首页 > 编程语言 > 详细

python爬取页面内容

时间:2020-03-18 15:56:29      阅读:61      评论:0      收藏:0      [点我收藏+]

from selenium import webdriver
import xlwt

driver = webdriver.Chrome(r‘D:\chromedriver.exe‘)
driver.maximize_window() #窗口最大化
workbook = xlwt.Workbook(encoding=‘ascii‘)
worksheet = workbook.add_sheet(‘抓取内容‘)
a1="https://baike.baidu.com/item/%E5%8D%8E%E4%B8%BAMate30/22592869?fr=aladdin"
a2="https://baike.baidu.com/item/%E5%8D%8E%E4%B8%BAP30/22778077?fr=aladdin"
a3="https://baike.baidu.com/item/%E5%8D%8E%E4%B8%BAP20/21971588?fr=aladdin"
for i in range(4):
if i == 1:
z = a1
driver.get(z)
v = driver.find_element_by_xpath(‘/html/body/div[4]/div[2]/div/div[2]/div[7]/dl[1]/dd[1]‘)
r0 = v.text
v1 = driver.find_element_by_xpath(‘/html/body/div[4]/div[2]/div/div[2]/div[7]/dl[1]/dd[2]‘)
r1 = v1.text
v2 = driver.find_element_by_xpath(‘/html/body/div[4]/div[2]/div/div[2]/div[7]/dl[1]/dd[3]‘)
r2 = v2.text
worksheet.write(i, 0, r0) # 写入
worksheet.write(i, 1, r1) # 写入
worksheet.write(i, 2, r2) # 写入

 

python爬取页面内容

原文:https://www.cnblogs.com/zhangzhaolin/p/12517110.html

(0)
(0)
   
举报
评论 一句话评论(0
关于我们 - 联系我们 - 留言反馈 - 联系我们:wmxa8@hotmail.com
© 2014 bubuko.com 版权所有
打开技术之扣,分享程序人生!