首页 > 其他 > 详细

笔记之爬虫

时间:2019-09-25 21:58:45      阅读:87      评论:0      收藏:0      [点我收藏+]
list1=[‘tank‘,18]
#append
list1 .append(‘male‘)
print(list1)
#count:计算列表中值的数量
print(list1.count(‘tank‘))#2


‘‘‘
字典的内置方法
‘‘‘
#dict1:
# name=‘tank‘
# age=18
dict1={‘name‘:‘tank‘,‘age‘:18}

print(dict1[‘name‘])
#若key不存在则报错
#print (dict1[‘name‘]

#get特点是key没有默认返回None
print(dict1.get(‘name‘))#None
str1=‘墙里的想着出去,墙外的人想着进来‘
# 0 1 2 3 4 5.....................16
#索引取值
print(len(str1))
print(str1[9]) #外

#切片
#获取str1中的‘墙外的人’四个字
#range(8,12) #8-11
#[8:12]
print(str1[8:12])#墙外的人

#长度len
print(len(str1))

#成员运算in|not in
print(‘进‘in str)#true,判断进字是否在str1里面
print(‘进‘not in str1)#false
#移除空白strip
username=input(‘请输入用户名:‘)
print(username)
#移除username两边的空格
username=username.strip()
print(username)


str2="墨:菲;定:律"
#切片split(切分的规则)
#List1=[]
#for x in str2:
# print(x)
# list1.append(x)
#print(list1)
list1=str2.split(‘:‘)
print(list1)

#lower&upper大小写
str3="aabbcc"
#把str3的字母都变成小写
lowerstr3=str3. lower()
print(lowerstr3)#aabbcc

#把str3的字母都变成大写
upperstr3=str3.upper()
print(upperstr3)#AABBCC

#starwith&endswith判断字符开头或者结尾是否是什么
str4 = "tank是一个文质彬彬的靓仔"
print(str4.starswith("tank")) # Ture
print(str4.starswith("DSB")) #False

print(str4.endswith("靓仔")) #Ture
print(str4.endswith("sb")) #False

#replace: 替换。replace(旧,新)
str5 = "吕连杰说,有个人很帅啊,他是徐峰!"
str = str5.repleace("徐峰","tank")
print(str5)

# isdigit:判断字符是否是数字
str6 = "24124141"
print(str6.isdigit()) #Ture
# ‘‘‘
# 文本读写
#
# 字符编码
# 美国:
# ASCCI
# 中国:
# GBK
#
# 总结:必须统一字符编码


‘‘‘

# 写文件
# with open(‘安财贸,txt‘,‘w‘,encording=‘utf-8‘)as f :
# str1=‘tank很帅,真的啊!‘
# f.write(str1)
# 读文件
with open(‘安财贸.txt‘, ‘r‘, encording=‘utf-8‘)as f:
str = f.read()
# print(str1)

‘‘‘
#读写二进制流数据
‘‘‘
with open (‘xiao泽.mp4‘,‘rb‘)as f :
data =f.read()
print(data)
‘‘‘
爬取cang老师图片,并保存本地。
1.导入requests模块
下载:
注意:必须联网
方式一:
pip3 install requests
方式二:
file-->settings-->project-->interpreter-->‘绿色的‘
再输入框内输入-->requests-->intall package

import requests
2.使用requests爬取图片并保存
-1)下载图片
-2)保存图片

‘‘‘
import requests
#1)下载图片
#requests.get(‘数据的链接‘)
#往cang老师图片地址发送请求获取相应数据
response = requests.get(‘https://gss1.bdstatic.com/9vo3dSag_xI4khGkpoWK1HF6hhy/baike/w%3D268%3Bg%3D0/sign=4c9bf08f04f41bd5da53eff269e1e6f6/d439b6003af33a87d8d517becc5c10385243b5dd.jpg‘)
#content就是获取图片的二进制流数据
print(response.content)

#2)保存数据
#读取二进制流数据write+bytes wb
with open(‘cang老师。jpg‘,‘wb‘) as f:
# f.write(传入二进制流数据)
f.write(response.content)

笔记之爬虫

原文:https://www.cnblogs.com/lljie/p/11587511.html

(0)
(0)
   
举报
评论 一句话评论(0
关于我们 - 联系我们 - 留言反馈 - 联系我们:wmxa8@hotmail.com
© 2014 bubuko.com 版权所有
打开技术之扣,分享程序人生!