首页 > 其他 > 详细

scrapy使用response.body时编码问题

时间:2020-10-30 15:10:47      阅读:76      评论:0      收藏:0      [点我收藏+]

scrapy使用response.body时编码问题

 

摘要:scrapy使用response.body时编码问题。如果在使用responses.body获取数据时,需要将其编码转换成unicode,即如下处理:

response.body返回的结果是byte字节串,其编码是网页的原编码;

如果在使用responses.body获取数据时,需要将其编码转换成unicode,即如下处理:

 

body = response.body.decode(‘gbk‘) #假设网页编码是gbk.

 

body = response.body.decode(response.encoding) #即可将其转化成默认的编码

 

这样输出来的内容才正确。也可以直接用response.text这样可以直接是字符串了。

 

 

scrapy使用response.body时编码问题

原文:https://www.cnblogs.com/xiao-xue-di/p/13901394.html

(0)
(0)
   
举报
评论 一句话评论(0
关于我们 - 联系我们 - 留言反馈 - 联系我们:wmxa8@hotmail.com
© 2014 bubuko.com 版权所有
打开技术之扣,分享程序人生!