首页 > 其他 > 详细

英文符号乱码

时间:2020-01-20 19:37:31      阅读:69      评论:0      收藏:0      [点我收藏+]

最近在WuxiaWorld上看书. 线上看总有些不方便, 不能点词查词. 便想爬下来看. 

 

爬取的过程当中发现符号编码有点问题, 不能够正常显示. 

如下:

 

显示为:

技术分享图片

正确应该显示的内容是:

技术分享图片

 

####

查看了一下资料, 应该是因为标点符号的编码出入造成的.

这里的英文符号使用的并非是utf8编码. 

 

尝试几次后. 重新编码可以解决该问题:

增加语句如下:

        # 标点转码
        content = str(chapter_content).encode(‘iso-8859-1‘)
        content = chapter_content.decode(‘utf8‘)

 

  

英文符号乱码

原文:https://www.cnblogs.com/jrri/p/12219070.html

(0)
(0)
   
举报
评论 一句话评论(0
关于我们 - 联系我们 - 留言反馈 - 联系我们:wmxa8@hotmail.com
© 2014 bubuko.com 版权所有
打开技术之扣,分享程序人生!