首页 > 编程语言 > 详细

python3 报错:UnicodeDecodeError: 'utf-8' codec can't decode byte 0xd6 in position 201: invalid continuation byte

时间:2018-04-18 15:41:19      阅读:797      评论:0      收藏:0      [点我收藏+]

代码:

# -*- coding:utf-8 -*-

from urllib import request

resp = request.urlopen(http://www.xxx.com)

print(resp.read().decode(utf-8))

报错:

Traceback (most recent call last):
  File "F:/workspace/python/py3/test_urllib.py", line 7, in <module>
    print(resp.read().decode(utf-8))
UnicodeDecodeError: utf-8 codec cant decode byte 0xd6 in position 201: invalid continuation byte

原因:

  确定要抓取的页面的编码,并不是所有网站的编码都是utf-8的,resp.read().decode()应传入与要抓取的网页一致的编码。

python3 报错:UnicodeDecodeError: 'utf-8' codec can't decode byte 0xd6 in position 201: invalid continuation byte

原文:https://www.cnblogs.com/tianxintian22/p/8875267.html

(0)
(0)
   
举报
评论 一句话评论(0
关于我们 - 联系我们 - 留言反馈 - 联系我们:wmxa8@hotmail.com
© 2014 bubuko.com 版权所有
打开技术之扣,分享程序人生!