实习有个测试,需要爬点东西,结果一直提示错误UnicodeEncodeError: ‘gbk’ codec can’t encode character ‘\xa0’ in position
,在网上一查,发现是 Windows 的控制台的问题。控制台的编码是 GBK,Python 是 UTF-8,造成了冲突。下面给出三种解决方法:
print(json.dumps(textList, ensure_ascii=False).replace(‘\xa0‘, ‘ ‘))
先用 GBK 编码,加个 ignore 丢弃错误的字符,然后再解码。
import requests
url = ‘https://segmentfault.com/a/1190000015617318‘
print(requests.get(url).text.encode(‘gbk‘, ‘ignore‘).decode(‘gbk‘)
Windows Registry Editor Version 5.00
[HKEY_CURRENT_USER\Console\%SystemRoot%_system32_cmd.exe]
"CodePage"=dword:0000fde9
"FontFamily"=dword:00000036
"FontWeight"=dword:00000190
"FaceName"="Consolas"
"ScreenBufferSize"=dword:232900d2
"WindowSize"=dword:002b00d2
保存后运行。如果 Ctrl+B 无效,用 python.exe 打开.py程序后再试一次。
转载:
https://blog.csdn.net/weixin_34292959/article/details/88765900
原文:https://www.cnblogs.com/liruilong/p/12498447.html