1. 文章
  2. 文章详情

Python print 输出文本gbk编码错误处理

错误UnicodeEncodeError: ‘gbk’ codec can’t encode character ‘\xa0’ in position,是因为Windows 的控制台的编码是 GBK,而Python 是 UTF-8

解决方法:

一:直接替换出错的内容

import requests 
url = 'https://segmentfault.com/a/1190000015617318' 
print(requests.get(url).text.replace('\xa0', ' '))

二:再解码

先用 GBK 编码,加个 ignore 丢弃错误的字符,然后再解码。

import requests
url = 'https://segmentfault.com/a/1190000015617318'
print(requests.get(url).text.encode('gbk', 'ignore').decode('gbk')

三:修改控制台编码

新建一个 cmd.reg, 输入代码:

Windows Registry Editor Version 5.00

[HKEY_CURRENT_USER\Console\%SystemRoot%_system32_cmd.exe]
"CodePage"=dword:0000fde9
"FontFamily"=dword:00000036
"FontWeight"=dword:00000190
"FaceName"="Consolas"
"ScreenBufferSize"=dword:232900d2
"WindowSize"=dword:002b00d2

保存后运行来修改注册表

发表评论

登录后才能评论

评论列表(0条)