UnicodeEncodeError: ‘gbk’ codec can’t encode character ‘\xbb’ in position 30380: illegal multibyte sequence错误出现的解决办法
UnicodeEncodeError: 'gbk' codec can't encode character '\xbb' in position 30380: illegal multibyte sequence
如图:
重新导入编码格式
import io
import sys
sys.stdout = io.TextIOWrapper(sys.stdout.buffer,encoding='gb18030') #改变标准输出的默认编码
此处用encoding=‘gb18030’,因为encoding='utf-8’会产生中文乱码
1.UTF-8:即国际通用字符编码,该编码方式囊括了世界各个国家及地区使用的字符集,尤其是对于英文字母的表示方法仅占用一个字节,很好的支持了欧美等国家的需要。优点:为了统一世界上各种编码而设计,通用性强。缺点:为了兼顾世界所有语言的字符,必须采用多位给字符编号,例如中文字符采用3字节编码方式,而gb18030采用2字节。
2.gb18030:是新出的国家标准。这个标准由国家强制执行(也是为了保证中国信息业的地位,以及争取一定的主动权),所以所有在中国大陆销售的操作系统必须支持gb18030。现在的Gb18030不仅包含了简体和繁体汉字,支持中国少数名族文字,还包含了日韩等国的象形文字。优点:兼容性好,与以前的国标码都兼容。缺点:对英文字母需要2个字节的编码。
来源:CSDN
作者:E_l_Bailong
链接:https://blog.csdn.net/E_l_Bailong/article/details/104157916