UnicodeDecodeError: ‘utf8‘ codec can‘t decode byte 0xd3 in position 3: invalid continuation byte|电子爱好者

admin管理员组
文章数量:1611205

python中文编码问题

# -*- coding:utf-8 -*-
# -*- coding:utf-8 -*-
import chardet

a = '子系统'
print a, len(a), chardet.detect(a)


b = '子系统'.decode('utf-8').encode('gb2312')
print b, len(b), chardet.detect(b)

c = u'子系统'
print c, len(c)

d = '子系统'.decode('utf-8').encode('gbk')
print d, len(d), chardet.detect(d)

瀛愮郴缁?9 {'confidence': 0.87625, 'language': '', 'encoding': 'utf-8'}
子系统 6 {'confidence': 0.6826397542769941, 'language': 'Russian', 'encoding': 'KOI8-R'}
子系统 3
子系统 6 {'confidence': 0.6826397542769941, 'language': 'Russian', 'encoding': 'KOI8-R'}

由此可知，从返回的字节的长度来说：
一个中文字  utf-8编码  占 3个字节
一个中文字  gb2312编码  占 2个字节
一个中文字  unicode编码  占 1个字节
一个中文字  gbk编码  占 2个字节
 所以gbk和gb2312 比较难区分，这个需要自己在遇到编码问题的时候，自己尝试吧。

本文标签： Codec Decode UnicodeDecodeError byte Invalid

版权声明：本文标题：UnicodeDecodeError: ‘utf8‘ codec can‘t decode byte 0xd3 in position 3: invalid continuation byte 内容由热心网友自发贡献，该文观点仅代表作者本人，转载请联系作者并注明出处：https://m.elefans.com/dongtai/1728607570a1165649.html，本站仅提供信息存储空间服务，不拥有所有权，不承担相关法律责任。如发现本站有涉嫌抄袭侵权/违法违规的内容，一经查实，本站将立刻删除。

更多相关文章

xp系统

UnicodeDecodeError: ‘utf-8‘ codec can‘t decode byte 0xe4 in position 1023: unexpected end of data

3小时前

问题描述正常运行项目的时候，没有什么问题，但是只要一debug，就报错，内容如下实验了网上很多解决方法，什么py文件的头

UnicodeDecodeError: ‘utf-8‘ codec can‘t decode byte 0x80 in position 1: invalid start byte

3小时前

Error 用pandas读取一个csv文件时出现该错误： import pandas as pddf = pd.read_csv('filename', index_col=0)error message为Uni

解决UnicodeDecodeError: ‘ascii‘ codec can‘t decode byte 0xe5 in position 108: ordinal not in range(128

3小时前

解决UnicodeDecodeError: ascii codec cant decode byte 0xe5 in position 108: ordinal not in range(128) 混淆了 python2 里边的 str

Python3遇到问题unicodeescape codec cant decode bytes in position 2 3 truncated UXXXXXXXX escape解决办法

3小时前

Python3 代码运行时遇到如下错误提示： SyntaxError: (unicode error) ‘unicodeescape’ codec can’t decode bytes in position 2-3

解决‘utf-8‘ codec can‘t decode byte 0xd0 in position 398: invalid continuation byte

3小时前

这里讲一个我遇到的错误，之前再爬网站的时候。解码的时候使用的是utf-8但是报错误了。utf-8不能解开。后面我发现是解码格式的问题如果你在选择解码方式的时候建议先要确定网站的编码方式，比

【Python】UnicodeEncodeError: ‘gbk‘ codec can‘t encode character ‘xxx‘ in position xxx解决

3小时前

报错： 非法的多字节序列 UnicodeEncodeError: gbk codec cant encode character xf6 in position 156: illegal multibyte se

Python报错：‘latin-1‘ codec can‘t encode characters in position 48-56: ordinal not in range(256)

3小时前

报错信息： 原因： 因为 console 是字节流输出，Python 3 源码文件以 UTF-8 编码，所有字符串都是 unicode 字符串。注意

python读取文件时报错，‘utf-8‘ codec can‘t decode byte 0xb1 in position 0: invalid start byte

3小时前

具体错误如下：utf-8 codec cant decode byte 0xb1 in position 0: invalid start byte 解决方法： dfpd.read_csv

UnicodeDecodeError: 'gbk' codec can't decode byte 0xab in position 43: illegal multibyte sequence

3小时前

python读取txt文件时报错： UnicodeDecodeError: gbk codec cant decode byte 0xab in position 43: illegal multibyte sequ

解决：UnicodeEncodeError: ‘charmap‘ codec can‘t encode characters in position 11-14:character maps to ＜

3小时前

#CE测试执行工具打开runner.py报错信息：UnicodeEncodeError: ‘charmap’ codec can’t encode characters in position 11-14: chara

UnicodeEncodeError: 'gbk' codec can't encode character 'xa0' in position ... 问题解决办法之一

3小时前

从网上抓了一些字节流，想打印出来结果发生了一下错误： UnicodeEncodeError: gbk codec cant encode character xbb in position 8

Python2.x编码问题：UnicodeDecodeError: 'ascii' codec can't decode byte in position : ordinal not in range

3小时前

Python2.x的默认字符集编码是ASCII，包含的字符有限，因此会有很多字符集的问题。问题原因真相只有一个：.py文件的某个字节，超出了ASCII表达的范围。每个字节是8 bit、理论上可以表示256个字符。但标准ASCII

(unicode error) 'unicodeescape' codec can't decode bytes in position 12-13: truncated UXXXXXXXX esc

3小时前

(unicode error) ‘unicodeescape’ codec can’t decode bytes in position 12-13: truncated UXXXXXXXX escape 用python代码读取桌面文件