UnicodeDecodeError: ‘‘ codec can‘t decode byte 0xb0 in position : invalid start byte，批量读取不同编码文件的解决方法|电子爱好者

admin管理员组
文章数量:1610834

问题

以下是踩过的坑：

解决方案

读取单个文件

批量读取文件

方法一：

方法二

参考博客：(45条消息) Python读取各种格式的txt文档（ANSI、Unicode、Unicode big endian、UTF-8等）_Ltinginger的博客-CSDN博客_python读取ansi编码文件

问题

想用python打开一个.dat的文件，代码及报错如下：

以下是踩过的坑：

默认编码格式是utf-8，这个格式读取错误，就看看文件是什么格式，把编码格式换一换呗

最简单的方法，用记事本打开，另存为这个时候可以看到编码格式为ANSI，ok，那就把解码格式改为这个

修改过后，还是报错

也尝试了gbk，gb18030等等什么的，弄了好大一圈也没有解决，直到看到这篇可以查看具体编码格式的博客：(45条消息) Python读取各种格式的txt文档（ANSI、Unicode、Unicode big endian、UTF-8等）_Ltinginger的博客-CSDN博客_python读取ansi编码文件

解决方案

读取单个文件

用代码查看，这个文件用的到底是哪种格式的编码

try:
	f = open('171017-1656_#24.txt','rb')	#打开txt文档
	r = f.read()	#读取
	f_charInfo = chardet.detect(r) #获取文本编码信息
	print(f_charInfo)
	f.close()
except:
	if f:
		f.close()
		print('err')

输出：{'encoding': 'ISO-8859-1', 'confidence': 0.73, 'language': ''}

不得不说标准是真多，完全没听说过的，修改后尝试

fp=open('171017-1656_#23.txt',encoding='ISO-8859-1')  #gb18030
lines = fp.readline()
fp.close()
print(lines)

输出：

EXPLAIN

就是文件第一行内容，完全输出对比查看也是正确的。

如果只读取一个文件，到这里就可以结束了

批量读取文件

如果需要批量读取文件，上面的方法一个一个的去查看就有点麻烦了，我提供两种解决思路，仅供参考

方法一：

循环输出每个文件的编码格式

import os
import chardet

path = r"C:\Users\Desktop\learn\金属腐蚀\qwe" #文件夹目录
files= os.listdir(path) #得到文件夹下的所有文件名称

for file in files: #遍历文件夹
    position = path+'\\'+ file
    print (file) 
    try:
	    f = open(position,'rb')	#打开文档
	    r = f.read()	#读取
	    f_charInfo = chardet.detect(r) #获取文本编码信息
	    print(f_charInfo)
	    f.close()
    except:
	    if f:
		    f.close()
		    print('err')

看输出结果编码格式都是一样的，读取的时候统一修改就好，如果有不同格式的编码文件，这样就行不通了，看下面的方法二

方法二

顺序读出各个文件的编码格式，并将其保存在一个字典当中，然后读取的时候将解码格式设置为其对应的编码格式即可

a = {}
for file in files: #遍历文件夹
	position = path+'\\'+ file
	#print (file)
	fr = open(position,'rb')	    #打开文档
	r = fr.read()	  #读取
	fr_charInfo = chardet.detect(r)    #获取文本编码信息
	#print(f_charInfo['encoding'])
	a[file] = fr_charInfo['encoding']
	fr.close()

#a的结果
"""a = {'171017-1656_#23.txt': 'utf-8', '171017-1656_#24.txt': 'ISO-8859-1', 
'171017-1656_#25.txt': 'ISO-8859-1', '171017-1656_#26.txt': 'ISO-8859-1', 
'171017-1656_#27.txt': 'ISO-8859-1', '171017-1656_#28.txt': 'ISO-8859-1', 
'171017-1656_#29.txt': 'ISO-8859-1', '171017-1656_#30.txt': 'ISO-8859-1', 
'171017-1656_#31.txt': 'ISO-8859-1', '171017-1656_#32.txt': 'ISO-8859-1',
 '171017-1656_#33.txt': 'ISO-8859-1', '171017-1656_#34.txt': 'ISO-8859-1', 
'171017-1656_#35.txt': 'ISO-8859-1'}"""

#读取的时候加上其对应格式
with open(position, "r",encoding=a[file]) as fp:    #打开文件        
        lines = fp.readlines()   #读取文件中
        fp.close()

这个方法基本适用绝大多数情况了

本文标签：解决方法批量文件 Decode byte

版权声明：本文标题：UnicodeDecodeError: ‘‘ codec can‘t decode byte 0xb0 in position : invalid start byte，批量读取不同编码文件的解决方法内容由热心网友自发贡献，该文观点仅代表作者本人，转载请联系作者并注明出处：https://m.elefans.com/dongtai/1728604045a1165226.html，本站仅提供信息存储空间服务，不拥有所有权，不承担相关法律责任。如发现本站有涉嫌抄袭侵权/违法违规的内容，一经查实，本站将立刻删除。

更多相关文章

xp系统

【UnicodeDecodeError: ‘gbk‘ codec can‘t decode byte 0xaf in position 304】的解决方案

1小时前

【UnicodeDecodeError: gbk codec cant decode byte 0xaf in position 304: illegal multibyte sequence】的解决方案项目场景问题描述原因分析解决方案E

python编码报错：UnicodeDecodeError: ‘utf-8‘ codec can‘t decode byte 0xbc in position 2: invalid start byt

1小时前

UnicodeDecodeError: utf-8 codec cant decode byte 0xbc in position 2: invalid start byte 解决问题 UnicodeDecodeError: utf-8 c

Python中读取txt文本出现“ ‘gbk‘ codec can‘t decode byte 0xbf in position 2: illegal multibyte sequence”的解决办法

1小时前

此种错误，可能是要处理的字符串本身不是gbk编码，但是却以gbk编码去解码。比如，字符串本身是utf-8的，但是却用gbk去解码utf-8的字符串&a

python py文件中不能有中文的解决方案：UnicodeDecodeError: ‘utf-8‘ codec can‘t decode byte 0xc9 in position

1小时前

这个问题困惑了好久，在借鉴大佬的解决方法后，现在记录一些有用的解决方法。首先，直接抛出解决办法第一种通过记事本打开py文件，进行另保存&

解决‘gbk‘ codec can‘t decode byte 0xab in position 13: illegal multibyte sequence

1小时前

原代码： fbopen(self.caseListFile)for value in fb.readlines():datastr(value)if data !and not data.startswit

UnicodeDecodeError: ‘utf-8‘ codec can‘t decode byte 0xcf in position 14: invalid continuation byte

1小时前

使用结巴分词时，报错： UnicodeDecodeError: ‘utf-8’ codec can’t decode byte 0xcf in position 14: invalid conti

解决python读取pkl文件报错UnicodeDecodeError: ‘utf-8‘ codec can‘t decode byte 0x80 in position 0

1小时前

完整报错是：UnicodeDecodeError: utf-8 codec cant decode byte 0x80 in position 0: invalid start byte 解决方法读取时open函

python UnicodeDecodeErrorutf-8 codec cant decode byte 0xcc in position 0: invalid continuation

1小时前

错误代码提示： hostname, aliases, ipaddrsgethostbyaddr(name)UnicodeDecodeError: utf-8 codec cant decode byte 0xc

python报错gbk_python报错 'gbk' codec can't decode byte 0xff in position 0: illegal multibyte sequence...

1小时前

python报错 gbk codec cant decode byte 0xff in position 0: illegal multibyte sequence kpsztd LV11 2018-09-14fromsysimport

‘utf-8‘ codec can‘t decode byte 0xd5 in position 116

1小时前

读取csv出错问题：‘utf-8’ codec can’t decode byte 0xb9 in position 0: invalid start byte 方法1 修改读取csv文件代码为&#xf

解决UnicodeDecodeError: ‘gbk‘ codec can‘t decode byte 0xa7 in position 85: illegal multibyte sequence

1小时前

解决UnicodeDecodeError: ‘gbk’ codec can’t decode byte 0xa7 in position 85: illegal multibyte sequence 代码 in_fileopen(r

相信我，彻底解决UnicodeDecodeError: ‘gb2312‘ codec can‘t decode byte 0xa9 in position 7211: illegal multibyt

1小时前

相信大家在coding时候，尤其是在与文本打交道时候，经常会遇到类似这样的问题。问题截图那么通常你是怎么解决这个问题呢？我相信你肯定明白这是编码问题&#xff0

UnicodeDecodeError asciicodec can't decode byte 0xe5 in position 0 ordinal not in range(128)

1小时前

运行python程序时出现以下错误： UnicodeDecodeError: ‘ascii’ codec can’t decode byte 0xe5 in position 0: ordinal not in ra

求助【UnicodeDecodeError: ‘charmap‘ codec can‘t decode byte 0x9d in position 3201character maps to ＜un】

1小时前

UnicodeDecodeError: ‘charmap’ codec can’t decode byte 0x9d in position 3201: character maps to读入TXT时，发生以下错误

python读取文件时报错，‘utf-8‘ codec can‘t decode byte 0xb1 in position 0: invalid start byte

1小时前

具体错误如下：utf-8 codec cant decode byte 0xb1 in position 0: invalid start byte 解决方法： dfpd.read_csv

(unicode error) 'unicodeescape' codec can't decode bytes in position 12-13: truncated UXXXXXXXX esc

1小时前

(unicode error) ‘unicodeescape’ codec can’t decode bytes in position 12-13: truncated UXXXXXXXX escape 用python代码读取桌面文件

UnicodeDecodeError: ‘utf8‘ codec can‘t decode byte 0xd3 in position 3: invalid continuation byte

1小时前

python中文编码问题 # -*- coding:utf-8 -*-# -*- coding:utf-8 -*-import chardeta子系统print a, len(a), chardet.detect(a)b子系

UnicodeDecodeError: 'gbk' codec can't decode byte 0xad in position 898: illegal multibyte sequence

1小时前

1.问题描述 Windows环境下，打开cmd，然后运行Python命令，这个时候突然发现报错了，错误信息如下： Unicod

UnicodeDecodeError: ‘gbk’ codec can‘t decode byte 0xaa in position 2: illegal multibyte sequence解决方法

1小时前

windows文本编辑器编辑的文件，编码为gbk，python操作时设置读取时编码为gbk sublime编辑器编辑的文件编码设置为utf-8，python操作时设置读取u

常见WinXP启动故障及解决方法

20分钟前

1、NTLDR is missing当你从Win9X升级到Windows XP的时候1)、Clone以后的问题：当你想把使用Clone制作的Win9x升级到Windows XP，那么很容易出现一句

电子爱好者 - 最新技术资讯及电子产品介绍！

UnicodeDecodeError: ‘‘ codec can‘t decode byte 0xb0 in position : invalid start byte，批量读取不同编码文件的解决方法

问题

以下是踩过的坑：

解决方案

读取单个文件

批量读取文件

方法一：

方法二

更多相关文章

【UnicodeDecodeError: ‘gbk‘ codec can‘t decode byte 0xaf in position 304】的解决方案

python编码报错：UnicodeDecodeError: ‘utf-8‘ codec can‘t decode byte 0xbc in position 2: invalid start byt

Python中读取txt文本出现“ ‘gbk‘ codec can‘t decode byte 0xbf in position 2: illegal multibyte sequence”的解决办法

python py文件中不能有中文的解决方案：UnicodeDecodeError: ‘utf-8‘ codec can‘t decode byte 0xc9 in position

解决‘gbk‘ codec can‘t decode byte 0xab in position 13: illegal multibyte sequence

UnicodeDecodeError: ‘utf-8‘ codec can‘t decode byte 0xcf in position 14: invalid continuation byte

解决python读取pkl文件报错UnicodeDecodeError: ‘utf-8‘ codec can‘t decode byte 0x80 in position 0

python UnicodeDecodeErrorutf-8 codec cant decode byte 0xcc in position 0: invalid continuation

python报错gbk_python报错 'gbk' codec can't decode byte 0xff in position 0: illegal multibyte sequence...

‘utf-8‘ codec can‘t decode byte 0xd5 in position 116

解决UnicodeDecodeError: ‘gbk‘ codec can‘t decode byte 0xa7 in position 85: illegal multibyte sequence

相信我，彻底解决UnicodeDecodeError: ‘gb2312‘ codec can‘t decode byte 0xa9 in position 7211: illegal multibyt

UnicodeDecodeError asciicodec can't decode byte 0xe5 in position 0 ordinal not in range(128)

求助【UnicodeDecodeError: ‘charmap‘ codec can‘t decode byte 0x9d in position 3201character maps to ＜un】

python读取文件时报错，‘utf-8‘ codec can‘t decode byte 0xb1 in position 0: invalid start byte

(unicode error) 'unicodeescape' codec can't decode bytes in position 12-13: truncated UXXXXXXXX esc

UnicodeDecodeError: ‘utf8‘ codec can‘t decode byte 0xd3 in position 3: invalid continuation byte

UnicodeDecodeError: 'gbk' codec can't decode byte 0xad in position 898: illegal multibyte sequence

UnicodeDecodeError: ‘gbk’ codec can‘t decode byte 0xaa in position 2: illegal multibyte sequence解决方法

常见WinXP启动故障及解决方法

发表评论

推荐文章

微软发邮件说侵权是诈骗吗_是的，我们都侵权

人人商城 后台开启WAP访问后 微信浏览器 跳过授权 手机号密码登录

【云原生】SQL（及存储过程）跑得太慢怎么办？

SLF4J: Failed to load class “org.slf4j.impl.StaticLoggerBinder“.解决方法

惠普电脑使用蓝牙连接蓝牙设备

热门文章

微软谈&quot;开源&quot;、&quot;赦&quot;盗版背后的商业逻辑

TP-LINK KEY 解析工具指南

2022年ansys电脑配置要求，不同场景下的电脑硬件推荐

excel表格横向纵向变换_表格的制作方法

windows7专业版_windows7专业版和旗舰版的区别

遥感图像处理笔记之【多模态遥感图像综述】

C#按键精灵实战：低级鼠标键盘Hook、XML脚本解析、DLL编写

相信我，彻底解决UnicodeDecodeError: ‘gb2312‘ codec can‘t decode byte 0xa9 in position 7211: illegal multibyt

HP Loadrunner12的下载和安装

2024最详细安装Ubuntu系统指南_惠普电脑ubuntu系统安装教程

最新文章

关于多路由器桥接问题的解决

有线桥接，多个路由器共用一个WIFI

TP-Link路由器桥接断电后无法重连问题分析与解决分享

手把手叫教你设置无线路由器桥接模式

无线路由桥接关掉服务器要怎么办,路由器设置无线桥接后不能登录副路由器怎么办？...

无线桥接显示dhcp服务器没有开启,桥接提示“获取IP地址失败，请检查主路由器DHCP服务器是否开启”...

记一次配置路由器无线桥接的过程——让古董路由器发挥余热

解决两个无线路由器实现桥接和将无线路由器当做无线交换机使用

如何对多台路由器桥接，让信号最大范围覆盖？

两个路由器有线桥接好还是无线桥接好？

什么无线桥接一直正在链接服务器失败,tplink无线桥接失败怎么办？

linux桥接wifi与有线,两个路由器有线桥接好还是无线桥接好？

2台路由器的无线桥接

路由器有线桥接相同ssid_在家中配置两个具有一个SSID（网络名称）的无线路由器以进行免费漫游...

路由器桥接(WIFI无线中继)设置及摆放位置图解

小米手机肿么还原时钟

15000流明是多少瓦

一般普通投影机功率多大?

苹果绿联转换器有些投影机不能用

坚果V9投影机具体参数?

有关九年级作文850字精选

80后90后_高一作文

中级卫生专业资格中医全科学主治医师中级模拟题2021年(9)案与解析

(精品)师范大学招考硕士研究生课程八六0试卷

ZXMVC8900(V3

【模拟人生4（The Sims 4）性感露背黑色亮片礼服MOD V20190313】模拟人生4（The Sims 4）性感露背黑色亮片礼服MOD V20190313 官方免费下载

【生化危机2：重制版（Resident Evil 2 Remake）克莱尔红头发深色服装MOD】生化危机2：重制版（Resident Evil 2 Remake）克莱尔红头发深色服装MOD 官方免费下载

【模拟人生4（The Sims 4）性感露背深V领吊带裙MOD V20190311】模拟人生4（The Sims 4）性感露背深V领吊带裙MOD V20190311 官方免费下载

【模拟人生4（The Sims 4）科幻风宇宙飞船家庭住宅MOD V20190311】模拟人生4（The Sims 4）科幻风宇宙飞船家庭住宅MOD V20190311 官方免费下载

【鬼泣5（Devil May Cry V）v1.0十四项修改】鬼泣5（Devil May Cry V）v1.0十四项修改 官方免费下载

如何实现高效的treenode搜索算法

人人商城后台开启WAP访问后微信浏览器跳过授权手机号密码登录

微软谈"开源"、"赦"盗版背后的商业逻辑

【鬼泣5（Devil May Cry V）v1.0十四项修改】鬼泣5（Devil May Cry V）v1.0十四项修改官方免费下载