Python爬虫‘utf-8‘ codec can‘t decode byte 0x83 in position 0: invalid start byte 的解决方案|电子爱好者

admin管理员组
文章数量:1611147

今天用Python爬取豆瓣的时候，发现报错“UnicodeDecodeError: ‘utf-8’ codec can’t decode byte 0x83 in position 1:invalid start byte”。

然后发现不管我怎么转码都还是乱码，然后网上搜了下，发现好像是因为请求头的原因导致的。

错误原因竟然是我的 headers 中有一条:

html_header = {
    ……
    'Accept-Encoding': 'gzip, deflate, br',
    ……
}

这一条是我从web端请求抓过来的，为什么用浏览器可以正常浏览，而用Python模仿就不行呢?

看到网上的一种解释:

本地接收压缩格式的数据，服务器传过来压缩格式gzip的文件，而解压这种gzip文件只能用deflate算法，浏览器能够自动解压，程序却不能自动解压gzip，需要额外进行设置才行。

总结：写爬虫程序时候还是不要写 'Accept-Encoding': 'gzip, deflate' 了，就让服务器传原始文件过来吧，不用压缩了。

本文标签：爬虫解决方案 Codec Decode Python

版权声明：本文标题：Python爬虫‘utf-8‘ codec can‘t decode byte 0x83 in position 0: invalid start byte 的解决方案内容由热心网友自发贡献，该文观点仅代表作者本人，转载请联系作者并注明出处：https://m.elefans.com/dianzi/1728604697a1165303.html，本站仅提供信息存储空间服务，不拥有所有权，不承担相关法律责任。如发现本站有涉嫌抄袭侵权/违法违规的内容，一经查实，本站将立刻删除。

更多相关文章

xp系统

【python-bug】日期正则表达式 unbalanced parenthesis at position 64

3小时前

# 正则表达式import repatternre.compile(r"^((19[2-9]d{1})|(20((0?[0-9])|(1?[0-8])))) ((0?[1-9])|(1?[0-2])) ((0?[1-

Python UnicodeDecodeError: ‘utf-8‘ codec can‘t decode byte 0xbb in position 0: invalid start byte

3小时前

关注微信公共号：小程在线关注CSDN博客：程志伟的博客 df1pd.read_csv(F:Python科室数据.csv,encodingUTF-8) df1.head(3) Traceb

解决UnicodeDecodeError: ‘gbk‘ codec can‘t decode byte 0xa7 in position 85: illegal multibyte sequence

3小时前

解决UnicodeDecodeError: ‘gbk’ codec can’t decode byte 0xa7 in position 85: illegal multibyte sequence 代码 in_fileopen(r

‘gbk‘ codec can‘t decode byte 0x80 in position 27: illegal multibyte sequenc

3小时前

错误代码示范 with open(".garbage_classifygarbage_classify_rule.json", 'r') as load_f:load_dict = json.lo

UnicodeDecodeError: ‘ascii‘ codec can‘t decode byte 0xd7 in position 0: ordinal not in range(128)

3小时前

出错根源：解码方式不匹配出错源代码： import _pickle as cPicklex = cPickle.load(open('s01.dat', 'rb'))报错：UnicodeDec

UnicodeDecodeError: ‘utf-8‘ codec can‘t decode byte 0xe4 in position 1023: unexpected end of data

3小时前

问题描述正常运行项目的时候，没有什么问题，但是只要一debug，就报错，内容如下实验了网上很多解决方法，什么py文件的头

python报错:UnicodeDecodeError: ‘utf-8‘ codec can‘t decode byte 0xb8 in position 9: invalid start byte

3小时前

python版本3.9.1 场景: 将一个byte数据串转成字符串格式时使用.decode()报错: 分析: 出现异常报错是由于设置了decode()方法的第二个参数errors为严格（strict&#xff

UnicodeDecodeError: ‘utf-8‘ codec can‘t decode byte 0x80 in position 1: invalid start byte

3小时前

Error 用pandas读取一个csv文件时出现该错误： import pandas as pddf = pd.read_csv('filename', index_col=0)error message为Uni

UnicodeDecodeError asciicodec can't decode byte 0xe5 in position 0 ordinal not in range(128)

3小时前

运行python程序时出现以下错误： UnicodeDecodeError: ‘ascii’ codec can’t decode byte 0xe5 in position 0: ordinal not in ra

【Python】UnicodeEncodeError: ‘gbk‘ codec can‘t encode character ‘xxx‘ in position xxx解决

3小时前

报错： 非法的多字节序列 UnicodeEncodeError: gbk codec cant encode character xf6 in position 156: illegal multibyte se

python读取字符报错：‘utf-8‘ codec can‘t decode byte 0xbd in position 2: invalid start byte

3小时前

python读取字符报错:utf-8 codec cant decode byte 0xbd in position 2: invalid start byte 原因解决方法原因 utf-8只包含了部分汉字，导致解

解决：UnicodeEncodeError: ‘charmap‘ codec can‘t encode characters in position 11-14:character maps to ＜

3小时前

#CE测试执行工具打开runner.py报错信息：UnicodeEncodeError: ‘charmap’ codec can’t encode characters in position 11-14: chara

Python2.x编码问题：UnicodeDecodeError: 'ascii' codec can't decode byte in position : ordinal not in range

3小时前

Python2.x的默认字符集编码是ASCII，包含的字符有限，因此会有很多字符集的问题。问题原因真相只有一个：.py文件的某个字节，超出了ASCII表达的范围。每个字节是8 bit、理论上可以表示256个字符。但标准ASCII

Python-logging报错解决：UnicodeEncodeError: 'gbk' codec can't encode character 'u' in position: illegal

3小时前

我在Python3 中使用Logging模块把日志打到终端输出时会报错。代码如下： import logginglogging.basicConfig(level=logging.INFO,filename='log.log

UnicodeEncodeError: ‘gbk‘ codec can‘t encode character ‘xa0‘ in position 67008: illegal multibyte s

3小时前

使用Python写文件的时候，或者将网络数据流写入到本地文件的时候，大部分情况下会遇到：UnicodeEncodeError: ‘gbk’ codec can’t encod

UnicodeDecodeError: 'gbk' codec can't decode byte 0xad in position 898: illegal multibyte sequence

3小时前

1.问题描述 Windows环境下，打开cmd，然后运行Python命令，这个时候突然发现报错了，错误信息如下： Unicod

解决方案：惠普15-bc012tx笔记本电脑电池掉电快的检测及解决

3小时前

目录 1 背景2 电脑介绍3 可能原因4 检测电池工具4.1 CMD检测方法 5 我的电脑调整 1 背景 2016年国庆节购买的光影精灵笔记本电脑15-bc012tx。最近发现笔记本电脑的电池非常不耐用，基本上1个多小

Win11电脑连接惠普拓展坞网卡频繁断连问题解决方案

2小时前

Win11电脑连接惠普拓展坞网卡频繁断连问题解决方案外设win11电脑连接惠普拓展坞网卡频繁断连问题项目地址: https:gitcodeResource-Bundle-Collection18786 简介本

python显示安装失败_Win7安装Python失败提示Setup failed

1小时前

一、安装报错如图所示，双击Python安装包后进行安装显示Setup failed 安装失败： 二、错误排除 1.首先查看自己的计算机是否已经安装了 Win7 Service Pack 1大

Win7串口开发的的一些错误以及解决方案

44分钟前

文章目录 [toc] 背景遇到的问题1 看得到串口，但是一直打开失败，GetLastError4332 看得到串口(COM16)，但是一直打开失败,GetLastError2

电子爱好者 - 最新技术资讯及电子产品介绍！

Python爬虫‘utf-8‘ codec can‘t decode byte 0x83 in position 0: invalid start byte 的解决方案

更多相关文章

【python-bug】日期正则表达式 unbalanced parenthesis at position 64

Python UnicodeDecodeError: ‘utf-8‘ codec can‘t decode byte 0xbb in position 0: invalid start byte

解决UnicodeDecodeError: ‘gbk‘ codec can‘t decode byte 0xa7 in position 85: illegal multibyte sequence

‘gbk‘ codec can‘t decode byte 0x80 in position 27: illegal multibyte sequenc

UnicodeDecodeError: ‘ascii‘ codec can‘t decode byte 0xd7 in position 0: ordinal not in range(128)

UnicodeDecodeError: ‘utf-8‘ codec can‘t decode byte 0xe4 in position 1023: unexpected end of data

python报错:UnicodeDecodeError: ‘utf-8‘ codec can‘t decode byte 0xb8 in position 9: invalid start byte

UnicodeDecodeError: ‘utf-8‘ codec can‘t decode byte 0x80 in position 1: invalid start byte

UnicodeDecodeError asciicodec can't decode byte 0xe5 in position 0 ordinal not in range(128)

【Python】UnicodeEncodeError: ‘gbk‘ codec can‘t encode character ‘xxx‘ in position xxx解决

python读取字符报错：‘utf-8‘ codec can‘t decode byte 0xbd in position 2: invalid start byte

解决：UnicodeEncodeError: ‘charmap‘ codec can‘t encode characters in position 11-14:character maps to ＜

Python2.x编码问题：UnicodeDecodeError: 'ascii' codec can't decode byte in position : ordinal not in range

Python-logging报错解决：UnicodeEncodeError: 'gbk' codec can't encode character 'u' in position: illegal

UnicodeEncodeError: ‘gbk‘ codec can‘t encode character ‘xa0‘ in position 67008: illegal multibyte s

UnicodeDecodeError: 'gbk' codec can't decode byte 0xad in position 898: illegal multibyte sequence

解决方案：惠普15-bc012tx笔记本电脑电池掉电快的检测及解决

Win11电脑连接惠普拓展坞网卡频繁断连问题解决方案

python显示安装失败_Win7安装Python失败 提示Setup failed

Win7串口开发的的一些错误以及解决方案

发表评论

推荐文章

微服务商城系统（十三）订单、支付流程分析

如何虚拟打印PDF文件（Win7）

w10系统excel服务器,win10系统下excel如何制作表格

互联网架构多线程并发编程高级教程

【闲置路由器的有效利用】路由器有线桥接实现无线漫游

热门文章

kali破解WIFI密码学习笔记

5G的速度到底能有多快

封禁商业开源惹“众怒”？微软最新回应来了！

win10专业版没有触摸板选项_win10鼠标光标不见了触摸板没反应的具体解决办法...

org.springframework.messaging.MessagingException: No route info of this topic:

Kubernetes 集群安全机制详解

[转]信息安全相关理论题(三)

window10家庭版安装docker记录

windows7系统设置自动关机时间

惠普电脑使用蓝牙连接蓝牙设备

最新文章

HashMap 中size 和 capacity

CUDA out of memory. Tried to allocate 150.00 MiB (GPU 0； 4.00 GiB total capacity； 2.24 GiB already a

关于hashMap的扩容与红黑树与属性TREEIFY_THRESHOLD（树型阈值）与MIN_TREEIFY_CAPACITY（最小树容量）

ambari Capacity Scheduler 调度排序策略

linux centos7 hadoop &amp; yarn的调度模式以及参数配置 Yarn的资源调度器默认CapacityScheduler默认只有一个root.default队列 调整Yarn资源队列

【C++】 STL之 vector的capacity和size属性区别

Linux vector最大存储数量,C++ STL vector容量（capacity）和大小（size）的区别

LaTeX使用LuaLaTeX和TikZ编译时出错TeX capacity exceeded, sorry [input stack size=5000]

StringBuilder的容量（StringBuilder Capacity）

Yarn的fair和capacity调度器

Android studio Error:Illegal Capacity 错误

hadoop上传不了文件之后发现-Configured Capacity: 0 (0 B)

CUDA out of memory. Tried to allocate 392.00 MiB (GPU 0； 10.76 GiB total capacity； 652.77 MiB alread

Primer C++ 学习笔记：vector容器的容量改变（size，capacity，resize，reserve，shrink_to_fit）

容器容量和容器大小（capacity和size）

小米手机肿么还原时钟

15000流明是多少瓦

一般普通投影机功率多大?

苹果绿联转换器有些投影机不能用

坚果V9投影机具体参数?

有关九年级作文850字精选

80后90后_高一作文

中级卫生专业资格中医全科学主治医师中级模拟题2021年(9)案与解析

(精品)师范大学招考硕士研究生课程八六0试卷

ZXMVC8900(V3

【模拟人生4（The Sims 4）性感露背黑色亮片礼服MOD V20190313】模拟人生4（The Sims 4）性感露背黑色亮片礼服MOD V20190313 官方免费下载

【生化危机2：重制版（Resident Evil 2 Remake）克莱尔红头发深色服装MOD】生化危机2：重制版（Resident Evil 2 Remake）克莱尔红头发深色服装MOD 官方免费下载

【模拟人生4（The Sims 4）性感露背深V领吊带裙MOD V20190311】模拟人生4（The Sims 4）性感露背深V领吊带裙MOD V20190311 官方免费下载

【模拟人生4（The Sims 4）科幻风宇宙飞船家庭住宅MOD V20190311】模拟人生4（The Sims 4）科幻风宇宙飞船家庭住宅MOD V20190311 官方免费下载

【鬼泣5（Devil May Cry V）v1.0十四项修改】鬼泣5（Devil May Cry V）v1.0十四项修改 官方免费下载

如何实现高效的treenode搜索算法

treenode与链表有何本质区别

在哪些场景下应优先考虑使用treenode

treenode在树形结构中的角色是什么

如何通过treenode实现二叉树

python显示安装失败_Win7安装Python失败提示Setup failed

linux centos7 hadoop & yarn的调度模式以及参数配置 Yarn的资源调度器默认CapacityScheduler默认只有一个root.default队列调整Yarn资源队列

【鬼泣5（Devil May Cry V）v1.0十四项修改】鬼泣5（Devil May Cry V）v1.0十四项修改官方免费下载