零代码编程：用ChatGPT爬取网页数据遇到乱码怎么办？|电子爱好者

admin管理员组
文章数量:1533889

今天用ChatGPT写了一段代码，爬取中文网站数据，提示词如下：

写一段Python程序，爬取网页数据并保存到excel表格。

具体步骤：

打开网站https://www.zhenfund/Case/?id=3，解析源代码；

定位 id="ma_3" 的div元素；

定位其中所有的li元素；

定位li元素中的img 元素，提取alt值作为excel表格第1列；

定位li元素中的a元素，提取href值作为excel表格第2列；

保存excel表格到电脑d盘

注意：alt值里面有些是中文字符，可能在保存到excel表格时出现乱码问题。

程序运行很成功，但是结果里面有很多乱码，这些乱码在源代码都是中文。

把这个问题向ChatGPT反馈，尝试了几种方式来修改，都没有作用。

爬取出来的excel文件，用各种编码都无法正常显示。

那么，应该是源文件的问题了。

看来ChatGPT 不太懂这个问题，于是转而用搜索引擎搜索这个问题，最后找到一个靠谱答案：一般的网站的编码格式都是 UTF-8，所以当你系统的默认编码也是 UTF-8 时，也就是说，你的默认编码方式和目标网站的编码方式一致时，即使不明确设置编码方式，也不会出问题。但是爬取过程中没问题，但是用打开保存好的 csv 文件时出现乱码，这个其实就是源文件的编码方式和 Excel 的解码方式不一致导致的。这种问题解决也很简单，只要在代码中设置一下 encoding 即可。这里建议一种方法，r.encoding = r.apparent_encoding ，这个可以自动推测目标网站的编码格式，省的你自己去一个个设置。

于是，根据这个情况让ChatGPT进行修改：

随后运行成功，不再有任何乱码出现了：

本文标签：乱码代码网页数据 chatGPT

版权声明：本文标题：零代码编程：用ChatGPT爬取网页数据遇到乱码怎么办？内容由热心网友自发贡献，该文观点仅代表作者本人，转载请联系作者并注明出处：https://m.elefans.com/dongtai/1725038616a1003659.html，本站仅提供信息存储空间服务，不拥有所有权，不承担相关法律责任。如发现本站有涉嫌抄袭侵权/违法违规的内容，一经查实，本站将立刻删除。

更多相关文章

xp系统

电子爱好者 - 最新技术资讯及电子产品介绍！

零代码编程：用ChatGPT爬取网页数据遇到乱码怎么办？

更多相关文章

c语言网页版在线编译器_简单好用的网页版在线公式编辑器

这么有料的福利，你还不赶紧关注一波吗？（代码合集）

YT Saver（网页视频下载软件）官方中文版32位V4.6.0 | 网页万能视频下载神器

flv格式php怎么播放不了,FLV格式视频不能在网页播放的解决办法

SpringMVC将请求和响应的数据转换为JSON格式的几种方式

【CVutils】计算机视觉：视频图像（清洗、裁剪、人脸区域抓取等）数据预处理&amp;数据集制作 || 代码合集

数据中台为什么那么火？

zoom如何使用网页版登录

cad有没有网页版_在线CAD看图网页版，一样可以快速查看CAD图纸

网页版Facebook第三方登陆

使用vite搭建项目时，在启动vite后，浏览器显示页面：找不到localhost的网页

实现一个网页版的Xshell

钉钉网页版登陆地址

030 星际争霸网页版！！

网页上怎么查询服务器地址,怎么查看一个网页的服务器地址

android指定浏览器打开特定网页

ZYNQ之路--Xilinx AXI-Full-Master实例代码翻译

《大数据技术原理与应用》林子雨 期末复习重点（总结）

如何设计微服务的数据一致性

Mybatis批量插入大量数据最优方式

发表评论

推荐文章

dell precision3551电脑安装win10+ubuntu

【已解决】（新）西部数据移动硬盘插入，电脑无法识别盘符

SCSI硬盘系统无法启动取数据办法

再谈指针：大佬给你拨开 C指针 的云雾

Ubuntu 20.04 系统备份和还原

热门文章

计算机开机硬盘扫描,解决每次开机都检测硬盘

企业里Win10 开启BitLocker锁定磁盘，如何备份系统，当系统出现问题又如何恢复，快速恢复又兼顾系统安全（远程设备篇）

windows10系统更新遇到错误怎么解决

ubuntu中安装搜狗拼音输入法

Ubuntu 13.10下安装使用搜狗拼音输入法

文件夹提示文件或目录损坏且无法读取

ChatGPT的API接口的模型有多少种？这些模型都有什么功能或者在应用场景上有什么区别？【模型介绍使用与调用接口方法】

aptio设置全中文_电脑开机后出现Aptio设置工具

破解2018版pycharm详细过程及pycharm无法打开的原因

事务原理：ACID,CAP和BASE理论及分布式事务一致性案例

最新文章

ThoughtWorks线上编程题解体验

开源项目教程：Cookie-Thought 深度指南

ThoughtWorks(中国)程序员读书雷达

Maven的pom文件 提示错误 Failure to transfer com.thoughtworks.xstream:xstream:jar:

（4）ClassNotFoundException: org.dom4j.io.SAXReader 以及com.thoughtworks.xstream.XStream

ThoughtWorks 2018校园招聘作业

软件开发沉思录--ThoughtWorks文集

用ThoughtWorks.QRCode生成二维码时出现“索引超出了数组界限”的错误

使用ThoughtWorks.QRCode 生成二维码（带logo）

使用 Skeleton of Thought 技术实现更高效的 AI 文本生成

推荐项目：ThoughtWorks Each——简化Scala中Monadic编程的艺术

ThoughtWorks.QRCode类库

jmeter打开xml文件报jmeter.save.SaveService: Conversion error com.thoughtworks.xstream

ThoughtWorks 结对编程

.NET 二维码生成（ThoughtWorks.QRCode）

小米手机肿么还原时钟

15000流明是多少瓦

一般普通投影机功率多大?

苹果绿联转换器有些投影机不能用

坚果V9投影机具体参数?

有关九年级作文850字精选

80后90后_高一作文

中级卫生专业资格中医全科学主治医师中级模拟题2021年(9)案与解析

(精品)师范大学招考硕士研究生课程八六0试卷

ZXMVC8900(V3

【模拟人生4（The Sims 4）性感露背黑色亮片礼服MOD V20190313】模拟人生4（The Sims 4）性感露背黑色亮片礼服MOD V20190313 官方免费下载

【生化危机2：重制版（Resident Evil 2 Remake）克莱尔红头发深色服装MOD】生化危机2：重制版（Resident Evil 2 Remake）克莱尔红头发深色服装MOD 官方免费下载

【模拟人生4（The Sims 4）性感露背深V领吊带裙MOD V20190311】模拟人生4（The Sims 4）性感露背深V领吊带裙MOD V20190311 官方免费下载

【模拟人生4（The Sims 4）科幻风宇宙飞船家庭住宅MOD V20190311】模拟人生4（The Sims 4）科幻风宇宙飞船家庭住宅MOD V20190311 官方免费下载

【鬼泣5（Devil May Cry V）v1.0十四项修改】鬼泣5（Devil May Cry V）v1.0十四项修改 官方免费下载

如何实现高效的treenode搜索算法

treenode与链表有何本质区别

在哪些场景下应优先考虑使用treenode

treenode在树形结构中的角色是什么

如何通过treenode实现二叉树

【CVutils】计算机视觉：视频图像（清洗、裁剪、人脸区域抓取等）数据预处理&数据集制作 || 代码合集

《大数据技术原理与应用》林子雨期末复习重点（总结）

再谈指针：大佬给你拨开 C指针的云雾

Maven的pom文件提示错误 Failure to transfer com.thoughtworks.xstream:xstream:jar:

【鬼泣5（Devil May Cry V）v1.0十四项修改】鬼泣5（Devil May Cry V）v1.0十四项修改官方免费下载