python 模拟微信浏览器请求_python爬虫:使用Selenium模拟浏览器行为|电子爱好者

admin管理员组
文章数量:1616424

前几天有位微信读者问我一个爬虫的问题，就是在爬去百度贴吧首页的热门动态下面的图片的时候，爬取的图片总是爬取不完整，比首页看到的少。原因他也大概分析了下，就是后面的图片是动态加载的。他的问题就是这部分动态加载的图片该怎么爬取到。

分析

他的代码比较简单，主要有以下的步骤：使用BeautifulSoup库，打开百度贴吧的首页地址，再解析得到id为new_list标签底下的img标签，最后将img标签的图片保存下来。

headers = {

'User-Agent':'Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/51.0.2704.103 Safari/537.36'

}

data=requests.get("https://tieba.baidu/index.html",headers=headers)

html=BeautifulSoup(data.text,'lxml')

前面提到过，有部分图片是动态加载的，那么首先我们得弄清楚，这部分图片是怎么动态加载的。在浏览器中打开百度贴吧的首页，可以明显的看到，在往下滚动滚动条的时候，当滚动到底部的时候，滚动条缩短了，并向上移动了一段距离。这个现象也正是有DOM元素动态的添加到了html文档的一个表现。动态加载数据无非就是ajax请求，而ajax本质上就是XMLHttpRequest请求(简称xhr)。在谷歌浏览器中，我们可以通过开发者工具的network面板来监测xhr请求。

刚打开首页时的xhr请求，这里的请求都和要爬取的

本文标签：浏览器爬虫 Python selenium

版权声明：本文标题：python 模拟微信浏览器请求_python爬虫:使用Selenium模拟浏览器行为内容由热心网友自发贡献，该文观点仅代表作者本人，转载请联系作者并注明出处：https://m.elefans.com/dongtai/1728737470a1171010.html，本站仅提供信息存储空间服务，不拥有所有权，不承担相关法律责任。如发现本站有涉嫌抄袭侵权/违法违规的内容，一经查实，本站将立刻删除。

更多相关文章

xp系统

电子爱好者 - 最新技术资讯及电子产品介绍！

python 模拟微信浏览器请求_python爬虫:使用Selenium模拟浏览器行为

更多相关文章

求助，微信浏览器如何跳转百度地图APP和高德地图APP

360浏览器开启webGL硬件加速解决百度地图3D视角正常展示的解决方案

想天浏览器：推荐国内主流浏览器TOP10

联想劫持Edge浏览器主页

C#操作IE浏览器(打开url、获取浏览器地址栏的地址、模拟百度搜索)

360浏览器，拖拽搜索，设置默认搜索引擎为”百度“

爬虫Selenium+Chrome 控制浏览器，打开百度网页，输入搜索关键词，点击回车，截取搜索页面

三星浏览器高阶使用技巧-修改CountryCode和UA

python编写一个简单的网页浏览器

python selenium 打开浏览器自动闪退

python 模拟微信浏览器请求_python爬虫:使用Selenium模拟浏览器行为

edge或谷歌浏览器打开默认是百度或其他，怎么修改成自己想要的页面

Chrome插件-屏蔽浏览器的百度广告

python模拟浏览器打开百度首页并登录或者点击首页新闻并保存网页

python爬虫模拟浏览器的两种方法_python爬虫模拟浏览器的两种方法实例分析

突破淘宝对于selenium检测，直接驱动google浏览器，跳过验证码输入

15.网络爬虫—selenium验证码破解

越过验证码 selenium模拟登录B站项目实战（附源码）

Python网络爬虫模拟登录与验证解析

Python|Pyppeteer实现自动注册Gmail邮箱(11)

发表评论

推荐文章

js判断是否是微信浏览器或者支付宝浏览器

dmg写入u盘_轻松教大家用U盘安装Mac OS10.14.1双系统

鸿蒙系统 麒麟系统什么关系,鸿蒙系统和麒麟芯片之间有什么秘密，为何只有麒麟芯片才能升级？...

Linux系统中Tomcat下载+安装+测试【一看就会】

ping通百度却在浏览器中打不开 netsh winsock reset

热门文章

【Linux &amp;&amp; Mac OS】Mac OS 和 Linux 的内核有什么区别

使用U盘安装CentOS 8.2（5）U盘恢复

【读写和修改U盘中的十六进制dat数据文件】

u盘文件被电脑杀毒软件删掉了，怎么才能恢复

Android 快速修复功能,用于解决Android系统问题的四大Android修复软件

台式计算机diy,电脑：台式机DIY及组装

Matlab R2019a Win64位 迅雷下载链接

mac系统正在计算机,苹果电脑mac出现死机问题如何解决？

华为m2android怎么升级,【刷机指导】华为平板M2 8 EMUI4.0回退EMUI3.1指导教程

openssh linux 下载,OpenSSH 下载与配置

最新文章

电脑达人教你怎么解决Win7系统盘渐渐变小的问题

怎么清理C盘？快速释放空间，这4招很管用！

你的C盘该减肥啦！

电脑D盘满了怎么办？这3个小技巧助你清理！

计算机英语 多余的,C盘都是英文不敢动手？只要删除这4个文件夹，电脑空间多出10个G！...

怎么清理ug10注册表_实用 | 小白该如何清理电脑、让电脑没这么卡？

可怜滴小C盘呀,清理清理你

掌握C盘整理方法帮你轻松提升电脑运行速度

手机桌面上的计算机为什么不能删除,为什么我的电脑无法删除C盘上的文件当删除 – 手机爱问...

计算机无法删除u盘里东西,u盘出现文件无法删除怎么办 u盘出现文件无法删除解决方法【详解】...

计算机里东西删除不了,为什么电脑上有的文件删不了？

尝试释放C盘空间

C盘各个文件夹的作用

电脑temp文件夹可以删除吗？4类数据删除，让c盘垃圾一扫而空

困扰很久的电脑问题—空白文件夹怎么处理？

小米手机肿么还原时钟

15000流明是多少瓦

一般普通投影机功率多大?

苹果绿联转换器有些投影机不能用

坚果V9投影机具体参数?

有关九年级作文850字精选

80后90后_高一作文

中级卫生专业资格中医全科学主治医师中级模拟题2021年(9)案与解析

(精品)师范大学招考硕士研究生课程八六0试卷

ZXMVC8900(V3

【模拟人生4（The Sims 4）性感露背黑色亮片礼服MOD V20190313】模拟人生4（The Sims 4）性感露背黑色亮片礼服MOD V20190313 官方免费下载

【生化危机2：重制版（Resident Evil 2 Remake）克莱尔红头发深色服装MOD】生化危机2：重制版（Resident Evil 2 Remake）克莱尔红头发深色服装MOD 官方免费下载

【模拟人生4（The Sims 4）性感露背深V领吊带裙MOD V20190311】模拟人生4（The Sims 4）性感露背深V领吊带裙MOD V20190311 官方免费下载

【模拟人生4（The Sims 4）科幻风宇宙飞船家庭住宅MOD V20190311】模拟人生4（The Sims 4）科幻风宇宙飞船家庭住宅MOD V20190311 官方免费下载

【鬼泣5（Devil May Cry V）v1.0十四项修改】鬼泣5（Devil May Cry V）v1.0十四项修改 官方免费下载

如何实现高效的treenode搜索算法

treenode与链表有何本质区别

在哪些场景下应优先考虑使用treenode

treenode在树形结构中的角色是什么

如何通过treenode实现二叉树

鸿蒙系统麒麟系统什么关系,鸿蒙系统和麒麟芯片之间有什么秘密，为何只有麒麟芯片才能升级？...

【Linux && Mac OS】Mac OS 和 Linux 的内核有什么区别

Matlab R2019a Win64位迅雷下载链接

计算机英语多余的,C盘都是英文不敢动手？只要删除这4个文件夹，电脑空间多出10个G！...

【鬼泣5（Devil May Cry V）v1.0十四项修改】鬼泣5（Devil May Cry V）v1.0十四项修改官方免费下载