scrapy通过Request返回的页面数据与浏览器查看到的页面数据不一致|电子爱好者

admin管理员组
文章数量:1531699

1.URL的地址可以反映请求用户所在的区域，区域不同返回的数据也不同
例如：http://www.xxxx/en/xxx 和 http://www.xxxx/cn/xxx
就可以看出不同

2.请求用户的IP地址所在的区域，如果使用代理，则返回的数据也可能不同。

3.请求头的设置不同，例如：user-agent,accept-language不同也会导致返回的数据不同。
scrapy有自己默认的scrapy相关的user-agent,且默认accept-language为en，所以返回的内容与chrome浏览器返回的内容不同。

4.chromedriver 与 Chrome浏览器的版本不一致。chromedriver下载地址，每个文件夹的notes.txt文件中都有对本版本对应chrome浏览器的说明。chromedriver下载之后需要放在/usr/local/bin下（mac）

补充：
1.可以在chrome浏览器网址输入：chrome://version/ 来查看详细的信息。

2.scrapy可以断点调试查看：response对象里面的request对象里面的headers对象的user-agent，这个是请求头，注意与响应头区分开来。

3.scrapy的请求头设置可以在setting.py文件中：

DEFAULT_REQUEST_HEADERS = {
    'accept-language': 'zh-CN,zh;q=0.8',
    'user-agent': 'Mozilla/5.0 (Macintosh; Intel Mac OS X 10_13_3) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/68.0.3440.106 Safari/537.36'
}

本文标签：页面数据浏览器 scrapy request

版权声明：本文标题：scrapy通过Request返回的页面数据与浏览器查看到的页面数据不一致内容由热心网友自发贡献，该文观点仅代表作者本人，转载请联系作者并注明出处：https://m.elefans.com/dongtai/1724843632a993535.html，本站仅提供信息存储空间服务，不拥有所有权，不承担相关法律责任。如发现本站有涉嫌抄袭侵权/违法违规的内容，一经查实，本站将立刻删除。

更多相关文章

xp系统

chrome浏览器项目登陆页面卡死，XHR查看ajax请求一直在pending状态

1天前

项目开发时登陆测试环境验证问题，使用新的tab页面打开该地址，登陆时页面卡死白屏，卡死前打开F12查看控制台中的ajax请求，显示部分请求始终处于pen

如何使用postman抓包（Chrome 浏览器）

1天前

如何使用postman抓包（Chrome 浏览器） 1.安装插件（Postman&Postman Interceptor）&#xff1

Chrome浏览器无法开启声音，并且音量合成器中没有选项

1天前

chrome toolbox扩展，它有个快捷键功能，只要一不小心按下AltW，那么在下次按AltW之前，你的chrome被彻底静音了。不行就换个浏览

Chrome浏览器同一窗口每次请求sessionId不同问题的一种解决办法分享

1天前

最近在调试一些浏览器请求页面的时候，在其他浏览器都正常，唯独只有谷歌chrome浏览器不行，问题的最直接现象就是每次请求在后台过滤器里通过request.getSession

Chrome 浏览器如何完美实现滚动截图技巧,在电脑上实现长截屏

1天前

一、前言我们平时在浏览网页时，想把碰到好的网页内容或者文章截屏保存，但是网页的长度常常会超出屏幕高度，一般的截屏功能只能截取显示在屏幕上的内容，那我们

Google Chrome浏览器的回退功能快捷键

1天前

能点击进来的应该都是键盘党，我也是。以下： Alt← 回退 Alt→ 前进在常用的的浏览器中，按Backspace键是可以回退页面的。但在Google Chrome浏览

如何解决谷歌Chrome浏览器空白页的问题

1天前

如何解决谷歌Chrome浏览器空白页的问题参考文章： （1）如何解决谷歌Chrome浏览器空白页的问题 （2）https:

WR703N路由器刷openwrt后续之------打开数据双传。

1天前

之前在刷完openwrt之后就试图用手机上的软件来对路由器发送数据进而操控底层节点。但是改了半天之后，还是实现不了这些功能。（比如有的时候只能发送一次数据，或者有的时候只能打

怎么登陆计算机管理,192.168.0.1怎么登陆到管理页面

1天前

本文档介绍路由器登录管理界面方法，帮助您快速登录管理界面进行相关设置，下面都以腾达路由器来讲解，其他品牌路由器登陆方法类似。 1.电脑或手机连接上路由器 1.1有线电脑找根

解决双系统中Ubuntu16.04启动页面是黑屏，并只有一个光标在闪的问题

21小时前

问题背景本人为了学习大数据，在自己的dell笔记本电脑上安装了windows 10 和 Ubuntu 16.04系统，本来两个系统运行的挺好的，但是最近一直使用了Wind

大数据安全和网络安全基础知识

14小时前

不要把自己的努力看的太重，毕竟大家都在努力这里写目录标题商业扫描器命令执行一句话木马超全局变量用post方法去接收pw变量SQL注入分为显注和盲注git安装git与github查看隐藏的目录和文件夹三款系统扫描器openavsness

手机html页面图片不显示,是什么原因？HTML插入图片显示不出来？

14小时前

2007-09-12 为什么插入的图片不显示一、电脑速度“慢”是主要问题 1、网络故障(新浪系统、地方连接等)； 2、电脑故障(先天不足、后天维护保养差等)； 3、速度慢多数情况是网络慢新浪系统

【人工智能】人工智能、机器学习和数据工程 InfoQ 趋势报告 - 2021 年 8 月

13小时前

关键要点我们看到越来越多的公司使用深度学习算法。因此，我们将深度学习从创新者转移到了早期采用者类别。与此相关的是，深度学习存在新的挑战，例如在边缘设备上部署算法和训练非常大

一口气了解大模型相关通识，基础笔记！_大模型数据

13小时前

一、大模型生态有哪些语言类大模型: GPT-3、GPT-3.5、GPT-4系列模型。并且，OpenAl在训练GPT-3的同时训练了参数不同、复杂度各不相同的A、B、C、D四项大模型 (基座模型)&#xff0

过年装逼小技能-ESP8266实现连接WiFi自动跳出浏览器界面~

6小时前

一个很简单的小操作，每逢家里有客人来访，总是需要到处询问WiFi密码。i人对此十分抗拒，刚好最近在学习ESP8266，想到了可以利用ESP8266广播W

移动硬盘接android手机吗,笔点说：智能手机可以直接连接移动硬盘读取数据吗？...

3小时前

原标题：笔点说：智能手机可以直接连接移动硬盘读取数据吗？ 今天在问答平台上受邀答题，网友询问：“有没有哪一款移动硬盘可以用在电脑上

移动硬盘无法读取数据，总是提醒格式化

3小时前

解决办法：运行cmd，输入chkdsk G:f，回车即可。

移动硬盘危机：读取出错结构损坏的数据拯救之道

2小时前

一、遭遇困境：移动硬盘读取出错结构损坏在数字化时代，移动硬盘早已成为我们存储和携带数据的重要工具。然而，有时我们可能会遭遇一个令人头疼的问题——移动硬盘读取出错&

群晖第二篇-挂载外接移动硬盘拷贝数据

2小时前

1.首先将移动硬盘接入前面的usb口中，然后依次点击“控制面板”->“外接设备”，然后查看硬盘是否挂载成功此时则正常，ps：西数的一块移动硬盘不

Data Security and Privacy数据安全与隐私重要知识点

1小时前

Data Security and Privacy Part1: Internet Communication1.1 Risk and Countermeasure1.2 TLS Protocol1.2.1 Overview1.2.1.1

电子爱好者 - 最新技术资讯及电子产品介绍！

scrapy通过Request返回的页面数据与浏览器查看到的页面数据不一致

更多相关文章

chrome浏览器项目登陆页面卡死，XHR查看ajax请求一直在pending状态

如何使用postman抓包（Chrome 浏览器）

Chrome浏览器无法开启声音，并且音量合成器中没有选项

Chrome浏览器同一窗口每次请求sessionId不同问题的一种解决办法分享

Chrome 浏览器如何完美实现滚动截图技巧,在电脑上实现长截屏

Google Chrome浏览器的回退功能快捷键

如何解决谷歌Chrome浏览器空白页的问题

WR703N路由器刷openwrt后续之------打开数据双传。

怎么登陆计算机管理,192.168.0.1怎么登陆到管理页面

解决双系统中Ubuntu16.04启动页面是黑屏，并只有一个光标在闪的问题

大数据安全和网络安全基础知识

手机html页面图片不显示,是什么原因？HTML插入图片显示不出来？

【人工智能】人工智能、机器学习和数据工程 InfoQ 趋势报告 - 2021 年 8 月

一口气了解大模型相关通识，基础笔记！_大模型数据

过年装逼小技能-ESP8266实现连接WiFi自动跳出浏览器界面~

移动硬盘接android手机吗,笔点说：智能手机可以直接连接移动硬盘读取数据吗？...

移动硬盘无法读取数据，总是提醒格式化

移动硬盘危机：读取出错结构损坏的数据拯救之道

群晖第二篇-挂载外接移动硬盘拷贝数据

Data Security and Privacy数据安全与隐私重要知识点

发表评论

推荐文章

SD卡插入手机容量变小，U盘低级格式化HA-LLFTOOL

在win10pe中集成virtio驱动

Ubuntu 下安装新世纪五笔输入法

【windows10】如何将我的电脑设在桌面，而非快捷方式

win10 系统识别不了移动硬盘

热门文章

在Windows10上安全弹出U盘的三种方法，总有一种适合你

(图文)M.2_NVME协议固态硬盘转接PCIE卡通过UEFI引导安装Windows7

获取Chrome浏览器Cookies的一种方法

解决VMware和AMD兼容的问题用了一年时间

下载Ubuntu镜像时，i386 和 amd64 的区别

win10的ssh服务器开启及内网穿透到手机端

Windows10 java环境变量的配置详细教程（Windows10 和Windows11）

粉丝答疑：电脑蓝屏了怎么办？

Mac电脑无法读取和写入移动硬盘怎么办

计算机调整分区出现无法读取文件提示,电脑从硬盘分区往其他分区复制文件的时候提示“一个意外错误使你无法复制该文件……”...

最新文章

如何从xp升级到WIN7

VMware虚拟机安装windows server 2012 R2教程（图文版 超详细！）

docker选择安装位置_详解docker pull 下来的镜像文件存放的位置

VMware Workstation Pro 12 无法使用超过4G大小的ghost镜像文件进行系统还原的 傻 快 处理方案

linux下如何读取使用iso 镜像文件的方法

win7变成xp风格了怎么改回_win7

xp的服务器系统怎么安装win7系统教程,教你xp系统下安装win7双系统的教程

如何打开iso文件

虚拟光驱下载安装和使用，Windows系统如何直接打开iso文件

修改镜像文件boot.wim(再封装)

xpvista系统升级为win7

linux命令之主机与虚拟机之间挂载iso镜像文件

vs2015镜像文件安装

android iso 制作工具,android x86 iso custom

SACD ISO镜像中提取DSDIFF(DFF)、DSF文件

小米手机肿么还原时钟

15000流明是多少瓦

一般普通投影机功率多大?

苹果绿联转换器有些投影机不能用

坚果V9投影机具体参数?

有关九年级作文850字精选

80后90后_高一作文

中级卫生专业资格中医全科学主治医师中级模拟题2021年(9)案与解析

(精品)师范大学招考硕士研究生课程八六0试卷

ZXMVC8900(V3

【模拟人生4（The Sims 4）性感露背黑色亮片礼服MOD V20190313】模拟人生4（The Sims 4）性感露背黑色亮片礼服MOD V20190313 官方免费下载

【生化危机2：重制版（Resident Evil 2 Remake）克莱尔红头发深色服装MOD】生化危机2：重制版（Resident Evil 2 Remake）克莱尔红头发深色服装MOD 官方免费下载

【模拟人生4（The Sims 4）性感露背深V领吊带裙MOD V20190311】模拟人生4（The Sims 4）性感露背深V领吊带裙MOD V20190311 官方免费下载

【模拟人生4（The Sims 4）科幻风宇宙飞船家庭住宅MOD V20190311】模拟人生4（The Sims 4）科幻风宇宙飞船家庭住宅MOD V20190311 官方免费下载

【鬼泣5（Devil May Cry V）v1.0十四项修改】鬼泣5（Devil May Cry V）v1.0十四项修改 官方免费下载

如何实现高效的treenode搜索算法

treenode与链表有何本质区别

在哪些场景下应优先考虑使用treenode

treenode在树形结构中的角色是什么

如何通过treenode实现二叉树

VMware虚拟机安装windows server 2012 R2教程（图文版超详细！）

VMware Workstation Pro 12 无法使用超过4G大小的ghost镜像文件进行系统还原的傻快处理方案

【鬼泣5（Devil May Cry V）v1.0十四项修改】鬼泣5（Devil May Cry V）v1.0十四项修改官方免费下载