python中requests模块有些网站不能访问解决方案|电子爱好者

admin管理员组
文章数量:1529462

python学习中爬取网站视频时由于python本身不能地址限制的原因，不能直接用response = requests.get(url)获取到网页源代码，进而无法爬取网站信息。
我以猫眼网为例：

访问猫眼代码如下：

import requests
from requests.exceptions import RequestException
def get_one_page(url):
    response = requests.get(url)
    try:
        if response.status_code == 200:
            return response.text
        return None
    except RequestException:
        return None
def main():
    url = 'http://maoyan/board/4'
    html = get_one_page(url)
    print(html)
if __name__ == '__main__':
    main()

控制台会出现这样的代码，如果把它写在html里，就是一个禁止访问的页面：

<body>
  <header>
    <h3><span class="icon">⛔️</span>很抱歉，您的访问被禁止了</h3>
  </header>
  <main>
    <p>? 如何恢复？</p>
    <ol>
      <li>
        &nbsp;•&nbsp;&nbsp;您可以尝试切换网络环境，例如：关闭 Wi-Fi、关闭 VPN 等网络代理再尝试访问
      </li>
      <li>
        &nbsp;•&nbsp;&nbsp;如果您认为当前网络的封禁是误报，请提交您的联系方式，以便我们核实
        <form method="POST" action="?__oceanus_forbidden=1">
          <input type="text" name="contact" required placeholder="请输入手机号或者邮箱地址" />
          <button class="row" type="submit">提交</button>
        </form>
      </li>
    </ol>
  </main>
  <footer>
    <a href="https://maoyan">猫眼电影</a>
    <a href="mailto:oceanus.feedback@maoyan">邮件反馈</a>
  </footer>
</body>

解决方法：是这种访问一般都是代码后台访问网站，现在稍微有点反扒意识的网站，都不能正常爬取到，这个时候返回的状态码也不是200，所以我们给他加入头部信息，可以直接在网页上审查元素，点network，再点doc，查看他的**（user-agent）用户代理就行的，这就是个访问浏览器的方式，当我们不用这个头部信息的时候，有些网站就认为我们不是从浏览器访问的，就不给你爬取，所以我们加上这个头部信息就行了，但是有些网站的反扒措施比较好，就像知乎**，就算把所有的头部信息都加在里面，甚至是登录后的cookies，也不能拿到首页的源代码，必须模拟登录，现在介绍这个是最简单的，就是加个用户代理**"Mizilla/5.0**"就行了。

import requests
from requests.exceptions import RequestException
def get_one_page(url):
    headers = {"user-agent": "Mizilla/5.0"}
    response = requests.get(url, headers=headers)
    try:
        if response.status_code == 200:
            return response.text
        return None
    except RequestException:
        return Noneain():
    url = 'http://maoyan/board/4'
    html = get_one_page(url)
    print(html)
if __name__ == '__main__':
    main()

现在便可以正常访问一些普通的网站。

本文标签：模块解决方案网站 Python requests

版权声明：本文标题：python中requests模块有些网站不能访问解决方案内容由热心网友自发贡献，该文观点仅代表作者本人，转载请联系作者并注明出处：https://m.elefans.com/dianzi/1726627252a1078891.html，本站仅提供信息存储空间服务，不拥有所有权，不承担相关法律责任。如发现本站有涉嫌抄袭侵权/违法违规的内容，一经查实，本站将立刻删除。

更多相关文章

xp系统

电子爱好者 - 最新技术资讯及电子产品介绍！

python中requests模块有些网站不能访问解决方案

更多相关文章

pythonQQ邮箱自动发送邮件

python接收163邮件以及下载附件（以163邮箱为例）

解决网站发邮件导致IP泄露的问题

qq互联 网站接入三方账号

【合作】网站提交入口

用户注册登录模块实践

python 爬虫 selenium 无头浏览器设置

Win10更新导致无法使用局域网共享打印机最佳解决方案

win10怎么用计算机的搜索,搜索框用不了？Win10左下角搜索框无法搜索无反应的解决方案...

设置Win10的Hyper-V的遇到的问题及解决方案

Win10 安装Python和pip

Chrome浏览器无法登录知乎、b站解决方案

python打开chrome浏览器的2种方法

郑州轻工业大学-校园网自动拨号解决方案

python实现数据恢复软件_恢复python

【详细】Window7s自动更新启动后出现黑屏只显示鼠标解决方案

【python】零基础从入门到精通(六）

1.Python教程--基础篇（全）

启动系统时无法正常启动提示windowssystem32winload.efi 解决方案

AMD HDMI Output未插入 解决方案

发表评论

推荐文章

MSDN的下载和使用

MateBook D 14 2022款 12代酷睿版集显(NbF-16)原厂Win11系统下载

关于VM14中安装win 10遇到的小问题

win10dos命令

dlink打印服务器重置,DLink_DP310打印服务器用户手册.pdf

热门文章

提升WIFI提速十大技巧

小米手机+MIUI系统开发版线刷到稳定版（小米8+MIUI10）

android模拟器横屏显示,安卓模拟器bluestacks怎么横屏显示

python实现bt下载器_10行 Python代码使用磁力链接批量下载种子

(BUU_[BJDCTF2020]BJD hamburger competition

2016女生赛 1003 Luck Competition

吐血整理 ChatGPT 3.54.0 新手使用手册~ 【2024.09.06 亲测好用】

安装win10出现“计算机意外的重新启动或遇到错误？

win7提示“User Profile Service服务未能登录”

X86、X64、win32、AMD64、ARM

最新文章

windows计算机无法打开,电脑无法运行Win11是怎么回事？

win10 电脑开机底部任务栏无反应（鼠标一直转圈，部分图标不显示）

电脑开机一两秒就断电怎么办？

电脑开机出现黑屏，出现“windows 未能启动，原因可能更改了硬件或者软件，解决此类问题的步骤”

02、【电脑维修】windows系统登录时候出现两个账户（Administrator账户隐藏）

windows电脑改造为linux

查看电脑开机关机记录

电脑设置开机自启动软件

计算机常年开机,电脑长时间开机的危害

插入安装光盘并重新启动计算机,电脑开机时显示 插入windows安装光盘并重新启动计算机 怎么解决 急救...

玩转电脑|如何取消开机按 CTRL+ALT+DEL 登陆系统

电脑关机 重启 开机怎么看日志

计算机系统不升级设置,笔记本电脑怎么设置不更新系统？

电脑引导,电脑常见开机引导错误的解决方法

电脑开机内存占用过高处理

小米手机肿么还原时钟

15000流明是多少瓦

一般普通投影机功率多大?

苹果绿联转换器有些投影机不能用

坚果V9投影机具体参数?

有关九年级作文850字精选

80后90后_高一作文

中级卫生专业资格中医全科学主治医师中级模拟题2021年(9)案与解析

(精品)师范大学招考硕士研究生课程八六0试卷

ZXMVC8900(V3

【模拟人生4（The Sims 4）性感露背黑色亮片礼服MOD V20190313】模拟人生4（The Sims 4）性感露背黑色亮片礼服MOD V20190313 官方免费下载

【生化危机2：重制版（Resident Evil 2 Remake）克莱尔红头发深色服装MOD】生化危机2：重制版（Resident Evil 2 Remake）克莱尔红头发深色服装MOD 官方免费下载

【模拟人生4（The Sims 4）性感露背深V领吊带裙MOD V20190311】模拟人生4（The Sims 4）性感露背深V领吊带裙MOD V20190311 官方免费下载

【模拟人生4（The Sims 4）科幻风宇宙飞船家庭住宅MOD V20190311】模拟人生4（The Sims 4）科幻风宇宙飞船家庭住宅MOD V20190311 官方免费下载

【鬼泣5（Devil May Cry V）v1.0十四项修改】鬼泣5（Devil May Cry V）v1.0十四项修改 官方免费下载

如何实现高效的treenode搜索算法

treenode与链表有何本质区别

在哪些场景下应优先考虑使用treenode

treenode在树形结构中的角色是什么

如何通过treenode实现二叉树

qq互联网站接入三方账号

AMD HDMI Output未插入解决方案

插入安装光盘并重新启动计算机,电脑开机时显示插入windows安装光盘并重新启动计算机怎么解决急救...

电脑关机重启开机怎么看日志

【鬼泣5（Devil May Cry V）v1.0十四项修改】鬼泣5（Devil May Cry V）v1.0十四项修改官方免费下载