2024年最全爬虫之Fiddler抓包腾讯视频_fiddler抓腾讯视频，2024年最新美团面试到发offer过程|电子爱好者

admin管理员组
文章数量:1532135

一、Python所有方向的学习路线

Python所有方向路线就是把Python常用的技术点做整理，形成各个领域的知识点汇总，它的用处就在于，你可以按照上面的知识点去找对应的学习资源，保证自己学得较为全面。

二、学习软件

工欲善其事必先利其器。学习Python常用的开发软件都在这里了，给大家节省了很多时间。

三、入门学习视频

我们在看视频学习的时候，不能光动眼动脑不动手，比较科学的学习方法是在理解之后运用它们，这时候练手项目就很适合了。

网上学习资料一大堆，但如果学到的知识不成体系，遇到问题时只是浅尝辄止，不再深入研究，那么很难做到真正的技术提升。

需要这份系统化学习资料的朋友，可以戳这里获取

一个人可以走的很快，但一群人才能走的更远！不论你是正从事IT行业的老鸟或是对IT行业感兴趣的新人，都欢迎加入我们的的圈子（技术交流、学习资源、职场吐槽、大厂内推、面试辅导），让我们一起学习成长！

（4）观察网址结构，得出结论：

（5）下一个提取id我发现每次都可以在上一个js包中找到，这些js包像一个链表一样，是链式链接的。下面的图片是我在第一个js包中搜索第二个js包的id的例子：

这样，我们就能找到所有的js包，从而爬取所有的评论。

2.具体代码

#提取10次，每次提取10个
import urllib.request,time
import urllib.error
import random,re


'''
作用：该模块为爬虫设置用户和ip代理
参数：thisUrl是要爬取的网址
    ip_pool是ip代理池
返回值：返回爬取网页信息的二进制数据
'''
def ua_ip(thisUrl, ip_pool):
    #构建用户代理池
    ua_pool = [
        'Mozilla/5.0 (Windows NT 10.0; WOW64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/63.0.3239.26 Safari/537.36 Core/1.63.5558.400 QQBrowser/10.1.1695.400',
        'User-Agent: Mozilla/4.0 (compatible; MSIE 7.0; Windows NT 5.1; Trident/4.0; SE 2.X MetaSr 1.0; SE 2.X MetaSr 1.0; .NET CLR 2.0.50727; SE 2.X MetaSr 1.0)',
        'Mozilla/5.0 (Windows; U; Windows NT 6.1; en-US) AppleWebKit/534.16 (KHTML, like Gecko) Chrome/10.0.648.133 Safari/534.16',
        'Mozilla/5.0 (Windows NT 6.1; WOW64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/38.0.2125.122 UBrowser/4.0.3214.0 Safari/537.36',
        'Mozilla/5.0 (compatible; MSIE 9.0; Windows NT 6.1; WOW64; Trident/5.0; SLCC2; .NET CLR 2.0.50727; .NET CLR 3.5.30729; .NET CLR 3.0.30729; Media Center PC 6.0; .NET4.0C; .NET4.0E; LBBROWSER)',
        "Mozilla/4.0 (compatible; MSIE 6.0; Windows NT 5.1; SV1; AcooBrowser; .NET CLR 1.1.4322; .NET CLR 2.0.50727)",
        "Mozilla/4.0 (compatible; MSIE 7.0; Windows NT 6.0; Acoo Browser; SLCC1; .NET CLR 2.0.50727; Media Center PC 5.0; .NET CLR 3.0.04506)",
        "Mozilla/4.0 (compatible; MSIE 7.0; AOL 9.5; AOLBuild 4337.35; Windows NT 5.1; .NET CLR 1.1.4322; .NET CLR 2.0.50727)",
        "Mozilla/5.0 (Windows; U; MSIE 9.0; Windows NT 9.0; en-US)",
        "Mozilla/5.0 (compatible; MSIE 9.0; Windows NT 6.1; Win64; x64; Trident/5.0; .NET CLR 3.5.30729; .NET CLR 3.0.30729; .NET CLR 2.0.50727; Media Center PC 6.0)",
        "Mozilla/5.0 (compatible; MSIE 8.0; Windows NT 6.0; Trident/4.0; WOW64; Trident/4.0; SLCC2; .NET CLR 2.0.50727; .NET CLR 3.5.30729; .NET CLR 3.0.30729; .NET CLR 1.0.3705; .NET CLR 1.1.4322)",
        "Mozilla/4.0 (compatible; MSIE 7.0b; Windows NT 5.2; .NET CLR 1.1.4322; .NET CLR 2.0.50727; InfoPath.2; .NET CLR 3.0.04506.30)",
        "Mozilla/5.0 (Windows; U; Windows NT 5.1; zh-CN) AppleWebKit/523.15 (KHTML, like Gecko, Safari/419.3) Arora/0.3 (Change: 287 c9dfb30)",
        "Mozilla/5.0 (X11; U; Linux; en-US) AppleWebKit/527+ (KHTML, like Gecko, Safari/419.3) Arora/0.6",
        "Mozilla/5.0 (Windows; U; Windows NT 5.1; en-US; rv:1.8.1.2pre) Gecko/20070215 K-Ninja/2.1.1",
        "Mozilla/5.0 (Windows; U; Windows NT 5.1; zh-CN; rv:1.9) Gecko/20080705 Firefox/3.0 Kapiko/3.0",
        "Mozilla/5.0 (X11; Linux i686; U;) Gecko/20070322 Kazehakase/0.4.5",
        "Mozilla/5.0 (X11; U; Linux i686; en-US; rv:1.9.0.8) Gecko Fedora/1.9.0.8-1.fc10 Kazehakase/0.5.6",
        "Mozilla/5.0 (Windows NT 6.1; WOW64) AppleWebKit/535.11 (KHTML, like Gecko) Chrome/17.0.963.56 Safari/535.11",
        "Mozilla/5.0 (Macintosh; Intel Mac OS X 10_7_3) AppleWebKit/535.20 (KHTML, like Gecko) Chrome/19.0.1036.7 Safari/535.20",
        "Opera/9.80 (Macintosh; Intel Mac OS X 10.6.8; U; fr) Presto/2.9.168 Version/11.52",
        "Mozilla/5.0 (Windows NT 6.1; WOW64) AppleWebKit/536.11 (KHTML, like Gecko) Chrome/20.0.1132.11 TaoBrowser/2.0 Safari/536.11",
        "Mozilla/5.0 (Windows NT 6.1; WOW64) AppleWebKit/537.1 (KHTML, like Gecko) Chrome/21.0.1180.71 Safari/537.1 LBBROWSER",
        "Mozilla/5.0 (compatible; MSIE 9.0; Windows NT 6.1; WOW64; Trident/5.0; SLCC2; .NET CLR 2.0.50727; .NET CLR 3.5.30729; .NET CLR 3.0.30729; Media Center PC 6.0; .NET4.0C; .NET4.0E; LBBROWSER)",
        "Mozilla/4.0 (compatible; MSIE 6.0; Windows NT 5.1; SV1; QQDownload 732; .NET4.0C; .NET4.0E; LBBROWSER)",
        "Mozilla/5.0 (Windows NT 6.1; WOW64) AppleWebKit/535.11 (KHTML, like Gecko) Chrome/17.0.963.84 Safari/535.11 LBBROWSER",
        "Mozilla/4.0 (compatible; MSIE 7.0; Windows NT 6.1; WOW64; Trident/5.0; SLCC2; .NET CLR 2.0.50727; .NET CLR 3.5.30729; .NET CLR 3.0.30729; Media Center PC 6.0; .NET4.0C; .NET4.0E)",
        "Mozilla/5.0 (compatible; MSIE 9.0; Windows NT 6.1; WOW64; Trident/5.0; SLCC2; .NET CLR 2.0.50727; .NET CLR 3.5.30729; .NET CLR 3.0.30729; Media Center PC 6.0; .NET4.0C; .NET4.0E; QQBrowser/7.0.3698.400)",
        "Mozilla/4.0 (compatible; MSIE 6.0; Windows NT 5.1; SV1; QQDownload 732; .NET4.0C; .NET4.0E)",
        "Mozilla/4.0 (compatible; MSIE 7.0; Windows NT 5.1; Trident/4.0; SV1; QQDownload 732; .NET4.0C; .NET4.0E; 360SE)",
        "Mozilla/4.0 (compatible; MSIE 6.0; Windows NT 5.1; SV1; QQDownload 732; .NET4.0C; .NET4.0E)",
        "Mozilla/4.0 (compatible; MSIE 7.0; Windows NT 6.1; WOW64; Trident/5.0; SLCC2; .NET CLR 2.0.50727; .NET CLR 3.5.30729; .NET CLR 3.0.30729; Media Center PC 6.0; .NET4.0C; .NET4.0E)",
        "Mozilla/5.0 (Windows NT 5.1) AppleWebKit/537.1 (KHTML, like Gecko) Chrome/21.0.1180.89 Safari/537.1",
        "Mozilla/5.0 (Windows NT 6.1; WOW64) AppleWebKit/537.1 (KHTML, like Gecko) Chrome/21.0.1180.89 Safari/537.1",
        "Mozilla/5.0 (iPad; U; CPU OS 4_2_1 like Mac OS X; zh-cn) AppleWebKit/533.17.9 (KHTML, like Gecko) Version/5.0.2 Mobile/8C148 Safari/6533.18.5",
        "Mozilla/5.0 (Windows NT 6.1; Win64; x64; rv:2.0b13pre) Gecko/20110307 Firefox/4.0b13pre",
        "Mozilla/5.0 (X11; Ubuntu; Linux x86_64; rv:16.0) Gecko/20100101 Firefox/16.0",
        "Mozilla/5.0 (Windows NT 6.1; WOW64) AppleWebKit/537.11 (KHTML, like Gecko) Chrome/23.0.1271.64 Safari/537.11",
        "Mozilla/5.0 (X11; U; Linux x86_64; zh-CN; rv:1.9.2.10) Gecko/20100922 Ubuntu/10.10 (maverick) Firefox/3.6.10"
    ]

    thisUA = random.choice(ua_pool) #从用户代理池中随机选择一个用户代理
    thisIP = random.choice(ip_pool) #从ip代理池中随机选择一个ip代理
    print("用户代理：{}".format(thisUA))
    print("ip代理：{}".format(thisIP))
    #将IP代理格式化
    proxy = urllib.request.ProxyHandler({'http': thisIP})
    #安装IP代理,并构建开启工具
    opener = urllib.request.build_opener(proxy, urllib.request.HTTPHandler)
    #构造报头
    headers = ('user-agent', thisUA)
    #安装报头
    opener.addheaders = [headers]
    #将opener设置为全局
    urllib.request.install_opener(opener)
    #以二进制形式爬取信息
    respense = urllib.request.urlopen(thisUrl)
    data = respense.read()
    respense.close()    #避免持续链接导致被发现是爬虫
    return data

def main():
    ip_pool = [
        '127.0.0.1:8888'
    ]
    v_id = '2369303789'     #要爬取的视频的id，这里我爬取的是斗罗大陆的
    c_id = '0'    #第一次评论的id
    num = '10'  #每一页提取的评论数数目
    n = 1   #用来记录获取的评论总数
    fp = open('D:\\python\\new.txt', 'a+')
    for i in range(0, 10):
        try:
            # 网址格式：http://coral.qq/article/【视频id】/comment/v2?callback=_article2369303789commentv2&orinum=【一次提取的评论数目】&oriorder=o&pageflag=1&cursor=【下一个视频id】
            url = 'http://coral.qq/article/'+ v_id +'/comment/v2?callback=_article2369303789commentv2&orinum='+ num +'&oriorder=o&pageflag=1&cursor='+c_id
            #对获取的二进制数进行解码
            data = ua_ip(url, ip_pool).decode('utf-8', 'ignore')
            #构造获取下一页评论ip的正则表达式
            pat1 = '"last":"(.*?)"'
            c_ids = repile(pat1).findall(data)
            c_id = c_ids[0]     #c_ids是一个列表，获取他的第一个元素就是下一页评论id
            #构造获取评论内容的正则表达式
            pat2 = '"content":"(.*?)"'
            comment_list = repile(pat2).findall(data)
            for comment in comment_list:
                thisdata = "第"+str(n)+"个评论为：" + eval('u"' + comment + '"')
                print(thisdata)
                fp.write(thisdata + '\n')
                n += 1
        except urllib.error.HTTPError as e:
            if hasattr(e, 'code'):
                print(e.code)
            if hasattr(e, 'reason'):
                print(e.reason)
        except Exception as err:
            print(err)
        time.sleep(2)    # 每爬取一页，停顿2秒，减少频率，从而减少被发现的几率


![在这里插入图片描述](https://img-blog.csdnimg/20210511152217670.jpg?x-oss-process=image/watermark,type_ZmFuZ3poZW5naGVpdGk,shadow_10,text_aHR0cHM6Ly9ibG9nLmNzZG4ubmV0L3poaWd1aWd1,size_16,color_FFFFFF,t_70)

**感谢每一个认真阅读我文章的人，看着粉丝一路的上涨和关注，礼尚往来总是要有的：**



①　2000多本Python电子书（主流和经典的书籍应该都有了）

②　Python标准库资料（最全中文版）

③　项目源码（四五十个有趣且经典的练手项目及源码）

④　Python基础入门、爬虫、web开发、大数据分析方面的视频（适合小白学习）

⑤ Python学习路线图（告别不入流的学习）




**网上学习资料一大堆，但如果学到的知识不成体系，遇到问题时只是浅尝辄止，不再深入研究，那么很难做到真正的技术提升。**

**[需要这份系统化学习资料的朋友，可以戳这里获取](https://bbs.csdn/topics/618317507)**

**一个人可以走的很快，但一群人才能走的更远！不论你是正从事IT行业的老鸟或是对IT行业感兴趣的新人，都欢迎加入我们的的圈子（技术交流、学习资源、职场吐槽、大厂内推、面试辅导），让我们一起学习成长！**

本文标签：腾讯爬虫视频最全过程

版权声明：本文标题：2024年最全爬虫之Fiddler抓包腾讯视频_fiddler抓腾讯视频，2024年最新美团面试到发offer过程内容由热心网友自发贡献，该文观点仅代表作者本人，转载请联系作者并注明出处：https://m.elefans.com/xitong/1724844127a993593.html，本站仅提供信息存储空间服务，不拥有所有权，不承担相关法律责任。如发现本站有涉嫌抄袭侵权/违法违规的内容，一经查实，本站将立刻删除。

电子爱好者 - 最新技术资讯及电子产品介绍！

2024年最全爬虫之Fiddler抓包腾讯视频_fiddler抓腾讯视频，2024年最新美团面试到发offer过程

一、Python所有方向的学习路线

二、学习软件

三、入门学习视频

2.具体代码

更多相关文章

安卓手机怎么root_怎么在腾讯手机管家中一键获取Root权限

使用JS调用迅雷下载网站本地视频，生成迅雷下载链接

亲测好用，ChatGPT 3.54.0新手使用手册，最全论文指令手册~ 【2024年 更新】

腾讯免费企业邮箱服务器,怎样使用免费的腾讯企业邮箱

redmine 腾讯企业邮箱配置

为什么qq没有位置服务器,腾讯QQ内测扩列功能上线 2019QQ扩列为什么找不到

手机服务器连接视频文件夹吗,巧用手机自带功能向电脑传输视频 华为小米苹果均适用...

win7服务器如何还原系统教程视频,win7如何系统还原_win7系统还原教程

史上最全的计算机网络知识点总结

Win10 环境下安装Ubuntu 18.04过程记录

【探索】探究暴风影音视频截图黑屏原因

下载的****.ts格式的视频在迅雷播放器中无法播放

html音乐播放器怎么有黑边框,播放不能满屏有黑边怎么办,怎么剪切视频黑边,剪切黑边...

为什么chrome视频时卡得厉害(by quqi99)

腾讯wifi管家竟然盗取我家wifi密码惊讶！震惊！失望！

Python编程零基础如何逆袭成为爬虫实战高手之《WIFI破解》（甩万能钥匙十条街）爆赞爆赞~

ESP8266刷入WI-PWN制作wifi杀手的过程、准备材料、报错解决、烧录固件等

全网最全！解决VirtualBox或VMware启动虚拟机时报错问题“不能为虚拟电脑打开一个新任务”和“Error In suplibOslnit”解决方案超全超详细

腾讯企业邮箱没有绑定手机也没有绑定微信怎么处理

项目教程视频入口集合

发表评论

推荐文章

k3刷机 重置_斐讯K3刷机教程：一直重启、忘了密码怎么办？手机刷机包下载

惠普DL388G9服务器安装双系统无法启动问题

kali linux安装五笔输入法

UltraISO打开Ubuntu镜像ISO文件只有EFI文件夹

国内各种免费AI聊天机器人(ChatGPT)推荐(中)

热门文章

怎样把U盘格式化成NTFS格式

Prometheus监控系列-- 进阶阶段 | 高级操作 | 配合Grafana | 邮箱报警 | 参数说明

ie浏览器运行JavaScript脚本打开Chrome浏览器ie配置启用ActiveX控件配置

chrome浏览器项目登陆页面卡死，XHR查看ajax请求一直在pending状态

路由器安全升级和设置

GPU池化和虚拟化

win10系统windows网络诊断显示远程计算机或设备将不接受连接

Windows 10 子系统Linux重启(不重启Win10)

移动硬盘提示无法访问文件系统RAW，里面的文件如何找到

Setting up Distrobox on Ubuntu 22.04 （**）

最新文章

xp怎么更改锁定计算机的快捷键,xp锁定计算机快捷键_在Window XP中快速锁定计算机_xp怎么锁定计算机...

电脑公司GHOSTXP_SP3特别版V2012.02

深度小兵封装工具V5.0.0525 与 驱动选择最新版8.0F 封装WinXP_sp3唱凯歌&amp;nbsp;

[装机版]小路工作室GhostXP 2008贺岁版

Windows2003和SP2补丁集成+GHOST安装系统

深度完美 Ghost XP_SP3 软件选择版_2011.09

番茄花园 Ghost XP SP3 电脑城快速装机安全版 2011年6月

GhostXP_SP3会员专用版V4.0【IE6+IE8】

番茄花园 Ghost XP SP3 2011.7月 快速装机版

深度完美 Ghost XP SP3 纯净标准版 V120

新萝卜家园Ghost XP SP3电脑城装机版2013.08

电脑系统安装知识及安装步骤

基于优盘方式的WINDOWS 7系统安装

纯净和完美谁重要？

谈谈在电脑120的这些日子

小米手机肿么还原时钟

15000流明是多少瓦

一般普通投影机功率多大?

苹果绿联转换器有些投影机不能用

坚果V9投影机具体参数?

有关九年级作文850字精选

80后90后_高一作文

中级卫生专业资格中医全科学主治医师中级模拟题2021年(9)案与解析

(精品)师范大学招考硕士研究生课程八六0试卷

ZXMVC8900(V3

【模拟人生4（The Sims 4）性感露背黑色亮片礼服MOD V20190313】模拟人生4（The Sims 4）性感露背黑色亮片礼服MOD V20190313 官方免费下载

【生化危机2：重制版（Resident Evil 2 Remake）克莱尔红头发深色服装MOD】生化危机2：重制版（Resident Evil 2 Remake）克莱尔红头发深色服装MOD 官方免费下载

【模拟人生4（The Sims 4）性感露背深V领吊带裙MOD V20190311】模拟人生4（The Sims 4）性感露背深V领吊带裙MOD V20190311 官方免费下载

【模拟人生4（The Sims 4）科幻风宇宙飞船家庭住宅MOD V20190311】模拟人生4（The Sims 4）科幻风宇宙飞船家庭住宅MOD V20190311 官方免费下载

【鬼泣5（Devil May Cry V）v1.0十四项修改】鬼泣5（Devil May Cry V）v1.0十四项修改 官方免费下载

如何实现高效的treenode搜索算法

treenode与链表有何本质区别

在哪些场景下应优先考虑使用treenode

treenode在树形结构中的角色是什么

亲测好用，ChatGPT 3.54.0新手使用手册，最全论文指令手册~ 【2024年更新】

手机服务器连接视频文件夹吗,巧用手机自带功能向电脑传输视频华为小米苹果均适用...

k3刷机重置_斐讯K3刷机教程：一直重启、忘了密码怎么办？手机刷机包下载

深度小兵封装工具V5.0.0525 与驱动选择最新版8.0F 封装WinXP_sp3唱凯歌 

番茄花园 Ghost XP SP3 2011.7月快速装机版

【鬼泣5（Devil May Cry V）v1.0十四项修改】鬼泣5（Devil May Cry V）v1.0十四项修改官方免费下载