python 爬取腾讯视频弹幕|电子爱好者

admin管理员组
文章数量:1530845

腾讯视频弹幕地址:http://mfm.video.qq/danmu?timestamp=0&target_id=xxxxx

1.在视频地址中获取target_id

2.通过视频cid和vid获取target_id

3.cid和vid在视频链接网页中可以抓取

4.在电视剧任意一集页面中可以抓取每一集vid，cid一样。

5.弹幕的timestamp参数每隔30s变化一次

代码

import requests
import json
import random
import os
from lxml import etree
from requests.packages.urllib3.exceptions import InsecureRequestWarning
requests.packages.urllib3.disable_warnings(InsecureRequestWarning)


headers = {
    'USER-AGENT': 'Mozilla/5.0 (Windows NT 10.0; WOW64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/67.0.3396.99 Safari/537.36',
}

def get_str_btw(s, f, b):
    par = s.partition(f)
    return (par[2].partition(b))[0][:]

def filename_find(filepath, return_type=0):
    basename = os.path.basename(filepath)
    extension = f'.{basename.split(".")[-1]}'
    extension_lang = f'.{basename.split(".")[-2]}.{basename.split(".")[-1]}'
    if not basename.__contains__('.'):
        extension = ''
        extension_lang = ''
    filename_without_extension = basename[0:len(basename)-len(extension)]
    if return_type == 0:    # 文件名
        return basename
    if return_type == 1:    # 后缀名
        return extension
    if return_type == 2:    # 无后缀文件名
        return filename_without_extension
    if return_type == 3:    # 后缀名加字幕语言名
        return extension_lang


def get_targetid(cid,vid):  # 传入豆瓣api获得的腾讯视频uri
    base_url = 'https://access.video.qq/danmu_manage/regist?vappid=97767206&vsecret=c0bdcbae120669fff425d0ef853674614aa659c605a613a4'
    # print(get_targetid(url))
    # 构造请求头部
    headers = {
    'USER-AGENT':'Mozilla/5.0 (Windows NT 10.0; WOW64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/67.0.3396.99 Safari/537.36',
    }
    data = {"wRegistType":2,"vecIdList":[vid],"wSpeSource":0,"bIsGetUserCfg":1,"mapExtData":{vid:{"strCid":cid,"strLid":""}}}
    # 发送请求，获得响应
    response = requests.post(url=base_url, headers=headers, data=json.dumps(data))
    # 获得网页源代码
    html = response.text
    targetid = get_str_btw(html, 'targetid=', '&')
    # 返回targetid
    return targetid


def seconds_to_time(seconds):
    mm = int(seconds * 100 % 100)
    m, s = divmod(seconds, 60)
    h, m = divmod(m, 60)
    return ("%d:%02d:%02d.%02d" % (h, m, s, mm))


def sort_comment(timestamp,res):
    comments = []
    con = sorted(res["comments"], key=lambda keys: keys['timepoint'])
    for i in range(timestamp-15, timestamp+15):
        com = []
        for j in con:
            if j['timepoint'] == i:
                com.append(j)
        comments.append(com)
    return comments


def down_qq_danmu(targetid, danmu_name):
    url = 'https://mfm.video.qq/danmu?target_id=' + targetid
    try:
        os.remove(danmu_name)
    except:
        pass
    with open(danmu_name, "a", encoding='utf-8') as file:
        file.write('''[Script Info]
    Title: bilibili ASS 弹幕在线转换
    Original Script: 根据 251884753.xml 的弹幕信息，由 https://github/tiansh/us-danmaku 生成
    ScriptType: v4.00+
    Collisions: Normal
    PlayResX: 560
    PlayResY: 420
    Timer: 10.0000
    
    [V4+ Styles]
    Format: Name, Fontname, Fontsize, PrimaryColour, SecondaryColour, OutlineColour, BackColour, Bold, Italic, Underline, StrikeOut, ScaleX, ScaleY, Spacing, Angle, BorderStyle, Outline, Shadow, Alignment, MarginL, MarginR, MarginV, Encoding
    Style: Fix,Microsoft YaHei UI,20,&H66FFFFFF,&H66FFFFFF,&H66000000,&H66000000,1,0,0,0,100,100,0,0,1,2,0,2,20,20,2,0
    Style: R2L,Microsoft YaHei UI,20,&H66FFFFFF,&H66FFFFFF,&H66000000,&H66000000,1,0,0,0,100,100,0,0,1,2,0,2,20,20,2,0
    
    [Events]
    Format: Layer, Start, End, Style, Name, MarginL, MarginR, MarginV, Effect, Text
    ''')
        n = 0
        for i in range(15,100000,30):
            try:
                data = {
                    "timestamp":i
                }
                #print(i)
                response = requests.get(url,headers=headers,params=data,verify=False)
                res = json.loads(response.content)     # 字符串转化为列表格式
                if res['count'] != 0: #判断弹幕数量，确实是否爬取结束
                    comments = sort_comment(i,res)
                    for content in comments:
                        try:
                            ram = random.randint(0, len(content) - 1)   # 随机数
                            content_choose = content[ram]['content']  # 爱奇艺弹幕中每秒有多条 随机从中选取一条弹幕作为展示
                            seconds = content[ram]['timepoint']
                            line = [20, 40, 60, 80]
                            style = '\move(%s,%s,%s,%s)' % (random.randint(560, 760), line[n], -random.randint(10, 100), line[n])
                            # file.write('Dialogue: 0,%(start)s,%(end)s,%(styleid)s,,20,20,2,,{%(styles)s}%(text)s\n' % {'start': seconds_to_time(float(seconds)+ random.random()), 'end': seconds_to_time(float(seconds)+ random.random() + 8), 'styles': styles[i], 'text': item.getElementsByTagName('content')[0].firstChild.data, 'styleid': 'Fix'})
                            file.write('Dialogue: 0,%(start)s,%(end)s,%(styleid)s,,20,20,2,,{%(styles)s}%(text)s\n' % {
                                'start': seconds_to_time(float(seconds) + random.random()),
                                'end': seconds_to_time(float(seconds) + random.random() + 8), 'styles': style,
                                'text': content_choose,
                                'styleid': 'Fix'})
                            n = n + 1
                            if n > 3:
                                n = 0
                        except:
                            pass
                else:
                    print('爬完了')
                    break
            except:
                pass


def qqvideo_bullet(file_path, cid, vid):
    targetid = get_targetid(cid, vid)
    danmu_name = os.path.dirname(file_path) + "/" + filename_find(file_path, 2) + ".Danish.ass"
    down_qq_danmu(targetid, danmu_name)
    return danmu_name


def get_vid_list(url):      #根据任意一集的url获取电视剧所有集的vid
    res = requests.get(url).text
    html_elem = etree.HTML(res)
    info = html_elem.xpath('//html/head/script[@r-notemplate="true"][@type="text/javascript"]/text()')[0]
    # print(info)
    vid_info = json.loads(get_str_btw(info, '"vip_ids":', ',"comment_show_type"'))
    vid_list = []
    for vid in vid_info:
        vid_list.append(vid['V'])
    return vid_list


if __name__ == "__main__":
    uri = "tenvideo2://?action=1&cover_id=ccd36tevohjt9ze&video_id=u0035tjlfmu&from=douban.doc_m"   # 豆瓣返回腾讯视频uri
    cid = get_str_btw(uri, 'cover_id=', '&')
    vid = get_str_btw(uri, 'video_id=', '&')
    file_path = r'I:\python练习\爱奇艺弹幕下载转换\[超体]Lucy.2014.BluRay.720p.x264.AC3-BtsHD.mkv'
    #qqvideo_bullet(file_path, cid, vid)
    url = "https://v.qq/x/cover/mzc00200js3mdvw/q00354i139r.html"
    vid_list = get_vid_list(url)

本文标签：腾讯弹幕视频 Python

版权声明：本文标题：python 爬取腾讯视频弹幕内容由热心网友自发贡献，该文观点仅代表作者本人，转载请联系作者并注明出处：https://m.elefans.com/xitong/1726539465a1074573.html，本站仅提供信息存储空间服务，不拥有所有权，不承担相关法律责任。如发现本站有涉嫌抄袭侵权/违法违规的内容，一经查实，本站将立刻删除。

更多相关文章

xp系统

腾讯企业邮箱又一次隐藏了qq邮件列表的入口

1天前

今天登陆腾讯企业邮箱，发现腾讯企业邮箱又一次隐藏了qq邮件列表的入口，很不方便操作， 我们切换到工具箱选项，然后随便点击里面的一个工具&#xff

limux 卡登录界面_腾讯企点客服界面及会话列表简介

1天前

（一）PC客户端界面简介企点的PC客户端仅企点工号可登录，管理员账号不可登录，请移步企点官网下载最新版本。 ①类似个人QQ，为本工

「Python爬虫系列讲解」十一、基于登录分析的 Selenium 微博爬虫

1天前

本专栏是以杨秀璋老师爬虫著作《Python网络数据爬取及分析「从入门到精通」》为主线、个人学习理解为主要内容，以学习笔记形式编写的。本专栏不光是自己的一个学习分享，也希望能给您普及一些关于爬虫的

360浏览器在b站看直播html5,用360浏览器看Bilibili视频很卡怎么办_360浏览器看B站视频卡如何解决-win7之家...

1天前

bilibili是中国大陆一个动画、游戏相关的弹幕视频分享网站，也被称为b站，不过最近有不少用户在使用360浏览器看bilibili视频的时候却很卡，看优酷爱奇艺视频都不卡

python 爬虫 selenium 无头浏览器设置

1天前

使用selenium 爬取数据，不弹出浏览器，后台运行，需要代码设置下无头参数配置 #浏览器在后台运行，不弹出页面from selenium.web

win10环境下，Python、PyCharm的下载安装及PyCharm其中如何import对应包-cvcuda等

23小时前

今天和大家分享在win10环境下，Python的下载及安装、PyCharm的下载安装及PyCharm其中如何import对应包-cvcuda等，如有问题请大佬指出，共同探讨

Chrome 浏览器倍速播放视频

22小时前

按 F12 打开开发者工具页面，转到 console（控制台）页面，输入 document.querySelector(‘video’).playbac

Python+Selenium程序执行完，chrome浏览器自动关闭解决方案

22小时前

一、Chrome浏览器自动关闭因为把driverwebdriver.Chrome()放在了函数内部，在函数执行完毕之后，程序内所有的步骤都结束了，关于这段程序的进程也

python操作无界面的chrome浏览器（转）

22小时前

python操作无界面的chrome浏览器 python 操作无界面chrome浏览器python操作无界面的chrome浏览器。主要利用selenium 和对应自己电脑上Chrome浏览器版本的webdriver。chrome版本的w

Python相关环境变量配置和模拟手机app登录

19小时前

【java环境变量配置】接着，打开系统->高级系统设置->环境变量。新建一个JAVA_HOME C:Program FilesJavajdk1.8.0_201（这里是你的安装

手机服务器连接视频文件夹吗,巧用手机自带功能向电脑传输视频华为小米苹果均适用...

19小时前

原标题：巧用手机自带功能向电脑传输视频华为小米苹果均适用手机拍摄的视频想要无损传输到电脑上，各个品牌手机的办法不一样，这里我主要就华为、小米、苹果三个主要品牌的手机主要说

苹果笔记本适合学python吗_MacBook Pro适合深度学习吗？

13小时前

在最前先说一个速度对比： 分别用笔记本cpu i5 3.1GHz和外接显卡GTX1070跑了一个很小的训练，gpu的速度是cpu的32倍。非常不科学的对比，参考一下就好。

python用amd还是intel_amd64; 64 bit; 但是on win 32? 那么该安装win32还是amd64的lxml包呢?...

12小时前

安装对应python版本的pywin32 将python安装目录下的Libsite-packages添加到PYTHONPATH环境变量将python安装目录下的Scripts目录添加到PATH环境变量将python安装目录Libsi

win10实现开机播放视频

10小时前

事先说明本文技术上没有什么发明，大多数是网上能找的到，更多是记录贴而不是技术创新。另外我不是windows方向而是android，当然这不是借口，只是如

Python：实现视频播放器（附完整源码）

8小时前

Python：实现视频播放器以下是一个使用OpenCV库的简单实现： import cv2def play_video(video_path):# 打开视频文件video = cv2.VideoCapture(video_pa

暴风云视频平台SDK使用介绍（一）-- 概述

8小时前

暴风影音推出了自己的云视频平台 ，提供了视频存贮，转码以及播放等服务，你可以借助这个平台创建自己的视频应用。我们将通过一系列文章对此进行介绍概述文件上传网页播放

android ipad 传视频播放器,三种将本地视频导入到iPad中的方法

8小时前

首先，前往苹果官网下载安装对应版本的 iTunes 客户端。打开 iTunes，用数据线连接手机和电脑。按照提示连接成功之后，依次点击「工具栏的文件>将文件添加到资

html音乐播放器怎么有黑边框,播放不能满屏有黑边怎么办,怎么剪切视频黑边,剪切黑边...

8小时前

我们用暴风影音播放或得放到手机播放时，视频周边总是有黑边，中间的画面显得好小甚至看不清楚，那怎么才能把这些没用的黑边去掉呢？狸窝全能视频转换器可以帮助你

Python实现模拟按键刷搜狗拼音输入法字数

5小时前

"""Python实现模拟按键刷搜狗拼音输入法字数"""import timeimport win32conimport win32api# 1.实现模拟按键VK_COD

Python生成Wifi二维码一键联网

1小时前

前言每次家里来了朋友， 总是要问Wifi密码，你有没有遇到这样的场景： 1、现在手机基本都保存了密码，平时不记，经常忘记 2、密

电子爱好者 - 最新技术资讯及电子产品介绍！

python 爬取腾讯视频弹幕

更多相关文章

腾讯企业邮箱又一次隐藏了qq邮件列表的入口

limux 卡登录界面_腾讯企点客服界面及会话列表简介

「Python爬虫系列讲解」十一、基于登录分析的 Selenium 微博爬虫

360浏览器在b站看直播html5,用360浏览器看Bilibili视频很卡怎么办_360浏览器看B站视频卡如何解决-win7之家...

python 爬虫 selenium 无头浏览器设置

win10环境下，Python、PyCharm的下载安装及PyCharm其中如何import对应包-cvcuda等

Chrome 浏览器倍速播放视频

Python+Selenium程序执行完，chrome浏览器自动关闭解决方案

python操作无界面的chrome浏览器（转）

Python相关环境变量配置和模拟手机app登录

手机服务器连接视频文件夹吗,巧用手机自带功能向电脑传输视频 华为小米苹果均适用...

苹果笔记本适合学python吗_MacBook Pro适合深度学习吗？

python用amd还是intel_amd64; 64 bit; 但是on win 32? 那么该安装win32还是amd64的lxml包呢?...

win10实现开机播放视频

Python：实现视频播放器（附完整源码）

暴风云视频平台SDK使用介绍（一）-- 概述

android ipad 传视频播放器,三种将本地视频导入到iPad中的方法

html音乐播放器怎么有黑边框,播放不能满屏有黑边怎么办,怎么剪切视频黑边,剪切黑边...

Python实现模拟按键刷搜狗拼音输入法字数

Python生成Wifi二维码 一键联网

发表评论

推荐文章

camtasia2024绿色免费安装包win+mac下载含2024最新激活密钥

揭开斐讯免费路由器通过京东热销的幕后真相

k3刷机 重置_斐讯K3刷机教程：一直重启、忘了密码怎么办？手机刷机包下载

五笔输入法：高效打字的利器

微计算机最常用的输入法,输入无极限 最常用五款拼音输入法横评

热门文章

win10、11共享打印机报错无法连接到打印机

Chrome浏览器占用太多内存，内存不够用怎么办

VMware安装虚拟机黑屏

NVIDIA_CUDA和AMD_AMD APP

linux自带五笔输入法,在Linux操作系统的环境下使用五笔输入法

模板文件下载后乱码或异常的可能原因及解决方案

win10下JDK环境变量配置与IDEA开发工具清晰简洁步骤，迈出Java学习第一步

C语言基础内容（一）——第01章_C语言入门

如何重启 Windows 10 子系统（WSL) ubuntu

在Windows10家庭版安装Docker遇到问题的解决方法

最新文章

win7 系统更新服务器失败怎么办,Windows7 Update更新失败报错80070002和80070003怎么办？...

WiFi和WLAN有什么区别和联系？

公共wifi不安全家里的wifi就安全了吗？

路由器wifi热点丢包率高_使用笔记本电脑和虚拟路由器创建自己的Wifi热点

无线路由器服务器拒接,wifi被拒绝接入解决方法(图文)

Windows7系统优化（批处理）

如何给自己各种帐号编一个安全又不会忘记的密码？

ESP8266 Node mcu WIFI无线控制入门_01无线远程控制LED

看自己的Wifi是否被盗用的技巧

【Android wifi】wifi基本原理

win7、win8旗舰版系统下载、32位、64位

【智能家居篇】wifi网络接入原理（中）——认证Authentication

Android Wifi连接控制、TCP、UDP通信，6.0以上适配

网络安全--解除认证攻击wifi(详细教程)

WIFI 一键配置原理-ESP8266

小米手机肿么还原时钟

15000流明是多少瓦

一般普通投影机功率多大?

苹果绿联转换器有些投影机不能用

坚果V9投影机具体参数?

有关九年级作文850字精选

80后90后_高一作文

中级卫生专业资格中医全科学主治医师中级模拟题2021年(9)案与解析

(精品)师范大学招考硕士研究生课程八六0试卷

ZXMVC8900(V3

【模拟人生4（The Sims 4）性感露背黑色亮片礼服MOD V20190313】模拟人生4（The Sims 4）性感露背黑色亮片礼服MOD V20190313 官方免费下载

【生化危机2：重制版（Resident Evil 2 Remake）克莱尔红头发深色服装MOD】生化危机2：重制版（Resident Evil 2 Remake）克莱尔红头发深色服装MOD 官方免费下载

【模拟人生4（The Sims 4）性感露背深V领吊带裙MOD V20190311】模拟人生4（The Sims 4）性感露背深V领吊带裙MOD V20190311 官方免费下载

【模拟人生4（The Sims 4）科幻风宇宙飞船家庭住宅MOD V20190311】模拟人生4（The Sims 4）科幻风宇宙飞船家庭住宅MOD V20190311 官方免费下载

【鬼泣5（Devil May Cry V）v1.0十四项修改】鬼泣5（Devil May Cry V）v1.0十四项修改 官方免费下载

如何实现高效的treenode搜索算法

treenode与链表有何本质区别

在哪些场景下应优先考虑使用treenode

treenode在树形结构中的角色是什么

如何通过treenode实现二叉树

手机服务器连接视频文件夹吗,巧用手机自带功能向电脑传输视频华为小米苹果均适用...

Python生成Wifi二维码一键联网

k3刷机重置_斐讯K3刷机教程：一直重启、忘了密码怎么办？手机刷机包下载

微计算机最常用的输入法,输入无极限最常用五款拼音输入法横评

【鬼泣5（Devil May Cry V）v1.0十四项修改】鬼泣5（Devil May Cry V）v1.0十四项修改官方免费下载