python下载电影_Python3.x+迅雷x 自动下载高分电影的实现方法|电子爱好者

admin管理员组
文章数量:1562644

快要过年了，大家都在忙些什么呢？一到年底公司各种抢票，备年货，被这过年的气氛一烘，都归心似箭，哪还有心思上班啊。归心似箭=产出低下=一行代码十个错=无聊。于是想起了以前学过一段时间的Python，自己平时也挺爱看电影的，手动点进去看电影详情然后一部一部的去下载太烦了，何不用Python写个自动下载电影的工具呢？诶，这么一想就不无聊了。以前还没那么多XX会员的时候，想看看电影都是去XX天堂去找电影资源，大部分想看的电影还是有的，就它了，爬它！

话说以前玩Python的时候爬过挺多网站的，都是在公司干的(Python不属于公司的业务范围，纯属自己折腾着好玩)，我那个负责运维的同事天天跑过来说：你又在爬啥啊，你去看看新闻，某某爬东西又被抓了！出了事你自己负责啊！哎呀我的娘亲，吓的都没继续玩下去了。这个博客是爬取某天堂的资源(具体是哪个天堂下面的代码里会有的)，会不会被抓啊？单纯的作为技术讨论，个人练手，不做商业用途应该没事吧？写到这里小手不禁微微颤抖...

得嘞，死就死吧，我不入地狱谁入地狱，先看最终实现效果:

如上，这个下载工具是有界面的(牛皮吧)，只要输入一个根地址和电影评分，就可以自动爬电影了，要完成这个工具需要具备以下知识点：

PyCharm的安装和使用这个不多说，猿们都懂，不属于猿类的我也没办法科普了，就是个IDE

tkinter这是个Python GUI开发的库，图中这个简陋的可怜的界面就是基于TK开发的，不想要界面也可以去掉，丝毫不影响爬电影，加上用户界面可以显得屌一点，当然最主要的是我想学习一点新知识静态网页的分析技巧相对于动态网站的爬取，静态网站的爬取就显得小菜了，F12会按吧，右键查看网页源代码会吧，通过这些简单的操作就可以查看网页的排版布局规则，然后根据这些规则写爬虫，soeasy

数据持久化已经下载过的电影，下次再爬电影的时候不希望再下载一次吧，那就把下载过的链接存储起来，下载电影之前去比对是否下载过，以过滤重复下载

迅雷X的下载安装这个就更不用多说了，作为当代社会主义有为青年，谁没用过迅雷？谁的硬盘里没有几部动作类型的片子？

差不多就这些了，至于实现的技术细节的话，也不多，requests+BeautifulSoup的使用，re正则，Python数据类型，Python线程，dbm、pickle等数据持久化库的使用，等等，这个工具也就这么些知识范畴了。当然，Python是面向对象的，编程思想是所有语言通用的，这个不是一朝一夕的事，也没办法通过语言描述清楚。各位对号入座，以上哪个知识面不足的自己去翻资料学习，我可是直接贴代码的。

说到Python的学习还是多说两句吧，以前学习Python爬虫的时候看的是 @工匠若水 https://blog.csdn/yanbober的博客，这哥们的Python文章写的真不错，对于有过编程经验却从没接触过Python的人很有帮助，基本上很快就能上手一个小项目。得嘞，撸代码：

import url_manager

import html_parser

import html_download

import persist_util

from tkinter import *

from threading import Thread

import os

class SpiderMain(object):

def __init__(self):

self.mUrlManager = url_manager.UrlManager()

self.mHtmlParser = html_parser.HtmlParser()

self.mHtmlDownload = html_download.HtmlDownload()

self.mPersist = persist_util.PersistUtil()

# 加载历史下载链接

def load_history(self):

history_download_links = self.mPersist.load_history_links()

if history_download_links is not None and len(history_download_links) > 0:

for download_link in history_download_links:

self.mUrlManager.add_download_url(download_link)

d_log("加载历史下载链接: " + download_link)

# 保存历史下载链接

def save_history(self):

history_download_links = self.mUrlManager.get_download_url()

if history_download_links is not None and len(history_download_links) > 0:

self.mPersist.save_history_links(history_download_links)

def craw_movie_links(self, root_url, score=8):

count = 0;

self.mUrlManager.add_url(root_url)

while self.mUrlManager.has_continue():

try:

count = count + 1

url = self.mUrlManager.get_url()

d_log("craw %d : %s" % (count, url))

headers = {

'User-Agent': 'Mozilla/5.0 (Windows NT 6.1; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/62.0.3202.62 Safari/537.36',

'Referer': url

}

content = self.mHtmlDownload.down_html(url, retry_count=3, headers=headers)

if content is not None:

doc = content.decode('gb2312', 'ignore')

movie_urls, next_link = self.mHtmlParser.parser_movie_link(doc)

if movie_urls is not None and len(movie_urls) > 0:

for movie_url in movie_urls:

d_log('movie info url: ' + movie_url)

content = self.mHtmlDownload.down_html(movie_url, retry_count=3, headers=headers)

if content is not None:

doc = content.decode('gb2312', 'ignore')

movie_name, movie_score, movie_xunlei_links = self.mHtmlParser.parser_movie_info(doc, score=score)

if movie_xunlei_links is not None and len(movie_xunlei_links) > 0:

for xunlei_link in movie_xunlei_links:

# 判断该电影是否已经下载过了

is_download = self.mUrlManager.has_download(xunlei_link)

if is_download == False:

# 没下载过的电影添加到迅雷下载列表

d_log('开始下载 ' + movie_name + ', 链接地址: ' + xunlei_link)

self.mUrlManager.add_download_url(xunlei_link)

os.system(r'"D:\迅雷\Thunder\Program\Thunder.exe" {url}'.format(url=xunlei_link))

# 每下载一部电影都实时更新数据库，这样可以保证即使程序异常退出也不会重复下载该电影

self.save_history()

if next_link is not None:

d_log('next link: ' + next_link)

self.mUrlManager.add_url(next_link)

except Exception as e:

d_log('错误信息: ' + str(e))

def runner(rootLink=None, scoreLimit=None):

if rootLink is None:

return

spider = SpiderMain()

spider.load_history()

if scoreLimit is None:

spider.craw_movie_links(rootLink)

else:

spider.craw_movie_links(rootLink, score=float(scoreLimit))

spider.save_history()

# rootLink = 'https://www.dytt8/html/gndy/dyzz/index.html'

# rootLink = 'https://www.dytt8/html/gndy/dyzz/list_23_207.html'

def start(rootLink, scoreLimit):

loop_thread = Thread(target=runner, args=(rootLink, scoreLimit,), name='LOOP THREAD')

#loop_thread.setDaemon(True)

loop_thread.start()

#loop_thread.join() # 不能让主线程等待，否则GUI界面将卡死

btn_start.configure(state='disable')

# 刷新GUI界面，文字滚动效果

def d_log(log):

s = log + '\n'

txt.insert(END, s)

txt.see(END)

if __name__ == "__main__":

rootGUI = Tk()

rootGUI.title('XX电影自动下载工具')

# 设置窗体背景颜色

black_background = '#000000'

rootGUI.configure(background=black_background)

# 获取屏幕宽度和高度

screen_w, screen_h = rootGUI.maxsize()

# 居中显示窗体

window_x = (screen_w - 640) / 2

window_y = (screen_h - 480) / 2

window_xy = '640x480+%d+%d' % (window_x, window_y)

rootGUI.geometry(window_xy)

lable_link = Label(rootGUI, text='解析根地址: ',\

bg='black',\

fg='red', \

font=('宋体', 12), \

relief=FLAT)

lable_link.place(x=20, y=20)

lable_link_width = lable_link.winfo_reqwidth()

lable_link_height = lable_link.winfo_reqheight()

input_link = Entry(rootGUI)

input_link.place(x=20+lable_link_width, y=20, relwidth=0.5)

lable_score = Label(rootGUI, text='电影评分限制: ', \

bg='black', \

fg='red', \

font=('宋体', 12), \

relief=FLAT)

lable_score.place(x=20, y=20+lable_link_height+10)

input_score = Entry(rootGUI)

input_score.place(x=20+lable_link_width, y=20+lable_link_height+10, relwidth=0.3)

btn_start = Button(rootGUI, text='开始下载', command=lambda: start(input_link.get(), input_score.get()))

btn_start.place(relx=0.4, rely=0.2, relwidth=0.1, relheight=0.1)

txt = Text(rootGUI)

txt.place(rely=0.4, relwidth=1, relheight=0.5)

rootGUI.mainloop()

本文标签：迅雷高分下载电影方法电影

版权声明：本文标题：python下载电影_Python3.x+迅雷x 自动下载高分电影的实现方法内容由热心网友自发贡献，该文观点仅代表作者本人，转载请联系作者并注明出处：https://m.elefans.com/xitong/1727486245a1117187.html，本站仅提供信息存储空间服务，不拥有所有权，不承担相关法律责任。如发现本站有涉嫌抄袭侵权/违法违规的内容，一经查实，本站将立刻删除。

更多相关文章

xp系统

电子爱好者 - 最新技术资讯及电子产品介绍！

python下载电影_Python3.x+迅雷x 自动下载高分电影的实现方法

更多相关文章

HTML学生个人网站作业设计：电影网站设计——迅雷看看电影网页(1页) HTML+CSS+JavaScript 简单DIV布局个人介绍网页模板代码 DW学生个人网站制作成品下载

HTML+CSS+JS制作一个迅雷看看电影网页设计实例 ，排版整洁，内容丰富，主题鲜明，简单的网页制作期末作业

python迅雷下载任务出错_迅雷任务出错是怎么回事_迅雷下载一直提示任务出错解决方法－系统城...

linux 命令行 迅雷替代,linux下迅雷的替代

php 迅雷离线下载,linux 下使用迅雷离线下载

[Windows] 迅雷 无修改 无限制 无视封锁

Ubuntu安装迅雷，让下载变得轻松

利用树莓派，实现迅雷24小时远程下载

迅雷离线下载 linux,linux 下使用迅雷离线下载

[导入]高分动作大片《精英部队》【DVD中字-RMVB457.25MB】【迅雷】

【计算机网络 15】简单几行Java代码实现迅雷功能，java流式编程原理

用python爬取阳光电影的链接

曾经很火的迅雷，为什么现在不怎么火了？

在香港，无法使用迅雷下载怎么办？

迅雷看看网站设计分析

【Python成长之路】从零学爬虫--下载豆瓣8分以上的电影（附电影下载地址）

兰戈 迅雷

神盾局特工第一季全集Agents Of SHIELD迅雷下载

【Syslinux &amp; Grub &amp; Grub2】万能优盘启动盘 （WinPE、LinuxPE）-- 方法2 U盘ISO写入（推荐）

win11缺少dll文件怎么办，电脑缺少dll文件一键修复方法分享

发表评论

推荐文章

腾讯云windows server搭建valheim(英灵神殿)服务器

pp助手苹果版本_曾经iOS一代越狱神奇器，PP助手宣布凉凉

w ndows7错误恢复,windows7错误恢复进不去循环 从根本上解决问题

【Linux】进程概念（冯诺依曼体系结构、操作系统、进程）

无法定位程序输入点ucrtbase.terminate于动态链接库api-ms-win-crt-runtime-l1-1-0.dll上错误解决方法

热门文章

解决局域网内Windows无法ping通与无法远程桌面

C# 截屏

腾讯文档收集表图片一键重命名

使用腾讯企业邮箱调用SpringMail或者JavaMail发送邮件的发送服务器设置

android模拟器开启vt,逍遥安卓模拟器怎样打开VT模式 VT虚拟化设置办法

搜索引擎蜘蛛 ajax,了解搜索引擎蜘蛛习性 助力内页顺畅收录

ubuntu18.04能够连wifi，但无法上网

Android系统替换默认输入法

国际商法术语总结

win10 睡眠、休眠、电池管理

最新文章

用U盘安装系统完美教程

老电脑有救了！无TPM限制，打造解除最低硬件限制的Win11 ISO镜像

windows下使用GRUB2 制作支持BIOS和UEFI的WINPE、LINUX、MAXDOS多引导U盘

u盘g4l备份linux,用U盘启动G4L备份还原linux系统.doc

普华龙芯服务器系统U盘安装方法

U盘光盘制作win10+Ubutun16.04

linux怎么还原bak文件,Linux下面如何备份恢复系统? 有G4L，变得如此简单

linux挂移动硬盘命令,linux挂载命令mount及U盘、移动硬盘的挂载

Ventoy+WePE 装机教程(装PVE+ESXI等，不用单独费一个U盘）

linux里面rpm是什么文件,linux怎么解压rpm文件

Linux驱动入门(三)——源码下载阅读、分析和嵌入式文件系统介绍

linux 挂载硬盘_Linux系列教程（十八）——Linux文件系统管理之文件系统常用命令...

linux统计目录下的文件字节数,Linux下统计当前文件夹下的文件个数、目录个数...

qemu宿主机（debain 10）与虚拟机（Windows xp）传递文件的方法

linux dvd写入u盘工具,Windows 7 USBDVD Download Tool(用于制作Windows 7启动U盘)

小米手机肿么还原时钟

15000流明是多少瓦

一般普通投影机功率多大?

苹果绿联转换器有些投影机不能用

坚果V9投影机具体参数?

有关九年级作文850字精选

80后90后_高一作文

中级卫生专业资格中医全科学主治医师中级模拟题2021年(9)案与解析

(精品)师范大学招考硕士研究生课程八六0试卷

ZXMVC8900(V3

【模拟人生4（The Sims 4）性感露背黑色亮片礼服MOD V20190313】模拟人生4（The Sims 4）性感露背黑色亮片礼服MOD V20190313 官方免费下载

【生化危机2：重制版（Resident Evil 2 Remake）克莱尔红头发深色服装MOD】生化危机2：重制版（Resident Evil 2 Remake）克莱尔红头发深色服装MOD 官方免费下载

【模拟人生4（The Sims 4）性感露背深V领吊带裙MOD V20190311】模拟人生4（The Sims 4）性感露背深V领吊带裙MOD V20190311 官方免费下载

【模拟人生4（The Sims 4）科幻风宇宙飞船家庭住宅MOD V20190311】模拟人生4（The Sims 4）科幻风宇宙飞船家庭住宅MOD V20190311 官方免费下载

【鬼泣5（Devil May Cry V）v1.0十四项修改】鬼泣5（Devil May Cry V）v1.0十四项修改 官方免费下载

如何实现高效的treenode搜索算法

treenode与链表有何本质区别

在哪些场景下应优先考虑使用treenode

treenode在树形结构中的角色是什么

如何通过treenode实现二叉树

HTML+CSS+JS制作一个迅雷看看电影网页设计实例，排版整洁，内容丰富，主题鲜明，简单的网页制作期末作业

linux 命令行迅雷替代,linux下迅雷的替代

[Windows] 迅雷无修改无限制无视封锁

兰戈迅雷

【Syslinux & Grub & Grub2】万能优盘启动盘（WinPE、LinuxPE）-- 方法2 U盘ISO写入（推荐）

w ndows7错误恢复,windows7错误恢复进不去循环从根本上解决问题

搜索引擎蜘蛛 ajax,了解搜索引擎蜘蛛习性助力内页顺畅收录

【鬼泣5（Devil May Cry V）v1.0十四项修改】鬼泣5（Devil May Cry V）v1.0十四项修改官方免费下载