python实用代码2：自动爬找下载电影|电子爱好者

admin管理员组
文章数量:1562617

【银行业正处于快速数字化转型中，怎么发展？往哪里走？最后能到哪里？确切的方向谁也说不完整，广征意见中的各类奇思怪想满天飞。总结起来有这么几类：一是提高工作效率类。如通过系统提高自动化处理比例，将日常工作中某些规律性业务交由系统自动处理，提高单位时间内工作效率，如报表自动统计、业务机器人等；二是提升客户体验感类。如通过系统处理常规业务弥补客服人员的有限性，减少客户等待时间，方便客户自主操作，例如ATM机、银企对账机、智能开卡机等取款、查询打印等易于理解、不会产生歧义类常规业务；三是大数据分析类。如根据退休人员购买理财产品等情况，提供更符合该类客户在安全、稳定收益方面需求的产品。

本人是银行窗口服务方面小小负责人，希望在数据化转型方面通过系统建设等方式，提高柜面服务质量、服务效率，更好的为服务对象提供更优质服务。各位如在办理银行业务方面，不管是线下还是线上如遇到什么问题，如您方便，随时可以在评论区吐槽或反应，不胜感激！

在实际工作中，技术人员与业务人员面对对象不一样，思维也相差挺大，为了体验技术人员可能的思路，我试着学学编程。作为只是尝试，所以仅仅是通过简单的编程解决工作上一些小问题，偏实用性，如excel报表汇总、数据查询等,为了提高兴趣，也收集并按自己想法更改了一些爬虫程序，如批量下载电影、图片、音乐等，后续将陆续发布，如有侵权请知会立删】

python实用代码2：自动爬找下载电影

学习python有一点很吸引人，就是爬虫技术，不知初学者们有无同感？能自动搜索到自己需要的各种数据！其中，自动下载电影更让人兴奋，试想：一打开程序运行后，同时有几千部电影等待下载，下载一晚上，硬盘满满当当的几千电影，多么壮观！收集整理代码如下，仅供交流学习。

#coding=utf-8
import requests
import bs4
import pandas as pd
import os
import pyperclip

def get_data(url):  #1、网络请求 
    #访问指定的 url 网页
    headers = {
        'accept': 'text/html,application/xhtml+xml,application/xml;q=0.9,image/webp,image/apng,*/*;q=0.8',
        'user-agent': 'Mozilla/5.0 (Windows NT 10.0; WOW64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/68.0.3440.106 Safari/537.36',
    }

    r = requests.get(url, headers=headers)
    r.raise_for_status()
    r.encoding = r.apparent_encoding
    return r.text

def parse_data(html):  #2. 网页解析
    #根据 url 获取到的网页内容
    bsobj = bs4.BeautifulSoup(html,'html.parser')
    info = []
    # 获取电影列表
    tbList = bsobj.find_all('table', attrs = {'class': 'tbspan'})
    # 对电影列表中的每一部电影单独处理
    for item in tbList:
        movie = []
        link = item.b.find_all('a')[1]
        #print(link)
        # 获取电影的名称
        name = link['title']
        # 获取详情页面的 url
        url = 'https://www.dy2018' + link["href"]
        # 将数据存放到电影信息列表里
        # 访问电影的详情页面，查找电影下载的磁力链接
        temp = bs4.BeautifulSoup(get_data(url),'html.parser')
        tbody = temp.find_all('tbody')
        # 下载链接有多个（也可能没有），这里将所有链接都放进来
        for i in tbody:
            download = i.a.text
            #if 语句的判断，如果下载链接中包含 magnet:?xt=urn:btih 字符串，则视为有效链接，下载下来，否则跳过。
            if 'magnet:' in download:
                movie.append(name)
                movie.append(url)
                movie.append(download)
                # 将此电影的信息加入到电影列表中
                info.append(movie)
                break
    return info

def save_data(data):  #3.数据存储
    #将 data 中的信息输出到文件中/或数据库中,保存的数据
    try:
        os.mkdir("D:/film") #创建文件用于存储爬取到的数据
    except:
        ""
    file_name = 'D:/film/影片.csv'
    data_frame = pd.DataFrame(data)
    data_frame.to_csv(file_name, mode='a', index=False, sep=',', header=False) 

def download(links):#下载电影
    imageData = pd.read_csv('D:/film/影片.csv',names=['name','link','download'])
    # 获取电影的下载链接，并用换行符分隔
    a_link = imageData['download']
    links = '\n'.join(a_link)
    # 复制到剪切板
    pyperclip.copy(links)
    # 打开迅雷
    thunder_path = r'C:\Program Files (x86)\ThunderNetwork\Thunder\Program\ThunderStart.exe'
    os.startfile(thunder_path)
    
def main():   #4. 爬虫
    #循环爬取多页数据
     """
    1、剧情片
 	2、喜剧片
 	3、动作片
 	4、爱情片
 	5、科幻片
 	6、动画片
 	7、悬疑片
 	8、惊悚片
 	9、恐怖片
 	10、纪录片
 	11、音乐歌舞题材电影
 	12、传记片
 	13、历史片
 	14、战争片
 	15、犯罪片
 	16、奇幻电影
 	17、冒险电影
 	18、灾难片
 	19、武侠片
 	20、古装片
     """
    StaNO=int(input("请输入下载起始影视种类： "))  #1-20
    EndNO=int(input("请输入下载结束影视种类： "))  #1-20
    #每类电影下载页数选择
    page_stanum=int(input("请输入下载起始页面：  ")) 
    page_endnum=int(input("请输入下载结束页面： "))
    for NOnum in range(StaNO,EndNO):
        for page in range(page_stanum,page_endnum):
            print('正在爬取：第' + str(NOnum)+'-'+str(page) + '页......')       
            # 根据之前分析的 URL 的组成结构，构造新的 url
            if page == 1:
                index = 'index'
            else:
                index = 'index_' + str(page)           
            url = 'https://www.dy2018/'+str(NOnum)+'/' + index +'.html'
            # 依次调用网络请求函数，网页解析函数，数据存储函数，爬取并保存该页数据
            html = get_data(url)
            movies = parse_data(html)
            links = save_data(movies)
            print('第' +str(NOnum)+'-'+ str(page) + '页完成！')
    download(links)

if __name__ == '__main__':  #5. 程序入口
    main()

本文标签：下载电影代码 Python

版权声明：本文标题：python实用代码2：自动爬找下载电影内容由热心网友自发贡献，该文观点仅代表作者本人，转载请联系作者并注明出处：https://m.elefans.com/xitong/1727487210a1117256.html，本站仅提供信息存储空间服务，不拥有所有权，不承担相关法律责任。如发现本站有涉嫌抄袭侵权/违法违规的内容，一经查实，本站将立刻删除。

更多相关文章

xp系统

电子爱好者 - 最新技术资讯及电子产品介绍！

python实用代码2：自动爬找下载电影

python实用代码2：自动爬找下载电影

更多相关文章

Python爬虫之scrapy框架360全网图片爬取

python写手机应用宝下载_APK 批量爬取脚本（应用宝和360市场）

三行代码解决手机深刷成功后仍无限重启

Python ESP32 WIFI连接

30行代码实现一个带UI界面的图片背景移除工具：并附带web网页

【Python语句】： For 循环的详细讲解! ! ! 附带源码

21 种代码的坏味道

Azure cognitive services speech example[python]

电脑出现错误代码0x0000011b怎么办，一键修复0x0000011b

Iphone手机、安卓手机浏览器控制默认缩放大小的方法总结（附代码）

手机浏览器隐藏地址栏的代码

python之selenium设置浏览器为手机模式（开发者模式）

RK3326 Android 8.1 修改默认输入法为讯飞输入法——两种方法，推荐第二种（纯代码）

python software foundation是什么-PythonSoftwareFoundation

conductor client 代码快速分析

【手把手反内卷】开创全新AI多模态任务一视听分割：代码实践、优化教程（二）

Win10中kernel添加c语言,今天传授win10蓝屏终止代码KERNEL的具体操作方式

python安装哪个版本好啊_windows10安装哪个版本的Python？

python 爬取电影天堂电影

教你如何用python来爬取电影天堂上面的电影

发表评论

推荐文章

MPB：遗传发育所白洋组-​高通量分离培养和鉴定植物根系细菌

程序员不可忽视的事——使用电脑注意事项

win8系统在安装msi文件时遇到2502和2503错误

怎样用计算机命令修复软件,WINDOWS系统损坏无需重装，利用命令一键轻松修复...

iPhone自带的Safari浏览器怎么设置为电脑网页版，四步教会你

热门文章

Win10怎么截屏录屏？Win10截图方法大全 超强大的工具！

为什么我的iPhone4s用pp助手一键越狱前三步都对，最后完成的时候进度条满了却没有成功的提示，直接退出了？...

windows10开启VT和Hyper-V无法安装模拟器的另一种x86 Android解决办法

浅谈屏蔽搜索引擎爬虫（蜘蛛）抓取索引收录网页的几种思路

电脑开机出现win11死机画面怎么办 win11开机一段时间后假死

ubuntu18.04能够连wifi，但无法上网

cleanmymac x断网激活免费码有必要买吗

剑眉大侠的提权笔记

IBM Promotes Era of Cognitive Computing

win10上使用Linux子系统（Ubuntu）现在的几个坑!

最新文章

win11缺少dll文件怎么办，电脑缺少dll文件一键修复方法分享

中标麒麟系统u盘安装_骨灰级菜鸟用U盘装中标麒麟v5.0

SCCM制作启动镜像和U盘引导装机记录

ubuntu下制作u盘镜像_Windows 10 官方下载镜像制作U盘系统启动盘

mount命令的用法，以及技巧光盘镜像文件、移动硬盘及U盘的方法

打开游戏缺少dll文件，分享5种解决dll丢失的方法

lunix remount u盘_【转】转载:U盘版便携式Linux制作, casper-rw 解析

Linux文件系统管理、挂载光盘、U盘、移动硬盘，以及手工分区硬盘

u盘美化

打造地表最强U盘。拯救学妹爆红的C盘

windows和linux访问光盘的区别,linux下挂载光盘镜像文件、移动硬盘、U盘、Windows和NFS网络共享分类...

制作支持UEFI引导的U盘在System x服务器上安装Windows Server 2008 R2操作系统

linux0.9.7.1 u盘启动,AIO Boot 0.9.9.1 | 制作带有多个系统的USB启动盘 | 自启动U盘下载...

Ventoy+WePE 装机教程

iOS项目添加文件

小米手机肿么还原时钟

15000流明是多少瓦

一般普通投影机功率多大?

苹果绿联转换器有些投影机不能用

坚果V9投影机具体参数?

有关九年级作文850字精选

80后90后_高一作文

中级卫生专业资格中医全科学主治医师中级模拟题2021年(9)案与解析

(精品)师范大学招考硕士研究生课程八六0试卷

ZXMVC8900(V3

【模拟人生4（The Sims 4）性感露背黑色亮片礼服MOD V20190313】模拟人生4（The Sims 4）性感露背黑色亮片礼服MOD V20190313 官方免费下载

【生化危机2：重制版（Resident Evil 2 Remake）克莱尔红头发深色服装MOD】生化危机2：重制版（Resident Evil 2 Remake）克莱尔红头发深色服装MOD 官方免费下载

【模拟人生4（The Sims 4）性感露背深V领吊带裙MOD V20190311】模拟人生4（The Sims 4）性感露背深V领吊带裙MOD V20190311 官方免费下载

【模拟人生4（The Sims 4）科幻风宇宙飞船家庭住宅MOD V20190311】模拟人生4（The Sims 4）科幻风宇宙飞船家庭住宅MOD V20190311 官方免费下载

【鬼泣5（Devil May Cry V）v1.0十四项修改】鬼泣5（Devil May Cry V）v1.0十四项修改 官方免费下载

如何实现高效的treenode搜索算法

treenode与链表有何本质区别

在哪些场景下应优先考虑使用treenode

treenode在树形结构中的角色是什么

如何通过treenode实现二叉树

MPB：遗传发育所白洋组-高通量分离培养和鉴定植物根系细菌

Win10怎么截屏录屏？Win10截图方法大全超强大的工具！

【鬼泣5（Devil May Cry V）v1.0十四项修改】鬼泣5（Devil May Cry V）v1.0十四项修改官方免费下载