python 爬取电影天堂电影|电子爱好者

admin管理员组
文章数量:1563235

主要介绍爬取电影天堂首页的电影列表，并将结果保存为csv文件.

1.首先导入需要的模块

import requests
from bs4 import BeautifulSoup
import csv

2.获取网页，并解析结果

def html_parser(url_start):
    #获取html
    try:
        headers={'User-Agent':'Mozilla/5.0 (Windows NT 6.1; WOW64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/55.0.2883.87 Safari/537.36'}    #模拟浏览器登入 
        r=requests.get(url_start,headers=headers,timeout=10)  #获取网页
    except:
        pass
        #print(r.status_code)
    else:
        html = r.content.decode('gb2312','ignore')  #解码gb2312，忽略其中有异常的编码，仅显示有效的编码

        #print(len(html))          

    #解析网页
    soup = BeautifulSoup(html,'lxml')                                
    for li in soup.select('.co_area2 li'):  #选择所有class=co_area2 下的所有的 li 节点
        for a in li.select('a'):            #选择 li 节点下的 a 节点 
            link=url_start+a['href']        #构造每个电影的网页链接     
            item={                          #将获取的结果存储为字典
                "name":a.string,
                "link":link
            }
            save_result(item)               #每次获取一个结果后，存储一次
            item.clear()                    #存储后清空字典，为下次存储做准备

因为电影天堂的网页的编码方式是"gb2312"，

<META http-equiv=Content-Type content="text/html; charset=gb2312">
<title>电影天堂_免费电影_迅雷电影下载</title>

需要在获取页面的时候，进行解码处理，如下

html = r.content.decode('gb2312','ignore')  #解码gb2312，忽略其中有异常的编码，仅显示有效的编码

3.存储结果

def save_result(item):                      #存储结果
    with open('dy.csv','a',newline='',encoding='utf-8') as csvfile:   #打开一个csv文件，用于存储
        fieldnames=['name','link']
        writer=csv.DictWriter(csvfile,fieldnames=fieldnames)
        writer.writerow(item)

4.主函数

def main():                                          #主程序
    with open('dy.csv','a',newline='') as csvfile:   #写入表头
        writer=csv.writer(csvfile)            
        writer.writerow(['name','link'])

    url_start="https://www.dy2018/"
    html_parser(url_start)

5.运行

if __name__ == '__main__':     #运行主程序
    main()

6.运行结果

欢迎关注，获取更多技能

本文标签：电影天堂 Python

版权声明：本文标题：python 爬取电影天堂电影内容由热心网友自发贡献，该文观点仅代表作者本人，转载请联系作者并注明出处：https://m.elefans.com/dongtai/1727487614a1117286.html，本站仅提供信息存储空间服务，不拥有所有权，不承担相关法律责任。如发现本站有涉嫌抄袭侵权/违法违规的内容，一经查实，本站将立刻删除。

更多相关文章

xp系统

路由器运行python脚本_在路由器中运行Python

19小时前

本文原文名:记在路由器中实现热点自动认证本文主要记录我在路由器中实现热点自动认证的过程，由于一些原因，本文不讨论程序。本文主要提及以下内容。 1.使用 U 盘扩展 OpenWrt 路由器的存储空间并安装 Python 2.解决 Pyth

Python爬虫-爬取手机应用市场中APP下载量

16小时前

一、首先是爬取360手机助手应用市场信息，用来爬取360应用市场，App软件信息，现阶段代码只能爬取下载量，如需爬取别的信息，请自行添加代码。使用方法： 1、在D盘根目录新建.tet文件，命名为App_name，并把App名称黏贴到文件内

python实现电脑自动开机_python自动循环定时开关机（非重启）测试

14小时前

做手机整机测试的，肯定有开关机的需求，关机，几分钟后再开机（一直循环操作测试，就是不能重启）&#xf

【Python】pyspider 一直卡在 result worker starting 的解决办法

13小时前

pyspider 启动所遇到的坑环境： python 3.7.4pip 21.2.41. 启动 async 关键字报错的问题参考链接：https:wwwblogsMayfly-nymphp10808088.html 原因：

制作一个简单的python病毒

13小时前

大家都知道电脑病毒，有的人会想着自己做一个病毒，那到底怎么做，用任何编程语言都可以做一个比较简单的病毒，那用python该怎么做？

Python游戏库pygame全方位使用指南，从零开始游戏开发！

9小时前

文章目录前言1.初始化化程序2.创建Surface对象3.事件监听4.游戏循环二.Pygame Display显示模块详解1.将Surface对象粘贴至主窗口上2.设置窗口主窗口3.填充主窗口背景，参数值RGB4.

Azure cognitive services speech example[python]

8小时前

参考链接： Text-to-speech API reference (REST) - Speech service - Azure Cognitive Services | Microsoft Learn

python批量打印mathcad_Print Conducto全能批量打印工具

5小时前

Print Conducto全能批量打印工具由西西给大家带来，这款软件也是一个打印软件，可以批量打印，非常的好用，不用自己一个个的去点了&#xf

win10怎样彻底删除python_WIN10安装python及numpy等第三方库以及卸载

4小时前

1. 安装python 安装python前，可以先安装一个IDE，同类的有ANACONDA、pyCharm、VS code，个人喜欢VS code。这个链接已经比较详细了&a

【Python 版本】之求稳不追新

4小时前

目录前言1 Python 2是被替代的版本2 Python 2的兼容到3.9截止3 推荐 Python 3稳定版4 注意集成开发工具对应的 Python 版本总结附录前言 Python 2.7已经于2020年元旦起不再更新，所以当然用

python安装哪个版本好啊_windows10安装哪个版本的Python？

4小时前

python2除了一些大公司历史遗留问题还在使用，目前中小创公司使用最多的是python3 大公司的一些新项目也开始用python3了目前来说，python3.5以上的版本都可以目前使用最多的是python3.7（建议你安装这个）

python 迅雷批量下载电影天堂电影

4小时前

代码 import requestsimport osimport reimport timefor n in range(1,10):a_urlhttp:www.dytt8htmlgndydyzzlist_23_s

电影《绿箭侠第一季》迅雷中英双字下载地址

3小时前

01 ftp:dygod2:dygod2d315.dydytt:9068绿箭侠第一季[电影天堂-www.dytt8]绿箭侠第一季01集[中英双字].rmvb 02 ftp:dygod2:dygod2d315.dydytt:9

电影资源 BT PT下载的电影命名规则资源详解

3小时前

初识一般来说，正规压制组压制的电影，都采用 0day 命名方式，即：英文名称、版本说明、年份、片源、分辨率、视频编码、音频格式、压制小组。例如文件

抖音电影视频剪辑——电影版权问题

3小时前

抖音电影视频剪辑——电影版权问题背景随着目前互联网微视频的火爆，有很多电影宣传视频采用了微视频的方式进行宣传，例如抖音、西瓜等平台均有专职的视频剪辑师进行剪辑并配音，这引

黑客类型电影推荐

3小时前

在多数人眼中，黑客通常是一群无聊至极没有什么趣味的人，在他们的世界里仿佛只有计算机和那敲不完的代码。但事实真的如此吗？让我们回味一下看《黑客帝国》、《幽灵》等黑客题材电影时的场景。有木有种热血澎湃，瞬间变成小迷妹的冲动？其实在现实生活中，他

爬虫实战爬取豆瓣电影Top250榜单电影

3小时前

爬虫实战爬取豆瓣电影Top250榜单电影实战内容：直接上代码，重要地方有注释。 from bs4 import BeautifulSoupimport reimport urllib.request,urllib.errorim

爬虫python下载电影_python爬虫--爬取某网站电影下载地址

3小时前

前言：因为自己还是python世界的一名小学生，还有很多路要走，所以本文以目的为向导，达到目的即可，对于那些我自己都没弄懂的原理&

豆瓣电影TOP250全套下载

3小时前

本期我们推出了影迷爱好者无人不知的豆瓣电影TOP250的下载，我们尽全力提供所有电影的bt，迅雷和百度云下载链接，如果有小部分资源失效，务必请您及时留言

python趣味编程-盒子追逐者游戏

6分钟前

在上一期我们用Python实现了一个奥赛罗游戏的游戏，这一期我们继续使用Python实现一个简单的盒子追逐追逐者游戏，让我们开始今天的旅程吧~ 在Python自由源代码中使用Turtle的盒子追逐者游戏在Python中使用Turtle的

电子爱好者 - 最新技术资讯及电子产品介绍！

python 爬取电影天堂电影

更多相关文章

路由器运行python脚本_在路由器中运行Python

Python爬虫-爬取手机应用市场中APP下载量

python实现电脑自动开机_python自动循环定时开关机（非重启）测试

【Python】pyspider 一直卡在 result worker starting 的解决办法

制作一个简单的python病毒

Python游戏库pygame全方位使用指南，从零开始游戏开发！

Azure cognitive services speech example[python]

python批量打印mathcad_Print Conducto全能批量打印工具

win10怎样彻底删除python_WIN10安装python及numpy等第三方库以及卸载

【Python 版本】之求稳不追新

python安装哪个版本好啊_windows10安装哪个版本的Python？

python 迅雷 批量下载电影天堂电影

电影《绿箭侠第一季》迅雷中英双字下载地址

电影资源 BT PT下载的电影命名 规则 资源 详解

抖音电影视频剪辑——电影版权问题

黑客类型电影推荐

爬虫实战爬取豆瓣电影Top250榜单电影

爬虫python下载电影_python爬虫--爬取某网站电影下载地址

豆瓣电影TOP250全套下载

python趣味编程-盒子追逐者游戏

发表评论

推荐文章

腾讯企业邮箱发信端口

win7驱动程序未经签名可以使用吗_win7必须要禁止驱动程序签名强制才能启动吗？...

超级玛丽超级马里奥

青龙全依赖环境一键安装脚本：QLDependency

win10 22H2怎么样？win10 22H2和21H1区别介绍

热门文章

python将手机模拟器截屏并发送至电脑上

什么软件可以测试鬼,PP助手新奇App推荐《鬼魂探测器》能抓鬼？

买电脑-不选宏基的N个原因

html元素不让蜘蛛抓取,屏蔽网站后台禁止搜索引擎蜘蛛抓取的方法

带你快速了解安卓应用上架各大应用市场

升级iOS 15后iPhone不断自动重启？尝试这些修复方法

Linux Ubuntu18.04能连wifi但是不能网问题

《Cognitive Mapping and Planning for Visual Navigation》读书笔记

css - 手机浏览器像素按照电脑浏览器像素规则显示

怎么下载php文件的电影,下电影下下来是.php格式，请问怎么打开？

最新文章

(教程)中兴机顶盒免拆机变身游戏机

2023 苹果小游戏无限撸红包 全程免看广告

当贝盒子刷EmuELEC游戏系统固件

移动盒子 【源代码】

cts游戏手机版_CTS6遨游中国2豪华版下载,CTS6遨游中国2手机版官网豪华版安装包 v1.4 - 游戏盒子下载站...

N1盒子内置双系统最新 V3.9.9.5 默认1920x1080分辨率版发布

android 盒子 红白机 模拟器,安卓FC模拟器

鲸享云小盒子业务x86刷机

Rust盒子APP下载及Rust腐蚀APP使用教程

游戏盒子接球

游戏盒子专用EMUELEC各种版本自选、联邦游电局（S905L3A镜像包）

游戏平台系统云游戏实现

PS3手柄连接斐讯T1盒子

游戏盒子接球最终版

cimoc 最新版_cimoc隐藏入口最新版本1.6.1下载,cimoc最新版本1.6.1 - 游戏盒子下载站...

小米手机肿么还原时钟

15000流明是多少瓦

一般普通投影机功率多大?

苹果绿联转换器有些投影机不能用

坚果V9投影机具体参数?

有关九年级作文850字精选

80后90后_高一作文

中级卫生专业资格中医全科学主治医师中级模拟题2021年(9)案与解析

(精品)师范大学招考硕士研究生课程八六0试卷

ZXMVC8900(V3

【模拟人生4（The Sims 4）性感露背黑色亮片礼服MOD V20190313】模拟人生4（The Sims 4）性感露背黑色亮片礼服MOD V20190313 官方免费下载

【生化危机2：重制版（Resident Evil 2 Remake）克莱尔红头发深色服装MOD】生化危机2：重制版（Resident Evil 2 Remake）克莱尔红头发深色服装MOD 官方免费下载

【模拟人生4（The Sims 4）性感露背深V领吊带裙MOD V20190311】模拟人生4（The Sims 4）性感露背深V领吊带裙MOD V20190311 官方免费下载

【模拟人生4（The Sims 4）科幻风宇宙飞船家庭住宅MOD V20190311】模拟人生4（The Sims 4）科幻风宇宙飞船家庭住宅MOD V20190311 官方免费下载

【鬼泣5（Devil May Cry V）v1.0十四项修改】鬼泣5（Devil May Cry V）v1.0十四项修改 官方免费下载

如何实现高效的treenode搜索算法

treenode与链表有何本质区别

在哪些场景下应优先考虑使用treenode

treenode在树形结构中的角色是什么

如何通过treenode实现二叉树

python 迅雷批量下载电影天堂电影

电影资源 BT PT下载的电影命名规则资源详解

2023 苹果小游戏无限撸红包全程免看广告

移动盒子【源代码】

android 盒子红白机模拟器,安卓FC模拟器

【鬼泣5（Devil May Cry V）v1.0十四项修改】鬼泣5（Devil May Cry V）v1.0十四项修改官方免费下载