美女如何无水印下载？python带你批量采集（含完整源码）|电子爱好者

admin管理员组
文章数量:1532180

环境介绍：

python 3.8 解释器
pycharm 2021专业版 >>> 激活码编辑器
谷歌浏览器
谷歌驱动
selenium >>> 驱动 >>> 浏览器

模块使用：

采集一个

requests >>> pip install requests
re

采集多个

selenium >>> pip install selenium==3.141.0 (3.141.0)
指定模块版本去安装使用这个模块安装浏览器驱动
time

如果安装python第三方模块:

win + R 输入 cmd 点击确定, 输入安装命令 pip install 模块名 (pip install requests) 回车
在pycharm中点击Terminal(终端) 输入安装命令

如何配置pycharm里面的python解释器?

选择file(文件) >>> setting(设置) >>> Project(项目) >>> python interpreter(python解释器)
点击齿轮, 选择add
添加python安装路径

pycharm如何安装插件?

选择file(文件) >>> setting(设置) >>> Plugins(插件)
点击 Marketplace 输入想要安装的插件名字比如:翻译插件输入 translation / 汉化插件输入 Chinese
选择相应的插件点击 install(安装) 即可
安装成功之后是会弹出重启pycharm的选项点击确定, 重启即可生效

案例基本流程思路:

一. 分析数据来源

确定自己需求 , 我们采集内容是什么? 采集那个网站… 先采集一个, 然后再去采集多个
通过开发者工具进行抓包分析…

I. 开发者工具网页浏览器自带, F12 或者鼠标右键点击检查选择network

II. 刷新网页…让网页数据内容重新完整加载一遍 <找数据内容>

III. 通过network下面的media里面找到url地址

IV. 不够… >>> 分析这个url地址从哪里来的… 通过抓包分析, 得到url地址通过一次编码

二. 代码实现的步骤基本四大步骤…

发送请求, 对于刚刚分析得到url地址发送请求
获取数据, 获取服务器返回响应数据
解析数据, 提取我们想要url地址以及标题
保存数据, 把内容保存本地文件夹

代码

导入模块

import requests  # 导入数据请求模块 第三方模块 pip install requests
import re  # 导入正则表达式模块  内置模块

from selenium import webdriver
import time  # 时间模块

selenium
用selenium模块用驱动<浏览器>操作浏览器

人怎么去操作浏览器, 怎么去写代码

打开浏览器
webdriver.Chrome(executable_path=“chromedriver”) 括号里面是需要加驱动路径
如果你驱动放在和代码一个文件夹里面, 可以不用写路径
或者你的驱动放在python安装目录里面也可以不用写路径
其他位置, 都需要指定路径位置
输入网址
查看网页内容

requests请求数据,获取服务器返回数据内容 selenium你可以直接根据元素面板去定位数据内容

模拟浏览器对于url地址发送请求, 最后获取服务返回响应数据

发送请求:

确定url
模拟伪装
请求头headers 是可以直接在开发者工具里面复制粘贴 request headers 直接复制
字典数据类型, 构建完整键值对形式
user-agent 用户代理表示浏览器基本身份标识
请求方式
状态码 200 表示请求成功… 但是不一定得到你想要的数据…

没有得到你想要数据内容, 是什么原因导致的? <被反爬了> 为什么被反爬了因为你被识别出来你是爬虫程序
比如说: 超市面试试吃老是你来吃东西<一直你是Ip请求快速>, 不给你吃了 <IP被封>

里面网址被我删去了一部分好过审，会的小伙伴自己添加一下，不会的可左侧扫🐎领取哦~

driver = webdriver.Chrome()  # 实例化一个浏览器对象
driver.get('')
driver.implicitly_wait(10)


def drop_down():
    for x in range(1, 30, 4):
        time.sleep(1)
        j = x / 9
        js = '' % j
        driver.execute_script(js)

源码、解答、资料、教程可加Q裙：261823976免费领
list_1 = [1, 2, 3, 4, 5, 6, 7]
list_1[1:]
drop_down()
lis = driver.find_elements_by_css_selector(
    'div.mwbaK9mv > div:nth-child(2) > ul .ECMy_Zdt')  # 通过 css 选择器查找元素  获取多个li标签返回列表
# url_list = [li.find_element_by_css_selector('a').get_attribute('href') for li in lis]
for li in lis:
    try:
        time.sleep(1)
        url = li.find_element_by_css_selector('a').get_attribute('href')
        # url = ''  # 网址
        headers = {
            'cookie': '',
            'user-agent': 'Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/101.0.4951.54 Safari/537.36'
        }
        response = requests.get(url=url, headers=headers)
        # print(url)
        # <Response [200]> 响应对象 200 状态码 表示请求成功 response.text 获取响应对象文本数据
        # print(response.text)
        """
        数据解析, 提取我们想要数据内容
            re正则表达式 <在付费课程 2.5个小时的内容讲解完>
        re.findall() 调用re模块里面findall方法 去查询匹配数据
            找到所有 >>> 从什么地方去找什么样数据 (.*?) 表示你想要数据内容, 通配符, 可以匹配任意字符(除了换行符以外)
        """
        title = re.findall('<title data-react-helmet="true">(.*?)</title>', response.text, re.S)[0]
        title = re.sub(r'[/\:*?"<>|\n]', '', title)
        video_url = re.findall('src(.*?)%22%7D%2C%7B%22src', response.text)[0]  # 编码的内容获取
        video_url_1 = requests.utils.unquote(video_url).replace('":"', 'https:')  # 解码
        # 编码 requests.utils.quote
        # 就业工作 1 接单赚钱 2
        # print(title)
        # print(video_url)
        # print(video_url_1)
        video_content = requests.get(url=video_url_1, headers=headers).content  # 发送请求获取二进制数据内容
        解答、资料、教程可加Q裙：261823976免费领
        with open('img\\' + title + '.mp4', mode='wb') as f:
            f.write(video_content)  # 写入内容
            print('正在保存: ', title)
    except Exception as e:
        print(e)

尾语

成功没有快车道，幸福没有高速路。

所有的成功，都来自不倦地努力和奔跑，所有的幸福都来自平凡的奋斗和坚持

——励志语录

本文章就写完啦~感兴趣的小伙伴可以复制代码去试试

你们的支持是我最大的动力！！记得三连哦~ 💕 欢迎大家阅读往期的文章呀

本文标签：水印带你批量源码完整

版权声明：本文标题：美女如何无水印下载？python带你批量采集（含完整源码）内容由热心网友自发贡献，该文观点仅代表作者本人，转载请联系作者并注明出处：https://m.elefans.com/dongtai/1725442302a1023718.html，本站仅提供信息存储空间服务，不拥有所有权，不承担相关法律责任。如发现本站有涉嫌抄袭侵权/违法违规的内容，一经查实，本站将立刻删除。

更多相关文章

xp系统

python shutil复制中文文件decodeerror_python shutil模块批量操作文件(移动复制打包压缩解压)...

2天前

shutil -- --High-level file operations 高级的文件操作模块。 os模块提供了对目录或者文件的新建删除查看文件属性，还提供了对文件以及目录的路径操作。比如说&#xff1

软件导航页源码+可封装APP下载软件引流整站源码

2天前

正文: 完整标题: 源码介绍: APP软件应用下载导航网站源码APP分享下载页引流导航网站源码带后台版这款源码安装非常便捷干净，源码只有十几MB 只需要上传源码修改数据库连接信息即可使用。后台添加应用及轮播广

网赚APP资源下载类网站源码

2天前

PbootCMS内核开发的网站模板，该模板适用于网赚APP网站、APP官网等企业，当然其他行业也可以做，只需要把文字图片换成其他行业的即可； PCWAP

短视频app源码开发，音视频合成的实现

2天前

在短视频app源码开发中，音视频数据的处理是关键，尤其是音视频合成处理，只有有声音的短视频内容才更有吸引力，在短视频app源码中如何实现音视频的合成呢&

一套完整的APP版本更新代码

2天前

本文转载至IT985博客：点击打开链接在很多APP中版本更新是最基本的一个功能了，那么从检查版本更新到下载自动安装这一系列过程改如何实现呢，当然有很多方式&#xff

一个app服务端后台框架源码分享（源码已可以下载）

2天前

一个app服务端后台框架源码下载地址：http:download.csdndetailjialiuyang9536076 欢迎下载，修改。下载代码有问题可以联系q 49512002

Cesium AI GPT 文档源码 ChatGPT问答

1天前

我用Cesium104.0的源码 | 文档 | 3DTiles标准作为上下文语料定制了一个智能Cesium专家问答助手语料: 3D Tiles Specificationhttps:cesiumdownloadscesiu

2023年12月10日最新Python源码：使用ChatGPT(NLP)批量处理文件，自动提取关键信息并生成总结!

1天前

运行效果如下： 源码如下，可根据需求做进一步调整和改进： import osimport openai #pip install openai0.28.0impor

告别手动写作时代，ChatGPT带你体验智能论文写作，让论文写作再也不是难题

1天前

ChatGPT 介绍 ChatGPT 是一个基于人工智能的对话代理，它由 OpenAI 开发，基于 GPT（Generative Pretrained Transforme

支付宝网站支付在微信浏览器中跳转问题(亲测,附源码)

1天前

文章目录前言具体步骤配置沙箱回调地址，修改代码支付宝网关准备加密js以及跳转html源码下载地址前言奉上整理好的测试url: 点我调用支付宝之前的博客中提到了使用支付宝提供的sdk实现手机网站支付，今天整理一个简单版本的，原理很简

如何始终在Google Chrome浏览器中显示完整URL

1天前

Google Chrome hides the “https:” and “www.” in web addresses until you click twice in the address field. If you’d rath

全局热键给截图自动加水印并win10系统通知

18小时前

大家好，我是小小明。常写博客或公众号的号主们都非常清楚，一旦出名自己的文章就容易被一些培训机构胡乱搬运，这些无良培训机构实在太多，靠举报根本举报不过来，不如直接利用他们给自己做一波宣传。基本的思路就是给文章的每张图片都加上水印。给图

android 杀毒源代码,ExeBinder - 源码下载|其它|杀毒|源代码 - 源码中国

17小时前

软件简介： EXE捆绑机可以将两个可执行文件(EXE文件)捆绑成一个文件，运行捆绑后的文件等于同时运行了两个文件。它会自动更改图标，使捆绑后的文件与捆绑前的文件图标一样。产

一文带你了解网络安全简史

17小时前

网络安全简史 1. 上古时代1.1 计算机病毒的理论原型1.2 早期计算机病毒1.3 主要特点 2. 黑客时代2.1 计算机病毒的大流行2.2 知名计算机病毒2.3 主要特点 3. 黑产时代3.1 网络威胁持续升级3.2 代表性事件3.3

微信公众号文章批量下载成网页和PDF格式-真正完全免费工具

17小时前

很多公众号文章确实写的很棒很有价值，我们想保存到本地慢慢看的时候，就可以用到这个工具了。经过实测可用，完全免费，无限制。一、功能列表目前已实

C++基础入门：实现类似暴风影音的影音播放器！（源码展示）

16小时前

VC影音播放器源代码，基于DX技术实现，常规的WAVMP3AVIWMV等格式都能很好的支持。界面酷似早期的暴风影音播放器，那种经典风格的。项目如下&#xff1

(附源码）SSM网上商城的开发毕业设计-89386

15小时前

摘要随着Internet的使用越来越广泛，在传统的商业模式中，对于各类生活日常商品，人们习惯于到各种商家店铺购买。然而在快节奏的新时代中，人们不一

（附源码）ssm网上零食销售系统毕业设计 180826

15小时前

SSM网上零食销售系统的开发摘要随着Internet的使用越来越广泛，在传统的商业模式中，对于零食等商品，人们习惯于到各种商家店铺购买。然而在快节奏的新时代中&

Spring源码——bean的加载

4小时前

前言内容主要参考自《Spring源码深度解析》一书，算是读书笔记或是原书的补充。进入正文后可能会引来各种不适，毕竟阅读源码是件极其痛苦的事情。本文主要涉及书中第五章的部分，依照书中内容以及个人理解对Spring进行了注释，详见Git

chatgpt: 用纯c 对 esp32编程，串口输出hello world 完整代码

1小时前

以下是一个简单的在ESP32上使用纯C语言通过UART串口输出"Hello, World!"的完整代码示例。此示例假设您使用的是ESP-IDF开发框架 #include "freertosFreeRTOS.

电子爱好者 - 最新技术资讯及电子产品介绍！

美女如何无水印下载？python带你批量采集（含完整源码）

环境介绍：

模块使用：

采集一个

采集多个

如果安装python第三方模块:

如何配置pycharm里面的python解释器?

pycharm如何安装插件?

案例基本流程思路:

一. 分析数据来源

二. 代码实现的步骤 基本四大步骤…

代码

导入模块

尾语

更多相关文章

python shutil复制中文文件decodeerror_python shutil模块批量操作文件(移动 复制打包 压缩 解压)...

软件导航页源码+可封装APP下载软件引流整站源码

网赚APP资源下载类网站源码

短视频app源码开发，音视频合成的实现

一套完整的APP版本更新代码

一个app服务端后台框架源码分享（源码已可以下载）

Cesium AI GPT 文档 源码 ChatGPT问答

2023年12月10日最新Python源码：使用ChatGPT(NLP)批量处理文件，自动提取关键信息并生成总结!

告别手动写作时代，ChatGPT带你体验智能论文写作，让论文写作再也不是难题

支付宝网站支付在微信浏览器中跳转问题(亲测,附源码)

如何始终在Google Chrome浏览器中显示完整URL

全局热键给截图自动加水印并win10系统通知

android 杀毒 源代码,ExeBinder - 源码下载|其它|杀毒|源代码 - 源码中国

一文带你了解网络安全简史

微信公众号文章批量下载成网页和PDF格式-真正完全免费工具

C++基础入门：实现类似暴风影音的影音播放器！（源码展示）

(附源码）SSM网上商城的开发 毕业设计-89386

（附源码）ssm网上零食销售系统 毕业设计 180826

Spring源码——bean的加载

chatgpt: 用纯c 对 esp32编程， 串口输出hello world 完整代码

发表评论

推荐文章

Precision T7910 图形工作站win7和linux双系统安装

Chrome浏览器无法登录知乎、b站解决方案

小米路由器登陆以及切换wan账户脚本

电脑开机蓝屏代码C000021a

IDEA2020.3的详细安装教程

热门文章

如何彻底禁用Chrome浏览器的缓存功能

路由器登陆wlan网络连接服务器无响应,无线路由器服务器无响应

Android APK反编译就这么简单 详解（附图）

Android开发实战《手机安全卫士》——13.“缓存清理”模块实现

springboot网上购物平台的设计与实现-附源码141422

（附源码）ssm网上零食销售系统 毕业设计 180826

Windows系统删除大量文件导致系统卡顿解决方案

windows系统引导配置命令

【XP升级到Windows7必须注意的几个问题】

2023年关键字降本增“笑”，2024年的关键字会是什么呢？

最新文章

网吧XP无盘系统集成优化及母盘封装

制作系统启动光盘

锐起无盘精华100问！（包括3.1，3.0版本）

用GHOST备份ubuntu系统

新萝卜家园 GhostXP SP3 电脑城装机版 V2011.07

启动易(EASYBOOT)制作启动光盘

网吧母盘网上精华＋个人总结＝超详细

EeePC 901换装Windows XP的步骤

GHOST恢复盘.维护盘关键词

Ghost过程中出现GHOSTERR.TXT文件的解决方法

NTBACKUP恢复

Window系统装机步骤

Windows Server 2003广州虚拟主机网DVD版

新手入门启动光盘制作最详细的教程

番茄花园原班人马倾力打造的装机员系统

小米手机肿么还原时钟

15000流明是多少瓦

一般普通投影机功率多大?

苹果绿联转换器有些投影机不能用

坚果V9投影机具体参数?

有关九年级作文850字精选

80后90后_高一作文

中级卫生专业资格中医全科学主治医师中级模拟题2021年(9)案与解析

(精品)师范大学招考硕士研究生课程八六0试卷

ZXMVC8900(V3

二. 代码实现的步骤基本四大步骤…

python shutil复制中文文件decodeerror_python shutil模块批量操作文件(移动复制打包压缩解压)...

Cesium AI GPT 文档源码 ChatGPT问答

android 杀毒源代码,ExeBinder - 源码下载|其它|杀毒|源代码 - 源码中国

(附源码）SSM网上商城的开发毕业设计-89386

（附源码）ssm网上零食销售系统毕业设计 180826

chatgpt: 用纯c 对 esp32编程，串口输出hello world 完整代码

Android APK反编译就这么简单详解（附图）

（附源码）ssm网上零食销售系统毕业设计 180826

【鬼泣5（Devil May Cry V）v1.0十四项修改】鬼泣5（Devil May Cry V）v1.0十四项修改官方免费下载