爬取QQ空间数据|电子爱好者

admin管理员组
文章数量:1539154

爬取QQ空间数据–Python爬虫入门

本人自习Python四个月，准本研究NLP，目前大三。我在学习爬虫时，发现大部分都是爬豆瓣的数据，可能是这种简单的例子适合初学者，但是我更喜欢爬取一些能切实体现问题的数据，QQ空间就是我能切身体会的数据源。

Selenium Web自动化测试工具
QQ空间自动登陆
模拟浏览器
动态网页数据爬取（本文暂不涉及，日后补充）

未能解决的问题： 1. 登录后内容直接爬取 2. 动态爬取 3. 多线程爬虫实现

准备工作

Python3.6
Selenium

具体过程

模拟登陆:

	driver.get('https://qzone.qq/')

    driver.switch_to.frame('login_frame')
    driver.find_element_by_id('switcher_plogin').click()

    driver.find_element_by_id('u').clear()
    driver.find_element_by_id('u').send_keys('XXXXXX')  #这里填写你的QQ号
    driver.find_element_by_id('p').clear()
    driver.find_element_by_id('p').send_keys('XXXXXX')  #这里填写你的QQ密码
    driver.find_element_by_id('login_button').click()

获取登陆后页面源码:

 response = driver.page_source

获取页面内所有说说动态（仅文字）:

	abtract_pattern = repile('<a target="_blank" href="http://user.qzone.qq/(.\d*)" data-clicklog="nick" class="f-name q_namecard " link="nameCard_(.\d*)">(.*?)</a>',re.S)  
    abtract = re.findall(abtract_pattern,str(response))     
   
    elements = driver.find_elements_by_class_name('f-info')

打印结果:

	i=0
    for a in abtract:
        print(a[2]+"  :  "+elements[i].text)
        i=i+1

效果:

注：如有不足，请斧正。

本文标签：数据空间 qq

版权声明：本文标题：爬取QQ空间数据内容由热心网友自发贡献，该文观点仅代表作者本人，转载请联系作者并注明出处：https://m.elefans.com/xitong/1726251497a1062528.html，本站仅提供信息存储空间服务，不拥有所有权，不承担相关法律责任。如发现本站有涉嫌抄袭侵权/违法违规的内容，一经查实，本站将立刻删除。

更多相关文章

xp系统

[写轮眼]QQ服务调校

1天前

QQ在后台运行的时候会占用非常高的内存，一般在100M以上，我见过最高的到了450M，如果你手机运行内存并不是很高，那么就把QQ并不常用的服务禁用吧&a

8 MM配置-主数据-定义行业部门和具体行业部门字段选择(OMS3-Define Industry Sectors&Industry-Sector-Specific Field Sele-T137)

1天前

业务背景：定义行业部门和具体行业部门字段选择事务码: OMS3 SPRO路径：后勤常规->物料主数据->字段选择>定义行业部门和具体行业部门字段选择第1步&#x

python 数据可视化工具--matplotlib

1天前

数据可视化工具--matplotlib 1. 条形图1.1 垂直条形图1.2 水平条形图1.3 堆叠条形图1.4 水平交错条形图 2.饼状图3. 直方图与核密度曲线4. 箱线图5. 折线图6. 散点图7. 气泡图说明:数据可视化中的数据集

类别不平衡数据的处理

1天前

1.不平衡学习的基本概念及处理方法分类：http:www.360doccontent1710230942392246_697348454.shtml 重点学习：分类中解决类别不平衡

人工智能机器学习模型构建数据集HIGGS Data Set数据集百度网盘下载地址

21小时前

HIGGS Data Set数据集官网： https:archive.ics.uci.edumldatasetsHIGGS 下载地址：链接：https:pa

电脑c盘哪些文件可以删除？剔除无用文件，这5类数据可清理

12小时前

你是否曾因为电脑C盘空间告急而头疼不已？打开资源管理器，C盘里的文件琳琅满目，却又不敢轻易下手删除，真是太愁人了！电脑c盘哪些文件

电脑：在各个盘里被到回收站删除的文件，占用的空间是盘还是回收站所在的C盘？

12小时前

问题： 电脑：在各个盘里被到回收站删除的文件，占用的空间是盘还是回收站所在的C盘？ 答案：答案：尽管文件被

怎么把python从c盘移到d盘_PyCharm占用过大C盘空间，system配置文件迁移

12小时前

Apple iPhone 11 (A2223) 128GB 黑色移动联通电信4G手机双卡双待 4999元包邮去购买 > 随着 PyCharm 的持续使用，对应 C:Users\.PyCharm<

C盘不够用-删除D盘空间贡献给C盘的简单方法

11小时前

刚开始分区的时候没有把握得好，C盘原本是有二十多G的，用着用着就只剩不到10G了，即使把东西都装在D盘，C盘的剩余空间也还是越来越小。ATTN&am

解决E盘分空间给C盘

11小时前

1. 桌面点击【此电脑】 -> 【管理】 2. 点击【磁盘管理】 -> 【新加卷(E:)】 -> 【压缩卷】 3. 选择压缩大小进行压缩后出现未分配的100G。因为我们压缩出来的空间，紧靠

微信开发者工具在C盘下User Data有啥用，能删掉吗？占用空间超大

11小时前

微信开发者工具安装到了D盘，新建的项目也是存到了D盘，为啥c盘下(C:Users****AppDataLocal微信开发者工具User Data)还有3.9G的占用&#xff0

如何删除C盘不必要的文件，释放空间？

11小时前

对于电脑小菜的超大号福利！！！！！！ 大多数人都会因为C盘的容量过小而愁恼过，我也是

不卸载重装，从C盘将Foxmail邮件存储迁移出，节省C盘空间

11小时前

不知道有没有小伙伴像我一样，当年装系统的时候，没想到Windows系统更新后会占用空间这么大，也没想到办公电脑能7年还不更新换代。总之就是最近总报C盘空间不足&#xf

yolo图像检测数据集格式转换：xml 与 txt格式相互转换

10小时前

格式介绍一图流介绍的比较详细，一般图像检测数据集格式为txt或者xml格式，在使用labelimg进行标注的时候，可以设置获得不同格式的数据集，以满足

catia批量转stp文件格式_catia教程一数据格式转换

10小时前

1. 与其它数据格式的转换可以将文档转换为以下格式： 1)将V5的*.CATPart文档保存为V4模型格式。 2)将V5的零件或装配文档保存为STEP AP203格式(.stp)。 3)将V5的*.CATPart文档保存为IGES格式(.

SpringBoot集成阿里easyexcel（四）Converter导入导出数据转换器

10小时前

SpringBoot集成阿里easyexcel（四）Converter导入导出数据转换器通过com.alibaba.excel.converters.Converter转换器实现Excel导入

2022年全网首发|大数据专家级技能模型与学习指南(胜天半子篇)

8小时前

整篇文章约2.5万字(不包含引用和连接内容)。回顾过去 2019-2020年 2021年本文的行文思路第一部分：学习路径概览编程语言(⭐️⭐️⭐️⭐️⭐️)Linux基础(⭐️⭐️⭐️⭐️⭐️)数据库入门(

我在B站读大学，大数据专业

8小时前

欢迎关注博客主页：微信搜：import_bigdata，大数据领域硬核原创作者_王知无(import_bigdata)_CSDN博客https:blog.csdnu01

突然估摸出了chrome数据的备份

5小时前

📚博客主页：knighthood2001 ✨公众号：认知up吧 （目前正在带领大家一起提升认知，感兴趣可以来围观一下&#

plsql 删除一直在执行_固态硬盘开启Trim后，删除数据究竟能不能恢复?

2小时前

固态硬盘其实是闪存存储硬盘系列的一个俗称(SSD)，近些年闪存存储发展迅速，一些企业级的固态硬盘容量能够达到10T以上容量，在速度和存储密度上的优势逐渐盖过传统的机械硬盘。

电子爱好者 - 最新技术资讯及电子产品介绍！

爬取QQ空间数据

爬取QQ空间数据–Python爬虫入门

未能解决的问题： 1. 登录后内容直接爬取 2. 动态爬取 3. 多线程爬虫实现

准备工作

具体过程

更多相关文章

[写轮眼]QQ服务调校

8 MM配置-主数据-定义行业部门和具体行业部门字段选择(OMS3-Define Industry Sectors&amp;Industry-Sector-Specific Field Sele-T137)

python 数据可视化工具--matplotlib

类别不平衡数据的处理

人工智能机器学习模型构建数据集HIGGS Data Set数据集百度网盘下载地址

电脑c盘哪些文件可以删除？剔除无用文件，这5类数据可清理

电脑：在各个盘里被到回收站删除的文件，占用的空间是盘还是回收站所在的C盘？

怎么把python从c盘移到d盘_PyCharm占用过大C盘空间，system配置文件迁移

C盘不够用-删除D盘空间贡献给C盘的简单方法

解决E盘分空间给C盘

微信开发者工具在C盘下User Data有啥用，能删掉吗？占用空间超大

如何删除C盘不必要的文件，释放空间？

不卸载重装，从C盘将Foxmail邮件存储迁移出，节省C盘空间

yolo图像检测数据集格式转换：xml 与 txt格式相互转换

catia批量转stp文件格式_catia教程一数据格式转换

SpringBoot集成阿里easyexcel（四）Converter导入导出数据转换器

2022年全网首发|大数据专家级技能模型与学习指南(胜天半子篇)

我在B站读大学，大数据专业

突然估摸出了chrome数据的备份

plsql 删除一直在执行_固态硬盘开启Trim后，删除数据究竟能不能恢复?

发表评论

推荐文章

qq发压缩文件服务器拒绝,QQ不能接收和发送RAR压缩文件是怎么回事？急求解决方法！...

软件AI加速器：免费提升AI性能

Will the eaco (EarthChain) become a sustainable universe and an international super sovereign curren

Microsoft Windows 环境中NLS_LANG的正确设置 (文档 ID 1577370.1)

如何扩充C盘容量（在不重装系统或删除其他盘内容的条件下）

热门文章

如何用手机访问电脑本地localhost网页, 以调试项目?

解决云服务器上go-cqhttp扫码登录QQ失败问题

网络安全的故事

python 数据可视化工具--matplotlib

SAP S4 HANA - Simple, Scalable, Sustainable and Smart!

用安卓手机免root制作启动U盘

chm转txt(chm转txt格式转换器安卓)

火狐兼容性问题

MSDN的下载和使用指南

linux centos 开机密码,centos开机就让我输root密码怎么办答

最新文章

问题解决：Linux 发行版 Ubuntu【忘记登陆用户名或密码】怎么办？（详细步骤+图文示意）

【ADB命令第三篇】手机密码（访问权限密码或者锁屏密码等）忘记怎么办？

开机提示有人正在使用计算机,查看电脑有没有被他人使用过的三种方法

麒麟桌面操作系统上使用单用户模式修改密码

计算机怎么删除手机密码,手机锁屏密码忘记，要怎么清除锁屏密码？

关于win10忘记用户密码，却无法找回，反复让我输入密码

Linux忘记root密码后，利用GRUB2进行重置root密码的俩种方法

GT-n8000平板开机密码忘记 解决办法

疑难杂症篇(六)--Linux(红帽6)操作系统登陆密码忘记的解决方案

uos系统忘记密码破解步骤

忘了linux 3.10密码,Linux_教您5步恢复Ubuntu系统的密码无需花几十分钟重装系统， 如果您的操作系统密码忘 - phpStudy...

银河麒麟系统v10修改密码（忘记密码版）

Hololens2 网页连接设备修改密码

mac如何取消root密码，macos的root密码

安全模式下密码忘记的解决方法

小米手机肿么还原时钟

15000流明是多少瓦

一般普通投影机功率多大?

苹果绿联转换器有些投影机不能用

坚果V9投影机具体参数?

有关九年级作文850字精选

80后90后_高一作文

中级卫生专业资格中医全科学主治医师中级模拟题2021年(9)案与解析

(精品)师范大学招考硕士研究生课程八六0试卷

ZXMVC8900(V3

【模拟人生4（The Sims 4）性感露背黑色亮片礼服MOD V20190313】模拟人生4（The Sims 4）性感露背黑色亮片礼服MOD V20190313 官方免费下载

【生化危机2：重制版（Resident Evil 2 Remake）克莱尔红头发深色服装MOD】生化危机2：重制版（Resident Evil 2 Remake）克莱尔红头发深色服装MOD 官方免费下载

【模拟人生4（The Sims 4）性感露背深V领吊带裙MOD V20190311】模拟人生4（The Sims 4）性感露背深V领吊带裙MOD V20190311 官方免费下载

【模拟人生4（The Sims 4）科幻风宇宙飞船家庭住宅MOD V20190311】模拟人生4（The Sims 4）科幻风宇宙飞船家庭住宅MOD V20190311 官方免费下载

【鬼泣5（Devil May Cry V）v1.0十四项修改】鬼泣5（Devil May Cry V）v1.0十四项修改 官方免费下载

如何实现高效的treenode搜索算法

treenode与链表有何本质区别

在哪些场景下应优先考虑使用treenode

treenode在树形结构中的角色是什么

8 MM配置-主数据-定义行业部门和具体行业部门字段选择(OMS3-Define Industry Sectors&Industry-Sector-Specific Field Sele-T137)

GT-n8000平板开机密码忘记解决办法

忘了linux 3.10密码,Linux_教您5步恢复Ubuntu系统的密码无需花几十分钟重装系统，　　如果您的操作系统密码忘 - phpStudy...

【鬼泣5（Devil May Cry V）v1.0十四项修改】鬼泣5（Devil May Cry V）v1.0十四项修改官方免费下载