admin管理员组

文章数量:1530518

现在磁力站很多,但是搜出来的东西乱七八糟的,广告也多,我看多了觉得挺烦的,正好周末无聊,想着自己做一个,下面附上本次利用Python爬虫磁力站点的教程。

下面是我写爬虫时候主要引用的库

当然,抓取的关键词可以自己从代码里设置,比如title,文件大小之类的。

但我怎么知道爬出来的哪些数据是没有用的呢?自己手动一个一个试显然不靠谱。

其实我并不需要知道哪些数据是没有用的,我只需要确定哪些数据是有用的就可以!!!

我的做法是:尝试和traceker通信,通信成功的链接才会保留下来帮我导出到excel,通信失败的,就直接剔除。

对了,这里跟大家解释一下Tracker是什么?

tracker服务器<

本文标签: 自己的爬虫磁力搜索引擎Python