admin管理员组文章数量:1552164
工具准备:
1. chrome 浏览器(或者其他可以按F12打开源代码)
2. atom 编辑器(一款带正则匹配搜索的编辑器,github发布,无比顺手)
3. 了解基本的正则表达式
开始:
1. 案例是下载https://web.stanford.edu/~jurafsky/NLPCourseraSlides.html
内所有的ppt和pdf文件
2. 按F12 可以发现整个网页的框架,在源代码窗口内移动鼠标,网页页面会高亮显示对应的内容。
可以看到,table border 整一块对应了所有的下载链接的HTML代码
3. 右键该层HTML -> copy -> copy to outerHTML, atom打开后随便新建文档,黏贴到文档,可以看到一层层的html代码
4. atom下,按ctrl +F 搜索,搜索栏右边点击 ".*" 启动正则匹配
5. 此时打开迅雷, 在搜索栏写入
http.*?.pdf
解释:. 句号代表匹配任意的一个字符,*代表句号匹配的个数是任意多个,?代表非贪婪匹配,只要遇到.pdf就直接停止匹配
http.*?.pptx
匹配ppt, 其他内容也是相似的方式,因为下载链接都是文件后缀名结尾,如下载页面内全部视频 flv mp4 替换表达式的pdf即可
6.点击find all, ctrl + c ,接着开着的迅雷就会自动识别你的复制栏,然后下载全部内容
版权声明:本文标题:快速无需脚本直接用迅雷下载页面全部链接 内容由热心网友自发贡献,该文观点仅代表作者本人, 转载请联系作者并注明出处:https://m.elefans.com/dongtai/1727281513a1106427.html, 本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌抄袭侵权/违法违规的内容,一经查实,本站将立刻删除。
发表评论