迅雷API批量下载巨潮年报|电子爱好者

admin管理员组
文章数量:1552312

说明

首先从巨潮页面用八爪鱼爬取公告链接列表，但是该链接指向页面还有一个下载按钮且链接无法在详情页对下载直接元素提取，索性链接之间有关系可以直接修改。
下载路径分开保存的一种方法：如何使用python批量下载-用Python调用迅雷实现后台批量下载
还是要手动确认保存感觉有点不够方便
因为迅雷仍然碰到下载速度为0的问题所以用python补充下载，因为没有多线程所以会有点慢
(70条消息) python批量下载巨潮PDF年报_无敌的前任的博客-CSDN博客
迅雷和普通脚本都遇到反爬虫机制拒绝请求：
(73条消息) python批量下载年报（反爬虫应对版）_无敌的前任的博客-CSDN博客
关于网络环境影响导致pdf损坏的处理

年报筛选流程

1、通过简称：“文本包含”ST
2、通过标题：
（1）摘要、已取消
（2）英文版
（3）关于、公告、H股
3、通过代码升序、时间降序排序：
（1）先将以前年度的更新报告放到以前年度文件中（从最新一年开始处理）
（2）然后去重保留最新年报（一定要在上一小步之后）
（3）通过代码排除B股年报

代码

from win32com.client import Dispatch
#pip install win32compat
#pip install pywin32
import os
import re
import openpyxl
import time
def xunlei(url, downpath,filename):
    #运行之前记得在迅雷的设置中心勾选“一键下载”，不然会有弹框确认是否建立下载任务。
    #filename = url.split('/')[-1]
    thunder = Dispatch('ThunderAgent.Agent64.1')
    #thunder = Dispatch("ThunderAgent.Agent.1")
    thunder.AddTask(url, filename, downpath, "", "", -1, 0, 5)
    #thunder.AddTask(url)
    # AddTask("下载地址", "另存文件名", "保存目录","任务注释","引用地址","开始模式", "只从原始地址下载","从原始地址下载线程数")
    thunder.CommitTasks()
    time.sleep(0.05)
def code_revise(code_cell):
    code=(code_cell.value)
    code=str(code)
    #用value就是数值，text不能用
    for i in range(1,6-len(code)+1):
        code='0'+code
    return code
def url_revise(url):
    #普通命令str.replace(old, new[, max])
    #old --将被替换的子字符串。.new --新字符串,用于替换old子字符串。max --可选字符串,替换不超过max次
    #re.sub(pattern, repl, string, count=0, flags=0)
    #参数含义依次为旧字符正则匹配式、新子串、原文、次数默认全部替换
    #print("url1:" + url)
    old1=re.compile(r'disclosure/detail\?stockCode=\d+&announcementId')
    old2=re.compile(r'orgId=\w+\d+&announcementTime')
    new1='announcement/download?bulletinId'
    new2='announceTime'
    url=re.sub(old1,new1,url)
    url = re.sub(old2, new2, url)
    #print("url2:"+url)
    return url
input= r'E:\huang\Documents'
os.chdir(input)
downpath=r'E:\Alark\Users\Desktop\年报'
downlist='2015-2016年其他行业.xlsx'
wb = openpyxl.load_workbook(downlist)
ws = wb.active
#active_sheet = wb.active
for row in ws.rows:
    if row[0].value==None:
        #print("row[0]:",row[0].value)
        break
    else:
        pass
        #print(code_revise(row[0]),row[2].value)
    filename=code_revise(row[0])+'_'+row[2].value+'.pdf'
    url=url_revise(row[4].value)
    xunlei(url, downpath, filename)
wb.save("cache.xlsx")

本文标签：迅雷年报批量巨潮 API

版权声明：本文标题：迅雷API批量下载巨潮年报内容由热心网友自发贡献，该文观点仅代表作者本人，转载请联系作者并注明出处：https://m.elefans.com/xitong/1727282148a1106483.html，本站仅提供信息存储空间服务，不拥有所有权，不承担相关法律责任。如发现本站有涉嫌抄袭侵权/违法违规的内容，一经查实，本站将立刻删除。

更多相关文章

xp系统

电子爱好者 - 最新技术资讯及电子产品介绍！

迅雷API批量下载巨潮年报

目录

说明

年报筛选流程

代码

更多相关文章

福尔摩斯基本演绎法第一季全集Elementary迅雷下载

python下载迅雷资源助手_python：you-get下载B站、优酷网站的在线视频

迅雷API批量下载巨潮年报

iOS下载不了迅雷怎么办

JAVA代码实现迅雷功能（下载图片、音乐、视频、电影）

oracle11G官方迅雷下载地址合集

oracle官网数据库使用迅雷下载方法

迅雷 华为 手机 php,荣耀路由Pro怎么用手机远程下载迅雷任务

Sentinel下载哨兵数据（IDM或者迅雷下载）

极速下载新选择：IDM与迅雷11绿色版功能全解析

linux 迅雷 命令行,Linux小迅雷：uGet下载工具加速 | 薄荷开源网

迅雷下不了php文件怎么打开方式,如何解决迅雷打不开php文件的问题

不用 VIP 也能高速下载！迅雷 11 新版抢先体验 2T迅雷离线云盘

Chrome 中迅雷的插件(正确的下载地址)下载以及安装（一）

【Linux】一种类似迅雷的下载器安装

在树莓派上配置迅雷远程下载

Python爬虫-用迅雷下载电影

血族第四季全集The Strain迅雷下载

手把手带你一起写迅雷官网

IDM和迅雷哪个更好用?Internet Download Manager迅雷对比

发表评论

推荐文章

操作系统-陈渝

android studio安卓模拟器启动了但是看不到画面解决办法

eclipse 和idea 快捷键对照

canopy下载_Canopy Initiative强迫开源技术进行集成

U盘装WIN7出现 &quot;C：$Extend$Reparse 已损坏且无法读取&quot;的解决

热门文章

TortoiseSVN (Subversion客户端) 使用手册(中文) （四）

Redis学习笔记

android系统10.0模拟器,exagear模拟器安卓10.0

IntelliJ IDEA 快捷键

WARMING! ! ! BIOS Recovery mode has been detected. Please put the file “ASUS. CAp“ into HDD or a rem

⭐️一招关掉所有广告弹窗（包括360安全卫士弹出的全部广告窗口）

用百度网盘下载磁力连接报错无法解析解决办法

UOS系统设置共享文件夹（samba）

如何建立共享文件夹win10,win11，实现电脑与电脑间文件的传输

这3个BT下载工具，可替代迅雷，总有一个适合你

最新文章

电脑丢失dll文件一键修复之dll确实损坏影响电脑运行

小马激活报错：已停止工作

软件激活工具100

小马激活手动分配磁盘_不要成为“单把小马”手动测试仪

小马哥服务器系统激活,Vue项目接口.md

win10缺失dll文件怎么一键修复，快速解决电脑dll问题

认知复杂度（Cognitive Complexity）

小马激活工具激活系统导致系统崩溃

解决最新小马激活工具导致主页劫持问题

电脑系统或者office系列使用小马激活工具，电脑开机桌面出现假的Edge浏览器

电脑出现错误代码0x00000709一键修复的几种方法

Cognitive Terms Definition

小马激活工具拒绝访问cannot open file c:oemsf解决方法

小马激活软件报错 can not open file：COEMSF

小马激活工具出现Cannot open file k:OEMSF 的解决方法

小米手机肿么还原时钟

15000流明是多少瓦

一般普通投影机功率多大?

苹果绿联转换器有些投影机不能用

坚果V9投影机具体参数?

有关九年级作文850字精选

80后90后_高一作文

中级卫生专业资格中医全科学主治医师中级模拟题2021年(9)案与解析

(精品)师范大学招考硕士研究生课程八六0试卷

ZXMVC8900(V3

【模拟人生4（The Sims 4）性感露背黑色亮片礼服MOD V20190313】模拟人生4（The Sims 4）性感露背黑色亮片礼服MOD V20190313 官方免费下载

【生化危机2：重制版（Resident Evil 2 Remake）克莱尔红头发深色服装MOD】生化危机2：重制版（Resident Evil 2 Remake）克莱尔红头发深色服装MOD 官方免费下载

【模拟人生4（The Sims 4）性感露背深V领吊带裙MOD V20190311】模拟人生4（The Sims 4）性感露背深V领吊带裙MOD V20190311 官方免费下载

【模拟人生4（The Sims 4）科幻风宇宙飞船家庭住宅MOD V20190311】模拟人生4（The Sims 4）科幻风宇宙飞船家庭住宅MOD V20190311 官方免费下载

【鬼泣5（Devil May Cry V）v1.0十四项修改】鬼泣5（Devil May Cry V）v1.0十四项修改 官方免费下载

如何实现高效的treenode搜索算法

treenode与链表有何本质区别

在哪些场景下应优先考虑使用treenode

treenode在树形结构中的角色是什么

迅雷华为手机 php,荣耀路由Pro怎么用手机远程下载迅雷任务

linux 迅雷命令行,Linux小迅雷：uGet下载工具加速 | 薄荷开源网

U盘装WIN7出现 "C：$Extend$Reparse 已损坏且无法读取"的解决

【鬼泣5（Devil May Cry V）v1.0十四项修改】鬼泣5（Devil May Cry V）v1.0十四项修改官方免费下载