Schedule + Pyecharts | 时间序列图(动态轮播图)|电子爱好者

admin管理员组
文章数量:1530519

文章目录

前言
1. 导入模块
- 1.1 schedule模块示例
- 1.2 其他定时周期
2. 爬取知乎热榜数据
3. 爬取微博热搜数据
4. 时间序列图（动态轮播图）
- 4.1 一个简单的例子(NBA球员数据)
- 4.2 微博热搜数据时序图
- - 4.2.1 基础时间序列图
  - 4.2.2 调整图布边距
  - 4.2.3 定制主题，增加图标，设置播放速度
- 4.3 知乎热榜数据时序图
推荐阅读

前言

大家好，我是 👉【Python当打之年】
本期利用schedule模块定时采集知乎热榜/微博热搜数据，用pandas进行数据处理，用pyecharts的Timeline进行热榜数据动态轮播展示（时间序列图），希望对小伙伴们有所帮助，如有疑问或者需要改进的地方也可以在评论区留言。

涉及到的内容：
schedule — 定时任务
read_html — 网页数据采集
Pandas — 数据处理
Pyecharts — 数据可视化

先看一下效果：

1. 导入模块

import time
import schedule
import json
import requests
import pandas as pd
from pyecharts import options as opts
from pyecharts.charts import Bar, Timeline, Grid
from pyecharts.globals import ThemeType

以上模块如果没有的话，直接pip安装即可。

1.1 schedule模块示例

演示时设置运行3次退出，使用过程中，大家根据需要设置即可，一般作服务端时不设置。

count = 0
def work():
    global count
    count += 1
    author = 'Python当打之年'
    time_mow = time.strftime("%Y-%m-%d %H:%M:%S", time.localtime())
    print(f'{time_mow} -- {author}')

每5秒执行一次：

schedule.every(5).seconds.do(work)
while True:
    if count > 2:
        schedule.clear()
        break
    schedule.run_pending()
    time.sleep(1)

每1分钟执行一次：

count = 0
schedule.every(1).minutes.do(work)
while True:
    if count > 2:
        schedule.clear()
        break
    schedule.run_pending()
    time.sleep(1)

1.2 其他定时周期

每1分钟执行一次任务:
schedule.every(1).minutes.do(work)
每小时执行一次任务:
schedule.every().hour.do(work)
每天在什么时间点执行一次任务:
schedule.every().day.at('10:30').do(work)
每10-20分钟(随机)执行一次任务:
schedule.every(10).to(20).minutes.do(work)
每周一执行一次任务:
schedule.every().monday.do(work)
每周一什么时间点执行一次任务:
schedule.every().monday.at('09:30').do(work)
每分钟在第45秒的时候执行任务:
schedule.every().minute.at(':45').do(work)

2. 爬取知乎热榜数据

# 网址
zhihu_url = 'https://api.zhihu/topstory/hot-list?limit=10&reverse_order=0'
# 伪装请求头
headers = {'User-Agent':'Mozilla/5.0 (Windows NT 10.0; WOW64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/78.0.3904.108 Safari/537.36 QIHU 360SE'}
# 是否加表头
zhihu_csv_header = True
# 计次
zhihu_count = 0

爬取数据：

def getzhihudata(url, headers):
    r = requests.get(url, headers=headers)
    r.raise_for_status()
    r.encoding = r.apparent_encoding
    datas = json.loads(r.text)['data']
    allinfo = []
    time_mow = time.strftime("%Y-%m-%d %H:%M", time.localtime())
    print(time_mow)
    for indx,item in enumerate(datas):
        title = item['target']['title']
        heat = item['detail_text'].split(' ')[0]
        answer_count = item['target']['answer_count']
        follower_count = item['target']['follower_count']
        href = item['target']['url']
        info = [time_mow, indx+1, title, heat, answer_count, follower_count, href]
        allinfo.append(info)
    # 仅首次加表头
    global zhihu_csv_header
    df = pd.DataFrame(allinfo,columns=['时间','排名','标题','热度(万)','回答数','关注数','链接'])
    print(df.head())
    df.to_csv('zhuhu_hot_datas.csv', mode='a+', index=False, header=zhihu_csv_header)
    zhihu_csv_header = False
    global zhihu_count
    zhihu_count += 1    
getzhihudata(zhihu_url, headers)

效果：

作为演示这里设置每1分钟执行一次爬取任务，爬取3次，大家在本地运行时可以设置5分钟或者10分钟采集一次，循环次数设置30次左右，这样数据量不至于过多或过少。

3. 爬取微博热搜数据

def getweibodata():
    url = 'https://s.weibo/top/summary'
    r = requests.get(url, timeout=10)
    r.encoding = r.apparent_encoding
    df = pd.read_html(r.text)[0]
    df = df.loc[1:,['序号', '关键词']]
    df = df[~df['序号'].isin(['•'])]
    time_mow = time.strftime("%Y-%m-%d %H:%M", time.localtime())
    print(time_mow)
    df['时间'] = [time_mow] * df.shape[0]
    df['排名'] = df['序号'].apply(int)
    df['标题'] = df['关键词'].str.split('  ', expand=True)[0]
    df['热度'] = df['关键词'].str.split('  ', expand=True)[1]
    df = df[['时间','排名','标题','热度']]
    print(df.head())
    # 仅首次加表头
    global weibo_csv_header
    df.to_csv('weibo_hot_datas.csv', mode='a+', index=False, header=weibo_csv_header)
    weibo_csv_header = False
getweibodata()

效果：

4. 时间序列图（动态轮播图）

4.1 一个简单的例子(NBA球员数据)

数据：

names = ['詹姆斯', '杜兰特', '库里', '欧文', '哈登']
allinfo = [[[492, 610, 533, 416, 565, 639, 709, 465, 472], [387, 551, 488, 511, 514, 646, 747, 454, 636], [1683, 2036, 2089, 1743, 1920, 1954, 2251, 1505, 1544]], [[533, 527, 640, 598, 178, 589, 513, 464, 497], [214, 231, 374, 445, 110, 361, 300, 366, 457], [2161, 1850, 2280, 2593, 686, 2029, 1555, 1792, 2027]], [[88, 314, 334, 341, 430, 353, 261, 369, 26], [138, 539, 666, 619, 527, 524, 310, 361, 33], [383, 1786, 1873, 1900, 2375, 1999, 1346, 1881, 104]], [[191, 216, 259, 237, 157, 230, 227, 335, 103], [275, 350, 433, 389, 250, 418, 306, 464, 128], [944, 1325, 1478, 1628, 1041, 1816, 1466, 1596, 548]], [[252, 379, 344, 459, 501, 659, 389, 518, 387], [229, 455, 446, 565, 612, 907, 630, 586, 450], [1044, 2023, 1851, 2217, 2376, 2356, 2191, 2818, 2096]]]

时序图：

y1 = []
y2 = []
y3 = []
for i in range(9):
    y_trb_sorce = []
    y_ast_sorce = []
    y_pts_sorce = []
    for j in range(5):
        y_trb_sorce.append(allinfo[j][0][i])
        y_ast_sorce.append(allinfo[j][1][i])
        y_pts_sorce.append(allinfo[j][2][i])
    y1.append(y_pts_sorce)
    y2.append(y_ast_sorce)
    y3.append(y_trb_sorce)

years = ['11-12赛季', '12-13赛季', '13-14赛季', '14-15赛季', '15-16赛季', '16-17赛季', '17-18赛季', '18-19赛季', '19-20赛季']
tl = Timeline()
for i in range(9):
    bar = (
        Bar()
            .add_xaxis(names)
            .add_yaxis('得分', y1[i])
            .add_yaxis('助攻', y2[i])
            .add_yaxis('篮板', y3[i])
            .set_global_opts(title_opts=opts.TitleOpts("{}三项数据".format(years[i])))
    )
    tl.add(bar, "{}".format(years[i]))
tl.render_notebook()

效果：

4.2 微博热搜数据时序图

读取数据：

weibo_data = pd.read_csv('weibo_hot_datas.csv')
weibo_data.head()

4.2.1 基础时间序列图

取排名前15的热点：

tl = Timeline()
count = 50
time_data_counts = int(weibo_data.shape[0]/count)
times = weibo_data['时间'].values.tolist()
for i in range(time_data_counts):
    bar = (
        Bar()
            .add_xaxis(list(weibo_data['标题'])[i*count:i*count+15][::-1])
            .add_yaxis('微博热搜', list(weibo_data['热度'])[i*count:i*count+15][::-1])
            .reversal_axis()
            .set_global_opts(title_opts=opts.TitleOpts('{}'.format(times[i*count])))
    )
    tl.add(bar, "{}".format(times[i*count]))
tl.render_notebook()

效果：

4.2.2 调整图布边距

# 将图形整体右移
grid = (
    Grid()
    .add(bar, grid_opts=opts.GridOpts(pos_left='30%', pos_right='10%'))
)
tl.add(bar, "{}".format(times[i*count]))
tl.add(grid, '')

这样就比较正常一些了，也可以显示微博热搜排名后15条的数据。

4.2.3 定制主题，增加图标，设置播放速度

4.3 知乎热榜数据时序图

本期主要是给小伙伴们提供一个制作时序图的思路，代码重复比较多，部分代码就没贴出来了，如果需要可以点击下面链接查看所有代码，也可以在线运行：

【Schedule + Pyecharts | 时间序列图(动态轮播图)】

以上就是本期为大家整理的全部内容了，赶快练习起来吧，原创不易，喜欢的朋友可以点赞、收藏也可以分享让更多人知道哦

电子爱好者 - 最新技术资讯及电子产品介绍！

Schedule + Pyecharts | 时间序列图(动态轮播图)

文章目录

前言

1. 导入模块

1.1 schedule模块示例

1.2 其他定时周期

2. 爬取知乎热榜数据

3. 爬取微博热搜数据

4. 时间序列图（动态轮播图）

4.1 一个简单的例子(NBA球员数据)

4.2 微博热搜数据时序图

4.2.1 基础时间序列图

4.2.2 调整图布边距

4.2.3 定制主题，增加图标，设置播放速度

4.3 知乎热榜数据时序图

推荐阅读

更多相关文章

vue-pdf预览pdf内容动态文字丢失问题（Warning: Error during font loading: The CMap “baseUrl“ parameter must be sp）

Win10查看电脑上次的开机时间

windows ping长包命令显示时间、记录日志

【时间之外】浏览器分屏使用技巧

开发者在国内如何白嫖AWS服务器一年时间，怎样通过SSH工具连接AWS？免费的服务器有什么样的限制？

HTTPS原理-使用-请求拦截-防止拦截-动态调试HTTP请求

antd timepicker时间选择器在IE浏览器左上角闪现问题修复方法

工具-win11系统，微软自带输入法输入“sj” 显示时间 【2022年01月11日 10:16:49】格式

Excel时间和时间戳转换公式

xp系统和服务器同步时间出错,xp电脑时间同步出错该怎么解决？电脑时间同步错误解决方法...

xp电脑系统时间同步服务器不可用,winxp系统不自动设置无法同步internet时间的解决方案...

学习-Java字符串之String类格式化字符串之日期时间格式化输出

正在准备配置请勿关闭计算机,正在准备配置windows请勿关闭计算机时间长了解决教程...

Adguard Home最低DNS处理时间配置

LangGPT：这个Prompt顶级思维框架（RAG、结构化）有时间一定要看看

前端日常调试:Chrome浏览器Network面板http请求时间分析

chrome浏览器的默认超时时间

暴力递归记忆化搜索动态规划

算法 64式 8、动态规划算法整理

Windows设置NTP同步时间服务器

发表评论

推荐文章

手机网速测试软件排行榜,手机测网速软件，几款测速软件推荐

微信内嵌浏览器打开手机浏览器下载APP（APK）的方法

【ChatGPT整活大赏】写论文后自动生成视频

重装笔记本系统，WiFi标志不亮，连接不了WIFI

mobilenet cpu 加速_One Booster(手机清理加速)app下载-One Booster手机版下载v1.5.7.0

热门文章

win10系统要求配置_旧电脑想升级2020新版Win10？微软公布最低系统要求，你看了没？...

python过去电脑网关不可用怎么办_住宅网关不可用

怎么看xp计算机mac地址,查找MAC地址的两种方法

ZKP8.2 FRI (Univariate) Polynomial Commitment

支持html5特性的浏览器,五大主流浏览器对CSS3和HTML5特性支持情况的详细清单

阿里云MFA绑定Chrome浏览器

运维Python大全

IntelliJ IDEA 2018安装与破解

windows10计算机策略,win10系统轻松玩转组策略的图文步骤

Windows 10无法设置静态IP的解决办法

最新文章

关于win10系统镜像下载安装问题

win11浏览器默认主页如何设置

Win11 Excel文件变成白板图标怎么解决？

减少win11核显占用的内存怎么操作

win2012 r2 php mysql,在Windows Server2012 R2上安装WordPress PHP和MYSQL

原版win7系统怎么安装,原版Win7系统的安装步骤

Win11显示麦克风未插上怎么办？Win11显示麦克风未插上的解决方法

Win11更改声音输出设备有什么方法？

Win11鼠标动不了如何恢复？Win11鼠标动不了恢复的方法

Win11磁盘清理在哪打开？

Windows7BT种子大全

Win11隐藏输入法状态栏方法

Win10一键修复所有dll缺失的方法

Win11怎么把桌面文件路径改到D盘

Win11图标变暗怎么办？Win11图标变暗的解决方法

小米手机肿么还原时钟

15000流明是多少瓦

一般普通投影机功率多大?

苹果绿联转换器有些投影机不能用

坚果V9投影机具体参数?

有关九年级作文850字精选

80后90后_高一作文

中级卫生专业资格中医全科学主治医师中级模拟题2021年(9)案与解析

工具-win11系统，微软自带输入法输入“sj” 显示时间【2022年01月11日 10:16:49】格式

【鬼泣5（Devil May Cry V）v1.0十四项修改】鬼泣5（Devil May Cry V）v1.0十四项修改官方免费下载