Python爬取2345天气网|电子爱好者

admin管理员组
文章数量:1580180

一、基于Python面向对象实现

二、以下是全部完整代码

前言

天气预报大家都会关注，但是怎么获取天气预报的数据就是难点了，不可能一点一点的复制把，接下来就将告诉你们这样爬取某天气网站

首先，请求该2345网站地址，该网站没什么反爬机制，但是天气历史数据不在页面源代码里，属于动态数据，需要抓包得到数据，打开检查，点击网络，选中xhr，刷新页面就能抓到一下这个包，下图就是该包响应的数据。

1.导包

# coding=utf-8
import requests
import re
import csv

2.先创建一个天气预报(WeatherForecast)类，再创建一个类方法，定义我们的类属性，其中self.url是抓包得到的链接地址，self.headers是伪装成浏览器，self.data_list是定义的一个空列表

class WeatherForecast(object):
    def __init__(self):
        self.url = 'https://tianqi.2345/Pc/GetHistory?areaInfo%5BareaId%5D=59493&areaInfo%5BareaType%5D=2&date%5Byear%5D={0}&date%5Bmonth%5D={1}'
        self.headers = {
            'user-agent': 'Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/107.0.0.0 Safari/537.36 Edg/107.0.1418.24',
            'accept-encoding': 'gzip, deflate, br'
        }
        self.data_list=[]

3.定义get_content方法来发送请求获取数据，这里如果是请求text和content得到的响应均是二进制数据,所以我们请求json得到响应是文本内容

    def get_content(self,url):
        res = requests.get(url=url,headers=self.headers)
        content = res.json()
        # print(content['data'])
        return content['data']

4.定义parse_data方法,使用re解析来解析日期，最高气温，最低气温，天气，风力风向，空气质量这些字段，因为得到的是迭代器，所以需要遍历，然后将数据添加在之前定义的data_list这个空列表里面

    def parse_data(self,content):
        result = repile(r'<td>(?P<date>.*?)</td>.*?<td style="color:#ff5040;">(?P<max>.*?)</td>'
                            r'.*?<td style="color:#3097fd;" >(?P<min>.*?)</td>.*?<td>(?P<weather>.*?)</td>'
                            r'.*?<td>(?P<cloud>.*?)</td>.*?<td><span class="history-aqi wea-aqi.*?>(?P<sky>.*?)</span></td>',
                            re.S)
        find_result = result.finditer(content)
        for it in find_result:
            data_dict=it.groupdict()
            # print(data_dict)
            self.data_list.append(data_dict)
        return self.data_list

5.定义write_csv方法，将数据写入csv文件里，并将字段名写在第一行

    def write_csv(self,data_list):
        with open('./SenZheng.csv','w')as f:
            writer=csv.writer(f)
            writer.writerow(['日期','最高温度','最低温度','天气','风力风向','空气质量'])
            for i in data_list:
                writer.writerow(i.values())
                print(i.values())

6.定义运行方法，用年份和月份来实现翻页功能，并将之前定义的各个功能函数进行调用

    def run(self):
        for year in range(2019, 2022, 1):
            for month in range(1, 13, 1):
                url = self.url.format(year, month)
                print('正在爬取第{0}年{1}月的天气!'.format(year, month))
                content = self.get_content(url)
                data=self.parse_data(content)
                self.write_csv(data)
            print('全部爬取完毕!')

7.创建实例对象（weather）来调用WeatherForecast()类，并调用运行方法

if __name__ == '__main__':
    weather = WeatherForecast()
    weather.run()

二、以下是全部完整代码

# coding=utf-8
import requests
import re
import csv

class WeatherForecast(object):
    def __init__(self):
        self.url = 'https://tianqi.2345/Pc/GetHistory?areaInfo%5BareaId%5D=59493&areaInfo%5BareaType%5D=2&date%5Byear%5D={0}&date%5Bmonth%5D={1}'
        self.headers = {
            'user-agent': 'Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/107.0.0.0 Safari/537.36 Edg/107.0.1418.24',
            'accept-encoding': 'gzip, deflate, br'
        }
        self.data_list=[]

    def get_content(self,url):
        res = requests.get(url=url,headers=self.headers)
        content = res.json()
        # print(content['data'])
        return content['data']

    def parse_data(self,content):
        result = repile(r'<td>(?P<date>.*?)</td>.*?<td style="color:#ff5040;">(?P<max>.*?)</td>'
                            r'.*?<td style="color:#3097fd;" >(?P<min>.*?)</td>.*?<td>(?P<weather>.*?)</td>'
                            r'.*?<td>(?P<cloud>.*?)</td>.*?<td><span class="history-aqi wea-aqi.*?>(?P<sky>.*?)</span></td>',
                            re.S)
        find_result = result.finditer(content)
        for it in find_result:
            data_dict=it.groupdict()
            # print(data_dict)
            self.data_list.append(data_dict)
        return self.data_list

    def write_csv(self,data_list):
        with open('./SenZheng.csv','w')as f:
            writer=csv.writer(f)
            writer.writerow(['日期','最高温度','最低温度','天气','风力风向','空气质量'])
            for i in data_list:
                writer.writerow(i.values())
                print(i.values())

    def run(self):
        for year in range(2019, 2022, 1):
            for month in range(1, 13, 1):
                url = self.url.format(year, month)
                print('正在爬取第{0}年{1}月的天气!'.format(year, month))
                content = self.get_content(url)
                data=self.parse_data(content)
                self.write_csv(data)
            print('全部爬取完毕!')


if __name__ == '__main__':
    weather = WeatherForecast()
    weather.run()

本文标签：天气 Python

版权声明：本文标题：Python爬取2345天气网内容由热心网友自发贡献，该文观点仅代表作者本人，转载请联系作者并注明出处：https://m.elefans.com/dongtai/1727867042a1134556.html，本站仅提供信息存储空间服务，不拥有所有权，不承担相关法律责任。如发现本站有涉嫌抄袭侵权/违法违规的内容，一经查实，本站将立刻删除。

更多相关文章

xp系统

电子爱好者 - 最新技术资讯及电子产品介绍！

Python爬取2345天气网

一、基于Python面向对象实现

二、以下是全部完整代码

更多相关文章

python 爬虫 m3u8 视频文件 加密解密 整合mp4

python爬取app、返回的是加密数据_Python 逆向抓取 APP 数据

python各版本的下载以及安装注意事项

使用Python做QQ机器人

conda 更换python版本 更改虚拟环境路径

Pycharm安装另外版本的python

python安装sklearn，亲测有效！！！

python Windows电脑设置定时启动程序，定时运行代码

Python 2.7 Tutorial —— 流程控制

python手机版下载安装教程,python安卓手机版下载

python写的程序怎么打包手机app_Python Kivy（App开发） Windows安装打包步骤

手机怎么下载python并安装,如何在手机上下载python

windows下Python版app自动化测试环境配置更新版

Python如何将仅包含音频内容的Mp4，提取并转换为Mp3

用python写搜索引擎_用python做一个搜索引擎(Pylucene)的实例代码

python的搜题软件下载_直播答题？Python助你自动搜题之新手篇！

python用selenium模拟谷歌浏览器点页面

python宿舍管理系統毕业设计源码231642

Python语言

Python自动化操作浏览器，解放双手，这感觉真爽

发表评论

推荐文章

批处理bat，设置定时关机

Pixhawk飞行日志教程---使用日志诊断问题

信息搜集之搜索引擎

虚拟机体验NAS私人云全揭秘：深度揭秘虚拟机安装群晖DSM6.26.2.16.2.26.2.3系统

2024最新解决苹果ma电脑系统卡顿、反应慢问题的方法教程

热门文章

用bat写一个定时关机程序

计算机定时关机命令,定时关机命令,小编教你怎么使用命令行定时关机

YoloV5、ShuffleNetV2、YoloV5-Lite网络概述

Centos7 进入紧急模式Emergency Mode处理办法

推荐一款牛逼的搜索引擎，是Google的替代品吗？

自己找不到资源？不妨来试试这4个资源网站，各种资源一键到手！

关于谷歌浏览器被搜狗网址导航恶意劫持解决办法

【谷歌浏览器崩溃解决办法】

【嵌入式项目】基于嵌入式的智能家居控制板（完整工程资料源码）

Android Studio 模拟器卡慢、占内存解决方法，音视频开发前景

最新文章

Qt：在Windows 10安装CMake项目构建工具

Windows10系统上直接安装、使用Ubuntu系统（不是双系统，而是WSL，即Windows Subsystem for Linux）

windows10下将文件传送到Linux（CentOS）

windows10-企业版LTSC手动安装ubuntu-18.04

Windows 10安装Elasticsearch-7.0.0

MiniSMB安装手册Windows10桌面版

Windows10安装Redis

Windows10 1803版本以上禁止网站访问语言列表的方法

windows永久关闭更新

win10 wsl子系统访问windows文件系统

复制windows10下的文件到vmware中的ubuntu

关于windows 10 安装

Windows10+tensorflow-gpu 环境搭建

windows中为终端设置代理

windows10改变鼠标指针

小米手机肿么还原时钟

15000流明是多少瓦

一般普通投影机功率多大?

苹果绿联转换器有些投影机不能用

坚果V9投影机具体参数?

有关九年级作文850字精选

80后90后_高一作文

中级卫生专业资格中医全科学主治医师中级模拟题2021年(9)案与解析

(精品)师范大学招考硕士研究生课程八六0试卷

ZXMVC8900(V3

【模拟人生4（The Sims 4）性感露背黑色亮片礼服MOD V20190313】模拟人生4（The Sims 4）性感露背黑色亮片礼服MOD V20190313 官方免费下载

【生化危机2：重制版（Resident Evil 2 Remake）克莱尔红头发深色服装MOD】生化危机2：重制版（Resident Evil 2 Remake）克莱尔红头发深色服装MOD 官方免费下载

【模拟人生4（The Sims 4）性感露背深V领吊带裙MOD V20190311】模拟人生4（The Sims 4）性感露背深V领吊带裙MOD V20190311 官方免费下载

【模拟人生4（The Sims 4）科幻风宇宙飞船家庭住宅MOD V20190311】模拟人生4（The Sims 4）科幻风宇宙飞船家庭住宅MOD V20190311 官方免费下载

【鬼泣5（Devil May Cry V）v1.0十四项修改】鬼泣5（Devil May Cry V）v1.0十四项修改 官方免费下载

如何实现高效的treenode搜索算法

treenode与链表有何本质区别

在哪些场景下应优先考虑使用treenode

treenode在树形结构中的角色是什么

如何通过treenode实现二叉树

python 爬虫 m3u8 视频文件加密解密整合mp4

conda 更换python版本更改虚拟环境路径

【鬼泣5（Devil May Cry V）v1.0十四项修改】鬼泣5（Devil May Cry V）v1.0十四项修改官方免费下载