Python办公必备利器：提升效率，留出摸鱼宝贵时间！|电子爱好者

admin管理员组
文章数量:1541757

在日常python数据分析过程中，pandas作为python中强大的数据处理库，可以帮助我们快速的对数据进行预处理和数据现状分析，节约大量的时间。

今天就将最最常用的数据处理部分进行详细的案例代码总结如下:

1.数据写入：单一数据写入新EXCEL表格

2.数据写入：多数据写入EXCEL中，创建多个表格，同时写入不同的数据

3.数据查看：快速获取前10条数据进行数据查看

4.数据查看：快速查看不同行列数据

5.数据查看：查看最大值和最小值

6.数据处理：数据重复、删除、缺失处理

7.快速筛选：快速筛选数据以了解数据

8.数据提取：提取个人性别或者生日信息

9.数据统计：求和、平均、排序

10.数据分箱：对数据进行分箱统计

实例1：数据写入：单一数据写入新EXCEL表格

import pandas as pd`              `# 首先创建一个空的DataFrame，添加列的名称：姓名`              `df = pd.DataFrame(columns=['姓名'])`              `# 然后建立一个列表数据，列表里面是人的姓名信息`              `name_list = ['小李', '小张', '小五', '小六', '小七', '小八', '小九', '小十', '小高', '小马']`              `# 将列表名字添加到DataFrame中`              `df['姓名'] = name_list`              `# 最后保存为一个新的Excel文件，文件名称为：个人信息表.xlsx`              `df.to_excel('个人信息表.xlsx', index=False)

实例2：数据写入：多数据写入EXCEL中，创建多个表格，同时写入不同的数据

import pandas as pd`              `# 创建一个有数据的新DataFrame用于存入excel`              `data1 = pd.DataFrame({'A': [1, 5, 6], 'B': [4, 8, 9]})`              `data2 = pd.DataFrame({'C': ['a1', 'b1', 'c1'], 'D': ['a2', 'b2', 'c2']})`              `# 创建一个Excel写入对象`              `writer = pd.ExcelWriter('output_info.xlsx')`              `# 写入不同数据到不同工作表`              `data1.to_excel(writer, sheet_name='Sheet1', index=False)`              `data2.to_excel(writer, sheet_name='Sheet2', index=False)`              `# 保存文件`              `writer.save()

实例3：数据查看：快速获取前10条数据进行数据查看

import pandas as pd` `#先读取Excel文件``df = pd.read_excel('个人信息表.xlsx')``# 获取前10个人的数据``top_10_data = df.head(10)``print(top_10_data)

实例4：数据查看：快速查看不同行列数据

`import pandas as pd`              `# 创建一个有数据的新DataFrame用于存入excel`              `df = pd.DataFrame({'A': [1, 5, 6, 5, 6, 5, 6, 5, 6, 5, 6], 'B': [4, 8, 9, 8, 9, 8, 9, 8, 9, 8, 9]})              ``#显示所有列`              `pd.set_option('display.max_columns', None)`              `print(df)`              `#显示所有行`              `pd.set_option('display.max_rows', None)`              `print(df)`              `#设置value的显示长度为100，默认为50`              `pd.set_option('max_colwidth',100)              ``# 行索引前后都包，列索引前包后包`              `print(df.loc[0:5, ('A', 'B')])`              `# 行列索引前包后不包`              `print(df.iloc[0:5, 0:5])`

实例5：数据查看：查看最大值和最小值

import pandas as pd`              `data = pd.read_csv('data.csv')`              `mean_value = data['score'].mean()`              `max_value = data['score'].max()`              `min_value = data['score'].min()`              `print("平均值：", mean_value)`              `print("最大值：", max_value)`              `print("最小值：", min_value)

实例6：数据处理：数据重复、删除、缺失处理

`import pandas as pd`              `# 首先创建一个空的DataFrame`              `df = pd.DataFrame(columns=['sample'])`              `# 然后建立一个列表数据，列表里面是人的姓名信息`              `sample_list = ['1', ' ', '6', '7', '6', '13', '7', ' ',None, '25']`              `df['sample']=sample_list`              `# 查看重复的数据`              `print(df[df.duplicated()])`              `# 删除重复的数据`              `print(df.drop_duplicates())              ``# sum(col.isnull())表示当前列有多少缺失,col.size表示当前列总共有多少行数据`              `print(df.apply(lambda col: sum(col.isnull())/col.size))              ``# 填补缺失值`              `print(df['sample'].fillna('未知'))              ``# 默认的bool类型`              `print(df['sample'].isnull())`              `# 数值0、1型指示变量`              `print(df['sample'].isnull().apply(int))`

实例7：快速筛选：快速筛选数据以了解数据

`import pandas as pd`              `# 首先读取Excel文件`              `df = pd.read_excel('学生成绩表信息.xlsm')`              `# 筛选出数学和语文成绩同时大于等于70的学生`              `filter_data = df[(df['数学成绩'] >=70) & (df['语文成绩'] >=70)]`              `print(filter_data)`

实例8：数据提取：提取个人性别或者生日信息

`import pandas as pd              ``# 创建一个空的DataFrame`              `df = pd.DataFrame(columns=['性别', '姓名', '身份证号'])              ``# 编造5个人的信息并添加到DataFrame中`              `new_data = {'性别': ['男', '女', '男', '女', '男'],              ``             '姓名': ['张三', '李四', '王五', '赵六', '钱七'],               ``'身份证号': ['320125198605041234', '310226199505082445', '440102196705041534', '500233198402041244','610322200105301334']}`              `df = df.append(pd.DataFrame(new_data))              ``# 保存为Excel文件`              `df.to_excel('个人信息表.xlsx', index=False)              ``# 重新从Excel文件中读取数据`              `df = pd.read_excel('人员信息表.xlsx')              ``# 统计男女数量`              `gender_counts = df['性别'].value_counts()`              `male_count = gender_counts.get('男', 0)`              `female_count = gender_counts.get('女', 0)`              `print('男性人数：', male_count)`              `print('女性人数：', female_count)              ``# 通过身份证号计算出生日期`              `def get_birthday(id_number):              ``     iflen(str(id_number)) ==18:               ``         birthday =str(id_number)[6:14]               ``         year = birthday[0:4]               ``         month = birthday[4:6]               ``         day = birthday[6:8]               ``         return year +'年'+ month +'月'+ day +'日'               ``     else:               ``         return'非法身份证号'               ``df['出生日期'] = df['身份证号'].apply(get_birthday)              ``# 打印结果`              `print(df)`

实例9：数据统计：求和、平均、排序

`import pandas as pd`              `# 创建一个data数据`              `data = {              ``     '姓名': ['小三', '小四', '小五', '小六', '小七'],               ``     '语文成绩': [80, 95, 85, 88, 92],               ``     '数学成绩': [70, 85, 87, 78, 83],               ``'英语成绩': [75, 80, 82, 82, 88]`              `}`              `# 创建对应data的DataFrame`              `df = pd.DataFrame(data)`              `# 保存为Excel文件`              `df.to_excel('学生成绩汇总表.xlsx', index=False)`              `# 读取Excel文件`              `df = pd.read_excel('学生成绩汇总表.xlsx')`              `# 计算总分和平均分`              `df['总分'] = df['语文成绩'] + df['数学成绩'] + df['英语成绩']`              `df['平均分'] = df[['语文成绩', '数学成绩', '英语成绩']].mean(axis=1)`              `# 排名`              `df['排名'] = df['总分'].rank(ascending=False, method='min')`              `# 将计算结果保存到Excel文件`              `df.to_excel('学生成绩汇总表.xlsx', index=False)`              `# 重新读取Excel文件并打印结果`              `df = pd.read_excel('学生成绩汇总表.xlsx')`              `print(df)`

实例10：数据分箱：对数据进行分箱统计

import pandas as pd`              `# 首先创建一个空的DataFrame`              `df = pd.DataFrame(columns=['分箱'])`              `# 然后建立一个列表数据，列表里面是人的姓名信息`              `box_list = [1, 4, 6, 7, 10, 13, 19, 20, 25, 30, 45, 48, 55, 70, 80, 90]`              `df['分箱'] = box_list`              `# 等宽分箱：每个分箱的取值范围一致`              `print(pd.cut(df['分箱'], 4))`              `# 不等宽分箱：自定义分箱`              `print(pd.cut(df['分箱'], bins=4, labels=[1, 20, 60, 90]))              ``# 等深分箱：每个分箱样本数量一致（分2箱的分位数）`              `print(df['分箱'].quantile([0, 0.5, 1]))`              `# include_lowest=True表示包含边界的最小值`              `print(pd.cut(df['分箱'], bins=df['分箱'].quantile([0, 0.5, 1]), include_lowest=True))

–END–

关于Python学习指南

学好 Python 不论是就业还是做副业赚钱都不错，但要学会 Python 还是要有一个学习规划。最后给大家分享一份全套的 Python 学习资料，给那些想学习 Python 的小伙伴们一点帮助！

包括：Python激活码+安装包、Python web开发，Python爬虫，Python数据分析，人工智能、自动化办公等学习教程。带你从零基础系统性的学好Python！

👉Python所有方向的学习路线👈

Python所有方向路线就是把Python常用的技术点做整理，形成各个领域的知识点汇总，它的用处就在于，你可以按照上面的知识点去找对应的学习资源，保证自己学得较为全面。（全套教程文末领取）

👉Python学习视频600合集👈

观看零基础学习视频，看视频学习是最快捷也是最有效果的方式，跟着视频中老师的思路，从基础到深入，还是很容易入门的。

温馨提示：篇幅有限，已打包文件夹，获取方式在：文末

👉Python70个实战练手案例&源码👈

光学理论是没用的，要学会跟着一起敲，要动手实操，才能将自己的所学运用到实际当中去，这时候可以搞点实战案例来学习。

👉Python大厂面试资料👈

我们学习Python必然是为了找到高薪的工作，下面这些面试题是来自阿里、腾讯、字节等一线互联网大厂最新的面试资料，并且有阿里大佬给出了权威的解答，刷完这一套面试资料相信大家都能找到满意的工作。

👉Python副业兼职路线&方法👈

学好 Python 不论是就业还是做副业赚钱都不错，但要学会兼职接单还是要有一个学习规划。

👉 这份完整版的Python全套学习资料已经上传，朋友们如果需要可以扫描下方CSDN官方认证二维码或者点击链接免费领取【保证100%免费】

本文标签：利器宝贵效率时间摸鱼

版权声明：本文标题：Python办公必备利器：提升效率，留出摸鱼宝贵时间！内容由热心网友自发贡献，该文观点仅代表作者本人，转载请联系作者并注明出处：https://m.elefans.com/dongtai/1727068634a1095926.html，本站仅提供信息存储空间服务，不拥有所有权，不承担相关法律责任。如发现本站有涉嫌抄袭侵权/违法违规的内容，一经查实，本站将立刻删除。

更多相关文章

xp系统

半个月时间把MySQL重新巩固了一遍，梳理了一篇几万字 “超硬核” 文章！

5天前

MySQL 是最流行的关系型数据库管理系统，在 WEB 应用方面 MySQL 是最好的 RDBMS(Relational Database Management System：关系数据库管理系统)

【Shotcut】开源免费视频编辑软件 - 微信视频编辑利器

5天前

博文目录一、Shotcut是什么？有什么特点？二、Shotcut下载、安装2.1 官网下载2.2 Shotcut安装2.3 Shotcut启动三、编辑一个简单的微信视频号3.1 设置项目参数3

【自媒体创作利器】AI白日梦+ChatGPT 三分钟生成爆款短视频

4天前

引言随着人工智能（AI）技术的快速发展，AI在各个领域都展现出了强大的应用潜力。其中，自然语言处理技术的进步使得智能对话系统得以实现&#xf

Paper：txyz_ai(一款帮助科研人员阅读PDF论文ChatGPT利器)的简介、安装、使用方法之详细攻略

4天前

Paper：txyz_ai(一款帮助科研人员阅读PDF论文ChatGPT利器)的简介、安装、使用方法之详细攻略目录 txyz.ai的简介 txyz.ai的安装 1、Web端plug-in安装步骤图文教程第一步，打开 ChatGP

qq飞车手游服务器维护中,QQ飞车手游3月28日停机维护到几点_QQ飞车手游3.28停机维护时间_玩游戏网...

4天前

《QQ飞车》将在3月28日迎来自己新一轮的更新，也就是明天将出现暂时性的停机，那么《QQ飞车》手游3月28日停机维护到几点呢？下面就让玩游戏网的小编为大家提前预告一下&

ajax默认超时时间多久,请问chrome浏览器的默认超时时间是多久？

3天前

测试时间：20190226 MacOS 环境下，timeout在各浏览器默认值为(以下浏览器都为当前时间最新版本) chrome 72.x 为4min safari 12 为8min fire

怎样查看计算机历史的开机时间,win10系统怎么查看电脑的历史开关机时间｜win10系统如何查询电脑开机后运行多长时间...

3天前

win10系统怎么查看电脑的历史开关机时间｜win10系统如何查询电脑开机后运行多长时间？ win10系统怎么查看电脑的历史开关机时间为了避免自己的电脑被他人盗用，可以通过

又一款代替PanDownload的百度网盘不限速下载工具利器 – 雷鸟下载

3天前

百度网盘下载太慢一直是困扰着无数人的问题。尽管百度网盘官方推出了“不限速客户端”，但实际上还是有部分资源无法加速。如果你是重度用户，开通度盘会员当然是最好的选择。但如果只是很偶尔才下载那么一两

EasyPlayer RTSP播放器:一个适用于安防行业的工具利器（EasyPlayer Windows v2.0.17.0709）

3天前

EasyPlayer-RTSP-Win播放器最新版本下载：https:githubEasyDSSEasyPlayer-RTSP-Winreleases EasyPlayer项目Github地址&#x

解决时间机器无法识别硬盘问题

2天前

T7 SSD分区后做时光机器，但无法识别（如图），问题解决一、问题描述：当时没保存照片，图片来自网络。问题详情：硬盘没分区且是苹果可识别的格式（如，ExFAT）则可以识别并显示在列表里（如本文后面正常图片所示）；硬盘做了分区后，

安装冰点还原后无法更改系统时间怎么办

2天前

冰点还原是一款非常好用的系统保护软件，但是一些用户反馈安装了冰点之后系统时间无法修改了，提示没有权限，即便是取消保护再修改都不行，BIOS里改也没用，那么该如何解决呢？下面小编从官网找到了解决方法。经过多方查询，小编终于知道了可

电脑软件：推荐5款实用的效率软件

2天前

目录 1、图片管理神器-Image Tuner 2、系统维护神器-Dism++ 3、桌面效率神器-蜂窝桌面整理 4、键鼠模拟软件-按键精灵 5、书签管理神器-Toby for Chrome 今天小编大家推荐5款实用的效率神器，希望对大家能有

OpenCV 概述和应用领域：图像处理的万能利器

2天前

OpenCV 概述和应用领域导语一、 OpenCV 概述1.1 基本功能1.2 开源社区支持二、 OpenCV 的应用领域2.1 物体识别与跟踪2.2 图像分割与边缘检测2.3 图像特征提取与描述总结导语 OpenCV （ Open So

时间序列预测最大预测误差_预测误差的措施可以通过实验了解它们

2天前

时间序列预测最大预测误差入门(Getting Started) Measurement is the first step that leads to control and eventually improvement. 测量是导致控制

Excel表Ctrl+v和Ctrl shift+v有什么区别_这些专业级的Excel快捷键，是效率进阶的必学技能...

2天前

本期文章决定给大家总结一下，Excel专业人士经常使用的20个Excel快捷键。我当然不会讲CTRLC、CTRLV、CTRLZ等，它们是最基本的快捷键了，而本文介绍的将会助你

用聚宽量化炒股-5获取数据函数-5）获取当前时间股票数据函数get_current_data、查询股票所属行业get_industry

1天前

1.get_current_data(security_list=None) 默认为None，代表当前universe中的股票。该函数的返回值为一个dict对象。字典的key为股票代码，字典的value如下： high_limit:

vue3时间戳格式转换

1天前

项目中遇到后端返回值为秒的值,例如(102135464)秒,需要转化成yyyy-m-d格式,但是在vue3项目中不支持filters过滤器,需要使用到计算属性computed代替. 1.项目目录中,创建一个名为utils文件夹下面的fil

日期格式与朱利安时间戳的相互转换

1天前

朱利安时间戳转日期格式 import datetime# 朱利安时间戳15706datedatetime.datetime(1950, 1, 1)datetime.timedelta(15706)time_strdate

element-ui时间选择器的一些注意事项时间格式怎么转换

1天前

一、12小时制与24小时制最初的代码写的是yyyy-MM-dd hh:mm:ss ,后面发现选择器上面一旦选择超过12点的，又会从1开始算，也就是12小时制。查了很久都没有什么好办法可以

在机械硬盘和固态硬盘上分别打一个压缩包，时间相差几倍

23小时前

机械硬盘，它的原理类似于光盘，主要结构是一个高速旋转的盘片的和在盘片上来回读写数据的磁头。而固态硬盘则是以电子存储的方式来储存数据的，主要由主控芯片、闪存芯片、固件算法等组成

电子爱好者 - 最新技术资讯及电子产品介绍！

Python办公必备利器：提升效率，留出摸鱼宝贵时间！

关于Python学习指南

👉Python所有方向的学习路线👈

👉Python学习视频600合集👈

温馨提示：篇幅有限，已打包文件夹，获取方式在：文末

👉Python70个实战练手案例&源码👈

👉Python大厂面试资料👈

👉Python副业兼职路线&方法👈

更多相关文章

半个月时间把MySQL重新巩固了一遍，梳理了一篇几万字 “超硬核” 文章！

【Shotcut】开源免费视频编辑软件 - 微信视频编辑利器

【自媒体创作利器】AI白日梦+ChatGPT 三分钟生成爆款短视频

Paper：txyz_ai(一款帮助科研人员阅读PDF论文ChatGPT利器)的简介、安装、使用方法之详细攻略

qq飞车手游服务器维护中,QQ飞车手游3月28日停机维护到几点_QQ飞车手游3.28停机维护时间_玩游戏网...

ajax默认超时时间多久,请问chrome浏览器的默认超时时间是多久？

怎样查看计算机历史的开机时间,win10系统怎么查看电脑的历史开关机时间｜win10系统如何查询电脑开机后运行多长时间...

又一款代替PanDownload的百度网盘不限速下载工具利器 – 雷鸟下载

EasyPlayer RTSP播放器:一个适用于安防行业的工具利器（EasyPlayer Windows v2.0.17.0709）

解决时间机器无法识别硬盘问题

安装冰点还原后无法更改系统时间怎么办

电脑软件：推荐5款实用的效率软件

OpenCV 概述和应用领域：图像处理的万能利器

时间序列预测最大预测误差_预测误差的措施可以通过实验了解它们

Excel表Ctrl+v和Ctrl shift+v有什么区别_这些专业级的Excel快捷键，是效率进阶的必学技能...

用聚宽量化炒股-5获取数据函数-5）获取当前时间股票数据函数get_current_data、查询股票所属行业get_industry

vue3时间戳格式转换

日期格式与朱利安时间戳的相互转换

element-ui时间选择器的一些注意事项 时间格式怎么转换

在机械硬盘和固态硬盘上分别打一个压缩包，时间相差几倍

发表评论

推荐文章

计算机日志文件,电脑日志文件可以删除吗？

电脑蓝屏代码116是什么？Win7电脑出现蓝屏代码116(nvlddmkm.sys)的解决方法

解决VMware开机蓝屏问题

内网安全：各类密码的抓取

惠普1112打印机

热门文章

一键整理硬盘所有的照片和视频，手机照片的自动备份---多点相册

C盘瘦身技巧【修改虚拟内存的位置】【关闭休眠文件】

歌曲转换成mp3格式免费秘籍，安利6款音频转换软件（简单实用）

谷歌浏览器调用打印无预览且默认全屏，只打开一个应用

服务器s4系列固态,尘埃落定 揭晓四大顶级主控胜负_固态硬盘_固态硬盘评测-中关村在线...

Terrance Force安装Ubuntu经验总结——Ubuntu安装识别不了固态硬盘怎么办？

计算机加载固态硬盘,老电脑加装SSD实录：速度提升十分明显

【精品收藏】世界上最有智慧的人是怎样理性思考的？查理·芒格的100个思维模型...

小米10android11固件,小米10 Android 11 Beta 1线刷包已放出，附链接

linux-wifibt调试

最新文章

WIFI 认证 测试

手机待机功耗测试软件,移动端相关功耗测试杂谈

手机WIFI的上行下行速度不同

测试家里网速用什么软件,家中宽带网速多少？教你测试小妙招

使用iperf&amp;jperf测试Android设备的wifi速率方法

限制网速弱网测试

iPhone手机使用iSH终端运行iperf3命令测试内网Wi-Fi网速

测试网速_手机网速测试排名出炉，华为表现意外，中兴才是王者

android手机信号测试,买手机别只看性能!教你测试手机信号好坏

手机模拟弱网测试-fiddler使用！

红米k30pro网速测试软件,红米K30Pro和一加手机8Pro性能对比：依然有差距比想象的要大...

苹果网速4g测试软件,‎App Store 上的“测网速 - SpeedTest 网速测试大师”

300兆的网速测试软件,光纤是300兆的网速，用电脑测试只有100兆，光猫坏了？

手机电脑同连一个wf,手机网速比电脑网速快很多,电脑网速很慢

android nio wifi 拥堵 超时,提高WiFi上网速度，改变道路拥挤的方法

小米手机肿么还原时钟

15000流明是多少瓦

一般普通投影机功率多大?

苹果绿联转换器有些投影机不能用

坚果V9投影机具体参数?

有关九年级作文850字精选

80后90后_高一作文

中级卫生专业资格中医全科学主治医师中级模拟题2021年(9)案与解析

(精品)师范大学招考硕士研究生课程八六0试卷

ZXMVC8900(V3

【模拟人生4（The Sims 4）性感露背黑色亮片礼服MOD V20190313】模拟人生4（The Sims 4）性感露背黑色亮片礼服MOD V20190313 官方免费下载

【生化危机2：重制版（Resident Evil 2 Remake）克莱尔红头发深色服装MOD】生化危机2：重制版（Resident Evil 2 Remake）克莱尔红头发深色服装MOD 官方免费下载

【模拟人生4（The Sims 4）性感露背深V领吊带裙MOD V20190311】模拟人生4（The Sims 4）性感露背深V领吊带裙MOD V20190311 官方免费下载

【模拟人生4（The Sims 4）科幻风宇宙飞船家庭住宅MOD V20190311】模拟人生4（The Sims 4）科幻风宇宙飞船家庭住宅MOD V20190311 官方免费下载

【鬼泣5（Devil May Cry V）v1.0十四项修改】鬼泣5（Devil May Cry V）v1.0十四项修改 官方免费下载

如何实现高效的treenode搜索算法

element-ui时间选择器的一些注意事项时间格式怎么转换

服务器s4系列固态,尘埃落定揭晓四大顶级主控胜负_固态硬盘_固态硬盘评测-中关村在线...

WIFI 认证测试

使用iperf&jperf测试Android设备的wifi速率方法

android nio wifi 拥堵超时,提高WiFi上网速度，改变道路拥挤的方法

【鬼泣5（Devil May Cry V）v1.0十四项修改】鬼泣5（Devil May Cry V）v1.0十四项修改官方免费下载