admin管理员组

文章数量:1530842

问题描述:

       我有一位同学在写毕业论文的时候,遇到一个问题,获取的研究数据(.csv)文件里面包含的数据量特别大,高达上百万行,wps或者office根本无法打开或者完全显示这些数据,因此需要有个高效的办法,根据数据的年份去拆分成多份数据。


高效应对:

  可以利用Python提取数据,那么问题来了,python不精通呀!但是,我有chatgpt嘿嘿嘿。直接和chatgpt提需求,需求描述地越详细chatgpt产出的代码就越接近自己的预期!

# 先下载包哟~
# pip install pandas 

import pandas as pd

# 读取csv文件
input_file = 'input.csv'
output_file = 'output.csv'

# 读取csv文件到DataFrame
df = pd.read_csv(input_file)

# 过滤DataFrame,只保留Year列为'2016'的行
filtered_df = df[df['Year'] == 2016]

# 将过滤后的DataFrame导出到新的csv文件
filtered_df.to_csv(output_file, index=False)

print(f'处理完成,结果已保存到 {output_file}')

结果展示:

     非常完美!能流畅打开且数据可以显示全了。根据这个流程就可以快速把数据整理出来咯~

本文标签: 脚本表格快速数据chatGPT