admin管理员组文章数量:1538122
2024年5月22日发(作者:)
信
19
与电
2020
年第
22
期
China
Computer
&
Communication
10
信息化徽有
Excel
和
Python
对比学习在
Python
数据分析课程
中的运用
沈涵飞
(苏州工业园区月艮务外包职业学院
,
江苏苏州
215123
)
摘
要
:
随着大数据时代的来临
,
数据分析在工作中越来越重要.
Python
是数据科学的主流开发语言
,
与
Excel
相比
,
具有独特的优势.但先学
Python
程序设计再学
Python
数据分析的学习路径
,
对非计算机相关专业的学生来说
,
存在很
大的困难
。
本文提出了在课程中运用
Excel
和
Python
对比学习的教学方式
,
有助于降低课程的门槛
,
突出学习重点
,
在
实践中获得了很好的教学效果
。
关键词
:
对比学习
;
数据分析教学
;
速查表
;
任务驱动
中图分类号
:
TP311.
13-4
;
G642
文献标识码
:
A
文章编号
:
1003-9767
(2020)
22-249-03
Application
of
Excel
and
Python
Analysis
Comparative
Course
Learning
in
Python
Data
SHEN
Hanfei
(Suzhou
Industrial
Park
Institute
of Services
Outsourcing,
Suzhou
Jiangsu
215123,
China)
Abstract:
With
the
advent
of
the
era
of
big
data,
data
analysis
is
becoming
more
and
more
important
in
our
work.
Python
is
the
mainstream
development
language
of
data
science.
Compared
with
Excel,
Python
has
unique
advantages.
However,
it
is
very
difficult
for
non-computer
related
majors
to
learn
Python
programming
first
and
then
Python
data
analysis.
This
paper
puts
forward
that
using
Excel
and
Python
to
teach
in
the
course
can
help
lower
the
threshold
of
the
course,
highlight
the
key
points
of
learning,
and
achieve
good
teaching
results
in
practice.
Keywords
:
comparative
study;
teaching
of
data
analysis;
CheatSheet;
task-driven
0
引言
的语法和高层次的语言表示表达了应用计算机解决问题的计
2018
年
3
月
15
日
,
教育部办公厅发布
《
教育部办公厅
算思维理念何
。
Python
语言抽象了问题及解决方案,
自动化
关于公布首批
“
新工科
”
研究与实践项目的通知
》旳
。新工
问题求解
,
是
“
复杂信息系统时代
”
利用计算机解决问题最
科专业主要指针对新兴产业的专业
,
以互联网和工业智能为
直观的表达工具
[3]
o
使用
Python
处理数据相对于
Excel
的优
核心
,
包括大数据
、
云计算
、
人工智能
、
区块链
、
虚拟现实
、
势有以下几方面
。
①
Python
有更多的数据获取途径
。
例如
,
智能科学与技术等相关工科专业
。
在此背景下
,
信息工程学
使用
Pandas
中的
read_html
函数直接抓取网页上的表格
,
使
院开设了
《
Python
数据分析
》
课程作为公共选修课
。
用
Requests
和
BeautifulSoup
库从网站抓取数据并解析数据
,
TuShare
库则能为金融分析人员提供快速
、
整洁和多样的易
1
开设
《
Python
数据分析
》
课程的目的
于分析的证券数据
,
极大地减轻数据获取的工作量
。②
Python
Excel
是最常用的数据分析工具
,
具有上手容易
、
学习
在处理大量数据时的效率高于
Excel,
特别是对海量数据的
资源丰富
、
图表定制功能强大等特点
。
Python
是数据科学的
处理效果要明显优于
Excel
。
③
Python
是脚本语言
,
容易实
主流开发语言
,
设计理念是关心计算问题的求解
,
其轻量级
现自动化操作
。
Excel
的
VBA
是基于
Excel
内部的自动化
,
基金项目
:
校本教材
《
Python
程序设计与数据处理实例教程
》
(项目编号
:
19jc05)
»
作者简介
:
沈涵飞
(1978-)
,
男
,
江苏苏州人
,
硕士研究生
,
系统架构设计师
,
讲师
。
研究方向
:
信息化教学
、
专利分析等
。
249
信息化嶽育
信
China
Computer
ia
与电
&
Communication
ns
2020
年第
22
期
其他方面的自动化就做不了
,
比如批量修改文件名
,
而使用
联网上有不少在线的
Jupyter
Notebook
平台,
国内的有
Python
很容易实现
。
④
Python
可用来做算法模型
。
广义的
米
筐
(
/
)
、
聚宽
(
www
.
数据分析包含了算法
,
比如各类机器学习和数据挖掘算法
。
/
),
国夕卜有谷歌的
CoLab
。
使用云端的
Jupyter
使用者只需要理解基本的算法原理和应用条件
,
Python
就能
Notebook
平台免去了安装软件的麻烦
,
非常适合非计算机相
定制算法模型解决任务
,
比如使用
kNN
、
决策树等对数据进
关专业的学生使用
。
安装第三方库也很容易
,
例如安装词云
行分类操作
。
库
wordcloud
的命令是
!pip
install
wordcloud-user
,
参数
user
由于
Python
具有这些优势
,
因此开设了
《
Python
数据
表明安装包到用户自身的环境中
。
分析
》
课程作为公共选修课
。
《
Python
数据分析
》
课程不能
2.2
速查表和在线资源
简单地认为是
《
Python
程序设计
》
+
《
数据分析
》
。
程序设
计类课程的基本目标是培养学生的计算思维能力
,
其教学模
由于
Python
数据分析类的第三方库涉及的语法细节很
式是由逻辑驱动的
,
一般从变量
、
数据类型
、
运算符与表达
多,
为了克服学生的畏难情绪
,
让学生聚焦于任务解决
,
提
式开始
,
然后是分支判断和循环结构
,
以及函数
、
文件操作等
。
高学生处理任务的效率
,
课程组给学生设计了速查表
(
Cheat
作为公共选修课的
《
Python
数据分析
》
重在培养学生的数据
Sheet)
o
速查表内容简洁
,
涵盖了
Python
数据处理的最常
处理和分析能力,
因此选用的教材和课程教学的模式都应该
用代码
,
能根据学生的反馈进行及时调整
,
快速响应学生的
是任务驱动而不是逻辑驱动
。
需求
。
对于学习能力强的同学
,
推荐他们从互联网下载更多
在通常的课程设置中
,
往往是先开设
《
Python
程序设计
》
适合自己的速查表
。
除此之外
,
还提供了在线的
Pandas
教程
课程
,
然后再学习
《
Python
数据分析
》
课程
。
这种方式适合
(
https
://www.
/pandas
)
、
Python
数据科学
(
有程序设计基础的学生
,
有利于打好扎实的编程基础
,
但不
/python_data_science
)
等在线资源来配合速
适合非计算机相关专业的学生
。
查表的使用
。
数据分析的常规流程
:
熟悉工具一明确目的一获取数
3
Excel
和
Python
对比学习法的应用
据一熟悉数据一处理数据一分析数据一得出结论一验证结
论
。
《
Python
数据分析
》
课程最为核心的是分析数据并得出
3.1
方法的优势
有意义的结论
,
不应该把掌握语言的语法细节作为课程的重
Excel
在数据处理方面的优势是上手容易
,
拥有丰富的
点
,
尤其在课时有限的情况下
,
应该让语法学习服务于分析
学习资源
;
制作图表比
Python
更容易
,
而且更为美观
;
让学
数据这个核心任务
。
当所学语法不足以支持任务解决时
,
再
生从熟悉的
Excel
操作中去学习对应的
Python
实现
,
而不是
进一步强化计算思维的培养
。
直接学习
Python
代码
,
大大降低了学习门槛
,
消除了学生对
Python
数据分析所需要的技能主要是
Python
入门知识
代码的恐惧心理
;
可以采用两种方法实现同一个任务
,
还可
和
NumPy
、
Pandas
、
Matplotlib
等第三方库的使用
。
在完成
以对比结果
。
NumPy
、
Pandas
、
Matplotlib
库的使用设计细
基本数据分析任务时
,
并不需要用到太多传统程序设计技能
,
节非常多
,
对比学习能够让学生聚焦于解决任务本身
,
而不
完全可以直接从
Excel
切入
,
然后使用
Python
完成同样的任
是语法细节
。
务
,
在此基础上再完成更为复杂的任务
。
3.2
方法的实施
2
方法实施的资源支持
由于
Excel
和
Python
各有优势
,
在教学过程中并不是
2.1
应用
JupyterNotebook
的云端开发环境
所有的教学内容全部采用
Excel
和
Python
的对比学习法
,
常用的
Python
环境有很多
,
如
IDLE+PyCharm
、
而是在基础内容的教学中引入了
3
个任务
,
先使用
Excel
解
Anaconda
等
,
其中
IDLE
是简洁的集成开发环境
,
也是全
决
,
然后再使用
Python
处理同样的任务
,
以此掌握常用的
国计算机等级考试二级
Python
科目的指定工具
,大小不到
数据分析技能
。
任务
1
是制作产品销售数据表
,
主要是掌握
30MB
o
安装基本的
Python
环境对非计算机专业的学生有一
数据的导入
、
排序
、
列的简单计算
、
列数据的汇总等
,
该任
定的难度
,
而且使用
Python
数据分析时
,
往往会用到很多第
务会用到
Excel
中的
rank
函数
,而该函数在
Python
教材中
三方库
,
安装这些第三方库经常会产生冲突
,
即使是教师也
较少提及
,
因此引导学生主动探索
,
使用
JupyterNotebook
很难解决
,
还会给很多初学者带来不少困扰
。
的帮助和互联网资源来解决
。
任务
2
是制作日常费用统
因此
,
在教学过程中
,
课程组引入了云端的
Jupyter
计表
,
先在
Excel
中使用分类汇总和数据透视表实现分组
Notebook
平台
。
Jupyter
Notebook
是基于浏览器的
Python
统计
,
然后在
Python
中使用
GroupBy
对象的聚集函数来
数据分析工具
,使用方便,
具有极强的交互和富文本的
解决
。
任务
3
是分析消费数据集
,
先使用
Excel
数据透视
展示效果
,
Anaconda
安装包自带
Jupyter
Notebooko
互
表快速实现
,
然后使用
Python
的
pivot
table
和
crosstab
250
信
19
与电
2020
年第
22
期
China
Computer
&
Communication
10
信息化徽有
实现
。
据分析工具来完成数据分析任务
。
在此基础上
,
再进行横向和纵向拓展
。
横向拓展是把之
前学习
《
计算机操作基础
》
等课程中使用
Excel
来解决的任
务
,
改为采用
Python
来处理
;
纵向拓展是在此基础上使用
参考文献
Python
来解决更为复杂的任务
。
[1]
教育部办公厅.关于公布首批
“
新工科
”
研究与
4
结语
实践项目的通知(教高厅函
[2018J17
号
)[EB/OL].(2018-
《
Python
数据分析
》
课程作为公共选修课
,
选课的学生
03-21)
[2019-04-21].
.
/srcsite/A08/
未必学过程序设计语言
。
通过使用云端的
Python
开发环境
,
S7056/20
1
803/t201
80329_33
.
采用
Excel
和
Python
的对比学习法
,
能有效地降低入学习门
[2]
Wing
J
ational
thinking[J]
.Communications
槛
,
突出
Python
语法的重点
,
让学生聚焦于解决任务
,
受到
of
the
ACM,
2006,49(3):33-35.
了学生的欢迎和好评
。
此外
,
还可以把对比学习进一步拓展
[3]
嵩天
,
黄天羽
,
礼欣
.Python
语言
:
程序设计课程教学
到
SQL
语言和
R
语言的学习中
,
有助于学生利用不同的数
改革的理想选择
[J].
中国大学教学
,2016
⑵
:42-47,
251
版权声明:本文标题:Excel和Python对比学习在Python数据分析课程中的运用 内容由热心网友自发贡献,该文观点仅代表作者本人, 转载请联系作者并注明出处:https://m.elefans.com/xitong/1716387742a500886.html, 本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌抄袭侵权/违法违规的内容,一经查实,本站将立刻删除。
发表评论