admin管理员组

文章数量:1538122

2024年5月22日发(作者:)

19

与电

2020

年第

22

China

Computer

&

Communication

10

信息化徽有

Excel

Python

对比学习在

Python

数据分析课程

中的运用

沈涵飞

(苏州工业园区月艮务外包职业学院

江苏苏州

215123

)

随着大数据时代的来临

数据分析在工作中越来越重要.

Python

是数据科学的主流开发语言

Excel

相比

具有独特的优势.但先学

Python

程序设计再学

Python

数据分析的学习路径

对非计算机相关专业的学生来说

存在很

大的困难

本文提出了在课程中运用

Excel

Python

对比学习的教学方式

有助于降低课程的门槛

突出学习重点

实践中获得了很好的教学效果

关键词

对比学习

数据分析教学

速查表

任务驱动

中图分类号

TP311.

13-4

G642

文献标识码

A

文章编号

1003-9767

(2020)

22-249-03

Application

of

Excel

and

Python

Analysis

Comparative

Course

Learning

in

Python

Data

SHEN

Hanfei

(Suzhou

Industrial

Park

Institute

of Services

Outsourcing,

Suzhou

Jiangsu

215123,

China)

Abstract:

With

the

advent

of

the

era

of

big

data,

data

analysis

is

becoming

more

and

more

important

in

our

work.

Python

is

the

mainstream

development

language

of

data

science.

Compared

with

Excel,

Python

has

unique

advantages.

However,

it

is

very

difficult

for

non-computer

related

majors

to

learn

Python

programming

first

and

then

Python

data

analysis.

This

paper

puts

forward

that

using

Excel

and

Python

to

teach

in

the

course

can

help

lower

the

threshold

of

the

course,

highlight

the

key

points

of

learning,

and

achieve

good

teaching

results

in

practice.

Keywords

comparative

study;

teaching

of

data

analysis;

CheatSheet;

task-driven

0

引言

的语法和高层次的语言表示表达了应用计算机解决问题的计

2018

3

15

教育部办公厅发布

教育部办公厅

算思维理念何

Python

语言抽象了问题及解决方案,

自动化

关于公布首批

新工科

研究与实践项目的通知

》旳

。新工

问题求解

复杂信息系统时代

利用计算机解决问题最

科专业主要指针对新兴产业的专业

以互联网和工业智能为

直观的表达工具

[3]

o

使用

Python

处理数据相对于

Excel

的优

核心

包括大数据

云计算

人工智能

区块链

虚拟现实

势有以下几方面

Python

有更多的数据获取途径

例如

智能科学与技术等相关工科专业

在此背景下

信息工程学

使用

Pandas

中的

read_html

函数直接抓取网页上的表格

使

院开设了

Python

数据分析

课程作为公共选修课

Requests

BeautifulSoup

库从网站抓取数据并解析数据

TuShare

库则能为金融分析人员提供快速

整洁和多样的易

1

开设

Python

数据分析

课程的目的

于分析的证券数据

极大地减轻数据获取的工作量

。②

Python

Excel

是最常用的数据分析工具

具有上手容易

学习

在处理大量数据时的效率高于

Excel,

特别是对海量数据的

资源丰富

图表定制功能强大等特点

Python

是数据科学的

处理效果要明显优于

Excel

Python

是脚本语言

容易实

主流开发语言

设计理念是关心计算问题的求解

其轻量级

现自动化操作

Excel

VBA

是基于

Excel

内部的自动化

基金项目

校本教材

Python

程序设计与数据处理实例教程

(项目编号

19jc05)

»

作者简介

沈涵飞

(1978-)

,

江苏苏州人

硕士研究生

系统架构设计师

讲师

研究方向

信息化教学

专利分析等

249

信息化嶽育

China

Computer

ia

与电

&

Communication

ns

2020

年第

22

其他方面的自动化就做不了

比如批量修改文件名

而使用

联网上有不少在线的

Jupyter

Notebook

平台,

国内的有

Python

很容易实现

Python

可用来做算法模型

广义的

(

/

)

聚宽

(

www

.

数据分析包含了算法

比如各类机器学习和数据挖掘算法

/

),

国夕卜有谷歌的

CoLab

使用云端的

Jupyter

使用者只需要理解基本的算法原理和应用条件

Python

就能

Notebook

平台免去了安装软件的麻烦

非常适合非计算机相

定制算法模型解决任务

比如使用

kNN

决策树等对数据进

关专业的学生使用

安装第三方库也很容易

例如安装词云

行分类操作

wordcloud

的命令是

!pip

install

wordcloud-user

,

参数

user

由于

Python

具有这些优势

因此开设了

Python

数据

表明安装包到用户自身的环境中

分析

课程作为公共选修课

Python

数据分析

课程不能

2.2

速查表和在线资源

简单地认为是

Python

程序设计

+

数据分析

程序设

计类课程的基本目标是培养学生的计算思维能力

其教学模

由于

Python

数据分析类的第三方库涉及的语法细节很

式是由逻辑驱动的

一般从变量

数据类型

运算符与表达

多,

为了克服学生的畏难情绪

让学生聚焦于任务解决

式开始

然后是分支判断和循环结构

以及函数

文件操作等

高学生处理任务的效率

课程组给学生设计了速查表

(

Cheat

作为公共选修课的

Python

数据分析

重在培养学生的数据

Sheet)

o

速查表内容简洁

涵盖了

Python

数据处理的最常

处理和分析能力,

因此选用的教材和课程教学的模式都应该

用代码

能根据学生的反馈进行及时调整

快速响应学生的

是任务驱动而不是逻辑驱动

需求

对于学习能力强的同学

推荐他们从互联网下载更多

在通常的课程设置中

,

往往是先开设

Python

程序设计

适合自己的速查表

除此之外

还提供了在线的

Pandas

教程

课程

然后再学习

Python

数据分析

课程

这种方式适合

(

https

://www.

/pandas

)

Python

数据科学

(

有程序设计基础的学生

有利于打好扎实的编程基础

但不

/python_data_science

)

等在线资源来配合速

适合非计算机相关专业的学生

查表的使用

数据分析的常规流程

熟悉工具一明确目的一获取数

3

Excel

Python

对比学习法的应用

据一熟悉数据一处理数据一分析数据一得出结论一验证结

Python

数据分析

课程最为核心的是分析数据并得出

3.1

方法的优势

有意义的结论

不应该把掌握语言的语法细节作为课程的重

Excel

在数据处理方面的优势是上手容易

拥有丰富的

尤其在课时有限的情况下

应该让语法学习服务于分析

学习资源

制作图表比

Python

更容易

而且更为美观

让学

数据这个核心任务

当所学语法不足以支持任务解决时

生从熟悉的

Excel

操作中去学习对应的

Python

实现

而不是

进一步强化计算思维的培养

直接学习

Python

代码

大大降低了学习门槛

消除了学生对

Python

数据分析所需要的技能主要是

Python

入门知识

代码的恐惧心理

可以采用两种方法实现同一个任务

还可

NumPy

Pandas

Matplotlib

等第三方库的使用

在完成

以对比结果

NumPy

Pandas

Matplotlib

库的使用设计细

基本数据分析任务时

并不需要用到太多传统程序设计技能

节非常多

对比学习能够让学生聚焦于解决任务本身

而不

完全可以直接从

Excel

切入

然后使用

Python

完成同样的任

是语法细节

在此基础上再完成更为复杂的任务

3.2

方法的实施

2

方法实施的资源支持

由于

Excel

Python

各有优势

在教学过程中并不是

2.1

应用

JupyterNotebook

的云端开发环境

所有的教学内容全部采用

Excel

Python

的对比学习法

常用的

Python

环境有很多

IDLE+PyCharm

而是在基础内容的教学中引入了

3

个任务

先使用

Excel

Anaconda

其中

IDLE

是简洁的集成开发环境

也是全

然后再使用

Python

处理同样的任务

以此掌握常用的

国计算机等级考试二级

Python

科目的指定工具

,大小不到

数据分析技能

任务

1

是制作产品销售数据表

主要是掌握

30MB

o

安装基本的

Python

环境对非计算机专业的学生有一

数据的导入

排序

列的简单计算

列数据的汇总等

该任

定的难度

而且使用

Python

数据分析时

往往会用到很多第

务会用到

Excel

中的

rank

函数

,而该函数在

Python

教材中

三方库

安装这些第三方库经常会产生冲突

即使是教师也

较少提及

因此引导学生主动探索

使用

JupyterNotebook

很难解决

还会给很多初学者带来不少困扰

的帮助和互联网资源来解决

任务

2

是制作日常费用统

因此

在教学过程中

课程组引入了云端的

Jupyter

计表

先在

Excel

中使用分类汇总和数据透视表实现分组

Notebook

平台

Jupyter

Notebook

是基于浏览器的

Python

统计

然后在

Python

中使用

GroupBy

对象的聚集函数来

数据分析工具

,使用方便,

具有极强的交互和富文本的

解决

任务

3

是分析消费数据集

先使用

Excel

数据透视

展示效果

Anaconda

安装包自带

Jupyter

Notebooko

表快速实现

然后使用

Python

pivot

table

crosstab

250

19

与电

2020

年第

22

China

Computer

&

Communication

10

信息化徽有

实现

据分析工具来完成数据分析任务

在此基础上

再进行横向和纵向拓展

横向拓展是把之

前学习

计算机操作基础

等课程中使用

Excel

来解决的任

改为采用

Python

来处理

纵向拓展是在此基础上使用

参考文献

Python

来解决更为复杂的任务

[1]

教育部办公厅.关于公布首批

新工科

研究与

4

结语

实践项目的通知(教高厅函

[2018J17

)[EB/OL].(2018-

Python

数据分析

课程作为公共选修课

选课的学生

03-21)

[2019-04-21].

.

/srcsite/A08/

未必学过程序设计语言

通过使用云端的

Python

开发环境

S7056/20

1

803/t201

80329_33

.

采用

Excel

Python

的对比学习法

能有效地降低入学习门

[2]

Wing

J

ational

thinking[J]

.Communications

突出

Python

语法的重点

让学生聚焦于解决任务

受到

of

the

ACM,

2006,49(3):33-35.

了学生的欢迎和好评

此外

还可以把对比学习进一步拓展

[3]

嵩天

黄天羽

礼欣

.Python

语言

程序设计课程教学

SQL

语言和

R

语言的学习中

有助于学生利用不同的数

改革的理想选择

[J].

中国大学教学

,2016

:42-47,

251

本文标签: 数据学生课程学习任务