admin管理员组

文章数量:1531657

2024年3月26日发(作者:)

32

卷第

4

2020

12

宁德师范学院学报

(

自然科学版

)

JournalofNingdeNormalUniversity渊NaturalScience)

Vol.32No.4

Dec.

2020

新型冠状病毒肺炎确诊病例的数据聚类分析

陈本晶

广东环境保护工程职业学院

广东佛山

528216冤

摘要

搜集从

2020

1

20

日到

3

14

日共

55d

我国境内

新型冠状病毒肺炎

冶渊

简称

新冠肺炎

冶冤

计确诊病例

现有疑似病例

累计治愈出院病例

累计死亡病例数据

使用

SPSS22.0

进行

k

平均值聚类分析

中国

34

个省区市的累计确诊病例变量进行系统聚类分析

.

从聚类结果来看

我国疫情经历了集中暴发期

高峰

缓解期

3

个阶段

从各省区市聚类的最终归属类别来看

各地疫情情况与接触重点疫区人员密切程度

域关系呈显著正相关

充分说明控制传染源

切断传播途径的重要性

.

关键词

新冠肺炎

曰k

平均值聚类分析

系统聚类分析

正相关

疫情分析

中图分类号

院R195.1

文献标识码

院A

文章编号

院2095-2481(2020)04-0346-06

后疫情在全国范围内暴发

截至

2020

3

21

24

全国

31

个省

自治区

直辖市

和新疆生产建

设兵团

不包含港澳台

累计确诊病例

81054

累计治愈出院病例

72244

累积死亡病例

3261

经连续

2

日新增确诊病例为

0

[1]

国内疫情得到有效控制

.

然而此时

国外疫情正在井喷暴发

来自世界卫

现有确诊病例

5549

.

新增报告境外输入确诊病例

45

累计报告境外输入确诊病例

314

湖北已

2019

12

湖北省武汉市发现不明原因肺炎

后来确定为

新型冠状病毒肺炎

冶渊COVID-19冤袁

生组织报告

截至

2020

3

21

国外累计确诊已达

191614

新增确诊

20065

.

疫情发生以

中国政府采用控制传染源

切断传播途径的指导方针对疫情的判断

决策

控制起了关键作用

.

中国

政府应对疫情的探索和经验

给国外的疫情防控工作提供了十分宝贵的经验

.

1

问题的提出

2019

12

月新冠肺炎疫情发生以来

专家学者们利用新冠肺炎的资料在临床医学

流行病学和

疫情防控管理等方面

得到了许多科研成果

例如

新型冠状病毒肺炎诊疗方案

试行第六版

冤曳

中指出经

呼吸道飞沫和密切接触传播是新冠肺炎的主要传播途径

人群普遍易感

[2]

基于

SEIR

模型分析相关干

预措施在新冠肺炎疫情中的作用

[3]

全国各地城市

除武汉外

冤71%

的感染病例和从武汉输出的人口相

[4]

.

新冠肺炎在多个领域的研究为临床应用

公共卫生防控和政策决策等提供了重要依据

充分展示

了科学研究对疫情防控的重要意义

.

本文从聚类分析的角度探索我国疫情的发展阶段

各地疫情与接触

重点疫区人员密切程度

重点疫区区域的关系

.

2

聚类分析的原理和方法

将认识对象进行分类是人类认识世界的一种重要方法

聚类分析是统计学研究中

物以类聚

问题

的多元统计分析方法

是对样本或变量进行定量分析的一种统计方法

目的是根据事物本身的特性将相

过程的不同

可以分为快速聚类

系统聚类和两步聚类

3

种方法

[5]

.

对样本进行分类为

Q

型聚类分析

似的事物进行归类

.

被归为一类的事物具有较高的相似性

而不同类间的事物有着较大的差异

.

根据分类

收稿日期

院2020-03-25

作者简介

陈本晶

(1982-)袁

讲师

.E-mail:****************

基金项目

广东环境保护工程职业学院

2017

年院级教学改革项目

(J443218061906).

4

陈本晶

新型冠状病毒肺炎确诊病例的数据聚类分析

-

347

-

指标进行分类为

R

型聚类分析

.SPSS

快速聚类利用

k

平均值分类法对样本进行分类且只可以实现对样

本进行

Q

型聚类分析

系统聚类可以实现对样本进行

Q

型聚类分析和对变量进行

R

型聚类分析

.

3

3.1

国内新冠肺炎疫情的聚类分析

数据指标选取

本文选取新冠肺炎累计确诊病例

现有疑似病例

累计治愈出院病例

累计死亡病例

新增确诊病

现有确诊病例

新增治愈出院病例作为数据指标进行分析

.

3.2

数据来源与处理

本文引用的全国每天累计确诊病例

现有疑似病例

累计治愈出院病例

累计死亡病例数据来源于

国家卫健委官方网站

渊冤袁

经过狗熊会成员人工整理可以在其网站

渊www.

下载

其中国家卫健委未公布

1

21

日现有疑似病例数据

本文根据前后

2

日现有疑

似病例数据采用求算术平均值的方法计算得出缺失数据

.

中国

34

个省区市的累计确诊病例数据来自国

家及各地卫健委官方网站

和鲸社区

渊冤

专业数据分析人员从腾讯新闻网网络爬虫

收集整理而得

.

经过笔者核实

数据权威有效

准确率在

95%

以上

笔者在校正和补充部分数据后采用

.

3.3

聚类结果与讨论

3.3.1

14

日共

55d

中国累计确诊病例

现有疑似病例

累计治愈出院病例

累计死亡病例四个变量进行

k

平均

值聚类分析

[5]

.

k=3袁

55

天中国新冠肺炎疫情划分为

3

个阶段

集中暴发期

高峰期

缓解期

.

由表

1

可以看出

四个变量的聚类均方值都远远大于误差均方值

并且显著性水平均小于

0.05袁

对全国疫情按发展阶段进行

k

平均值聚类分析使用

SPSS22.0

对从

2020

1

20

日到

3

明拒绝四个变量使各类之间无差异的假设

表明参与聚类分析的

4

个变量能够良好地区分各类

类间的

差异足够大

.

1

方差分析

类型

累计确诊

现有疑似

累计治愈出院

累计死亡

聚类分析

均方值

24325465001.860

960987618.008

.747

36828779.857

df

2

2

2

2

误差

均方值

112248082.052

46115767.708

49026652.959

120876.262

df

52

52

52

52

F

216.712

20.839

283.026

304.682

显著性

0.000

0.000

0.000

0.000

由表

2尧

3

可以看出三个阶段分别为

14363袁983袁368冤.

其中

袁1

25

日到

1

30

日每日新增确诊

1000耀2000

袁1

31

日到

2

11

1

阶段

院2020

1

20

要2

11

为疫情集中暴发期

1

类的聚类中心为

渊16633袁

日新增确诊

2000耀3000

.

现有疑似病例也和每日新增确诊病例一样快速增加

袁2

8

日达到最大值

渊28942

[1]

之后每日新增病例大幅下降

.

累计治愈出院和累计死亡病例在这阶段还较少

.

由于疫情初

期对新冠肺炎的高度传染性认识不够

导致很多人被感染

加上春节的到来

全国人民开始一年一度的

春运

大迁徙

冶袁

疫情迅速从湖北扩散到全国各地

防控工作面临严峻挑战

.

疫情早期武汉医疗资源供应

严重不足

很多确诊和疑似病例无法顺利就医

供需矛盾突出

.1

23

武汉封城

袁1

29

全国

31

个省区市

不包括港澳台

全部启动重大突发公共卫生事件一级响应

.

广大人民群众众志成城

在家严防

死守

打响了疫情防控阻击战

全国形成了全面动员

全面部署

全面加强疫情防控工作的局面

[6]

.

2

阶段

院2020

2

12

要2

26

为疫情高峰期

2

类的聚类中心为

渊72358,6016,

17346,2095冤.2

12

按照

新型冠状病毒肺炎诊疗方案

试行第五版修正版

冤曳袁

湖北省增加了

床诊断病例

分类

对疑似病例具有肺炎影像学特征者

确定为临床诊断病例

以便患者能及早按照确诊

病例相关要求接受规范治疗

进一步提高救治成功率

.

湖北省报告的

13332

例临床诊断病例纳入确诊

病例统计

[1]

.

与第

1

类聚类中心相比

累计确诊病例

累计治愈出院病例大幅增加

现有疑似病例大幅降

-

348

-

宁德师范学院学报

(

自然科学版

)

2020

12

.

现有确诊病例在这阶段是最多的

4

耀6

万例

袁2

17

日达到最大值

渊58016

[1]

.

2

16

以后

新增治愈出院病例每日

2000

例以上

.

累计死亡人数占累计确诊人数的比例低于

5%.

武汉和湖北

是疫情防控的重中之重

是打赢疫情防控阻击战的决胜之地

.

武汉胜则湖北胜

湖北胜则全国胜

.

党中央

举全国之力予以支援

组织各省区市和军队

调派三百多支医疗队

四万多名医护人员驰援

袁10d

建成

的火神山医院

尧18d

建成的雷神山医院也在这时投入使用

.

优先保障武汉和湖北的医用物资

并组织

19

个省份对口支援湖北

除武汉外

16

个市州

[7]

.

春节已过

针对节后人员大范围流动可能带来的疫情扩

措施

.

学校全部延迟开学

.

53873,3041冤袁

与第

2

类聚类中心比较

每日新增确诊数量迅速下降

全国除武汉市外

其余大部分省

3

阶段

院2020

2

27

要3

14

为疫情缓解期

3

类的聚类中心为

渊80364,591,

散风险

全国大部分企业

机关事业单位灵活复工

错峰上班

在健康监测

人员管理等方面采取了严格

市新增确诊病例已实现零增长或个位数增长

.3

1

日之后全国每日新增确诊低于

200

袁3

8

日之

后全国每日新增确诊低于

30

现有疑似病例大幅下降

累计治愈出院病例大幅增加

截至

3

14

24

现有确诊病例

10734

累计治愈出院

66911

[1]

累计治愈出院病例占累计确诊病例的比例达

82.76%.

治愈出院率除湖北省为

80%

以外

其余各省为均在

95%

以上

治疗效果良好

.

疫情拐点出现

武汉和湖北疫情防控形势发生积极向好变化

取得阶段性重要成果

初步实现了稳定局势

扭转局面的

目标

.

但是武汉和湖北疫情防控任务依然艰巨繁重

要继续把疫情防控作为当前头等大事

离疫情结束

还有很长一段时间

.

大部分企业已经有序复工复产

但是所有学校仍然延迟开学

全国小学

中学

大学

利用网络教学平台上课

采用

停课不停教

停课不停学

的在线模式教学

.

2

每个聚类中的个案数量

类型

聚类

1

聚类

2

聚类

3

有效

缺失

数量

23.000

15.000

17.000

55.000

0.000

聚类

累计确诊

现有疑似

累计治愈出院

累计死亡

3

最终聚类中心

123

16633

14363

983

368

72358

6016

17346

2095

80364

591

53873

3041

三个变量具有高度正相关性

见表

4.

因此仅使用全国

34

个省区市的累计确诊病例

2020

1

20

要3

14

日共

55d

的数据进行

R

型系统聚类

[5]

k=2尧3尧4尧5袁

5

得到聚类个数为

2耀5

的各个案

的最终归属类别

.

4

相关系数矩阵

Pearson

相关

累计确诊

1

0.793**

0.963**

累计治愈出院

0.793**

1

0.919**

累计死亡

0.963**

0.919**

1

3.3.2

对中国疫情按省区市进行系统聚类分析由于累计确诊病例

累计治愈出院病例

累计死亡病例

累计确诊

累计治愈出院

累计死亡

院**

表示相关性在

0.01

上显著

双尾

冤.

4

陈本晶

新型冠状病毒肺炎确诊病例的数据聚类分析

5

各聚类组员

地区

安徽

北京

福建

甘肃

广东

广西

贵州

海南

河北

河南

黑龙江

湖北

湖南

吉林

江苏

江西

辽宁

内蒙古

宁夏

青海

山东

山西

陕西

上海

四川

天津

新疆

云南

浙江

重庆

西藏

澳门

台湾

香港

5

个集群

1

2

2

2

3

2

2

2

2

3

2

4

1

2

5

1

2

2

2

2

5

2

2

2

5

2

2

2

3

5

2

2

2

2

4

个集群

1

2

2

2

1

2

2

2

2

1

2

3

1

2

4

1

2

2

2

2

4

2

2

2

4

2

2

2

1

4

2

2

2

2

3

个集群

1

2

2

2

1

2

2

2

2

1

2

3

1

2

2

1

2

2

2

2

2

2

2

2

2

2

2

2

1

2

2

2

2

2

-

2

个集群

1

1

1

1

1

1

1

1

1

1

1

2

1

1

1

1

1

1

1

1

1

1

1

1

1

1

1

1

1

1

1

1

1

1

349

-

由表

5

可得

袁k=2

分类如下

:

湖北自成一类

其余各省

自治区

直辖市

港澳台为一类

.

k=3

分类如下

:渊

安徽

广东

河南

湖南

江西

浙江

冤袁渊

北京

福建

甘肃

广西

贵州

海南

河北

黑龙江

吉林

江苏

辽宁

内蒙古

宁夏

青海

山东

山西

陕西

上海

四川

天津

新疆

云南

重庆

西

澳门

台湾

香港

冤袁渊

湖北

冤.

k=4

分类如下

:渊

安徽

广东

河南

湖南

江西

浙江

冤袁渊

北京

福建

甘肃

广西

贵州

海南

河北

黑龙江

吉林

辽宁

内蒙古

宁夏

青海

山西

陕西

上海

天津

新疆

云南

西藏

澳门

台湾

香港

冤袁渊

冤袁渊

江苏

山东

四川

重庆

冤.

k=5

分类如下

:渊

安徽

湖南

江西

冤袁渊

北京

福建

甘肃

广西

贵州

海南

河北

黑龙江

吉林

内蒙古

宁夏

青海

山西

陕西

上海

天津

新疆

云南

西藏

澳门

台湾

香港

冤袁渊

广东

河南

浙江

冤袁

湖北

冤袁渊

江苏

山东

四川

重庆

冤.

-

350

-

宁德师范学院学报

(

自然科学版

)

2020

12

从聚类分析结果来看

首先

湖北省是全国疫情防控的重中之重

,

聚类不管分成几类

,

湖北都自成一

3

14

湖北的累积确诊病例占全国的

83.9%袁

武汉的累积确诊病例占全国的

61.8%.

只有集中力量

.

湖北疫情看武汉

武汉是决胜之地的主战场

湖北省其他市州也是决胜之地的重要战场

.

截至

2020

把重点地区的疫情控制住

,

才能从根本上扭转全国疫情的局面

.

由百度地图所得数据

[8]

在武汉下达封城

1

23

日前后

500

万人离开武汉

高于

2019

年同时期的离开人口

.

由于在

1

23

日出了封城令

高速公路并没有关闭

导致更多的人选择了高速公路离开武汉

可以推断出封城令导致一部分人恐

导致更多的人选择离开了武汉

这对疫情的控制很不利

.

百度地图数据显示

武汉封城后

袁76.57%

人迁出武汉的人选择了湖北省内

其中

袁31%

的人去了孝感市和黄冈市

袁5.32%

的人去了河南

袁3.07%

人去了湖南

.

分析湖北省确诊病例的市州

可以发现

武汉与周边的孝感

黄冈

荆州

咸宁

襄阳

随州

荆门

鄂州等城市

构成了武汉都市圈

人员流动十分频繁

这些城市都成为了疫情重灾区

.

其中

孝感累

积确诊病例

3518

黄冈累积确诊病例

2907

武汉

孝感

黄冈累积确诊病例排名全国前三

.

由此可

以推断出

离开武汉的人带着肺炎病毒进入了新的城市

导致了新城市被感染

.

在离开武汉去了河南省

和湖南省后

河南省和湖南省也成为了患者较多的省份

.

其次

广东

河南

浙江三省累积确诊病例都超

1200

这是因为广东珠三角

浙江温州和湖北的人员流动较为频繁

在广东工作的湖北籍人员有

300

万之多

温州有

20

万人在武汉从事商贸工作

而河南和湖北相邻

河南是劳务输出大省

在武汉工

作的河南籍人员也很多

.

安徽

湖南

江西的累积确诊病例仅次于广东

河南

浙江

三省累积确诊病例均

超过

900

这是因为此三省和湖北地理位置相邻

但是彼此的贸易往来

人员流动不如广东

浙江

600

,

这是因为江苏经济发达

是劳务输入大省

和湖北虽然不相邻但是距离较近

.

而重庆和湖北接壤

南活跃

因此累积确诊病例比广东

河南

浙江少

.

江苏

山东

四川

重庆四地累积确诊病例也较多

各约

很多从华东地区开往重庆

四川的高铁

火车都要从湖北经过

因此重庆

四川的疫情也较为严重

但是

因为湖北各地封城

重庆距离武汉较远

所以疫情还不算严重

.

山东距离湖北较远

但是山东因为一个监

狱感染新冠肺炎病毒就确诊

207

例而使得山东的累计确诊病例也较多

.

北京

福建

甘肃

广西

贵州

河北

黑龙江

吉林

辽宁

内蒙古

宁夏

青海

山西

陕西

上海

天津

新疆

云南

西藏

澳门

台湾

香港等地疫情较轻

各地累积确诊病例低于

400

累积确诊病例最少的西藏仅

1

大部分省份累积

确诊病例在几十例到一百多例

.

这是因为这些省份距离湖北较远

很多省份和湖北的贸易往来

人员流

动没有那么频繁

而北京

上海这两个国际大都市人员流动大

累计确诊病例较少应该归功于北京市

海市政府对疫情的高效有序管理

有效阻止了疫情的大规模蔓延

.

香港

澳门

台湾因为离湖北较远

员往来还要办理通行证

人员流动少

所以疫情也较轻微

.

聚类分析的结果表明

各地疫情情况与和湖北的人员往来密切程度

地域关系呈显著正相关

这充

遏制疫情蔓延势头

[6]

.

一方面中国政府调动全国人民的力量投入疫情防控

严防死守

另一方面为了防止

疫情迅速蔓延

湖北省内下辖至少

18

个市

宣布采取封城措施

这从源头上控制了疫情的扩散

.

分说明控制传染源

切断传播途径的重要性

.

中国政府把人民群众生命安全和身体健康放在第一位

坚决

4

结语

全国疫情防控形势持续向好

生产生活秩序加快恢复的态势不断巩固和拓展

[9]

.

目前新冠疫情在全

球蔓延开来

国际疫情带来的输入性风险增加

.

国内外疫情形势具有复杂性和严峻性

,

要毫不松懈各项

防控工作

决不能让来之不易的疫情防控持续向好形势发生逆转

.

完善和加强防控

严格落实早发现

报告

早隔离

早治疗措施

加强疫情监测

集中救治患者

防止疫情向外扩散

.

落实人员流入地和流出地

的防控责任

.

中国构建起的全方位多层次的疫情防控体系

最大程度遏制疫情蔓延

值得各国借鉴

.

加强

4

陈本晶

新型冠状病毒肺炎确诊病例的数据聚类分析

-

351

-

疫情防控国际合作

同世界卫生组织紧密合作

加强同有关国家在疫情防控上的交流合作

继续提供力

所能及的帮助

.

中国秉持人类命运共同体理念

既是对本国人民生命安全和身体健康负责

也是对全球

公共卫生事业尽责

展现出负责任大国的担当

.

全球战

中国向世界传递信心和力量

共筑捍卫生

命安全的防疫之墙

.

参考文献

:

[1]

中华人民共和国国家卫生健康委员会

.

新型冠状病毒肺炎疫情防控疫情通报

[EB/OL].渊2020-03-14冤[2020-03-25].

[2]

国家卫生健康委员会

.叶

新型冠状病毒肺炎诊疗方案

试行第六版

冤曳

解读

[J].

中国医刊

,2020,55渊3冤:347-348.

[J].

浙江大学学报

医学版

冤,2020,49渊2冤:178-184.

35渊3冤:248-255.

/.

[3]

曹盛力

,

冯沛华

,

时朋朋

.

修正

SEIR

传染病动力学模型应用于湖北省

2019

冠状病毒病

渊COVID-19冤

疫情预测和评估

[4]

赵序茅

,

李欣海

,

聂常虹

.

基于大数据回溯新冠肺炎的扩散趋势及中国对疫情的控制研究

[J].

中国科学院院刊

,2020,

[5]

李昕

,

张明明

.SPSS22.0

统计分析

[M].

北京

:

电子工业出版社

,2015:258-264.

03-25]./2020/02/15/.

[6]

习近平

.

习近平在中央政治局常委会会议研究应对新型冠状病毒肺炎疫情工作时的讲话

[EB/OL].渊2020-02-03冤[2020-

[7]

习近平

.

习近平在统筹推进新冠肺炎疫情防控和经济社会发展工作部署会议上的讲话

[EB/OL].渊2020-02-03冤[2020-

[8]

佚名

.

对疫情的一点数据分析

[EB/OL].渊2020-02-05冤[2020-03-25]./people/purity.

03-25]./2020/02/23/.

[9]

中共中央政治局常务委员会

.

分析国内外新冠肺炎疫情防控和经济形势研究部署统筹抓好疫情防控和经济社会发展

重点工作中共中央总书记习近平主持会议

[EB/OL].渊2020-03-18冤[2020-03-25]./2020/03/18/AR鄄

.

Clusteringanalysisofnovelcoronaviruspneumoniaconfirmedcases

CHENBen-jing

(GuangdongVocationalCollegeofEnvironmentalProtectionEngineering,Foshan,Guangdong528216,China)

Abstract:Coronavirusdisease19(COVID-19)

cumulativecuredanddischargedcases,andcumulativedeadcases.k-meansclusteringanalysiswascarried

demicsituationhasexperiencedthreestages:concentratedoutbreakperiod,

peakperiodandremissionperiod.

thekeyepidemicareas,

Keywords:

andtheregionalrelationshipissignificantlypositive,

January20,2020toMarch14,2020,includingcumulativeconfirmedcases,existingsuspectedcases,

casesinChinawerecollectedduringthe55daysfrom

outbySPSS22.0,andasystematicclusteringanalysiswasmadeonthecumulativeconfirmedcasevariables

administrativeregion,theepidemicsituationineachregioniscloselyrelatedtothepersonnelincontactwith

importanceofcontrollingthesourceofinfectionandcuttingoffthetransmissionpath.

epidemicsituationanalysis

COVID-19;clusteranalysisofk-means;systematicclusteranalysis;positivecorrelation;

[

责任编辑郭涓

]

Accordingtothefinalclassificationofclusteringineachprovincial

whichfullyshowsthe

本文标签: 疫情病例确诊防控肺炎