admin管理员组

文章数量:1530838

2024年5月15日发(作者:)

疫情里的大数据应用

□文/原野

当前新冠肺炎疫情(C0VID-19)在全

数据分析等方法支撑疫情防控工作。”

球持续蔓延。而我国国内疫情已经基本平

息,复工复产基本到位,人民群众的社会

大数据助力人员流动分析

生活回到正轨,甚至出现了国庆黄金周各

2019年12月26日

,一

条数据在电子

地旅游大热潮。国情有区别,我国的行政

病历系统中存储下来,记录的张继先医生

体制在集中力量、统筹规划、刚性执行方

惊讶地发现,当天上午居然已经有三条类

面的独特优势得到了生动体现,而科技应

似的数据,都包含了发热、咳嗽等关键字,

用带来的高效率也是本次国内抗疫比较重

她感觉不明原因的肺炎有了异常,于是果

要的助推力。其中,大数据的应用功不可

断上报。

没。运营商在背后默默支撑。

12月29日下午,类似的数据增长到

疫情发生后,工业和信息化部第一时

了7条,在医院召开多部门会诊后,副院

间成立电信大数据支撑服务疫情防控领导

长决定直接到省、市卫健委的疾控处报告。

小组,统筹协调部门之间、部省之间的联

这家医院是湖北省中西医结合医院,最早

动共享。通过电信大数据用户位置轨迹数

上报疫情的医生就是这位呼吸与重症医学

据多元场景分析,能够统计全国特别是湖

科主任张继先。张继先医生说:“我们医

北等重点地区的人员流动情况,分析预测

生写病历,有病历系统,填出来的时候就

确诊、疑似患者及密切接触人员等重点人

会发现这些病人的共同点。”张医生提到

群的流动情况,支撑服务疫情态势研判、

的电子病历是患者所有健康相关的完整数

疫情防控部署以及对流动人员的监测统

据档案,患者被治疗的全过程都会被记录

计。当然运营商尽己所能外,电力、自来水、

下来。这意味着医院在诊疗病人的同时,

燃气、银联等基础设施企业也提供了相应

能获取更加完整的数据。

的数据信息,还包括航运、铁路、航空公

当前,电子病历系统(EMR)是国

司以及诸多互联网公司群策群力,共同助

家推动的医院信息化升级中的一个核心系

力政府各级部门取得了这场抗疫大战的阶

统。在2018年到2019年,国务院和国家

段性胜利。

卫健委总共有9条政策详细提到了国家对

2020年2月23日,习近平总书记在

于电子病历的硬性要求。2019年,全国总

统筹推进新冠肺炎疫情防控和经济社会发

计有7000多家医院申报了国家的电子病

展工作部署会议上指出:“要充分运用大

历评级。正是因为有了升级,系统对数据

■15

封面文章

的采集更加完善,才有更快发现传染的可

能。如果没有这样客观确凿的电子数据,

本次要在体制内发现疫情可能会更晚,影

响会更大,后果会更严重。

疫怙发屮

fn

,丨:彳

km

,

m

化部第-时

叫成:/:电丨,)人数

m

友挖服务&怙防拧领斤

m

,统方协脚部

n

之间.部竹之

m

的収

Pi

7。通过人数

m

川•位

n

轨迹数

則多

H

:场议分祈,能够统

mN

特别记湖

北等承点地丨<的入(4流动怙况,分析

m

为防止疫情扩散、有效网格化防控提供大

数据支撑。

温州市大数据局在省市之间、各县市

区之间建立畅通的数据通道,对各渠道数

据进行处理、整合、分析,精准梳理从武

汉到温州人员的车辆、航班、高铁数据信

息,为有效开展网格化防控、防止疫情扩

散提供了支撑。

大数据助力居住情况排查

国家电网浙江杭州供电公司的开发团

队研发“电力大数据+社区网格化”算法,

实现了收集、研判电力数据功能,对滨江

157476户居民、超过1000万条电力数据

进行收集和分析。为精准判断细微的用电

数据差别,团队开发了居民短暂和长期外

出、举家返回、隔离人员异动等3个场景

6套算法模型。通过3轮150余万条次电

力大数据巡航,精准判断出区域内人员日

流动量和分布,并实时监测居家隔离人员、

独居老人等特殊群体347户,让社区人员

得以根据电量波动判断业主状况,做好跟

踪服务。

在武汉集中拉网式大排查工作中,武

汉供电公司客服汉口分中心与所辖社区积

极对接,利用“电力大数据+社区网格化”

防疫算法,向街道社区提供电力精准大数

据。相应团队研发了社区疫情防控大数据

平台分析研判工具。

以百步亭大型社区为出发点,结合社

区需求,完成9个社区2轮连续三天的居

民零度电量的实住率筛查,并以“长期未

住人”、“动态空置房”、“异动隔离户’’

为重要分析防疫场景,采用4套算法模型

扩大数据分析效能,高效协助政府街道社

区疫情防控排查工作。

在创武汉“无疫情小区”期间,该工

作团队从超50万条次的大数据中,为百步

亭社区约4.8万户居民中精准提取了 5170

户的“长期未住人”等大数据,助力百步

亭社区在3月5 R成功实现五类防控“清

零,,〇

m

诊、

m

m

m

密切接触人

tA

等>

m

(入

l

!

f

的流动怙况,女捋服务疫怙态势研判.

&怙防拧部

X

以汝付流动人(4的监测统

"0

2020年1月底,在湖北省人民政府新

闻发布会上,武汉市长表示,因疫情和春

运影响,致500万人离开武汉。“ 500万

人去哪儿了? ”成为公众迫切想知道的答

案。百度地图慧眼的迁徙大数据显示,1

月10 H至22 H春运期间(武汉封城之前),

每天从武汉出发的人群中有六至七成的人

前往了湖北省内的其他城市,其次是河南

省、湖南省、安徽省、重庆市、江西省。

百度地图发挥AI优势、数据优势,

在疫情期间上线“发热门诊地图”、“肺

炎疫情期出行管控消息速报”、“武汉游

客指定酒店”专题等,并全面开放百度地

图迁徙大数据平台,为公众、媒体、政府、

科研及时了解疫情防控现状、掌握各地出

行路线封堵情况,提供全面、立体的大数

据服务。

根据航班管家统计的12月30日至1

月22日武汉航班国内出发、国际出发、

港澳台出发的运力数据,北京、广州、成

者丨5、海口、昆明、厦门、深圳、上海、三亚、

南宁是武汉出港航班前十大城市。

广西壮族自治区大数据局第一时间赴

区卫健委对接数据需求,归集公安厅、教

育厅、交通厅、住建厅等14个单位相关

数据,运用大数据技术综合统计分析,基

本掌握病源地人员进入广西的相关数据,

16

封面文章

大数据支撑密切接触查询

与流行传染病患者密切接触的人,自

身被感染的风险更高,且有可能进一步传

染他人。因此,追踪并观察这些密切接触

者有助于这些高危人群第一时间得到护理

和治疗,并防止病毒进一步扩展,这也是

流行病控制的关键。

从数据本质上看,接触者识别本质上

是寻找和感染者时间、空间上有重叠的人

群。在当前信息社会,通过基站数据(运

营商)、支付数据(银联&第三方支付机

构)、出行数据(铁路&飞机&住宿)、

城市公共安全视频监控系统等可以建立大

数据融合平台,通过数据融合与深度挖掘

进一步实现人员的追踪。

一些地方利用智慧城市平台相关数

据,并结合手机信令数据,帮助追踪确认

患者的移动轨迹和人群接触史,推动建立

个体关系图谱,帮助精准定位疫情传播路

径,锁定感染源及密切接触人群,为疫情

防控提供宝贵信息。

国务院办公厅电子政务办公室、国家

卫健委与中国电科联合开发了“密切接触

者测量仪” APP,通过深度共享卫健委、

交通部、铁路总公司、民航局的权威数据

资源,提供准确查询。通过扫描二维码将

密切接触者查询软件下载到手机上,普通

公众通过输入个人信息就可以查询自己是

否为新冠肺炎病人密切接触者。截至2月

20日,累计查询超过1.5亿人次,自我发

现的新冠肺炎病人密切接触者超过9万人。

12306利用实名制售票大数据优势,

及时配合地方政府及各级防控机构提供确

诊病人车上密切接触者信息。列车上如出

现确诊或疑似旅客,会调取旅客相关信息,

包括车次、车厢等,然后提供给相关防疫

部门进行后续处理。多地电信运营商通过

轨迹追踪,明确在确诊患者活动范围出现

过的人员,帮助准确锁定密切接触者。多

家互联网平台企业制作了“确诊患者同行

程查询工具”,用户输入日期、车次和地

区等信息,就可以确认自己是否曾与已披

露的确诊患者同行。

大数据支撑流行病学追踪

温州市利用数据平台可以快速追寻与

确诊病例有密切接触的人员,并通知到位。

2月1日,得知梧田街道龙霞南路小敏粉

大数据的应用领域无限广阔。摄影/费锋

17

-

封面文章

干店老板父子确诊新冠肺炎的消息后,温

口流动、感染人群发生数据和行为轨迹数

州市瓯海区梧田街道连夜成立处置工作专

据,建立疫情传播扩散模型,实时预判疫

班,在上级部门及时协调下,通过三大运

情发展趋势和受控概率,及时推动预警提

营商数据比对,发现15天内有3615人曾

示信息,为相关决策提供参考。北京全面

在粉干店附近活动过。基于此,迅速安排

停止省际公路交通的决定即建立在大数据

工作人员逐一电话联系排查;通过监控系

分析之上。

统逐一比对,最终准确锁定255名密切接

贵州省科技厅成立了疫情研判专家

触者,其中包括40名曾进入过粉干店的

组,每天组织流行病统计、病原生物、数

人员,并及时采取了隔离观察措施。一场

据分析等方面的专家,集中“坐镇”。截

可能扩散的疫情,得到及时控制。

至2月20日,专家组已向省政府分管领

云南省应对疫情工作领导小组指挥部

导提交38份分析研判报告。一开始,贵

要求,充分利用大数据手段,加强疫情溯

州在疫情地图上呈现低于100例确诊病例。

源种监测,公民出入公共场所、乘坐公共

但专家组提前五天就给出了“神预判”:

交通工具等须扫码出入,协助掌握公共场

2月9日,贵州确诊病例将超100例。果然,

所人员流动情况。例如:2月20日,云南

五天后应验。“神判断”正是基于对疫情

省新增确诊病例1例。云南省公安厅迅速

势态的预判、对传播途径的研究,专家组

从数据中分析得知,这位患者此前曾到过

还提出了针对性的防控建议,如对重点人

一个农贸市场和一所医院,在农贸市场和

群全面排查、对社区和乡镇严防死守等。

41个人有过接触,在医院与260人可能有

贵州后来采取的一些防控措施,都与专家

过接触。大约1分钟就分析出准确数据,

组当初的建议不谋而合。

并在第一时间提供给了疫情防控指挥部。

找出这些接触者后,指挥部及时通过短信、

大数据助力

CT

影像

AI

筛查并加速研发疫苗

电话等方式,提示他们关注自身身体状况,

随着临床诊断数据的积累,新冠肺炎

及时居家隔离或到定点医院就诊,尽最大

的影像学大数据特征逐渐清晰,CT影像

可能减少交叉传播。

诊断结果变得愈发重要。根据国家卫健委

在北京、大连等地的二次疫情中,

公布的诊疗方案第五版,临床诊断无需依

地方政府均借助手机信令数据、公安大数

赖核酸检测结果,CT影像临床诊断结果

据等开展大规模人群筛查,进行人流的轨

可作为新冠肺炎病例判断的标准。一位新

迹追踪和疫情溯源分析,并将排查出的密

冠肺炎病人的CT影像大概在300张左右,

切接触者全部集中隔离并进行核酸检测,

这给医生临床诊断带来巨大压力。医生对

避免了疫情的进一步扩散。此外,北京之

一个病例的CT影像肉眼分析耗时大约为

所以能在极短的时间内将第二波疫情控制

5—15分钟。2月16日起,在河南郑州小

住,还在于借助大数据技术对疫情区域做

汤山启用的阿里达摩院的最新AI算法诊

了精准分级,以街道为单位划分风险等级,

断技术可在20秒内对新冠疑似案例CT影

进行分级管控,并根据疫情的发展动态调

像做出判读,分析结果准确率达到96%的

整风险等级,没有搞“一刀切”封城,为

水准。除了阿里达摩院,中山大学孙逸仙

常态化疫情防控工作树立了一个很好的样

纪念医院也开发了基于胸片和胸部CT的

本,对于超大城市的应急管理具有探索性

新型冠状病毒肺炎AI筛查和辅助诊断系

意义。

统,20秒完成CT诊断,准确率90%以上。

大数据辅助疫情防控决策

对于疫苗研制,清华大学药学院的人

工智能药物研发和大数据分享平台涵盖了

部分政府、机构根据历史种现有的人

既往冠状病毒相关研究中设计的900多个

18

小分子在不同阶段的相关实验信息等,有

数据中心、上海市中小微企业政策性融资

助于加快药物的筛选过程。

担保基金管理中心(以下筒称市担保中心)

大数据助力复工复产

与建设银行上海市分行、上海银行等15

家银行签署协议,共同发布“大数据普惠

防疫健康码(简称“健康码”)是

金融担保合作方案”,通过“大数据+担

新冠疫情防控背景下出现的一种基于互联

保+银行’的模式,支持银行扩大信贷投放,

网、大数据等技术的新型应用。健康码包

帮助中小企业复工复产。银行在企业授权

含数据统计分析、人员流动监测等多方面

后,通过市大数据中心的大数据普惠金融

功能,在平衡疫情防控和企业复工关系方

应用获取公共数据,经过运用金融科技手

面发挥了巨大作用。自2月7日“余杭绿

段综合评价后形成拟授信客户名单,再由

码”上线起,短短两周时间就有超过200

市担保基金对名单中客户予以担保,支持

个城市上线了“健康码”。在国务院办公

银行加大信贷投放,特别是重点支持前期

厅电子政务办的指导下,基于全国一体化

经营正常而受疫情影响遇到暂时困难的中

政务服务平台,全国版的健康码也已宣布

小微企业。数据涵盖银行比较关心的社保、

上线。总体来看,“健康码”是大数据思维、

公积金、纳税,高新技术企业认定等等,

大数据技术在应急管理领域的生动运用,

只要企业授权,银行就可以获得这些数据,

是一种具有原始创新性的数字化治理新机

银行拿到数据以后给企业做一个画像,企

制,对推进国家治理体系和治理能力现代

业不需要抵押就可以获得融资服务。

化具有重要力作用。

三家通信运营商根据疫情防控的需

大数据应用即将成为"上帝视角”

要,在得到用户授权的情况下,基于电信

本次新冠疫情,我国实施了联防联控

大数据分析,向用户提供本人“ 14天内到

的防控措施。政府在对这场突发公共疫情

访地查询”服务。凭该服务可以帮助有关

的危机管理中应用大数据以及时启动疫情

部门提高对流动人员行程查验的效率,对

防控机制、实现多元主体联防联控、有效

重点人群进行排查,实施精准防控,特别

监督官员执政行为和精准定位潜在感染人

是有助于做好当前形势下的复工复产。借

员。在疫情防控过程里,各级政府依托信

助查询短信,手机用户在被问到有关行程

息技术创新治理模式、重构治理流程,同

问题时,可向用工单位、社区管理等部门

时促进了通信、交通、卫健、公安、社区

证明自己的行程。

等多个系统的数据对接,为提升治理能力

大数据模型为政府决策复工复产提供

形成了很多好的经验。

科学参考。深圳大学发布《新冠肺炎疫情

当然,由于新冠疫情突发,大数据应

防控时空分析研究报告》,依据大数据对

用也是颇有点“赶鸭子上架”的味道。上

全市复工与错峰管控,进行疫情传播状况

述罗列的只是部分地区某些维度上做得比

的模拟。基于深圳公交系统出行数据、手

较出彩的大数据抗疫应用案例。在实际应

机数据,考虑深圳市人口密度、人群流动、

用过程里仍存在对大数据技术的适应性不

新冠情况等数据参数,以SEIR/SIR传染

足、各部门间数据共享未成体系等问题。

病模型为基础,模拟新型冠状病毒传播路

例如大数据应用和智慧城市体系主要集中

径。测算出复工比例为60%时,疫情传播

在省市一级层面,大部分能够覆盖到市区

风险率相对较低。为政府安排复工复产提 一级,先进地区已经到县区一级,到乡镇

供决策支持。街道一层基本很少了,到社区基本就各自

上海推行“大数据+担保+银行”信

为战,信息化手段较为缺失,主要靠人海

贷模式,助中小企业复工复产。上海市大

战术、传统手段。缺乏顶层设计和联动机

.

19

.

封面文章

制。大数据种信息化还未形成部门种街道

需要以政府的权威种信用来背书,民众才

以及社区居民的联动机制。

能将个人隐私信息放心托付。我国政府对

今后必然的趋势肯定会是在顶层设计

保护公民个人隐私种数据安全高度重视,

的统一规划下进一步促进大数据在政府部

2020年2月,国家互联网信息办公室就

门间开放共享,完成全社会各省全部人口

下发了《关于做好个人信息保护利用大数

的数据全量对接,以促进大数据技术更高

据支撑联防联控工作的通知》,4月国家

效地服务于政府治理以应对新危机种新挑

市场监管总局(国家标准委)又发布《个

战。基于我国的集约化一体式行政体制,

人健康信息码》的三项国家标准,用以规

今后必将会建立健全大数据辅助科学决策

范健康码的码制、展现方式和数据内容,

手P社会治理的机制,推进政府管理和社会

同时充分考虑了个人隐私种敏感信息的保

治理模式创新,实现政府决策科学化、社

护,对个人健康信息的采集、加工种利用

会治理精准化、公共服务高效化。

等各个环节进行了规范。健康码数据由相

大数据应用与个人隐私保护^然是天平的两端

关部门掌握,并严格按照个人信息保护有

关规定,做好个人信息保护和数据安全工

将来变成“上帝视角”的大数据应用

作,防范数据泄露,禁止第三方平台留存

难免会让个人隐私保护成为人人焦虑的话

用户数据。这些都为筑牢数据安全的藩篱

题。鱼与熊掌,如何兼得?

起到了积极作用。

在当前疫情防控形势下,因防疫而进

然而,当前在泛化的大数据立法方面

行个人信息搜集虽然对于控制疫情成效显

存在四大挑战:即个人数据保护、政府数

著,但同时人们对于数据安全和公民个人

据开放、数据流通与交易、数据跨境流动。

隐私保护也会产生焦虑。保护公民个人隐

应加快推进我国的大数据立法,应该

私和数据安全在大数据时代尤为重要。例

坚持安全与发展并重、促进与规范并举的

如对于防疫类大数据,数据使用方必须要

原则,重点促进网络基础设施的发展;加

加强对公民个人隐私的保护,保证防疫大

强网络安全与隐私保护;开放数据资源,

数据的安全。防疫大数据不同于普通数据,

加强政府和公共部门的数据开放;针对数

大数据应用成就未来。摄影/江伟

20

封面文章

据的收集、存储和使用等全环节建立数据

安全与保护的规则;明确大数据生态中各

不同主体的责任。

当前,数据管理过程中还未有效建立

数据权限种数据保密级别体系。在“党管

数据”的核心思想指导下,应尽快建立健

全数据管理和监管体系。明确数据权限和

数据密级,在顶层设计体系架构中,与数

据应用相结合,同时做到数据安全不泄露,

不侵犯隐私,不违法等原则性问题,重点

还要高度站位国家数据主权安全。

治理大数据资源的社会敏感度和影响

力甚至匹敌枪械武器管理。以法治理“大

数据”这样的社会新生事物,肯定是方向。

个人隐私保护也要依靠技术实现事前防御

如果说通过法律治理是用事后惩戒的

威慑力来保护个人隐私,那么事前防御就

需要技术手段。

当前的技术解决思路基本是将数据的

关键信息存储在利用区块链技术搭建的相

关平台上,再使用各类隐私计算技术来对

这些数据进行分析,既可以对数据的私密

性进行保护,又可以安全共享。隐私计算

主要解决如何在数据受保护情况下进行分

析处理的问题,简单来讲就是“数据可用

不可见”。隐私计算(也称为“联邦学习”)

是能帮助不同机构在满足用户隐私保护、

数据安全和政府法规的要求下,进行数据

联合使用和建模。

新M疫情如同一场大地震改变f地

貌,如雷震天,ih火山喷发,助推大数据

应用即将成为“±帝视ff]”。这在疫情时

期会是大幸,而在疫情之后这样的“上帝

视角” tk"f能会走向极端,令社会所ff公

忧个体的自山权益。阚而需要在

查中实施了“差分隐私”的尖端技术。这

种做法故意将干扰信息或随机变量等“噪

声”加入系统中,同时基于数学工具使得

这样的数据在统计结果上没有出现偏离。

其好处就是:想要揭秘数据库的人只靠人

口普查数据无法获取详细的个人记录。

例如,微软也有一个地图项目应用到

了差分隐私,具体做法是把地图分为多个

区域,然后给用户具体的GPS定位做了漂

移。在一些场景下,APP运营商并不需要

知道人们的具体位置,可能大概知道某个

街道位置,不一定非要定位到具体是哪栋

楼。如果微软的差分隐私方法得到普及,

以后就可以在手机层面安装类似的工具接

口。APP运言商如要调用位置信息,只会

得到一个经过差分隐私处理的模糊位置。

当然在关乎公共利益的用途时,国家有关

部门还是可以调用真实信息。

同态加密是指满足密文同态运算性质

的加密算法,即数据经过同态加密之后,

对密文进行特定的计算,得到的密文计算

结果在进行对应的同态解密后的明文等同

于对明文数据直接进行相同的计算,实现

数据的“可算不可见”。

安全多方计算是指在无可信第三方的

情况下,多个参与方协同计算一个约定的

函数,并且保证每一方仅获取自己的计算

结果,无法通过计算过程中的交互数据推

测出其他任意一方的输入和输出数据(除

非函数本身可以由自己的输入推测出其他

参与方的输入和输出)。

上述诸多理论与技术方法其实本质上

都是工具,是双刃利器,归根结底要靠人

来使用。尽可能地让科学技术助善,让大

多数人受益,这需要政治家的智慧。

新冠疫情如同一场大地震改变了地

貌,如雷震天,让火山喷发,助推大数据

应用即将成为“上帝视角”。这在疫情时

期会是大幸,而在疫情之后这样的“上帝

视角”也可能会走向极端,令社会所有公

民疑虑担忧个体的自由权益。因而需要在

顶层设计时审慎权衡与把握。♦

m层设计时审慎权衡与把m。

现在主流用于机器学习的隐私计算方

法主要有三种:差分隐私、同态加密、安

全多方计算。

例如,美国在2020年下半年人口普

•21

本文标签: 数据疫情防控政府分析