首页大数据
美疫情数据统计告诉你,全球公众目光为何聚焦德克里克堡军事生化武器研究基地?数据无对错,存在就有价值!
发布时间:2020-03-29编辑:admin来源:首页资讯

约翰·霍普金斯大学全球疫情数据看板显示,截止到2020年3月29日20时,全球新冠肺炎确诊病例达679977例。其中,美国确诊病例124686例,意大利确诊病例92472例,确诊病例数均超过中国;另有西班牙、德国、伊朗、法国、英国、瑞士、比利时等7个国家确诊病例过万。

美疫情数据统计告诉你,全球公众目光为何聚焦德克里克堡军事生化武器研究基地?数据无对错,存在就有价值!图片来源:网络

新冠肺炎疫情的主场已经毫无异议的转到美国、欧洲为中心。尤其是美国,我们看到约翰·霍普金斯大学的全球疫情数据展板上确诊病例相对均匀的散布在美国地图上,如果特朗普政府不进行强力控制,接下去这意味着什么,大家都能明白。

美疫情数据统计告诉你,全球公众目光为何聚焦德克里克堡军事生化武器研究基地?数据无对错,存在就有价值!图片来源:网络

而透过美国各州的数据进一步按照人口密度和区域面积来分析的话,可以发现美国患病比率最高的区域并不是确诊病例数量最多的纽约,而是马里兰州!

俄塔斯社3月25日报道,目前该州共对382名疑似患者进行了检测,阳性人数288人,阳性率75%。紧邻马里兰州的特拉华州检测了104人,阳性68人,阳性比例65%。距离马里兰州不远的新泽西州检测了3297人,阳性2844人,阳性率86%。

为什么马里兰州以及周边的几个州的阳性率远远超出了美方的平均水平?据悉,美军德特里克堡生物实验室在马里兰州,该实验室是美陆军最大的传染病研究实验室。2019年7月,美国紧急关闭了该实验室,所有基地内的工作人员全部接受全面的检测,美CDC在6月份对这个基地进行了审查,以不符合生物安全标准为由要求美军关闭这个实验室。

美疫情数据统计告诉你,全球公众目光为何聚焦德克里克堡军事生化武器研究基地?数据无对错,存在就有价值!图片来源:网络

近日,三名美国记者和一名加拿大记者表示,他们追踪到了全球新冠疫情的零号病人。种种证据都指向了德特里克堡美军生物实验基地的一名研究员的亲戚Maatje Benassi,她是一名自行车运动员,同时也是美军军官,曾经参加了2019年10月份的武汉军运会。而她的一个亲戚也是荷兰的首个确诊患者。同时Maatje Benassi的身份可能还比较特殊,因为她能够直接见到北约军队的总司令。

人可以说谎,但是数据不会!

我想,应该可以理解为什么大家一直盯着要求特朗普政府公布为什么要关闭位于马里兰州的德克里克堡军事生化武器研究基地,并且高度质疑新冠疫情的传播在马里兰州要早于武汉。

近段时间,我每天基本上不太关注中国的疫情数据了。经过两个多月的全国一体化作战,中国已经拥有了相对成型的防控体系和措施,初期确诊的患者正陆续康复,新增病例仅仅零星状出现,疫情防控重点已经从国内排查监测收治转移到防止境外输入风险以及入境人员的隔离观察和确诊收治,同时正在积极推动全面复工复产。

但是,我密切关注着约翰·霍普金斯大学系统科学与工程中心的团队建立的全球疫情数据。尽管我们都通过各种渠道的数据来了解疫情每天的进展,数据也成为防控和百姓了解疫情必要的不可或缺的主要信息,但这些数据的真实性和准确性却遭受了很多人的质疑,这一点大家应该都有感触,例如我们对于武汉初期发布数据与实际情况不符,以及今天对伊朗发布数据严重低于该国实际疫情情况的质疑。

疫情防控的数据统计,事实上需要历经数日的时间,而且数据的来源都要经历排查、疑似、检测、确诊、医院、区域、全国,再到公开的过程,任何一个过程的差错都会造成数据的不准确。即便没有数据造假的动机,也不能完全相信其真实性。但是,统计本身研究的是趋势,即使数据并不同步准确,也依然可以透过它们分析出一些规律。那么现在来看欧洲、美洲,大家对这些已经发布数据的看法和期望也就心里有数了。

疫情防控数据集中反映的问题是欠缺真实、准确、及时的数据,比如由于数据采集不规范、数据不精准、标准不统一、报送不及时、多头要报表、统计口径经常调整,甚至还有官员干扰等问题,使得通过数据分析来“放大”背后的问题、成因以达到发现问题变得困难重重,数据洞察的作用很难奏效。

数据没有对错之分,那是人为的定义,数据能够存在并且能够被收集,就说明它是自然的、中性的、有价值的,我们应该尊重它们。只是数据分析不能仅靠简单地加减乘除和基础的统计便了结,而是要回溯数据收集过程的复杂机理,这就是为什么有业务经验和实践悟性的大数据人才在数据分析中会变得越发重要的原因,这种实践能力会让我们识别数据中隐藏的规律和问题,知道这种数据是如何存在的,它是否能够真正反应问题。这需要反复甄别、多次讨论,而非直接投入各种复杂的“算法”。

当然,实际的数据采集和应用工作中,无论付出多少代价,这种问题将永远存在,只是程度轻重不同而已。大数据从业者真正要面对的也恰恰是这种情况下,如何提升数据收集和数据洞察的抗干扰能力,如何排除数据生产过程杂音的业务素养。数据分析不能只是针对高质量的结构化数据,对于复杂的大量的非结构化数据、充斥着错误和假象的部分结构化数据,如何识别、如何分析和利用不同的工具,也就成为从业者必备的重要能力。

本文作者:江青,中南财经政法大学MBA合作导师、中国(西安)丝绸之路研究院一带一路大数据中心研究员、首页大数据(CSISC大数据研究实验室)创始人。


首页大数据(CSISC大数据研究实验室)是一家长期开展大数据应用研究的专业公司,以成为“领导者管理工具”为企业发展目标,致力于为政府、企业用户提供优秀的整合数据服务和专业的数字化解决方案,以大规模数据处理、数据采集生产、数据建模预测、数据统计分析与数据可视化一体的专业信息整合与AI平台建设解决方案,推动治理的数字化进程。服务咨询:010-63870318