文章详情

数据分析在下一波新冠大流行中有哪些作用

2020-11-25

点击量:

  数据分析在下一波新冠大流行中有哪些作用?在短短的几个月内,新型冠状病毒COVID-19流行病就已经颠覆了整个世界。在短期内,国家和区域的应对措施包括通过隔离和限制行动来遏制。正确实施这些解决方案旨在限制传染病的蔓延,以免使我们全球医疗保健和应急管理系统的紧张资源和能力不堪重负。但是,考虑到这些措施的严重经济副作用,世界各地的当局已经在计划放宽限制行动,以期预期到价差下降。

数据分析
 

  数据和分析在全球响应的第一波中发挥了核心作用。从大流行的最早时期开始,我们就收到了世界各地勤奋的志愿者收集的最新病例,死亡和康复报告。国内的各个平台创建了流行的仪表板,该仪表板从全球众多来源收集这些数据。平台上拥有最新的病例感染计数,并且其他一些来源也涌现出类似的信息。包括腾讯在内的商业组织已经提供了工具和数据,以帮助向公众宣传。
 

  此外,对病毒本身的系统发育也进行了更深入的数据驱动的研究-中国到目前为止提供了有关最新病毒株的最新摘要,由全世界的病毒学家自行报告。
 

  然而,即使在第一次全球性疫情得到遏制之后,仍需要持续应对以对抗新型冠状病毒COVID-19,并将继续给地方和地区当局带来巨大负担。例如,季节性高峰或区域性暴发可能需要尽快恢复行动限制。同样的限制保持多久也同样重要-需要对此进行调整,以防止经济遭受反复冲击。

 

数据分析

 ‍

  这导致了数据和分析方面的许多相关需求。在中国,联合了多个部门包括三大运营商在内的许多合作伙伴进行了合作,以收集相关数据来满足这些需求:合并包括来自合作伙伴的匿名手机位置数据在内的合作伙伴数据集,并公开进行有关行政边界和人口统计信息的可用地理数据集。我们的目标是为中央和地方当局以及决策者提供多角度的工具,以协助持续对抗新型冠状病毒COVID-19。这涵盖了几个领域,我们将在下面说明三个领域:
 

  交互式的人口规模联系人跟踪功能
 

  首先,接触者追踪已成为一种数据驱动的方法,用于识别和遏制新型冠状病毒COVID-19(和其他疾病)的传播。接触者跟踪从根本上涉及跟踪被感染个体的活动和互动,以识别其他处于危险中的人。新加坡政府建立了一个鼓励人们选择参与的应用程序,在美国,苹果和谷歌采取了前所未有的步骤,共同致力于开发一种可以同时保护人们健康和隐私的解决方案。但是,无论用于收集跟踪数据的技术是什么(在撰写本文时),全球近200万感染(估计R0在2-3之间),使用该数据包含传播都是一项艰巨的任务。

  ‍

数据分析
 

  第一步,当局需要详尽而全面的联系追踪功能,最好是在最有能力立即采取行动的地方和区域人群中。但是,他们还需要考虑出行方式,这要求他们特别关注主要入境口岸,例如港口,机场和边境地区。在此特别重要的是,需要尽快从数据中显示的较高级别的汇总模式或趋势转变为较低级别的生活模式。识别和隔离特定个体(及其主要社会单位,即其家庭)的能力,以及了解更广泛的互动方式的能力,将使行动限制在2020年大流行的不可避免的后续阶段中更有针对性和更有效到明年。

  ‍

  为了说明这种类型的可伸缩联系人跟踪,我们将X-Mode Social的数据与OmniSci Immerse中的时空队列分析功能进行了组合。我们从X-Mode合作伙伴的生活模式数据集中获取了将近1600亿个原始地理位置数据点,历时一个多月,涉及约500万台设备。我们通过匿名设备标识符对此进行汇总,以计算时空仓中的停留时间,这使我们能够观察特定设备,更重要的是(对于公共机构)不同设备群体的生活细粒度模式。例如,“ 3月5日下午5点在肯尼迪国际机场观察到的所有设备”。另一个可能是“在已知有大量新型冠状病毒COVID-19患者大量涌入的医院附近观察到的所有设备”。一旦确定了队列,卫生部门就可以有针对性地监控该队列。

  ‍

  下面是此分析工作流程的说明:
 

  此示例显示了在疫情爆发初期位于意大利北部的移动设备群组的交互式建筑。仪表板放大到意大利,时间过滤到三月初,然后使用套索仅抓住意大利北部的相关区域。
 

  监控行动限制的有效性
 

  到目前为止,强制性和自愿性的社会隔离已被证明是有效的,但是很明显,任何潜在的因素都可能导致这种有效性沿地理和时间维度变化。首先,当局需要迅速了解有关检疫和社会隔离的地方和区域法令是否确实有效,并采取相应行动。例如,一种简单的指导措施可能是-感兴趣区域(县或街区组)中的平均人口实际旅行比例是多少,超过其本国街区组的给定距离?反过来又如何将其传播的可能性考虑在内(以人口密度和基线病例数衡量)?“有效”社会距离较低的地区(例如城市)是否总是面临更大的传染风险?反过来,

  ‍

  要回答这些问题(和其他问题),需要将人口统计数据与运动数据集成在一起,并能够在多个地理和时间聚合级别上查看此数据。这是一个示例,说明了我们如何整合位置信息并计算停留时间的其他统计信息,以说明由于实施了行动限制,在全国大部分地区花费的平均时间如何增加,而平均行进距离如何减少。您会注意到,某些地区限制行动的速度比其他地区要慢,这可能会使决策者为病毒在这些地区的更快传播做好准备。

  ‍

  该仪表板显示了移动设备在社区级别的汇总停留时间,以确定社区集体远离社会并限制其移动的程度。绿色表示更长的停留时间,这意味着存在更多的社交距离。

  ‍

  各个级别的医疗系统的最新视图
 

  最后,在任何时间范围内,医疗保健系统的总体状态(和承载能力)将是做出响应的主要因素。看到一线医院工作人员的英雄气概令人振奋。尤其是当您考虑到其中一些人的人数是普通人员的十倍时,这是由于医护人员令人心碎的高感染率。该系统不堪重负。为避免这种情况,当局需要开发详细,更新的图片,结合有关公共卫生的后勤信息和背景数据,以及有关新型冠状病毒COVID-19本身如何对整个公共卫生产生影响的统计数据-这方面的一个很好的例子是Kevin Systrom对调查中
 

  实时
 

  这涉及整合多个数据透视图-有关医疗机构的后勤信息部分可公开获得。关于慢性病(及其与急性呼吸窘迫综合征的合并症)患病率的历史数据也是如此(由新型冠状病毒COVID-19产生)以及当地和区域人口,以及相关的人口统计数据。
 

  结论思想

  新型冠状病毒COVID-19对于我们将我们在较不紧张的时期内构建的工具应用于紧急的,迅速发展的和存在的,非常重要的公共卫生需求的能力构成了迄今为止最大的考验。OmniSci致力于在这方面我们可以做的一切,但这不是我们可以合理地希望单独做的事情。

  ‍

  我们首先要感谢我们的第一响应者和医疗第一线工作人员-他们是这场战斗中的士兵,并将在可预见的将来继续前进,我们要感谢他们使他们的工作尽可能地容易。接下来,我们不断增长的新的和长期的合作伙伴名单,他们愿意作出贡献的数据,计算资源,并努力:X模式,SafeGraph,Veraset,xCures和亚马逊网络

长按识别二维码,加关注
↓ ↓ ↓ 继续阅读与本文标签相同的文章
数据分析