CN113312915A - 一种智能流行病学调查*** - Google Patents

一种智能流行病学调查*** Download PDF

Info

Publication number
CN113312915A
CN113312915A CN202110589720.6A CN202110589720A CN113312915A CN 113312915 A CN113312915 A CN 113312915A CN 202110589720 A CN202110589720 A CN 202110589720A CN 113312915 A CN113312915 A CN 113312915A
Authority
CN
China
Prior art keywords
intelligent
epidemiology
subsystem
information
suspected patient
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN202110589720.6A
Other languages
English (en)
Other versions
CN113312915B (zh
Inventor
李建欣
周号益
张帅
陈天宇
朱天晨
刘瀚骋
傅星珵
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Beihang University
Original Assignee
Beihang University
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Beihang University filed Critical Beihang University
Priority to CN202110589720.6A priority Critical patent/CN113312915B/zh
Publication of CN113312915A publication Critical patent/CN113312915A/zh
Application granted granted Critical
Publication of CN113312915B publication Critical patent/CN113312915B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/20Natural language analysis
    • G06F40/279Recognition of textual entities
    • G06F40/289Phrasal analysis, e.g. finite state techniques or chunking
    • G06F40/295Named entity recognition
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16HHEALTHCARE INFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR THE HANDLING OR PROCESSING OF MEDICAL OR HEALTHCARE DATA
    • G16H10/00ICT specially adapted for the handling or processing of patient-related medical or healthcare data
    • G16H10/20ICT specially adapted for the handling or processing of patient-related medical or healthcare data for electronic clinical trials or questionnaires
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16HHEALTHCARE INFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR THE HANDLING OR PROCESSING OF MEDICAL OR HEALTHCARE DATA
    • G16H50/00ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics
    • G16H50/80ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics for detecting, monitoring or modelling epidemics or pandemics, e.g. flu
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y02TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
    • Y02ATECHNOLOGIES FOR ADAPTATION TO CLIMATE CHANGE
    • Y02A90/00Technologies having an indirect contribution to adaptation to climate change
    • Y02A90/10Information and communication technologies [ICT] supporting adaptation to climate change, e.g. for weather forecasting or climate simulation

Landscapes

  • Engineering & Computer Science (AREA)
  • Health & Medical Sciences (AREA)
  • Public Health (AREA)
  • General Health & Medical Sciences (AREA)
  • Medical Informatics (AREA)
  • Epidemiology (AREA)
  • Primary Health Care (AREA)
  • Theoretical Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • Computational Linguistics (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Physics & Mathematics (AREA)
  • Artificial Intelligence (AREA)
  • Biomedical Technology (AREA)
  • Data Mining & Analysis (AREA)
  • Databases & Information Systems (AREA)
  • Pathology (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)
  • Medical Treatment And Welfare Office Work (AREA)

Abstract

本发明通过信息技术领域的方法,实现了一种智能流行病学调查***,***由智能流行病学前端交互子***、智能流行病学模型推断子***和智能流行病学图数据库存储子***三个部分组成。其中智能流行病学前端交互子***主要负责流调人员对流调事件进行修改和***,以及流调时空的同步可视化;智能流行病学模型推断子***采用了多语言MBERT预训练模型,是一项已经成熟的技术,使用预训练模型对文本的实体进行推断,最终将推断结果存储到智能流行病学图数据库存储子***中。本发明所述***实现了以较高的效率从流调采访文本或者问卷中自动抽取关键事件地点人物信息,并且加快流调速度的技术效果。

Description

一种智能流行病学调查***
技术领域
本发明涉及信息技术和人工交互领域,尤其涉及一种智能流行病学调查***。
背景技术
流行病学调查,简称流调,是指用流行病学的方法进行的调查研究。主要用于研究疾病、健康和卫生时间的分布及其决定因素。通过这些研究将提出合理的预防保健对策和健康服务措施,并评价这些对策和措施的效果。
传统的流行病学调查方法包括问卷调查,面对面采访等,其主要目的是了解疫情流行情况,调查疫情来源等。以新冠疫情流行病学调查为例,流行病学调查的任务是调查病例的发病和就诊情况、临床特征、危险因素和暴露史;发现和管理密切接触者,防范新型冠状病毒肺炎疫情的蔓延和传播。这些传统的方法比较简单,往往需要从大量的文本记录信息中整理出事件的时间轴和患者经过的空间区域信息,很容意发生错误和遗漏,而且人力成本很高。
在流调实际操作的过程中,调查人员往往还需要地图工具的辅助,不同的地图标准也容易带来流调信息的误差和不确定,会对定位患者的信息造成误导。
发明内容
为此,本发明首先提出一种智能流行病学调查***,***包括三个部分:智能流行病学前端交互子***、智能流行病学模型推断子***和智能流行病学图数据库存储子***:
(1)所述智能流行病学前端交互子***用于流调人员对流调事件进行修改和***,包括流调信息填报页面和流调信息展示页面两个部分,其中流调信息填报页面通过表单组件输入被调查者的基本信息和行程信息,并通过地图组件在输入地点和行程的同时,在地图组件上同步显示事件的位置;
所述表单组件采用开源的Ant Design设计框架,所述地图组件使用高德地图的SDK服务。
(2)所述智能流行病学模型推断子***用于抽取流调文本中疑似患者的行程轨迹信息。采用多语言MBERT预训练模型,使用预训练方法对文本的实体进行推断,最终将推断结果存储到图数据库***中,所述模型推断***包括编码器和解码器两个部分,其中编码器采用了MBERT架构,而解码器使用了标准的NER解码器;
所述MBERT架构采用12层transformer层堆叠而成的模型架构,输入的文本首先经过词表映射,生成词向量、位置嵌入矩阵和文段分割嵌入矩阵,经过多层Transformer结构的变换后,最终得到每个位置上的语境化向量表示,每个基本的Transformer单元中最核心的部分是全连接多头自注意力机制,Transformer的结构会堆叠多层,其公式表示为:
H0=E+P+S
Hl=TransformerBlock(Hl-1),l∈[1,L]
Figure BDA0003088923180000021
其中Hl表示第1层transformer输出的隐状态,E表示词向量,P表示位置嵌入矩阵,S表示文段分割嵌入矩阵,L表示最大层数。
所述最大层数为12。
所述预训练方法首先在大规模语料集上进行预训练,之后在OntoNotes 5数据集上进行名称实体识别微调,微调后的参数将直接用于生成语境化的词向量。
所述解码器使用标准的NER架构,将编码器生成的词向量进行线性变换,得到最终对于每一个词元的推断结果,被推断为实体的词元将从文本中被抽离出来,从而形成目标事件的关键信息。
(3)所述智能流行病学图数据库存储子***用于高效存取疑似患者及其密接者的轨迹信息和时空关联关系,其对于流调过程中的各个事件建模为时间,地点,人物的三元组,形成三个节点和两条边,同一个被调查者的多个事件可以围绕该调查者作为中心节点生成一张子图。
所述节点为:疑似患者或地点或疑似患者密切接触者,所述边为交通方式或位置或接触关系。
本发明所要实现的技术效果在于:
1.提供了一种智能流行病学调查方法与装置,以解决现有流调方法中缺少地理空间信息指导,文本事件抽取效率低下、流调信息难以可视化等问题。
2.能够以较高的效率从流调采访文本或者问卷中自动抽取关键事件地点人物信息,并且提供良好的人机交互能力。
3.为流调工作提供更为友好的人机操作界面,融合地理位置信息,可以可视化地输入、编辑患者的行程轨迹,形成更为直观的流调路线。
4.具有良好的扩展性,可以支持大量操作平台,包括PC和平板、手机等;
5.发明具有重要的社会价值,对于重大公共卫生危机和流行疾病防范事业具有重要的效率提升作用。
附图说明
图1智能流行病学调查***总体图
具体实施方式
以下是本发明的优选实施例并结合附图,对本发明的技术方案作进一步的描述,但本发明并不限于此实施例。
本发明提出了一种智能流行病学调查***,分为三个部分,分别是智能流行病学前端交互子***,智能流行病学模型推断子***,智能流行病学图数据库存储子***。其中智能流行病学前端交互子***主要负责流调人员对流调事件进行修改和***,以及流调时空的同步可视化;智能流行病学模型推断子***采用了多语言MBERT预训练模型,是一项已经成熟的技术,使用预训练模型对文本的实体进行推断,最终将推断结果存储到智能流行病学图数据库存储子***中。
(1)智能流行病学前端交互子***
该子***主要包括流调信息填报页面和流调信息展示页面两个部分,其中流调信息填报页面允许用户输入被调查者的基本信息和行程信息。在输入地点和行程的同时,也会在地图组件上同步显示事件的位置,从而方便调查人员对被调查者的路径进行观察和分析。前端的表单组件采用了开源的Ant Design设计框架,而地图组件和服务则使用了高德地图的SDK服务。
(2)智能流行病学模型推断子***
该子***包括编码器和解码器两个部分,其中编码器采用了MBERT架构,而解码器使用了标准的NER解码器。
MBERT架构是一种由12层transformer层堆叠而成的模型架构,输入的文本首先经过词表映射,生成词向量、位置嵌入矩阵和文段分割嵌入矩阵。经过多层Transformer结构的变换后,最终得到每个位置上的语境化向量表示。每个基本的Transformer单元中最核心的部分是全连接多头自注意力机制,Transformer的结构会堆叠多层。可以将其抽象地形式化为:
H0=E+P+S
Hl=TransformerBlock(Hl-1),l∈[1,L]
Figure BDA0003088923180000041
其中Hl表示第l层transformer输出的隐状态,E表示词向量,P表示位置嵌入矩阵,S表示文段分割嵌入矩阵,L表示最大层数,本***取12。
MBERT首先在大规模语料集上进行预训练,之后在OntoNotes 5数据集上进行名称实体识别微调,微调后的参数将直接用于生成语境化的词向量。
解码器部分使用了标准的NER架构,即名称实体识别结构,将编码器生成的词向量进行线性变换,得到最终对于每一个词元的推断结果,被推断为实体的词元将从文本中被抽离出来,从而形成目标事件的关键信息。
(3)智能流行病学图数据库存储子***
流调数据中的各个事件具有高度的时空关联性,因而更适合使用图数据库来进行持久化存储和管理。对于流调过程中的各个事件,该子***将其建模为(时间,地点,人物)三元组,形成三个节点和两条边,其中的节点和边的类型如下:
类型 名称
节点 疑似患者
节点 地点
节点 疑似患者密接者
交通方式
位于
接触
同一个被调查者的多个事件可以围绕该调查者作为中心节点生成一张子图,从而方便流调人员对于传播途径和高风险地区进行快速分析。

Claims (3)

1.一种智能流行病学调查***,其特征在于:***包括三个部分:智能流行病学前端交互子***、智能流行病学模型推断子***和智能流行病学图数据库存储子***;
所述智能流行病学前端交互子***用于流调人员对流调事件进行修改和***,包括流调信息填报页面和流调信息展示页面两个部分。其中流调信息填报页面通过表单组件输入被调查者的基本信息和行程信息,并通过地图组件在输入地点和行程的同时,在地图组件上同步显示事件的位置;流调信息展示页面通过综合分析所有被调查者的移动轨迹与相应时间,集中展示所有被调查者共同暴露的时间与地点。
所述智能流行病学模型推断子***用于抽取流调文本中疑似患者的行程轨迹信息,包括疑似患者停留时刻,疑似患者停留地点等文本实体。其采用预训练语言模型,进行微调优化,来对文本的实体进行抽取,最终将抽取结果存储到图数据库***中。
所述智能流行病学图数据库存储子***用于高效存取疑似患者及其密接者的轨迹信息和时空关联关系。其对于流调过程中的各个事件建模为时间,地点,人物的三元组,形成三个节点和两条边,同一个被调查者的多个事件可以围绕该调查者作为中心节点生成一张子图。
在流调人员录入流调记录过程中,前端交互子***接受输入流调文本,交由模型推断子***对文本中的关键实体进行抽取,形成疑似患者的轨迹结构化数据。多个疑似患者数据依次存储到图数据库存储子***中,在图数据库子***中完成合并,形成时空关联关系,并完成数据持久化存储。
2.如权利要求1所述的一种智能流行病学调查***,其特征在于:所述文本中抽取的实体包括疑似患者移动过程中的时间点、疑似患者行程轨迹中的停留地点,疑似患者以及疑似患者密切接触者的人名等流行病学关键信息,所述图数据库***包括以图数据结构进行数据持久化存储的组件以及对应的操作接口。
3.如权利要求1所述的一种智能流行病学调查***,其特征在于:所述节点为:疑似患者或地点或疑似患者密切接触者,所述边为疑似患者移动轨迹中所采用的交通方式、疑似患者每次停留的位置或疑似患者之间的密切接触关系。
CN202110589720.6A 2021-05-28 2021-05-28 一种智能流行病学调查*** Active CN113312915B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202110589720.6A CN113312915B (zh) 2021-05-28 2021-05-28 一种智能流行病学调查***

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202110589720.6A CN113312915B (zh) 2021-05-28 2021-05-28 一种智能流行病学调查***

Publications (2)

Publication Number Publication Date
CN113312915A true CN113312915A (zh) 2021-08-27
CN113312915B CN113312915B (zh) 2022-08-30

Family

ID=77375937

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202110589720.6A Active CN113312915B (zh) 2021-05-28 2021-05-28 一种智能流行病学调查***

Country Status (1)

Country Link
CN (1) CN113312915B (zh)

Cited By (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113793694A (zh) * 2021-09-27 2021-12-14 辽宁金晟科技股份有限公司 一种标准化现场流调采集及实时研判***及方法
CN113889204A (zh) * 2021-09-10 2022-01-04 北京声智科技有限公司 同步流调的方法、装置、设备及存储介质
CN114693279A (zh) * 2022-05-30 2022-07-01 八爪鱼人工智能科技(常熟)有限公司 应用于疫情防控的信息管理方法及数字化设备
CN115083618A (zh) * 2022-05-18 2022-09-20 深圳大学 一种基于物联网的人工智能流行病学调查***及方法
CN117524505A (zh) * 2023-11-21 2024-02-06 四川省疾病预防控制中心 一种基于大数据的流行性疾病溯源方法

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102385667A (zh) * 2011-11-17 2012-03-21 杭州市疾病预防控制中心 现场流行病学智能调查***
US20190295725A1 (en) * 2018-03-23 2019-09-26 Donnie R. Morrow, JR. Patient Tracking and Diagnosis System of Transmissible Disease
CN111028955A (zh) * 2020-03-11 2020-04-17 智博云信息科技(广州)有限公司 一种疫情区域的展示方法及***
CN112464667A (zh) * 2020-11-18 2021-03-09 北京华彬立成科技有限公司 文本的实体识别方法、装置、电子设备和存储介质
CN112786210A (zh) * 2021-01-15 2021-05-11 华南师范大学 一种疫情传播追踪方法及***

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102385667A (zh) * 2011-11-17 2012-03-21 杭州市疾病预防控制中心 现场流行病学智能调查***
US20190295725A1 (en) * 2018-03-23 2019-09-26 Donnie R. Morrow, JR. Patient Tracking and Diagnosis System of Transmissible Disease
CN111028955A (zh) * 2020-03-11 2020-04-17 智博云信息科技(广州)有限公司 一种疫情区域的展示方法及***
CN112464667A (zh) * 2020-11-18 2021-03-09 北京华彬立成科技有限公司 文本的实体识别方法、装置、电子设备和存储介质
CN112786210A (zh) * 2021-01-15 2021-05-11 华南师范大学 一种疫情传播追踪方法及***

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
海南政务大数据: "《数字化流行病调查***》", 《HTTP://DSJ.HAINAN.GOV.CN/ZTZL/HNDSJCXYYDS/202009/T20200924_2856396.HTML》 *
王维笑 等: "《基于人工智能的新型冠状病毒肺炎流行病学信息采集***的开发》", 《中国医学装备》 *

Cited By (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113889204A (zh) * 2021-09-10 2022-01-04 北京声智科技有限公司 同步流调的方法、装置、设备及存储介质
CN113793694A (zh) * 2021-09-27 2021-12-14 辽宁金晟科技股份有限公司 一种标准化现场流调采集及实时研判***及方法
CN115083618A (zh) * 2022-05-18 2022-09-20 深圳大学 一种基于物联网的人工智能流行病学调查***及方法
CN114693279A (zh) * 2022-05-30 2022-07-01 八爪鱼人工智能科技(常熟)有限公司 应用于疫情防控的信息管理方法及数字化设备
CN117524505A (zh) * 2023-11-21 2024-02-06 四川省疾病预防控制中心 一种基于大数据的流行性疾病溯源方法

Also Published As

Publication number Publication date
CN113312915B (zh) 2022-08-30

Similar Documents

Publication Publication Date Title
CN113312915B (zh) 一种智能流行病学调查***
Dai et al. Analyzing the correlation between visual space and residents' psychology in Wuhan, China using street-view images and deep-learning technique
Stott et al. Automatic metro map layout using multicriteria optimization
CN114078602A (zh) 传染病防控中基于大数据与ai技术实现重点人群快速溯源及筛查管控的***、方法及应用
Kuru et al. A novel report generation approach for medical applications: the SISDS methodology and its applications
Grekousis et al. Analyzing high-risk emergency areas with GIS and neural networks: The case of Athens, Greece
CN113435833B (zh) 智慧社区的城市三维模型协同管理方法与***
Zhong et al. Analyzing passenger travel demand related to the transportation hub inside a city area using mobile phone data
Juanamasta et al. An integrative review of Indonesia’s quality of care
Ahmed et al. Visual accessibility and inclusive wayfinding design in hospital environment in Nigeria
CN113435834B (zh) 一种社区医疗应急机构的城市三维模型协同管理方法与***
Ong et al. Mobility, Accessibility and Disadvantaged Neighborhoods: Assessing Diversity in Transportation-Related Needs and Opportunities
Al-Douri Impact of Utilizing 3D Digital Urban Models on the Design Content of Urban Design Plans in US Cities
Lorah Interpretation and Visualization of Moderation Effects and Random Slopes in Multilevel Models
da Silva et al. Application of M-Macbeth software to evaluate the usability of the subway trains
Ramírez Mapping changes in spatial cognition of public spaces at NOVA University Lisbon (Campolide Campus) Caused by COVID-19 Restrictions
ESCAP Leaving no one behind: A methodology to identify those furthest behind in accessing opportunities in Asia and the Pacific
Deng et al. Research on evaluation method of wayfinding signs in medical institutions based on mobile network intelligent navigation
CN112908456B (zh) 基于人工智能的住院管理***
Savin et al. Medico-geoinformaton system for suicide prevention among adolescents
Ahmed et al. Impact of landmarks on route direction in hospital wayfinding at university of Ilorin teaching hospital in Kwara State, Nigeria
TIMOFTE et al. Data Science Driven Analysis of the Impact of COVID-19.
Boncoraglio et al. A Visual Analytics Platform to Measure Performance on University Entrance Tests (Discussion Paper)
Ong et al. Mobility, Accessibility and Disadvantaged Neighborhoods
ESCAP Leaving no one behind: a methodology to identify those furthest behind in Asia and the Pacific

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant