CN113936809A - 传染病预测和训练方法、装置、设备及介质 - Google Patents

传染病预测和训练方法、装置、设备及介质 Download PDF

Info

Publication number
CN113936809A
CN113936809A CN202111201853.8A CN202111201853A CN113936809A CN 113936809 A CN113936809 A CN 113936809A CN 202111201853 A CN202111201853 A CN 202111201853A CN 113936809 A CN113936809 A CN 113936809A
Authority
CN
China
Prior art keywords
user
node
feature vector
region
graph
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202111201853.8A
Other languages
English (en)
Inventor
黄予
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Tencent Technology Shenzhen Co Ltd
Original Assignee
Tencent Technology Shenzhen Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Tencent Technology Shenzhen Co Ltd filed Critical Tencent Technology Shenzhen Co Ltd
Priority to CN202111201853.8A priority Critical patent/CN113936809A/zh
Publication of CN113936809A publication Critical patent/CN113936809A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16HHEALTHCARE INFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR THE HANDLING OR PROCESSING OF MEDICAL OR HEALTHCARE DATA
    • G16H50/00ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics
    • G16H50/80ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics for detecting, monitoring or modelling epidemics or pandemics, e.g. flu
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/04Architecture, e.g. interconnection topology
    • G06N3/045Combinations of networks
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/04Architecture, e.g. interconnection topology
    • G06N3/047Probabilistic or stochastic networks
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/08Learning methods

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Health & Medical Sciences (AREA)
  • Theoretical Computer Science (AREA)
  • Data Mining & Analysis (AREA)
  • Biomedical Technology (AREA)
  • General Health & Medical Sciences (AREA)
  • Computing Systems (AREA)
  • Software Systems (AREA)
  • Evolutionary Computation (AREA)
  • Biophysics (AREA)
  • Molecular Biology (AREA)
  • Artificial Intelligence (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Mathematical Physics (AREA)
  • Computational Linguistics (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Public Health (AREA)
  • Medical Informatics (AREA)
  • Probability & Statistics with Applications (AREA)
  • Databases & Information Systems (AREA)
  • Pathology (AREA)
  • Epidemiology (AREA)
  • Primary Health Care (AREA)
  • Measuring And Recording Apparatus For Diagnosis (AREA)

Abstract

本申请公开了一种传染病预测和训练方法、装置、设备及介质,属于人工智能领域。所述预测方法包括:获取第一用户的第一生理信息和第一位置信息;基于第一生理信息和第一位置信息,在传染病的基础图网络中添加第一用户节点,得到更新后的图网络;基础图网络包括至少一个用户节点和/或至少一个地区节点,用户节点标识疑似患有传染病的用户,地区节点标识疑似患有传染病的用户所在的地区;将更新后的图网络输入图卷积神经网络,预测得到第一用户的第一用户特征向量;以及,基于第一用户特征向量,通过概率计算网络预测第一用户患有传染病的概率。上述方案提高了传染病预测的准确率。

Description

传染病预测和训练方法、装置、设备及介质
技术领域
本申请涉及人工智能领域,特别涉及一种传染病预测和训练方法、装置、设备及介质。
背景技术
在医学领域,传染病预测在传染病的防控过程中起着至关重要的作用。
相关技术中,通过判断疑似患者的症状是否为目标传染病的症状,对疑似患者患有目标传染病的概率进行预测;如,疑似患者表现出咳嗽症状(目标传染病的症状),相关技术将疑似患者标记为高风险人员。
然而,相关技术通过症状信息无法与其他相似疾病进行鉴别,如,相关技术可能将实际患有感冒的患者(咳嗽也为感冒的症状)标记为目标传染病的高风险人员,通过相关技术进行传染病预测的准确率较低。
发明内容
本申请提供了一种传染病预测和训练方法、装置、设备及介质,能够提高传染病预测的准确率。所述技术方案如下:
根据本申请的一个方面,提供了一种传染病预测方法,所述方法包括:
获取第一用户的第一生理信息和第一位置信息,第一生理信息是第一用户与传染病相关的生理信息,第一位置信息指示第一用户所在的位置;
基于第一生理信息和第一位置信息,在传染病的基础图网络上添加第一用户节点,得到更新后的图网络;基础图网络包括至少一个用户节点和/或至少一个地区节点,用户节点标识疑似患有传染病的用户,地区节点标识疑似患有传染病的用户所在的地区;
将更新后的图网络输入图卷积神经网络,预测得到第一用户的第一用户特征向量;以及,基于第一用户特征向量,通过概率计算网络预测第一用户患有传染病的概率。
根据本申请的另一方面,提供了一种图卷积神经网络的训练方法,所述方法采用半监督模式,所述方法包括:
获取n个样本用户的样本生理信息和样本位置信息;n个样本用户包括n1个第一样本用户和n2个第二样本用户,第一样本用户携带有标签,标签用于确定第一样本用户是否患有传染病,第二样本用户未携带有标签;
将与n个样本用户的样本生理信息和样本位置信息对应的样本图网络输入图卷积神经网络,通过图卷积神经网络计算得到n个样本用户的n个样本特征向量;
针对n1个第一样本用户中的一个,基于第一样本用户的样本特征向量,通过概率计算网络得到第一样本用户患有传染病的预测概率;
基于预测概率与n1个第一样本用户中患病样本用户所占比例的损失值,训练图卷积神经网络。
根据本申请的另一方面,提供了一种图卷积神经网络的训练方法,所述方法采用有监督模式,所述方法包括:
获取n1个第一样本用户的样本生理信息和样本位置信息;第一样本用户携带有标签,标签用于确定第一样本用户是否患有传染病;
将与n1个第一样本用户的样本生理信息和样本位置信息对应的样本图网络输入图卷积神经网络,通过图卷积神经网络计算得到n1个第一样本用户的n1个样本特征向量;
针对n1个第一样本用户中的一个,基于第一样本用户的样本特征向量,通过概率计算网络得到第一样本用户患有传染病的预测概率;
基于预测概率与n1个第一样本用户中患病样本用户所占比例的损失值,训练图卷积神经网络。
根据本申请的另一方面,提供了一种传染病预测装置,该装置包括:
获取模块,用于获取第一用户的第一生理信息和第一位置信息,第一生理信息是第一用户与传染病相关的生理信息,第一位置信息指示第一用户所在的位置;
更新模块,用于基于第一生理信息和第一位置信息,在传染病的基础图网络中添加第一用户节点,得到更新后的图网络;基础图网络包括至少一个用户节点和/或至少一个地区节点,用户节点标识疑似患有传染病的用户,地区节点标识疑似患有传染病的用户所在的地区;
预测模块,用于将更新后的图网络输入图卷积神经网络,预测得到第一用户的第一用户特征向量;以及,基于第一用户特征向量,通过概率计算网络预测第一用户患有传染病的概率。
根据本申请的另一方面,提供了一种图卷积神经网络的训练装置,该装置包括:
获取模块,用于获取n个样本用户的样本生理信息和样本位置信息;n个样本用户包括n1个第一样本用户和n2个第二样本用户,第一样本用户携带有标签,标签用于确定第一样本用户是否患有传染病,第二样本用户未携带有标签;
计算模块,用于将与n个样本用户的样本生理信息和样本位置信息对应的样本图网络输入图卷积神经网络,通过图卷积神经网络计算得到n个样本用户的n个样本特征向量;
计算模块,还用于针对n1个第一样本用户中的一个,基于第一样本用户的样本特征向量,通过概率计算网络得到第一样本用户患有传染病的预测概率;
训练模块,用于基于预测概率与n1个第一样本用户中患病样本用户所占比例的损失值,训练图卷积神经网络。
根据本申请的另一方面,提供了一种图卷积神经网络的训练装置,该装置包括:
获取模块,用于获取n1个第一样本用户的样本生理信息和样本位置信息;第一样本用户携带有标签,标签用于确定第一样本用户是否患有传染病;
计算模块,用于将与n1个第一样本用户的样本生理信息和样本位置信息对应的样本图网络输入图卷积神经网络,通过图卷积神经网络计算得到n1个第一样本用户的n1个样本特征向量;
计算模块,还用于针对n1个第一样本用户中的一个,基于第一样本用户的样本特征向量,通过概率计算网络得到第一样本用户患有传染病的预测概率;
训练模块,用于基于预测概率与n1个第一样本用户中患病样本用户所占比例的损失值,训练图卷积神经网络。
根据本申请的一个方面,提供了一种计算机设备,所述计算机设备包括:处理器和存储器,所述存储器存储有计算机程序,所述计算机程序由所述处理器加载并执行以实现如上所述的传染病预测方法,和/或,图卷积神经网络的训练方法。
根据本申请的另一方面,提供了一种计算机可读存储介质,所述存储介质存储有计算机程序,所述计算机程序由处理器加载并执行以实现如上所述的传染病预测方法,和/或,图卷积神经网络的训练方法。
根据本申请的另一个方面,提供了一种计算机程序产品或计算机程序,该计算机程序产品或计算机程序包括计算机指令,该计算机指令存储在计算机可读存储介质中。计算机设备的处理器从计算机可读存储介质读取该计算机指令,处理器执行该计算机指令,使得该计算机设备执行上述传染病预测方法,和/或,图卷积神经网络的训练方法。
本申请实施例提供的技术方案带来的有益效果至少包括:
通过第一用户的第一生理信息和第一位置信息,对基础图网络进行更新处理,并得到第一用户特征向量,以及通过概率计算网络将第一用户特征向量转换为第一用户患有传染病的概率,上述方法不仅采用第一用户的生理信息,还采用第一用户的位置信息对患病概率进行预测,结合传染病的空间传播性,显著提高了传染病预测的准确率。
附图说明
为了更清楚地说明本申请实施例中的技术方案,下面将对实施例描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本申请的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1是本申请一个示例性实施例提供的计算机***的示意图;
图2是本申请一个示例性实施例提供的传染病预测方法的流程图;
图3是本申请一个示例性实施例提供的应用有图2所示的传染病预测方法的产品的界面图;
图4是本申请另一个示例性实施例提供的传染病预测方法的流程图;
图5是本申请一个示例性实施例提供的第一图网络的示意图;
图6是本申请另一个示例性实施例的传染病预测方法的流程图;
图7是本申请一个示例性实施例提供的第二图网络的示意图;
图8是本申请另一个示例性实施例的传染病预测方法的流程图;
图9是本申请一个示例性实施例提供的第三图网络的示意图;
图10是本申请另一个示例性实施例提供的传染病预测方法的流程图;
图11是本申请一个示例性实施例提供的第四图网络的示意图;
图12是本申请一个示例性实施例提供的第五图网络和第六图网路的示意图;
图13是本申请一个示例性实施例提供的图卷积神经网络的训练方法的流程图;
图14是本申请另一个示例性实施例提供的图卷积神经网络的训练方法的流程图;
图15是本申请一个示例性实施例提供的传染病预测装置的结构框图;
图16是本申请一个示例性实施例提供的图卷积神经网络的训练装置的结构框图;
图17是本申请另一个示例性实施例提供的图卷积神经网络的训练装置的结构框图;
图18是本申请一个示例性实施例提供的计算机设备的结构框图。
具体实施方式
为使本申请的目的、技术方案和优点更加清楚,下面将结合附图对本申请实施方式作进一步地详细描述。
首先,对本申请实施例中涉及的名词进行简单介绍:
图网络:在本申请实施例中,图网络是指以图的形式存储的数据,图网络也称图数据、图模型、图表示、图结构数据。图网络包括至少一个节点和至少一条边,每个节点具有对应的特征,边用于表示不同节点之间的连接关系。
图神经网络:是指神经网络在图网络上应用的模型的统称,图神经网络包括图卷积神经网络(Graph Convolutional Network,GCN),图注意力网络等。图神经网络用于根据图的结构特征预测图的类别。具体地,图神经网络会包括一个或多个特征提取层。特征提取层例如是图卷积层(GraphConvolution Layers,GCL)。特征提取层用于提取图的结构特征。如果两个图是同构的,那么两个图的图在经过特征提取层后,得到的结构特征会是相似的。如果两个图是异构的,那么两个图的图在经过特征提取层后,得到的结构特征会是不同的。因此,图神经网络能够将具有同构性质的图结构映射到相同的表示域中,并输出相同的类别。
图卷积神经网络:是一类采用图卷积的图神经网络。图卷积神经网络包括至少一个图卷积层。图卷积层的作用类似于特征提取器,特征提取的对象是图,提取出的特征是图包含的结构特征。具体地,图卷积层包括多个卷积算子,卷积算子也称为卷积核,卷积核本质上可以是一个权重矩阵,权重矩阵中的权重值通过模型训练阶段得到,通过训练得到的权重值形成的各个权重矩阵可以用来从输入的图中提取特征,从而使得图卷积神经网络在应用阶段进行正确的预测。
图卷积层实现特征提取的功能是通过图卷积处理实现的。图卷积处理是对输入数据进行非线性变换的操作。对于图卷积神经网络第一个图卷积层而言,图卷积处理的输入数据为图;对于第二个卷积层至最后一个图卷积层而言,图卷积处理的输入数据为前一个图卷积层的输出结果。
本申请实施例的方案包括图卷积神经网络的训练阶段和使用阶段,图1示出了本申请一个示例性实施例提供的图卷积神经网络的训练设备101和使用设备102的计算机***。如图1所示,通过图卷积神经网络的训练设备101训练得到图卷积神经网络,将图卷积神经网络发送至使用设备102,在图卷积神经网络的使用设备102可使用图卷积神经网络。
其中,上述图卷积神经网络的训练设备101和使用设备102可以是具有机器学习能力的计算机设备,比如,该计算机设备可以是终端或服务器。
可选的,上述图卷积神经网络的训练设备101和使用设备102可以是同一个计算机设备,或者,图卷积神经网络的训练设备101和使用设备102也可以是不同的计算机设备。并且,当图卷积神经网络的训练设备101和图卷积神经网络的使用设备102是不同的设备时,图卷积神经网络的训练设备101和图卷积神经网络的使用设备102可以是同一类型的设备,比如图卷积神经网络的训练设备101和图卷积神经网络的使用设备102可以都是服务器;或者,图卷积神经网络的训练设备101和图卷积神经网络的使用设备102也可以是不同类型的设备。上述服务器可以是独立的物理服务器,也可以是多个物理服务器构成的服务器集群或者分布式***,还可以是提供云服务、云数据库、云计算、云函数、云存储、网络服务、云通信、中间件服务、域名服务、安全服务、CDN(Content Delivery Network,内容分发网络)、以及大数据和人工智能平台等基础云计算服务的云服务器。上述终端可以是智能手机、平板电脑、笔记本电脑、台式计算机、智能音箱、智能手表等,但并不局限于此。终端以及服务器可以通过有线或无线通信方式进行直接或间接地连接,本申请在此不做限制。
为提高传染病预测的准确率,图2是本申请一个示例性实施例提供的传染病预测方法的流程图。本实施例以该方法由图1所示的终端(使用设备102)来执行进行举例说明,该方法包括:
步骤220,获取第一用户的第一生理信息和第一位置信息;
第一用户:指进行传染病预测的用户。可选的,第一用户为未确定是否患有传染病的用户,即第一用户未携带有所述传染病的标签(标签用于确定用户是否患有传染病);可选的,第一用户为已确定是否患有传染病的用户,此时,第一用户再次进行传染病预测用于核验已确定的结果。
第一生理信息:是第一用户与传染病相关的生理信息,示意性的,与传染病相关的生理信息包括性别、年龄、症状、实验室检验指标信息和影像学检查信息中的至少一种。
第一位置信息:指示第一用户所在的位置。在本申请中,并不对位置信息指示的位置的最小单位进行限定,如,第一位置信息指示第一用户所在的位置为深圳市,或,第一位置信息指示第一用户所在的位置为深圳市南园街道,或,第一位置信息指示第一用户所在的位置为深圳市南园街道门牌号为5的房屋。
步骤240,基于第一生理信息和第一位置信息,在所述传染病的基础图网络中添加第一用户节点,得到更新后的图网络;
基础图网络:指与传染病相关的可重复使用的图网络,基础图网络包括至少一个用户节点和/或至少一个地区节点,其中,用户节点标识疑似患有传染病的用户,地区节点标识疑似患有传染病的用户所在的地区。
可选的,地区指基于行政规划得到的行政地区;可选的,地区指基于特定划分得到的地区,如,在传染病的发生时期,将A村庄周围3km的地区标记为高风险,高风险地区即为地区节点标识疑似患有传染病的用户所在的地区。
具体的在传染病的基础图网络中添加第一用户节点详见下述四种可能的实施方式。
步骤260,将更新后的图网络输入图卷积神经网络,预测得到第一用户的第一用户特征向量;
图卷积神经网络用于对更新后的图网络进行特征提取,预测得到第一用户的第一用户特征向量。第一用户特征向量是基于第一用户的第一生理信息和第一位置信息得到的特征向量。具体的,将更新后的图网络输入图卷积神经网络,预测得到第一用户的第一用户特征向量,详见下述四种可能的实施方式。
步骤280,基于第一用户特征向量,通过概率计算网络预测第一用户患有传染病的概率。
在一个实施例中,将第一用户特征向量通过归一化函数得到范围为[0,1]的数值,该数值即为第一用户患有传染病的概率。可选的,归一化函数为sigmoid函数。
在一个实施例中,图3示出了应用有图2所示的传染病预测方法的产品界面图,其中风险评分301显示为第一患者、第二患者、第三患者和第四患者的患病概率。
综上所述,上述方法通过第一用户的第一生理信息和第一位置信息,对基础图网络进行更新处理,并得到第一用户特征向量,以及通过概率计算网络将第一用户特征向量转换为第一用户患有传染病的概率,上述方法不仅采用第一用户的生理信息,还采用第一用户的位置信息对患病概率进行预测,结合传染病的空间传播性,显著提高了传染病预测的准确率。
第一种可能的实施方式:基于图2所示的可选实施例中,图4示出了本申请一个示例性实施例提供的传染病预测方法的流程图,其中,步骤240可替换为:步骤242-1和步骤242-2,步骤260可替换为步骤262-1、步骤262-2、步骤262-3和步骤262-4。
步骤242-1,基于第一生理信息,在基础图网络中生成第一用户节点;
其中,基础图网络包括第一地区节点,第一地区节点标识疑似患有传染病的用户所在的第一地区。基于第一生理信息,终端在基础图网络中生成第一用户节点,第一用户节点携带有第一用户的第一生理信息。
步骤242-2,在第一位置信息指示的第一用户所在的位置落入第一地区的情况下,在基础图网络中将第一用户节点与第一地区节点进行连边操作,形成第一图网络;
在一个实施例中,第一位置信息的第一用户所在的位置为深圳市南园街道,第一地区为深圳市,即,第一位置信息指示的第一用户所在的位置落入第一地区,在基础图网络中将第一用户节点与第一地区节点进行连边操作,形成第一图网络(即更新后的图网络)。
示意性的,图5示出了第一图网络,其中第一地区节点501和第一用户节点502之间相连。
步骤262-1,基于第一图网络中第一地区节点携带的历史患病信息,得到初始地区特征向量;基于第一图网络中第一用户节点携带的第一生理信息,得到初始用户特征向量;
可选的,历史患病信息包括在过去一定时间段内传染病的历史确诊人数。
在一个实施例中,第一地区节点采用d表示,第一用户节点采用u表示,基于第一图网络中第一地区节点携带的历史患病信息,终端得到初始地区特征向量
Figure BDA00033052031300000911
基于第一图网络中第一用户节点携带的第一生理信息,得到初始用户特征向量
Figure BDA00033052031300000912
在一个实施例中,初始用户特征向量包括以0或1表示的是否型特征(症状)、以浮点数表示的数值型特征(年龄)、以one-hot向量表示的类别型特征(性别)中的至少一种。
步骤262-2,基于初始地区特征向量和初始用户特征向量,计算得到第1层地区特征向量;基于初始地区特征向量和初始用户特征向量,计算得到第1层用户特征向量;
在一个实施例中,第一地区节点的特征向量的更新公式为:
Figure BDA0003305203130000091
其中,φ表示激活函数,
Figure BDA0003305203130000092
表示来自第i层的第一地区节点自身的信息流,
Figure BDA0003305203130000093
表示来自第i层的第一用户节点u的信息流;
Figure BDA0003305203130000094
Figure BDA0003305203130000095
其中,
Figure BDA0003305203130000096
表示第i-1层地区特征向量,
Figure BDA0003305203130000097
表示第i-1层用户特征向量,
Figure BDA0003305203130000098
表示第一地区节点的第i层的第一参数矩阵,
Figure BDA0003305203130000099
表示第一地区节点的第i层的第二参数矩阵。
在一个实施例中,第一用户节点的特征向量的更新公式为:
Figure BDA00033052031300000910
其中,φ表示激活函数,
Figure BDA0003305203130000101
表示来自第i层第一用户节点自身的信息流,
Figure BDA0003305203130000102
表示来自第i层的第一地区节点的信息流。
Figure BDA0003305203130000103
Figure BDA0003305203130000104
其中,
Figure BDA0003305203130000105
表示第i-1层地区特征向量,
Figure BDA0003305203130000106
表示第i-1层用户特征向量,
Figure BDA0003305203130000107
表示第一用户节点的第i层的第三参数矩阵,
Figure BDA0003305203130000108
表示第一用户节点的第i层的第四参数矩阵。
在i=1时,第1层地区特征向量
Figure BDA0003305203130000109
是基于初始地区特征向量
Figure BDA00033052031300001010
和初始用户特征向量
Figure BDA00033052031300001011
得到的,第1层用户特征向量
Figure BDA00033052031300001012
是基于初始地区特征向量
Figure BDA00033052031300001013
和初始用户特征向量
Figure BDA00033052031300001014
得到的。
步骤262-3,基于第i-1层地区特征向量和第i-1层用户特征向量,计算得到第i层地区特征向量;基于第i-1层地区特征向量和第i-1层用户特征向量,计算得到第i层用户特征向量;
结合参考上式(1)至(6),第i层地区特征向量
Figure BDA00033052031300001015
是基于第i-1层地区特征向量
Figure BDA00033052031300001016
和第i-1层用户特征向量
Figure BDA00033052031300001017
得到的,第i层用户特征向量
Figure BDA00033052031300001018
是基于初始地区特征向量
Figure BDA00033052031300001019
和第i层用户特征向量
Figure BDA00033052031300001020
得到的。
步骤262-4,将第k层用户特征向量输出为第一用户特征向量。
在一个实施例中,图卷积神经网络包括k个图卷积层,终端将上述第k个图卷积层输出的第k层用户特征向量输出为第一用户特征向量,k为大于1的整数,i为大于0且小于k的整数。
综上所述,上述方法通过更新基础图网络,得到更新后的第一图网络,第一图网络包括第一地区节点和第一用户节点,实现了通过图网络对用户的生理信息和位置信息进行数据整合,进一步可通过图卷积神经网络和概率计算网络获取第一用户的患病概率。
第二种可能的实施方式:基于图2所示的可选实施例中,图6示出了本申请一个示例性实施例提供的传染病预测方法的流程图,其中,步骤240可替换为:步骤244-1和步骤244-2,步骤260可替换为步骤264-1、步骤264-2、步骤264-3和步骤264-4。
步骤244-1,基于第一生理信息,在基础图网络中生成第一用户节点;
其中,基础图网络包括第一地区节点和与第一地区节点相连的第二地区节点,第一地区节点标识疑似患有传染病的用户所在的第一地区,第二地区节点标识疑似患有传染病的用户所在的第二地区。
且,第二地区节点与第一地区节点之间的人口流动数量达到数量阈值,和/或,第二地区节点与第一地区节点分别指示的地区之间的距离低于第一距离阈值。
示意性的,第一地区为深圳市,第二地区为广州市,基于深圳市与广州市之间的人口流动数量达到数量阈值,且,深圳市与广州市之间的距离低于第一距离阈值,在基础图网络中第一地区节点和第二地区节点相连。
在一个实施例中,终端基于第一生理信息,在基础图网络中生成第一用户节点,第一用户节点携带有第一生理信息。
步骤244-2,在第一位置信息指示的第一用户所在的位置落入第一地区的情况下,在基础图网络中将第一用户节点与第一地区节点进行连边操作,形成第二图网络;
在一个实施例中,第一位置信息的第一用户所在的位置为深圳市南园街道,第一地区为深圳市,即,第一位置信息指示的第一用户所在的位置落入第一地区,在基础图网络中将第一用户节点与第一地区节点进行连边操作,形成第二图网络(即更新后的图网络)。
示意性的,图7示出了第二图网络,其中,第一地区节点701和第二地区节点702之间相连,第一地区节点701和第一用户节点703之间相连。
步骤264-1,基于第二图网络中第一地区节点携带的历史患病信息,得到第一地区节点的初始地区特征向量;基于第二图网络中第二地区节点携带的历史患病信息,得到第二地区节点的初始地区特征向量;基于第二图网络中第一用户节点携带的第一生理信息,得到初始用户特征向量;
在一个实施例中,第一地区节点采用d表示,第二地区节点采用d’表示,第一用户节点采用u表示,基于第二图网络中第一地区节点携带的历史患病信息,终端得到第一地区节点的初始地区特征向量
Figure BDA0003305203130000111
基于第二图网络中第二地区节点携带的历史患病信息,终端得到第二地区节点的初始地区特征向量
Figure BDA0003305203130000112
基于第二图网络中第一用户节点携带的第一生理信息,得到初始用户特征向量
Figure BDA0003305203130000113
步骤264-2,基于第一地区节点的初始地区特征向量、第二地区节点的初始地区特征向量和初始用户特征向量,结合第一权重,计算得到第一地区节点的第1层地区特征向量;基于第一地区节点的初始地区特征向量和初始用户特征向量,计算得到第1层用户特征向量;
其中,第一权重与第一地区节点和第二地区节点之间的人口流动数量相关联。
在一个实施例中,第一地区节点的特征向量的更新公式为:
Figure BDA0003305203130000121
其中,φ表示激活函数,
Figure BDA0003305203130000122
表示来自第i层的第一地区节点d自身的信息流,
Figure BDA0003305203130000123
表示来自第i层的第一用户节点u的信息流,
Figure BDA0003305203130000124
表示来自第i层的第二地区节点d′的信息流,αd←d′表示第一权重,Nd(d)表示与第一地区节点d相连的所有地区节点集合。
Figure BDA0003305203130000125
Figure BDA0003305203130000126
Figure BDA0003305203130000127
Figure BDA0003305203130000128
其中,d″表示第一地区节点d相连的地区节点(包括第二地区节点),wd←d′表示第二地区节点d′与第一地区节点d的边权(基于第一地区和第二地区之间的人口流动数量得到)。
Figure BDA0003305203130000129
表示第一地区节点的第i层的第五参数矩阵,
Figure BDA00033052031300001210
表示第一地区节点的第i层的第六参数矩阵,
Figure BDA00033052031300001211
表示第一地区节点的第i层的第七参数矩阵。
在一个实施例中,第一用户节点的特征向量的更新公式为:
Figure BDA00033052031300001212
其中,φ表示激活函数,
Figure BDA00033052031300001213
表示来自第i层第一用户节点自身的信息流,
Figure BDA00033052031300001214
表示来自第i层的第一地区节点的信息流。
Figure BDA00033052031300001215
Figure BDA00033052031300001216
其中,
Figure BDA00033052031300001217
表示第一地区节点的第i-1层地区特征向量,
Figure BDA00033052031300001218
表示第i-1层用户特征向量,
Figure BDA00033052031300001219
表示第一用户节点的第i层的第八参数矩阵,
Figure BDA00033052031300001220
表示第一用户节点的第i层的第九参数矩阵。
在i=1,第一地区节点的第1层地区特征向量
Figure BDA00033052031300001221
是基于第一地区节点的初始地区特征向量
Figure BDA0003305203130000131
第二地区节点的初始地区特征向量
Figure BDA0003305203130000132
和初始用户特征向量
Figure BDA0003305203130000133
得到的,第1层用户特征向量
Figure BDA0003305203130000134
是基于初始地区特征向量
Figure BDA0003305203130000135
和初始用户特征向量
Figure BDA0003305203130000136
得到的。
步骤264-3,基于第一地区节点的第i-1层地区特征向量、第二地区节点的第i-1层地区特征向量和第i-1层用户特征向量,结合第一权重,计算得到第一地区节点的第i层地区特征向量;基于第一地区节点的第i-1层地区特征向量和第i-1层用户特征向量,计算得到第i层用户特征向量;
结合参考上式(7)至(14),第一地区节点的第i层地区特征向量
Figure BDA0003305203130000137
是基于第一地区节点的第i-1层地区特征向量
Figure BDA0003305203130000138
第二地区节点的第i-1层地区特征向量
Figure BDA0003305203130000139
和第i-1层用户特征向量
Figure BDA00033052031300001310
结合第一权重得到的。第i层用户特征向量是基于第一地区节点的第i-1层地区特征向量
Figure BDA00033052031300001311
和第i-1层用户特征向量
Figure BDA00033052031300001312
得到的。
步骤264-4,将第k层用户特征向量输出为第一用户特征向量。
在一个实施例中,图卷积神经网络包括k个图卷积层,终端将上述第k个图卷积层输出的第k层用户特征向量输出为第一用户特征向量,k为大于1的整数,i为大于0且小于k的整数。
综上所述,上述方法通过更新基础图网络,得到更新后的第二图网络,第二图网络包括第一地区节点、第二地区节点和第一用户节点,实现了通过图网络对用户的生理信息和位置信息进行数据整合,进一步可通过图卷积神经网络和概率计算网络获取第一用户的患病概率。
第三种可能的实施方式:基于图2所示的可选实施例中,图8示出了本申请一个示例性实施例提供的传染病预测方法的流程图,其中,步骤240可替换为:步骤246-1和步骤246-2,步骤260可替换为步骤266-1、步骤266-2、步骤266-3和步骤266-4。
步骤246-1,基于第一生理信息,在基础图网络中生成第一用户节点;
基础图网络包括第一地区节点和与第一地区节点相连的第二用户节点,第一地区节点标识疑似患有传染病的用户所在的第一地区,第二用户节点标识疑似患有传染病的第二用户。
第二用户节点:指在基础图网络更新前即已存在的用户节点。
在一个实施例中,终端基于第一生理信息,在基础图网络中生成第一用户节点,第一用户节点携带有第一生理信息。
步骤246-2,在第一位置信息指示的第一用户所在的位置落入第一地区的情况下,在基础图网络中将第一用户节点与第一地区节点进行连边操作,形成第三图网络;
在一个实施例中,第一位置信息的第一用户所在的位置为深圳市南园街道,第一地区为深圳市,即,第一位置信息指示的第一用户所在的位置落入第一地区,在基础图网络中将第一用户节点与第一地区节点进行连边操作,形成第三图网络(即更新后的图网络)。
示意性的,图9示出了第三图网络,其中,第一地区节点901和第一用户节点902之间相连,第一地区节点901和第二用户节点903之间相连。其中,第二用户节点指示的第二用户所在的位置落入第一地区。
步骤266-1,基于第三图网络中第一地区节点携带的历史患病信息,得到初始地区特征向量;基于第三图网络中第一用户节点携带的第一生理信息,得到第一用户节点的初始用户特征向量;基于第三图网络中第二用户节点携带的第二生理信息,得到第二用户节点的初始用户特征向量;
在一个实施例中,第一地区节点采用d表示,第一用户节点与至少一个第二用户节点共同构成的用户节点集中的一个用户节点采用ui表示,第一用户节点采用u表示,基于第三图网络中第一地区节点携带的历史患病信息,终端得到第一地区节点的初始地区特征向量
Figure BDA0003305203130000141
基于第三图网络中第一用户节点携带的第一生理信息,得到初始用户特征向量
Figure BDA0003305203130000142
步骤266-2,基于初始地区特征向量、第一用户节点的初始用户特征向量和第二用户节点的初始用户特征向量,计算得到第1层地区特征向量;基于初始地区特征向量和第一用户节点的初始用户特征向量,计算得到第一用户节点的第1层用户特征向量;
在一个实施例中,第一地区节点的特征向量的更新公式为:
Figure BDA0003305203130000143
其中,φ表示激活函数,
Figure BDA0003305203130000144
表示来自第i层的第一地区节点d自身的信息流,
Figure BDA0003305203130000145
表示来自第i层的与第一地区节点d相连的用户节点集(包括第一用户节点和第二用户节点)中的一个用户节点ui的信息流,Nu(d)表示与第一地区节点d相连的所有用户节点集合。
Figure BDA0003305203130000151
Figure BDA0003305203130000152
其中,
Figure BDA0003305203130000153
表示第i-1层地区特征向量,
Figure BDA0003305203130000154
表示第i-1层的用户节点集中的一个用户节点的用户特征向量,
Figure BDA0003305203130000155
表示第一地区节点的第i层的第十参数矩阵,
Figure BDA0003305203130000156
表示第一地区节点的第i层的第十一参数矩阵。
在一个实施例中,第一用户节点的特征向量的更新公式为:
Figure BDA0003305203130000157
其中,φ表示激活函数,
Figure BDA0003305203130000158
表示来自第i层第一用户节点自身的信息流,
Figure BDA0003305203130000159
表示来自第i层的第一地区节点的信息流。
Figure BDA00033052031300001510
Figure BDA00033052031300001511
其中,
Figure BDA00033052031300001512
表示第i-1层地区特征向量,
Figure BDA00033052031300001513
表示第i-1层用户特征向量,
Figure BDA00033052031300001514
表示第一用户节点的第i层的第十二参数矩阵,
Figure BDA00033052031300001515
表示第一用户节点的第i层的第十三参数矩阵。
在i=1,第一地区节点的第1层地区特征向量
Figure BDA00033052031300001516
是基于第一地区节点的初始地区特征向量
Figure BDA00033052031300001517
第一用户节点的初始用户特征向量和第二用户节点的初始用户特征向量得到的,第一用户节点的第1层用户特征向量
Figure BDA00033052031300001518
是基于初始地区特征向量
Figure BDA00033052031300001519
和初始用户特征向量
Figure BDA00033052031300001520
得到的。
步骤266-3,基于第i-1层地区特征向量、第一用户节点的第i-1层用户特征向量和第二用户节点的第i-1层用户特征向量,计算得到第i层地区特征向量;基于第i-1层地区特征向量和第一用户节点的第i-1层用户特征向量,计算得到第一用户节点的第i层用户特征向量;
结合参考上式(15)至(20),第i层地区特征向量
Figure BDA00033052031300001521
是基于第一地区节点的第i-1层地区特征向量
Figure BDA00033052031300001522
第i-1层的第一用户节点和第二用户节点构成的用户节点集的用户特征向量得到的。第i层用户特征向量是基于第一地区节点的第i-1层地区特征向量
Figure BDA00033052031300001523
和第i-1层用户特征向量
Figure BDA00033052031300001524
得到的。
步骤266-4,将第一用户节点的第k层用户特征向量输出为第一用户特征向量。
在一个实施例中,图卷积神经网络包括k个图卷积层,终端将上述第k个图卷积层输出的第一用户节点的第k层用户特征向量输出为第一用户特征向量,k为大于1的整数,i为大于0且小于k的整数。
综上所述,上述方法通过更新基础图网络,得到更新后的第三图网络,第三图网络包括第一用户节点和第二用户节点,实现了通过图网络对用户的生理信息和位置信息进行数据整合,进一步可通过图卷积神经网络和概率计算网络获取第一用户的患病概率。
第四种可能的实施方式,基于图2所示的可选实施例中,图10示出了本申请一个示例性实施例提供的传染病预测方法的流程图,其中,步骤240可替换为:步骤248-1和步骤248-2,步骤260可替换为步骤268-1、步骤268-2、步骤268-3和步骤268-4。
步骤248-1,基于第一生理信息,在基础图网络中生成第一用户节点;
基础图网络包括第三用户节点,第三用户节点标识疑似患有传染病的第三用户,第三用户节点携带有第三用户的第三生理信息和第三位置信息;
步骤248-2,在第一生理信息与第三生理信息之间的相似度大于相似度阈值,和/或,第一位置信息与第三位置信息分别指示的位置之间的距离小于第二距离阈值的情况下,在基础图网络中将第一用户节点与第三用户节点进行连边操作,形成第四图网络;
在一个实施例中,第一生理信息指示第一用户的症状,第三生理信息指示第三用户的症状,在第一用户的症状与第三用户的症状之间的相似度大于相似度阈值,且,第一用户所在的位置与第三用户所在的位置之间的距离小于第二距离阈值的情况下,在基础图网络中将第一用户节点与第三用户节点进行连边操作,形成第四图网络,示意性的,图11示出了第四图网络,第一用户节点1101和第三用户节点1102相连。
步骤268-1,基于第四图网络中第一用户节点携带的第一生理信息,得到第一用户节点的初始用户特征向量;基于第四图网络中第三用户节点携带的第三生理信息,得到第三用户节点的初始用户特征向量;
在一个实施例中,第一用户节点采用m表示,第二用户节点采用n表示,基于第一用户节点携带的第一生理信息,得到第一用户节点m的初始用户特征向量
Figure BDA0003305203130000161
基于第三用户节点携带的第三生理信息,得到第三用户节点n的初始用户特征向量
Figure BDA0003305203130000162
步骤268-2,基于第一用户节点的初始用户特征向量和第三用户节点的初始用户特征向量,结合第二权重,计算得到第一用户节点的第1层用户特征向量和第三用户节点的第1层用户特征向量;
其中,第二权重与第一生理信息和第三生理信息之间的相似度、第一位置信息和第三位置信息分别指示的位置之间的距离中的至少一个相关联;
在一个实施例中,第一用户节点的特征向量的更新公式为:
Figure BDA0003305203130000171
其中,σ表示激活函数,αmn为第二权重,W14表示第i层第一用户节点的第十四权重,W15表示第i层第三用户节点的第十五权重。
Figure BDA0003305203130000172
Figure BDA0003305203130000173
其中,aT表示特定参数矩阵,同W16一起在训练过程中进行训练得到,N(m)表示与第一用户节点相连的用户节点集合,
Figure BDA0003305203130000174
表示归一化后的距离,δd表示第二距离阈值,
Figure BDA0003305203130000175
表示第一用户与第三用户所在位置的距离,smn表示第一用户的第一生理信息与第三用户的第三生理信息之间的相似度,[]表示向量拼接,W16表示第i层的第一用户节点的第十六参数矩阵。
Figure BDA0003305203130000176
Figure BDA0003305203130000177
wf表示一个生理信息f(第一生理信息中的一个生理信息)的权重,Sm表示第一用户的第一生理信息、Sn表示第三用户的第三生理信息,Nf表示出现了生理信息f的确诊患者数目,N表示当前确诊患有传染病的患者数目。
同理,参考上式(21)可计算第二用户节点n的特征向量
Figure BDA0003305203130000178
步骤268-3,基于第一用户节点的第i-1层用户特征向量和第三用户节点的第i-1层用户特征向量,结合第二权重,计算得到第一用户节点的第i层用户特征向量和第三用户节点的第i层用户特征向量;
结合参考上式(21)(22)(23),可计算得到第一用户节点的第i层用户特征向量和第三用户节点的第i层用户特征向量。
步骤268-4,将第一用户节点的第k层用户特征向量输出为第一用户特征向量。
在一个实施例中,图卷积神经网络包括k个图卷积层,终端将上述第k个图卷积层输出的第一用户节点的第k层用户特征向量输出为第一用户特征向量,k为大于1的整数,i为大于0且小于k的整数。
综上所述,上述方法通过更新基础图网络,得到更新后的第四图网络,第四图网络包括第一用户节点和第三用户节点,实现了通过图网络对用户的生理信息和位置信息进行数据整合,进一步可通过图卷积神经网络和概率计算网络获取第一用户的患病概率。
值得说明的一点是,上述第一种可能的实施方式至第四种可能的实施方式可以进行结合,示意性的,图12示出了本申请一个示例性实施例提供的第五图网络和第六图网络的示意图。
第五图网络(a)是基于第一图网络、第二图网络、第三图网络和第四图网络结合得到的。第一地区节点1201与第一用户节点1203相连,第一地区节点1201与第二地区节点1202相连,第一地区节点1201还连接有至少一个第二用户节点,第一用户节点1203还连接有至少一个第三用户节点。
第六图网络(b)是基于第一图网络、第二图网络和第三图网络结合得到的,第一地区节点1201与第一用户节点1203相连,第一地区节点1201与第二地区节点1202相连,第一地区节点1201还连接有至少一个第二用户节点。
值得说明的另一点是,上述所有的参数矩阵均通过模型训练进行更新。
在一个实施例中,基于图2所示的可选实施例,步骤280可被替换为:
S1:将第一用户特征向量和第一用户节点的初始用户特征向量进行拼接,得到第一中间向量;
S2:将第一中间向量输入全连接网络,得到第二中间向量;
S3:将第二中间向量输入激活函数,预测第一用户患有传染病的概率。
示意性的,计算第一用户患有传染病的概率的公式如下:
Figure BDA0003305203130000181
其中,FC表示全连接网络,σ表示sigmoid函数,
Figure BDA0003305203130000182
表示第一用户节点的第k层输出的用户特征向量,
Figure BDA0003305203130000183
表示第一用户节点的初始特征向量,[]表示向量拼接。
在一个实施例中,基于图2所示的可选实施例,步骤280之后还包括:
在更新后的图网络中删除第一用户节点。其中,第一用户节点为基于第一用户的第一生理信息在基础图网络中生成的用户节点。
为训练上述图卷积神经网络,图13示出了本申请一个示例性实施例提供的图卷积神经网络的训练方法的流程图,以该方法应用于图1所示的图卷积神经网络的终端(训练设备101)举例说明,该训练方法采用半监督模式,该方法包括:
步骤1301,获取n个样本用户的样本生理信息和样本位置信息;
其中,n个样本用户包括n1个第一样本用户和n2个第二样本用户,第一样本用户携带有标签,标签用于确定第一样本用户是否患有传染病,第二样本用户未携带有标签。
在一个实施例中,终端获取n个样本用户的样本生理信息和样本位置信息。
步骤1302,将与n个样本用户的样本生理信息和样本位置信息对应的样本图网络输入图卷积神经网络,通过图卷积神经网络计算得到n个样本用户的n个样本特征向量;
在一个实施例中,终端将与n个样本用户的样本生理信息和样本位置信息对应的样本图网络输入图卷积神经网络,通过图卷积神经网络计算得到n个样本用户的n个样本特征向量。
可选的,终端基于n个样本用户的样本生理信息生成n个样本节点,基于n个样本位置信息指示的位置落入第一地区节点指示的第一地区内,终端将n个样本节点与第一地区节点进行连边,得到第一样本图网络;
可选的,终端基于n个样本用户的样本生理信息生成n个样本节点,基于n个样本位置信息指示的位置落入第一地区节点指示的第一地区,或,第二地区节点指示的第二地区内,终端将n个样本节点与第一地区节点或第二地区节点进行连边,得到第二样本图网络;
可选的,终端基于n个样本用户的样本生理信息生成n个样本节点,基于n个样本位置信息指示的位置落入第一地区节点指示的第一地区内,终端将n个样本节点与第一地区节点进行连边,与第二用户节点共同构成第三样本图网络,第二用户节点指示的第二用户所在的位置落入第一地区节点指示的第一地区内;
可选的,终端基于n个样本用户的样本生理信息生成n个样本节点,基于n个样本用户中的一个样本用户与第三用户节点指示的第三用户之间的距离低于第二距离阈值,和/或,针对n个样本用户中的一个样本用户的生理信息与第三用户节点指示的第三用户的第三生理信息之间的相似度达到相似度阈值,终端将n个样本节点与第三用户节点进行连边,得到第四样本图网络。
结合参考图5、图7、图9、图11和图12,第一样本图网络、第二样本图网络、第三样本图网络和第四样本图网络分别与第一图网络、第二图网络、第三图网络、第四图网络相类似;
值得说明的一点是,基于上述第一样本图网络、第二样本图网络、第三样本图网络和第四样本图网络还可构建得到新的样本图网络,新的样本图网络可与第五图网络和第六图网络相类似。
步骤1303,针对n1个第一样本用户中的一个,基于第一样本用户的样本特征向量,通过概率计算网络得到第一样本用户患有传染病的预测概率;
在一个实施例中,针对n1个第一样本用户中的一个,终端基于第一样本用户的样本特征向量,通过概率计算网络得到第一样本用户患有传染病的预测概率。
在一个实施例中,终端将第一样本用户的样本特征向量和第一样本用户的初始特征向量进行拼接,得到第一样本中间向量;接着,终端将第一样本中间向量输入全连接网络,得到第二样本中间向量;最后,终端将第二样本中间向量输入激活函数,得到第一样本用户患有传染病的概率。
步骤1304,基于预测概率与n1个第一样本用户中患病样本用户所占比例的损失值,训练图卷积神经网络。
在一个实施例中,终端基于预测概率与n1个第一样本用户中患病样本用户所占比例的损失值,训练图卷积神经网络。
综上所述,上述训练方法通过设置n个样本用户中n1个第一样本用户有标签、n2个第二样本用户没有标签,训练图卷积神经网络,使得没有标签的样本用户仍参与数据的整合计算,但没有标签的样本用户的预测概率不参与图卷积神经网络的训练。
为训练上述图卷积神经网络,图14示出了本申请一个示例性实施例提供的图卷积神经网络的训练方法的流程图,以该方法应用于图1所示的图卷积神经网络的终端(训练设备101)举例说明,该训练方法采用有监督模式,该方法包括:
步骤1401,获取n1个第一样本用户的样本生理信息和样本位置信息;
其中,第一样本用户携带有标签,标签用于确定第一样本用户是否患有传染病;在一个实施例中,终端获取n1个第一样本用户的样本生理信息和样本位置信息
步骤1402,将与n1个第一样本用户的样本生理信息和样本位置信息对应的样本图网络输入图卷积神经网络,通过图卷积神经网络计算得到n1个第一样本用户的n1个样本特征向量;
在一个实施例中,终端将n1个第一样本用户的样本生理信息和样本位置信息输入图卷积神经网络,通过图卷积神经网络计算得到n1个第一样本用户的n1个样本特征向量。
可选的,终端基于n1个第一样本用户的样本生理信息生成n个样本节点,基于n个样本位置信息指示的位置落入第一地区节点指示的第一地区内,终端将n个样本节点与第一地区节点进行连边,得到第五样本图网络;
可选的,终端基于n1个第一样本用户的样本生理信息生成n个样本节点,基于n个样本位置信息指示的位置落入第一地区节点指示的第一地区,或,第二地区节点指示的第二地区内,终端将n个样本节点与第一地区节点或第二地区节点进行连边,得到第六样本图网络;
可选的,终端基于n1个第一样本用户的样本生理信息生成n个样本节点,基于n个样本位置信息指示的位置落入第一地区节点指示的第一地区内,终端将n个样本节点与第一地区节点进行连边,与第二用户节点共同构成第七样本图网络,第二用户节点指示的第二用户所在的位置落入第一地区节点指示的第一地区内;
可选的,终端基于n1个第一样本用户的样本生理信息生成n个样本节点,基于n1个第一样本用户中的一个样本用户与第三用户节点指示的第三用户之间的距离低于第二距离阈值,和/或,针对n1个第一样本用户中的一个样本用户的生理信息与第三用户节点指示的第三用户的第三生理信息之间的相似度达到相似度阈值,终端将n个样本节点与第三用户节点进行连边,得到第八样本图网络。
结合参考图5、图7、图9、图11和图12,第五样本图网络、第六样本图网络、第七样本图网络和第八样本图网络分别与第一图网络、第二图网络、第三图网络、第四图网络相类似;
值得说明的一点是,基于上述第五样本图网络、第六样本图网络、第七样本图网络和第八样本图网络还可构建得到新的样本图网络,新的样本图网络可与第五图网络和第六图网络相类似。
步骤1403,针对n1个第一样本用户中的一个,基于第一样本用户的样本特征向量,通过概率计算网络得到第一样本用户患有传染病的预测概率;
在一个实施例中,终端针对n1个第一样本用户中的一个,基于第一样本用户的样本特征向量,通过概率计算网络得到第一样本用户患有传染病的预测概率。
在一个实施例中,终端将第一样本用户的样本特征向量和第一样本用户的初始特征向量进行拼接,得到第一样本中间向量;接着,终端将第一样本中间向量输入全连接网络,得到第二样本中间向量;最后,终端将第二样本中间向量输入激活函数,得到第一样本用户患有传染病的概率。
步骤1404,基于预测概率与n1个第一样本用户中患病样本用户所占比例的损失值,训练图卷积神经网络。
在一个实施例中,终端基于预测概率与n1个第一样本用户中患病样本用户所占比例的损失值,训练图卷积神经网络。
综上所述,上述训练方法利用携带有标签的n1个第一样本用户,训练图卷积神经网络,实现了对图卷积神经网络的训练。
在一个实施例中,图15示出了本申请一个示例性实施例提供的传染病预测装置的结构框图,该装置包括:
获取模块1501,用于获取第一用户的第一生理信息和第一位置信息,第一生理信息是第一用户与传染病相关的生理信息,第一位置信息指示第一用户所在的位置;
更新模块1502,用于基于第一生理信息和第一位置信息,在传染病的基础图网络中添加第一用户节点,得到更新后的图网络;基础图网络包括至少一个用户节点和/或至少一个地区节点,用户节点标识疑似患有传染病的用户,地区节点标识疑似患有传染病的用户所在的地区;
预测模块1503,用于将更新后的图网络输入图卷积神经网络,预测得到第一用户的第一用户特征向量;以及,基于第一用户特征向量,通过概率计算网络预测第一用户患有传染病的概率。
在一个可选的实施例中,基础图网络包括第一地区节点,更新后的图网络包括第一图网络,第一地区节点标识疑似患有传染病的用户所在的第一地区。
更新模块1502,还用于基于第一生理信息,在基础图网络中生成第一用户节点。
更新模块1502,还用于在第一位置信息指示的第一用户所在的位置落入第一地区的情况下,在基础图网络中将第一用户节点与第一地区节点进行连边操作,形成第一图网络。
在一个可选的实施例中,图卷积神经网络具有k个图卷积层。
在一个可选的实施例中,预测模块1503还用于基于第一图网络中第一地区节点携带的历史患病信息,得到初始地区特征向量;基于第一图网络中第一用户节点携带的第一生理信息,得到初始用户特征向量。
在一个可选的实施例中,预测模块1503还用于基于初始地区特征向量和初始用户特征向量,计算得到第1层地区特征向量;基于初始地区特征向量和初始用户特征向量,计算得到第1层用户特征向量。
在一个可选的实施例中,预测模块1503还用于基于第i-1层地区特征向量和第i-1层用户特征向量,计算得到第i层地区特征向量;基于第i-1层地区特征向量和第i-1层用户特征向量,计算得到第i层用户特征向量。
在一个可选的实施例中,预测模块1503还用于将第k层用户特征向量输出为第一用户特征向量。
在一个可选的实施例中,基础图网络包括第一地区节点和与第一地区节点相连的第二地区节点,更新后的图网络包括第二图网络,第一地区节点标识疑似患有传染病的用户所在的第一地区,第二地区节点标识疑似患有传染病的用户所在的第二地区。
在一个可选的实施例中,更新模块1502还用于基于第一生理信息,在基础图网络中生成第一用户节点。
在一个可选的实施例中,更新模块1502还用于在第一位置信息指示的第一用户所在的位置落入第一地区的情况下,在基础图网络中将第一用户节点与第一地区节点进行连边操作,形成第二图网络。
其中,第二地区节点与第一地区节点之间的人口流动数量达到数量阈值,和/或,第二地区节点与第一地区节点分别指示的地区之间的距离低于第一距离阈值。
在一个可选的实施例中,图卷积神经网络包括k个图卷积层。
在一个可选的实施例中,预测模块1503还用于基于第二图网络中第一地区节点携带的历史患病信息,得到第一地区节点的初始地区特征向量;基于第二图网络中第二地区节点携带的历史患病信息,得到第二地区节点的初始地区特征向量;基于第二图网络中第一用户节点携带的第一生理信息,得到初始用户特征向量。
在一个可选的实施例中,预测模块1503还用于基于第一地区节点的初始地区特征向量、第二地区节点的初始地区特征向量和初始用户特征向量,结合第一权重,计算得到第一地区节点的第1层地区特征向量,第一权重与第一地区节点和第二地区节点之间的人口流动数量相关联;基于第一地区节点的初始地区特征向量和初始用户特征向量,计算得到第1层用户特征向量;
在一个可选的实施例中,预测模块1503还用于基于第一地区节点的第i-1层地区特征向量、第二地区节点的第i-1层地区特征向量和第i-1层用户特征向量,结合第一权重,计算得到第一地区节点的第i层地区特征向量;基于第一地区节点的第i-1层地区特征向量和第i-1层用户特征向量,计算得到第i层用户特征向量。
在一个可选的实施例中,预测模块1503还用于将第k层用户特征向量输出为第一用户特征向量。
在一个可选的实施例中,基础图网络包括第一地区节点和与第一地区节点相连的第二用户节点,更新后的图网络包括第三图网络,第一地区节点标识疑似患有传染病的用户所在的第一地区,第二用户节点标识疑似患有传染病的第二用户。
在一个可选的实施例中,更新模块1502还用于基于第一生理信息,在基础图网络中生成第一用户节点。
在一个可选的实施例中,更新模块1502还用于在第一位置信息指示的第一用户所在的位置落入第一地区的情况下,在基础图网络中将第一用户节点与第一地区节点进行连边操作,形成第三图网络。
其中,第二用户节点指示的第二用户所在的位置落入第一地区。
在一个可选的实施例中,图卷积神经网络具有k个图卷积层。
在一个可选的实施例中,预测模块1503还用于基于第三图网络中第一地区节点携带的历史患病信息,得到初始地区特征向量;基于第三图网络中第一用户节点携带的第一生理信息,得到第一用户节点的初始用户特征向量;基于第三图网络中第二用户节点携带的第二生理信息,得到第二用户节点的初始用户特征向量。
在一个可选的实施例中,预测模块1503还用于基于初始地区特征向量、第一用户节点的初始用户特征向量和第二用户节点的初始用户特征向量,计算得到第1层地区特征向量;基于初始地区特征向量和第一用户节点的初始用户特征向量,计算得到第一用户节点的第1层用户特征向量。
在一个可选的实施例中,预测模块1503还用于基于第i-1层地区特征向量、第一用户节点的第i-1层用户特征向量和第二用户节点的第i-1层用户特征向量,计算得到第i层地区特征向量;基于第i-1层地区特征向量和第一用户节点的第i-1层用户特征向量,计算得到第一用户节点的第i层用户特征向量。
在一个可选的实施例中,预测模块1503还用于将第一用户节点的第k层用户特征向量输出为第一用户特征向量。
在一个可选的实施例中,基础图网络包括第三用户节点,更新后的图网络包括第四图网络,第三用户节点标识疑似患有传染病的第三用户,第三用户节点携带有第三用户的第三生理信息和第三位置信息。
在一个可选的实施例中,更新模块1502还用于基于第一生理信息,在基础图网络中生成第一用户节点。
在一个可选的实施例中,更新模块1502还用于在第一生理信息与第三生理信息之间的相似度大于相似度阈值,和/或,第一位置信息与第三位置信息分别指示的位置之间的距离小于第二距离阈值的情况下,在基础图网络中将第一用户节点与第三用户节点进行连边操作,形成第四图网络。
在一个可选的实施例中,图卷积神经网络包括k层图卷积层。
在一个可选的实施例中,预测模块1503还用于基于第四图网络中第一用户节点携带的第一生理信息,得到第一用户节点的初始用户特征向量;基于第四图网络中第三用户节点携带的第三生理信息,得到第三用户节点的初始用户特征向量。
在一个可选的实施例中,预测模块1503还用于基于第一用户节点的初始用户特征向量和第三用户节点的初始用户特征向量,结合第二权重,计算得到第一用户节点的第1层用户特征向量和第三用户节点的第1层用户特征向量,第二权重与第一生理信息和第三生理信息之间的相似度、第一位置信息和第三位置信息分别指示的位置之间的距离中的至少一个相关联。
在一个可选的实施例中,预测模块1503还用于基于第一用户节点的第i-1层用户特征向量和第三用户节点的第i-1层用户特征向量,结合第二权重,计算得到第一用户节点的第i层用户特征向量和第三用户节点的第i层用户特征向量。
在一个可选的实施例中,预测模块1503还用于将第一用户节点的第k层用户特征向量输出为第一用户特征向量。
在一个可选的实施例中,该装置还包括删除模块1504,用于在更新后的图网络中删除第一用户节点。
在一个可选的实施例中,概率计算网络包括激活函数。
在一个可选的实施例中,预测模块1503还用于将第一用户特征向量和第一用户节点的初始用户特征向量进行拼接,得到第一中间向量。
在一个可选的实施例中,预测模块1503还用于将第一中间向量输入全连接网络,得到第二中间向量。
在一个可选的实施例中,预测模块1503还用于将第二中间向量输入激活函数,预测第一用户患有传染病的概率。
综上所述,上述装置通过第一用户的第一生理信息和第一位置信息,对基础图网络进行更新处理,并得到第一用户特征向量,以及通过概率计算网络将第一用户特征向量转换为第一用户患有传染病的概率,上述装置不仅采用第一用户的生理信息,还采用第一用户的位置信息对患病概率进行预测,结合传染病的空间传播性,显著提高了传染病预测的准确率。
图16示出了本申请一个示例性实施例提供的图卷积神经网络的训练装置的结构框图,该装置采用半监督方式对图卷积神经网络进行训练,该装置包括:
获取模块1601,用于获取n个样本用户的样本生理信息和样本位置信息;n个样本用户包括n1个第一样本用户和n2个第二样本用户,第一样本用户携带有标签,标签用于确定第一样本用户是否患有传染病,第二样本用户未携带有标签;
计算模块1602,用于将与n个样本用户的样本生理信息和样本位置信息对应的样本图网络输入图卷积神经网络,通过图卷积神经网络计算得到n个样本用户的n个样本特征向量;
计算模块1602,还用于针对n1个第一样本用户中的一个,基于第一样本用户的样本特征向量,通过概率计算网络得到第一样本用户患有传染病的预测概率;
训练模块1603,用于基于预测概率与n1个第一样本用户中患病样本用户所占比例的损失值,训练图卷积神经网络。
在一个可选的实施例中,概率计算网络包括激活函数。
在一个可选的实施例中,计算模块1602,还用于将第一样本用户的样本特征向量和第一样本用户的初始特征向量进行拼接,得到第一样本中间向量。
在一个可选的实施例中,计算模块1602,还用于将第一样本中间向量输入全连接网络,得到第二样本中间向量。
在一个可选的实施例中,计算模块1602,还用于将第二样本中间向量输入激活函数,得到第一样本用户患有传染病的概率。
综上所述,上述训练装置通过设置n个样本用户中n1个第一样本用户有标签、n2个第二样本用户没有标签,训练图卷积神经网络,使得没有标签的样本用户仍参与数据的整合计算,但没有标签的样本用户的预测概率不参与图卷积神经网络的训练。
图17示出了本申请一个示例性实施例提供的图卷积神经网络的训练装置的结构框图,该装置采用有监督方式对图卷积神经网络进行训练,该装置包括:
获取模块1701,用于获取n1个第一样本用户的样本生理信息和样本位置信息;第一样本用户携带有标签,标签用于确定第一样本用户是否患有传染病;
计算模块1702,用于将与n1个第一样本用户的样本生理信息和样本位置信息对应的样本图网络输入图卷积神经网络,通过图卷积神经网络计算得到n1个第一样本用户的n1个样本特征向量;
计算模块1702,还用于针对n1个第一样本用户中的一个,基于第一样本用户的样本特征向量,通过概率计算网络得到第一样本用户患有传染病的预测概率;
训练模块1703,用于基于预测概率与n1个第一样本用户中患病样本用户所占比例的损失值,训练图卷积神经网络。
在一个可选的实施例中,概率计算网络包括激活函数。
在一个可选的实施例中,计算模块1702,还用于将第一样本用户的样本特征向量和第一样本用户的初始特征向量进行拼接,得到第一样本中间向量。
在一个可选的实施例中,计算模块1702,还用于将第一样本中间向量输入全连接网络,得到第二样本中间向量。
在一个可选的实施例中,计算模块1702,还用于将第二样本中间向量输入激活函数,得到第一样本用户患有传染病的概率。
综上所述,上述训练装置利用携带有标签的n1个第一样本用户,训练图卷积神经网络,实现了对图卷积神经网络的训练。
图18示出了本申请一个示例性实施例提供的计算机设备1800的结构框图。该计算机设备可以为终端或服务器,在本实施例可以简单描述为终端单独训练图卷积神经网络和/或终端单独使用图卷积神经网络,或,服务器单独训练图卷积神经网络和/或服务器单独使用图卷积神经网络,或,终端和服务器共同训练图像检索模型和/或终端和服务器共同使用图卷积神经网络。
通常,计算机设备1800包括有:处理器1801和存储器1802。
处理器1801可以包括一个或多个处理核心,比如4核心处理器、8核心处理器等。处理器1801可以采用DSP(Digital Signal Processing,数字信号处理)、FPGA(Field-Programmable Gate Array,现场可编程门阵列)、PLA(Programmable Logic Array,可编程逻辑阵列)中的至少一种硬件形式来实现。处理器1801也可以包括主处理器和协处理器,主处理器是用于对在唤醒状态下的数据进行处理的处理器,也称CPU(Central ProcessingUnit,中央处理器);协处理器是用于对在待机状态下的数据进行处理的低功耗处理器。在一些实施例中,处理器1801可以集成有GPU(Graphics Processing Unit,图像处理器),GPU用于负责显示屏所需要显示的内容的渲染和绘制。一些实施例中,处理器1801还可以包括AI处理器,该AI处理器用于处理有关机器学习的计算操作。
存储器1802可以包括一个或多个计算机可读存储介质,该计算机可读存储介质可以是非暂态的。存储器1802还可包括高速随机存取存储器,以及非易失性存储器,比如一个或多个磁盘存储设备、闪存存储设备。在一些实施例中,存储器1802中的非暂态的计算机可读存储介质用于存储至少一个指令,该至少一个指令用于被处理器1801所执行以实现本申请中方法实施例提供的传染病的预测方法或图卷积神经网络的训练方法。
在一些实施例中,计算机设备1800还可选包括有:***设备接口1803和至少一个***设备。处理器1801、存储器1802和***设备接口1803之间可以通过总线或信号线相连。各个***设备可以通过总线、信号线或电路板与***设备接口1803相连。具体地,***设备包括:射频电路1804、显示屏1805、摄像头组件1806、音频电路1807、定位组件1808和电源1809中的至少一种。
***设备接口1803可被用于将I/O(Input/Output,输入/输出)相关的至少一个***设备连接到处理器1801和存储器1802。在一些实施例中,处理器1801、存储器1802和***设备接口1803被集成在同一芯片或电路板上;在一些其他实施例中,处理器1801、存储器1802和***设备接口1803中的任意一个或两个可以在单独的芯片或电路板上实现,本实施例对此不加以限定。
射频电路1804用于接收和发射RF(Radio Frequency,射频)信号,也称电磁信号。射频电路1804通过电磁信号与通信网络以及其他通信设备进行通信。射频电路1804将电信号转换为电磁信号进行发送,或者,将接收到的电磁信号转换为电信号。可选地,射频电路1804包括:天线***、RF收发器、一个或多个放大器、调谐器、振荡器、数字信号处理器、编解码芯片组、用户身份模块卡等等。射频电路1804可以通过至少一种无线通信协议来与其它终端进行通信。该无线通信协议包括但不限于:万维网、城域网、内联网、各代移动通信网络(2G、3G、4G及5G)、无线局域网和/或WiFi(Wireless Fidelity,无线保真)网络。在一些实施例中,射频电路1804还可以包括NFC(Near Field Communication,近距离无线通信)有关的电路,本申请对此不加以限定。
显示屏1805用于显示UI(User Interface,用户界面)。该UI可以包括图形、文本、图标、视频及其它们的任意组合。当显示屏1805是触摸显示屏时,显示屏1805还具有采集在显示屏1805的表面或表面上方的触摸信号的能力。该触摸信号可以作为控制信号输入至处理器1801进行处理。此时,显示屏1805还可以用于提供虚拟按钮和/或虚拟键盘,也称软按钮和/或软键盘。在一些实施例中,显示屏1805可以为一个,设置在计算机设备1800的前面板;在另一些实施例中,显示屏1805可以为至少两个,分别设置在计算机设备1800的不同表面或呈折叠设计;在另一些实施例中,显示屏1805可以是柔性显示屏,设置在计算机设备1800的弯曲表面上或折叠面上。甚至,显示屏1805还可以设置成非矩形的不规则图形,也即异形屏。显示屏1805可以采用LCD(Liquid Crystal Display,液晶显示屏)、OLED(OrganicLight-Emitting Diode,有机发光二极管)等材质制备。
摄像头组件1806用于采集图像或视频。可选地,摄像头组件1806包括前置摄像头和后置摄像头。通常,前置摄像头设置在终端的前面板,后置摄像头设置在终端的背面。在一些实施例中,后置摄像头为至少两个,分别为主摄像头、景深摄像头、广角摄像头、长焦摄像头中的任意一种,以实现主摄像头和景深摄像头融合实现背景虚化功能、主摄像头和广角摄像头融合实现全景拍摄以及VR(Virtual Reality,虚拟现实)拍摄功能或者其它融合拍摄功能。在一些实施例中,摄像头组件1806还可以包括闪光灯。闪光灯可以是单色温闪光灯,也可以是双色温闪光灯。双色温闪光灯是指暖光闪光灯和冷光闪光灯的组合,可以用于不同色温下的光线补偿。
音频电路1807可以包括麦克风和扬声器。麦克风用于采集用户及环境的声波,并将声波转换为电信号输入至处理器1801进行处理,或者输入至射频电路1804以实现语音通信。出于立体声采集或降噪的目的,麦克风可以为多个,分别设置在计算机设备1800的不同部位。麦克风还可以是阵列麦克风或全向采集型麦克风。扬声器则用于将来自处理器1801或射频电路1804的电信号转换为声波。扬声器可以是传统的薄膜扬声器,也可以是压电陶瓷扬声器。当扬声器是压电陶瓷扬声器时,不仅可以将电信号转换为人类可听见的声波,也可以将电信号转换为人类听不见的声波以进行测距等用途。在一些实施例中,音频电路1807还可以包括耳机插孔。
定位组件1808用于定位计算机设备1800的当前地理位置,以实现导航或LBS(Location Based Service,基于位置的服务)。定位组件1808可以是基于美国的GPS(Global Positioning System,全球定位***)、中国的北斗***或俄罗斯的伽利略***的定位组件。
电源1809用于为计算机设备1800中的各个组件进行供电。电源1809可以是交流电、直流电、一次性电池或可充电电池。当电源1809包括可充电电池时,该可充电电池可以是有线充电电池或无线充电电池。有线充电电池是通过有线线路充电的电池,无线充电电池是通过无线线圈充电的电池。该可充电电池还可以用于支持快充技术。
在一些实施例中,计算机设备1800还包括有一个或多个传感器1810。该一个或多个传感器1810包括但不限于:加速度传感器1811、陀螺仪传感器1812、压力传感器1813、指纹传感器1814、光学传感器1815以及接近传感器1816。
加速度传感器1811可以检测以计算机设备1800建立的坐标系的三个坐标轴上的加速度大小。比如,加速度传感器1811可以用于检测重力加速度在三个坐标轴上的分量。处理器1801可以根据加速度传感器1811采集的重力加速度信号,控制显示屏1805以横向视图或纵向视图进行用户界面的显示。加速度传感器1811还可以用于游戏或者用户的运动数据的采集。
陀螺仪传感器1812可以检测计算机设备1800的机体方向及转动角度,陀螺仪传感器1812可以与加速度传感器1811协同采集用户对计算机设备1800的3D动作。处理器1801根据陀螺仪传感器1812采集的数据,可以实现如下功能:动作感应(比如根据用户的倾斜操作来改变UI)、拍摄时的图像稳定、游戏控制以及惯性导航。
压力传感器1813以设置在计算机设备1800的侧边框和/或显示屏1805的下层。当压力传感器1813设置在计算机设备1800的侧边框时,可以检测用户对计算机设备1800的握持信号,由处理器1801根据压力传感器1813采集的握持信号进行左右手识别或快捷操作。当压力传感器1813设置在显示屏1805的下层时,由处理器1801根据用户对显示屏1805的压力操作,实现对UI界面上的可操作性控件进行控制。可操作性控件包括按钮控件、滚动条控件、图标控件、菜单控件中的至少一种。
指纹传感器1814用于采集用户的指纹,由处理器1801根据指纹传感器1814采集到的指纹识别用户的身份,或者,由指纹传感器1814根据采集到的指纹识别用户的身份。在识别出用户的身份为可信身份时,由处理器1801授权该用户执行相关的敏感操作,该敏感操作包括解锁屏幕、查看加密信息、下载软件、支付及更改设置等。指纹传感器1814可以被设置在计算机设备1800的正面、背面或侧面。当计算机设备1800上设置有物理按键或厂商Logo时,指纹传感器1814可以与物理按键或厂商Logo集成在一起。
光学传感器1815用于采集环境光强度。在一个实施例中,处理器1801可以根据光学传感器1815采集的环境光强度,控制显示屏1805的显示亮度。具体地,当环境光强度较高时,调高显示屏1805的显示亮度;当环境光强度较低时,调低显示屏1805的显示亮度。在另一个实施例中,处理器1801还可以根据光学传感器1815采集的环境光强度,动态调整摄像头组件1806的拍摄参数。
接近传感器1816,也称距离传感器,通常设置在计算机设备1800的前面板。接近传感器1816用于采集用户与计算机设备1800的正面之间的距离。在一个实施例中,当接近传感器1816检测到用户与计算机设备1800的正面之间的距离逐渐变小时,由处理器1801控制显示屏1805从亮屏状态切换为息屏状态;当接近传感器1816检测到用户与计算机设备1800的正面之间的距离逐渐变大时,由处理器1801控制显示屏1805从息屏状态切换为亮屏状态。
本领域技术人员可以理解,图18中示出的结构并不构成对计算机设备1800的限定,可以包括比图示更多或更少的组件,或者组合某些组件,或者采用不同的组件布置。
本申请还提供一种计算机可读存储介质,所述存储介质中存储有至少一条指令、至少一段程序、代码集或指令集,所述至少一条指令、所述至少一段程序、所述代码集或指令集由处理器加载并执行以实现上述方法实施例提供的传染病预测方法和图卷积神经网络的训练方法。
本申请提供了一种计算机程序产品或计算机程序,该计算机程序产品或计算机程序包括计算机指令,该计算机指令存储在计算机可读存储介质中。计算机设备的处理器从计算机可读存储介质读取该计算机指令,处理器执行该计算机指令,使得该计算机设备执行上述方法实施例提供的传染病预测方法和图卷积神经网络的训练方法。
上述本申请实施例序号仅仅为了描述,不代表实施例的优劣。
本领域普通技术人员可以理解实现上述实施例的全部或部分步骤可以通过硬件来完成,也可以通过程序来指令相关的硬件完成,所述的程序可以存储于一种计算机可读存储介质中,上述提到的存储介质可以是只读存储器,磁盘或光盘等。
以上所述仅为本申请的可选实施例,并不用以限制本申请,凡在本申请的精神和原则之内,所作的任何修改、等同替换、改进等,均应包含在本申请的保护范围之内。

Claims (15)

1.一种传染病预测方法,其特征在于,所述方法包括:
获取第一用户的第一生理信息和第一位置信息,所述第一生理信息是所述第一用户与所述传染病相关的生理信息,所述第一位置信息指示所述第一用户所在的位置;
基于所述第一生理信息和所述第一位置信息,在所述传染病的基础图网络中添加第一用户节点,得到更新后的图网络;所述基础图网络包括至少一个用户节点和/或至少一个地区节点,所述用户节点标识疑似患有所述传染病的用户,所述地区节点标识疑似患有所述传染病的用户所在的地区;
将所述更新后的图网络输入图卷积神经网络,预测得到所述第一用户节点的第一用户特征向量;以及,基于所述第一用户特征向量,通过概率计算网络预测所述第一用户患有所述传染病的概率。
2.根据权利要求1所述的方法,其特征在于,所述基础图网络包括第一地区节点,所述更新后的图网络包括第一图网络,所述第一地区节点标识疑似患有所述传染病的用户所在的第一地区;
所述基于所述第一生理信息和所述第一位置信息,在所述传染病的基础图网络中添加第一用户节点,得到更新后的图网络,包括:
基于所述第一生理信息,在所述基础图网络中生成第一用户节点;
在所述第一位置信息指示的所述第一用户所在的位置落入所述第一地区的情况下,在所述基础图网络中将所述第一用户节点与所述第一地区节点进行连边操作,形成第一图网络。
3.根据权利要求2所述的方法,其特征在于,所述图卷积神经网络包括k个图卷积层;
所述将更新后的图网络输入图卷积神经网络,预测得到所述第一用户的第一用户特征向量,包括:
基于所述第一图网络中所述第一地区节点携带的历史患病信息,得到所述初始地区特征向量;基于所述第一图网络中所述第一用户节点携带的第一生理信息,得到初始用户特征向量;
基于所述初始地区特征向量和所述初始用户特征向量,计算得到第1层地区特征向量;基于所述初始地区特征向量和所述初始用户特征向量,计算得到第1层用户特征向量;
基于第i-1层地区特征向量和第i-1层用户特征向量,计算得到第i层地区特征向量;基于所述第i-1层地区特征向量和所述第i-1层用户特征向量,计算得到第i层用户特征向量;
将第k层用户特征向量输出为所述第一用户特征向量,k为大于1的整数,i为大于0且小于k的整数。
4.根据权利要求1所述的方法,其特征在于,所述基础图网络包括第一地区节点和与所述第一地区节点相连的第二地区节点,所述更新后的图网络包括第二图网络,所述第一地区节点标识疑似患有所述传染病的用户所在的第一地区,所述第二地区节点标识疑似患有所述传染病的用户所在的第二地区;
所述基于所述第一生理信息和所述第一位置信息,在所述传染病的基础图网络中添加第一用户节点,得到更新后的图网络,包括:
基于所述第一生理信息,在所述基础图网络中生成第一用户节点;
在所述第一位置信息指示的所述第一用户所在的位置落入所述第一地区的情况下,在所述基础图网络中将所述第一用户节点与所述第一地区节点进行连边操作,形成第二图网络;
其中,所述第二地区节点与所述第一地区节点之间的人口流动数量达到数量阈值,和/或,所述第二地区节点与所述第一地区节点分别指示的地区之间的距离低于第一距离阈值。
5.根据权利要求4所述的方法,其特征在于,所述图卷积神经网络包括k个图卷积层;
所述将更新后的图网络输入图卷积神经网络,预测得到所述第一用户的第一用户特征向量,包括:
基于所述第二图网络中所述第一地区节点携带的历史患病信息,得到所述第一地区节点的初始地区特征向量;基于所述第二图网络中所述第二地区节点携带的历史患病信息,得到所述第二地区节点的初始地区特征向量;基于所述第二图网络中所述第一用户节点携带的第一生理信息,得到初始用户特征向量;
基于所述第一地区节点的初始地区特征向量、所述第二地区节点的初始地区特征向量和所述初始用户特征向量,结合第一权重,计算得到所述第一地区节点的第1层地区特征向量,所述第一权重与所述第一地区节点和所述第二地区节点之间的人口流动数量相关联;基于所述第一地区节点的初始地区特征向量和所述初始用户特征向量,计算得到第1层用户特征向量;
基于所述第一地区节点的第i-1层地区特征向量、所述第二地区节点的第i-1层地区特征向量和第i-1层用户特征向量,结合所述第一权重,计算得到所述第一地区节点的第i层地区特征向量;基于所述第一地区节点的第i-1层地区特征向量和所述第i-1层用户特征向量,计算得到第i层用户特征向量;
将第k层用户特征向量输出为所述第一用户特征向量,k为大于1的整数,i为大于0且小于k的整数。
6.根据权利要求1所述的方法,其特征在于,所述基础图网络包括第一地区节点和与所述第一地区节点相连的第二用户节点,所述更新后的图网络包括第三图网络,所述第一地区节点标识疑似患有所述传染病的用户所在的第一地区,所述第二用户节点标识疑似患有所述传染病的第二用户;
所述基于所述第一生理信息和所述第一位置信息,在所述传染病的第一图网络中添加第一用户节点,得到处理后的图网络,包括:
基于所述第一生理信息,在所述基础图网络中生成第一用户节点;
在所述第一位置信息指示的所述第一用户所在的位置落入所述第一地区的情况下,在所述基础图网络中将所述第一用户节点与所述第一地区节点进行连边操作,形成第三图网络;
其中,所述第二用户节点指示的第二用户所在的位置落入所述第一地区。
7.根据权利要求6所述的方法,其特征在于,所述图卷积神经网络包括k个图卷积层;
所述将所述更新后的图网络输入图卷积神经网络,预测得到所述第一用户的第一用户特征向量,包括:
基于所述第三图网络中所述第一地区节点携带的历史患病信息,得到初始地区特征向量;基于所述第三图网络中所述第一用户节点携带的所述第一生理信息,得到所述第一用户节点的初始用户特征向量;基于所述第三图网络中所述第二用户节点携带的第二生理信息,得到所述第二用户节点的初始用户特征向量;
基于所述初始地区特征向量、所述第一用户节点的初始用户特征向量和所述第二用户节点的初始用户特征向量,计算得到第1层地区特征向量;基于所述初始地区特征向量和所述第一用户节点的初始用户特征向量,计算得到所述第一用户节点的第1层用户特征向量;
基于第i-1层地区特征向量、所述第一用户节点的第i-1层用户特征向量和所述第二用户节点的第i-1层用户特征向量,计算得到第i层地区特征向量;基于第i-1层地区特征向量和所述第一用户节点的第i-1层用户特征向量,计算得到所述第一用户节点的第i层用户特征向量;
将所述第一用户节点的第k层用户特征向量输出为所述第一用户特征向量,k为大于1的整数,i为大于0且小于k的整数。
8.根据权利要求1所述的方法,其特征在于,所述基础图网络包括第三用户节点,所述更新后的图网络包括第四图网络,所述第三用户节点标识疑似患有所述传染病的第三用户,所述第三用户节点携带有所述第三用户的第三生理信息和第三位置信息;
所述基于所述第一生理信息和所述第一位置信息,在所述传染病的第一图网络中添加第一用户节点,得到处理后的图网络,包括:
基于所述第一生理信息,在所述基础图网络中生成第一用户节点;
在所述第一生理信息与所述第三生理信息之间的相似度大于相似度阈值,和/或,所述第一位置信息与所述第三位置信息分别指示的位置之间的距离小于第二距离阈值的情况下,在所述基础图网络中将所述第一用户节点与所述第三用户节点进行连边操作,形成第四图网络。
9.根据权利要求8所述的方法,其特征在于,所述图卷积神经网络包括k个图卷积层;
所述将所述处理后的图网络输入图卷积神经网络,得到所述第一用户的第一用户特征向量,包括:
基于所述第四图网络中所述第一用户节点携带的所述第一生理信息,得到所述第一用户节点的初始用户特征向量;基于所述第四图网络中所述第三用户节点携带的所述第三生理信息,得到所述第三用户节点的初始用户特征向量;
基于所述第一用户节点的初始用户特征向量和所述第三用户节点的初始用户特征向量,结合第二权重,计算得到所述第一用户节点的第1层用户特征向量和所述第三用户节点的第1层用户特征向量,所述第二权重与所述第一生理信息和所述第三生理信息之间的相似度、所述第一位置信息和所述第三位置信息分别指示的位置之间的距离中的至少一个相关联;
基于所述第一用户节点的第i-1层用户特征向量和所述第三用户节点的第i-1层用户特征向量,结合所述第二权重,计算得到第一用户节点的第i层用户特征向量和所述第三用户节点的第i层用户特征向量;
将所述第一用户节点的第k层用户特征向量输出为所述第一用户特征向量,k为大于1的整数,i为大于0且小于k的整数。
10.根据权利要求3或5或7或9所述的方法,其特征在于,所述概率计算网络包括激活函数;
所述基于所述第一用户特征向量,通过概率计算网络预测所述第一用户患有所述传染病的概率,包括:
将所述第一用户特征向量和所述第一用户节点的初始用户特征向量进行拼接,得到第一中间向量;
将所述第一中间向量输入全连接网络,得到第二中间向量;
将所述第二中间向量输入激活函数,预测所述第一用户患有所述传染病的概率。
11.一种图卷积神经网络的训练方法,其特征在于,所述方法用于训练如权利要求1所述的图卷积神经网络,所述训练方法采用半监督模式,所述方法包括:
获取n个样本用户的样本生理信息和样本位置信息;所述n个样本用户包括n1个第一样本用户和n2个第二样本用户,所述第一样本用户携带有标签,所述标签用于确定所述第一样本用户是否患有所述传染病,所述第二样本用户未携带有所述标签;
将与所述n个样本用户的样本生理信息和样本位置信息对应的样本图网络输入所述图卷积神经网络,通过所述图卷积神经网络计算得到所述n个样本用户的n个样本特征向量;
针对所述n1个第一样本用户中的一个,基于所述第一样本用户的样本特征向量,通过所述概率计算网络得到所述第一样本用户患有所述传染病的预测概率;
基于所述预测概率与所述n1个第一样本用户中患病样本用户所占比例的损失值,训练所述图卷积神经网络。
12.一种传染病预测装置,其特征在于,所述装置包括:
获取模块,用于获取第一用户的第一生理信息和第一位置信息,所述第一生理信息是所述第一用户与所述传染病相关的生理信息,所述第一位置信息指示所述第一用户所在的位置;
更新模块,用于基于所述第一生理信息和所述第一位置信息,在所述传染病的基础图网络中添加第一用户节点,得到更新后的图网络;所述基础图网络包括至少一个用户节点和/或至少一个地区节点,所述用户节点标识疑似患有所述传染病的用户,所述地区节点标识疑似患有所述传染病的用户所在的地区;
预测模块,用于将所述更新后的图网络输入图卷积神经网络,预测得到第一用户的第一用户特征向量;以及,基于所述第一用户特征向量,通过概率计算网络预测所述第一用户患有所述传染病的概率。
13.一种图卷积神经网络的训练装置,其特征在于,所述装置包括:
获取模块,用于获取n个样本用户的样本生理信息和样本位置信息;所述n个样本用户包括n1个第一样本用户和n2个第二样本用户,所述第一样本用户携带有标签,所述标签用于确定所述第一样本用户是否患有所述传染病,所述第二样本用户未携带有所述标签;
计算模块,用于将所述n个样本用户的样本生理信息和样本位置信息输入所述图卷积神经网络,通过所述图卷积神经网络计算得到所述n个样本用户的n个样本特征向量;
计算模块,还用于针对所述n1个第一样本用户中的一个,基于所述第一样本用户的样本特征向量,通过所述概率计算网络得到所述第一样本用户患有所述传染病的预测概率;
训练模块,用于基于所述预测概率与所述n1个第一样本用户中患病样本用户所占比例的损失值,训练所述图卷积神经网络。
14.一种计算机设备,其特征在于,所述计算机设备包括:处理器和存储器,所述存储器存储有计算机程序,所述计算机程序由所述处理器加载并执行以实现如权利要求1至10任一所述的传染病预测方法,和/或,权利要求11所述图卷积神经网络的训练方法。
15.一种计算机可读存储介质,其特征在于,所述计算机可读存储介质存储有计算机程序,所述计算机程序由处理器加载并执行以实现如权利要求1至10任一所述的传染病预测方法,和/或,权利要求11所述图卷积神经网络的训练方法。
CN202111201853.8A 2021-10-15 2021-10-15 传染病预测和训练方法、装置、设备及介质 Pending CN113936809A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202111201853.8A CN113936809A (zh) 2021-10-15 2021-10-15 传染病预测和训练方法、装置、设备及介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202111201853.8A CN113936809A (zh) 2021-10-15 2021-10-15 传染病预测和训练方法、装置、设备及介质

Publications (1)

Publication Number Publication Date
CN113936809A true CN113936809A (zh) 2022-01-14

Family

ID=79279870

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202111201853.8A Pending CN113936809A (zh) 2021-10-15 2021-10-15 传染病预测和训练方法、装置、设备及介质

Country Status (1)

Country Link
CN (1) CN113936809A (zh)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN115862888A (zh) * 2023-02-17 2023-03-28 之江实验室 传染病感染情况预测方法、***、设备及存储介质

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN115862888A (zh) * 2023-02-17 2023-03-28 之江实验室 传染病感染情况预测方法、***、设备及存储介质

Similar Documents

Publication Publication Date Title
CN112884770B (zh) 图像分割处理方法、装置及计算机设备
CN108288032B (zh) 动作特征获取方法、装置及存储介质
CN111104980B (zh) 确定分类结果的方法、装置、设备及存储介质
CN111680697B (zh) 实现领域自适应的方法、装置、电子设备及介质
CN111127509B (zh) 目标跟踪方法、装置和计算机可读存储介质
CN111027490B (zh) 人脸属性识别方法及装置、存储介质
CN110933468A (zh) 播放方法、装置、电子设备及介质
CN111897996A (zh) 话题标签推荐方法、装置、设备及存储介质
CN110570460A (zh) 目标跟踪方法、装置、计算机设备及计算机可读存储介质
WO2022193973A1 (zh) 图像处理方法、装置、电子设备、计算机可读存储介质及计算机程序产品
CN111738365B (zh) 图像分类模型训练方法、装置、计算机设备及存储介质
CN112002391A (zh) 检查顺序的确定方法、装置、电子设备及存储介质
CN113918767A (zh) 视频片段定位方法、装置、设备及存储介质
CN113257412B (zh) 信息处理方法、装置、计算机设备及存储介质
CN110166275B (zh) 信息处理方法、装置及存储介质
CN111353513B (zh) 一种目标人群筛选的方法、装置、终端和存储介质
CN113936809A (zh) 传染病预测和训练方法、装置、设备及介质
CN111898535A (zh) 目标识别方法、装置及存储介质
CN111563201A (zh) 内容推送方法、装置、服务器及存储介质
CN112925922A (zh) 获取地址的方法、装置、电子设备及介质
CN110990549A (zh) 获取答案的方法、装置、电子设备及存储介质
CN114328948A (zh) 文本标准化模型的训练方法、文本标准化方法及装置
CN113139614A (zh) 特征提取方法、装置、电子设备及存储介质
CN113569894A (zh) 图像分类模型的训练方法、图像分类方法、装置及设备
CN113516723A (zh) 人脸图片加密方法、装置、计算机设备及存储介质

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination