CN114783601A - 一种生理数据的分析方法、装置、电子设备和存储介质 - Google Patents

一种生理数据的分析方法、装置、电子设备和存储介质 Download PDF

Info

Publication number
CN114783601A
CN114783601A CN202210315874.0A CN202210315874A CN114783601A CN 114783601 A CN114783601 A CN 114783601A CN 202210315874 A CN202210315874 A CN 202210315874A CN 114783601 A CN114783601 A CN 114783601A
Authority
CN
China
Prior art keywords
physiological data
data analysis
analyzed
preset
state information
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202210315874.0A
Other languages
English (en)
Inventor
何峻青
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Tencent Technology Shenzhen Co Ltd
Original Assignee
Tencent Technology Shenzhen Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Tencent Technology Shenzhen Co Ltd filed Critical Tencent Technology Shenzhen Co Ltd
Priority to CN202210315874.0A priority Critical patent/CN114783601A/zh
Publication of CN114783601A publication Critical patent/CN114783601A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16HHEALTHCARE INFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR THE HANDLING OR PROCESSING OF MEDICAL OR HEALTHCARE DATA
    • G16H50/00ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics
    • G16H50/30ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics for calculating health indices; for individual health risk assessment
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/24Classification techniques
    • G06F18/241Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches
    • G06F18/2415Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches based on parametric or probabilistic models, e.g. based on likelihood ratio or false acceptance rate versus a false rejection rate
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16HHEALTHCARE INFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR THE HANDLING OR PROCESSING OF MEDICAL OR HEALTHCARE DATA
    • G16H10/00ICT specially adapted for the handling or processing of patient-related medical or healthcare data
    • G16H10/60ICT specially adapted for the handling or processing of patient-related medical or healthcare data for patient-specific data, e.g. for electronic patient records

Landscapes

  • Engineering & Computer Science (AREA)
  • Data Mining & Analysis (AREA)
  • Public Health (AREA)
  • Medical Informatics (AREA)
  • Health & Medical Sciences (AREA)
  • Physics & Mathematics (AREA)
  • Primary Health Care (AREA)
  • General Health & Medical Sciences (AREA)
  • Epidemiology (AREA)
  • Theoretical Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Evolutionary Computation (AREA)
  • Evolutionary Biology (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Biomedical Technology (AREA)
  • Databases & Information Systems (AREA)
  • General Engineering & Computer Science (AREA)
  • Pathology (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Artificial Intelligence (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Probability & Statistics with Applications (AREA)
  • Measuring And Recording Apparatus For Diagnosis (AREA)

Abstract

本申请涉及数据分析技术领域,尤其涉及人工智能技术领域,提供一种生理数据的分析方法、装置、电子设备和存储介质,用以提高生理数据的分析准确性。其中,方法包括:获取待分析对象的原始状态信息及至少一类对象属性信息;基于对应各预设状态信息配置的条件概率,对原始状态信息进行特征提取,获得相应的第一中间结果;分别对至少一类对象属性信息进行特征提取,获得至少一类对象属性信息各自对应的第二中间结果;基于第一中间结果和至少一个第二中间结果,确定待分析对象对应各类预设生理数据分析结果的类别概率,并基于各个类别概率,确定待分析对象的目标生理数据分析结果。这样,结合对应预设状态信息配置的条件概率,可有效提高分析准确性。

Description

一种生理数据的分析方法、装置、电子设备和存储介质
技术领域
本申请涉及数据分析技术领域,尤其涉及人工智能技术领域,提供一种生理数据的分析方法、装置、电子设备和存储介质。
背景技术
随着计算机技术的发展,医疗领域对计算机的应用也越来越多,例如,对对象的生理数据进行电子化以便进行医学统计分析;借助神经网络,依据对象的生理数据进行分析。
以智能问诊为例,对象可以将出现的症状等生理数据输入至自动问诊***,获得自动问诊***输出的该症状可能匹配的分析结果,以便对象可以根据得到的分析结果进行后续的就医或者是自行治疗。
相关技术的自动问诊***中,对于生理数据分析方法一般是基于大量的标注数据建立机器学习模型或者神经网络模型实现的,建立机器学习模型或者神经网络模型所需要的数据量较大、标注成本高。而使用知识驱动的方法,通常不能根据数据自动调整知识,需要耗费大量人力手动调整、校对知识,且不能实时查看各个知识调整后的结果,容易产生误判,导致准确性受影响。
因而,如何有效提高生理数据的分析准确性是亟待解决的。
发明内容
本申请实施例提供一种生理数据的分析方法、装置、电子设备和存储介质,用以提高生理数据的分析准确性。
本申请实施例提供的一种生理数据的分析方法,包括:
获取待分析对象的原始状态信息,以及与所述待分析对象相关的至少一类对象属性信息;其中,所述原始状态信息包含所述待分析对象在自身所处环境下的生理数据;
基于对应各预设状态信息配置的条件概率,对所述原始状态信息进行特征提取,获得相应的第一中间结果;所述条件概率表示在一个预设生理数据分析结果的条件下一个预设状态信息出现的概率;
分别对所述至少一类对象属性信息进行特征提取,获得所述至少一类对象属性信息各自对应的第二中间结果;
基于所述第一中间结果和至少一个第二中间结果,确定所述待分析对象对应各类预设生理数据分析结果的类别概率,并基于各个类别概率,确定所述待分析对象的目标生理数据分析结果。
本申请实施例提供的一种生理数据的分析装置,包括:
信息获取单元,用于获取待分析对象的原始状态信息,以及与所述待分析对象相关的至少一类对象属性信息;其中,所述原始状态信息包含所述待分析对象在自身所处环境下的生理数据;
特征提取单元,用于基于对应各预设状态信息配置的条件概率,对所述原始状态信息进行特征提取,获得相应的第一中间结果;所述条件概率表示在一个预设生理数据分析结果的条件下一个预设状态信息出现的概率;
所述特征提取单元,还用于分别对所述至少一类对象属性信息进行特征提取,获得所述至少一类对象属性信息各自对应的第二中间结果;
结果分析单元,用于基于所述第一中间结果和至少一个第二中间结果,确定所述待分析对象对应各类预设生理数据分析结果的类别概率,并基于各个类别概率,确定所述待分析对象的目标生理数据分析结果。
可选的,所述特征提取单元具体用于:
分别获取各个预设生理数据分析结果下,各预设状态信息各自的条件概率,并基于获得的各个条件概率,确定用于进行特征提取的第一权重矩阵;
基于所述第一权重矩阵,对所述原始状态信息进行特征提取,获得相应的第一中间结果。
可选的,所述特征提取单元具体用于:
对于所述至少一类对象属性信息中的每一类对象属性信息,分别执行以下操作:
对于一类对象属性信息,基于各预设生理数据分析结果与所述一类对象属性信息之间的匹配关联程度,确定用于对所述一类对象属性信息进行特征提取的第二权重矩阵;
基于所述第二权重矩阵,对所述一类对象属性信息进行特征提取,获得对应的第二中间结果。
可选的,所述特征提取单元具体用于:
将所述待分析对象的所述原始状态信息,输入已训练的目标分析模型中的第一特征网络;
基于所述第一特征网络,对所述原始状态信息进行特征提取,获得所述第一中间结果,其中,所述第一特征网络中的第一权重矩阵是基于所述条件概率确定的。
可选的,所述特征提取单元具体用于:
将所述待分析对象的至少一类对象属性信息,分别输入所述目标分析模型中相应的第二特征网络,其中,每个第二特征网络对应一类对象属性信息;
分别基于所述至少一类对象属性信息各自相应的第二特征网络,对相应的对象属性信息进行特征提取,获得相应的第二中间结果。
可选的,所述装置还包括:
模型训练单元,用于通过下列方式训练得到所述目标分析模型:
获取样本数据集,所述样本数据集中的每个样本数据包括一个样本对象,所述样本对象的原始状态信息,至少一类对象属性信息,以及所述样本对象的生理数据分析结果标签;
根据所述样本数据集对待训练的分析模型进行循环迭代训练,输出相应的目标分析模型;其中,在一次循环迭代过程中,执行以下操作:
将选取的样本数据输入所述待训练的分析模型,获得所述样本对象对应各类预设生理数据分析结果的类别概率;
采用基于所述样本对象对应各类预设生理数据分析结果的类别概率和所述生理数据分析结果标签,构建的目标损失函数,对所述待训练的分析模型进行参数调整。
可选的,在所述待训练的分析模型中,所述原始状态信息对应的特征网络中的第一权重矩阵是:基于所述条件概率初始化得到的;所述至少一类对象属性信息各自对应的特征网络中的第二权重矩阵是:基于各预设生理数据分析结果与各自之间的匹配关联程度初始化得到的;
则所述模型训练单元具体用于:
基于所述目标损失函数,对所述第一权重矩阵和各个第二权重矩阵进行参数调整。
可选的,所述模型训练单元具体用于:
将初始的样本数据按照预设生理数据分析结果类别划分为至少一个样本数据子集,并确定各预设生理数据分析结果类别对应的样本数据子集中的样本数量;
将样本数量未达到预设数量的样本数据子集中的样本数据,进行上采样处理,获得至少一个上采样的样本数据;
基于所述上采样的样本数据和所述初始的样本数据,构建所述样本数据集。
可选的,所述结果分析单元具体用于:
确定由所述第一中间结果和所述至少一个第二中间结果,进行累加求和得到的求和结果;
对所述求和结果进行归一化处理,获得所述待分析对象对应各类预设生理数据分析结果的类别概率。
可选的,所述对象属性信息包括下列至少一类:对象年龄信息,对象就诊时间信息、对象性别信息。
可选的,所述基于各个类别概率,确定所述待分析对象的目标生理数据分析结果,包括:
将各个类别概率中达到参考阈值的类别概率对应的预设生理数据分析结果,作为所述待分析对象的目标生理数据分析结果;或
将各个类别概率进行排序,并将排序结果在指定次序范围内的类别概率对应的预设生理数据分析结果,作为所述待分析对象的目标生理数据分析结果。
本申请实施例提供的一种电子设备,包括处理器和存储器,其中,所述存储器存储有计算机程序,当所述计算机程序被所述处理器执行时,使得所述处理器执行上述任意一种生理数据的分析方法的步骤。
本申请实施例提供一种计算机可读存储介质,其包括计算机程序,当所述计算机程序在电子设备上运行时,所述计算机程序用于使所述电子设备执行上述任意一种生理数据的分析方法的步骤。
本申请实施例提供一种计算机程序产品,所述计算机程序产品包括计算机程序,所述计算机程序存储在计算机可读存储介质中;当电子设备的处理器从计算机可读存储介质读取所述计算机程序时,所述处理器执行所述计算机程序,使得所述电子设备执行上述任意一种生理数据的分析方法的步骤。
本申请有益效果如下:
本申请实施例提供了一种生理数据的分析方法、装置、电子设备和存储介质。由于本申请实施例中,基于对应各预设状态信息配置的条件概率,对所述原始状态信息进行特征提取,由于每个条件概率表示在一个预设生理数据分析结果的条件下一个预设状态信息出现的概率,因而,基于此来对原始状态信息进行特征提取时,可以更加偏向的提取到与这些原始状态信息更加关联的生理数据分析结果,可提高特征提取的准确性;此外,还将待分析对象的原始状态信息及与生理数据分析结果相关的对象属性信息相结合,进行多类别多标签分类,基于各预设生理数据分析结果各自对应的类别概率,来确定针对待分析对象的目标生理数据分析结果。进一步提高准确性。
本申请的其它特征和优点将在随后的说明书中阐述,并且,部分地从说明书中变得显而易见,或者通过实施本申请而了解。本申请的目的和其他优点可通过在所写的说明书、权利要求书、以及附图中所特别指出的结构来实现和获得。
附图说明
此处所说明的附图用来提供对本申请的进一步理解,构成本申请的一部分,本申请的示意性实施例及其说明用于解释本申请,并不构成对本申请的不当限定。在附图中:
图1为本申请实施例中的一种应用场景的一个可选的示意图;
图2为本申请实施例中的一种智能问诊界面的示意图;
图3为本申请实施例中的一种生理数据的分析方法的流程示意图;
图4为本申请实施例中的一种预设生理数据分析结果与预设状态信息之间的对应关系示意图;
图5为本申请实施例中的一种将待分析对象的原始状态信息和对象属性信息输入模型后的处理过程示意图;
图6为本申请实施例中的一种模型训练方法的流程示意图;
图7为本申请实施例中的一种分析模型的结构示意图;
图8为本申请实施例中的一种样本数据扩充的方法示意图;
图9A为本申请实施例中的一种生理数据的分析方法的具体流程示意图;
图9B为本申请实施例中一种生理数据的分析方法的具体场景的示意图;
图10为本申请实施例中的一种生理数据的分析装置的组成结构示意图;
图11为应用本申请实施例的一种电子设备的一个硬件组成结构示意图;
图12为应用本申请实施例的又一种电子设备的一个硬件组成结构示意图。
具体实施方式
为使本申请实施例的目的、技术方案和优点更加清楚,下面将结合本申请实施例中的附图,对本申请的技术方案进行清楚、完整地描述,显然,所描述的实施例是本申请技术方案的一部分实施例,而不是全部的实施例。基于本申请文件中记载的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都属于本申请技术方案保护的范围。
下面对本申请实施例中涉及的部分概念进行介绍。
状态信息:用于表征对象在一定环境下的生理数据。在本申请实施例中,具体分为:预设状态信息,和针对待分析对象的原始状态信息两类;其中,原始状态信息表征待分析对象在自身所处环境下的生理数据;而预设状态信息是通过统计分析等方式确定的一些样本对象的历史的生理数据。
对象属性信息:表征对象自身的一些特征信息,或者与对象的生理数据分析结果相关的一些特征信息,比如对象年龄、对象性别、对象就诊时间、就诊历史等。
生理数据分析结果:指基于对象的生理数据,对对象自身的健康状态、情绪状态等进行分析获得的结果。在本申请实施例中,生理数据分析结果可表征对象的情绪波动情况,如喜、怒、悲、恐;还可表征对象的身体状况,如简单表示为健康、亚健康、不健康等,也可具体细分为各类疾病。其中,生理数据分析结果也可具体分为两大类:预设生理数据分析结果和目标生理数据分析结果。其中,预设生理数据分析结果是指在本申请实施例中,通过统计分析等方式预先设置的一些不同类别的生理数据分析结果,比如:感冒、中暑等;而目标生理数据分析结果是从预设生理数据分析结果中筛选出来的一个或多个生理数据分析结果。
知识图谱(Knowledge Graph):又叫知识域可视化或者知识领域映射地图,是显示知识发展进程与结构关系的一系列各种不同的图形。知识图谱使用可视化技术描述知识,挖掘、分析、构建、绘制和显示知识及它们之间的相互联系。知识图谱,是通过将应用数学、图形学、信息可视化技术、信息科学等学科的理论与方法与计量学引文分析、共现分析等方法结合,并利用可视化的图谱形象地展示学科的核心结构、发展历史、前沿领域以及整体知识架构达到多学科融合目的的现代理论。在本申请实施例中,知识图谱可在医疗诊断、智能问诊中应用,为疾病诊断提供有效的辅助。
条件概率:就是事件A在另外一个事件B已经发生条件下的发生概率。条件概率表示为P(A|B),读作“在B条件下A的概率”。需要注意的是,在这些定义中A与B之间不一定有因果或者时间顺序关系。A可能会先于B发生,也可能相反,也可能二者同时发生。A可能会导致B的发生,也可能相反,也可能二者之间根本就没有因果关系。条件概率公式例如考虑一些可能是新的信息的概率条件性可以通过贝叶斯定理实现。
加法神经网络模型(Neural Additive Models,NAM)和特征网络:NAM用语对各类特征使用神经网络预测各类特征映射到最终类别的概率或得分,之后对这些概率或得分直接求和,正则化之后得到结果。特征网络是NAM中计算各项特征对于最终类别的概率的子网络。
中间结果:在本申请实施例中,中间结果是指获取到最终与待分析对象对应的目标生理数据分析结果之前,得到的一个结果,可分为与原始状态信息对应的第一中间结果,与对象属性信息对应的第二中间结果两大类。其中,第一中间结果具体表征:基于原始状态信息预测得到的,各个预设生理数据分析结果可能为待分析对象对应的分析结果的概率或得分;第二中间结果具体表征:基于对象属性信息预测得到的,各个预设生理数据分析结果可能为待分析对象对应的分析结果的概率或得分。基于第一中间结果和第二中间结果进行一些数据处理,可获得最终待分析对象对应的目标生理数据分析结果。
微调(Fine-tune):指使用数据对已初始化参数的网络进行训练,更新参数。在本申请实施例中,需要对分析模型进行微调。
样本数据集:本申请实施例中的样本数据集可分为训练集和验证集两部分。一个机器学习模型通常包括两个部分的参数:模型参数和超参数。其中超参数是用于控制模型行为的参数,这些参数不是通过模型本身学习而来的,例如学习率是超参数。其中,训练集用于调整模型参数,而验证集则用于调整超参数,例如调整学习率。
本申请实施例涉及人工智能(Artificial Intelligence,AI)、自然语言处理(Nature Language processing,NLP)和机器学习技术(Machine Learning,ML),基于人工智能中的计算机视觉技术和机器学习而设计。
人工智能是利用数字计算机或者数字计算机控制的机器模拟、延伸和扩展人的智能,感知环境、获取知识并使用知识获得最佳结果的理论、方法、技术及应用***。换句话说,人工智能是计算机科学的一个综合技术,它企图了解智能的实质,并生产出一种新的能以人类智能相似的方式做出反应的智能机器。
人工智能也就是研究各种智能机器的设计原理与实现方法,使机器具有感知、推理与决策的功能。人工智能技术主要包括计算机视觉技术、自然语言处理技术、以及机器学习/深度学习、自动驾驶、智慧交通等几大方向。随着人工智能技术研究和进步,人工智能在多个领域展开研究和应用,例如常见的智能家居、智能客服、虚拟助理、智能音箱、智能营销、无人驾驶、自动驾驶、机器人、智能医疗等,相信随着技术的发展,人工智能将在更多的领域得到应用,并发挥越来越重要的价值。
自然语言处理是计算机科学领域与人工智能领域中的一个重要方向。它研究能实现人与计算机之间用自然语言进行有效通信的各种理论和方法。自然语言处理是一门融语言学、计算机科学、数学于一体的科学。因此,这一领域的研究将涉及自然语言,即人们日常使用的语言,所以它与语言学的研究有着密切的联系。自然语言处理技术通常包括文本处理、语义理解、机器翻译、机器人问答、知识图谱等技术。
机器学习是一门多领域交叉学科,涉及概率论、统计学、逼近论、凸分析、算法复杂度理论等多门学科。专门研究计算机怎样模拟或实现人类的学习行为,以获取新的知识或技能,重新组织已有的知识结构使之不断改善自身的性能。对比于数据挖掘从大数据之间找相互特性而言,机器学习更加注重算法的设计,让计算机能够自动地从数据中“学习”规律,并利用规律对未知数据进行预测。
机器学习是人工智能的核心,是使计算机具有智能的根本途径,其应用遍及人工智能的各个领域。机器学习和深度学习通常包括人工神经网络、置信网络、强化学习、迁移学习、归纳学习等技术。
在本申请实施例中提出的生理数据的分析方法可分为两部分,包括训练部分和应用部分;其中,训练部分就涉及到机器学习这一技术领域,在训练部分中,通过机器学习这一技术训练分析模型,具体的,基于样本数据集对待训练的分析模型进行循环迭代训练,获得目标分析模型。应用部分用于使用在训练部分训练得到的目标分析模型,来结合待分析对象的原始状态信息和对象属性信息,获得相应的目标生理数据分析结果。
下面对本申请实施例的设计思想进行简要介绍:
仍以智能问诊为例,自动问诊***用于在线向对象提供问诊服务。对象可以将出现的症状输入至自动问诊***,得到自动问诊***输出的该症状可能对应的疾病,以便对象可以根据得到的疾病进行后续的就医或者是自行治疗。
在相关技术中,自动问诊***中对于疾病的预测一般是基于大量的标注数据建立机器学习模型或者神经网络模型实现的,建立机器学习模型或者神经网络模型所需要的成本较高,训练时间较长。下面列举几种常见的机器学习模型:
1)贝叶斯网络及其变种。贝叶斯网络使用概率图模型来描述变量之间的关系,用有向图描述了模型的变量的联合概率分布。通常使用两层或三层贝叶斯网络对变量进行建模。具体算法为:先确定各层节点,构建网络结构。统计数据,计算首层节点的先验概率、各个节点与所有相连父节点之间的条件概率。当进行推断时,采用诊断推断的方式,自底向上计算祖先点的条件概率。由于贝叶斯网络中需要知道各个节点组合的概率分布,由于数据的稀疏性,因此会存在某些节点组合没有数据,概率为0的情况。
2)朴素贝叶斯方法。当贝叶斯网络只有两层时,第一层为类别,第二层为特征,且假设所有特征关于各类别相互独立,则简化为朴素贝叶斯方法。
在贝叶斯网络的方法中,通常使用后验概率作为指标,进行生理数据的分析或排序,并没有针对疾病诊断这一特定场景。
3)机器学习的方法,如支持向量机(Supported Vector Machines,SVM)、深度神经网络等。但是这类方法不具有可解释性,且需要大量训练数据,因此没有在生理数据的分析上广泛使用。
4)知识驱动的方法。通常不能根据数据自动调整知识,需要耗费大量人力手动调整、校对知识,且不能实时查看各个知识调整后的结果,比如人工将感冒条件下鼻塞的概率提高了,容易导致一些鼻炎的例子也判定为感冒,产生误判。
综上,相关技术中的方法,无法适用于仅有少量数据的情况,在验证集上测试之后,需要人工分析错误原因,进而进行修改,修改后再测试验证,再次修改。这种人工迭代过程耗费医生的时间,并且非常缓慢。
有鉴于此,本申请实施例提出了一种生理数据的分析方法、装置、电子设备和存储介质。由于本申请实施例中,基于对应各预设状态信息配置的条件概率,对所述原始状态信息进行特征提取,由于每个条件概率表示在一个预设生理数据分析结果的条件下一个预设状态信息出现的概率,因而,基于此来对原始状态信息进行特征提取时,可以更加偏向的提取到与这些原始状态信息更加关联的生理数据分析结果,可提高特征提取的准确性;此外,还将待分析对象的原始状态信息及与生理数据分析结果相关的对象属性信息相结合,进行多类别多标签分类,基于各预设生理数据分析结果各自对应的类别概率,来确定针对待分析对象的目标生理数据分析结果。进一步提高准确性。
以下结合说明书附图对本申请的优选实施例进行说明,应当理解,此处所描述的优选实施例仅用于说明和解释本申请,并不用于限定本申请,并且在不冲突的情况下,本申请中的实施例及实施例中的特征可以相互组合。
如图1所示,其为本申请实施例的应用场景示意图。该应用场景图中包括两个终端设备110和一个服务器120。
在本申请实施例中,终端设备110包括但不限于手机、平板电脑、笔记本电脑、台式电脑、电子书阅读器、智能语音交互设备、智能家电、车载终端等设备;终端设备上可以安装有生理数据的分析相关的客户端,该客户端可以是软件(例如浏览器、智能问诊软件、健康管理软件等),也可以是网页、小程序等,服务器120则是与软件或是网页、小程序等相对应的后台服务器,或者是专门用于进行生理数据的分析的服务器,本申请不做具体限定。服务器120可以是独立的物理服务器,也可以是多个物理服务器构成的服务器集群或者分布式***,还可以是提供云服务、云数据库、云计算、云函数、云存储、网络服务、云通信、中间件服务、域名服务、安全服务、CDN(Content Delivery Network,内容分发网络)、以及大数据和人工智能平台等基础云计算服务的云服务器。
需要说明的是,本申请各实施例中的生理数据的分析方法可以由电子设备执行,该电子设备可以为终端设备110或者服务器120,即,该方法可以由终端设备110或者服务器120单独执行,也可以由终端设备110和服务器120共同执行。比如由终端设备110和服务器120共同执行时,可通过终端设备110来获取待分析对象输入的原始状态信息,及与待分析对象相关的至少一类对象属性信息,并将这些信息发送给服务器120,由服务器120基于对应各预设状态信息配置的条件概率,对原始状态信息进行特征提取,获得相应的第一中间结果;条件概率表示在一个预设生理数据分析结果的条件下一个预设状态信息出现的概率;分别对至少一类对象属性信息进行特征提取,获得至少一类对象属性信息各自对应的第二中间结果;最终,服务器120基于第一中间结果和至少一个第二中间结果,确定待分析对象对应各类预设生理数据分析结果的类别概率,并基于各个类别概率,确定待分析对象的目标生理数据分析结果后,将目标生理数据分析结果通过终端设备110展示给待分析对象。
在一种可选的实施方式中,终端设备110与服务器120之间可以通过通信网络进行通信。
在一种可选的实施方式中,通信网络是有线网络或无线网络。
需要说明的是,图1所示只是举例说明,实际上终端设备和服务器的数量不受限制,在本申请实施例中不做具体限定。
本申请实施例中,当服务器的数量为多个时,多个服务器可组成为一区块链,而服务器为区块链上的节点;如本申请实施例所公开的生理数据的分析方法,其中所涉及的原始状态信息、对象属性信息、目标生理数据分析结果等数据可保存于区块链上。
此外,本申请实施例的生理数据的分析方法可以应用于各种生理数据分析结果相关场景,包括但不限于云技术、人工智能(Artificial Intelligence,AI)、智慧交通、辅助驾驶等场景。在这些场景下,包括但不限于智能问诊任务、AI辅助诊疗任务、健康管理检测任务等等,可用于所有需要可解释性,且已有初始权重,仅有少量数据无法直接训练模型,但需要根据数据调整权重的任务都可适用。
以智能问诊为例,状态信息可表示为症状,生理数据分析结果可表示为疾病,如图2所示,其为本申请实施例中的一种智能问诊界面的示意图。
在本申请实施例中,终端设备可以为待分析对象提供一个疾病预测功能,当待分析对象感觉到身体不适时,可以打开终端设备中的疾病预测功能,此时终端设备可以在对象界面引导待分析对象输入身体不适的相关描述,如图2中的界面2a所示。终端设备获取到待分析对象输入的相关描述(例如包含原始状态信息和至少一类对象属性信息)后,可以根据该相关描述预测待分析对象的疾病信息(即目标生理数据分析结果),将预测得到的疾病信息推送给待分析对象,如图2中的界面2b所示,预测得到的疾病信息中包括待分析对象可能患有的疾病名称。例如图2中所示,对象的症状有头晕、乏力、咳嗽、体温较高,预测得到的疾病为感冒。
需要说明的是,图2中的界面2a中,仅仅是以待分析对象输入的相关描述为原始状态信息为例进行举例说明的,图2未示出对象属性信息的输入过程,实际上,待分析对象的对象属性信息也可由对象在当前界面输入,或者,基于对象账号来获取等,本文不做具体限定。
在本申请实施例中,待分析对象可以根据该疾病信息选择合适的医生进行就诊,避免挂号错误以及重复挂号等操作,可以使待分析对象及时就诊,可以较大程度地节省时间成本以及人力成本。
可以理解的是,在本申请的具体实施方式中,涉及到对象的原始状态信息、生理数据、对象属性信息、样本对象的历史数据等相关的数据(如症状、年龄、性别、就诊时间、就诊历史等),当本申请以上实施例运用到具体产品或技术中时,需要获得对象许可或者同意,且相关数据的收集、使用和处理需要遵守相关国家和地区的相关法律法规和标准。
下面结合上述描述的应用场景,参考附图来描述本申请示例性实施方式提供的生理数据的分析方法,需要注意的是,上述应用场景仅是为了便于理解本申请的精神和原理而示出,本申请的实施方式在此方面不受任何限制。
参阅图3所示,为本申请实施例提供的一种生理数据的分析方法的实施流程图,该方法的具体实施流程包括如下步骤S31-S34:
S31:服务器获取待分析对象的原始状态信息,以及与待分析对象相关的至少一类对象属性信息。
其中,原始状态信息包含待分析对象在自身所处环境下的生理数据,如症状信息,症状信息可表征疾病过程中机体内的一系列机能、代谢和形态结构异常变化所引起的病人主观上的异常感觉或某些客观病态改变。
在本申请实施例中,症状包含症状和体征两个方面,指疾病引起患者的主观不适、异常感觉、功能变化或明显的病态改变。常见的一些症状有:发热、疼痛、体重改变、浮肿、呼吸困难、咳嗽、咯血、食欲减退、消化不良、吞咽困难、恶心呕吐、呕血、贫血、休克等。此外需要说明的是,症状也可以包含一些结合患者主观感知确定的信息,如呕吐次数、呕吐颜色等,这些都属于对象在自身所处环境下的一些生理数据。
需要说明的是,上述只是简单的列举了一些症状,实际上任何可以表征对象在一定环境下生理数据的状态信息,都适用于本申请实施例,在此不做具体限定。
另外,对象属性信息则表示与获取生理数据分析结果相关的一些特征信息,如对象年龄信息、对象性别信息、对象就诊时间信息等中的至少一类,此外,还可进一步包括就诊历史信息等,本文不做具体限定。
S32:服务器基于对应各预设状态信息配置的条件概率,对原始状态信息进行特征提取,获得相应的第一中间结果。
其中,条件概率表示在一个预设生理数据分析结果的条件下一个预设状态信息出现的概率,由于各预设状态信息可以表征预先设定出的一些不同的状态信息,例如不同症状,而各预设生理数据分析结果是指设定出的一些不同类别的结果,例如不同疾病,因而,条件概率也可表示在一个症状在一个疾病已经发生的条件下出现的概率,例如:在中暑的条件下,恶心的概率;在中暑的条件下,头晕的概率;在感冒的条件下,咳嗽的概率;等等。
在本申请实施例中,对应各预设状态信息配置的条件概率可以是根据书籍、医生经验、知识图谱或其他渠道等获取的,例如,在医疗保健领域有许多组织良好的知识图谱,如国际疾病分类、临床指南与共识等,具有符合人类认知的层级信息、复杂关联关系,本文不做具体限定。
参阅图4所示,其为本申请实施例中的一种预设生理数据分析结果与预设状态信息之间的对应关系示意图。
其中,图4简单列举了几种常见的预设生理数据分析结果(疾病)对应的预设状态信息(症状)。例如:感冒的常见症状有:鼻塞、流鼻涕、咽痒、咽喉痛、咳嗽、头痛、头昏、怕冷、低烧等;低血糖的常见症状有:心慌、手抖、出汗、头痛、头晕、昏迷、抽搐等;急性肠胃炎的常见症状有:恶心、呕吐、腹痛、腹泻、发热、口渴等;中暑的常见症状有:大量出汗、头晕、眼花、恶心、心慌、气短、体温常常小于37.5摄氏度等。
需要说明的是,上述所列举的对应关系只是简单举例说明,任何一种预设生理数据分析结果与预设状态信息之间的对应关系都适用于本申请实施例,在此不做具体限定。
此外,在本申请实施例中,预设生理数据分析结果与预设状态信息之间的对应关系的获取方式,同上述所列举的条件概率的获取方式相同或类似,重复之处不再赘述。
一种可选的实施方式为,步骤S32又可划分为以下子步骤(图3未示出):
S321:分别获取各个预设生理数据分析结果下,各预设状态信息各自的条件概率,并基于获得的各个条件概率,确定用于进行特征提取的第一权重矩阵。
具体地,从知识图谱中获取由各个疾病下,各症状各自的条件概率所组成的条件概率矩阵,基于该条件概率矩阵初始化得到一个第一权重矩阵,并通过机器学习的方式更新该第一权重矩阵,最终获得用于进行特征提取的第一权重矩阵。
例如,给定疾病集合,D={d1,d2,...dN},其中N为疾病数量(即类别数),di为某个疾病,如普通感冒,i的取值为1~N。症状特征集合F={f1,f2,...fK},其中K为症状特征数量,fj为某个特征,如咳嗽,每个特征的值域为{-1,0,1},分别表示阴性症状、未提及、阳性症状,j的取值为1~K。
根据书籍、医生经验或其他渠道,得到各个疾病下各症状特征的条件概率矩阵C,其大小为K×N,其中每个元素Cji的值为P(fj|di),值域为[0,1]。
其中,在基于该条件概率矩阵初始化得到一个第一权重矩阵时,这里的初始化方法可以有很多种,比如直接基于条件概率矩阵,对第一权重矩阵中的元素直接赋值,还可以采用映射等方式,本文不做具体限定,第一权重矩阵的大小也为K×N。
S322:基于第一权重矩阵,对原始状态信息进行特征提取,获得相应的第一中间结果。
具体地,可将待分析对象的原始状态信息,输入已训练的目标分析模型中的第一特征网络;基于第一特征网络,对原始状态信息进行特征提取,获得第一中间结果,其中,第一特征网络中的第一权重矩阵是基于条件概率确定的,该过程同模型训练过程相同,具体计算方式可参见下述公式(1-1),重复之处不再赘述。
在上述实施方式中,将知识表示成各症状的条件概率,邀请专家根据书籍与经验标注概率,使用标注的概率对特征网络进行初始化,这样可以有效提高准确率。
S33:服务器分别对至少一类对象属性信息进行特征提取,获得至少一类对象属性信息各自对应的第二中间结果。
一种可选的实施方式为,步骤S33又可划分为以下子步骤(图3未示出):
对于至少一类对象属性信息中的每一类对象属性信息,分别执行以下操作:
S331:对于一类对象属性信息,基于各预设生理数据分析结果与一类对象属性信息之间的匹配关联程度,确定用于对一类对象属性信息进行特征提取的第二权重矩阵。
同第一权重矩阵相似,本申请可基于各预设生理数据分析结果与一类对象属性信息之间的匹配关联程度,初始化得到一个权重矩阵,并通过机器学习的方式更新该权重矩阵,最终获得用于进行特征提取的第二权重矩阵。
以对象属性信息包括对象年龄信息为例,各类疾病与对象年龄信息之间的匹配关联程度,即表示各类疾病与年龄之间的关联,比如对于手足口病,主要发病人群为5岁以下儿童;而对于老年人(60岁以上),高发疾病包括冠心病;对于中年人(45-59岁),高发疾病包括高血压。也即,手足口病与0-5岁年龄段之间的匹配关联程度更高,而冠心病与60岁以上年龄段的匹配关联程度更高,高血压与45-59岁年龄段之间的匹配关联程度更高。
再比如,以对象属性信息包括对象就诊时间信息为例,各类疾病与对象就诊时间信息之间的匹配关联程度,即表示各类疾病与时间之间的关联,比如中暑频发于夏季;流行性感冒频发于春季。也即,中暑与夏季时间段之间的匹配关联程度更高,而流行性感冒与春季时间段之间的匹配关联程度更高。
在基于匹配关联程度来对第二权重矩阵进行初始化时,可设置匹配关联程度较高时对应的权重更高,可设置为正值,例如为2,而匹配关联程度较低时,对应的权重也较低,可设置为负值,例如-2。
需要说明的是,上述所列举的基于匹配关联程度来确定第二权重矩阵的方式只是简单举例说明,实际上任何一种基于匹配关联程度来确定第二权重矩阵的方式都适用于本申请实施例,在此不做具体限定。
此外,第二权重矩阵还可随机初始化,相比于随机初始化,采用上述基于匹配关联程度来确定的方式,可以将预设生理数据分析结果与对象属性信息更紧密的进行关联,因而,基于此得到的分析结果的准确性更高。
S332:基于第二权重矩阵,对一类对象属性信息进行特征提取,获得对应的第二中间结果。
具体地,可将待分析对象的至少一类对象属性信息,分别输入目标分析模型中相应的第二特征网络,其中,每个第二特征网络对应一类对象属性信息;进而,分别基于至少一类对象属性信息各自相应的第二特征网络,对相应的对象属性信息进行特征提取,获得相应的第二中间结果,该过程同模型训练过程相同,具体计算方式可参见下述公式(1-2)或(1-3),重复之处不再赘述。
如图5所示,其为本申请实施例中所列举的一种将待分析对象的原始状态信息和对象属性信息输入目标分析模型后的处理过程示意图。以对象属性信息包括对象年龄信息和对象就诊时间信息为例,第二中间结果则包括:对象年龄信息对应的第二中间结果,以及对象就诊时间信息对应的第二中间结果。
如图5中,将待分析对象的原始状态信息输入第一特征网络,获取第一中间结果;将对象年龄信息输入对应的第二特征网络-1,获取第二中间结果-1;将对象就诊时间信息输入对应的第二特征网络-2,获取第二中间结果-2。
接下来,即可执行步骤S34:
S34:服务器基于第一中间结果和至少一个第二中间结果,确定待分析对象对应各类预设生理数据分析结果的类别概率,并基于各个类别概率,确定待分析对象的目标生理数据分析结果。
可选的,在对象属性信息包括对象年龄信息和对象就诊时间信息时,可通过下列方式确定类别概率:
首先,确定由第一中间结果和至少一个第二中间结果,进行累加求和得到的求和结果;进而,对求和结果进行归一化处理,获得待分析对象对应各类预设生理数据分析结果的类别概率。
如图5所示,将第一中间结果,第二中间结果-1和第二中间结果-2进行累加,然后,通过激活函数Sigmoid函数,对求和结果进行归一化处理,获得待分析对象对应各类预设生理数据分析结果的类别概率。
例如,以预设生理数据分析结果的总数N=4为例,即一共设置了四类预设生理数据分析结果,分别为:感冒、低血糖、急性肠胃炎和中暑;待分析对象的原始状态信息包括:头晕、乏力、咳嗽、体温较高;年龄为20岁;基于此,预测得到该待分析对象与感冒、低血糖、急性肠胃炎和中暑各自对应的类别概率分别为:P1、P2、P3、P4
再比如,对象属性信息还包括:对象性别信息时,第二中间结果还包括:对象性别信息对应的第二中间结果。此时,求和结果是指:将第一中间结果,对象年龄信息对应的第二中间结果,对象就诊时间信息对应的第二中间结果,以及对象性别信息对应的第二中间结果进行累加求和得到的结果,等等,在对象属性信息变换时,依此类推即可,在此不再重复赘述。
在基于上述方式获得各个预设生理数据分析结果各自对应的类别概率即可,即可基于各个类别概率,确定与该待分析对象相匹配的一个或多个的目标生理数据分析结果。
一种可选的实施方式为,基于各个类别概率确定待分析对象的目标生理数据分析结果时,有以下两种方式:
确定方式一、将各个类别概率中达到参考阈值的类别概率对应的预设生理数据分析结果,作为待分析对象的目标生理数据分析结果。
例如,参考阈值为tr,当某个疾病的类别概率大于该阈值时,则作为匹配的目标生理数据分析结果;假设上述所列举的四个类别概率P1、P2、P3、P4中,P1>tr,则表示该待分析对象可能患有的疾病为感冒。
确定方式二、将各个类别概率进行排序,并将排序结果在指定次序范围内的类别概率对应的预设生理数据分析结果,作为待分析对象的目标生理数据分析结果。
例如,将各个类别概率按照从大到小排序时,可选前m个作为该待分析对象的目标生理数据分析结果;将各个类别概率按照从小到大排序时,可选后m个作为该待分析对象的目标生理数据分析结果,m为正整数。
例如P1>P3>P2>P4,m=2,则表示该待分析对象可能患有的疾病为感冒、急性肠胃炎中的至少一种,其中,最有可能患有的疾病为感冒。
需要说明的是,上述所列举的几种确定方式只是举例说明,任何一种基于各个类别概率确定待分析对象的目标生理数据分析结果的方式都适用于本申请实施例,重复之处不再赘述。
在本申请实施例中,特征提取的过程可以通过机器学习的方式实现,例如本申请中提出的用于进行生理数据分析结果匹配的分析模型。
考虑到医疗诊断场景需要很高的可解释性,而且需要完美兼容条件概率的意义,因此使用NAM模型进行建模,以该分析模型为NAM为例,对每一类特征(即原始状态信息、对象属性信息等),可使用一个特征网络计算该特征的网络输出h,进而,基于各特征网络的输出预测N个类别概率。
在本申请实施例中,用于训练NAM的样本数据集可分为训练集和验证集两部分,用训练集训练NAM,对于每个迭代,计算损失函数Loss,以及Loss的梯度,使用优化器对参数进行更新。该迭代训练完后,保存模型。进而,输入验证集的样本,计算Loss,以及需要的指标,根据某种训练策略调整学习率,并决定是否提前终止。
例如,预设迭代次数为20次,但是在第5次迭代后,基于验证集计算得到的Loss不再下降,而是处于振荡的状态,则可提前停止迭代。
在训练完成后,用最佳模型计算各个类别的概率P,作为模型的输出。之后按照P对疾病进行排序或输出概率Pi高于预设阈值的疾病作为结果。
下面对模型训练的详细过程进行举例说明:
一种可选的实施方式为,目标分析模型可以通过下列方式训练得到的:
参阅图6所示,其为本申请实施例中的一种目标分析模型的训练过程示意图,以服务器为执行主体为例,具体包括如下步骤S61-S62:
S61:服务器获取样本数据集,样本数据集中的每个样本数据包括一个样本对象,样本对象的原始状态信息,至少一类对象属性信息,以及样本对象的生理数据分析结果标签。
例如,对于每个样本数据Sl(l的取值为1~n),已知特征序列Fl(即原始状态信息)和疾病标签Dl(即生理数据分析结果标签),Fl为F的子集,其中每个元素为观测到样本对象的症状特征,此外还有年龄、性别、就诊月份等对象属性信息。这里以症状特征为例进行初始化和微调。Dl为疾病集合D的子集,表征真实的疾病。由于本申请实施例中,并未限制真实疾病数量,因此为已知特征序列,预测疾病概率的多标签问题。
具体地,对各个样本数据,可将特征序列Fl映射为一个长度为K的向量,其中阳性特征的值为1,阴性特征的值为-1,没有观测到的特征值为0。将疾病标签映射为长度为N的向量,其中真实疾病的值为1,其余为0。因此得到向量化的训练集表示。对验证集也使用同样的映射方法,将各个样本表示为一个向量对,得到向量化的验证集表示。
在样本数据包含上述内容的基础上,提供小数据量的训练集Strain和验证集Svalid,每个集合S={(F1,D1),(F2,D2),...,(Fn,Dn)},如何调整条件概率矩阵C,使得模型的预测精度更高,则是该模型训练的目的。
S62:服务器根据样本数据集对待训练的分析模型进行循环迭代训练,输出相应的目标分析模型。
其中,在一次循环迭代过程中,执行以下操作:
S621:服务器将选取的样本数据输入待训练的分析模型,获得样本对象对应各类预设生理数据分析结果的类别概率。
具体地,该过程同上述所列举的基于目标分析模型来对待分析对象进行生理数据的分析的过程相同。例如图7所示,其为本申请实施例中的一种分析模型结构示意图,该分析模型是一种加法神经网络,每类特征对应一个特征网络,特征网络可以有一层或多层,最后一层的神经元数量为疾病数量N。如图7中的特征网络1,…,特征网络n,输入分析模型中的各类特征,会分别输入至各自对应的特征网络中进行特征提取,即图7中由原始状态信息、对象属性信息等形成的特征向量会分段输入到相应的特征网络1-特征网络n中,最后再将各特征网络隐层输出进行累加求和后,经过Sigmoid进行归一化处理,获得由各类别概率组成的概率向量P,包含N个元素,一个元素表征一个预设生理数据分析结果(疾病)对应的类别概率。
在本申请实施例中,通过对训练集和验证集的特征(即原始状态信息、对象属性信息等)和标签(即生理数据分析结果标签)进行向量化,输入加法神经网络,如图7所示。
下面以原始状态信息为症状,对象属性信息为年龄、就诊时间为例,进行举例说明:
对于症状特征xs,使用一层神经网络,其中第一权重矩阵Ws使用已标注的条件概率矩阵C进行初始化。
在训练和推断时,按照公式(1-1)计算该特征网络的输出hs,即第一中间结果,是一个长度为N的向量。
hs=g(Wsxs+bs) 公式(1-1)
其中,Ws为可训练的第一权重矩阵,大小与C相同。bs为偏置向量,长度为N。g为激活函数,用于对输出进行正则化,通常使用激活函数有tanh,Relu,Leaky Relu等,可根据不同的任务选择不同的激活函数。
具体地,本申请考虑到若使用修正线性单元(Rectified linear unit,Relu)或Sigmoid,则后续Sigmoid变换之后各个类别的分数值都会在0.5以上,因此在本疾病概率预测任务中,使用tanh或带泄露修正线性单元(Leaky Relu)。
同理,对于年龄特征xa,即对象年龄信息对应的第二中间结果,也是一个长度为N的向量,可按照公式(1-2)计算得到:
ha=g(Waxa+ba) 公式(1-2)
其中,ha为年龄特征网络的隐藏输出,Wa为可训练的第二权重矩阵,ba为偏置向量。
对于就诊时间特征xm,即对象就诊时间信息对应的第二中间结果,也是一个长度为N的向量,可按照公式(1-3)计算得到:
hm=g(Wmxm+bm) 公式(1-3)
其中,hm为就诊时间对应的特征网络隐层输出,Wm也为可训练的第二权重矩阵,bm为偏置向量。
随后,可将各个特征网络输出的向量相加,用Sigmoid函数进行归一化,得到的即为各个类别的概率P,如公式(2):
P=f(∑(hs,ha,hm)) 公式(2)
其中,P为长度为N的向量,每一个元素Pi为属于对应类别的概率,即类别概率。f为归一化函数,将值域映射到[0,1]之间。考虑到本申请实施例为多标签分类,因而可使用Sigmoid函数作为f(若为单分类问题,可使用softmax等函数作为f)。
S622:服务器采用基于样本对象对应各类预设生理数据分析结果的类别概率和生理数据分析结果标签,构建的目标损失函数,对待训练的分析模型进行参数调整。
对于训练集,计算所有样本的网络输出与标签向量计算损失函数,分类问题常用的损失函数有交叉熵及其变形,以交叉熵为例,损失函数的计算如公式(3)所示。
Loss=-∑iyilogPi-(1-yi)log(1-Pi) 公式(3)
在公式(3)中,yi为各个类别的实际概率(即样本数据中的生理数据分析结果标签),为0或1,Pi为预测的该类别概率,为概率矩阵P的第i个元素。
具体地,训练时计算Loss的梯度,使用任意优化方法进行参数更新。每个迭代结束后,计算在验证集数据上的误差和精度,保存模型,直到达到预设的迭代次数结束训练。也可视情况提前结束训练,如误差不再下降或精度不再上升时,取精度最高的或误差最小的模型,作为疾病预测模型,也即目标分析模型。
需要说明的是,上述实施例中使用一种可解释的高准确率的方法-加法神经网络,来预测疾病概率,并且使用一些样本对象的历史数据,对初始化后的加法神经网络进行微调,提高准确率,这个过程神经网络自动调整参数,减少人工劳动,有效提高效率,且实现了使用NAM进行多类别多标签分类的效果。
可选的,本申请实施例中,在训练之后,还可对各类特征对各类别的影响和参数可视化或打印,查看关系和参数值是否合理,从而调整网络或参数,也可去除某个特征,具体依据实际情况而定,在此不做具体限定。
在本申请实施例中,若训练集或验证集中存在类别之间不均衡的情况,则可对数据少的类别进行上采样,使得各类别样本量相同。
一种可选的实施方式为,通过下列方式扩充样本数据:
首先,将初始的样本数据按照预设生理数据分析结果类别划分为至少一个样本数据子集,并确定各预设生理数据分析结果类别对应的样本数据子集中的样本数量;进而,将样本数量未达到预设数量的样本数据子集中的样本数据,进行上采样处理,获得至少一个上采样的样本数据。这样,即可基于上采样的样本数据和初始的样本数据,构建样本数据集。
如图8所示,其为本申请实施例中的一种样本数据扩充的方法示意图,其中,样本数据集包含初始的样本数据,以及上采样的样本数据,其中,初始的样本数据包含了四类按照预设生理数据分析结果类别划分为至少一个样本数据子集,在图8中用填充有不同图案的矩形表示。其中,后两类样本数据子集中的样本数据较少,未达到预设数量,因而可进行上采样,获得虚线框中上采样的样本数据,最终,可通过上述方式进行样本数据的扩充后,再输入到分析模型中,进行模型的训练和验证,最终输出目标分析模型。
其中,上采样时,可对样本数据按照某种规则进行多次随机采样,从而增加数据量。例如,对对象属性信息中的年龄、对就诊时间等进行调整,本文不做具体限定。
在基于上述方式对样本数据进行扩充后,即可获得大量的样本数据(带标注标签的样本数据),进而,从样本数据集中进行样本数据抽取,例如抽取的样本数据包括样本对象的原始状态信息、对象年龄信息、对象就诊时间信息和生理数据分析结果标签,进而对模型进行训练和验证,获得目标分析模型。
在上述实施方式中,对于仅有少量数据的场景,也可采用上述方法来进行样本扩充,进而训练模型,可解决相关技术中仅有少量数据无法直接训练模型的问题。
综上,本申请实施例在特征网络中,使用各症状的条件概率进行初始化,使用数据量很小的训练集进行微调,即可自动调整条件概率,提高准确率,减少人工劳动。
参阅图9A所示,其为本申请实施例中的一种生理数据的分析方法的具体流程示意图,以服务器为执行主体为例,该方法的具体实施流程如下:
步骤S901:服务器获取待分析对象的原始状态信息,以及对象年龄信息和对象就诊时间信息;
步骤S902:服务器将该原始状态信息,输入目标分析模型中的第一特征网络,以及,将该对象年龄信息和对象就诊时间信息,分别输入目标分析模型中相应的第二特征网络;
步骤S903:服务器基于第一特征网络,对原始状态信息进行特征提取,获得第一中间结果;
步骤S904:服务器分别基于相应的第二特征网络,对相应的对象属性信息进行特征提取,获得对象年龄信息对应的第二中间结果和对象就诊时间信息对应的第二中间结果;
步骤S905:服务器基于第一中间结果,对象年龄信息对应的第二中间结果,以及对象就诊时间信息对应的第二中间结果,确定进行累加求和得到的求和结果;
步骤S906:服务器对求和结果进行归一化处理,获得待分析对象对应各类预设生理数据分析结果的类别概率;
步骤S907:服务器将各个类别概率中达到参考阈值的类别概率对应的预设生理数据分析结果,作为该待分析对象的目标生理数据分析结果。
如图9B所示,其为本申请实施例中所列举的一种生理数据的分析方法的具体场景示意图。待分析对象的原始状态信息包括:出汗、头晕、眼花、恶心,对象年龄信息为:20岁,对象就诊时间信息为:7月2日。待分析对象将这些信息通过终端设备上安装的客户端输入后,终端设备可将这些信息发送给服务器,服务器侧配置有目标分析模型,进而,基于目标分析模型中的各特征网络,进行特征提取,获得中间结果,包括原始状态信息对应的第一中间结果,对象年龄信息对应的第二中间结果和对象就诊时间信息对应的第二中间结果;进而,采用上述步骤S905-S907中的方式,获取该待分析对象的目标生理数据分析结果,并将该结果反馈给终端设备,由终端设备通过客户端展示给待分析对象。例如,服务器通过目标分析模型最终获得该待分析对象对应的各类别概率为:中暑概率0.7,急性肠胃炎概率0.5,感冒概率0.4,低血糖概率0.3,其中,参考阈值为0.6,则达到参考阈值的为:中暑概率0.7,对应的预设生理数据分析结果为:中暑,即可将中暑这一结果反馈给终端设备,由终端设备向给待分析对象展示如图9B所示的智能问诊界面。
结合本申请实施例中的生理数据的分析方法,在儿科智能问诊场景下,共110个疾病,使用719份样本的数据集进行微调,便可自动调整参数,在验证集上的精度从26.4%上升到51.7%,提升了95.8%,在P@3上的提升幅度更大。
基于相同的发明构思,本申请实施例还提供一种生理数据的分析装置。如图10所示,其为生理数据的分析装置1000的结构示意图,可以包括:
信息获取单元1001,用于获取待分析对象的原始状态信息,以及与待分析对象相关的至少一类对象属性信息;其中,原始状态信息包含待分析对象在自身所处环境下的生理数据;
特征提取单元1002,用于基于对应各预设状态信息配置的条件概率,对原始状态信息进行特征提取,获得相应的第一中间结果;条件概率表示在一个预设生理数据分析结果的条件下一个预设状态信息出现的概率;
特征提取单元1002,还用于分别对至少一类对象属性信息进行特征提取,获得至少一类对象属性信息各自对应的第二中间结果;
结果分析单元1003,用于基于第一中间结果和至少一个第二中间结果,确定待分析对象对应各类预设生理数据分析结果的类别概率,并基于各个类别概率,确定待分析对象的目标生理数据分析结果。
可选的,特征提取单元1002具体用于:
分别获取各个预设生理数据分析结果下,各预设状态信息各自的条件概率,并基于获得的各个条件概率,确定用于进行特征提取的第一权重矩阵;
基于第一权重矩阵,对原始状态信息进行特征提取,获得相应的第一中间结果。
可选的,特征提取单元1002具体用于:
对于至少一类对象属性信息中的每一类对象属性信息,分别执行以下操作:
对于一类对象属性信息,基于各预设生理数据分析结果与一类对象属性信息之间的匹配关联程度,确定用于对一类对象属性信息进行特征提取的第二权重矩阵;
基于第二权重矩阵,对一类对象属性信息进行特征提取,获得对应的第二中间结果。
可选的,特征提取单元1002具体用于:
将待分析对象的原始状态信息,输入已训练的目标分析模型中的第一特征网络;
基于第一特征网络,对原始状态信息进行特征提取,获得第一中间结果,其中,第一特征网络中的第一权重矩阵是基于条件概率确定的。
可选的,特征提取单元1002具体用于:
将待分析对象的至少一类对象属性信息,分别输入目标分析模型中相应的第二特征网络,其中,每个第二特征网络对应一类对象属性信息;
分别基于至少一类对象属性信息各自相应的第二特征网络,对相应的对象属性信息进行特征提取,获得相应的第二中间结果。
可选的,装置还包括:
模型训练单元1004,用于通过下列方式训练得到目标分析模型:
获取样本数据集,样本数据集中的每个样本数据包括一个样本对象,样本对象的原始状态信息,至少一类对象属性信息,以及样本对象的生理数据分析结果标签;
根据样本数据集对待训练的分析模型进行循环迭代训练,输出相应的目标分析模型;其中,在一次循环迭代过程中,执行以下操作:
将选取的样本数据输入待训练的分析模型,获得样本对象对应各类预设生理数据分析结果的类别概率;
采用基于样本对象对应各类预设生理数据分析结果的类别概率和生理数据分析结果标签,构建的目标损失函数,对待训练的分析模型进行参数调整。
可选的,在待训练的分析模型中,原始状态信息对应的特征网络中的第一权重矩阵是:基于条件概率初始化得到的;至少一类对象属性信息各自对应的特征网络中的第二权重矩阵是:基于各预设生理数据分析结果与各自之间的匹配关联程度初始化得到的;
则模型训练单元1004具体单元:
基于目标损失函数,对第一权重矩阵和各个第二权重矩阵进行参数调整。
可选的,模型训练单元1004具体用于:
将初始的样本数据按照预设生理数据分析结果类别划分为至少一个样本数据子集,并确定各预设生理数据分析结果类别对应的样本数据子集中的样本数量;
将样本数量未达到预设数量的样本数据子集中的样本数据,进行上采样处理,获得至少一个上采样的样本数据;
基于上采样的样本数据和初始的样本数据,构建样本数据集。
可选的,结果分析单元1003具体用于:
确定由第一中间结果和至少一个第二中间结果,进行累加求和得到的求和结果;
对求和结果进行归一化处理,获得待分析对象对应各类预设生理数据分析结果的类别概率。
可选的,对象属性信息包括下列至少一类:对象年龄信息,对象就诊时间信息、对象性别信息。
可选的,基于各个类别概率,确定待分析对象的目标生理数据分析结果,包括:
将各个类别概率中达到参考阈值的类别概率对应的预设生理数据分析结果,作为待分析对象的目标生理数据分析结果;或
将各个类别概率进行排序,并将排序结果在指定次序范围内的类别概率对应的预设生理数据分析结果,作为待分析对象的目标生理数据分析结果。
由于本申请实施例中,基于对应各预设状态信息配置的条件概率,对原始状态信息进行特征提取,由于每个条件概率表示在一个预设生理数据分析结果的条件下一个预设状态信息出现的概率,因而,基于此来对原始状态信息进行特征提取时,可以更加偏向的提取到与这些原始状态信息更加关联的生理数据分析结果,可提高特征提取的准确性;此外,还将待分析对象的原始状态信息及与生理数据分析结果相关的对象属性信息相结合,进行多类别多标签分类,基于各预设生理数据分析结果各自对应的类别概率,来确定针对待分析对象的目标生理数据分析结果。进一步提高准确性。
为了描述的方便,以上各部分按照功能划分为各模块(或单元)分别描述。当然,在实施本申请时可以把各模块(或单元)的功能在同一个或多个软件或硬件中实现。
在介绍了本申请示例性实施方式的生理数据的分析方法和装置之后,接下来,介绍根据本申请的另一示例性实施方式的电子设备。
所属技术领域的技术人员能够理解,本申请的各个方面可以实现为***、方法或程序产品。因此,本申请的各个方面可以具体实现为以下形式,即:完全的硬件实施方式、完全的软件实施方式(包括固件、微代码等),或硬件和软件方面结合的实施方式,这里可以统称为“电路”、“模块”或“***”。
与上述方法实施例基于同一发明构思,本申请实施例中还提供了一种电子设备。在一种实施例中,该电子设备可以是服务器,如图1所示的服务器120。在该实施例中,电子设备的结构可以如图11所示,包括存储器1101,通讯模块1103以及一个或多个处理器1102。
存储器1101,用于存储处理器1102执行的计算机程序。存储器1101可主要包括存储程序区和存储数据区,其中,存储程序区可存储操作***,以及运行即时通讯功能所需的程序等;存储数据区可存储各种即时通讯信息和操作指令集等。
存储器1101可以是易失性存储器(volatile memory),例如随机存取存储器(random-access memory,RAM);存储器1101也可以是非易失性存储器(non-volatilememory),例如只读存储器,快闪存储器(flash memory),硬盘(hard disk drive,HDD)或固态硬盘(solid-state drive,SSD);或者存储器1101是能够用于携带或存储具有指令或数据结构形式的期望的计算机程序并能够由计算机存取的任何其他介质,但不限于此。存储器1101可以是上述存储器的组合。
处理器1102,可以包括一个或多个中央处理单元(central processing unit,CPU)或者为数字处理单元等等。处理器1102,用于调用存储器1101中存储的计算机程序时实现上述生理数据的分析方法。
通讯模块1103用于与终端设备和其他服务器进行通信。
本申请实施例中不限定上述存储器1101、通讯模块1103和处理器1102之间的具体连接介质。本申请实施例在图11中以存储器1101和处理器1102之间通过总线1104连接,总线1104在图11中以粗线描述,其它部件之间的连接方式,仅是进行示意性说明,并不引以为限。总线1104可以分为地址总线、数据总线、控制总线等。为便于描述,图11中仅用一条粗线描述,但并不描述仅有一根总线或一种类型的总线。
存储器1101中存储有计算机存储介质,计算机存储介质中存储有计算机可执行指令,计算机可执行指令用于实现本申请实施例的生理数据的分析方法。处理器1102用于执行上述的生理数据的分析方法,如图3所示。
在另一种实施例中,电子设备也可以是其他电子设备,如图1所示的终端设备110。在该实施例中,电子设备的结构可以如图12所示,包括:通信组件1210、存储器1220、显示单元1230、摄像头1240、传感器1250、音频电路1260、蓝牙模块1270、处理器1280等部件。
通信组件1210用于与服务器进行通信。在一些实施例中,可以包括电路无线保真(Wireless Fidelity,WiFi)模块,WiFi模块属于短距离无线传输技术,电子设备通过WiFi模块可以帮助对象收发信息。
存储器1220可用于存储软件程序及数据。处理器1280通过运行存储在存储器1220的软件程序或数据,从而执行终端设备110的各种功能以及数据处理。存储器1220可以包括高速随机存取存储器,还可以包括非易失性存储器,例如至少一个磁盘存储器件、闪存器件、或其他易失性固态存储器件。存储器1220存储有使得终端设备110能运行的操作***。本申请中存储器1220可以存储操作***及各种应用程序,还可以存储执行本申请实施例生理数据的分析方法的计算机程序。
显示单元1230还可用于显示由对象输入的信息或提供给对象的信息以及终端设备110的各种菜单的图形对象界面。具体地,显示单元1230可以包括设置在终端设备110正面的显示屏1232。其中,显示屏1232可以采用液晶显示器、发光二极管等形式来配置。显示单元1230可以用于显示本申请实施例中的应用操作界面(如图2所示的智能问诊界面)。
显示单元1230还可用于接收输入的数字或字符信息,产生与终端设备110的对象设置以及功能控制有关的信号输入,具体地,显示单元1230可以包括设置在终端设备110正面的触控屏1231,可收集对象在其上或附近的触摸操作,例如点击按钮,拖动滚动框等。
其中,触控屏1231可以覆盖在显示屏1232之上,也可以将触控屏1231与显示屏1232集成而实现终端设备110的输入和输出功能,集成后可以简称触摸显示屏。本申请中显示单元1230可以显示应用程序以及对应的操作步骤。
摄像头1240可用于捕获静态图像,对象可以将摄像头1240拍摄的图像通过应用发布评论。摄像头1240可以是一个,也可以是多个。物体通过镜头生成光学图像投射到感光元件。感光元件可以是电荷耦合器件或互补金属氧化物半导体光电晶体管。感光元件把光信号转换成电信号,之后将电信号传递给处理器1280转换成数字图像信号。
终端设备还可以包括至少一种传感器1250,比如加速度传感器1251、距离传感器1252、指纹传感器1253、温度传感器1254。终端设备还可配置有陀螺仪、气压计、湿度计、温度计、红外线传感器、光传感器、运动传感器等其他传感器。
音频电路1260、扬声器1261、传声器1262可提供对象与终端设备110之间的音频接口。音频电路1260可将接收到的音频数据转换后的电信号,传输到扬声器1261,由扬声器1261转换为声音信号输出。终端设备110还可配置音量按钮,用于调节声音信号的音量。另一方面,传声器1262将收集的声音信号转换为电信号,由音频电路1260接收后转换为音频数据,再将音频数据输出至通信组件1210以发送给比如另一终端设备110,或者将音频数据输出至存储器1220以便进一步处理。
蓝牙模块1270用于通过蓝牙协议来与其他具有蓝牙模块的蓝牙设备进行信息交互。例如,终端设备可以通过蓝牙模块1270与同样具备蓝牙模块的可穿戴电子设备(例如智能手表)建立蓝牙连接,从而进行数据交互。
处理器1280是终端设备的控制中心,利用各种接口和线路连接整个终端的各个部分,通过运行或执行存储在存储器1220内的软件程序,以及调用存储在存储器1220内的数据,执行终端设备的各种功能和处理数据。在一些实施例中,处理器1280可包括一个或多个处理单元;处理器1280还可以集成应用处理器和基带处理器,其中,应用处理器主要处理操作***、对象界面和应用程序等,基带处理器主要处理无线通信。可以理解的是,上述基带处理器也可以不集成到处理器1280中。本申请中处理器1280可以运行操作***、应用程序、对象界面显示及触控响应,以及本申请实施例的生理数据的分析方法。另外,处理器1280与显示单元1230耦接。
在一些可能的实施方式中,本申请提供的生理数据的分析方法的各个方面还可以实现为一种程序产品的形式,其包括计算机程序,当程序产品在电子设备上运行时,计算机程序用于使电子设备执行本说明书上述描述的根据本申请各种示例性实施方式的生理数据的分析方法中的步骤,例如,电子设备可以执行如图3中所示的步骤。
程序产品可以采用一个或多个可读介质的任意组合。可读介质可以是可读信号介质或者可读存储介质。可读存储介质例如可以是但不限于电、磁、光、电磁、红外线、或半导体的***、装置或器件,或者任意以上的组合。可读存储介质的更具体的例子包括:具有一个或多个导线的电连接、便携式盘、硬盘、随机存取存储器、只读存储器、可擦式可编程只读存储器、光纤、便携式紧凑盘只读存储器、光存储器件、磁存储器件、或者上述的任意合适的组合。
本申请的实施方式的程序产品可以采用便携式紧凑盘只读存储器并包括计算机程序,并可以在电子设备上运行。然而,本申请的程序产品不限于此,在本文件中,可读存储介质可以是任何包含或存储程序的有形介质,该程序可以被命令执行***、装置或者器件使用或者与其结合使用。
可读信号介质可以包括在基带中或者作为载波一部分传播的数据信号,其中承载了可读计算机程序。这种传播的数据信号可以采用多种形式,包括但不限于电磁信号、光信号或上述的任意合适的组合。可读信号介质还可以是可读存储介质以外的任何可读介质,该可读介质可以发送、传播或者传输用于由命令执行***、装置或者器件使用或者与其结合使用的程序。
可读介质上包含的计算机程序可以用任何适当的介质传输,包括但不限于无线、有线、光缆、RF等等,或者上述的任意合适的组合。
可以以一种或多种程序设计语言的任意组合来编写用于执行本申请操作的计算机程序,程序设计语言包括面向对象的程序设计语言—诸如Java、C++等,还包括常规的过程式程序设计语言—诸如“C”语言或类似的程序设计语言。计算机程序可以完全地在用户计算装置上执行、部分地在用户计算装置上执行、作为一个独立的软件包执行、部分在用户计算装置上部分在远程计算装置上执行、或者完全在远程计算装置或服务器上执行。在涉及远程计算装置的情形中,远程计算装置可以通过任意种类的网络包括局域网或广域网连接到用户计算装置,或者,可以连接到外部计算装置。
本领域内的技术人员应明白,本申请的实施例可提供为方法、***、或计算机程序产品。因此,本申请可采用完全硬件实施例、完全软件实施例、或结合软件和硬件方面的实施例的形式。而且,本申请可采用在一个或多个其中包含有计算机可用计算机程序的计算机可用存储介质(包括但不限于磁盘存储器、CD-ROM、光学存储器等)上实施的计算机程序产品的形式。
尽管已描述了本申请的优选实施例,但本领域内的技术人员一旦得知了基本创造性概念,则可对这些实施例做出另外的变更和修改。所以,所附权利要求意欲解释为包括优选实施例以及落入本申请范围的所有变更和修改。
显然,本领域的技术人员可以对本申请进行各种改动和变型而不脱离本申请的精神和范围。这样,倘若本申请的这些修改和变型属于本申请权利要求及其等同技术的范围之内,则本申请也意图包含这些改动和变型在内。

Claims (15)

1.一种生理数据的分析方法,其特征在于,该方法包括:
获取待分析对象的原始状态信息,以及与所述待分析对象相关的至少一类对象属性信息;其中,所述原始状态信息包含所述待分析对象在自身所处环境下的生理数据;
基于对应各预设状态信息配置的条件概率,对所述原始状态信息进行特征提取,获得相应的第一中间结果;所述条件概率表示在一个预设生理数据分析结果的条件下一个预设状态信息出现的概率;
分别对所述至少一类对象属性信息进行特征提取,获得所述至少一类对象属性信息各自对应的第二中间结果;
基于所述第一中间结果和至少一个第二中间结果,确定所述待分析对象对应各类预设生理数据分析结果的类别概率,并基于各个类别概率,确定所述待分析对象的目标生理数据分析结果。
2.如权利要求1所述的方法,其特征在于,所述基于对应各预设状态信息配置的条件概率,对所述原始状态信息进行特征提取,获得相应的第一中间结果,包括:
分别获取各个预设生理数据分析结果下,各预设状态信息各自的条件概率,并基于获得的各个条件概率,确定用于进行特征提取的第一权重矩阵;
基于所述第一权重矩阵,对所述原始状态信息进行特征提取,获得相应的第一中间结果。
3.如权利要求1所述的方法,其特征在于,所述分别对所述至少一类对象属性信息进行特征提取,获得所述至少一类对象属性信息各自对应的第二中间结果,包括:
对于所述至少一类对象属性信息中的每一类对象属性信息,分别执行以下操作:
对于一类对象属性信息,基于各预设生理数据分析结果与所述一类对象属性信息之间的匹配关联程度,确定用于对所述一类对象属性信息进行特征提取的第二权重矩阵;
基于所述第二权重矩阵,对所述一类对象属性信息进行特征提取,获得对应的第二中间结果。
4.如权利要求1~3任一项所述的方法,其特征在于,所述基于对应各预设状态信息配置的条件概率,对所述原始状态信息进行特征提取,获得相应的第一中间结果,包括:
将所述待分析对象的所述原始状态信息,输入已训练的目标分析模型中的第一特征网络;
基于所述第一特征网络,对所述原始状态信息进行特征提取,获得所述第一中间结果,其中,所述第一特征网络中的第一权重矩阵是基于所述条件概率确定的。
5.如权利要求4所述的方法,其特征在于,所述分别对所述至少一类对象属性信息进行特征提取,获得所述至少一类对象属性信息各自对应的第二中间结果,包括:
将所述待分析对象的至少一类对象属性信息,分别输入所述目标分析模型中相应的第二特征网络,其中,每个第二特征网络对应一类对象属性信息;
分别基于所述至少一类对象属性信息各自相应的第二特征网络,对相应的对象属性信息进行特征提取,获得相应的第二中间结果。
6.如权利要求4所述的方法,其特征在于,所述目标分析模型是通过下列方式训练得到的:
获取样本数据集,所述样本数据集中的每个样本数据包括一个样本对象,所述样本对象的原始状态信息,至少一类对象属性信息,以及所述样本对象的生理数据分析结果标签;
根据所述样本数据集对待训练的分析模型进行循环迭代训练,输出相应的目标分析模型;其中,在一次循环迭代过程中,执行以下操作:
将选取的样本数据输入所述待训练的分析模型,获得所述样本对象对应各类预设生理数据分析结果的类别概率;
采用基于所述样本对象对应各类预设生理数据分析结果的类别概率和所述生理数据分析结果标签,构建的目标损失函数,对所述待训练的分析模型进行参数调整。
7.如权利要求6所述的方法,其特征在于,在所述待训练的分析模型中,所述原始状态信息对应的特征网络中的第一权重矩阵是:基于所述条件概率初始化得到的;所述至少一类对象属性信息各自对应的特征网络中的第二权重矩阵是:基于各预设生理数据分析结果与各自之间的匹配关联程度初始化得到的;
则所述采用基于所述样本对象对应各类预设生理数据分析结果的类别概率和所述生理数据分析结果标签,构建的目标损失函数,对所述待训练的分析模型进行参数调整,包括:
基于所述目标损失函数,对所述第一权重矩阵和各个第二权重矩阵进行参数调整。
8.如权利要求6所述的方法,其特征在于,所述获取样本数据集,包括:
将初始的样本数据按照预设生理数据分析结果类别划分为至少一个样本数据子集,并确定各预设生理数据分析结果类别对应的样本数据子集中的样本数量;
将样本数量未达到预设数量的样本数据子集中的样本数据,进行上采样处理,获得至少一个上采样的样本数据;
基于所述上采样的样本数据和所述初始的样本数据,构建所述样本数据集。
9.如权利要求1~3任一项所述的方法,其特征在于,所述基于所述第一中间结果和至少一个第二中间结果,确定所述待分析对象对应各类预设生理数据分析结果的类别概率,包括:
确定由所述第一中间结果和所述至少一个第二中间结果,进行累加求和得到的求和结果;
对所述求和结果进行归一化处理,获得所述待分析对象对应各类预设生理数据分析结果的类别概率。
10.如权利要求1~3任一项所述的方法,其特征在于,所述对象属性信息包括下列至少一类:对象年龄信息,对象就诊时间信息、对象性别信息。
11.如权利要求1~3任一项所述的方法,其特征在于,所述基于各个类别概率,确定所述待分析对象的目标生理数据分析结果,包括:
将各个类别概率中达到参考阈值的类别概率对应的预设生理数据分析结果,作为所述待分析对象的目标生理数据分析结果;或
将各个类别概率进行排序,并将排序结果在指定次序范围内的类别概率对应的预设生理数据分析结果,作为所述待分析对象的目标生理数据分析结果。
12.一种生理数据的分析装置,其特征在于,包括:
信息获取单元,用于获取待分析对象的原始状态信息,以及与所述待分析对象相关的至少一类对象属性信息;其中,所述原始状态信息包含所述待分析对象在自身所处环境下的生理数据;
特征提取单元,用于基于对应各预设状态信息配置的条件概率,对所述原始状态信息进行特征提取,获得相应的第一中间结果;所述条件概率表示在一个预设生理数据分析结果的条件下一个预设状态信息出现的概率;
所述特征提取单元,还用于分别对所述至少一类对象属性信息进行特征提取,获得所述至少一类对象属性信息各自对应的第二中间结果;
结果分析单元,用于基于所述第一中间结果和至少一个第二中间结果,确定所述待分析对象对应各类预设生理数据分析结果的类别概率,并基于各个类别概率,确定所述待分析对象的目标生理数据分析结果。
13.一种电子设备,其特征在于,其包括处理器和存储器,其中,所述存储器存储有计算机程序,当所述计算机程序被所述处理器执行时,使得所述处理器执行权利要求1~11中任一所述方法的步骤。
14.一种计算机可读存储介质,其特征在于,其包括计算机程序,当所述计算机程序在电子设备上运行时,所述计算机程序用于使所述电子设备执行权利要求1~11中任一所述方法的步骤。
15.一种计算机程序产品,其特征在于,包括计算机程序,所述计算机程序存储在计算机可读存储介质中;当电子设备的处理器从所述计算机可读存储介质读取所述计算机程序时,所述处理器执行所述计算机程序,使得所述电子设备执行权利要求1~11中任一所述方法的步骤。
CN202210315874.0A 2022-03-28 2022-03-28 一种生理数据的分析方法、装置、电子设备和存储介质 Pending CN114783601A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202210315874.0A CN114783601A (zh) 2022-03-28 2022-03-28 一种生理数据的分析方法、装置、电子设备和存储介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202210315874.0A CN114783601A (zh) 2022-03-28 2022-03-28 一种生理数据的分析方法、装置、电子设备和存储介质

Publications (1)

Publication Number Publication Date
CN114783601A true CN114783601A (zh) 2022-07-22

Family

ID=82425958

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202210315874.0A Pending CN114783601A (zh) 2022-03-28 2022-03-28 一种生理数据的分析方法、装置、电子设备和存储介质

Country Status (1)

Country Link
CN (1) CN114783601A (zh)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN115062554A (zh) * 2022-08-19 2022-09-16 上海华模科技有限公司 生物组织状态的模拟方法、***及存储介质
CN116910920A (zh) * 2023-09-12 2023-10-20 陕西万禾数字科技有限公司 基于增强现实技术的航空发动机综合健康管理***及方法

Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111128390A (zh) * 2019-12-20 2020-05-08 昆明理工大学 一种基于骨科症状特征选取的文本处理方法
CN111667915A (zh) * 2020-06-05 2020-09-15 山东凯鑫宏业生物科技有限公司 一种具有疾病推理的智能医疗***及其诊断方法
CN111666477A (zh) * 2020-06-19 2020-09-15 腾讯科技(深圳)有限公司 一种数据处理方法、装置、智能设备及介质
CN111968750A (zh) * 2020-10-23 2020-11-20 平安科技(深圳)有限公司 一种服务器、数据处理方法、装置及可读存储介质
WO2021114840A1 (zh) * 2020-05-28 2021-06-17 平安科技(深圳)有限公司 基于语义分析的评分方法、装置、终端设备及存储介质
CN113436725A (zh) * 2021-06-24 2021-09-24 平安国际智慧城市科技股份有限公司 数据处理方法、***、计算机设备及计算机可读存储介质

Patent Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111128390A (zh) * 2019-12-20 2020-05-08 昆明理工大学 一种基于骨科症状特征选取的文本处理方法
WO2021114840A1 (zh) * 2020-05-28 2021-06-17 平安科技(深圳)有限公司 基于语义分析的评分方法、装置、终端设备及存储介质
CN111667915A (zh) * 2020-06-05 2020-09-15 山东凯鑫宏业生物科技有限公司 一种具有疾病推理的智能医疗***及其诊断方法
CN111666477A (zh) * 2020-06-19 2020-09-15 腾讯科技(深圳)有限公司 一种数据处理方法、装置、智能设备及介质
CN111968750A (zh) * 2020-10-23 2020-11-20 平安科技(深圳)有限公司 一种服务器、数据处理方法、装置及可读存储介质
CN113436725A (zh) * 2021-06-24 2021-09-24 平安国际智慧城市科技股份有限公司 数据处理方法、***、计算机设备及计算机可读存储介质

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN115062554A (zh) * 2022-08-19 2022-09-16 上海华模科技有限公司 生物组织状态的模拟方法、***及存储介质
CN115062554B (zh) * 2022-08-19 2022-11-08 上海华模科技有限公司 生物组织状态的模拟方法、***及存储介质
CN116910920A (zh) * 2023-09-12 2023-10-20 陕西万禾数字科技有限公司 基于增强现实技术的航空发动机综合健康管理***及方法
CN116910920B (zh) * 2023-09-12 2023-12-05 陕西万禾数字科技有限公司 基于增强现实技术的航空发动机综合健康管理***及方法

Similar Documents

Publication Publication Date Title
Srinivasu et al. From blackbox to explainable AI in healthcare: existing tools and case studies
Zheng et al. The fusion of deep learning and fuzzy systems: A state-of-the-art survey
US11113598B2 (en) Dynamic memory network
US11544524B2 (en) Electronic device and method of obtaining emotion information
US20160350653A1 (en) Dynamic Memory Network
CN111666477B (zh) 一种数据处理方法、装置、智能设备及介质
Morshed et al. Deep osmosis: Holistic distributed deep learning in osmotic computing
Kaklauskas Biometric and intelligent decision making support
EP3884426B1 (en) Action classification in video clips using attention-based neural networks
EP3820369B1 (en) Electronic device and method of obtaining emotion information
CN111898636B (zh) 一种数据处理方法及装置
Jain et al. GAN-Poser: an improvised bidirectional GAN model for human motion prediction
França et al. An overview of deep learning in big data, image, and signal processing in the modern digital age
CN114783601A (zh) 一种生理数据的分析方法、装置、电子设备和存储介质
CN113704460B (zh) 一种文本分类方法、装置、电子设备和存储介质
Halvardsson et al. Interpretation of swedish sign language using convolutional neural networks and transfer learning
WO2023231753A1 (zh) 一种神经网络的训练方法、数据的处理方法以及设备
US20240046127A1 (en) Dynamic causal discovery in imitation learning
Hasan et al. Employment of ensemble machine learning methods for human activity Recognition
CN115238909A (zh) 一种基于联邦学习的数据价值评估方法及其相关设备
Ju et al. 3D-CNN-SPP: A patient risk prediction system from electronic health records via 3D CNN and spatial pyramid pooling
Feng et al. Ontology semantic integration based on convolutional neural network
WO2024067779A1 (zh) 一种数据处理方法及相关装置
Arun Prasath et al. Prediction of sign language recognition based on multi layered CNN
CN113609233A (zh) 一种实体对象编码方法、装置、电子设备和存储介质

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination