CN111652135B - 心电图数据生成方法、装置及电子设备 - Google Patents
心电图数据生成方法、装置及电子设备 Download PDFInfo
- Publication number
- CN111652135B CN111652135B CN202010493569.1A CN202010493569A CN111652135B CN 111652135 B CN111652135 B CN 111652135B CN 202010493569 A CN202010493569 A CN 202010493569A CN 111652135 B CN111652135 B CN 111652135B
- Authority
- CN
- China
- Prior art keywords
- data
- initial
- model
- target
- electrocardiogram
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F2218/00—Aspects of pattern recognition specially adapted for signal processing
- G06F2218/22—Source localisation; Inverse modelling
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/21—Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
- G06F18/214—Generating training patterns; Bootstrap methods, e.g. bagging or boosting
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
- G06N3/045—Combinations of networks
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- Artificial Intelligence (AREA)
- General Physics & Mathematics (AREA)
- Data Mining & Analysis (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Life Sciences & Earth Sciences (AREA)
- Evolutionary Computation (AREA)
- Biophysics (AREA)
- Biomedical Technology (AREA)
- Computing Systems (AREA)
- General Health & Medical Sciences (AREA)
- Computational Linguistics (AREA)
- Mathematical Physics (AREA)
- Software Systems (AREA)
- Molecular Biology (AREA)
- Health & Medical Sciences (AREA)
- Signal Processing (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Bioinformatics & Computational Biology (AREA)
- Evolutionary Biology (AREA)
- Measurement And Recording Of Electrical Phenomena And Electrical Characteristics Of The Living Body (AREA)
Abstract
本申请实施例提供一种心电图数据生成方法、装置及电子设备,该方法包括:获取初始心电图数据,所述初始心电图数据属于预设的原标签;将所述初始心电图数据输入目标数据扩充模型中,得到预设数量的目标心电图数据,各所述目标心电图数据两两不同。利用数据扩充模型对输入的初始心电图数据进行扩充,可以得到与初始心电图数据不同,同时又相关的目标心电图数据,从而实现了自动生成带标注的心电图数据。
Description
技术领域
本申请涉及计算机技术,尤其涉及一种心电图数据生成方法、装置及电子设备。
背景技术
心电信号是一种记录心跳在一段时间内在一个或多个导联上电生理活动的信号,具有丰富的心脏生理信息。在临床诊断上,心电信号是许多疾病的重要参考依据,心电信号的异常是许多疾病的反映。随着人工智能技术的不断发展,利用神经网络模型进行健康数据分析等,成为研究的热点。基于实际任务的需要,一些神经网络模型需要以心电信号作为输入。该心电信号具体可以为心电图数据。例如,某个用于进行心电图分类的神经网络模型,需要基于心电图数据完成心电图的分类。对于这种神经网络模型,在进行模型训练时,需要使用大量的带标注的心电图数据,带标注的心电图数据越多,所训练出的神经网络模型的准确性越高。
但是,目前获取带标注的心电图数据的难度较大。首先,心电图数据属于医疗数据,因此心电图数据的公开受限。其次,对心电图数据进行标注,需要专业的医学知识,因此标注的难度大。因此,如何获取较大数量的带标注的心电图数据,是亟待解决的问题。
发明内容
本申请实施例提供一种心电图数据生成方法、装置及电子设备,用于自动获取较大数量的带标注的心电图数据。
第一方面,本申请实施例提供一种心电图数据生成方法,包括:
获取初始心电图数据,所述初始心电图数据属于预设的原标签。
将所述初始心电图数据输入目标数据扩充模型中,得到预设数量的目标心电图数据,各所述目标心电图数据两两不同。
第二方面,本申请实施例提供一种心电图数据生成装置,包括:
获取模块,用于获取初始心电图数据,所述初始心电图数据属于预设的原标签。
处理模块,用于将所述初始心电图数据输入目标数据扩充模型中,得到预设数量的目标心电图数据,各所述目标心电图数据两两不同。
第三方面,本申请实施例提供一种电子设备,包括:
存储器,用于存储程序指令;处理器,用于调用并执行所述存储器中的程序指令,执行上述第一方面所述的方法步骤。
第四方面,本申请实施例提供一种可读存储介质,所述可读存储介质中存储有计算机程序,所述计算机程序用于执行上述第一方面所述的方法。
本申请实施例所提供的心电图数据生成方法、装置及电子设备,利用数据扩充模型对输入的初始心电图数据进行扩充,可以得到与初始心电图数据不同,同时又相关的目标心电图数据,从而实现了自动生成带标注的心电图数据。
附图说明
为了更清楚地说明本申请或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作一简单地介绍,显而易见地,下面描述中的附图是本申请的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动性的前提下,还可以根据这些附图获得其他的附图。
图1为本申请实施例提供的心电图数据生成方法的一种示例性***架构图;
图2为本申请实施例提供的心电图数据生成方法的流程示意图;
图3为本申请实施例提供的心电图数据生成方法的流程示意图;
图4为作为第一目标数据扩充模型的变分自编码器的结构示意图;
图5为具体实施时实现的效果的示意图;
图6为预先初始训练业务模型的示意图;
图7为对变分自编码器进行训练的示意图;
图8为利用训练完成的变分自编码器得到目标心电图数据的示意图;
图9为本申请实施例提供的心电图数据生成方法的流程示意图;
图10为作为第二目标数据扩充模型的变分自编码器的结构示意图;
图11为具体实施时实现的效果的示意图;
图12为对变分自编码器进行训练的示意图;
图13为利用训练完成的变分自编码器得到目标心电图数据的示意图;
图14为本申请实施例提供的一种心电图数据生成装置的模块结构图;
图15为本申请实施例提供的一种电子设备1000的结构示意图。
具体实施方式
为使本申请的目的、技术方案和优点更加清楚,下面将结合本申请实施例中的附图,对本申请实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本申请一部分实施例,而不是全部的实施例。基于本申请中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都属于本申请保护的范围。
在应用神经网络进行健康数据分析等场景中,可能需要使用大量的带标注的心电图数据对神经网络进行训练,但是,相比于其他领域的训练数据,心电图数据标注时的难度较大。因此,需要提供一种有效生成大量带标注的心电图数据的方法。
基于上述的考虑,本申请实施例利用数据扩充模型将一个心电图数据扩充为相关的心电图数据,从而自动生成带标注的心电图数据。
另外,带有疾病标签的心电图数据相比健康标签的心电图数据,往往更少,造成了严重的数据不均衡。示例性的,现实情况中,假设采集了1000个心电图数据并进行标注,这些带标注的心电图数据中,可能有600个心电图数据的标签为健康标签,200个为疾病A标签,100个为疾病B标签,150个为疾病C标签。因此,带标注的心电图数据还存在严重的不均衡问题,对于后续的业务模型的训练过程可能产生较大影响。本申请实施例还用于解决这一问题。
图1为本申请实施例提供的心电图数据生成方法的一种示例性***架构图,如图1所示,本申请实施例涉及数据扩充模型以及至少一个业务模型,业务模型的数量可以为一个,也可以为多个,图1中以一个业务模型为例进行示例。其中,数据扩充模型和业务模型可以位于同一个电子设备,或者,也可以位于不同的电子设备,本申请实施例对此不作具体限定。本申请实施例中,可以利用数据扩充模型生成大量的带标注的心电图数据,这些带标注的心电图数据可以作为业务模型的训练数据,用来训练业务模型。而数据扩充模型在训练时,可以借助预先经过初始训练的业务模型输出的业务数据来修正数据扩充模型的输出结果,该初始训练可以指使用较少的带标签的心电图数据对业务模型进行训练,经过初始训练的业务模型可以完成业务模型的功能。这些带标签的心电图数据可以是利用人工标注方式得到的心电图数据。
图2为本申请实施例提供的心电图数据生成方法的流程示意图,该方法的执行主体可以为包含了上述数据扩充模型的电子设备。如图2所示,该方法包括:
S201、获取初始心电图数据。
可选的,该初始心电图数据可以指包括了由心电图检测仪器所生成的心电信号的数据,例如,可以为包含了心电信号的图像。心电信号包括了特定条数的导联的波形信号,每条导联的波形信号持续特定的时长。本申请实施例对于心电图数据的导联条数以及持续时间不做具体限定。
可选的,当获取到原始的心电信号之后,可以对信号使用带通滤波器进行滤波等预处理,再将其用于模型训练。
上述初始心电图数据属于预设的原标签。
本申请实施例中,心电图数据的标签用于表征健康状况以及疾病信息。示例性的,假设涉及心脏的疾病信息包括房颤、房扑、束支阻滞,则可以使用4个标记位作为心电图数据的标签。例如,如果某个心电图数据代表健康,则该心电图数据的标签可以表示为1000;如果某个心电图数据代表房颤,则该心电图数据的标签可以表示0100;如果某个心电图数据代表房颤和房扑,则标签可以表示为0110。
在执行本实施例之前,可以预先使用一些带标签的心电图数据初始训练业务模型,该业务模型可以是指实现某些业务功能的模型,例如可以是进行健康数据分析的模型。对业务模型进行初始训练时使用的这些带标签的心电图数据,可以是通过手工标注方式得到的心电图数据。
作为一种可选的实施方式,可以将上述用于初始训练业务模型的带标签的心电图数据作为上述的初始心电图数据,即初始心电图数据具有预设的原标签。应理解,本申请实施例可以不限于此,初始心电图数据也可以来源于其他的带标签的心电图数据。
本申请实施例中,业务模型可以是用于根据心电图数据输出能够表征业务的业务数据。例如,业务模型为进行健康数据分析的模型,则业务模型可以输出表征健康数据分析结果的结果数据。
S202、将上述初始心电图数据输入目标数据扩充模型中,得到预设数量的目标心电图数据,所得到的各目标心电图数据两两不同。
上述预设数量可以根据后续训练业务模型时的需要进行灵活设置。
将上述初始心电图数据输入目标数据扩充模型后,目标数据扩充模型可以生成与初始心电图数据不同,同时又与初始心电图数据相关的目标心电图数据。
其中,目标心电图数据与初始心电图数据相关,可以是指目标心电图数据的标签与初始心电图数据的标签相同,还可以是指目标心电图数据的标签与初始心电图数据的标签不同,但是差异较小。
目标数据扩充模型得到的预设数量的目标心电图数据两两不同,同时,这些目标心电图数据与初始心电图数据也分别不同。
本实施例中,利用数据扩充模型对输入的初始心电图数据进行扩充,可以得到与初始心电图数据不同,同时又相关的目标心电图数据,从而实现了自动生成带标注的心电图数据。
如前文所述,在利用数据扩充模型扩充带标签的心电图数据之前,可以预先使用一些带标签的心电图数据初始训练业务模型,该业务模型可以完成业务模型的功能。但是,对于业务模型来说,使用的训练越多,则模型的训练效果越好,所得到的模型的可用性越强,因此,利用上述扩充得到的目标心电图数据,可以继续训练业务模型。
可选的,可以将上述初始心电图数据以及上述预设数量的目标心电图数据输入业务模型中,得到业务模型输出的业务数据。并根据该业务数据,修正业务模型。
可选的,如果业务模型与数据扩充模型位于同一电子设备,则电子设备可以直接将扩充得到的目标心电图数据输入业务模型中。如果业务模型与数据扩充模型不位于同一电子设备,则上述的输入可以指由电子设备将目标心电图数据发送至业务模型所在的设备,并由业务模型所在的设备目标心电图数据输入业务模型中。
本申请实施例的业务模型可以为神经网络模型,例如卷积神经网络模型、循环神经网络模型等。具体可以根据所输入的心电图数据进行选择。例如,如果心电图数据的导联条数较多,持续时间较长,则可以使用参数量较多的神经网络模型,否则,可以使用参数量较少的神经网络模型。
本申请实施例中,上述的目标数据扩充模型可以为下述的任意一种模型。
第一种,目标数据扩充模型可以为第一目标数据扩充模型。在使用该第一目标数据扩充模型时,仅需要输入初始心电图数据,该第一目标数据扩充模型即可输出与初始心电图数据的标签相同,同时,在数据上又存在略微差异的目标心电图数据。
第二种,目标数据扩充模型可以为第二目标数据扩充模型。在使用该第二目标数据扩充模型时,可以输入初始心电图数据、初始心电图数据的原标签以及期望标签,该第二目标数据扩充模型即可以输出目标心电图数据,该目标心电图数据的标签为上述期望标签,同时,该目标心电图数据又与初始心电图数据的波形基本保持一致,这种方式在实现心电图数据扩充的同时,还能提升带标注的心电图数据的均衡性。
其中,使用该第二种的第二目标数据扩充模型,当输入的期望标签与原标签相同时,可以实现与第一种的第一目标数据扩充模型同样的效果。
以下分别对上述第一目标数据扩充模型和第二目标数据扩充模型的处理和训练过程进行说明。
首先说明第一目标数据扩充模型的处理和训练过程。
当目标数据扩充模型为第一目标数据扩充模型,经上述步骤S202所得到的各目标心电图数据两两不同,并且,每个目标心电图数据的标签与上述初始心电图数据的原标签相同,该预设数量大于等于2。其中,每个目标心电图数据由上述第一目标数据扩充模型基于上述初始心电图数据编码后的数据分布信息得到。
上述的第一目标数据扩充模型能够对初始心电图数据进行编码,并且得到编码后的数据分布信息,该数据分布信息表征的是数据的分布,而并非是特定的数据,因此,基于该数据分布信息,第一目标数据扩充模型可以扩充出大于等于2的预设数量的目标心电图数据,这些目标心电图数据属于的标签与初始心电图数据相同,例如,初始心电图数据的标签表征房颤,则这些目标心电图数据属于的标签均表征房颤,同时,这些目标心电图两两之间,以及与初始心电图数据均不同。值得说明的是,该不同,是指略微不同,例如在PR间期的长度上略微不同。
上述预设数量可以根据后续训练业务模型时的需要进行灵活设置。
本实施例中,由于数据扩充模型能够对初始心电图数据进行编码并得到数据分布信息,因此,利用数据扩充模型对输入的初始心电图数据进行扩充,可以得到大量的与初始心电图数据标签相同同时在数据上又存在略微差异的目标心电图数据,从而实现了自动生成大量的带标注的心电图数据。
值得说明的是,虽然初始心电图数据具有预设的标签,但是,利用的第一数据扩充模型进行数据扩充时,并不需要使用该标签信息。该标签信息用于后续对业务模型的训练中,具体的,当使用初始心电图数据以及通过其扩充得到的多个目标心电图数据进一步训练业务扩充模型时,初始心电图数据和多个目标心电图数据均具有初始心电图的标签信息,从而基于该标签信息进行业务模型的训练。
以上实施例说明了利用第一目标数据扩充模型可以得到预设数量的目标心电图数据。以下说明利用第一目标数据扩充模型生成预设数量的目标心电图数据的两种具体实施方式。
第一种实施方式中,可以将下述操作执行预设数量次:
将上述初始心电图数据输入第一目标数据扩充模型中,由上述第一目标数据扩充模型对上述初始心电图数据进行编码,得到上述初始心电图数据的中间输出,并对该中间输出随机采样一次,将采样的结果进行解码,得到所述目标心电图数据;
其中,上述中间输出为经过编码所得到的数据分布信息。
在该实施方式中,每次均将初始心电图数据输入第一目标数据扩充模型中,第一目标数据扩充模型产生中间输出的数据分布,模型从数据分布中进行一次采样,并对采样得到的数据进行解码,进而得到一个目标心电图数据。循环执行预设数量次,并且每次采样均为随机采样,从而可以得到预设数量个略微不同的目标心电图数据。
第二种实施方式中,将上述初始心电图数据输入第一目标数据扩充模型中,由上述第一目标数据扩充模型对上述初始心电图数据进行编码,得到上述初始心电图数据的中间输出,并对上述中间输出随机采样所述预设数量次,将采样的结果分别进行解码,得到上述预设数量的目标心电图数据。
在该实施方式中,将初始心电图数据输入第一目标数据扩充模型中的次数为一次,输入之后,第一目标数据扩充模型产生中间输出的数据分布,再从数据分布中分别进行预设数量次的采样,每次采样均为随机采样,并分别预设数量次采样得到的数据进行解码,进而得到预设数量个略微不同的目标心电图数据。
以下说明使用第一目标数据扩充模型得到预设数量的目标心电图数据之前,对目标数据模型所对应的第一初始数据扩充模型进行训练的过程。
本申请实施例中,第一初始数据扩充模型是指未训练完成的第一目标数据扩充模型,当第一初始数据扩充模型训练完成后,即成为第一目标数据扩充模型。
本申请实施例在训练第一初始数据扩充模型时,利用了前述的经过初始训练的业务模型,经过这种处理,可以使得训练得到的第一目标数据扩充模型所生成的目标心电图数据能够保留初始心电图数据中的与疾病异常有关的微小波形特征,进而使得目标心电图数据能够对业务模型的进一步的训练效果起到更明显的作用。以下进行具体说明。
图3为本申请实施例提供的心电图数据生成方法的流程示意图,如图3所示,对第一初始数据扩充模型进行训练的过程包括:
S301、将第一训练心电图数据输入第一初始数据扩充模型中,得到该第一初始数据扩充模型输出的第一扩充心电图数据。
作为一种可选的实施方式,可以将前述的用于初始训练业务模型的带标签的心电图数据作为上述的第一训练心电图数据。应理解,本申请实施例可以不限于此,初始心电图数据也可以来源于其他的带标签的心电图数据。
S302、将上述第一训练心电图数据以及上述第一扩充心电图数据分别输入业务模型中,分别得到由上述业务模型输出的第一训练业务数据以及第一扩充业务数据。
其中,业务模型用于根据心电图数据输出能够表征业务的业务数据。例如前文所述的,业务模型为进行健康数据分析的模型,则业务模型可以输出表征健康数据分析结果的结果数据。另外,第一训练业务数据是业务模型对第一训练心电图数据处理得到的业务数据,第一扩充业务数据是业务模型对第一扩充心电图数据处理得到的业务数据。
值得说明的是,由第一初始数据扩充模型输出的第一扩充心电图数据为前述的预设数量个,则针对每个第一扩充心电图数据均可以执行一次本步骤,或者,也可以从预设数量个第一扩充心电图数据中选择一个第一扩充心电图数据执行本步骤。
以选择一个第一扩充心电图数据为例,将第一训练心电图数据和该第一扩充心电图数据分别输入业务模型后,业务模型对第一训练心电图数据处理输出上述的第一训练业务数据,对第一扩充心电图数据处理输出上述的第一扩充业务数据。
S303、根据上述第一训练业务数据以及第一扩充业务数据,对上述第一初始数据扩充模型进行修正,得到上述第一目标数据扩充模型。
对第一初始数据扩充模型训练的目标是使得训练得到的第一目标数据扩充模型对初始心电图数据与扩充得到的目标心电图数据之间存在略微差异,同时属于相同的标签。如果第一目标数据扩充模型足够准确,则对于属于相同的标签的两个心电图数据,将该两个心电图数据输入业务模型中后,由业务模型所输出的业务数据应尽可能接近。例如,某个初始心电图数据表示房颤,则将该初始心电图数据和由此得到的目标心电图数据输入进行健康数据分析的业务模型后,所得到的分析结果应均和房颤相关。基于上述,本申请实施例可以利用业务模型来约束初始数据模型的训练,从而使得最终训练得到的第一目标数据扩充模型所生成的目标心电图数据能够保留初始心电图数据中的与疾病异常有关的微小波形特征,进而使得目标心电图数据能够对业务模型的进一步的训练效果起到更明显的作用。
应理解,将第一初始数据扩充模型训练成为第一目标数据扩充模型的过程,可能需要多次的训练,因此,具体实施过程中,上述步骤S301-S303可以多次循环执行,每次循环结束,会修正得到新的第一初始数据扩充模型,当某次循环结束所得到的第一初始数据扩充模型满足预设的要求时,则停止训练,并将本次的第一初始数据扩充模型作为第一目标数据扩充模型。
以下说明上述步骤S303中根据上述第一训练业务数据以及第一扩充业务数据,对上述第一初始数据扩充模型进行修正的可选方式。
作为一种可选的实施方式,可以根据上述第一训练业务数据以及第一扩充业务数据确定第一初始数据扩充模型的损失函数的结果,并根据损失函数的结果,对第一初始数据扩充模型进行修正。
利用第一训练业务数据和第一扩充业务数据得到第一初始数据扩充模型的损失函数的结果,即,将第一训练业务数据和第一扩充业务数据引入第一初始数据扩充模型的损失函数中,以此来影响损失函数的结果,进而影响第一初始数据扩充模型的修正,从而实现前述的使得最终训练得到的第一目标数据扩充模型所生成的目标心电图数据能够保留初始心电图数据中的与疾病异常有关的微小波形特征,进而使得目标心电图数据能够对业务模型的进一步的训练效果起到更明显的作用。
可选的,在根据上述第一训练业务数据以及第一扩充业务数据确定第一初始数据扩充模型的损失函数的结果时,可以首先确定第一训练业务数据和第一扩充业务数据的差异信息,并根据第一训练业务数据以及第一扩充业务数据的差异信息,确定第一初始数据扩充模型的损失函数的结果。
利用第一训练业务数据和第一扩充业务数据的差异信息,能够体现出对应的第一训练心电图数据和第一扩充心电图数据的差异,因此,利用第一训练业务数据和第一扩充业务数据的差异信息得到第一初始数据扩充模型的损失函数的结果,能够更加准确地修正第一初始数据扩充模型,使得第一初始数据扩充模型准确度不断提升。
可选的,在根据第一训练业务数据以及第一扩充业务数据的差异信息,确定第一初始数据扩充模型的损失函数的结果时,可以将该差异信息作为损失函数的第一参数的值,并将该第一参数的值与损失函数的第二参数的值相加,得到第一初始数据扩充模型的损失函数的结果。
其中,第二参数的值根据上述第一训练心电图数据、第一扩充心电图数据以及第一初始数据扩充模型对上述第一训练心电图数据编码得到的数据分布信息得到。
在该实施例中,将第一训练业务数据以及第一扩充业务数据的差异信息作为损失函数的一部分,即第一参数,并将第一训练心电图数据以及第一初始数据扩充模型得到的数据分布信息以及第一扩充心电图数据作为损失函数的另一部分,即第二参数,利用第一参数和第二参数的结合,共同约束第一初始数据扩充模型的修正。
其中,针对上述第二参数,利用上述第一训练心电图数据和第一扩充心电图数据可以衡量第一训练心电图数据和第一扩充心电图数据是否足够接近,利用上述数据分布信息可以衡量数据分布信息是否足够接近理想的数据分布,例如是否足够接近正态分布。
本申请实施例中,第一目标数据扩充模型可以为变分自编码器。图4为作为第一目标数据扩充模型的变分自编码器的结构示意图,如图4所示,变分自编码器包括编码器和解码器,对于一个特定的输入数据,编码器对输入数据进行编码可以得到数据分布信息,该数据分布信息可以为高斯分布参数,该高斯分布参数包括均值μ和标准差σ。均值和方差可以均为多维参数。通过对均值和标准差采样,可以得到隐变量z,将隐变量z输入解码器中,可以得到重建的输出数据。
以前述的第二种得到多个目标心电图数据的方式为例,具体的,将前述的初始心电图数据输入变分自编码器中,由编码器编码得到高斯分布参数均值μ和标准差σ,对这些参数在对应的高斯分布下采样预设数量次,每次采样均为随机采样,得到预设数量个不同的隐变量z,将这些隐变量z分别输入解码器中,可以得到预设数量个目标心电图数据。
可选的,上述的编码器和解码器例如可以分别为神经网络,例如卷积神经网络、循环神经网络等,本申请实施例对于编码器和解码器的具体形式不做限定。
以下说明在得到第一目标数据扩充模型之前,对使用变分自编码器的第一初始数据扩充模型使用前述的方式进行训练和修正的具体过程。
当第一初始数据扩充模型为变分自编码器时,假设某次训练时,第一训练心电图数据为X,第一初始数据扩充模型输出的第一扩充心电图数据为μ为均值和σ为标准差,则可以使用下述公式(1)计算得到前述第二参数L的值。
其中,上述n表示X中包含的点数。示例性的,假设第一训练心电图数据为12导联,长度为5000,则n为导联条数与长度的乘积,即n为60000。
另外,假设将第一训练心电图数据X输入业务模型中,由业务模型输出的第一训练业务数据为Y,将第一扩充心电图数据输入业务模型中,由业务模型输出的第一扩充业务数据为则可以使用下述公式(2)计算得到前述第一参数CE的值。
其中,上述N表示业务模型分类的总数,例如,业务模型为2个二分类任务,则N为2。
利用上述公式(2),能够计算出Y和的交叉熵,该交叉熵能够衡量Y和/>的差异,即可以将该交叉熵作为Y和/>的差异信息。利用该差异信息,使得最终训练得到的第一目标数据扩充模型所生成的目标心电图数据能够保留初始心电图数据中的与疾病异常有关的微小波形特征,进而使得目标心电图数据能够对业务模型的进一步的训练效果起到更明显的作用。
图5为具体实施时实现的效果的示意图,如图5所示,心电图数据A为原始的心电图数据,该数据为1度AVB,即一度房室传导阻滞,在波形上的表现为a处的PR间期延长。心电图数据B为使用变分自编码器扩充但是未使用上述第一参数的值用于损失函数计算时所扩充出的心电图数据,其中b处的PR间期没有延长。心电图数据C为使用变分自编码器扩充并且使用上述第一参数的值用于损失函数计算时所扩充出的心电图数据,其中c处的PR间期有延长。由此可知,使用上述第一参数的值用于损失函数计算,使得心电图数据中的与疾病异常有关的微小波形特征在扩充出的心电图数据中得以保留。
在利用上述公式(1)和公式(2)计算出第一参数的值和第二参数的值之后,将两个参数的值相加,得到本次训练的第一初始数据扩充模型的损失函数的结果,进而使用该结果修正第一初始数据扩充模型。修正的方法例如可以是Adam或者其他梯度下降法,可以仅更新第一初始数据扩充模型的参数,不更新业务模型的参数。循环进行训练,直至得到第一目标数据扩充模型。
以下结合图示,对本申请以变分自编码器作为第一目标数据扩充模型的完整处理过程。
首先,图6为预先初始训练业务模型的示意图,如图6所示,预先使用一些带标签的心电图数据训练得到可用的业务模型。
其次,利用可用的业务模型对使用变分自编码器的第一初始数据扩充模型进行训练。图7为对变分自编码器进行训练的示意图,如图7所示,将第一训练心电图数据输入变分自编码器,得到重建的第一扩充心电图数据。应理解,第一训练心电图数据可以属于特定的标签,即第一训练心电图数据具有标签信息,但是,在此处训练时不使用训练心电图的标签信息。另外,分别将第一训练心电图数据和第一扩充心电图数据输入业务模型中,得到各自的分类有关的特征或概率,通过修正变分自编码器,使得二者不断接近。
再次,当训练得到使用变分自编码器的第一目标数据扩充模型后,可以将需要扩充的初始心电图数据输入训练好的变分自编码器中,并得到目标心电图数据。图8为利用训练完成的变分自编码器得到目标心电图数据的示意图。
对初始心电图数据扩充完成后,得到预设数量个目标心电图数据,可以进一步将初始心电图数据和目标心电图数据输入业务模型,以进行业务模型的进一步训练。
以下说明第二目标数据扩充模型的处理和训练过程。
当目标数据扩充模型为第二目标数据扩充模型,在上述步骤S202中,可以将初始心电图数据、初始心电图数据的原标签以及期望标签输入第二目标数据扩充模型中,由该第二目标数据扩充模型可以得到预设数量的目标心电图数据。
上述原标签表征的是初始心电图数据的实际疾病信息,上述期望标签是指用户希望将初始心电图数据转化为具有该期望标签的心电图数据。示例性的,初始心电图数据的原标签表征的为健康,期望标签为房颤,则通过第二目标数据扩充模型,可以将初始心电图数据转换为具有房颤特征的目标心电图数据。
本实施例中,第二目标数据扩充模型基于初始心电图数据、原标签以及期望标签可以得到目标心电图数据,将本实施例执行多次,每次选择不同的期望标签,则可以实现将同一个人的心电图数据扩充为多个心电图数据,同时所扩充的心电图数据分别具有不同的标签,而又保留原心电图的主要趋势和心率。
以上实施例说明了利用第二目标数据扩充模型可以得到预设数量的目标心电图数据。以下说明利用第二目标数据扩充模型生成预设数量的具体实施方式。
可选的,可以将下述操作执行预设数量次:
将初始心电图数据、初始心电图数据的原标签以及期望标签输入第二目标数据扩充模型中,由第二目标数据扩充模型对初始心电图数据进行编码,得到初始心电图数据的中间输出,再由第二目标数据扩充模型中的修正网络对中间输出进行修正,再由第二目标数据扩充模型对修正后的中间输出进行解码,得到目标心电图数据。
其中,上述修正网络的初始状态向量根据上述初始心电图数据的原标签以及期望标签得到。
可选的,将原标签和期望标签输入第二目标数据扩充模型后,模型可以对这两个标签进行格式转换,并计算二者的差值,再利用一个全连接层计算得到修正网络的初始状态向量。
可选的,在执行上述操作预设数量次时,每次所输入的期望标签可以不同,则可以扩充得到预设数量个不同标签的目标心电图数据。
在该实施方式中,每次均将初始心电图数据、原标签和期望标签输入第二目标数据扩充模型中,由第二目标数据扩充的修正网络基于原标签和期望标签的差异对初始心电图数据的编码结果进行修正,并进行解码得到目标心电图数据,从而使得每次得到的目标心电图数据的标签符合期望标签,同时又保留初始心电图数据的主要趋势和心率。
以下说明使用第二目标数据扩充模型得到预设数量的目标心电图数据之前,对目标数据模型所对应的第二初始数据扩充模型进行训练的过程。
本申请实施例中,第二初始数据扩充模型是指未训练完成的第二目标数据扩充模型,当第二初始数据扩充模型训练完成后,即成为第二目标数据扩充模型。
图9为本申请实施例提供的心电图数据生成方法的流程示意图,如图9所示,对第二初始数据扩充模型进行训练的过程包括:
S901、将第二训练心电图数据输入第二初始数据扩充模型中,得到第二初始数据扩充模型输出的第二扩充心电图数据。
作为一种可选的实施方式,可以将前述的用于初始训练业务模型的带标签的心电图数据作为上述的第二训练心电图数据。应理解,本申请实施例可以不限于此,初始心电图数据也可以来源于其他的带标签的心电图数据。
S902、将第二扩充心电图数据输入业务模型中,得到由业务模型输出的第二扩充业务数据,该业务模型用于根据心电图数据输出能够表征业务的业务数据,该第二扩充业务数据为业务模型对第二扩充心电图数据处理得到的业务数据。
可选的,本步骤中,第二扩充业务数据可以是标签或者是可以表征标签的数据。
值得说明的是,由第二初始数据扩充模型输出的第二扩充心电图数据为前述的预设数量个,则针对每个第二扩充心电图数据均可以执行一次本步骤,或者,也可以从预设数量个第二扩充心电图数据中选择一个第二扩充心电图数据执行本步骤。
以选择一个第二扩充心电图数据为例,将该第二扩充心电图数据输入业务模型后,业务模型对第二扩充心电图数据处理输出上述的第二扩充业务数据。
S903、根据第二训练心电图数据、第二扩充心电图数据、期望标签以及第二扩充业务数据,对第二初始数据扩充模型进行修正,得到第二目标数据扩充模型。
对第二初始数据扩充模型训练的目标是使得训练得到的第二目标数据扩充模型对初始心电图数据与扩充得到的目标心电图数据尽量保持一致,即尽量使得目标心电图数据能保留初始心电图数据的主要趋势和心率,同时,又使得目标心电图的标签与期望标签尽量保持一致。基于上述,本申请实施例可以利用业务模型输出的标签来约束第二初始数据模型的训练,从而使得最终训练得到的第二目标数据扩充模型所生成的目标心电图数据与初始心电图数据足够接近同时又具有期望标签。
应理解,将第二初始数据扩充模型训练成为第二目标数据扩充模型的过程,可能需要多次的训练,因此,具体实施过程中,上述步骤S901-S903可以多次循环执行,每次循环结束,会修正得到新的第二初始数据扩充模型,当某次循环结束所得到的第二初始数据扩充模型满足预设的要求时,则停止训练,并将本次的第二初始数据扩充模型作为第二目标数据扩充模型。
以下说明上述步骤S903中根据第二训练心电图数据、第二扩充心电图数据、期望标签以及第二扩充业务数据,对第二初始数据扩充模型进行修正的可选方式。
作为一种可选的实施方式,可以根据上述第二训练心电图数据、第二扩充心电图数据、期望标签以及第二扩充业务数据,确定第二初始数据扩充模型的损失函数的结果,并根据损失函数的结果,对第二初始数据扩充模型进行修正。
可选的,在根据上述第二训练心电图数据、第二扩充心电图数据、期望标签以及第二扩充业务数据确定第二初始数据扩充模型的损失函数的结果时,可以首先根据第二训练心电图数据和第二扩充心电图数据的第一差异信息确定第三参数,并根据期望标签和第二扩充业务数据所表征的标签的第二差异信息确定第四参数,再根据第三参数和第四参数,确定第二初始数据扩充模型的损失函数的结果。
根据第二训练心电图数据和第二扩充心电图数据所确定的第一差异信息可以表示第二初始数据扩充模型输出的心电图数据与输入的心电图数据的差异,根据期望标签和第二扩充业务数据所表征的标签所确定的第二差异信息可以表示第二初始数据扩充模型输出的心电图数据的标签与期望标签的差异,利用这两个差异信息修正第二初始数据扩充模型,可以使得第二初始数据扩充模型不断趋向准确。
可选的,在根据第三参数和第四参数确定第二初始数据扩充模型的损失函数的结果时,可以将第三参数和第四参数相加,得到第二初始数据扩充模型的损失函数的结果。
本申请实施例中,第二目标数据扩充模型可以为变分自编码器。图10为作为第二目标数据扩充模型的变分自编码器的结构示意图,如图10所示,变分自编码器包括编码器、修正网络和解码器。该变分自编码器的输入数据包括输入心电图数据、输入心电图数据的原标签和期望标签,这些数据输入变分自编码器后,首先由编码器对输入心电图数据进行编码,得到中间输出z,为隐变量。同时,模型对输入的原标签和期望标签进行格式转换、计算差值,再利用一个全连接层计算得到修正网络的初始状态向量。中间输出z和状态向量作为修正网络的输入,由修正网络对中间输出z进行修正,得到修正后的中间输出/>由解码器对/>进行解码得到输出心电图数据。
可选的,上述的修正网络例如可以为双向长短期记忆网络。
可选的,上述的编码器和解码器例如可以分别为神经网络,例如卷积神经网络、循环神经网络等,本申请实施例对于编码器、修正网络和解码器的具体形式不做限定。
以下说明在得到第二目标数据扩充模型之前,对使用变分自编码器的第二初始数据扩充模型使用前述的方式进行训练和修正的具体过程。
其中,上述N表示X中包含的点数。示例性的,假设第二训练心电图数据为12导联,长度为5000,则N为导联条数与长度的乘积,即N为60000。
另外,σ为权重值为权重值。如果期望标签与原标签一致,即希望模型输出的心电图数据与输入的心电图数据的波形完全一致,则可以设置σ为1。如果期望标签与原标签不一致,即希望模型输出的心电图数据与输入的心电图数据的波形大致趋势一致,则可以设置σ为小于1大于0的值,例如设置σ为0.7。
在上述公式(3)中,基于第二初始数据扩充模型输出的心电图数据与输入的心电图数据的差异计算出第三参数,可以用来衡量模型的输出数据是否与输入数据足够接近。
其中,上述N表示业务模型分类的总数,例如,业务模型为2个二分类任务,则N为2。
利用上述公式(4),能够计算出Y和的交叉熵,该交叉熵能够衡量Y和/>的差异,即可以将该交叉熵作为Y和/>的差异信息。利用该差异信息,能够衡量第二初始数据扩充模型输出的心电图数据的标签与期望标签是否足够接近。
在使用上述公式(3)和公式(4)分别计算得到第三参数的值和第四参数的值之后,可以将该两个值相加,得到一次训练中第二初始数据扩充模型的损失函数的结果。
图11为具体实施时实现的效果的示意图,如图11所示,心电图数据A为原始的心电图数据,该数据的标签表示健康。心电图数据B为期望标签为“房颤”时由变分自编码器输出的心电图数据,其中b处的P波小时,并且出现不规律的f波,即呈现出房颤的波形特征,同时,输出的心电图数据在整体波形上与输入的心电图数据保持一致。心电图C为期望标签为“健康”时由变分自编码器输出的心电图数据,该输出的心电图数据的波形与输入的心电图数据的波形基本一致。
在利用上述公式(3)和公式(4)计算出第三参数的值和第四参数的值之后,将两个参数的值相加,得到本次训练的第二初始数据扩充模型的损失函数的结果,进而使用该结果修正第二初始数据扩充模型。修正的方法例如可以是Adam或者其他梯度下降法,可以仅更新第二初始数据扩充模型的参数,不更新业务模型的参数。循环进行训练,直至得到第二目标数据扩充模型。
以下结合图示,对本申请以变分自编码器作为第二目标数据扩充模型的完整处理过程。
首先,如前述图6所示例的,可以预先使用一些带标签的心电图数据训练得到可用的业务模型。
其次,利用可用的业务模型对使用变分自编码器的第二初始数据扩充模型进行训练。图12为对变分自编码器进行训练的示意图,如图12所示,将第二训练心电图数据、第二训练心电图数据的原标签和期望标签输入变分自编码器,得到重建的第二扩充心电图数据。另外,将第二扩充心电图数据输入业务模型中,得到分类有关的特征或概率,通过修正变分自编码器,使得二者不断接近。
再次,当训练得到使用变分自编码器的第二目标数据扩充模型后,可以将需要扩充的初始心电图数据输入训练好的变分自编码器中,并得到目标心电图数据。图13为利用训练完成的变分自编码器得到目标心电图数据的示意图。
对初始心电图数据扩充完成后,得到预设数量个目标心电图数据,可以进一步将初始心电图数据和目标心电图数据输入业务模型,以进行业务模型的进一步训练。
图14为本申请实施例提供的一种心电图数据生成装置的模块结构图,如图14所示,该装置包括:
获取模块1401,用于获取初始心电图数据,所述初始心电图数据属于预设的原标签。
处理模块1402,用于将所述初始心电图数据输入目标数据扩充模型中,得到预设数量的目标心电图数据,各所述目标心电图数据两两不同。
作为一种可选的实施方式,所述目标数据扩充模型包括:第一目标数据扩充模型;每个目标心电图数据的标签与所述初始心电图数据的原标签相同,所述预设数量大于等于2;每个目标心电图数据由所述目标数据扩充模型基于所述初始心电图数据编码后的数据分布信息得到。
作为一种可选的实施方式,处理模块1402具体用于:
将下述操作执行所述预设数量次:
将所述初始心电图数据输入第一目标数据扩充模型中,由所述第一目标数据扩充模型对所述初始心电图数据进行编码,得到所述初始心电图数据的中间输出,并对所述中间输出随机采样一次,将采样的结果进行解码,得到所述目标心电图数据。
作为一种可选的实施方式,处理模块1402具体用于:
将所述初始心电图数据输入第一目标数据扩充模型中,由所述第一目标数据扩充模型对所述初始心电图数据进行编码,得到所述初始心电图数据的中间输出,并对所述中间输出随机采样所述预设数量次,将采样的结果分别进行解码,得到所述预设数量的目标心电图数据。
作为一种可选的实施方式,处理模块1402还用于:
将第一训练心电图数据输入第一初始数据扩充模型中,得到所述第一初始数据扩充模型输出的第一扩充心电图数据;将所述第一训练心电图数据以及所述第一扩充心电图数据分别输入业务模型中,分别得到由所述业务模型输出的第一训练业务数据以及第一扩充业务数据,所述业务模型用于根据心电图数据输出能够表征业务的业务数据,所述第一训练业务数据为所述业务模型对所述第一训练心电图数据处理得到的业务数据,所述第一扩充业务数据为所述业务模型对所述第一扩充心电图数据处理得到的业务数据;根据所述第一训练业务数据以及第一扩充业务数据,对所述第一初始数据扩充模型进行修正,得到所述第一目标数据扩充模型。
作为一种可选的实施方式,处理模块1402具体用于:
根据所述第一训练业务数据以及第一扩充业务数据,确定所述第一初始数据扩充模型的损失函数的结果;根据所述损失函数的结果,对所述第一初始数据扩充模型进行修正。
作为一种可选的实施方式,处理模块1402具体用于:
确定所述第一训练业务数据以及第一扩充业务数据的差异信息;根据所述第一训练业务数据以及第一扩充业务数据的差异信息,确定所述第一初始数据扩充模型的损失函数的结果。
作为一种可选的实施方式,处理模块1402具体用于:
将所述差异信息作为所述损失函数的第一参数的值;将所述第一参数的值和第二参数的值相加,得到所述第一初始数据扩充模型的损失函数的结果;其中,所述第二参数的值根据所述第一训练心电图数据、所述第一扩充心电图数据以及所述第一初始数据扩充模型对所述第一训练心电图数据编码得到的数据分布信息得到。
作为一种可选的实施方式,所述第一目标数据扩充模型为变分自编码器,所述变分自编码器包括编码器以及解码器,所述变分自编码器基于所述初始心电图数据编码后的数据分布信息包括高斯分布参数,所述高斯分布参数包括均值以及标准差。
作为一种可选的实施方式,所述目标数据扩充模型包括:第二目标数据扩充模型。
处理模块1402具体用于:
将所述初始心电图数据、所述初始心电图数据的原标签以及期望标签输入所述第二目标数据扩充模型中,得到预设数量的目标心电图数据。
作为一种可选的实施方式,处理模块1402具体用于:
将下述操作执行所述预设数量次:
将所述初始心电图数据、所述初始心电图数据的原标签以及期望标签输入所述第二目标数据扩充模型中,由所述第二目标数据扩充模型对所述初始心电图数据进行编码,得到所述初始心电图数据的中间输出,再由所述第二目标数据扩充模型中的修正网络对所述中间输出进行修正,再由所述第二目标数据扩充模型对修正后的中间输出进行解码,得到所述目标心电图数据;
其中,所述修正网络的初始状态向量根据所述初始心电图数据的原标签以及期望标签得到。
作为一种可选的实施方式,处理模块1402还用于:
将第二训练心电图数据输入第二初始数据扩充模型中,得到所述第二初始数据扩充模型输出的第二扩充心电图数据;将所述第二扩充心电图数据输入业务模型中,得到由所述业务模型输出的第二扩充业务数据,所述业务模型用于根据心电图数据输出能够表征业务的业务数据,所述第二扩充业务数据为所述业务模型对所述第二扩充心电图数据处理得到的业务数据;根据所述第二训练心电图数据、第二扩充心电图数据、期望标签以及第二扩充业务数据,对所述第二初始数据扩充模型进行修正,得到所述第二目标数据扩充模型。
作为一种可选的实施方式,处理模块1402具体用于:
根据所述第二训练心电图数据、第二扩充心电图数据、期望标签以及第二扩充业务数据,确定所述第二初始数据扩充模型的损失函数的结果;根据所述损失函数的结果,对所述第二初始数据扩充模型进行修正。
作为一种可选的实施方式,处理模块1402具体用于:
根据所述第二训练心电图数据和第二扩充心电图数据的第一差异信息确定第三参数;根据所述期望标签和所述第二扩充业务数据所表征的标签的第二差异信息确定第四参数;根据所述第三参数和所述第四参数,确定所述第二初始数据扩充模型的损失函数的结果。
作为一种可选的实施方式,处理模块1402具体用于:
将所述第三参数和所述第四参数相加,得到所述第二初始数据扩充模型的损失函数的结果。
作为一种可选的实施方式,所述第二目标数据扩充模型为变分自编码器,所述变分自编码器包括编码器、修正网络以及解码器。
作为一种可选的实施方式,处理模块1402还用于:
将所述初始心电图数据以及所述预设数量的目标心电图数据输入业务模型中,得到所述业务模型输出的业务数据;根据所述业务数据,修正所述业务模型。
本申请实施例提供的心电图数据生成装置,可以执行上述方法实施例中的方法步骤,其实现原理和技术效果类似,在此不再赘述。
需要说明的是,应理解以上装置的各个模块的划分仅仅是一种逻辑功能的划分,实际实现时可以全部或部分集成到一个物理实体上,也可以物理上分开。且这些模块可以全部以软件通过处理元件调用的形式实现;也可以全部以硬件的形式实现;还可以部分模块通过处理元件调用软件的形式实现,部分模块通过硬件的形式实现。例如,确定模块可以为单独设立的处理元件,也可以集成在上述装置的某一个芯片中实现,此外,也可以以程序代码的形式存储于上述装置的存储器中,由上述装置的某一个处理元件调用并执行以上确定模块的功能。其它模块的实现与之类似。此外这些模块全部或部分可以集成在一起,也可以独立实现。这里所述的处理元件可以是一种集成电路,具有信号的处理能力。在实现过程中,上述方法的各步骤或以上各个模块可以通过处理器元件中的硬件的集成逻辑电路或者软件形式的指令完成。
例如,以上这些模块可以是被配置成实施以上方法的一个或多个集成电路,例如:一个或多个特定集成电路(application specific integrated circuit,ASIC),或,一个或多个微处理器(digital signal processor,DSP),或,一个或者多个现场可编程门阵列(field programmable gate array,FPGA)等。再如,当以上某个模块通过处理元件调度程序代码的形式实现时,该处理元件可以是通用处理器,例如中央处理器(centralprocessing unit,CPU)或其它可以调用程序代码的处理器。再如,这些模块可以集成在一起,以片上***(system-on-a-chip,SOC)的形式实现。
在上述实施例中,可以全部或部分地通过软件、硬件、固件或者其任意组合来实现。当使用软件实现时,可以全部或部分地以计算机程序产品的形式实现。所述计算机程序产品包括一个或多个计算机指令。在计算机上加载和执行所述计算机程序指令时,全部或部分地产生按照本申请实施例所述的流程或功能。所述计算机可以是通用计算机、专用计算机、计算机网络、或者其他可编程装置。所述计算机指令可以存储在计算机可读存储介质中,或者从一个计算机可读存储介质向另一个计算机可读存储介质传输,例如,所述计算机指令可以从一个网站站点、计算机、服务器或数据中心通过有线(例如同轴电缆、光纤、数字用户线(DSL))或无线(例如红外、无线、微波等)方式向另一个网站站点、计算机、服务器或数据中心进行传输。所述计算机可读存储介质可以是计算机能够存取的任何可用介质或者是包含一个或多个可用介质集成的服务器、数据中心等数据存储设备。所述可用介质可以是磁性介质,(例如,软盘、硬盘、磁带)、光介质(例如,DVD)、或者半导体介质(例如固态硬盘solid state disk(SSD))等。
图15为本申请实施例提供的一种电子设备1500的结构示意图。如图15所示,该电子设备可以包括:处理器151、存储器152、通信接口153和***总线154,所述存储器152和所述通信接口153通过所述***总线154与所述处理器151连接并完成相互间的通信,所述存储器152用于存储计算机执行指令,所述通信接口153用于和其他设备进行通信,所述处理器101执行所述计算机程序时实现如上述图2至图13所示实施例的方案。
该图15中提到的***总线可以是外设部件互连标准(peripheral componentinterconnect,PCI)总线或扩展工业标准结构(extended industry standardarchitecture,EISA)总线等。所述***总线可以分为地址总线、数据总线、控制总线等。为便于表示,图中仅用一条粗线表示,但并不表示仅有一根总线或一种类型的总线。通信接口用于实现数据库访问装置与其他设备(例如客户端、读写库和只读库)之间的通信。存储器可能包含随机存取存储器(random access memory,RAM),也可能还包括非易失性存储器(non-volatile memory),例如至少一个磁盘存储器。
上述的处理器可以是通用处理器,包括中央处理器CPU、网络处理器(networkprocessor,NP)等;还可以是数字信号处理器DSP、专用集成电路ASIC、现场可编程门阵列FPGA或者其他可编程逻辑器件、分立门或者晶体管逻辑器件、分立硬件组件。
可选的,本申请实施例还提供一种存储介质,所述存储介质中存储有指令,当其在计算机上运行时,使得计算机执行如上述图2至图13所示实施例的方法。
可选的,本申请实施例还提供一种运行指令的芯片,所述芯片用于执行上述图2至图13所示实施例的方法。
本申请实施例还提供一种程序产品,所述程序产品包括计算机程序,所述计算机程序存储在存储介质中,至少一个处理器可以从所述存储介质读取所述计算机程序,所述至少一个处理器执行所述计算机程序时可实现上述图2至图13所示实施例的方法。
在本申请实施例中,“至少一个”是指一个或者多个,“多个”是指两个或两个以上。“和/或”,描述关联对象的关联关系,表示可以存在三种关系,例如,A和/或B,可以表示:单独存在A,同时存在A和B,单独存在B的情况,其中A,B可以是单数或者复数。字符“/”一般表示前后关联对象是一种“或”的关系;在公式中,字符“/”,表示前后关联对象是一种“相除”的关系。“以下至少一项(个)”或其类似表达,是指的这些项中的任意组合,包括单项(个)或复数项(个)的任意组合。例如,a,b,或c中的至少一项(个),可以表示:a,b,c,a-b,a-c,b-c,或a-b-c,其中,a,b,c可以是单个,也可以是多个。
可以理解的是,在本申请实施例中涉及的各种数字编号仅为描述方便进行的区分,并不用来限制本申请实施例的范围。
可以理解的是,在本申请的实施例中,上述各过程的序号的大小并不意味着执行顺序的先后,各过程的执行顺序应以其功能和内在逻辑确定,而不应对本申请实施例的实施过程构成任何限定。
最后应说明的是:以上各实施例仅用以说明本申请的技术方案,而非对其限制;尽管参照前述各实施例对本申请进行了详细的说明,本领域的普通技术人员应当理解:其依然可以对前述各实施例所记载的技术方案进行修改,或者对其中部分或者全部技术特征进行等同替换;而这些修改或者替换,并不使相应技术方案的本质脱离本申请各实施例技术方案的范围。
Claims (18)
1.一种心电图数据生成方法,其特征在于,包括:
获取初始心电图数据,所述初始心电图数据属于预设的原标签;
将所述初始心电图数据输入目标数据扩充模型中,得到预设数量的目标心电图数据,各所述目标心电图数据两两不同;
所述目标数据扩充模型包括:第一目标数据扩充模型;
每个目标心电图数据的标签与所述初始心电图数据的原标签相同,所述预设数量大于等于2;每个目标心电图数据由所述目标数据扩充模型基于所述初始心电图数据编码后的数据分布信息得到;
所述将所述初始心电图数据输入第一目标数据扩充模型中,得到预设数量的目标心电图数据之前,还包括:
将第一训练心电图数据输入第一初始数据扩充模型中,得到所述第一初始数据扩充模型输出的第一扩充心电图数据;
将所述第一训练心电图数据以及所述第一扩充心电图数据分别输入业务模型中,分别得到由所述业务模型输出的第一训练业务数据以及第一扩充业务数据,所述业务模型用于根据心电图数据输出能够表征业务的业务数据,所述第一训练业务数据为所述业务模型对所述第一训练心电图数据处理得到的业务数据,所述第一扩充业务数据为所述业务模型对所述第一扩充心电图数据处理得到的业务数据;
根据所述第一训练业务数据以及第一扩充业务数据,对所述第一初始数据扩充模型进行修正,得到所述第一目标数据扩充模型。
2.根据权利要求1所述的方法,其特征在于,所述将所述初始心电图数据输入第一目标数据扩充模型中,得到预设数量的目标心电图数据,包括:
将下述操作执行所述预设数量次:
将所述初始心电图数据输入第一目标数据扩充模型中,由所述第一目标数据扩充模型对所述初始心电图数据进行编码,得到所述初始心电图数据的中间输出,并对所述中间输出随机采样一次,将采样的结果进行解码,得到所述目标心电图数据。
3.根据权利要求1所述的方法,其特征在于,所述将所述初始心电图数据输入第一目标数据扩充模型中,得到多个目标心电图数据,包括:
将所述初始心电图数据输入第一目标数据扩充模型中,由所述第一目标数据扩充模型对所述初始心电图数据进行编码,得到所述初始心电图数据的中间输出,并对所述中间输出随机采样所述预设数量次,将采样的结果分别进行解码,得到所述预设数量的目标心电图数据。
4.根据权利要求1所述的方法,其特征在于,所述根据所述第一训练业务数据以及第一扩充业务数据,对所述第一初始数据扩充模型进行修正,包括:
根据所述第一训练业务数据以及第一扩充业务数据,确定所述第一初始数据扩充模型的损失函数的结果;
根据所述损失函数的结果,对所述第一初始数据扩充模型进行修正。
5.根据权利要求4所述的方法,其特征在于,所述根据所述第一训练业务数据以及第一扩充业务数据,确定所述第一初始数据扩充模型的损失函数的结果,包括:
确定所述第一训练业务数据以及第一扩充业务数据的差异信息;
根据所述第一训练业务数据以及第一扩充业务数据的差异信息,确定所述第一初始数据扩充模型的损失函数的结果。
6.根据权利要求5所述的方法,其特征在于,所述根据所述第一训练业务数据以及第一扩充业务数据的差异信息,确定所述第一初始数据扩充模型的损失函数的结果,包括:
将所述差异信息作为所述损失函数的第一参数的值;
将所述第一参数的值和第二参数的值相加,得到所述第一初始数据扩充模型的损失函数的结果;
其中,所述第二参数的值根据所述第一训练心电图数据、所述第一扩充心电图数据以及所述第一初始数据扩充模型对所述第一训练心电图数据编码得到的数据分布信息得到。
7.根据权利要求1-6任一项所述的方法,其特征在于,所述第一目标数据扩充模型为变分自编码器,所述变分自编码器包括编码器以及解码器,所述变分自编码器基于所述初始心电图数据编码后的数据分布信息包括高斯分布参数,所述高斯分布参数包括均值以及标准差。
8.根据权利要求1所述的方法,其特征在于,所述目标数据扩充模型包括:第二目标数据扩充模型;
所述将所述初始心电图数据输入目标数据扩充模型中,得到预设数量的目标心电图数据,包括:
将所述初始心电图数据、所述初始心电图数据的原标签以及期望标签输入所述第二目标数据扩充模型中,得到预设数量的目标心电图数据。
9.根据权利要求8所述的方法,其特征在于,所述将所述初始心电图数据、所述初始心电图数据的原标签以及期望标签输入所述第二目标数据扩充模型中,得到预设数量的目标心电图数据,包括:
将下述操作执行所述预设数量次:
将所述初始心电图数据、所述初始心电图数据的原标签以及期望标签输入所述第二目标数据扩充模型中,由所述第二目标数据扩充模型对所述初始心电图数据进行编码,得到所述初始心电图数据的中间输出,再由所述第二目标数据扩充模型中的修正网络对所述中间输出进行修正,再由所述第二目标数据扩充模型对修正后的中间输出进行解码,得到所述目标心电图数据;
其中,所述修正网络的初始状态向量根据所述初始心电图数据的原标签以及期望标签得到。
10.根据权利要求8或9所述的方法,其特征在于,所述将所述初始心电图数据输入第二目标数据扩充模型中,得到预设数量的目标心电图数据之前,还包括:
将第二训练心电图数据输入第二初始数据扩充模型中,得到所述第二初始数据扩充模型输出的第二扩充心电图数据;
将所述第二扩充心电图数据输入业务模型中,得到由所述业务模型输出的第二扩充业务数据,所述业务模型用于根据心电图数据输出能够表征业务的业务数据,所述第二扩充业务数据为所述业务模型对所述第二扩充心电图数据处理得到的业务数据;
根据所述第二训练心电图数据、第二扩充心电图数据、期望标签以及第二扩充业务数据,对所述第二初始数据扩充模型进行修正,得到所述第二目标数据扩充模型。
11.根据权利要求10所述的方法,其特征在于,所述根据所述第二训练心电图数据、第二扩充心电图数据、期望标签以及第二扩充业务数据,对所述第二初始数据扩充模型进行修正,得到所述第二目标数据扩充模型,包括:
根据所述第二训练心电图数据、第二扩充心电图数据、期望标签以及第二扩充业务数据,确定所述第二初始数据扩充模型的损失函数的结果;
根据所述损失函数的结果,对所述第二初始数据扩充模型进行修正。
12.根据权利要求11所述的方法,其特征在于,所述根据所述第二训练心电图数据、第二扩充心电图数据、期望标签以及第二扩充业务数据,确定所述第二初始数据扩充模型的损失函数的结果,包括:
根据所述第二训练心电图数据和第二扩充心电图数据的第一差异信息确定第三参数;
根据所述期望标签和所述第二扩充业务数据所表征的标签的第二差异信息确定第四参数;
根据所述第三参数和所述第四参数,确定所述第二初始数据扩充模型的损失函数的结果。
13.根据权利要求12所述的方法,其特征在于,所述根据所述第三参数和所述第四参数,确定所述第二初始数据扩充模型的损失函数的结果,包括:
将所述第三参数和所述第四参数相加,得到所述第二初始数据扩充模型的损失函数的结果。
14.根据权利要求8、9、11-13任一项所述的方法,其特征在于,所述第二目标数据扩充模型为变分自编码器,所述变分自编码器包括编码器、修正网络以及解码器。
15.根据权利要求1-6、8、9、11-13任一项所述的方法,其特征在于,所述方法还包括:
将所述初始心电图数据以及所述预设数量的目标心电图数据输入业务模型中,得到所述业务模型输出的业务数据;
根据所述业务数据,修正所述业务模型。
16.一种心电图数据生成装置,其特征在于,包括:
获取模块,用于获取初始心电图数据,所述初始心电图数据属于预设的原标签;
处理模块,用于将所述初始心电图数据输入目标数据扩充模型中,得到预设数量的目标心电图数据,各所述目标心电图数据两两不同;
所述目标数据扩充模型包括:第一目标数据扩充模型;每个目标心电图数据的标签与所述初始心电图数据的原标签相同,所述预设数量大于等于2;每个目标心电图数据由所述目标数据扩充模型基于所述初始心电图数据编码后的数据分布信息得到;
所述处理模块,具体用于将第一训练心电图数据输入第一初始数据扩充模型中,得到所述第一初始数据扩充模型输出的第一扩充心电图数据;将所述第一训练心电图数据以及所述第一扩充心电图数据分别输入业务模型中,分别得到由所述业务模型输出的第一训练业务数据以及第一扩充业务数据,所述业务模型用于根据心电图数据输出能够表征业务的业务数据,所述第一训练业务数据为所述业务模型对所述第一训练心电图数据处理得到的业务数据,所述第一扩充业务数据为所述业务模型对所述第一扩充心电图数据处理得到的业务数据;根据所述第一训练业务数据以及第一扩充业务数据,对所述第一初始数据扩充模型进行修正,得到所述第一目标数据扩充模型。
17.一种电子设备,其特征在于,包括:
存储器,用于存储程序指令;
处理器,用于调用并执行所述存储器中的程序指令,执行权利要求1-15任一项所述的方法步骤。
18.一种可读存储介质,其特征在于,所述可读存储介质中存储有计算机程序,所述计算机程序用于执行权利要求1-15任一项所述的方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202010493569.1A CN111652135B (zh) | 2020-06-03 | 2020-06-03 | 心电图数据生成方法、装置及电子设备 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202010493569.1A CN111652135B (zh) | 2020-06-03 | 2020-06-03 | 心电图数据生成方法、装置及电子设备 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN111652135A CN111652135A (zh) | 2020-09-11 |
CN111652135B true CN111652135B (zh) | 2023-05-23 |
Family
ID=72349858
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202010493569.1A Active CN111652135B (zh) | 2020-06-03 | 2020-06-03 | 心电图数据生成方法、装置及电子设备 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN111652135B (zh) |
Families Citing this family (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN112244860B (zh) * | 2020-09-27 | 2023-06-20 | 山东平伟医疗技术有限公司 | 一种动态心电图数据分析方法 |
CN113537274A (zh) * | 2021-04-14 | 2021-10-22 | 内蒙古卫数数据科技有限公司 | 一种基于机器学习技术的设备异常识别方法 |
CN113303807B (zh) * | 2021-05-18 | 2022-06-14 | 浙江大学 | 一种心电数据生成方法 |
CN113288156B (zh) * | 2021-05-18 | 2022-02-11 | 浙江大学 | 一种任意导联视角的心电数据的生成方法 |
CN115130509A (zh) * | 2022-06-29 | 2022-09-30 | 哈尔滨工业大学(威海) | 基于条件式变分自编码器的心电信号生成方法 |
Family Cites Families (9)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN111096735A (zh) * | 2018-10-26 | 2020-05-05 | 深圳市理邦精密仪器股份有限公司 | 可迭代更新的心电图分析*** |
CN109543838B (zh) * | 2018-11-01 | 2021-06-18 | 浙江工业大学 | 一种基于变分自编码器的图像增量学习方法 |
CN109886388B (zh) * | 2019-01-09 | 2024-03-22 | 平安科技(深圳)有限公司 | 一种基于变分自编码器的训练样本数据扩充方法和装置 |
CN110020623B (zh) * | 2019-04-04 | 2021-01-15 | 中山大学 | 基于条件变分自编码器的人体活动识别***及方法 |
CN110517759B (zh) * | 2019-08-29 | 2022-03-25 | 腾讯医疗健康(深圳)有限公司 | 一种待标注图像确定的方法、模型训练的方法及装置 |
CN110728203B (zh) * | 2019-09-23 | 2022-04-12 | 清华大学 | 基于深度学习的手语翻译视频生成方法及*** |
CN110704590B (zh) * | 2019-09-27 | 2022-04-12 | 支付宝(杭州)信息技术有限公司 | 扩充训练样本的方法和装置 |
CN110929772A (zh) * | 2019-11-15 | 2020-03-27 | 北京奇艺世纪科技有限公司 | 模型训练方法、样本生成方法、装置、电子设备及存储介质 |
CN111161740A (zh) * | 2019-12-31 | 2020-05-15 | 中国建设银行股份有限公司 | 意图识别模型训练方法、意图识别方法以及相关装置 |
-
2020
- 2020-06-03 CN CN202010493569.1A patent/CN111652135B/zh active Active
Also Published As
Publication number | Publication date |
---|---|
CN111652135A (zh) | 2020-09-11 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN111652135B (zh) | 心电图数据生成方法、装置及电子设备 | |
US20230131876A1 (en) | Systems and methods of identity analysis of electrocardiograms | |
US11564612B2 (en) | Automatic recognition and classification method for electrocardiogram heartbeat based on artificial intelligence | |
CN111772619B (zh) | 一种基于深度学习的心搏识别方法、终端设备及存储介质 | |
CN110495872B (zh) | 基于图片及心搏信息的心电分析方法、装置、设备及介质 | |
US20200397346A1 (en) | Annotation method, annotation device, storage medium, and identification system | |
CN112270212B (zh) | 基于多导联心电信号生成心搏标签数据序列的方法和装置 | |
US8626264B1 (en) | Obtaining information about brain activity | |
CN112070067B (zh) | 一种光体积描计信号的散点图分类方法和装置 | |
CN111462264B (zh) | 医学图像重建方法、医学图像重建网络训练方法和装置 | |
CN112270240B (zh) | 一种信号处理方法、装置、电子设备和存储介质 | |
CN111528832B (zh) | 一种心律失常分类方法及其有效性验证方法 | |
US20230371831A1 (en) | Method and apparatus for predicting blood pressure by fusing calibrated photoplethysmographic signal data | |
CN111387936B (zh) | 一种睡眠阶段识别方法、装置及设备 | |
CN112690802B (zh) | 一种检测心电信号的方法、装置、终端及存储介质 | |
CN111833984A (zh) | 基于机器学习的药品质控分析方法、装置、设备及介质 | |
CN111968137A (zh) | 头部ct图像分割方法、装置、电子设备及存储介质 | |
JPWO2008111349A1 (ja) | 生存分析システム、生存分析方法および生存分析用プログラム | |
CN116636856A (zh) | 心电分类方法、***、电子设备及存储介质 | |
CN114224354B (zh) | 心律失常分类方法、装置及可读存储介质 | |
CN113229798B (zh) | 模型迁移训练方法、装置、计算机设备及可读存储介质 | |
CN112603324A (zh) | 基于改进损失函数的神经网络的训练方法 | |
JPWO2021245733A5 (ja) | 脳画像解析装置、制御方法、及びプログラム | |
CN115211866B (zh) | 一种心律失常分类方法、***及电子设备 | |
CN113855044B (zh) | 缺失导联的心电数据的分类处理方法、装置及存储介质 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |