CN117976226A - 一种基于标记数据的创伤性脑损伤预测方法、装置及设备 - Google Patents

一种基于标记数据的创伤性脑损伤预测方法、装置及设备 Download PDF

Info

Publication number
CN117976226A
CN117976226A CN202311321247.9A CN202311321247A CN117976226A CN 117976226 A CN117976226 A CN 117976226A CN 202311321247 A CN202311321247 A CN 202311321247A CN 117976226 A CN117976226 A CN 117976226A
Authority
CN
China
Prior art keywords
data
extraction model
feature extraction
parameter
super
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202311321247.9A
Other languages
English (en)
Inventor
石磊
陈晨
成思
杨永利
费智敏
章杨杨
詹有芳
张珏
邓琳
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Shaanxi Zhongke Tongda Life Science Technology Co ltd
Shuguang Hospital Affiliated to Shanghai University of TCM
Original Assignee
Shaanxi Zhongke Tongda Life Science Technology Co ltd
Shuguang Hospital Affiliated to Shanghai University of TCM
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Shaanxi Zhongke Tongda Life Science Technology Co ltd, Shuguang Hospital Affiliated to Shanghai University of TCM filed Critical Shaanxi Zhongke Tongda Life Science Technology Co ltd
Priority to CN202311321247.9A priority Critical patent/CN117976226A/zh
Publication of CN117976226A publication Critical patent/CN117976226A/zh
Pending legal-status Critical Current

Links

Landscapes

  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Abstract

本发明公开了一种基于标记数据的创伤性脑损伤预测方法、装置及设备,属于大数据处理技术领域,通过构建第一数据特征提取模型、第二数据特征提取模型以及第三特征提取模型,以深度分析大数据中的时间特征以及空间特征,实现大数据的准确分类,从而实现标记数据的准确分类,实现更优秀的数据处理效果,使工作人员能够更好的挖掘大数据中的数据特征;其次,提出了一种模型训练方法,相比与现有的梯度下降法,具有更好的训练效果以及更快的训练速度,从而能够实现更好的大数据特征提取效果,最终实现数据特征的准确分析。

Description

一种基于标记数据的创伤性脑损伤预测方法、装置及设备
技术领域
本发明属于大数据处理技术领域,具体涉及一种基于标记数据的创伤性脑损伤预测方法、装置及设备。
背景技术
大数据分析是一种快速处理大规模数据集的方法,以便从数据中获取有用的信息。这些数据可以来自社交媒体、传感器、购买历史记录等。大数据分析可以帮助人们更好地了解数据背后的趋势以及模式,以便做出更优的决策。
在大数据分析技术领域中,常常采用聚类算法或者单一的神经网络进行数据的识别,从而造成最终的数据分类或者识别效果不佳。随着技术的发展,需要将大数据处理分析应用至各个技术领域中(例如:医学领域中的标记数据分类)。因此,急需一种具有更好数据分析效果的方法,以提升数据分析的准确性,从而实现更多技术领域的应用。
发明内容
本发明提供一种基于标记数据的创伤性脑损伤预测方法、装置及设备,用以解决现有大数据技术分析过程中存在的数据识别效果不佳的问题。
第一方面,本发明提供一种基于标记数据的创伤性脑损伤预测方法,包括:
获取历史标记数据以及对应的创伤性脑损伤类别,所述历史标记数据以及对应的创伤性脑损伤类别均为存储于数据库中的数据,标记数据表示固定时间窗内的血液标记物序列;
对所述历史标记数据进行预处理,获取预处理之后的历史标记数据,并以预处理后的历史标记数据以及对应的创伤性脑损伤类别构建训练数据;
构建第一数据特征提取模型、第二数据特征提取模型以及第三特征提取模型,并采用训练数据对第一数据特征提取模型、第二数据特征提取模型以及第三特征提取模型联合训练,获取训练完成的第一数据特征提取模型、第二数据特征提取模型以及第三特征提取模型;
获取当前标记数据,并采用第一数据特征提取模型提取当前标记数据中的第一数据特征,采用第二数据特征提取模型提取当前标记数据中的第二数据特征,采用第三特征提取模型对第一数据特征与第二数据特征进行融合,以获取融合数据特征;
采用第三特征提取模型对融合数据特征进行识别,以获取基于标记数据的创伤性脑损伤预测结果。
进一步地,对所述历史标记数据进行预处理,获取预处理之后的历史标记数据,并以预处理后的历史标记数据以及对应的创伤性脑损伤类别构建训练数据,包括:
获取预设的血液标记物的上限以及下限,并确定不在上限与下限之间的异常数据;
针对历史标记数据,确定数值为零或者缺失的数据,得到缺失数据;
针对缺失数据以及异常数据,采用前后相邻的有效数据的平均值进行修正,以获取预处理之后的历史标记数据;所述有效数据表示除了异常数据以及缺失数据之外的其他数据;
以预处理后的历史标记数据作为数据源,以预处理后的历史标记数据对应的创伤性脑损伤类别作为数据标签,构建训练数据。
进一步地,构建第一数据特征提取模型、第二数据特征提取模型以及第三特征提取模型,包括:
构建顺次连接的第一卷积层、第一池化层、第二卷积层、第二池化层、第一全连接层以及第二全连接层,以获取第一数据特征提取模型;
构建循环神经网络,并将循环神经网络作为第二数据特征提取模型;
构建顺次连接的数据融合层、输入层、隐含层以及输出层,以获取第三特征提取模型。
进一步地,采用训练数据对第一数据特征提取模型、第二数据特征提取模型以及第三特征提取模型联合训练,获取训练完成的第一数据特征提取模型、第二数据特征提取模型以及第三特征提取模型,包括:
初始化第一数据特征提取模型的超参数、第二数据特征提取模型的超参数以及第三特征提取模型的超参数,以获取联合超参数序列,并重复获取多个不同的联合超参数序列,所述联合超参数序列中第一数据特征提取模型的超参数、第二数据特征提取模型的超参数以及第三特征提取模型的超参数依次排列;
以训练数据中的预处理后的历史标记数据分别作为第一数据特征提取模型的输入数据以及第二数据特征提取模型的输入数据,分别获取第一数据特征以及第二数据特征;并将第一数据特征以及第二数据特征输入第三特征提取模型中,以获取第三特征提出模型输出的历史标记数据所对应的实际输出;
根据历史标记数据对应的实际输出以及对应的数据标签,获取联合超参数序列在联合训练中的损失函数值;在每次训练过程中,获取损失函数值之后确定每个联合超参数序列对应的历史最优值以及所有联合超参数序列中的全局最优值;
根据每个联合超参数序列对应的历史最优值以及所有联合超参数序列中的全局最优值,采用变速搜索以及综合影响更新的方式,对联合超参数序列进行更新,获取更新后的联合超参数序列;
以更新后的联合超参数序列为基础,重新确定每个联合超参数序列对应的历史最优值以及所有联合超参数序列中的全局最优值,并从非全局最优值的联合超参数序列中随机确定一个全局搜索序列;
采用全局最优值作为参照,引导全局搜索序列在解空间中进行全局搜索,获取全局搜索之后的全局搜索序列;针对重新获取的全局最优值,采用全局搜索之后的全局搜索序列与全局最优值之间的距离作为关键参数,以关键参数对全局最优值进行二次更新,获取二次更新后的全局最优值;
重新获取更新后的联合超参数序列、全局搜索之后的全局搜索序列以及二次更新后的全局最优值的误差函数值,按照预先设定的数量取出多个误差函数值最大的序列,得到多个目标超参数序列,并对目标超参数序列进行变异处理,获取变异后的目标超参数序列,从而完成当前训练过程中联合超参数序列的更新;
获取所有联合超参数序列对应的误差函数值,并确定出最小的误差函数值,判断该最小的误差函数值是否小于预设阈值,若是,则输出最小的误差函数值对应的联合超参数序列,得到第一数据特征提取模型、第二数据特征提取模型以及第三特征提取模型的超参数,完成训练,否则进入训练次数的判断步骤;
判断当前训练次数是否大于最大训练次数,若是,则输出最小的误差函数值对应的联合超参数序列,得到第一数据特征提取模型、第二数据特征提取模型以及第三特征提取模型的超参数,完成训练,否则进入下一次训练过程。
进一步地,根据每个联合超参数序列对应的历史最优值以及所有联合超参数序列中的全局最优值,采用变速搜索以及综合影响更新的方式,对联合超参数序列进行更新,获取更新后的联合超参数序列,包括:
根据每个联合超参数序列对应的历史最优值以及所有联合超参数序列中的全局最优值,采用变速搜索以及综合影响更新的方式,搜索联合超参数序列的增量为:
其中,表示第t次训练过程中第i个联合超参数序列中第j维超参数,i=1,2,...,I,I表示联合超参数序列总数,j=1,2,...,J,J表示联合超参数序列中超参数总数,表示对应的更新量,/>表示/>的增量,ωt表示第t次训练过程中的惯性权重,/>表示第t次训练过程中的第一学习因子,/>表示第t次训练过程中的第二学习因子,R1表示(0,1)之间的第一随机数,R2表示(0,1)之间的第二随机数,/>表示第i个联合超参数序列对应的历史最优值中第j维超参数,/>表示所有联合超参数序列中的全局最优值中第j维超参数;
获取原来联合超参数序列对应的误差函数值以及其增量对应的误差函数值,并判断原来联合超参数序列对应的误差函数值是否大于其增量对应的误差函数值,若是,则以预设概率接受该更新,得到更新后的联合超参数序列,否则直接接受该更新,得到更新后的联合超参数序列。
进一步地,第t+1次训练过程中的惯性权重ωt为:
其中,ωmax表示惯性权重的终值,ωmin表示惯性权重的起始值,T表示最大训练次数,zt表示中间参数;zt-1表示上一次训练过程中的中间参数,且z0为(0,1)之间的常数;μ表示第一影响因子,且μ为(0,4)之间的常数;
第t次训练过程中的第一学习因子为:
其中,表示第一学习因子的起始值,/>表示第一学习因子的终值;
第t次训练过程中的第二学习因子为:
其中,表示第一学习因子的起始值,/>表示第一学习因子的终值。
进一步地,采用全局最优值作为参照,引导全局搜索序列在解空间中进行全局搜索,获取全局搜索之后的全局搜索序列为:
ξ=(step-step*t/T)
其中,表示第t次训练过程中全局搜索序列中第j维超参数,/>表示当前全局最优值中第j维超参数,ξ表示中间参数,/>表示全局搜索序列的更新量,/>表示全局搜索之后的/>step表示搜索步长。
进一步地,针对重新获取的全局最优值,采用全局搜索之后的全局搜索序列与全局最优值之间的距离作为关键参数,以关键参数对全局最优值进行二次更新,获取二次更新后的全局最优值,包括:
获取全局搜索之后的全局搜索序列与全局最优值之间的距离为:
其中,d表示距离,sqrt表示返回一个数的正平方根函数;
根据全局搜索之后的全局搜索序列与全局最优值之间的距离,确定第二影响因子为:
σ=ae-λd
其中,σ表示第二影响因子,a表示以预设初始值线性减小的系数,e表示自然常数,λ表示常数项;
针对重新获取的全局最优值,采用全局搜索之后的全局搜索序列与全局最优值之间的距离作为关键参数,以关键参数对全局最优值进行二次更新为:
其中,表示重新获取的全局最优值,/>表示重新获取的全局最优值所对应的增量,/>表示更新后的/>ω'表示权重因子,/>表示重新获取的全局最优值在上一次训练过程中的增量,c1表示第一更新系数,c2表示第二更新系数,R3表示(0,1)之间的第三随机数,R4表示(0,1)之间的第四随机数,/>表示/>对应的历史最优值。
第二方面,本发明提供一种基于标记数据的创伤性脑损伤预测装置,包括第一数据获取模块、训练数据构建模块、训练模块、第二数据获取模块以及预测模块;
所述第一数据获取模块用于获取历史标记数据以及对应的创伤性脑损伤类别,所述历史标记数据以及对应的创伤性脑损伤类别均为存储于数据库中的数据,标记数据表示固定时间窗内的血液标记物序列;
所述训练数据构建模块用于对所述历史标记数据进行预处理,获取预处理之后的历史标记数据,并以预处理后的历史标记数据以及对应的创伤性脑损伤类别构建训练数据;
所述训练模块用于构建第一数据特征提取模型、第二数据特征提取模型以及第三特征提取模型,并采用训练数据对第一数据特征提取模型、第二数据特征提取模型以及第三特征提取模型联合训练,获取训练完成的第一数据特征提取模型、第二数据特征提取模型以及第三特征提取模型;
所述第二数据获取模块用于获取当前标记数据,并采用第一数据特征提取模型提取当前标记数据中的第一数据特征,采用第二数据特征提取模型提取当前标记数据中的第二数据特征,采用第三特征提取模型对第一数据特征与第二数据特征进行融合,以获取融合数据特征;
所述预测模块用于采用第三特征提取模型对融合数据特征进行识别,以获取基于标记数据的创伤性脑损伤预测结果。
第三方面,本发明提供一种基于标记数据的创伤性脑损伤预测设备,其特征在于,包括存储器和处理器,存储器与处理器之间通过总线相互连接。
存储器存储计算机执行指令。
处理器执行存储器存储的计算机执行指令,使得处理器执行如第一方面所述的基于标记数据的创伤性脑损伤预测方法。
本发明提供的一种基于标记数据的创伤性脑损伤预测方法、装置及设备,通过构建第一数据特征提取模型、第二数据特征提取模型以及第三特征提取模型,以深度分析大数据中的时间特征以及空间特征,实现大数据的准确分类,从而实现标记数据的准确分类,实现更优秀的数据处理效果,使工作人员能够更好的挖掘大数据中的数据特征;其次,提出了一种模型训练方法,相比与现有的梯度下降法,具有更好的训练效果以及更快的训练速度,从而能够实现更好的大数据特征提取效果,最终实现数据特征的准确分析。
附图说明
此处的附图被并入说明书中并构成本说明书的一部分,示出了符合本发明的实施例,并与说明书一起用于解释本发明的原理。
图1为本发明实施例提供的一种基于标记数据的创伤性脑损伤预测方法的流程图。
图2为本发明实施例提供的一种基于标记数据的创伤性脑损伤预测装置的结构示意图。
图3为本发明实施例提供的一种基于标记数据的创伤性脑损伤预测设备的结构示意图。
其中,201-第一数据获取模块、202-训练数据构建模块、203-训练模块、204-第二数据获取模块、205-预测模块、301-存储器、302-处理器、303-总线。
通过上述附图,已示出本发明明确的实施例,后文中将有更详细的描述。这些附图和文字描述并不是为了通过任何方式限制本发明构思的范围,而是通过参考特定实施例为本领域技术人员说明本发明的概念。
具体实施方式
这里将详细地对示例性实施例进行说明,其示例表示在附图中。下面的描述涉及附图时,除非另有表示,不同附图中的相同数字表示相同或相似的要素。以下示例性实施例中所描述的实施方式并不代表与本发明相一致的所有实施方式。相反,它们仅是与如所附权利要求书中所详述的、本发明的一些方面相一致的装置和方法的例子。
下面结合附图详细说明本发明的实施例。
如图1所示,本发明提供一种基于标记数据的创伤性脑损伤预测方法,包括:
S101、获取历史标记数据以及对应的创伤性脑损伤类别,所述历史标记数据以及对应的创伤性脑损伤类别均为存储于数据库中的数据,标记数据表示固定时间窗内的血液标记物序列。
固定时间窗内的血液标记物序列可以表示以预设的频率在一定的时间周期内采集的血液标记物数据。值得说明的是,历史标记数据以及对应的创伤性脑损伤类别均为存储于数据库中的数据之外,还可以为网络爬取的数据,或者还可以为人机交互所输入的数据。
S102、对所述历史标记数据进行预处理,获取预处理之后的历史标记数据,并以预处理后的历史标记数据以及对应的创伤性脑损伤类别构建训练数据。
数据在采集或者录入过程中,可能存在数据空缺或者数据异常值,因此需要对这些数据进行预处理,以使数据更加完善。通过预处理后的历史标记数据以及对应的创伤性脑损伤类别构建训练数据,从而可以有效地提取数据之间存在的关系,最终实现对大数据分析效果的改进。
S103、构建第一数据特征提取模型、第二数据特征提取模型以及第三特征提取模型,并采用训练数据对第一数据特征提取模型、第二数据特征提取模型以及第三特征提取模型联合训练,获取训练完成的第一数据特征提取模型、第二数据特征提取模型以及第三特征提取模型。
可选的,第一数据特征提取模型、第二数据特征提取模型以及第三特征提取模型均可以为神经网络模型,第一数据特征提取模型用于获取数据中的空间特征,第二数据特征提取模型用于获取数据中的时间特征,从而实现更准确的数据特征提取,而第三特征提取模型用于对第一数据特征提取模型以及第二数据特征提取模型提取的特征进行综合识别,从而实现数据的识别与分类。
S104、获取当前标记数据,并采用第一数据特征提取模型提取当前标记数据中的第一数据特征,采用第二数据特征提取模型提取当前标记数据中的第二数据特征,采用第三特征提取模型对第一数据特征与第二数据特征进行融合,以获取融合数据特征。
可选的,本实施例提供一种融合数据特征的获取方法,包括:将第一数据特征与第二数据特征顺序相连,从而形成一个新的序列,而第三特征提取模型的输入维度与融合数据特征的维度相同,从而可以实现数据的精准分类。
S105、采用第三特征提取模型对融合数据特征进行识别,以获取基于标记数据的创伤性脑损伤预测结果。
相比于现有技术,本发明提供的数据分析方法,能够进一步挖掘大数据中的数据特征,从而实现数据的精准识别及分类,高精度的数据识别,应用前景更加广泛。
在本实施例中,对所述历史标记数据进行预处理,获取预处理之后的历史标记数据,并以预处理后的历史标记数据以及对应的创伤性脑损伤类别构建训练数据,包括:
获取预设的血液标记物的上限以及下限,并确定不在上限与下限之间的异常数据。
针对历史标记数据,确定数值为零或者缺失的数据,得到缺失数据。
针对缺失数据以及异常数据,采用前后相邻的有效数据的平均值进行修正,以获取预处理之后的历史标记数据。所述有效数据表示除了异常数据以及缺失数据之外的其他数据。
以预处理后的历史标记数据作为数据源,以预处理后的历史标记数据对应的创伤性脑损伤类别作为数据标签,构建训练数据。
值得说明的是,除了上述的数据预处理方法之外,还可以采用其他数据处理方法,以剔除异常数据,从而能够更进一步地对数据进行挖掘。
在本实施例中,构建第一数据特征提取模型、第二数据特征提取模型以及第三特征提取模型,包括:
构建顺次连接的第一卷积层、第一池化层、第二卷积层、第二池化层、第一全连接层以及第二全连接层,以获取第一数据特征提取模型。构建循环神经网络,并将循环神经网络作为第二数据特征提取模型。
通过第一数据特征提取模型能够有效地提取数据中的空间特征,而循环神经网络具有记忆性、参数共享并且图灵完备(Turing completeness),因此在对序列的非线性特征进行学习时具有一定优势,因此可以采用循环神经网络的记忆性学习数据中的时间特征,从而实现更加全面的特征提取。
构建顺次连接的数据融合层、输入层、隐含层以及输出层,以获取第三特征提取模型。
第三特征提取模型可以根据第一数据特征提取模型输出的第一数据特征以及第二数据特征进行数据的融合及识别,从而实现数据的分类。数据融合层用于将第一数据特征与第二数据特征顺序连接,从而形成一个同时具有空间特征以及时间特征的融合数据特征。可以发现第三特征提取模型主要是提取输入数据中的特征,并基于提取的特征进行分类输出,因此,可以将第三特征提取模型设置为分类神经网络。例如:BP(BackPropagation,反向传播)神经网络。
在本实施例中,采用训练数据对第一数据特征提取模型、第二数据特征提取模型以及第三特征提取模型联合训练,获取训练完成的第一数据特征提取模型、第二数据特征提取模型以及第三特征提取模型,包括:
初始化第一数据特征提取模型的超参数、第二数据特征提取模型的超参数以及第三特征提取模型的超参数,以获取联合超参数序列,并重复获取多个不同的联合超参数序列,所述联合超参数序列中第一数据特征提取模型的超参数、第二数据特征提取模型的超参数以及第三特征提取模型的超参数依次排列。值得说明的是,本实施例中主要训练参数为权重以及偏置参数,从而提升数据识别效果。
以训练数据中的预处理后的历史标记数据分别作为第一数据特征提取模型的输入数据以及第二数据特征提取模型的输入数据,分别获取第一数据特征以及第二数据特征。并将第一数据特征以及第二数据特征输入第三特征提取模型中,以获取第三特征提出模型输出的历史标记数据所对应的实际输出。根据历史标记数据对应的实际输出以及对应的数据标签,获取联合超参数序列在联合训练中的损失函数值。
在本实施例中,损失函数可以设置均方根误差函数,从而实现训练效果的识别。值得说明的是,除了采用均方根误差函数获取损失函数值之外,还可以采用其他误差函数作为损失函数。
为了保证训练后的第一数据特征提取模型、第二数据特征提取模型以及第三特征提出模型,还可以获取神经网络指标(如准确率、召回率等等指标),若某项指标不符合预设条件,则可以重新训练。
在每次训练过程中,获取损失函数值之后确定每个联合超参数序列对应的历史最优值以及所有联合超参数序列中的全局最优值。
根据每个联合超参数序列对应的历史最优值以及所有联合超参数序列中的全局最优值,采用变速搜索以及综合影响更新的方式,对联合超参数序列进行更新,获取更新后的联合超参数序列。
通过历史最优值以及全局最优值的综合影响更新,能够使个联合超参数序列始终向更优的方向前进,从而实现更优位置的搜索。
以更新后的联合超参数序列为基础,重新确定每个联合超参数序列对应的历史最优值以及所有联合超参数序列中的全局最优值,并从非全局最优值的联合超参数序列中随机确定一个全局搜索序列。
采用变速搜索以及综合影响更新的方式,虽然能够一定程度上实现联合超参数序列的寻优,但是仍然存在与梯度下降法相同的缺陷,即容易陷入局部最优,因此本实施例确定一个全局搜索序列,通过对该全局搜索序列进行搜索,可以跳出局部最优,从而实现全局寻优。
采用全局最优值作为参照,引导全局搜索序列在解空间中进行全局搜索,获取全局搜索之后的全局搜索序列。针对重新获取的全局最优值,采用全局搜索之后的全局搜索序列与全局最优值之间的距离作为关键参数,以关键参数对全局最优值进行二次更新,获取二次更新后的全局最优值。
重新获取更新后的联合超参数序列、全局搜索之后的全局搜索序列以及二次更新后的全局最优值的误差函数值,按照预先设定的数量取出多个误差函数值最大的序列,得到多个目标超参数序列,并对目标超参数序列进行变异处理,获取变异后的目标超参数序列,从而完成当前训练过程中联合超参数序列的更新。
当联合超参数序列中误差函数值最大的序列,可能是无用序列,其会影响训练进程,故采用变异处理,以提高所有序列的多样性以及更换搜索范围,从而可以更快地搜索到全局最优的联合超参数序列。
可选的,本实施例提供另一种目标超参数序列的获取方法,包括:当某个联合超参数序列在预设训练次数中的误差函数值未减小,则可以确定该联合超参数序列为目标超参数序列。
获取所有联合超参数序列对应的误差函数值,并确定出最小的误差函数值,判断该最小的误差函数值是否小于预设阈值,若是,则输出最小的误差函数值对应的联合超参数序列,得到第一数据特征提取模型、第二数据特征提取模型以及第三特征提取模型的超参数,完成训练,否则进入训练次数的判断步骤。
判断当前训练次数是否大于最大训练次数,若是,则输出最小的误差函数值对应的联合超参数序列,得到第一数据特征提取模型、第二数据特征提取模型以及第三特征提取模型的超参数,完成训练,否则进入下一次训练过程。
在本实施例中,根据每个联合超参数序列对应的历史最优值以及所有联合超参数序列中的全局最优值,采用变速搜索以及综合影响更新的方式,对联合超参数序列进行更新,获取更新后的联合超参数序列,包括:
根据每个联合超参数序列对应的历史最优值以及所有联合超参数序列中的全局最优值,采用变速搜索以及综合影响更新的方式,搜索联合超参数序列的增量为:
其中,表示第t次训练过程中第i个联合超参数序列中第j维超参数,i=1,2,...,I,I表示联合超参数序列总数,j=1,2,...,J,J表示联合超参数序列中超参数总数,表示对应的更新量,/>表示/>的增量,ωt表示第t次训练过程中的惯性权重,/>表示第t次训练过程中的第一学习因子,/>表示第t次训练过程中的第二学习因子,R1表示(0,1)之间的第一随机数,R2表示(0,1)之间的第二随机数,/>表示第i个联合超参数序列对应的历史最优值中第j维超参数,/>表示所有联合超参数序列中的全局最优值中第j维超参数。
获取原来联合超参数序列对应的误差函数值以及其增量对应的误差函数值,并判断原来联合超参数序列对应的误差函数值是否大于其增量对应的误差函数值,若是,则以预设概率接受该更新,得到更新后的联合超参数序列,否则直接接受该更新,得到更新后的联合超参数序列。
在本实施例中,第t+1次训练过程中的惯性权重ωt为:
其中,ωmax表示惯性权重的终值,ωmin表示惯性权重的起始值,T表示最大训练次数,zt表示中间参数。zt-1表示上一次训练过程中的中间参数,且z0为(0,1)之间的常数。μ表示第一影响因子,且μ为(0,4)之间的常数。
本实施例提供的惯性权重具有较强的随机性和波动性,将震荡的级联混沌惯性权重引入算法的增量项,能够增加多样性,协助跳出局部极值,加快算法收敛速度。
第t次训练过程中的第一学习因子为:
其中,表示第一学习因子的起始值(在本实施例中可以设置为2.5),/>表示第一学习因子的终值(在本实施例中可以设置为0.5)。
第t次训练过程中的第二学习因子为:
其中,表示第一学习因子的起始值(在本实施例中可以设置为0.5),/>表示第一学习因子的终值(在本实施例中可以设置为2.5)。
在本实施例中,第一学习因子逐渐减小,而第二学习因子/>逐渐增大,可以使算法在训练前期能够在更广的范围内搜索,而在算法后期,偏向于精细搜索,提高搜索精度。
在本实施例中,采用全局最优值作为参照,引导全局搜索序列在解空间中进行全局搜索,获取全局搜索之后的全局搜索序列为:
ξ=(step-step*t/T)
其中,表示第t次训练过程中全局搜索序列中第j维超参数,/>表示当前全局最优值中第j维超参数,ξ表示中间参数,/>表示全局搜索序列的更新量,/>表示全局搜索之后的/>step表示搜索步长。
该全局搜搜能够在算法初期迫使全局搜索序列远离全局最优值,从而可以实现全局搜索,而在算法后期减少全局最优值的影响,从而方便搜索更优的解。
在本实施例中,针对重新获取的全局最优值,采用全局搜索之后的全局搜索序列与全局最优值之间的距离作为关键参数,以关键参数对全局最优值进行二次更新,获取二次更新后的全局最优值,包括:
获取全局搜索之后的全局搜索序列与全局最优值之间的距离为:
其中,d表示距离,sqrt表示返回一个数的正平方根函数。
根据全局搜索之后的全局搜索序列与全局最优值之间的距离,确定第二影响因子为:
σ=ae-λd
其中,σ表示第二影响因子,a表示以预设初始值线性减小的系数(如存在一个起始值以及一个终值,在两者之间线性减小),e表示自然常数,λ表示常数项。
针对重新获取的全局最优值,采用全局搜索之后的全局搜索序列与全局最优值之间的距离作为关键参数,以关键参数对全局最优值进行二次更新为:
其中,表示重新获取的全局最优值,/>表示重新获取的全局最优值所对应的增量,/>表示更新后的/>ω'表示权重因子。/>表示重新获取的全局最优值在上一次训练过程中的增量,若/>在上一次训练过程中仅进行了一次更新,则为一次更新时的增量。若/>在上一次训练过程中进行了二次更新,则为二次更新时的增量。c1表示第一更新系数,c2表示第二更新系数,R3表示(0,1)之间的第三随机数,R4表示(0,1)之间的第四随机数,/>表示/>对应的历史最优值。
采用线性减小的第二影响因子,可以减小后期全局搜索序列对全局最优值的影响力,从而提高算法后期的搜索精度,最终实现全局最优解的获取。
可选的,还可以设置一个概率,基于该概率,采用轮盘赌的方式确定是否需要对全局最优值进行更新,若是,则采用上述方法进行更新,否则不对全局最优值进行更新。
实施例2
如图2所示,本发明提供一种基于标记数据的创伤性脑损伤预测装置,包括第一数据获取模块201、训练数据构建模块202、训练模块203、第二数据获取模块204以及预测模块205。
所述第一数据获取模块201用于获取历史标记数据以及对应的创伤性脑损伤类别,所述历史标记数据以及对应的创伤性脑损伤类别均为存储于数据库中的数据,标记数据表示固定时间窗内的血液标记物序列。
所述训练数据构建模块202用于对所述历史标记数据进行预处理,获取预处理之后的历史标记数据,并以预处理后的历史标记数据以及对应的创伤性脑损伤类别构建训练数据。
所述训练模块203用于构建第一数据特征提取模型、第二数据特征提取模型以及第三特征提取模型,并采用训练数据对第一数据特征提取模型、第二数据特征提取模型以及第三特征提取模型联合训练,获取训练完成的第一数据特征提取模型、第二数据特征提取模型以及第三特征提取模型。
所述第二数据获取模块204用于获取当前标记数据,并采用第一数据特征提取模型提取当前标记数据中的第一数据特征,采用第二数据特征提取模型提取当前标记数据中的第二数据特征,采用第三特征提取模型对第一数据特征与第二数据特征进行融合,以获取融合数据特征。
所述预测模块205用于采用第三特征提取模型对融合数据特征进行识别,以获取基于标记数据的创伤性脑损伤预测结果。
本实施例提供的一种基于标记数据的创伤性脑损伤预测装置能够执行权利要求1所述的方法技术方案,其有益效果及原理类似,此处不再赘述。
实施例3
如图3所示,本实施例提供一种基于标记数据的创伤性脑损伤预测设备,包括存储器301和处理器302,存储器301与处理器302之间通过总线303相互连接。
存储器301存储计算机执行指令。
处理器302执行存储器存储的计算机执行指令,使得处理器执行如实施例1所述的一种基于标记数据的创伤性脑损伤预测方法。
具体举例的,存储器可以但不限于包括随机存取存储器(random access memory,RAM)、只读存储器(Read Only Memory,ROM)、闪存(Flash Memory)、先进先出存储器(FirstInput First Output,FIFO)和/或先进后出存储器(First In Last Out,FILO)等等。具体地,处理器可以包括一个或多个处理核心,比如4核心处理器、8核心处理器等。处理器可以采用DSP(Digital Signal Processing,数字信号处理)、FPGA(Field-Programmable GateArray,现场可编程门阵列)、PLA(Programmable Logic Array,可编程逻辑阵列)中的至少一种硬件形式来实现,同时,处理器也可以包括主处理器和协处理器,主处理器是用于对在唤醒状态下的数据进行处理的处理器,也称CPU(Central Processing Unit,中央处理器)。协处理器是用于对在待机状态下的数据进行处理的低功耗处理器。
实施例4
本实施例提供了一种计算机可读存储介质,计算机可读存储介质中存储有计算机执行指令,当计算机执行指令被处理器执行时用于实现如实施例1所述的一种基于标记数据的创伤性脑损伤预测方法。
实施例5
本实施例提供了一种计算机程序产品,包括计算机程序,该计算机程序被处理器执行时实现如实施例1所述的一种基于标记数据的创伤性脑损伤预测方法。
以上所述的具体实施方式,对本发明的目的、技术方案和有益效果进行了进一步详细说明,所应理解的是,以上所述仅为本发明的具体实施方式而已,并不用于限定本发明的保护范围,凡在本发明的精神和原则之内,所做的任何修改、等同替换、改进等,均应包含在本发明的保护范围之内。
以上所述的具体实施方式,对本发明的目的、技术方案和有益效果进行了进一步详细说明,所应理解的是,以上所述仅为本发明的具体实施方式而已,并不用于限定本发明的保护范围,凡在本发明的精神和原则之内,所做的任何修改、等同替换、改进等,均应包含在本发明的保护范围之内。

Claims (10)

1.一种基于标记数据的创伤性脑损伤预测方法,其特征在于,包括:
获取历史标记数据以及对应的创伤性脑损伤类别,所述历史标记数据以及对应的创伤性脑损伤类别均为存储于数据库中的数据,标记数据表示固定时间窗内的血液标记物序列;
对所述历史标记数据进行预处理,获取预处理之后的历史标记数据,并以预处理后的历史标记数据以及对应的创伤性脑损伤类别构建训练数据;
构建第一数据特征提取模型、第二数据特征提取模型以及第三特征提取模型,并采用训练数据对第一数据特征提取模型、第二数据特征提取模型以及第三特征提取模型联合训练,获取训练完成的第一数据特征提取模型、第二数据特征提取模型以及第三特征提取模型;
获取当前标记数据,并采用第一数据特征提取模型提取当前标记数据中的第一数据特征,采用第二数据特征提取模型提取当前标记数据中的第二数据特征,采用第三特征提取模型对第一数据特征与第二数据特征进行融合,以获取融合数据特征;
采用第三特征提取模型对融合数据特征进行识别,以获取基于标记数据的创伤性脑损伤预测结果。
2.根据权利要求1所述的基于标记数据的创伤性脑损伤预测方法,其特征在于,对所述历史标记数据进行预处理,获取预处理之后的历史标记数据,并以预处理后的历史标记数据以及对应的创伤性脑损伤类别构建训练数据,包括:
获取预设的血液标记物的上限以及下限,并确定不在上限与下限之间的异常数据;
针对历史标记数据,确定数值为零或者缺失的数据,得到缺失数据;
针对缺失数据以及异常数据,采用前后相邻的有效数据的平均值进行修正,以获取预处理之后的历史标记数据;所述有效数据表示除了异常数据以及缺失数据之外的其他数据;
以预处理后的历史标记数据作为数据源,以预处理后的历史标记数据对应的创伤性脑损伤类别作为数据标签,构建训练数据。
3.根据权利要求2所述的基于标记数据的创伤性脑损伤预测方法,其特征在于,构建第一数据特征提取模型、第二数据特征提取模型以及第三特征提取模型,包括:
构建顺次连接的第一卷积层、第一池化层、第二卷积层、第二池化层、第一全连接层以及第二全连接层,以获取第一数据特征提取模型;
构建循环神经网络,并将循环神经网络作为第二数据特征提取模型;
构建顺次连接的数据融合层、输入层、隐含层以及输出层,以获取第三特征提取模型。
4.根据权利要求3所述的基于标记数据的创伤性脑损伤预测方法,其特征在于,采用训练数据对第一数据特征提取模型、第二数据特征提取模型以及第三特征提取模型联合训练,获取训练完成的第一数据特征提取模型、第二数据特征提取模型以及第三特征提取模型,包括:
初始化第一数据特征提取模型的超参数、第二数据特征提取模型的超参数以及第三特征提取模型的超参数,以获取联合超参数序列,并重复获取多个不同的联合超参数序列,所述联合超参数序列中第一数据特征提取模型的超参数、第二数据特征提取模型的超参数以及第三特征提取模型的超参数依次排列;
以训练数据中的预处理后的历史标记数据分别作为第一数据特征提取模型的输入数据以及第二数据特征提取模型的输入数据,分别获取第一数据特征以及第二数据特征;并将第一数据特征以及第二数据特征输入第三特征提取模型中,以获取第三特征提出模型输出的历史标记数据所对应的实际输出;
根据历史标记数据对应的实际输出以及对应的数据标签,获取联合超参数序列在联合训练中的损失函数值;在每次训练过程中,获取损失函数值之后确定每个联合超参数序列对应的历史最优值以及所有联合超参数序列中的全局最优值;
根据每个联合超参数序列对应的历史最优值以及所有联合超参数序列中的全局最优值,采用变速搜索以及综合影响更新的方式,对联合超参数序列进行更新,获取更新后的联合超参数序列;
以更新后的联合超参数序列为基础,重新确定每个联合超参数序列对应的历史最优值以及所有联合超参数序列中的全局最优值,并从非全局最优值的联合超参数序列中随机确定一个全局搜索序列;
采用全局最优值作为参照,引导全局搜索序列在解空间中进行全局搜索,获取全局搜索之后的全局搜索序列;针对重新获取的全局最优值,采用全局搜索之后的全局搜索序列与全局最优值之间的距离作为关键参数,以关键参数对全局最优值进行二次更新,获取二次更新后的全局最优值;
重新获取更新后的联合超参数序列、全局搜索之后的全局搜索序列以及二次更新后的全局最优值的误差函数值,按照预先设定的数量取出多个误差函数值最大的序列,得到多个目标超参数序列,并对目标超参数序列进行变异处理,获取变异后的目标超参数序列,从而完成当前训练过程中联合超参数序列的更新;
获取所有联合超参数序列对应的误差函数值,并确定出最小的误差函数值,判断该最小的误差函数值是否小于预设阈值,若是,则输出最小的误差函数值对应的联合超参数序列,得到第一数据特征提取模型、第二数据特征提取模型以及第三特征提取模型的超参数,完成训练,否则进入训练次数的判断步骤;
判断当前训练次数是否大于最大训练次数,若是,则输出最小的误差函数值对应的联合超参数序列,得到第一数据特征提取模型、第二数据特征提取模型以及第三特征提取模型的超参数,完成训练,否则进入下一次训练过程。
5.根据权利要求4所述的基于标记数据的创伤性脑损伤预测方法,其特征在于,根据每个联合超参数序列对应的历史最优值以及所有联合超参数序列中的全局最优值,采用变速搜索以及综合影响更新的方式,对联合超参数序列进行更新,获取更新后的联合超参数序列,包括:
根据每个联合超参数序列对应的历史最优值以及所有联合超参数序列中的全局最优值,采用变速搜索以及综合影响更新的方式,搜索联合超参数序列的增量为:
其中,表示第t次训练过程中第i个联合超参数序列中第j维超参数,i=1,2,...,I,I表示联合超参数序列总数,j=1,2,...,J,J表示联合超参数序列中超参数总数,/>表示对应的更新量,/>表示/>的增量,ωt表示第t次训练过程中的惯性权重,/>表示第t次训练过程中的第一学习因子,/>表示第t次训练过程中的第二学习因子,R1表示(0,1)之间的第一随机数,R2表示(0,1)之间的第二随机数,/>表示第i个联合超参数序列对应的历史最优值中第j维超参数,/>表示所有联合超参数序列中的全局最优值中第j维超参数;
获取原来联合超参数序列对应的误差函数值以及其增量对应的误差函数值,并判断原来联合超参数序列对应的误差函数值是否大于其增量对应的误差函数值,若是,则以预设概率接受该更新,得到更新后的联合超参数序列,否则直接接受该更新,得到更新后的联合超参数序列。
6.根据权利要求5所述的基于标记数据的创伤性脑损伤预测方法,其特征在于,
第t+1次训练过程中的惯性权重ωt为:
其中,ωmax表示惯性权重的终值,ωmin表示惯性权重的起始值,T表示最大训练次数,zt表示中间参数;zt-1表示上一次训练过程中的中间参数,且z0为(0,1)之间的常数;μ表示第一影响因子,且μ为(0,4)之间的常数;
第t次训练过程中的第一学习因子为:
其中,表示第一学习因子的起始值,/>表示第一学习因子的终值;
第t次训练过程中的第二学习因子为:
其中,表示第一学习因子的起始值,/>表示第一学习因子的终值。
7.根据权利要求5所述的基于标记数据的创伤性脑损伤预测方法,其特征在于,采用全局最优值作为参照,引导全局搜索序列在解空间中进行全局搜索,获取全局搜索之后的全局搜索序列为:
ξ=(step-step*t/T)
其中,表示第t次训练过程中全局搜索序列中第j维超参数,/>表示当前全局最优值中第j维超参数,ξ表示中间参数,/>表示全局搜索序列的更新量,/>表示全局搜索之后的/>step表示搜索步长。
8.根据权利要求7所述的基于标记数据的创伤性脑损伤预测方法,其特征在于,针对重新获取的全局最优值,采用全局搜索之后的全局搜索序列与全局最优值之间的距离作为关键参数,以关键参数对全局最优值进行二次更新,获取二次更新后的全局最优值,包括:
获取全局搜索之后的全局搜索序列与全局最优值之间的距离为:
其中,d表示距离,sqrt表示返回一个数的正平方根函数;
根据全局搜索之后的全局搜索序列与全局最优值之间的距离,确定第二影响因子为:
σ=ae-λd
其中,σ表示第二影响因子,a表示以预设初始值线性减小的系数,e表示自然常数,λ表示常数项;
针对重新获取的全局最优值,采用全局搜索之后的全局搜索序列与全局最优值之间的距离作为关键参数,以关键参数对全局最优值进行二次更新为:
其中,表示重新获取的全局最优值,/>表示重新获取的全局最优值所对应的增量,/>表示更新后的/>ω'表示权重因子,/>表示重新获取的全局最优值在上一次训练过程中的增量,c1表示第一更新系数,c2表示第二更新系数,R3表示(0,1)之间的第三随机数,R4表示(0,1)之间的第四随机数,/>表示/>对应的历史最优值。
9.一种基于标记数据的创伤性脑损伤预测装置,其特征在于,包括第一数据获取模块、训练数据构建模块、训练模块、第二数据获取模块以及预测模块;
所述第一数据获取模块用于获取历史标记数据以及对应的创伤性脑损伤类别,所述历史标记数据以及对应的创伤性脑损伤类别均为存储于数据库中的数据,标记数据表示固定时间窗内的血液标记物序列;
所述训练数据构建模块用于对所述历史标记数据进行预处理,获取预处理之后的历史标记数据,并以预处理后的历史标记数据以及对应的创伤性脑损伤类别构建训练数据;
所述训练模块用于构建第一数据特征提取模型、第二数据特征提取模型以及第三特征提取模型,并采用训练数据对第一数据特征提取模型、第二数据特征提取模型以及第三特征提取模型联合训练,获取训练完成的第一数据特征提取模型、第二数据特征提取模型以及第三特征提取模型;
所述第二数据获取模块用于获取当前标记数据,并采用第一数据特征提取模型提取当前标记数据中的第一数据特征,采用第二数据特征提取模型提取当前标记数据中的第二数据特征,采用第三特征提取模型对第一数据特征与第二数据特征进行融合,以获取融合数据特征;
所述预测模块用于采用第三特征提取模型对融合数据特征进行识别,以获取基于标记数据的创伤性脑损伤预测结果。
10.一种基于标记数据的创伤性脑损伤预测设备,其特征在于,包括存储器和处理器,存储器与处理器之间通过总线相互连接。
存储器存储计算机执行指令。
处理器执行存储器存储的计算机执行指令,使得处理器执行如权利要求1-8任一所述的基于标记数据的创伤性脑损伤预测方法。
CN202311321247.9A 2023-10-12 2023-10-12 一种基于标记数据的创伤性脑损伤预测方法、装置及设备 Pending CN117976226A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202311321247.9A CN117976226A (zh) 2023-10-12 2023-10-12 一种基于标记数据的创伤性脑损伤预测方法、装置及设备

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202311321247.9A CN117976226A (zh) 2023-10-12 2023-10-12 一种基于标记数据的创伤性脑损伤预测方法、装置及设备

Publications (1)

Publication Number Publication Date
CN117976226A true CN117976226A (zh) 2024-05-03

Family

ID=90854274

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202311321247.9A Pending CN117976226A (zh) 2023-10-12 2023-10-12 一种基于标记数据的创伤性脑损伤预测方法、装置及设备

Country Status (1)

Country Link
CN (1) CN117976226A (zh)

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR20200079175A (ko) * 2018-12-24 2020-07-02 삼성전자주식회사 행위 예측에 기초한 ar 장치 제어 방법 및 장치
US20220335711A1 (en) * 2021-07-29 2022-10-20 Beijing Baidu Netcom Science Technology Co., Ltd. Method for generating pre-trained model, electronic device and storage medium
CN115293326A (zh) * 2022-07-05 2022-11-04 深圳市国电科技通信有限公司 电力负荷预测模型的训练方法、装置及电力负荷预测方法
US20230419646A1 (en) * 2021-02-26 2023-12-28 Huawei Technologies Co., Ltd. Feature extraction method and apparatus

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR20200079175A (ko) * 2018-12-24 2020-07-02 삼성전자주식회사 행위 예측에 기초한 ar 장치 제어 방법 및 장치
US20230419646A1 (en) * 2021-02-26 2023-12-28 Huawei Technologies Co., Ltd. Feature extraction method and apparatus
US20220335711A1 (en) * 2021-07-29 2022-10-20 Beijing Baidu Netcom Science Technology Co., Ltd. Method for generating pre-trained model, electronic device and storage medium
CN115293326A (zh) * 2022-07-05 2022-11-04 深圳市国电科技通信有限公司 电力负荷预测模型的训练方法、装置及电力负荷预测方法

Similar Documents

Publication Publication Date Title
CN110609891B (zh) 一种基于上下文感知图神经网络的视觉对话生成方法
CN103473283B (zh) 一种文本案例匹配方法
CN110555084B (zh) 基于pcnn和多层注意力的远程监督关系分类方法
CN110188192B (zh) 一种多任务网络构建与多尺度的罪名法条联合预测方法
CN111191442B (zh) 相似问题生成方法、装置、设备及介质
CN111460200B (zh) 基于多任务深度学习的图像检索方法、模型及其构建方法
CN110097096B (zh) 一种基于tf-idf矩阵和胶囊网络的文本分类方法
CN113157678B (zh) 一种多源异构数据关联方法
CN110310012B (zh) 数据分析方法、装置、设备及计算机可读存储介质
CN113593661A (zh) 临床术语标准化方法、装置、电子设备及存储介质
CN110175273A (zh) 文本处理方法、装置、计算机可读存储介质和计算机设备
CN110955767A (zh) 一种机器人对话***中生成意图候选集列表集合的算法及装置
CN116304020A (zh) 一种基于义原分析和跨度特征的工业文本实体抽取方法
CN111507528A (zh) 一种基于cnn-lstm的股票长期趋势预测方法
Zhang et al. A novel method based on deep reinforcement learning for machining process route planning
CN109460895A (zh) 构建社会单位画像的方法及***
CN116342167B (zh) 基于序列标注命名实体识别的智能成本度量方法和装置
CN110362828B (zh) 网络资讯风险识别方法及***
CN117151222A (zh) 领域知识引导的突发事件案例实体属性及其关系抽取方法、电子设备和存储介质
CN112380346A (zh) 金融新闻情感分析方法、装置、计算机设备及存储介质
CN117976226A (zh) 一种基于标记数据的创伤性脑损伤预测方法、装置及设备
CN115271826A (zh) 一种物流线路的价格区间预测方法和装置
CN112464648B (zh) 基于多源数据分析的行业标准空白特征识别***及方法
CN113987536A (zh) 数据表中字段安全等级确定方法、装置、电子设备及介质
CN113064979A (zh) 基于关键词检索的工期和价格合理性判断方法

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination