CN111553412A - 对性早熟分类模型进行训练的方法、装置和设备 - Google Patents
对性早熟分类模型进行训练的方法、装置和设备 Download PDFInfo
- Publication number
- CN111553412A CN111553412A CN202010344479.6A CN202010344479A CN111553412A CN 111553412 A CN111553412 A CN 111553412A CN 202010344479 A CN202010344479 A CN 202010344479A CN 111553412 A CN111553412 A CN 111553412A
- Authority
- CN
- China
- Prior art keywords
- classification
- image
- training
- information
- classification model
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/24—Classification techniques
- G06F18/241—Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
- G06N3/045—Combinations of networks
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/08—Learning methods
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- Data Mining & Analysis (AREA)
- Life Sciences & Earth Sciences (AREA)
- Artificial Intelligence (AREA)
- General Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- Evolutionary Computation (AREA)
- Biophysics (AREA)
- Computational Linguistics (AREA)
- Software Systems (AREA)
- Mathematical Physics (AREA)
- Health & Medical Sciences (AREA)
- Biomedical Technology (AREA)
- Computing Systems (AREA)
- Molecular Biology (AREA)
- General Health & Medical Sciences (AREA)
- Evolutionary Biology (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Bioinformatics & Computational Biology (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Abstract
本申请涉及一种对性早熟分类模型进行训练的方法、装置、计算机设备和存储介质。对性早熟分类模型进行训练的方法包括:获取用于表征性早熟类别的文本信息和影像信息;从所述文本信息中,提取与预设的性早熟分类参数对应的分类参数值;对所述影像信息进行特征提取处理,得到影像特征;利用所述分类参数值和所述影像特征,对所述性早熟分类模型进行训练。采用本方法能够利用分类参数值和影像特征,对性早熟分类模型进行训练,增加性早熟分类模型的训练数据的数据维度,提高性早熟分类模型的分类性能。
Description
技术领域
本申请涉及计算机技术领域,特别是涉及一种对性早熟分类模型进行训练的方法、装置、计算机设备和存储介质。
背景技术
随着计算机技术的发展,人工智能技术被广泛应用在各个行业中,人工智能技术的关键环节之一就是对模型的训练,以得到一个性能较优的模型。人工智能技术可以应用在对性早熟进行分类的领域中,但传统的训练性早熟分类模型性能并没有达到最优化。发明人发现,导致分类性能未到达最优化的原因是传统训练性早熟分类模型的数据维度单一,例如,训练数据仅是子宫体/卵巢的容积、长径、横径等,而这些数据仅是一些反映单一***发育的结构化数据。因此,为提高性早熟分类模型的分类性能,如何对性早熟分类模型进行训练是有必要解决的问题。
发明内容
基于此,有必要针对上述技术问题,提供一种能够提高性早熟分类模型的分类性能的对性早熟分类模型进行训练的方法、装置、计算机设备和存储介质。
一种对性早熟分类模型进行训练的方法,包括:
获取用于表征性早熟类别的文本信息和影像信息;
从所述文本信息中,提取与预设的性早熟分类参数对应的分类参数值;
对所述影像信息进行特征提取处理,得到影像特征;
利用所述分类参数值和所述影像特征,对所述性早熟分类模型进行训练。
在其中一个实施例中,所述对所述影像信息进行特征提取处理,得到影像特征的步骤,包括:
将所述影像信息输入至预先训练的卷积神经网络中,控制所述卷积神经网络从所述影像信息中提取骨形态特征,将所述骨形态特征作为所述影像特征;所述骨形态特征为与骨龄有关的影像特征。
在其中一个实施例中,在所述将所述影像信息输入至预先训练的卷积神经网络中的步骤之前,还包括:
获取影像训练样本,将所述影像训练样本输入至基于DenseNet模型构建的卷积神经网络中,控制所述卷积神经网络根据所述影像训练样本完成训练。
在其中一个实施例中,所述性早熟分类参数包括***的发育等级、骨龄、生殖器官尺寸中的至少一项。
在其中一个实施例中,所述分类参数值和所述影像特征均为多个;
所述利用所述分类参数值和所述影像特征,对所述性早熟分类模型进行训练的步骤,包括:
将同一个样本的分类参数值和影像特征归入同一组别;
根据各个组别的分类参数值和影像特征,对所述性早熟分类模型进行训练。
在其中一个实施例中,所述性早熟分类模型为XGBoost分类器;
所述根据各个组别的分类参数值和影像特征,对所述性早熟分类模型进行训练的步骤,包括:
将各个组别的分类参数值和影像特征输入至所述XGBoost分类器中,按照十折交叉验证的方式控制所述XGBoost分类器进行训练。
在其中一个实施例中,所述方法,还包括:
对所述性早熟分类模型输出的分类结果进行原因分析处理,得到对应的分类原因信息;
将所述分类原因信息和所述分类结果发送至目标终端,以使所述目标终端输出所述分类原因信息和所述分类结果。
一种对性早熟分类模型进行训练的装置,包括:
信息获取模块,用于获取用于表征性早熟类别的文本信息和影像信息;
分类参数值提取模块,用于从所述文本信息中,提取与预设的性早熟分类参数对应的分类参数值;
影像特征提取模块,用于对所述影像信息进行特征提取处理,得到影像特征;
模型训练模块,用于利用所述分类参数值和所述影像特征,对所述性早熟分类模型进行训练。
一种计算机设备,包括存储器和处理器,所述存储器存储有计算机程序,所述处理器执行所述计算机程序时实现以下步骤:
获取用于表征性早熟类别的文本信息和影像信息;
从所述文本信息中,提取与预设的性早熟分类参数对应的分类参数值;
对所述影像信息进行特征提取处理,得到影像特征;
利用所述分类参数值和所述影像特征,对所述性早熟分类模型进行训练。
一种计算机可读存储介质,其上存储有计算机程序,所述计算机程序被处理器执行时实现以下步骤:
获取用于表征性早熟类别的文本信息和影像信息;
从所述文本信息中,提取与预设的性早熟分类参数对应的分类参数值;
对所述影像信息进行特征提取处理,得到影像特征;
利用所述分类参数值和所述影像特征,对所述性早熟分类模型进行训练。
上述对性早熟分类模型进行训练的方法、装置、计算机设备和存储介质,服务器在获取到用于表征性早熟类别的文本信息和影像信息后,从文本信息中提取与预设的性早熟分类参数对应的分类参数值,对影像信息进行特征提取处理,得到影像特征,利用分类参数值和影像特征,对性早熟分类模型进行训练,增加性早熟分类模型的训练数据的数据维度,提高性早熟分类模型的分类性能。
附图说明
图1为一个实施例中计算机设备的内部结构图;
图2为一个实施例中对性早熟分类模型进行训练的方法的流程示意图;
图3为一个实施例中对性早熟分类模型进行训练的步骤的流程示意图;
图4为一个实施例中对性早熟分类模型进行训练的装置的结构框图。
具体实施方式
为了使本申请的目的、技术方案及优点更加清楚明白,以下结合附图及实施例,对本申请进行进一步详细说明。应当理解,此处描述的具体实施例仅用以解释本申请,并不用于限定本申请。
在本申请中提及“实施例”意味着,结合实施例描述的特定特征、结构或特性可以包含在本申请的至少一个实施例中。在说明书中的各个位置出现该短语并不一定均是指相同的实施例,也不是与其它实施例互斥的独立的或备选的实施例。本领域技术人员显式地和隐式地理解的是,本申请所描述的实施例可以与其它实施例相结合。
本申请提供的对性早熟分类模型进行训练的方法,可以应用于如图1所示的服务器中,服务器的内部结构图可以如图1所示。该计算机设备包括通过***总线连接的处理器、存储器和网络接口。其中,该计算机设备的处理器用于提供计算和控制能力。该计算机设备的存储器包括非易失性存储介质、内存储器。该非易失性存储介质存储有操作***、计算机程序和数据库。该内存储器为非易失性存储介质中的操作***和计算机程序的运行提供环境。该计算机设备的数据库用于存储对性早熟分类模型进行训练的数据。该计算机设备的网络接口用于与外部的终端通过网络连接通信。该计算机程序被处理器执行时以实现一种对性早熟分类模型进行训练的方法。
其中,服务器可以用独立的服务器或者是多个服务器组成的服务器集群来实现。
本领域技术人员可以理解,图1中示出的结构,仅仅是与本申请方案相关的部分结构的框图,并不构成对本申请方案所应用于其上的计算机设备的限定,具体的计算机设备可以包括比图中所示更多或更少的部件,或者组合某些部件,或者具有不同的部件布置。
在一个实施例中,如图2所示,提供了一种对性早熟分类模型进行训练的方法,以该方法应用于图1中的服务器为例进行说明,包括以下步骤:
步骤S202,获取用于表征性早熟类别的文本信息和影像信息。
其中,性早熟类别可以包括中枢性性早熟和非中枢性性早熟;文本信息和影像信息均可以反映生长发育情况,进而表征性早熟类别。进一步地,文本信息可以包括从病历中获取的参数(可以以中文字符、英文字符等形式表征,如“骨龄”、“bone age”)和对应的参数值(可以以数值形式表征,如“8”)等信息;服务器可以对文本信息进行结构化处理,得到结构化的文本信息;其中,结构化的文本信息可以理解为是结构化数据,相当于按照预设的格式排布的文本信息;根据预设的格式,可以从结构化处理后的文本信息中提取参数和对应的参数值。例如,文本信息为“Alice的骨龄为8周岁,单侧卵巢容积为3mL”,那么可以利用自然语言处理技术,对文本信息进行结构化处理,从结构化处理后的文本信息中提取出与性早熟类别有关的信息(如“骨龄”、“8”、“单侧卵巢容积”和“3”)。影像信息可以与图片、视频等影像形式对应,由于影像是以像素值形式表征(进一步可以是由像素值构成的矩阵),无法进行文本结构化处理,因此,可以将影像信息作为非结构化数据;服务器可以对非结构化的影像信息进行图像的特征提取处理,得到对应的影像特征,例如,原有的影像信息是以256*256的像素值矩阵形式表征,服务器根据影像所属类别或影像报告结论,可以对该像素值矩阵进行特征提取处理,得到64*64的特征矩阵,该特征矩阵携带有影像特征。进一步地,影像信息可以和骨龄X光片和/或盆腔超声图像对应。
具体地,服务器获取文本信息和影像信息的方式可以是:服务器可以向电子病历数据库发送性早熟信息获取指令,电子病历数据库接收到性早熟信息获取指令后,从一个或多个样本的电子病历中,将与性早熟类别有关的文本信息和影像信息发送至服务器;其中,电子病历可以包括以往病史信息、骨龄X光片和盆腔超声图像,以往病史信息为文本信息,骨龄X光片和盆腔超声图像为影像信息。在一个实施方式中,服务器还可以获取以数据表形式表征的结构化数据,如激素检验值;具体地,电子病历数据库可以从电子病历中提取激素检验值,并将激素检验值发送至服务器。
步骤S204,从文本信息中,提取与预设的性早熟分类参数对应的分类参数值。
性早熟分类参数可以为与性早熟类别有关的参数,可以包括发育等级(如***和***发育Tanner分期等级I~V期等)、骨龄、生殖器官尺寸(如单侧卵巢容积)中一个或多个,分类参数值可以为性早熟分类参数对应的数值,例如在步骤S202的介绍中,与骨龄对应的分类参数值为“8”、与单侧卵巢容积对应的参数值为“3”。
在本步骤中,服务器在获取到文本信息后,可以从文本信息中提取与性早熟分类参数对应的分类参数值,其中,服务器可以利用自然语言处理技术,对文本信息进行结构化处理,从结构化处理后的文本信息中提取分类参数值。
步骤S206,对影像信息进行特征提取处理,得到影像特征。
由于影像信息为与图片、视频等影像形式对应的信息,服务器在获取影像信息后,可以对与图片形式对应的影像信息进行特征提取处理,得到影像特征,其中,影像特征携带有与性早熟类别相关的信息。例如Alice的骨龄X光片中有对应的骨形态(骨形态与性早熟有关),而骨形态与骨龄有关,骨龄与性早熟类别有关,因此,对与骨龄X光片对应的影像信息进行特征提取处理后,得到的骨形态特征(属于影像特征中的一种)与性早熟类别相关。其中,如果影像信息是以视频形式对应的信息,那么可以先从视频中提取对应的帧图像,对帧图像进行特征提取处理。
步骤S208,利用分类参数值和影像特征,对性早熟分类模型进行训练。
服务器在对文本信息和影像信息进行处理后,得到对应的分类参数值和影像特征,将得到的分类参数和影像特征作为训练数据,对性早熟分类模型进行训练。性早熟分类模型可以是XGBoost分类器、AdaBoost分类器、GBDT分类器(Gradient BoostingDecisionTree,迭代决策树分类器)等。
在一个实施例中,为进一步提高性早熟分类模型的分类性能,性早熟分类模型可以为XGBoost分类器,服务器在得到对应的分类参数值和影像特征后,将得到的分类参数值和影像特征作为训练数据,输入至XGBoost分类器中,按照十折交叉验证的方式对XGBoost分类器进行训练。
在另一个实施例中,为进一步提高性早熟分类模型的分类准确性,可以根据多个样本的分类参数值和影像特征对性早熟分类模型进行训练,具体地:服务器收集多个样本的文本信息和影像信息,并分别从文本信息和影像信息中提取对应的分类参数值和影像特征,然后将同一个样本的分类参数值和影像特征进行关联,相当于归入同一个组别;然后服务器将关联后的分类参数值和影像特征(即同个组别的分类参数值和影像特征)作为训练数据输入至XGBoost分类器中,按照十折交叉验证的方式对XGBoost分类器进行训练。
上述对性早熟分类模型进行训练的方法中,服务器在获取到用于表征性早熟类别的文本信息和影像信息后,从文本信息中提取与预设的性早熟分类参数对应的分类参数值,对影像信息进行特征提取处理,得到影像特征,利用分类参数值和影像特征,对性早熟分类模型进行训练,增加性早熟分类模型的训练数据的数据维度,提高性早熟分类模型的分类性能;并且如果文本信息和影像信息之间变量个数的差距过大,例如如文本信息的变量个数只有30个(骨龄、生殖器官尺寸等),影像信息的变量个数为成千上万个(由于不同患者的影像信息均有所不同,且影像信息是以像素值表征,那么每一个的像素值就相当于一个变量,即影像信息包括的变量个数可能为成千上万个),此时直接将文本信息和影像信息输入至性早熟分类模型中进行训练,会导致影像信息掩盖文本信息,出现性早熟分类模型过度拟合的情况,降低分类的准确性;因此,在本申请提出的对性早熟分类模型进行训练的方法中,先对影像信息进行特征提取处理,利用得到的影像特征对性早熟分类模型进行训练,得到的影像特征的变量个数比特征提取处理之前的影像信息的变量个数较少,可以避免因数据变量个数的差距过大,导致性早熟分类模型过度拟合的情况,提高对性早熟分类模型进行分类的准确性。
在一个实施例中,为了提高对性早熟分类模型的训练速度,可以将影像信息输入至预先训练完成的卷积神经网络中;具体地,服务器在获取到影像信息后,将影像信息输入至预先训练完成的卷积神经网络中,卷积神经网络根据预先训练的参数从影像信息中提取与骨龄(或性早熟类别)有关的骨形态特征。
为了进一步保证性早熟分类模型的分类性能,可以基于DenseNet模型构建卷积神经网络,并利用影像训练样本对卷积神经网络进行训练,其中,影像训练样本可以从影像数据库中获得,可以包括骨龄X光片、盆腔超声图像等;具体地,服务器在获取到影像训练样本后,将影像训练样本输入至基于DenseNet模型构建的卷积神经网络中,根据影像训练样本,对卷积神经网络进行训练,得到训练完成的卷积神经网络模型,将训练完成的卷积神经网络模型作为影像特征提取模型。
在一些场景中,性早熟分类模型在完成分类后,仅仅是输出性早熟的分类结果,而影响性早熟分类模型输出该分类结果的原因是不可知的;因此,为进一步使得性早熟分类模型输出的分类结果的原因具有可知性、可解释性,服务器在得到性早熟分类模型输出的分类结果后,还可以对性早熟分类模型输出的分类结果进行原因分析处理(对性早熟分类模型输出分类结果的原因进行分析),进而得到对应的分类原因信息,并将分类原因信息和分类结果发送至目标终端(如与电子病历***对应的终端设备),目标终端输出接收到的分类原因信息和分类结果,其输出方式可以是在屏幕上显示,或语音播放等。其中,服务器可以利用LIME(Local Interpretable Model-agnostic Explanations)模型对性早熟分类模型输出的分类结果进行原因分析处理。
为了更好地理解上述方法,结合图3,详细阐述一个本申请对性早熟分类模型进行训练的方法的应用实例:
步骤S302、文本信息和影像信息的获取:从电子病历***的数据库(相当于电子病历数据库)获取文本信息(如以往病史信息)、激素检验值、骨龄X光片和盆腔超声图像,并发送至服务器。
步骤S304、文本信息和影像信息的处理:
利用自然语言技术对文本信息进行处理,使文本信息结构化,从结构化的文本信息中,提取分类参数值,其中分类参数值分别与***的发育等级、骨龄、生殖器官尺寸对应;利用影像训练样本对基于DenseNet模型构建的卷积神经网络进行训练,将与骨龄X光片对应的影像信息输入至已训练的卷积神经网络中,控制卷积神经网络对影像信息进行特征提取处理,得到与骨龄X光片对应的骨形态特征。其中,DenseNet模型的核心是建立前面所有层与后面层的密集连接,连接方式为每一层都与前面所层在通道维度上连接,整体作为下一层的输入,以实现特征重用,可以提高卷积神经网络提取影像特征的效率。
步骤S306、性早熟分类模型的构建:将同一个样本的分类参数值和骨形态特征归入同一个组别中,按照性早熟分类的标准,对各个组别进行类别标注(即中枢性性早熟类别和非中枢性性早熟类别的标注),将标注后的各个组别中的分类参数值和骨形态特征输入至XGBoost分类器中,使用20次的十折交叉验证的方式对XGBoost分类器进行训练,得到训练完成的XGBoost分类器(即性早熟分类模型)。其中,XGBoost分类器中的算法是集成算法的一种提升树模型,将许多CART回归树模型集成在一起,形成一个强分类器;XGBoost分类器在目标函数中增加了正则项,用于控制模型的复杂度;其中正则项里包含树的叶子节点个数,加入正则项的目标函数,减低性早熟分类模型的方差,使得性早熟分类模型的分类结果更稳定,可防止过拟合;并且XGBoost分类器支持计算的并行处理,减小计算量,提升性早熟分类模型的分类速度。
步骤S308、对分类结果进行原因分析处理:服务器利用LIME模型,对性早熟分类模型输出的分类结果进行原因分析处理,得到分类原因信息,使性早熟分类模型输出的分类结果的原因可解释(可以理解为重要的特征导致性早熟分类模型输出对应的分类结果)。
步骤S310、分类结果和分类原因信息的传输:服务器将分类结果和分类原因信息发送至目标终端进行显示输出,并发送至回传至电子病历***的数据库进行存储。
在传统技术中,可以利用分类决策树、BP神经网络技术,基于性早熟患儿盆腔超声报告信息,构建女童中枢性性早熟分类模型,但该类模型仅仅利用了性早熟患儿一个来源/维度的数据,且使用的样本量有限,结果的可靠性仍待验证。
而本申请结合以往病史信息、体格检查数据、性激素值、生长激素值、骨龄X光片、盆腔超声图像等多个来源/维度的数据,解决了单一维度的数据不能充分涵盖患者的发育进展信息,导致性早熟分类模型分类性能不高的技术问题;实现多维度的数据融合,针对不同维度的数据进行对应的处理,可以提升训练速度和性早熟分类模型的分类性能。
应该理解的是,上述实施例虽然涉及“单侧卵巢容积”等女性器官的性早熟分类参数,但这不应理解为对性早熟分类模型进行训练的数据来源(如文本信息和影像信息)仅与女性有关,本领域技术人员可以根据实际情况选取数据来源。虽然图2至3的流程图中的各个步骤按照箭头的指示依次显示,但是这些步骤并不是必然按照箭头指示的顺序依次执行。除非本文中有明确的说明,这些步骤的执行并没有严格的顺序限制,这些步骤可以以其它的顺序执行。而且,图2至3中的至少一部分步骤可以包括多个步骤或者多个阶段,这些步骤或者阶段并不必然是在同一时刻执行完成,而是可以在不同的时刻执行,这些步骤或者阶段的执行顺序也不必然是依次进行,而是可以与其它步骤或者其它步骤中的步骤或者阶段的至少一部分轮流或者交替地执行。
在一个实施例中,如图4所示,提供了一种对性早熟分类模型进行训练的装置400,包括:信息获取模块402、分类参数值提取模块404、影像特征提取模块406和模型训练模块408,其中:
信息获取模块402,用于获取用于表征性早熟类别的文本信息和影像信息;
分类参数值提取模块404,用于从文本信息中,提取与预设的性早熟分类参数对应的分类参数值;
影像特征提取模块406,用于对影像信息进行特征提取处理,得到影像特征;
模型训练模块408,用于利用分类参数值和影像特征,对性早熟分类模型进行训练。
在一个实施例中,影像特征提取模块406,还用于将影像信息输入至预先训练的卷积神经网络中,控制卷积神经网络从影像信息中提取骨形态特征,将骨形态特征作为影像特征;骨形态特征为与骨龄有关的影像特征。
在一个实施例中,影像特征提取模块406,还用于获取影像训练样本,将影像训练样本输入至基于DenseNet模型构建的卷积神经网络中,控制卷积神经网络根据影像训练样本完成训练。
在一个实施例中,性早熟分类参数包括***的发育等级、骨龄、生殖器官尺寸中的至少一项。
在一个实施例中,分类参数值和影像特征均为多个;模型训练模块408,还用于将同一个样本的分类参数值和影像特征归入同一组别;根据各个组别的分类参数值和影像特征,对性早熟分类模型进行训练。
在一个实施例中,性早熟分类模型为XGBoost分类器;模型训练模块408,还用于将各个组别的分类参数值和影像特征输入至XGBoost分类器中,按照十折交叉验证的方式控制XGBoost分类器进行训练。
在一个实施例中,对性早熟分类模型进行训练的装置400,还包括:原因分析模块和分类结果发送模块;其中,原因分析模块,用于对性早熟分类模型输出的分类结果进行原因分析处理,得到对应的分类原因信息;分类结果发送模块,用于将分类原因信息和分类结果发送至目标终端,以使目标终端输出分类原因信息和分类结果。
关于对性早熟分类模型进行训练的装置的具体限定可以参见上文中对于对性早熟分类模型进行训练的方法的限定,在此不再赘述。上述对性早熟分类模型进行训练的装置中的各个模块可全部或部分通过软件、硬件及其组合来实现。上述各模块可以硬件形式内嵌于或独立于计算机设备中的处理器中,也可以以软件形式存储于计算机设备中的存储器中,以便于处理器调用执行以上各个模块对应的操作。
在一个实施例中,提供了一种计算机设备,包括存储器和处理器,存储器中存储有计算机程序,该处理器执行计算机程序时实现以下步骤:
获取用于表征性早熟类别的文本信息和影像信息;
从文本信息中,提取与预设的性早熟分类参数对应的分类参数值;
对影像信息进行特征提取处理,得到影像特征;
利用分类参数值和影像特征,对性早熟分类模型进行训练。
在一个实施例中,处理器执行计算机程序时还实现以下步骤:
将影像信息输入至预先训练的卷积神经网络中,控制卷积神经网络从影像信息中提取骨形态特征,将骨形态特征作为影像特征;骨形态特征为与骨龄有关的影像特征。
在一个实施例中,处理器执行计算机程序时还实现以下步骤:
获取影像训练样本,将影像训练样本输入至基于DenseNet模型构建的卷积神经网络中,控制卷积神经网络根据影像训练样本完成训练。
在一个实施例中,分类参数值和影像特征均为多个;
处理器执行计算机程序时还实现以下步骤:
将同一个样本的分类参数值和影像特征归入同一组别;
根据各个组别的分类参数值和影像特征,对性早熟分类模型进行训练
在一个实施例中,性早熟分类模型为XGBoost分类器;
处理器执行计算机程序时还实现以下步骤:
将各个组别的分类参数值和影像特征输入至XGBoost分类器中,按照十折交叉验证的方式控制XGBoost分类器进行训练。
在一个实施例中,处理器执行计算机程序时还实现以下步骤:
对性早熟分类模型输出的分类结果进行原因分析处理,得到对应的分类原因信息;
将分类原因信息和分类结果发送至目标终端,以使目标终端输出分类原因信息和分类结果。
在一个实施例中,性早熟分类参数包括***的发育等级、骨龄、生殖器官尺寸中的至少一项。
需要说明的是,上述计算机设备中的处理器执行的步骤与本申请对性早熟分类模型进行训练的方法一一对应,上述对性早熟分类模型进行训练的方法实施例中阐述的内容及其对应的技术效果均适用于计算机设备的实施例中,在此不再赘述。
在一个实施例中,提供了一种计算机可读存储介质,其上存储有计算机程序,计算机程序被处理器执行时实现以下步骤:
获取用于表征性早熟类别的文本信息和影像信息;
从文本信息中,提取与预设的性早熟分类参数对应的分类参数值;
对影像信息进行特征提取处理,得到影像特征;
利用分类参数值和影像特征,对性早熟分类模型进行训练。
在一个实施例中,处理器执行计算机程序时还实现以下步骤:
将影像信息输入至预先训练的卷积神经网络中,控制卷积神经网络从影像信息中提取骨形态特征,将骨形态特征作为影像特征;骨形态特征为与骨龄有关的影像特征。
在一个实施例中,处理器执行计算机程序时还实现以下步骤:
获取影像训练样本,将影像训练样本输入至基于DenseNet模型构建的卷积神经网络中,控制卷积神经网络根据影像训练样本完成训练。
在一个实施例中,分类参数值和影像特征均为多个;
处理器执行计算机程序时还实现以下步骤:
将同一个样本的分类参数值和影像特征归入同一组别;
根据各个组别的分类参数值和影像特征,对性早熟分类模型进行训练
在一个实施例中,性早熟分类模型为XGBoost分类器;
处理器执行计算机程序时还实现以下步骤:
将各个组别的分类参数值和影像特征输入至XGBoost分类器中,按照十折交叉验证的方式控制XGBoost分类器进行训练。
在一个实施例中,处理器执行计算机程序时还实现以下步骤:
对性早熟分类模型输出的分类结果进行原因分析处理,得到对应的分类原因信息;
将分类原因信息和分类结果发送至目标终端,以使目标终端输出分类原因信息和分类结果。
在一个实施例中,性早熟分类参数包括***的发育等级、骨龄、生殖器官尺寸中的至少一项。
需要说明的是,上述计算机设备中的处理器执行的步骤与本申请对性早熟分类模型进行训练的方法一一对应,上述对性早熟分类模型进行训练的方法实施例中阐述的内容及其对应的技术效果均适用于计算机设备的实施例中,在此不再赘述。
本领域普通技术人员可以理解实现上述实施例方法中的全部或部分流程,是可以通过计算机程序来指令相关的硬件来完成,其中,计算机程序可存储于一个非易失性计算机可读取存储介质中,该计算机程序在执行时,可包括如上述各方法的实施例的流程。其中,本申请所提供的各实施例中所使用的对存储器、存储、数据库或其它介质的任何引用,均可包括非易失性和易失性存储器中的至少一种。非易失性存储器可包括只读存储器(Read-Only Memory,ROM)、磁带、软盘、闪存或光存储器等。易失性存储器可包括随机存取存储器(Random Access Memory,RAM)或外部高速缓冲存储器。作为说明而非局限,RAM可以是多种形式,比如静态随机存取存储器(Static Random Access Memory,SRAM)或动态随机存取存储器(Dynamic Random Access Memory,DRAM)等。
以上实施例的各技术特征可以进行任意的组合,为使描述简洁,未对上述实施例中的各个技术特征所有可能的组合都进行描述,然而,只要这些技术特征的组合不存在矛盾,都应当认为是本说明书记载的范围。
以上实施例仅表达了本申请的几种实施方式,其描述较为具体和详细,但并不能因此而理解为对发明专利范围的限制。应当指出的是,对于本领域的普通技术人员来说,在不脱离本申请构思的前提下,还可以做出若干变形和改进,这些都属于本申请的保护范围。因此,本申请专利的保护范围应以所附权利要求为准。
Claims (10)
1.一种对性早熟分类模型进行训练的方法,包括:
获取用于表征性早熟类别的文本信息和影像信息;
从所述文本信息中,提取与预设的性早熟分类参数对应的分类参数值;
对所述影像信息进行特征提取处理,得到影像特征;
利用所述分类参数值和所述影像特征,对所述性早熟分类模型进行训练。
2.根据权利要求1所述的方法,其特征在于,所述对所述影像信息进行特征提取处理,得到影像特征的步骤,包括:
将所述影像信息输入至预先训练的卷积神经网络中,控制所述卷积神经网络从所述影像信息中提取骨形态特征,将所述骨形态特征作为所述影像特征;所述骨形态特征为与骨龄有关的影像特征。
3.根据权利要求2所述的方法,其特征在于,在所述将所述影像信息输入至预先训练的卷积神经网络中的步骤之前,还包括:
获取影像训练样本,将所述影像训练样本输入至基于DenseNet模型构建的卷积神经网络中,控制所述卷积神经网络根据所述影像训练样本完成训练。
4.根据权利要求1所述的方法,其特征在于,所述性早熟分类参数包括***的发育等级、骨龄、生殖器官尺寸中的至少一项。
5.根据权利要求1至4任意一项所述的方法,其特征在于,所述分类参数值和所述影像特征均为多个;
所述利用所述分类参数值和所述影像特征,对所述性早熟分类模型进行训练的步骤,包括:
将同一个样本的分类参数值和影像特征归入同一组别;
根据各个组别的分类参数值和影像特征,对所述性早熟分类模型进行训练。
6.根据权利要求5所述的方法,其特征在于,所述性早熟分类模型为XGBoost分类器;
所述根据各个组别的分类参数值和影像特征,对所述性早熟分类模型进行训练的步骤,包括:
将各个组别的分类参数值和影像特征输入至所述XGBoost分类器中,按照十折交叉验证的方式控制所述XGBoost分类器进行训练。
7.根据权利要求1、2、3、4或6所述的方法,其特征在于,所述方法,还包括:
对所述性早熟分类模型输出的分类结果进行原因分析处理,得到对应的分类原因信息;
将所述分类原因信息和所述分类结果发送至目标终端,以使所述目标终端输出所述分类原因信息和所述分类结果。
8.一种对性早熟分类模型进行训练的装置,包括:
信息获取模块,用于获取用于表征性早熟类别的文本信息和影像信息;
分类参数值提取模块,用于从所述文本信息中,提取与预设的性早熟分类参数对应的分类参数值;
影像特征提取模块,用于对所述影像信息进行特征提取处理,得到影像特征;
模型训练模块,用于利用所述分类参数值和所述影像特征,对所述性早熟分类模型进行训练。
9.一种计算机设备,包括存储器和处理器,所述存储器存储有计算机程序,其特征在于,所述处理器执行所述计算机程序时实现权利要求1至7中任一项所述方法的步骤。
10.一种计算机可读存储介质,其上存储有计算机程序,其特征在于,所述计算机程序被处理器执行时实现权利要求1至7中任一项所述的方法的步骤。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202010344479.6A CN111553412A (zh) | 2020-04-27 | 2020-04-27 | 对性早熟分类模型进行训练的方法、装置和设备 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202010344479.6A CN111553412A (zh) | 2020-04-27 | 2020-04-27 | 对性早熟分类模型进行训练的方法、装置和设备 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN111553412A true CN111553412A (zh) | 2020-08-18 |
Family
ID=72004104
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202010344479.6A Pending CN111553412A (zh) | 2020-04-27 | 2020-04-27 | 对性早熟分类模型进行训练的方法、装置和设备 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN111553412A (zh) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN113256579A (zh) * | 2021-05-19 | 2021-08-13 | 扬州大学 | 基于预训练模型的肺结核识别*** |
Citations (11)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN1839391A (zh) * | 2003-06-25 | 2006-09-27 | 美国西门子医疗解决公司 | 用于***成像的自动诊断和决策支持的***和方法 |
US20140030253A1 (en) * | 2012-07-27 | 2014-01-30 | Vancouver Biotech Ltd. | HUMANIZED FORMS OF MONOCLONAL ANTIBODIES TO HUMAN GnRH RECEPTOR |
CN104699928A (zh) * | 2013-12-09 | 2015-06-10 | 奥美之路(北京)技术顾问有限公司 | 3-15岁体质发育评估模型 |
CN107595248A (zh) * | 2017-08-31 | 2018-01-19 | 郭淳 | 一种检测和评价儿童生长发育状况的方法和*** |
CN108056786A (zh) * | 2017-12-08 | 2018-05-22 | 浙江大学医学院附属儿童医院 | 一种基于深度学习的骨龄检测方法和装置 |
CN109146879A (zh) * | 2018-09-30 | 2019-01-04 | 杭州依图医疗技术有限公司 | 一种检测骨龄的方法及装置 |
CN109243618A (zh) * | 2018-09-12 | 2019-01-18 | 腾讯科技(深圳)有限公司 | 医学模型的构建方法、疾病标签构建方法及智能设备 |
CN109544518A (zh) * | 2018-11-07 | 2019-03-29 | 中国科学院深圳先进技术研究院 | 一种应用于骨骼成熟度评估的方法及其*** |
CN110265119A (zh) * | 2018-05-29 | 2019-09-20 | 中国医药大学附设医院 | 骨龄评估与身高预测模型、其***及其预测方法 |
CN110275880A (zh) * | 2019-05-21 | 2019-09-24 | 阿里巴巴集团控股有限公司 | 数据分析方法、装置、服务器及可读存储介质 |
CN110555846A (zh) * | 2019-10-13 | 2019-12-10 | 浙江德尚韵兴医疗科技有限公司 | 基于卷积神经网络的全自动骨龄评定方法 |
-
2020
- 2020-04-27 CN CN202010344479.6A patent/CN111553412A/zh active Pending
Patent Citations (11)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN1839391A (zh) * | 2003-06-25 | 2006-09-27 | 美国西门子医疗解决公司 | 用于***成像的自动诊断和决策支持的***和方法 |
US20140030253A1 (en) * | 2012-07-27 | 2014-01-30 | Vancouver Biotech Ltd. | HUMANIZED FORMS OF MONOCLONAL ANTIBODIES TO HUMAN GnRH RECEPTOR |
CN104699928A (zh) * | 2013-12-09 | 2015-06-10 | 奥美之路(北京)技术顾问有限公司 | 3-15岁体质发育评估模型 |
CN107595248A (zh) * | 2017-08-31 | 2018-01-19 | 郭淳 | 一种检测和评价儿童生长发育状况的方法和*** |
CN108056786A (zh) * | 2017-12-08 | 2018-05-22 | 浙江大学医学院附属儿童医院 | 一种基于深度学习的骨龄检测方法和装置 |
CN110265119A (zh) * | 2018-05-29 | 2019-09-20 | 中国医药大学附设医院 | 骨龄评估与身高预测模型、其***及其预测方法 |
CN109243618A (zh) * | 2018-09-12 | 2019-01-18 | 腾讯科技(深圳)有限公司 | 医学模型的构建方法、疾病标签构建方法及智能设备 |
CN109146879A (zh) * | 2018-09-30 | 2019-01-04 | 杭州依图医疗技术有限公司 | 一种检测骨龄的方法及装置 |
CN109544518A (zh) * | 2018-11-07 | 2019-03-29 | 中国科学院深圳先进技术研究院 | 一种应用于骨骼成熟度评估的方法及其*** |
CN110275880A (zh) * | 2019-05-21 | 2019-09-24 | 阿里巴巴集团控股有限公司 | 数据分析方法、装置、服务器及可读存储介质 |
CN110555846A (zh) * | 2019-10-13 | 2019-12-10 | 浙江德尚韵兴医疗科技有限公司 | 基于卷积神经网络的全自动骨龄评定方法 |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN113256579A (zh) * | 2021-05-19 | 2021-08-13 | 扬州大学 | 基于预训练模型的肺结核识别*** |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN112101190B (zh) | 一种遥感图像分类方法、存储介质及计算设备 | |
CN109344908B (zh) | 用于生成模型的方法和装置 | |
EP3913542A2 (en) | Method and apparatus of training model, device, medium, and program product | |
WO2022022154A1 (zh) | 脸部图像处理方法、装置、设备及存储介质 | |
CN112395979B (zh) | 基于图像的健康状态识别方法、装置、设备及存储介质 | |
CN110188829B (zh) | 神经网络的训练方法、目标识别的方法及相关产品 | |
CN112418292B (zh) | 一种图像质量评价的方法、装置、计算机设备及存储介质 | |
US20220101121A1 (en) | Latent-variable generative model with a noise contrastive prior | |
US11314970B1 (en) | Reinforcement learning techniques for automated video summarization | |
CN113821668A (zh) | 数据分类识别方法、装置、设备及可读存储介质 | |
CN112786160A (zh) | 基于图神经网络的多图片输入的多标签胃镜图片分类方法 | |
US20220101122A1 (en) | Energy-based variational autoencoders | |
CN111553412A (zh) | 对性早熟分类模型进行训练的方法、装置和设备 | |
CN111445545B (zh) | 一种文本转贴图方法、装置、存储介质及电子设备 | |
CN112000803B (zh) | 文本分类方法及装置、电子设备及计算机可读存储介质 | |
CN115525740A (zh) | 对话应答语句的生成方法、装置、电子设备及存储介质 | |
WO2024098763A1 (zh) | 文本操作图互检方法及模型训练方法、装置、设备、介质 | |
CN112464924A (zh) | 一种构建训练集的方法及装置 | |
TWI803243B (zh) | 圖像擴增方法、電腦設備及儲存介質 | |
CN115690276A (zh) | 虚拟形象的视频生成方法、装置、计算机设备和存储介质 | |
US20220101145A1 (en) | Training energy-based variational autoencoders | |
CN116129158A (zh) | 一种输电线路铁塔小部件图像识别方法及装置 | |
CN115115552A (zh) | 图像矫正模型训练及图像矫正方法、装置和计算机设备 | |
CN114283301A (zh) | 一种基于Transformer的自适应医学影像分类方法及*** | |
CN114708467B (zh) | 基于知识蒸馏的不良场景识别方法及***及设备 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
RJ01 | Rejection of invention patent application after publication |
Application publication date: 20200818 |
|
RJ01 | Rejection of invention patent application after publication |