CN111414946A

CN111414946A - 基于人工智能的医疗影像的噪声数据识别方法和相关装置

Info

Publication number: CN111414946A
Application number: CN202010170514.7A
Authority: CN
Inventors: 陈豪; 尚鸿; 孙钟前
Original assignee: Tencent Technology Shenzhen Co Ltd
Current assignee: Tencent Technology Shenzhen Co Ltd
Priority date: 2020-03-12
Filing date: 2020-03-12
Publication date: 2020-07-14
Anticipated expiration: 2040-03-12
Also published as: CN111414946B

Abstract

本申请实施例公开了基于人工智能的医疗影像的噪声数据识别方法和相关装置，针对具有标签的医疗影像，若需要识别其中是否具有噪声数据，可以将该医疗影像作为待识别标签数据，并通过第一识别模型对其进行识别。由于第一识别模型具备较好的抗噪能力，根据该第一识别模型得到的识别结果，其体现的置信度可以有效表达出待识别标签数据属于噪声数据的可能性，以此从具有标签的医疗影像中有效的筛选出标签标注错误的医疗影像，提高了噪声数据的确定准确性。

Description

基于人工智能的医疗影像的噪声数据识别方法和相关装置

技术领域

本申请涉及数据处理领域，特别是涉及基于人工智能的医疗影像的噪声数据识别方法和相关装置。

背景技术

在网络模型训练时，标签数据可以作为训练样本对网络模型进行监督训练或半监督训练。标签数据可以理解为携带有标签的数据，该标签用于标识数据中所体现、涉及的指定内容，例如关于医疗影像中病灶区域识别的标签数据中，医疗影像的标签可以体现出该医疗影像中是否具有病灶区域，或者病灶区域的病灶类型等。

然而，并不是所有数据的标签都是准确的，若一个标签数据的标签实际上并不正确，即标签所标识的内容并未体现在该数据中，或该数据并未涉及标签所标识的内容，那么这个标签数据属于噪声数据。若使用噪声数据对网络模型进行训练，会导致网络模型对噪声过拟合，最终得到效果不好的模型。例如在医疗影像领域，由于病灶识别的复杂性，即使是专家也不能给出准确的标注信息。

相关技术中，一般通过统计学方式筛查噪声数据，例如将噪声数据作为统计的异常值，通过使用异常值检测的方法从大量标签数据中筛查出噪声数据。然而，很多噪声数据并不属于统计规则下的异常值，例如一张通过标签标识了具有病灶的医疗影像，其上虽然没有示出病灶，但示出了对病灶区域手术之后形成的伤口，该标签数据理应属于噪声数据，但是从统计学角度并不能将其确定为异常值。

由此可见，相关技术中对医疗影像的噪声数据筛查方式准确性并不高，难以满足目前的噪声数据识别需求。

发明内容

为了解决上述技术问题，本申请提供了基于人工智能的医疗影像的噪声数据识别方法和相关装置，提高了噪声数据的确定准确性。

本申请实施例公开了如下技术方案：

一方面，本申请实施例提供了一种医疗影像的噪声数据识别方法，所述方法包括：

根据第一识别模型确定待识别标签数据的识别结果；所述第一识别模型是通过对初始网络模型进行N轮训练得到的，N小于完成对所述初始网络模型完整训练所需的总轮数M，所述第一识别模型的模型参数尚未收敛；

根据所述识别结果所体现的置信度，确定所述待识别标签数据是否为噪声数据。

另一方面，本申请实施例提供了一种医疗影像的噪声数据识别装置，所述装置包括第一确定单元和第二确定单元：

所述第一确定单元，用于根据第一识别模型确定待识别标签数据的识别结果；所述第一识别模型是通过对初始网络模型进行N轮训练得到的，N小于完成对所述初始网络模型完整训练所需的总轮数M，所述第一识别模型的模型参数尚未收敛；

所述第二确定单元，用于根据所述识别结果所体现的置信度，确定所述待识别标签数据是否为噪声数据。

另一方面，本申请实施例提供了一种用于医疗影像的噪声数据识别设备，所述设备包括处理器以及存储器：

所述存储器用于存储程序代码，并将所述程序代码传输给所述处理器；

所述处理器用于根据所述程序代码中的指令执行上述方面所述的方法。

另一方面，本申请实施例提供了一种计算机可读存储介质，所述计算机可读存储介质用于存储计算机程序，所述计算机程序用于执行上述方面所述的方法。

由上述技术方案可以看出，针对具有标签的医疗影像，若需要识别其中是否具有噪声数据，可以将该医疗影像作为待识别标签数据，并通过特定的第一识别模型对其进行识别。该第一识别模型是通过初始网络模型进行N轮训练得到的，由于N小于完成对所述初始网络模型完整训练所需的总轮数M，故训练得到的第一识别模型中的模型参数尚未收敛，属于刚完成初期训练，此时的第一识别模型通过训练学习到的是训练样本中大部分类似数据的共通特征，而由于作为训练样本的医疗影像中非噪声数据即具有正确标签的占比较大，那么第一识别模型学习到的主要是这类标签数据的共通特征，尚未过拟合噪声数据，从而具备较好的抗噪能力。由于第一识别模型本身的这种抗噪能力，根据这种第一识别模型得到的识别结果，其体现的置信度可以有效表达出待识别标签数据属于噪声数据的可能性，可以以此从具有标签的医疗影像中有效的筛选出标签标注错误的医疗影像，提高了噪声数据的确定准确性。

附图说明

为了更清楚地说明本申请实施例或现有技术中的技术方案，下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍，显而易见地，下面描述中的附图仅仅是本申请的一些实施例，对于本领域普通技术人员来讲，在不付出创造性劳动性的前提下，还可以根据这些附图获得其他的附图。

图1为本申请实施例提供的一种医疗影像的噪声数据识别方法的应用场景示意图；

图2为本申请实施例提供的一种医疗影像的噪声数据识别方法的流程示意图；

图3为本申请实施例提供的另一种医疗影像的噪声数据识别方法的流程示意图；

图4为本申请实施例提供的一种医疗影像的噪声数据识别装置的结构示意图；

图5为本申请实施例提供的服务器的结构示意图；

图6为本申请实施例提供的终端设备的结构示意图。

具体实施方式

下面结合附图，对本申请的实施例进行描述。

为了更有效地筛选出标签标注错误的医疗影像，本申请实施例提供了一种基于人工智能的医疗影像的噪声数据识别方法，该方法利用经过初期训练的第一识别模型对具有标签的医疗影像进行识别，通过该医疗影像对应的识别结果所体现的置信度，确定该医疗影像是否为噪声数据，从而可以有效地筛选出标签标注错误的医疗影像。

本申请实施例提供的医疗影像的噪声数据识别方法是基于人工智能实现的，人工智能(Artificial Intelligence,AI)是利用数字计算机或者数字计算机控制的机器模拟、延伸和扩展人的智能，感知环境、获取知识并使用知识获得最佳结果的理论、方法、技术及应用***。换句话说，人工智能是计算机科学的一个综合技术，它企图了解智能的实质，并生产出一种新的能以人类智能相似的方式做出反应的智能机器。人工智能也就是研究各种智能机器的设计原理与实现方法，使机器具有感知、推理与决策的功能。

人工智能技术是一门综合学科，涉及领域广泛，既有硬件层面的技术也有软件层面的技术。人工智能基础技术一般包括如传感器、专用人工智能芯片、云计算、分布式存储、大数据处理技术、操作/交互***、机电一体化等技术。人工智能软件技术主要包括计算机视觉技术、语音处理技术、自然语言处理技术以及机器学习/深度学习等几大方向。

在本申请实施例中，主要涉及的人工智能软件技术包括上述计算机视觉技术、机器学习/深度学习等方向。

例如可以涉及计算机视觉(Computer Vision)中的图像处理(ImageProcessing)、图像语义理解(Image Semantic Understanding，ISU)、视频处理(videoprocessing)、视频语义理解(video semantic understanding，VSU)、人脸识别(facerecognition)等。

例如可以涉及机器学习(Machine learning，ML)中的深度学习(Deep Learning)，包括各类人工神经网络(Artificial Neural Network,ANN)。

为了便于理解本申请的技术方案，下面结合实际应用场景对本申请实施例提供的医疗影像的噪声数据识别方法进行介绍。

本申请提供的医疗影像的噪声数据识别方法可以应用于具有数据处理能力的医疗影像的噪声数据识别设备，如终端设备、服务器。其中，终端设备具体可以为智能手机、计算机、个人数字助理(Personal Digital Assistant，PDA)、平板电脑等；服务器具体可以为独立服务器，也可以为集群服务器。

该数据处理设备可以具备实施计算机视觉技术的能力，计算机视觉是一门研究如何使机器“看”的科学，更进一步的说，就是指用摄影机和电脑代替人眼对目标进行识别、跟踪和测量等机器视觉，并进一步做图形处理，使电脑处理成为更适合人眼观察或传送给仪器检测的图像。作为一个科学学科，计算机视觉研究相关的理论和技术，试图建立能够从图像或者多维数据中获取信息的人工智能***。计算机视觉技术通常包括图像处理、图像识别、图像语义理解、图像检索、文字识别(Optical Character Recognition,OCR)、视频处理、视频语义理解、视频内容/行为识别、三维物体重建、3D技术、虚拟现实、增强现实、同步定位与地图构建等技术，还包括常见的人脸识别、指纹识别等生物特征识别技术。

在本申请实施例中，数据处理设备可以通过计算机视觉技术对具有标签的医疗影像中的噪声数据进行识别和检测。

该数据处理设备可以具备ML能力。ML是一门多领域交叉学科，涉及概率论、统计学、逼近论、凸分析、算法复杂度理论等多门学科。专门研究计算机怎样模拟或实现人类的学习行为，以获取新的知识或技能，重新组织已有的知识结构使之不断改善自身的性能。机器学习是人工智能的核心，是使计算机具有智能的根本途径，其应用遍及人工智能的各个领域。机器学习和深度学习通常包括人工神经网络等技术。

本申请实施例提供的医疗影像的噪声数据识别方法主要涉及对各类人工神经网络的应用。

下面结合应用场景，以及图1，对本申请实施例提供的医疗影像的噪声数据识别方法进行说明。在图1所示的应用场景中，包括服务器101、扫描仪102和显示屏103。

在应用过程中，扫描仪102可以用于对病理切片进行扫描获取医疗影像，并上传至服务器101中。服务器101可以将获取的医疗影像存储在内部存储器中。医护人员可以通过调取服务器101存储器中的医疗影像，对该医疗影像中包括的病灶区域进行标注，从而获取具有标签的医疗影像作为待识别标签数据。

在服务器101中，部署有第一识别模型，用于识别待识别标签数据中的待识别对象。第一识别模型可以根据应用场景和识别任务设置网络结构。在图1所示的应用场景中，第一识别模型可以是深度卷积神经网络，用于识别具有标签的医疗影像中的病灶区域。

其中，第一识别模型是对初始网络模型经过初期训练之后得到的，即通过对初始网络模型进行N轮训练，N小于完成对初始网络模型完整训练所需的总轮数M，该第一识别模型的模型参数尚未收敛。M标识了对初始网络模型完整训练所需的总轮数，即使得初始网络模型处于收敛态的训练次数。N标识了对初始网络模型进行初期训练得到第一识别模型所采用的轮数。

对于初始网络模型进行初期训练的目的是使初始网络模型针对训练样本集中的大部分类似数据的共通特性进行学习，避免过拟合训练样本集中的噪声数据，获得具备较好的抗噪声能力的第一识别模型，并将第一识别模型用于识别标签数据中的噪声数据。在图1所示的应用场景中，训练样本集可以是多个具有标签的医疗影像，服务器101可以通过处理器，利用该训练样本集对初始网络模型进行初期训练得到第一识别模型，并将该第一识别模型用于确定噪声数据，即识别标签标注错误的医疗影像。

在应用过程中，对初始网络模型进行初期训练所需的轮数N可以量化为模型总训练轮数M的1/10。无论具体的噪声确定任务所涉及的领域或场景，一般来说，N可以取值为5-10左右。当待识别标签数据量较大，且初始网络模型结构较为复杂的情况下，可以将N调整到20。在实际应用中，可以根据具体的应用场景以及噪声确定任务设定和调整N的取值。在图1所示的应用场景中，服务器101可以通过处理器将N设定为10，则利用上述训练样本集中具有标签的医疗影像对初始网络模型训练10轮得到第一识别模型。

需要说明的是，在对初始网络模型进行初期训练获取第一识别模型的过程中，为了使得第一识别模型的获取较好的抗噪声性能，在训练过程中，可以使用较大的学习率对模型进行训练，使得模型学习更为宽泛的内容，即训练样本集中大部分类似数据的共通特性，减少对于训练样本集中细微特征(例如噪声特征)的关注程度，以此避免出现对噪声数据的过拟合，即不会学习到噪声相关的特征，从而实现模型的抗噪性。一般来说，学习率的取值可以为0.01-0.1。在实际应用中，可以根据模型的复杂程度、待识别标签数据量以及噪声确定任务设定和调整学习率的大小。在图1所示的应用场景中，服务器101可以通过处理器将模型学习率设置为0.1，然后对初始网络模型训练10轮后得到第一识别模型，并用于确定噪声数据，即识别标签标注错误的医疗影像。

由于训练样本中非噪声数据即正确的标签数据所占的比重较大，因此，经过初期训练后得到第一识别模型学习到主要是大部分类似数据(正确的标签数据)的共通特征，尚未过拟合噪声数据，具备较好的抗噪能力。

在获取到第一识别模型后，服务器101可以利用该第一识别模型对待识别标签数据进行识别，确定该待识别标签数据的识别结果。其中，待识别标签数据为具有标签的医疗影像。标签用于标识待识别标签数据中是否包括病灶区域或者病灶区域的病灶类型。识别结果用于标识第一识别模型对待识别标签数据中是否包括病灶区域的预测结果。在图1所示的应用场景中，待识别标签数据可以是具有标签的胃部切片图像，其中，该胃部切片图像的标签标识了胃部切片图像是否包括胃癌细胞区域，利用第一识别模型对该胃部切片图像进行识别可以得到识别结果，该识别结果标识了第一识别模型对该胃部切片图像是否包括胃癌细胞区域的预测结果。

进一步地，服务器101可以利用处理器根据上述待识别标签数据对应的识别结果所体现的置信度，确定该待识别标签是否为噪声数据，即识别出医疗影像的标签是否标注错误。其中，置信度可以理解为与待标签数据对应的识别结果的可信程度。置信度从第一识别模型识别待识别标签数据为某一类别的可能性的角度，体现了该待识别标签数据属于噪声数据的可能性。

若识别结果所体现的置信度较低，表明第一识别模型确定出待识别标签数据的识别结果是较为不自信的。也就是说，由于第一识别模型本身具有抗噪性，如果第一识别模型无法准确地确定出该待识别标签数据的类别，证明该待识别标签数据的特征相对于正确标签数据的共通特征不够明显，或者该待识别标签数据中携带有与噪声相关的特征的可能性较大(因为第一识别模型尚未学习到噪声相关的特征)。因此，若第一识别模型无法准确地确定出待识别标签数据的类别，该待识别标签数据具有较高的可能性为噪声数据。

若识别结果所体现的置信度较高，表明第一识别模型确定出待识别标签数据的识别结果是较为自信的。也就是说，由于第一识别模型本身具有抗噪性，如果第一识别模型可以准确地确定出该待识别标签数据的类别，证明该识别标签数据的特征相对于正确标签数据的共通特征较为明显，或者该待识别标签数据中携带有与噪声相关的特征的可能性较小(因为第一识别模型尚未学习到噪声相关的特征)。因此，若该识别结果与该待识别标签数据对应的标签不同，则表明该待识别标签数据具有较高的可能性为噪声数据。

在图1所示的应用场景中，若上述第一识别模型对胃部切片图像进行识别后得到的识别结果所体现的置信度较低，表明第一识别模型对该胃部切片图像的识别结果是较为不自信的，则可以将该胃部切片图像确定为噪声数据，即认为该胃部切片图像的标签标注错误。若上述第一识别模型对胃部切片图像进行识别后得到的识别结果所体现的置信度较高，表明第一识别模型对该胃部切片图像的识别结果是较为自信的，则将该胃部切片图像的识别结果与标签进行比较，若比较结果表明识别结果与标签不一致，则可以将该胃部切片图像确定为噪声数据，即认为该胃部切片图像的标签标注错误。

由于第一识别模型本身的这种抗噪能力，根据这种第一识别模型得到的识别结果，其体现的置信度可以有效表达出待识别标签数据属于噪声数据的可能性，可以以此从具有标签的医疗影像中有效的筛选出标签标注错误的医疗影像，提高了噪声数据的确定准确性。

服务器101通过执行上述实施例提供的医疗影像的噪声数据识别方法，筛选出标签标注错误的医疗影像后，可以将筛选出来的医疗影像存储在内部存储器中。医护人员可以通过显示屏103调取并查看标签标注错误的医疗影像，并对这些医疗影像进行重新标注。

参见图2，图2为本申请实施例提供的一种医疗影像的噪声数据识别方法的流程示意图。为了便于描述，下面实施例以服务器作为执行主体，对该医疗影像的噪声数据识别方法进行介绍。如图2所示，该方法包括以下步骤：

S201:根据第一识别模型确定待识别标签数据的识别结果。

由于在对深度学习模型进行有监督学习的训练场景下，训练样本是带有标注信息的标签数据。在医疗影像领域，由于病灶识别的复杂性，即使是医学专家也不能给出准确的标注信息。因此，对于标签数据是具有标签的医疗影像，无法保证其标签是百分百正确的。故，可以将具有标签的医疗影像作为待识别标签数据，利用第一识别模型确定该待识别标签数据的识别结果，从而确定出该待识别标签数据是否为噪声数据，即识别出标签标注错误的医疗影像。其中，待识别标签数据为具有标签的医疗影像，标签用于标识医疗影像是否包括病灶区域或者病灶区域的病灶类型。医疗影像可以是任意类型的病理图像，例如，肺部CT图像、胃部切片图像等等。识别结果标识了第一识别模型对于待识别标签数据的预测结果。如图1所示的应用场景，服务器101利用第一识别模型对胃部切片图像进行识别的任务中，识别结果包括：胃部切片图像中包括胃癌细胞区域，以及胃部切片图像中不包括胃癌细胞区域。

上述第一识别模型是通过对初始网络模型进行N轮训练得到的，N小于完成对所述初始网络模型完整训练所需的总轮数M，所述第一识别模型的模型参数尚未收敛。其中，初始网络模型是预先搭建的参数初始化模型，即模型参数为初始值，尚未经过训练调整过。初始网络模型的结构可以是各种人工神经网络，例如，卷积神经网络(Convolutional NeuralNetwork,CNN)，循环神经网络(Recurrent Neural Network,RNN)等，可以根据具体的应用场景以及医疗影像的噪声数据识别任务搭建初始网络模型。M标识了对初始网络模型进行训练，使得该模型收敛的总训练周期数。N标识了对初始网络模型进行初期训练，使得该模型具有抗噪能力的训练周期数。

在对初始网络模型进行初期训练得到第一识别模型的过程中，可以利用训练样本集对初始网络模型进行初期训练，该训练样本集中的训练样本属于同一学习任务中使用的标签数据。可以理解的是，由于训练样本集中的大部分样本具有相近或相同的特征，因此，在初期训练的过程中，初始网络模型容易对大部分样本的共通特性进行学习，避免出现对噪声数据的过拟合，从而得到具备抗噪声性能的第一识别模型。

为了使得第一识别模型具备抗噪性能，在实际训练过程中，无论模型的复杂程度或噪声确定任务，可以设置较大的学习率(如学习率a＝0.1)，对初始网路模型进行N个周期的训练，得到用于医疗影像的噪声数据识别任务的第一识别模型。

由于较大的学习率可以使得初始网络模型能够降低初始网络模型对于细微特征的注意程度，且在初期训练过程中，能够使初始网络模型的注意力集中在训练样本的共通特性上进行学习，因此，经过初期训练后的第一识别模型尚未学习到噪声的特征，从而具有抗噪声性能。故，通过该第一识别模型确定出待识别标签数据的识别结果中可以体现出上述抗噪性的影响。

S202:根据所述识别结果所体现的置信度，确定所述待识别标签数据是否为噪声数据。

由于第一识别模型具备一定的抗噪声性能，因此，对于第一识别模型输出待识别标签数据的识别结果所体现的置信度，能够用于确定该待识别标签数据是否为噪声数据，噪声数据为标签标注错误的医疗影像。其中，识别结果所体现的置信度标识了对于这个识别结果的可信程度。从识别结果所体现的置信度这一角度，体现了第一识别模型对于识别结果的自信程度。若识别结果所体现的置信度较高，表明第一识别模型对于该识别结果较为自信；若识别结果所体现的置信度较低，表明第一识别模型对于该识别结果较为不自信。在应用过程中，可以将识别结果所体现的置信度与阈值进行比较，根据比较结果确定该第一识别模型对于识别结果的自信程度。

在一种可能的实现方式中，若识别结果所体现的置信度低于第一条件阈值，确定识别结果对应的待识别标签数据为噪声数据。

在实际应用中，第一条件阈值可以是预先设定的某一固定值。第一条件阈值也可以先设置为某一数值后，在利用该第一条件阈值对一定数量的待识别标签数据进行噪声筛选后，根据噪声数据的识别准确率，调整该第一条件阈值的大小。例如，预先设置第一条件阈值为a，根据识别结果所体现的置信度和该第一条件阈值a对1000个待识别标签数据进行噪声筛选后，筛选出100个待识别标签数据为噪声数据，对这100个噪声数据进行校对后，若100个噪声数据中存在10个为正确的标签数据，则噪声数据的识别准确率为90％。若想进一步提高噪声数据的识别准确率(提高至95％)，则可以适当地将第一条件阈值a调整为b。

若识别结果所体现的置信度低于第一条件阈值，说明该识别结果所体现的置信度较低，即第一识别模型对于该识别结果是较为不自信的。由于第一识别模型具有抗噪声性能，若第一识别模型无法较为准确地识别出待识别标签数据的类别(即第一识别模型对待识别标签数据对应的识别结果较为不自信)，表明该待识别标签数据中相对于正确的标签数据的共通特征不够明显，或者该待识别标签数据携带有与噪声相关的特性的可能性较大。因此，若识别结果所体现的置信度低于第一条件阈值，可以将该待识别标签数据确定为噪声数据。

在另一种可能的实现方式中，若识别结果所体现的置信度高于第二条件阈值，确定待识别标签数据的标签与识别结果是否一致；若不一致，确定识别结果对应的待识别标签数据为噪声数据。

在实际应用中，第二条件阈值可以设定为某一固定值，也可以先设后调整，与上述第一条件阈值类似，在此不再赘述。需要说明的是，第一条件阈值和第二条件阈值可以相等，也可以不相等。具体可以根据噪声确定任务设定第一条件阈值和第二条件阈值。

若识别结果所体现的置信度高于第二条件阈值，说明该识别结果所体现的置信度较高，即第一识别模型对于该识别结果是较为自信的。由于第一识别模型具有抗噪声性能，若第一识别模型能够较为准确地识别出待识别标签数据的类别(即第一识别模型对待识别标签数据对应的识别结果较为自信)，表明该待识别标签数据中相对于正确的标签数据的共通特征较为明显，或者该待识别标签数据携带有与噪声相关的特性的可能性较小。因此，若识别结果所体现的置信度高于第二条件阈值时，且该待识别标签数据的标签与识别结果不一致时，可以将该待识别标签数据确定为噪声数据。

基于上述，将识别结果所体现的置信度与第一条件阈值或第二条件阈值进行比较，从而确定出第一识别模型对于识别结果的自信程度。根据比较结果选择选择出噪声数据，提高了待识别标签数据的标签的标注准确度。

针对识别结果所体现的置信度，可以有多种不同的确定方式。

在一种可能的实现方式中，可以通过标识识别结果的概率分布，确定识别结果所体现的置信度。

其中，标识识别结果的概率分布可以理解为待识别标签数据为每一个类别的概率值情况。在实际应用中，可以将概率分布中的最大概率值对应的类别确定为待识别标签数据对应的识别结果，并将该最大概率值确定为该识别结果所体现的置信度。

如图1所示的应用场景，在识别胃部切片图像是否包括胃癌细胞区域的任务中，利用第一识别模型对胃部切片图像进行识别，得到概率分布为：该胃部切片图像包括胃癌细胞区域的概率为0.9，不包括胃癌细胞区域的概率为0.1，根据该概率分布中最大概率值0.9可以确定出该胃部切片图像的识别结果为该胃部切片图像包括胃癌细胞区域，则该识别结果所体现的置信度可以确定为0.9。

在另一种可能的实现方式中，可以通过确定标识识别结果的概率分布所对应的信息熵，进而，根据信息熵确定识别结果所体现的置信度。

其中，信息熵标识了识别结果的不确定度，即标识识别结果的概率分布的各类别对应的概率值的差异程度。信息熵越小，表明识别结果的不确定度越小，标识该识别结果的概率分布中个类别对应的概率值的差异越大，此时第一识别模型对于该识别结果较为自信，即该识别结果所体现的置信度较高。信息熵越大，表明识别结果的不确定度越大，标识该识别结果的概率分布中各类别对应的概率值的差异越小，此时第一识别模型对于该识别结果较为不自信，即该识别结果所体现的置信度较低。

上述标识识别结果的概率分布对应的信息熵可以通过以下数学式进行计算，即：

其中p(x_i)表示待识别标签数据为某一类别的概率值，n表示类别总数。H(X)表示标识识别结果的概率分布对应的信息熵。

例如，在上述图1所示的应用场景中，若胃部切片图像包括胃癌细胞区域的概率为0.9，胃部切片图像不包括胃癌细胞区域的概率为0.1，则该概率分布对应的信息熵H(X)为：

H(X)＝-0.9*lg(0.9)-0.1*lg(0.1)≈0.14

若上述胃部切片图像对应的概率分布为：胃部切片图像包括胃癌细胞区域的概率为0.6，胃部切片图像不包括胃癌细胞区域的概率为0.4，则该概率分布对应的信息熵H(X)为：

H(X)＝-0.6*lg(0.6)-0.4*lg(0.4)≈0.29

在实际应用中，可以利用上述第一识别模型对待识别标签数据进行多次重复筛选，能够提高对于待识别标签数据中标签数据的标签准确度。

下面结合图3，对另一种医疗影像的噪声数据识别方法进行介绍。在图3所示的方法中，该方法包括步骤S301-S302与上述S201-S202相同，在此不再赘述。该方法还包括以下步骤：

S303:获取重新标注数据。

若待识别标签数据确定为噪声数据，说明该待识别标签数据具有较大的可能性携带有错误的标签。因此，可以将噪声数据进行重新标注，即可得到重新标注数据。

可以理解的是，可以将初始网络模型所使用训练样本集中的标签数据作为待识别标签数据，利用第一识别模型筛选出该训练样本集中的噪声数据。对筛选出的噪声数据重新标注后，得到重新标注数据。

S304:根据所述重新标注数据和所述训练样本集中的剩余数据生成调整样本集。

基于步骤S301-S302，从训练样本集中筛选出噪声数据后，则该训练样本集中的剩余数据为训练样本集中除了噪声数据之外的标签数据。因此，可以利用上述重新标注数据和训练样本集中的剩余数据生成调整样本集。

S305:将所述调整样本集作为所述训练样本集重新对所述初始网络模型进行N轮训练，得到第二识别模型，基于所述第二识别模型进行医疗影像的噪声数据识别。

由于调整样本集中标签数据的标签是通过人工进行标注的，因此，调整样本集中标签数据仍然可能携带有错误的标签。为了进一步降低调整样本集中噪声数据的数量，可以将调整样本集作为训练样本集，重新对初始网络模型进行训练，得到第二识别模型，并利用该第二识别模型对医疗影像中的噪声数据进行识别。

在实际应用中，可以重复1-3次执行上述步骤S301-S305。通过多次筛选噪声数据，并对噪声数据重新标注，提高了训练样本集中标签数据对应的标签的准确度，降低了训练样本集中噪声数据的比重。

由于将调整样本集作为训练样本集重新训练初始网络模型，增加了调整样本集中的正确的标签数据所占比例，因此，该训练样本集中正确的标签数据所具有的共通特征更加明显，得到的第二识别模型的抗噪声性能更好。进而，利用该第二识别模型筛选训练样本集中的噪声数据，进一步提高了训练样本集中正确的标签数据的所占比例。

上述实施例提供的医疗影像的噪声数据识别方法，针对具有标签的医疗影像，若需要识别其中是否具有噪声数据，可以将该医疗影像作为待识别标签数据，并通过特定的第一识别模型对其进行识别。该第一识别模型是通过初始网络模型进行N轮训练得到的，由于N小于完成对所述初始网络模型完整训练所需的总轮数M，故训练得到的第一识别模型中的模型参数尚未收敛，属于刚完成初期训练，此时的第一识别模型通过训练学习到的是训练样本中大部分类似数据的共通特征，而由于作为训练样本的医疗影像中非噪声数据即具有正确标签的占比较大，那么第一识别模型学习到的主要是这类标签数据的共通特征，尚未过拟合噪声数据，从而具备较好的抗噪能力。由于第一识别模型本身的这种抗噪能力，根据这种第一识别模型得到的识别结果，其体现的置信度可以有效表达出待识别标签数据属于噪声数据的可能性，可以以此从具有标签的医疗影像中有效的筛选出标签标注错误的医疗影像，提高了噪声数据的确定准确性。

为了便于理解上述实施例提供的医疗影像的噪声数据识别方法，下面结合具体的应用场景，对该医疗影像的噪声数据识别方法进行介绍。为了便于描述，下面以服务器作为执行主体。

如图1所示的应用场景中，服务器101利用处理器通过第一识别模型对具有标签的胃部切片图像进行识别，确定出该胃部切片图像是否包括胃癌细胞区域的概率值，并将该概率值作为识别结果。其中，第一识别模型利用训练样本集对预先搭建的深度卷积神经网络经过10轮训练得到的，训练过程中可以将学习率设置为0.1；训练样本集包括具有标签的胃部切片图像，并作为待识别标签数据。

服务器101可以利用处理器根据上述识别结果计算对应的信息熵，将该信息熵与预设的阈值进行比较确定该识别结果的置信度。若信息熵大于阈值，且该识别结果与待识别数字切片图像不一致时，或者信息熵小于阈值时，则将该胃部切片图像确定为噪声数据，即认为该胃部切片图像的标签标注错误。医护人员对该筛选出来的胃部切片图像进行重新标注后，可以得到重新标注的胃部切片图像。

服务器101获取到重新标注的胃部切片图像后，将重新标注的胃部切片图像和训练样本集中的具有正确标签的胃部切片图像生成调整样本集，将该调整样本集作为训练样本集重新对初始网络模型进行10轮训练，并将重新训练得到的第一识别模型用于确定调整样本集中噪声数据。重复3次筛选噪声数据后，可以得到标签正确度较高的胃部切片图像。

针对上文描述的医疗影像的噪声数据识别方法，本申请实施例还提供了对应的医疗影像的噪声数据识别装置。

参见图4，图4为本申请实施例提供的一种医疗影像的噪声数据识别装置的结构示意图。如图4所示，该医疗影像的噪声数据识别装置400包括第一确定单元401、第二确定单元402：

所述第一确定单元401，用于根据第一识别模型确定待识别标签数据的识别结果；所述第一识别模型是通过对初始网络模型进行N轮训练得到的，N小于完成对所述初始网络模型完整训练所需的总轮数M，所述第一识别模型的模型参数尚未收敛；所述待识别标签数据为具有标签的医疗影像；

所述第二确定单元402，用于根据所述识别结果所体现的置信度，确定所述待识别标签数据是否为噪声数据；所述噪声数据为标签标注错误的医疗影像。

其中，所述第二确定单元402，用于：

若所述识别结果所体现的置信度低于第一条件阈值，确定所述识别结果对应的待识别标签数据为噪声数据。

其中，所述第二确定单元402，用于：

若所述识别结果所体现的置信度高于第二条件阈值，确定所述待识别标签数据的标签与所述识别结果是否一致；

若不一致，确定所述识别结果对应的待识别标签数据为噪声数据。

其中，所述第二确定单元402，还用于：

通过标识所述识别结果的概率分布，确定所述识别结果所体现的置信度。

其中，所述第二确定单元402，用于：

确定标识所述识别结果的概率分布所对应的信息熵；

根据所述信息熵确定所述识别结果所体现的置信度。

其中，所述待识别标签数据为训练所述初始网络模型所使用训练样本集中的标签数据。

其中，所述装置还包括获取单元，生成单元和训练单元：

所述获取单元，用于获取重新标注数据，所述重新标注数据是对所述噪声数据重新标注标签得到的；

所述生成单元，用于根据所述重新标注数据和所述训练样本集中的剩余数据生成调整样本集，所述剩余数据为所述训练样本集中除了噪声数据之外的标签数据；

所述训练单元，用于将所述调整样本集作为所述训练样本集重新对所述初始网络模型进行N轮训练，将训练得到的模型作为所述第一识别模型，触发所述第一确定单元401。

上述实施例提供的医疗影像的噪声数据识别装置，针对具有标签的医疗影像，若需要识别其中是否具有噪声数据，可以将该医疗影像作为待识别标签数据，并通过特定的第一识别模型对其进行识别。该第一识别模型是通过初始网络模型进行N轮训练得到的，由于N小于完成对所述初始网络模型完整训练所需的总轮数M，故训练得到的第一识别模型中的模型参数尚未收敛，属于刚完成初期训练，此时的第一识别模型通过训练学习到的是训练样本中大部分类似数据的共通特征，而由于作为训练样本的医疗影像中非噪声数据即具有正确标签的占比较大，那么第一识别模型学习到的主要是这类标签数据的共通特征，尚未过拟合噪声数据，从而具备较好的抗噪能力。由于第一识别模型本身的这种抗噪能力，根据这种第一识别模型得到的识别结果，其体现的置信度可以有效表达出待识别标签数据属于噪声数据的可能性，可以以此从具有标签的医疗影像中有效的筛选出标签标注错误的医疗影像，提高了噪声数据的确定准确性。

本申请实施例还提供了一种用于医疗影像的噪声数据识别的服务器和终端设备，下面将从硬件实体化的角度对本申请实施例提供的用于医疗影像的噪声数据识别的服务器和终端设备进行介绍。

参见图5，图5是本申请实施例提供的一种服务器结构示意图，该服务器1400可因配置或性能不同而产生比较大的差异，可以包括一个或一个以***处理器(centralprocessing units，CPU)1422(例如，一个或一个以上处理器)和存储器1432，一个或一个以上存储应用程序1442或数据1444的存储介质1430(例如一个或一个以上海量存储设备)。其中，存储器1432和存储介质1430可以是短暂存储或持久存储。存储在存储介质1430的程序可以包括一个或一个以上模块(图示没标出)，每个模块可以包括对服务器中的一系列指令操作。更进一步地，中央处理器1422可以设置为与存储介质1430通信，在服务器1400上执行存储介质1430中的一系列指令操作。

服务器1400还可以包括一个或一个以上电源1426，一个或一个以上有线或无线网络接口1450，一个或一个以上输入输出接口1458，和/或，一个或一个以上操作***1441，例如Windows ServerTM，Mac OS XTM，UnixTM,LinuxTM，FreeBSDTM等等。

上述实施例中由服务器所执行的步骤可以基于该图5所示的服务器结构。

其中，CPU 1422用于执行如下步骤：

根据第一识别模型确定待识别标签数据的识别结果；所述第一识别模型是通过对初始网络模型进行N轮训练得到的，N小于完成对所述初始网络模型完整训练所需的总轮数M，所述第一识别模型的模型参数尚未收敛；所述待识别标签数据为具有标签的医疗影像；

根据所述识别结果所体现的置信度，确定所述待识别标签数据是否为噪声数据；所述噪声数据为标签标注错误的医疗影像。

可选的，CPU 1422还可以执行本申请实施例中医疗影像的噪声数据识别方法任一具体实现方式的方法步骤。

针对上文描述的医疗影像的噪声数据识别方法，本申请实施例还提供了一种用于医疗影像的噪声数据识别的终端设备，以使上述医疗影像的噪声数据识别方法在实际中实现以及应用。

参见图6，图6为本申请实施例提供的一种终端设备的结构示意图。为了便于说明，仅示出了与本申请实施例相关的部分，具体技术细节未揭示的，请参照本申请实施例方法部分。该终端设备可以为包括平板电脑、个人数字助理(英文全称：Personal DigitalAssistant，英文缩写：PDA)等任意终端设备：

图6示出的是与本申请实施例提供的终端相关的部分结构的框图。参考图6，该终端包括：射频(英文全称：Radio Frequency，英文缩写：RF)电路1510、存储器1520、输入单元1530、显示单元1540、传感器1550、音频电路1560、无线保真(英文全称：wirelessfidelity，英文缩写：WiFi)模块1570、处理器1580、以及电源1590等部件。本领域技术人员可以理解，图6中示出的平板电脑结构并不构成对平板电脑的限定，可以包括比图示更多或更少的部件，或者组合某些部件，或者不同的部件布置。

下面结合图6对平板电脑的各个构成部件进行具体的介绍：

存储器1520可用于存储软件程序以及模块，处理器1580通过运行存储在存储器1520的软件程序以及模块，从而实现终端的各种功能应用以及数据处理。存储器1520可主要包括存储程序区和存储数据区，其中，存储程序区可存储操作***、至少一个功能所需的应用程序(比如声音播放功能、图像播放功能等)等；存储数据区可存储根据手机的使用所创建的数据(比如音频数据、电话本等)等。此外，存储器1520可以包括高速随机存取存储器，还可以包括非易失性存储器，例如至少一个磁盘存储器件、闪存器件、或其他易失性固态存储器件。

处理器1580是终端的控制中心，利用各种接口和线路连接整个平板电脑的各个部分，通过运行或执行存储在存储器1520内的软件程序和/或模块，以及调用存储在存储器1520内的数据，执行平板电脑的各种功能和处理数据，从而对平板电脑进行整体监控。可选的，处理器1580可包括一个或多个处理单元；优选的，处理器1580可集成应用处理器和调制解调处理器，其中，应用处理器主要处理操作***、用户界面和应用程序等，调制解调处理器主要处理无线通信。可以理解的是，上述调制解调处理器也可以不集成到处理器1580中。

在本申请实施例中，该终端所包括的存储器1520可以存储程序代码，并将所述程序代码传输给所述处理器。

该终端所包括的处理器1580可以根据所述程序代码中的指令执行上述实施例提供的医疗影像的噪声数据识别方法。

本申请实施例还提供一种计算机可读存储介质，用于存储计算机程序，该计算机程序用于执行上述实施例提供的医疗影像的噪声数据识别方法。

本领域普通技术人员可以理解：实现上述方法实施例的全部或部分步骤可以通过程序指令相关的硬件来完成，前述程序可以存储于一计算机可读取存储介质中，该程序在执行时，执行包括上述方法实施例的步骤；而前述的存储介质可以是下述介质中的至少一种：只读存储器(英文：read-only memory，缩写：ROM)、RAM、磁碟或者光盘等各种可以存储程序代码的介质。

需要说明的是，本说明书中的各个实施例均采用递进的方式描述，各个实施例之间相同相似的部分互相参见即可，每个实施例重点说明的都是与其他实施例的不同之处。尤其，对于设备及***实施例而言，由于其基本相似于方法实施例，所以描述得比较简单，相关之处参见方法实施例的部分说明即可。以上所描述的设备及***实施例仅仅是示意性的，其中作为分离部件说明的单元可以是或者也可以不是物理上分开的，作为单元显示的部件可以是或者也可以不是物理单元，即可以位于一个地方，或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部模块来实现本实施例方案的目的。本领域普通技术人员在不付出创造性劳动的情况下，即可以理解并实施。

以上所述，仅为本申请的一种具体实施方式，但本申请的保护范围并不局限于此，任何熟悉本技术领域的技术人员在本申请揭露的技术范围内，可轻易想到的变化或替换，都应涵盖在本申请的保护范围之内。因此，本申请的保护范围应该以权利要求的保护范围为准。

Claims

1.一种医疗影像的噪声数据识别方法，其特征在于，所述方法包括：

2.根据权利要求1所述的方法，其特征在于，所述根据所述识别结果所体现的置信度，确定所述识别结果对应的待识别标签数据是否为噪声数据，包括：

3.根据权利要求1所述的方法，其特征在于，所述根据所述识别结果所体现的置信度，确定所述识别结果对应的待识别标签数据是否为噪声数据，包括：

4.根据权利要求1-3任意一项所述的方法，其特征在于，在所述根据所述识别结果所体现的置信度，确定所述识别结果对应的待识别标签数据是否为噪声数据之前，所述方法还包括：

5.根据权利要求4所述的方法，其特征在于，所述通过标识所述识别结果的概率分布，确定所述识别结果对应的置信度，包括：

确定标识所述识别结果的概率分布所对应的信息熵；

根据所述信息熵确定所述识别结果所体现的置信度。

6.根据权利要求1所述的方法，其特征在于，所述待识别标签数据为训练所述初始网络模型所使用训练样本集中的标签数据。

7.根据权利要求6所述的方法，其特征在于，在根据所述识别结果确定出噪声数据之后，所述方法还包括：

获取重新标注数据，所述重新标注数据是对所述噪声数据重新标注标签得到的；

根据所述重新标注数据和所述训练样本集中的剩余数据生成调整样本集，所述剩余数据为所述训练样本集中除了噪声数据之外的标签数据；

将所述调整样本集作为所述训练样本集重新对所述初始网络模型进行N轮训练，得到第二识别模型，基于所述第二识别模型进行医疗影像的噪声数据识别。

8.一种医疗影像的噪声数据识别装置，其特征在于，所述装置包括第一确定单元和第二确定单元：

所述第一确定单元，用于根据第一识别模型确定待识别标签数据的识别结果；所述第一识别模型是通过对初始网络模型进行N轮训练得到的，N小于完成对所述初始网络模型完整训练所需的总轮数M，所述第一识别模型的模型参数尚未收敛；所述待识别标签数据为具有标签的医疗影像；

所述第二确定单元，用于根据所述识别结果所体现的置信度，确定所述待识别标签数据是否为噪声数据；所述噪声数据为标签标注错误的医疗影像。

9.根据权利要求8所述的装置，其特征在于，所述第二确定单元，用于：

10.根据权利要求8所述的装置，其特征在于，所述第二确定单元，用于：

11.根据权利要求8-10任意一项所述的装置，其特征在于，所述第二确定单元，还用于：

12.根据权利要求11所述的装置，其特征在于，所述第二确定单元，用于：

确定标识所述识别结果的概率分布所对应的信息熵；

根据所述信息熵确定所述识别结果所体现的置信度。

13.根据权利要求8所述的装置，其特征在于，所述待识别标签数据为训练所述初始网络模型所使用训练样本集中的标签数据。

14.一种用于医疗影像的噪声数据识别设备，其特征在于，所述设备包括处理器以及存储器：

所述处理器用于根据所述程序代码中的指令执行权利要求1-7任意一项所述的方法。

15.一种计算机可读存储介质，其特征在于，所述计算机可读存储介质用于存储计算机程序，所述计算机程序用于执行权力要求1-7任意一项所述的方法。