CN117496323B - 基于Transformer的多尺度二阶病理图像分类方法及*** - Google Patents
基于Transformer的多尺度二阶病理图像分类方法及*** Download PDFInfo
- Publication number
- CN117496323B CN117496323B CN202311810060.5A CN202311810060A CN117496323B CN 117496323 B CN117496323 B CN 117496323B CN 202311810060 A CN202311810060 A CN 202311810060A CN 117496323 B CN117496323 B CN 117496323B
- Authority
- CN
- China
- Prior art keywords
- scale
- order
- features
- classified
- feature
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 238000000034 method Methods 0.000 title claims abstract description 85
- 230000001575 pathological effect Effects 0.000 title claims abstract description 72
- 238000011176 pooling Methods 0.000 claims abstract description 66
- 238000007781 pre-processing Methods 0.000 claims abstract description 12
- 238000012545 processing Methods 0.000 claims abstract description 6
- 238000004364 calculation method Methods 0.000 claims description 25
- 239000011159 matrix material Substances 0.000 claims description 16
- 230000007170 pathology Effects 0.000 claims description 14
- 238000004590 computer program Methods 0.000 claims description 6
- 238000013507 mapping Methods 0.000 claims description 5
- 238000000605 extraction Methods 0.000 claims description 4
- 238000003860 storage Methods 0.000 claims description 4
- 238000005191 phase separation Methods 0.000 claims 2
- 206010006187 Breast cancer Diseases 0.000 abstract description 25
- 208000026310 Breast neoplasm Diseases 0.000 abstract description 25
- 230000007547 defect Effects 0.000 abstract description 2
- 238000003745 diagnosis Methods 0.000 description 6
- 238000013135 deep learning Methods 0.000 description 5
- 238000003759 clinical diagnosis Methods 0.000 description 4
- 238000005516 engineering process Methods 0.000 description 4
- 238000013528 artificial neural network Methods 0.000 description 3
- 238000012795 verification Methods 0.000 description 3
- 238000013459 approach Methods 0.000 description 2
- 238000004422 calculation algorithm Methods 0.000 description 2
- 238000004195 computer-aided diagnosis Methods 0.000 description 2
- 238000010586 diagram Methods 0.000 description 2
- 238000012986 modification Methods 0.000 description 2
- 230000004048 modification Effects 0.000 description 2
- 238000010606 normalization Methods 0.000 description 2
- 230000035945 sensitivity Effects 0.000 description 2
- 238000012935 Averaging Methods 0.000 description 1
- 208000009458 Carcinoma in Situ Diseases 0.000 description 1
- 230000009286 beneficial effect Effects 0.000 description 1
- 210000000481 breast Anatomy 0.000 description 1
- 231100000504 carcinogenesis Toxicity 0.000 description 1
- 239000012141 concentrate Substances 0.000 description 1
- 238000007796 conventional method Methods 0.000 description 1
- 230000000694 effects Effects 0.000 description 1
- 230000002708 enhancing effect Effects 0.000 description 1
- 238000009472 formulation Methods 0.000 description 1
- 230000004927 fusion Effects 0.000 description 1
- 238000010191 image analysis Methods 0.000 description 1
- 201000004933 in situ carcinoma Diseases 0.000 description 1
- 239000000203 mixture Substances 0.000 description 1
- 238000007634 remodeling Methods 0.000 description 1
- 238000011160 research Methods 0.000 description 1
- 238000012549 training Methods 0.000 description 1
- 238000010200 validation analysis Methods 0.000 description 1
- 230000000007 visual effect Effects 0.000 description 1
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V10/00—Arrangements for image or video recognition or understanding
- G06V10/70—Arrangements for image or video recognition or understanding using pattern recognition or machine learning
- G06V10/77—Processing image or video features in feature spaces; using data integration or data reduction, e.g. principal component analysis [PCA] or independent component analysis [ICA] or self-organising maps [SOM]; Blind source separation
- G06V10/80—Fusion, i.e. combining data from various sources at the sensor level, preprocessing level, feature extraction level or classification level
- G06V10/809—Fusion, i.e. combining data from various sources at the sensor level, preprocessing level, feature extraction level or classification level of classification results, e.g. where the classifiers operate on the same input data
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T7/00—Image analysis
- G06T7/0002—Inspection of images, e.g. flaw detection
- G06T7/0012—Biomedical image inspection
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V10/00—Arrangements for image or video recognition or understanding
- G06V10/40—Extraction of image or video features
- G06V10/44—Local feature extraction by analysis of parts of the pattern, e.g. by detecting edges, contours, loops, corners, strokes or intersections; Connectivity analysis, e.g. of connected components
- G06V10/443—Local feature extraction by analysis of parts of the pattern, e.g. by detecting edges, contours, loops, corners, strokes or intersections; Connectivity analysis, e.g. of connected components by matching or filtering
- G06V10/449—Biologically inspired filters, e.g. difference of Gaussians [DoG] or Gabor filters
- G06V10/451—Biologically inspired filters, e.g. difference of Gaussians [DoG] or Gabor filters with interaction between the filter responses, e.g. cortical complex cells
- G06V10/454—Integrating the filters into a hierarchical structure, e.g. convolutional neural networks [CNN]
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V10/00—Arrangements for image or video recognition or understanding
- G06V10/40—Extraction of image or video features
- G06V10/52—Scale-space analysis, e.g. wavelet analysis
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V10/00—Arrangements for image or video recognition or understanding
- G06V10/70—Arrangements for image or video recognition or understanding using pattern recognition or machine learning
- G06V10/764—Arrangements for image or video recognition or understanding using pattern recognition or machine learning using classification, e.g. of video objects
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V10/00—Arrangements for image or video recognition or understanding
- G06V10/70—Arrangements for image or video recognition or understanding using pattern recognition or machine learning
- G06V10/77—Processing image or video features in feature spaces; using data integration or data reduction, e.g. principal component analysis [PCA] or independent component analysis [ICA] or self-organising maps [SOM]; Blind source separation
- G06V10/7715—Feature extraction, e.g. by transforming the feature space, e.g. multi-dimensional scaling [MDS]; Mappings, e.g. subspace methods
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V10/00—Arrangements for image or video recognition or understanding
- G06V10/70—Arrangements for image or video recognition or understanding using pattern recognition or machine learning
- G06V10/82—Arrangements for image or video recognition or understanding using pattern recognition or machine learning using neural networks
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T2207/00—Indexing scheme for image analysis or image enhancement
- G06T2207/20—Special algorithmic details
- G06T2207/20081—Training; Learning
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T2207/00—Indexing scheme for image analysis or image enhancement
- G06T2207/20—Special algorithmic details
- G06T2207/20084—Artificial neural networks [ANN]
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T2207/00—Indexing scheme for image analysis or image enhancement
- G06T2207/30—Subject of image; Context of image processing
- G06T2207/30004—Biomedical image processing
- G06T2207/30068—Mammography; Breast
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V2201/00—Indexing scheme relating to image or video recognition or understanding
- G06V2201/03—Recognition of patterns in medical or anatomical images
-
- Y—GENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
- Y04—INFORMATION OR COMMUNICATION TECHNOLOGIES HAVING AN IMPACT ON OTHER TECHNOLOGY AREAS
- Y04S—SYSTEMS INTEGRATING TECHNOLOGIES RELATED TO POWER NETWORK OPERATION, COMMUNICATION OR INFORMATION TECHNOLOGIES FOR IMPROVING THE ELECTRICAL POWER GENERATION, TRANSMISSION, DISTRIBUTION, MANAGEMENT OR USAGE, i.e. SMART GRIDS
- Y04S10/00—Systems supporting electrical power generation, transmission or distribution
- Y04S10/50—Systems or methods supporting the power network operation or management, involving a certain degree of interaction with the load-side end user applications
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- Health & Medical Sciences (AREA)
- Multimedia (AREA)
- Evolutionary Computation (AREA)
- General Health & Medical Sciences (AREA)
- Artificial Intelligence (AREA)
- Medical Informatics (AREA)
- Databases & Information Systems (AREA)
- Software Systems (AREA)
- Computing Systems (AREA)
- Life Sciences & Earth Sciences (AREA)
- Biodiversity & Conservation Biology (AREA)
- Biomedical Technology (AREA)
- Molecular Biology (AREA)
- Nuclear Medicine, Radiotherapy & Molecular Imaging (AREA)
- Radiology & Medical Imaging (AREA)
- Quality & Reliability (AREA)
- Image Analysis (AREA)
Abstract
本公开提出一种基于Transformer的多尺度二阶病理图像分类方法及***,涉及图像处理领域。方法包括:获取待分类病理图像,进行预处理;将预处理后的待分类病理图像输入至Swin网络中,提取待分类病理图像的多尺度特征;将多尺度特征包含的单尺度特征分别输入至二阶池化模块和一阶池化模块,提取单尺度二阶特征、一阶特征;分别对单尺度二阶特征、一阶特征进行类别预测并联合,获得单尺度预测分数;融合多个单尺度预测分数,输出待分类病理图像类别预测结果。本公开通过考虑不同阶段的二阶特征,并融合一阶、二阶特征,充分挖掘了特征之间的细节信息,克服了传统方法无法捕获详细信息的缺陷,从而提高乳腺癌病理图像分类的准确性。
Description
技术领域
本发明涉及图像处理技术领域,尤其涉及一种基于Transformer的多尺度二阶病理图像分类方法及***。
背景技术
目前,乳腺癌已成为女性癌症死亡的第二大常见原因,尽管有经验的医生可以使用组织病理学图像进行诊断,但传统方法主观性强,效率低且不可重复。计算机辅助诊断(CAD)通过采用深度学习(DL)、计算机视觉等技术对病理图像进行分析,取得了可靠的结果,获得了组织病理学家的认可,显著减轻了医生的工作负担。
基于深度学***均池化(GAP)在神经网络末端建模全局信息的表示,然而这种方式忽略了特征之间的详细关系和复杂性。相较于一阶池化方法,二阶池化能够捕捉更多的信息并提供更丰富的特征表示,有助于更好地理解数据的结构以及特征之间的相互关系,从而增强算法的鲁棒性。基于此,部分研究将上述方法中的全局平均池化替换为二阶池化,但由于仍仅在神经网络末端采用二阶池化,忽略了不同尺度下的二阶特征表示,从而忽略了特征的详细信息。此外,它们在进行最终类别预测时只考虑了二阶统计量,而忽略了一阶特征中可能包含的额外信息。
发明内容
针对现有技术存在的问题,本发明提供了一种基于Transformer的多尺度二阶病理图像分类方法及***,所述方法使用Swin Transformer作为主干,在Swin Transformer的不同阶段之后进行二阶池化,以此来获得多尺度的二阶特征。并在单个尺度下联合一阶特征进行单个尺度下的分类,最后融合多个阶段的多尺度类别预测分数作为乳腺癌病理图像的最终预测得分。通过考虑不同阶段下的多尺度的二阶特征,充分挖掘了特征之间的细节信息,并融合了一阶、二阶池化特征,进一步获取有用信息,从而提高乳腺癌病理图像分类的准确性。
为了实现上述目的,本发明是通过如下的技术方案来实现:
为了实现上述目的,本发明采用如下技术方案:
第一方面,本发明提供一种基于Transformer的多尺度二阶病理图像分类方法,包括:获取待分类病理图像,对待分类病理图像进行预处理;
将预处理后的待分类病理图像输入至Swin Transformer网络中,提取待分类病理图像的多尺度特征;所述多尺度特征包含来自不同阶段的单尺度特征;
将多个单尺度特征分别输入至二阶池化模块和一阶池化模块,提取单尺度二阶特征和单尺度一阶特征;
分别对所述单尺度二阶特征和单尺度一阶特征进行类别预测,并联合预测结果,获得单尺度预测分数;
融合多个单尺度预测分数,输出待分类病理图像的类别预测结果。
进一步的技术方案,所述预处理包括:
使用随机水平翻转图像、随机垂直翻转图像以及随机旋转图像的数据增强方式,统一待分类病理图像的尺寸。
进一步的技术方案,所述提取待分类病理图像的多尺度特征,不包含SwinTransformer网络第一阶段提取的特征。
进一步的技术方案,所述将多个单尺度特征分别输入至二阶池化模块和一阶池化模块,提取单尺度二阶特征和单尺度一阶特征,包括:将每个单尺度特征分别输入至二阶池化模块,采用二阶池化处理,提取单尺度二阶特征;具体过程为:
将单尺度特征输入至二阶池化模块,对单个尺度的特征维度进行特征映射;
通过重塑操作对单尺度特征的维数进行分组,并计算相邻组之间的协方差矩阵;
拼接各协方差矩阵获得整体协方差矩阵,对整体协方差矩阵进行展平操作获得单尺度二阶特征。
进一步的技术方案,所述将多个单尺度特征分别输入至二阶池化模块和一阶池化模块,提取单尺度二阶特征和单尺度一阶特征,还包括:将每个单尺度特征分别输入至一阶池化模块,采用一阶池化处理,提取单尺度一阶特征;具体过程为:
将单尺度特征输入至一阶池化模块,通过全局平均池化计算单尺度一阶特征。
进一步的技术方案,所述分别对所述单尺度二阶特征和单尺度一阶特征进行类别预测,并联合预测结果,获得单尺度预测分数,包括:
其中,和/>表示用于分类的全连接层,/>和/>分别表示单尺度一阶特征和单尺度二阶特征,/>表示Swin Transformer的第i个阶段;通过计算均值获得单尺度预测分数。
进一步的技术方案,所述融合多个单尺度预测分数,输出待分类病理图像的类别预测结果,包括:通过对多个单尺度预测分数进行求和,得到最终类别预测结果。
第二方面,本发明提供一种基于Transformer的多尺度二阶病理图像分类***,包括:
图像获取及预处理模块,用于获取待分类病理图像,对待分类病理图像进行预处理;
多尺度特征提取模块,用于将预处理后的待分类病理图像输入至SwinTransformer网络中,提取待分类病理图像的多尺度特征;所述多尺度特征包含来自不同阶段的单尺度特征;
单尺度特征池化模块,用于将多个单尺度特征分别输入至二阶池化模块和一阶池化模块,提取单尺度二阶特征和单尺度一阶特征;
单尺度预测分数计算模块,用于分别对所述单尺度二阶特征和单尺度一阶特征进行类别预测,并联合预测结果,获得单尺度预测分数;
最终分类预测模块,用于融合多个单尺度预测分数,输出待分类病理图像的类别预测结果。
第三方面,本发明提供一种计算机可读存储介质,其上存储有计算机程序,该程序被处理器执行时实现第一方面所述的基于Transformer的多尺度二阶病理图像分类方法中的步骤。
第四方面,本发明提供一种计算机设备,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,所述处理器执行所述程序时实现第一方面所述的基于Transformer的多尺度二阶病理图像分类方法中的步骤。
与现有技术相比,本公开的有益效果为:
(1)本发明使用Swin Transformer作为主干,通过保存不同阶段的特征作为多尺度特征,对来自不同尺度的特征分别进行二阶池化,在单个尺度的特征空间中捕获特征之间的详细关系和复杂性;之后对各单尺度二阶特征分别进行类别的预测,并联合一阶池化特征进行类别预测的分数作为单个阶段的预测分数,即单个尺度的类别预测分数;最后,通过相加的方式融合多个尺度的类别预测分数作为最终的预测结果。通过考虑不同阶段的多尺度二阶特征,充分挖掘了特征之间的细节信息,克服了传统方法仅在神经网络末端进行池化操作无法捕获详细信息的缺陷;并且,融合了一阶池化特征和二阶池化特征,进一步获取额外信息,避免遗漏相关信息,从而提高乳腺癌病理图像分类的准确性。
(2)与现有传统方法仅仅采用网络末端的特征作为图像表示不同,本发明充分利用网络不同阶段的多尺度特征,以更全面的方式表达特征在不同网络阶段的信息。通过巧妙整合这些多尺度信息,能够更准确地捕捉和呈现乳腺癌图像的关键特征,为提高辅助诊断的精确性和可靠性提供了有效手段。
(3)与仅采用一阶或二阶池化来整合全局特征的方法不同,本发明所述方法在每个尺度的特征上通过联合一阶和二阶特征的类别预测分数来进行类别预测。通过在每个尺度上融合这些预测分数,最终得到了全局类别预测。这一独特的方法不仅提高了对每个尺度上关键特征的敏感性,还通过综合多个尺度的信息,使得最终的类别预测更加全面和准确。
(4)本发明舍弃网络第一阶段提取的尺度特征,专注于后续阶段的多尺度特征,能够更有效地捕捉和利用更丰富、更有代表性的图像信息,从而提高对乳腺癌病理图像的分类性能。
(5)本发明采用分组策略计算二阶特征,将多尺度特征包含的不同特征进行分组,通过计算不同组之间的协方差来表示二阶统计量,这种分组的形式可以降低计算消耗,提高计算效率,且在不同组之间计算二阶可以有效增强不同组间信息的交互性。
附图说明
构成本公开的一部分的说明书附图用来提供对本公开的进一步理解,本公开的示意性实施例及其说明用于解释本公开,并不构成对本公开的限定。
图1为本公开提供的一种基于Transformer的多尺度二阶病理图像分类方法的整体流程图;
图2为本公开提供的一种基于Transformer的多尺度二阶病理图像分类方法的算法整体结构图;
图3为本公开提供的一种基于Transformer的多尺度二阶病理图像分类方法的单尺度下一阶二阶联合预测流程示意图。
具体实施方式
下面结合附图与实施例对本发明作进一步说明。
实施例一
如图1所示,本实施例公开了一种基于Transformer的多尺度二阶病理图像分类方法,包括:
S1:获取待分类病理图像,对待分类病理图像进行预处理;
S2:将预处理后的待分类病理图像输入至Swin Transformer网络中,提取待分类病理图像的多尺度特征;所述多尺度特征包含来自不同阶段的单尺度特征;
S3:将多个单尺度特征分别输入至二阶池化模块和一阶池化模块,提取单尺度二阶特征和单尺度一阶特征;
S4:分别对所述单尺度二阶特征和单尺度一阶特征进行类别预测,并联合预测结果,获得单尺度预测分数;
S5:融合多个单尺度预测分数,输出待分类病理图像的类别预测结果。
在本实施例中,使用公开的数据集BACH(BreAst Cancer Histology)获取待分类病理图像。BACH数据集是一个广泛应用于乳腺癌病理图像分析的数据集,包含来自不同患者的乳腺组织切片图像,主要用于评估计算机视觉和深度学习方法在乳腺癌相关任务上的性能。该数据集包含了四个主要的乳腺癌组织类别,分别是正常、良性、原位癌和浸润性癌,每个类别有100个样本。在训练和验证阶段的样本数量按照7:3的比例进行划分。
获取待分类病理图像后,对待分类病理图像进行预处理。由于使用数据增强技术可以增加数据的多样性,提高模型的鲁棒性,因此本实施例使用随机水平翻转图像、随机垂直翻转图像以及随机旋转图像三种数据增强方式,将图像的输入大小调整为输入到主干网络中以提取特征,同时将输入记为/>。
在一种具体的实施方式中,将预处理后的待分类病理图像输入至SwinTransformer网络中,提取待分类病理图像的多尺度特征;所述多尺度特征包含来自不同阶段的单尺度特征。
具体过程为,通过Swin Transformer进行特征的提取,保存多个阶段(Stage)的输出作为二阶池化模块的输入,如图2上半部分所示:
式中,是第/>个阶段的输出,/>是视觉主干。本实施例使用Swin Transformer的Tiny版本,仅使用网络第2、3、4阶段输出的特征,并不使用第1个阶段的特征。这是因为第一个阶段生成的特征相对不足,通过专注于后续阶段的多尺度特征,能够更有效地捕捉和利用更丰富、更有代表性的图像信息,从而提高对乳腺癌病理图像的分类性能。
经过主干的特征提取,各个尺度特征的大小分别为:、/>、,其中384和768代表维度,/>和/>表示当前尺度下的空间分辨率。/>和的形状大小一致,这是因为Swin Transformer本身第4阶段并未使用下采样操作。
获取多个单尺度特征后,如图2下半部分所示,将每个单尺度特征分别输入至二阶池化模块,采用二阶池化处理,提取单尺度二阶特征;并将每个单尺度特征分别输入至一阶池化模块,采用一阶池化处理,提取单尺度一阶特征。
对于提取单尺度二阶特征,具体过程如图3虚线框内所示,对每个尺度的特征分别计算二阶特征:包括:
S311:将单尺度特征输入至二阶池化模块,对单个尺度的特征维度进行特征映射;
S312:通过重塑操作对单尺度特征的维数进行分组,并计算相邻组之间的协方差矩阵;
S313:拼接各协方差矩阵获得整体协方差矩阵,对整体协方差矩阵进行展平操作获得单尺度二阶特征。
具体的,在S311中,计算二阶之前首先通过一个特征维度的映射操作对特征维度进行降维:
是一个可学习的线性层,其输入维度是特征的维度,输出维度记为/>,在实际的实现中,对于不同尺度下特征的降维操作均设置/>,这个降维操作可以在一定程度上减少计算消耗。
在S312中,对每个尺度上的特征计算二阶,本实施例以协方差矩阵表示二阶池化处理,其过程首先可以通过以下公式概述,为了方便表示,将二阶池化后的特征记为:
为了进一步减少计算消耗,使用一个重塑操作来对特征的维度进行分组,在这里,以符号来表示特征的大小,即,重塑操作的计算过程如下:
式中,通过重塑(式中以表示)操作,将/>进行了分组,分组后的特征记为,其中M是分组的数量,在具体的实现中M=4。
然后通过相邻组之间计算协方差矩阵来获得二阶表示,计算过程如下式所示:
其中、/>分别表示第/>组和第/>组的特征,/>第/>组和第/>组特征之间的协方差矩阵/> 和/>分别表示/>的单位矩阵和全1矩阵。然后使用L2归一化方法对协方差矩阵/>进行归一化操作,以此来保证特征尺度一致性并降低噪声敏感度。
在S313中,不同组之间计算协方差矩阵后可以得到个协方差矩阵,然后将这些协方差矩阵进行拼接来获得整体的协方差矩阵/>:
其中,经过/>操作之后/>,然后通过两个卷积核大小为,步距为/>,输入与输出维度均为/>的卷积操作进行下采样以进一步提高计算效率。然后通过展平操作将特征拉伸为一个一维的向量,在具体的实现中,最终的二阶表示是一个长度为675的向量,该向量表示单个尺度下最终的二阶表达。
对于提取单尺度一阶特征,具体过程如图3上半部分所示,对每个尺度的特征分别计算一阶特征:包括:
S321:将单尺度特征输入至一阶池化模块,通过全局平均池化计算单尺度一阶特征。
具体的,,其中H=W分别代表高度和宽度,C代表通道数。全局平均池化的公式为:
对于每个通道,将该通道上的所有元素相加,然后除以输入特征图的总像素数(H× W)来获得该通道的平均值,其中,c来自C的某一个维度,h、w表示在通道c下的某一个元素的位置。这将为每个通道生成一个标量值。最终,得到一个形状为C的特征向量,其中每个元素代表一个通道的平均值。这个特征向量可以用作分类器的输入或其他后续层的特征表示。
在获取单尺度二阶特征和单尺度一阶特征后,分别对单尺度二阶特征和单尺度一阶特征进行类别预测,并联合预测结果,获得单尺度预测分数。
具体在联合类别预测模块中,通过均值计算获得,如下所示:
其中和/>表示用于分类的全连接层,/>和/>分别表示单个尺度下一阶和二阶的特征,通过这种相加的方式来生成单尺度预测/>。
通过对多个单尺度预测分数进行求和,得到最终类别预测结果。具体为,通过相加的方式融合来自不同尺度的预测分数以获得最终的类别预测:
通过反向传播更新网络参数进行学习,在网络学习过程中,初始学习率设置为5e-4,批量大小为32。网络在100个epoch内进行学习,使用带有5个epoch预热的余弦学习率调整策略的AdamW优化器来优化网络的可学习参数。
模型验证,在每个训练的epoch结束后,使用验证集进行验证,通过准确率来评估模型的效果,最后本实施例所述的方法在所使用的数据集上实现了91.67%的识别准确率。本实施例将模型中所有的可学习参数保存为权重文件,用于对新收集的乳腺癌病理图像数据进行处理。
与现有技术相比,首先,本发明方案考虑了此前乳腺癌病理图像分类方法中未曾考虑的多尺度信息,并在多个尺度信息上进行二阶建模以及联合一阶信息进行预测,最后整合多个尺度的信息来获得最终的类别预测。在二阶建模时通过分组的策略来降低协方差计算带来的计算消耗,与简单的分组不同,本发明使用的方法在不同组之间进行协方差的计算,以此来增强不同组之间的联系,并在计算协方差池化之前和之后分别利用降维和下采样的操作来进一步降低计算消耗,提升效率。最后,本发明所述方法在乳腺癌病理图像上实现了91.67%的识别准确率,这相比于仅使用Swin Transformer的方法取得86.67%的准确率提升了5%的准确率。将本具体实施例的方法应用于实践中,对乳腺癌病理图像进行分类,可为相关从业医生提供真实可靠、科学的临床诊断参考,提高诊断准确率。
实施例二
本实施例提供一种基于Transformer的多尺度二阶病理图像分类***,包括:
图像获取及预处理模块,用于获取待分类病理图像,对待分类病理图像进行预处理;
多尺度特征提取模块,用于将预处理后的待分类病理图像输入至SwinTransformer网络中,提取待分类病理图像的多尺度特征;所述多尺度特征包含来自不同阶段的单尺度特征;
单尺度特征池化模块,用于将多个单尺度特征分别输入至二阶池化模块和一阶池化模块,提取单尺度二阶特征和单尺度一阶特征;
单尺度预测分数计算模块,用于分别对所述单尺度二阶特征和单尺度一阶特征进行类别预测,并联合预测结果,获得单尺度预测分数;
最终分类预测模块,用于融合多个单尺度预测分数,输出待分类病理图像的类别预测结果。
与现有技术相比,首先,本发明方案考虑了此前乳腺癌病理图像分类方法中未曾考虑的多尺度信息,并在多个尺度信息上进行二阶建模以及联合一阶信息进行预测,最后整合多个尺度的信息来获得最终的类别预测。在二阶建模时通过分组的策略来降低协方差计算带来的计算消耗,与简单的分组不同,本发明使用的方法在不同组之间进行协方差的计算,以此来增强不同组之间的联系,并在计算协方差池化之前和之后分别利用降维和下采样的操作来进一步降低计算消耗,提升效率。最后,本发明所述方法在乳腺癌病理图像上实现了91.67%的识别准确率,这相比于仅使用Swin Transformer的方法取得86.67%的准确率提升了5%的准确率。将本具体实施例的方法应用于实践中,对乳腺癌病理图像进行分类,可为相关从业医生提供真实可靠、科学的临床诊断参考,提高诊断准确率。
实施例三
本实施例提供了一种计算机可读存储介质,其上存储有计算机程序,该程序被处理器执行时实现如上述实施例一所述的基于Transformer的多尺度二阶病理图像分类方法中的步骤。
与现有技术相比,首先,本发明方案考虑了此前乳腺癌病理图像分类方法中未曾考虑的多尺度信息,并在多个尺度信息上进行二阶建模以及联合一阶信息进行预测,最后整合多个尺度的信息来获得最终的类别预测。在二阶建模时通过分组的策略来降低协方差计算带来的计算消耗,与简单的分组不同,本发明使用的方法在不同组之间进行协方差的计算,以此来增强不同组之间的联系,并在计算协方差池化之前和之后分别利用降维和下采样的操作来进一步降低计算消耗,提升效率。最后,本发明所述方法在乳腺癌病理图像上实现了91.67%的识别准确率,这相比于仅使用Swin Transformer的方法取得86.67%的准确率提升了5%的准确率。将本具体实施例的方法应用于实践中,对乳腺癌病理图像进行分类,可为相关从业医生提供真实可靠、科学的临床诊断参考,提高诊断准确率。
实施例四
本实施例提供了一种计算机设备,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,所述处理器执行所述程序时实现如上述实施例一所述的基于Transformer的多尺度二阶病理图像分类方法中的步骤。
与现有技术相比,首先,本发明方案考虑了此前乳腺癌病理图像分类方法中未曾考虑的多尺度信息,并在多个尺度信息上进行二阶建模以及联合一阶信息进行预测,最后整合多个尺度的信息来获得最终的类别预测。在二阶建模时通过分组的策略来降低协方差计算带来的计算消耗,与简单的分组不同,本发明使用的方法在不同组之间进行协方差的计算,以此来增强不同组之间的联系,并在计算协方差池化之前和之后分别利用降维和下采样的操作来进一步降低计算消耗,提升效率。最后,本发明所述方法在乳腺癌病理图像上实现了91.67%的识别准确率,这相比于仅使用Swin Transformer的方法取得86.67%的准确率提升了5%的准确率。将本具体实施例的方法应用于实践中,对乳腺癌病理图像进行分类,可为相关从业医生提供真实可靠、科学的临床诊断参考,提高诊断准确率。
以上实施例二至四中涉及的各步骤或模块与实施例一相对应,具体实施方式可参见实施例一的相关说明部分。术语“计算机可读存储介质”应该理解为包括一个或多个指令集的单个介质或多个介质;还应当被理解为包括任何介质,所述任何介质能够存储、编码或承载用于由处理器执行的指令集并使处理器执行本发明中的任一方法。
以上所述仅为本发明的优选实施例而已,并不用于限制本发明,对于本领域的技术人员来说,本发明可以有各种更改和变化。凡在本发明的精神和原则之内,所作的任何修改、等同替换、改进等,均应包含在本发明的保护范围之内。
Claims (5)
1.一种基于Transformer的多尺度二阶病理图像分类方法,其特征在于,包括:
获取待分类病理图像,对待分类病理图像进行预处理;
将预处理后的待分类病理图像输入至Swin Transformer网络中,提取待分类病理图像的多尺度特征;所述多尺度特征包含来自不同阶段的单尺度特征,不包含SwinTransformer网络第一阶段提取的特征;
将多个单尺度特征分别输入至二阶池化模块和一阶池化模块,提取单尺度二阶特征和单尺度一阶特征;具体过程为,将每个单尺度特征分别输入至二阶池化模块,采用二阶池化处理,提取单尺度二阶特征:将单尺度特征输入至二阶池化模块,对单个尺度的特征维度进行特征映射;通过重塑操作对单尺度特征的维数进行分组,并计算相邻组之间的协方差矩阵;拼接各协方差矩阵获得整体协方差矩阵,对整体协方差矩阵进行展平操作获得单尺度二阶特征;将每个单尺度特征分别输入至一阶池化模块,通过全局平均池化计算单尺度一阶特征;
分别对所述单尺度二阶特征和单尺度一阶特征进行类别预测,并联合预测结果,获得单尺度预测分数;具体为:
其中,和/>表示用于分类的全连接层,/>和/>分别表示单尺度一阶特征和单尺度二阶特征,/>表示Swin Transformer的第/>个阶段;通过计算均值获得单尺度预测分数/>;
融合多个单尺度预测分数,输出待分类病理图像的类别预测结果;具体为,通过对多个单尺度预测分数进行求和,得到最终类别预测结果。
2.如权利要求1所述的基于Transformer的多尺度二阶病理图像分类方法,其特征在于,所述预处理包括:
使用随机水平翻转图像、随机垂直翻转图像以及随机旋转图像的数据增强方式,统一待分类病理图像的尺寸。
3.一种基于Transformer的多尺度二阶病理图像分类***,其特征在于,包括:
图像获取及预处理模块,用于获取待分类病理图像,对待分类病理图像进行预处理;
多尺度特征提取模块,用于将预处理后的待分类病理图像输入至Swin Transformer网络中,提取待分类病理图像的多尺度特征;所述多尺度特征包含来自不同阶段的单尺度特征,不包含Swin Transformer网络第一阶段提取的特征;
单尺度特征池化模块,用于将多个单尺度特征分别输入至二阶池化模块和一阶池化模块,提取单尺度二阶特征和单尺度一阶特征;具体过程为,将每个单尺度特征分别输入至二阶池化模块,采用二阶池化处理,提取单尺度二阶特征:将单尺度特征输入至二阶池化模块,对单个尺度的特征维度进行特征映射;通过重塑操作对单尺度特征的维数进行分组,并计算相邻组之间的协方差矩阵;拼接各协方差矩阵获得整体协方差矩阵,对整体协方差矩阵进行展平操作获得单尺度二阶特征;将每个单尺度特征分别输入至一阶池化模块,通过全局平均池化计算单尺度一阶特征;
单尺度预测分数计算模块,用于分别对所述单尺度二阶特征和单尺度一阶特征进行类别预测,并联合预测结果,获得单尺度预测分数;具体为:
其中,和/>表示用于分类的全连接层,/>和/>分别表示单尺度一阶特征和单尺度二阶特征,/>表示Swin Transformer的第/>个阶段;通过计算均值获得单尺度预测分数/>;
最终分类预测模块,用于融合多个单尺度预测分数,输出待分类病理图像的类别预测结果;具体为,通过对多个单尺度预测分数进行求和,得到最终类别预测结果。
4.一种计算机可读存储介质,其上存储有计算机程序,其特征在于,所述程序被处理器执行时实现如权利要求1-2中任一项所述的基于Transformer的多尺度二阶病理图像分类方法中的步骤。
5.一种计算机设备,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,其特征在于,所述处理器执行所述程序时实现如权利要求1-2中任一项所述的基于Transformer的多尺度二阶病理图像分类方法中的步骤。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202311810060.5A CN117496323B (zh) | 2023-12-27 | 2023-12-27 | 基于Transformer的多尺度二阶病理图像分类方法及*** |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202311810060.5A CN117496323B (zh) | 2023-12-27 | 2023-12-27 | 基于Transformer的多尺度二阶病理图像分类方法及*** |
Publications (2)
Publication Number | Publication Date |
---|---|
CN117496323A CN117496323A (zh) | 2024-02-02 |
CN117496323B true CN117496323B (zh) | 2024-03-29 |
Family
ID=89680292
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202311810060.5A Active CN117496323B (zh) | 2023-12-27 | 2023-12-27 | 基于Transformer的多尺度二阶病理图像分类方法及*** |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN117496323B (zh) |
Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN113673489A (zh) * | 2021-10-21 | 2021-11-19 | 之江实验室 | 一种基于级联Transformer的视频群体行为识别方法 |
CN115471448A (zh) * | 2022-07-18 | 2022-12-13 | 中日友好医院(中日友好临床医学研究所) | 基于人工智能的胸腺瘤组织病理的分型方法及装置 |
CN115861281A (zh) * | 2022-12-26 | 2023-03-28 | 浙江工业大学 | 一种基于多尺度特征的免锚框表面缺陷检测方法 |
CN116030307A (zh) * | 2023-02-03 | 2023-04-28 | 山东大学 | 基于上下文感知多尺度特征融合的乳腺病理图像识别*** |
CN117152506A (zh) * | 2023-08-25 | 2023-12-01 | 广州市第一人民医院(广州消化疾病中心、广州医科大学附属市一人民医院、华南理工大学附属第二医院) | 基于多尺度特征的三阴性乳腺癌免疫表型预测方法及*** |
Family Cites Families (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US7054504B2 (en) * | 1999-02-25 | 2006-05-30 | Ludwig Lester F | Relative optical path phase reconstruction in the correction of misfocused images using fractional powers of the fourier transform |
CN114821238B (zh) * | 2022-05-10 | 2022-09-13 | 山东建筑大学 | 基于全局细节补充的卷积神经网络的图像识别方法及*** |
-
2023
- 2023-12-27 CN CN202311810060.5A patent/CN117496323B/zh active Active
Patent Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN113673489A (zh) * | 2021-10-21 | 2021-11-19 | 之江实验室 | 一种基于级联Transformer的视频群体行为识别方法 |
CN115471448A (zh) * | 2022-07-18 | 2022-12-13 | 中日友好医院(中日友好临床医学研究所) | 基于人工智能的胸腺瘤组织病理的分型方法及装置 |
CN115861281A (zh) * | 2022-12-26 | 2023-03-28 | 浙江工业大学 | 一种基于多尺度特征的免锚框表面缺陷检测方法 |
CN116030307A (zh) * | 2023-02-03 | 2023-04-28 | 山东大学 | 基于上下文感知多尺度特征融合的乳腺病理图像识别*** |
CN117152506A (zh) * | 2023-08-25 | 2023-12-01 | 广州市第一人民医院(广州消化疾病中心、广州医科大学附属市一人民医院、华南理工大学附属第二医院) | 基于多尺度特征的三阴性乳腺癌免疫表型预测方法及*** |
Non-Patent Citations (2)
Title |
---|
MIFNet:基于多尺度输入与特征融合的胃癌病理图像分割方法;张泽中;高敬阳;赵地;;计算机应用;20191230(S2);全文 * |
深度细粒度图像识别研究综述;邓旭冉;闵少波;徐静远;李攀登;谢洪涛;张勇东;;南京信息工程大学学报(自然科学版);20191128(06);全文 * |
Also Published As
Publication number | Publication date |
---|---|
CN117496323A (zh) | 2024-02-02 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN108446730B (zh) | 一种基于深度学习的ct肺结节检测装置 | |
CN110503630B (zh) | 一种基于三维深度学习模型的脑出血分类、定位与预测方法 | |
CN110689025B (zh) | 图像识别方法、装置、***及内窥镜图像识别方法、装置 | |
EP4006831A1 (en) | Image processing method and apparatus, server, medical image processing device and storage medium | |
CN116313083B (zh) | 基于算法和大数据的糖尿病智慧互联远程实时监测管理*** | |
CN113077434B (zh) | 基于多模态信息的肺癌识别方法、装置及存储介质 | |
CN112465905A (zh) | 基于深度学习的磁共振成像数据的特征脑区定位方法 | |
CN114565761A (zh) | 一种基于深度学习的肾透明细胞癌病理图像肿瘤区域的分割方法 | |
CN115797929A (zh) | 基于双注意力机制的小型农田图像分割方法、装置 | |
CN112508884A (zh) | 一种癌变区域综合检测装置及方法 | |
CN113782184A (zh) | 一种基于面部关键点与特征预学习的脑卒中辅助评估*** | |
CN116091490A (zh) | 一种基于YOLOv4-CA-CBAM-K-means++-SIOU的肺结节检测方法 | |
CN117975170B (zh) | 基于大数据的医疗信息处理方法及*** | |
Elayaraja et al. | An efficient approach for detection and classification of cancer regions in cervical images using optimization based CNN classification approach | |
CN117237351B (zh) | 一种超声图像分析方法以及相关装置 | |
CN113724185B (zh) | 用于图像分类的模型处理方法、装置及存储介质 | |
CN117010971B (zh) | 一种基于人像识别的智能健康险提供方法及*** | |
CN117274278B (zh) | 基于模拟感受野的视网膜图像病灶部位分割方法及*** | |
CN113705670A (zh) | 基于磁共振成像和深度学习的脑部图像分类方法及设备 | |
CN107590806B (zh) | 一种基于大脑医学成像的检测方法和*** | |
CN113284613A (zh) | 一种基于深度学习的人脸诊断*** | |
CN116228759B (zh) | 肾细胞癌类型的计算机辅助诊断***及设备 | |
CN112861881A (zh) | 一种基于改进MobileNet模型的蜂窝肺识别方法 | |
CN117237599A (zh) | 图像目标检测方法及装置 | |
CN117496323B (zh) | 基于Transformer的多尺度二阶病理图像分类方法及*** |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |