CN104182755B - 基于塔形pca的乳腺钼靶x线图像块特征提取方法 - Google Patents
基于塔形pca的乳腺钼靶x线图像块特征提取方法 Download PDFInfo
- Publication number
- CN104182755B CN104182755B CN201410437632.4A CN201410437632A CN104182755B CN 104182755 B CN104182755 B CN 104182755B CN 201410437632 A CN201410437632 A CN 201410437632A CN 104182755 B CN104182755 B CN 104182755B
- Authority
- CN
- China
- Prior art keywords
- layer
- feature
- gray
- image
- mammograms
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired - Fee Related
Links
- 238000000513 principal component analysis Methods 0.000 title claims abstract description 44
- 210000005075 mammary gland Anatomy 0.000 title claims abstract description 34
- ZOKXTWBITQBERF-UHFFFAOYSA-N Molybdenum Chemical compound [Mo] ZOKXTWBITQBERF-UHFFFAOYSA-N 0.000 title claims abstract description 28
- 229910052750 molybdenum Inorganic materials 0.000 title claims abstract description 28
- 239000011733 molybdenum Substances 0.000 title claims abstract description 28
- 238000000605 extraction Methods 0.000 title abstract description 6
- 238000000034 method Methods 0.000 claims abstract description 82
- 239000013598 vector Substances 0.000 claims abstract description 77
- 238000012549 training Methods 0.000 claims abstract description 38
- 239000000470 constituent Substances 0.000 claims description 40
- 239000011159 matrix material Substances 0.000 claims description 37
- 238000012937 correction Methods 0.000 claims description 31
- 210000002445 nipple Anatomy 0.000 claims description 31
- 210000000481 breast Anatomy 0.000 claims description 22
- 206010028980 Neoplasm Diseases 0.000 claims description 20
- 239000000203 mixture Substances 0.000 claims description 18
- 238000005070 sampling Methods 0.000 claims description 16
- 239000000284 extract Substances 0.000 claims description 12
- 230000011218 segmentation Effects 0.000 claims description 10
- 238000004458 analytical method Methods 0.000 claims description 6
- 210000001519 tissue Anatomy 0.000 claims description 4
- 238000006243 chemical reaction Methods 0.000 claims description 3
- 238000001914 filtration Methods 0.000 claims description 3
- 210000004907 gland Anatomy 0.000 claims description 3
- 230000001174 ascending effect Effects 0.000 claims description 2
- 230000000717 retained effect Effects 0.000 claims 1
- 230000017105 transposition Effects 0.000 claims 1
- 238000001514 detection method Methods 0.000 abstract description 10
- 238000003759 clinical diagnosis Methods 0.000 abstract description 2
- 230000007547 defect Effects 0.000 abstract 1
- 238000000105 evaporative light scattering detection Methods 0.000 description 14
- 230000009467 reduction Effects 0.000 description 14
- 238000002474 experimental method Methods 0.000 description 8
- 238000012360 testing method Methods 0.000 description 8
- 238000005516 engineering process Methods 0.000 description 7
- 230000007812 deficiency Effects 0.000 description 5
- 230000003211 malignant effect Effects 0.000 description 5
- 238000003745 diagnosis Methods 0.000 description 4
- 238000012545 processing Methods 0.000 description 4
- 230000000694 effects Effects 0.000 description 3
- 230000005855 radiation Effects 0.000 description 3
- 201000011510 cancer Diseases 0.000 description 2
- 238000007689 inspection Methods 0.000 description 2
- 230000003902 lesion Effects 0.000 description 2
- 238000012706 support-vector machine Methods 0.000 description 2
- 206010006187 Breast cancer Diseases 0.000 description 1
- 238000010276 construction Methods 0.000 description 1
- 238000007796 conventional method Methods 0.000 description 1
- 238000010586 diagram Methods 0.000 description 1
- 230000009977 dual effect Effects 0.000 description 1
- 230000002708 enhancing effect Effects 0.000 description 1
- 230000004927 fusion Effects 0.000 description 1
- 230000000762 glandular Effects 0.000 description 1
- 238000003709 image segmentation Methods 0.000 description 1
- 238000002372 labelling Methods 0.000 description 1
- 238000009607 mammography Methods 0.000 description 1
- 238000013507 mapping Methods 0.000 description 1
- 230000000505 pernicious effect Effects 0.000 description 1
- 238000002601 radiography Methods 0.000 description 1
- 230000004044 response Effects 0.000 description 1
- 238000004088 simulation Methods 0.000 description 1
- 230000008961 swelling Effects 0.000 description 1
Landscapes
- Apparatus For Radiation Diagnosis (AREA)
- Image Processing (AREA)
Abstract
本发明公开了一种基于塔形PCA的乳腺钼靶X线图像块特征提取方法,主要解决现有技术提取的特征中不包含肿块中间密度大边缘密度小这一特征的缺点。其实现步骤是:(1)预处理;(2)构成塔形结构;(3)获得各图像层的灰度特征向量;(4)训练各图像层灰度特征的特征空间;(5)获得各图像层的主成分特征;(6)获得基于塔形PCA的乳腺钼靶X线图像块特征。本发明能使乳腺钼靶X线图像块的特征表示更为鲁棒,更为有效的表示图像特征,提高乳腺钼靶X线摄影图像中肿块区域检测的准确率,从而辅助放射科医生进行临床诊断。
Description
技术领域
本发明属于图像处理技术领域。更进一步涉及在医学影像处理技术领域中一种基于塔形主成分分析(Principal Component Analysis,PCA)的乳腺钼靶X线图像块灰度特征提取方法。本发明是根据乳腺肿块图像中间密度大边缘密度小分布情况,对乳腺图像块进行分层特征提取,同时对分层提取的灰度特征分别进行主成分分析,从而提高乳腺钼靶X线摄影图像中肿块区域检测的准确率。本发明可用于临床医疗病变区域检测,提高检出率,降低检测假阳率,辅助放射科医生进行临床诊断。
背景技术
目前,在临床医疗诊断中运用的图像特征灰度直观特征、灰度统计特征、变换域特征、代数特征。在图像处理中,灰度特征是最直观也是最全面表达图像的特征,可以很好地反应图像的灰度分布信息。灰度特征是最容易提取的特征,被广泛运用到图像的特征提取中,很多算法都是对灰度进行抽取得到的。为了对图像有更深层次、更本质的描述,去除特征冗余性,很多特征是在对灰度进行主成分分析(PCA)后获得的。
浙江大学申请的专利“基于主元分析和支持向量机的人脸检测方法”(申请号:201110446113.0,公开号:CN102592145A)中公开了一种对输入图像区域进行主成分分析的特征提取方法。该方法先将彩色图像转换为大小统一的灰度图,再对处理后的图像进行主成分分析(PCA),同时用支持向量机对分析的结果进行分类。该方法存在的不足是,直接将灰度图直接拉成列向量进行主成分分析(PCA),没有将图像的分布信息和空间信息融合进去,不能表征图像之间空间与位置上的关系。
李男的学位论文“基于PCA的乳腺肿块辅助诊断方法研究”(沈阳工业大学,2013年)公开了一种降低图像特征维数的方法。该方法利用主成分分析(PCA)的方法降低医学图像特征维数,去除特征之间的相关性,使得处理速度得到提高而不影响实验精度。但是,该方法仍然存在的不足是,选取的特征是直接将感兴趣区域拉成列向量,没有将组织的分布特征和空间特征融合进去,由此造成组织信息表征不完全,影响了乳腺肿块的诊断准确性。
马萌的学位论文“基于Directionlet和稀疏表示的乳腺X线图像检测和增强”(硕士学位论文,西安电子科技大学,2012年)公开了一种将“本征脸”特征运用到乳腺图像中的特征提取方法。该方法先提取样本图像块的“本征脸”特征,构建字典,然后直接获取测试图像块的“本征脸”特征,对特征进行分类,以特征在字典中的稀疏表示系数作为分类评判标准。该方法存在的不足是:特征维数太高,存在信息冗余,没有突出整体图像块中间密度大边缘密度小的重要性,分类准确率不高。
中山大学申请的专利“一种基于结构主元分析的人脸识别方法”(申请号:200610124229.1,公开号:CN100423020C),公开了一种用二维主成分分析(2DPCA)计算每个图像块的主元和主元特征的方法。该方法先将几何规整后的图像分割为30个互不重叠且大小一致的图像块,然后计算图像块的结构主元,再由图像块左乘各个结构主元得到图像块的结构主元特征。该方法的不足是:图像块的划分方式对图像块内包含的内容定义不明确,不能完全运用在乳腺特征中。
发明内容
本发明的目的在于克服上述现有技术的不足,提出一种基于塔形PCA的乳腺钼靶X线图像块特征提取方法,以使图像特征表示更为鲁棒,提高乳腺钼靶X线摄影图像的肿块区域检出率。
实现本发明的技术思路是,通过滑动窗提取乳腺钼靶X线摄影图像中乳腺部分的图像块,将乳腺钼靶X线图像块由内而外划分为5层,构成一个塔形结构,分层提取乳腺钼靶X线图像块的灰度特征,同时对乳腺钼靶X线图像块各层灰度特征进行分层降维。在分层降维的过程中,乳腺钼靶X线图像块第一层灰度特征降维后的特征维数最高,随着层数变高,降维后的特征维数变少,使符合乳腺钼靶X线图像块中间的灰度信息量多,边缘信息量少的特点,将乳腺钼靶X线图像块中间密度大边缘密度小的特征表征出来,达到更为准确地表征乳腺钼靶X线图像块的灰度特征,更为合理地加入乳腺肿块密度分布特征,更为鲁棒地表示乳腺钼靶X线图像块,提高乳腺钼靶X线摄影图像病变区域检出率的目的。
为实现上述目的,本发明包括如下主要步骤:
(1)预处理:
(1a)采用中值滤波的方法,对乳腺钼靶X线摄影图像进行去噪处理;
(1b)对去噪后的乳腺钼靶X线摄影图像进行下5采样,得到下采样后的乳腺钼靶X线图像;
(1c)对下采样后的乳腺钼靶X线图像,从其上边缘向下裁剪40行,从其下边缘向上裁剪40行,从其左边缘向右裁剪10列,从其右边缘向左裁剪10列,得到剪裁后的乳腺钼靶X线摄影图像;
(1d)采用最大类间方差法,对裁剪后的乳腺钼靶X线图像进行二值化处理,获得乳腺组织区域;
(1e)设置滑动窗窗口的大小为100×100个像素,在获得的乳腺组织区域中按行的方向滑动扫描,滑动窗每次滑动截取一个大小为100×100个像素乳腺钼靶X线图像块;
(2)构成塔形结构:
(2a)将乳腺钼靶X线图像块的第34行、第65行、第34列及第65列所围成的正方形区域作为第一层图像层;
(2b)由第一层图像层向上、下、左、右四个方向各延伸8个像素,将延伸的区域作为第二层图像层;
(2c)由第二层图像层向上、下、左、右四个方向各延伸8个像素,将延伸的区域作为第三层图像层;
(2d)由第三层图像层向上、下、左、右四个方向各延伸8个像素,将延伸的区域作为第四层图像层;
(2e)由第四层图像层向上、下、左、右四个方向延伸至填充整个乳腺钼靶X线图像块,将延伸的区域作为第五层图像层;
(3)获得各图像层的灰度特征向量:
采用灰度特征提取方法,逐层提取乳腺钼靶X线图像块的灰度特征,获得乳腺钼靶X线图像块各图像层的灰度特征向量;
(4)训练各图像层灰度特征的特征空间:
从乳腺影像数字数据库DDSM数据库中,选取500幅乳腺肿块图像作为训练图像,采用主成分分析PCA方法,训练得到各图像层灰度特征的特征空间:
(4a)按照步骤(2)的塔形结构划分方法,分别将500幅训练图像中每幅训练图像划分为5层图像层;
(4b)采用灰度特征提取方法,逐层提取500幅训练图像中每幅训练图像各图像层的灰度特征向量,将第一层所提取的500个灰度特征向量按列组成第一层灰度特征矩阵G1,将第二层所提取的500个灰度特征向量按列组成第二层灰度特征矩阵G2,将第三层所提取的500个灰度特征向量按列组成第三层灰度特征矩阵G3,将第四层所提取的500个灰度特征向量按列组成第四层灰度特征矩阵G4,将第五层所提取的500个灰度特征向量按列组成第五层灰度特征矩阵G5;
(4c)采用主成分分析PCA方法,分别提取各层灰度特征矩阵的主成分,得到由20个主成分组成的第一层灰度特征的特征空间D1,由16个主成分组成的第二层灰度特征的特征空间D2,由8个主成分组成的第三层灰度特征的特征空间D3,由4个主成分组成的第四层灰度特征的特征空间D4,由2个主成分组成的第五层灰度特征的特征空间D5;
(5)获得各图像层的主成分特征:
(5a)用乳腺钼靶X线图像块第一层图像层的灰度特征向量左乘第一层灰度特征的特征空间D1的转置,得到乳腺钼靶X线图像块第一个图像层的主成分特征,将第一个图像层灰度特征维数降低至20维;
(5b)用乳腺钼靶X线图像块第二层图像层的灰度特征向量左乘第二层灰度特征的特征空间D2的转置,得到乳腺钼靶X线图像块第二个图像层的主成分特征,将第二个图像层灰度特征维数降低至16维;
(5c)用乳腺钼靶X线图像块第三层图像层的灰度特征向量左乘第三层灰度特征的特征空间D3的转置,得到乳腺钼靶X线图像块第三个图像层的主成分特征,将第三个图像层灰度特征维数降低至8维;
(5d)用乳腺钼靶X线图像块第四层图像层的灰度特征向量左乘第四层灰度特征的特征空间D4的转置,得到乳腺钼靶X线图像块第四个图像层的主成分特征,将第四个图像层灰度特征维数降低至4维;
(5e)用乳腺钼靶X线图像块第五层图像层的灰度特征向量左乘第五层灰度特征的特征空间D5的转置,得到乳腺钼靶X线图像块第五个图像层的主成分特征,将第五个图像层灰度特征维数降低至2维;
(6)获得基于塔形PCA的乳腺钼靶X线图像块特征:
将获得的乳腺钼靶X线图像块5个图像层的主成分特征,按第一层至第五层的顺序依次首尾相连,获得基于塔形主成分分析PCA的乳腺钼靶X线图像块特征向量。
本发明与现有方法相比具有如下优点:
第一,由于本发明采用了按照构造的塔形结构进行分层降维的方式,克服了现有技术主成分分析方法直接提取特征主成分方法固定的缺点,使得本发明具有提取的特征符合肿块中间灰度信息量多,边缘信息量少的特点,获得的基于塔形PCA的灰度特征更为合理。
第二,由于本发明采用了分层提取乳腺钼靶X线图像块的灰度特征的方式,克服了现有技术灰度特征提取方法固定、不考虑肿块空间分布特征的缺点,使得本发明提取的乳腺钼靶X线图像块的灰度特征更为精确,提取的灰度特征包含乳腺肿块密度分布特征更为完整,提高了组织信息表征的完全性。
第三,由于本发明利用主成分分析PCA对提取的各层灰度特征进行分层降维,克服了现有技术提取的特征维数太高,使得本发明获得的基于塔形PCA的灰度特征去除了特征之间的相关性和冗余信息,突出了整体乳腺钼靶X线图像块中间密度大边缘密度小的重要性,提高了乳腺钼靶X线摄影图像中肿块的检出率。
第四,由于本发明构建塔形结构的方式与肿块延伸方式相关,克服了现有技术特征提取方法中不包含肿块由中间向外延伸生长特征的缺点,提高了特征提取方式对乳腺图像的适应性。
附图说明
图1为本发明的流程图。
具体实施方式
下面结合附图1,对本发明实现的步骤作进一步的详细描述。
步骤1,预处理。
对乳腺钼靶X线摄影图像进行预处理,经滑动窗获取得到的乳腺钼靶X线图像块,乳腺钼靶X线图像块的宽度为100个像素,乳腺钼靶X线图像块的高度为100个像素。
对乳腺钼靶X线摄影图像进行预处理的方法按如下步骤进行:
第一步,采用中值滤波的方法,对乳腺钼靶X线摄影图像进行去噪处理:将中值滤波器的滑动窗设置为3×3个像素的正方形窗,用正方形窗沿着乳腺钼靶X线摄影图像行的方向逐像素滑动,在每一次滑动期间内,将正方形窗中的所有像素的灰度值,按照由小到大的顺序进行排序,选取排序结果的中间值,替代正方形窗中心位置像素的灰度值。
第二步,对去噪后的乳腺钼靶X线摄影图像进行下5采样,得到下采样后的乳腺钼靶X线图像:首先,将下采样的采样间隔设置为5;然后,在去噪后的乳腺钼靶X线摄影图像中每隔5个像素保留一个像素,将保留的所有像素构成下采样后的乳腺钼靶X线图像得到下采样后的乳腺钼靶X线图像。
第三步,对下采样后的乳腺钼靶X线图像,从其上边缘向下裁剪40行,从其下边缘向上裁剪40行,从其左边缘向右裁剪10列,从其右边缘向左裁剪10列,得到剪裁后的乳腺钼靶X线摄影图像。
第四步,采用最大类间方差法,对裁剪后的乳腺钼靶X线图像进行二值化处理,获得乳腺组织区域,具体实施方法如下:
对裁剪后的乳腺钼靶X线图像中所有像素的灰度值求平均值,得到裁剪后的乳腺钼靶X线图像的平均灰度值u。
在裁剪后的乳腺钼靶X线图像中所有像素的灰度值中,选取最小值与最大值范围之间的任意一个灰度值,作为目标与背景的分割阈值t。
按照下式,计算目标与背景的类间方差:
G=w1×(u1-u)2+w2×(u2-u)2
其中,G表示裁剪后的乳腺钼靶X线图像目标与背景的类间方差,w1表示裁剪后的乳腺钼靶X线图像中灰度值大于分割阈值t的目标像素个数与乳腺钼靶X线图像总像素个数之比,u1表示裁剪后的乳腺钼靶X线图像目标像素的平均灰度值,u表示裁剪后的乳腺钼靶X线图像的平均灰度值,w2表示裁剪后的乳腺钼靶X线图像中灰度值小于或等于分割阈值t的背景像素个数与乳腺钼靶X线图像总像素个数之比,u2表示裁剪后的乳腺钼靶X线图像背景像素的平均灰度值。
遍历目标与背景的分割阈值t的所有取值,找寻类间方差G最大时,分割阈值t所对应的取值,将该值作为最佳分割阈值。
提取裁剪后的乳腺钼靶X线图像所有灰度值大于最佳分割阈值t的像素,构成乳腺组织区域。
第五步,设置滑动窗窗口的大小为100×100个像素,在获得的乳腺组织区域中按行的方向滑动扫描,滑动窗每次滑动截取一个大小为100×100个像素乳腺钼靶X线图像块。
步骤2,构成塔形结构。
将乳腺钼靶X线图像块由中心向外划分为5层图像层,构成一个塔形结构:
第一步,将乳腺钼靶X线图像块的第34行、第65行、第34列及第65列所围成的正方形区域作为第一层图像层。
第二步,由第一层图像层向上、下、左、右四个方向各延伸8个像素,将延伸的区域作为第二层图像层。
第三步,由第二层图像层向上、下、左、右四个方向各延伸8个像素,将延伸的区域作为第三层图像层。
第四步,由第三层图像层向上、下、左、右四个方向各延伸8个像素,将延伸的区域作为第四层图像层。
第五步,由第四层图像层向上、下、左、右四个方向延伸至填充整个乳腺钼靶X线图像块,将延伸的区域作为第五层图像层。
步骤3,获得各图像层的灰度特征向量。
采用灰度特征提取方法,逐层提取乳腺钼靶X线图像块的灰度特征,获得乳腺钼靶X线图像块各图像层的灰度特征向量。
灰度特征提取方法按如下步骤进行:
第一步,逐列提取构成乳腺钼靶X线图像块第k层图像层的乳腺图像区域的灰度值。
第二步,组合提取的各列灰度值,得到构成乳腺钼靶X线图像块第k层图像层的乳腺图像区域的灰度特征列向量。
步骤4,训练各图像层灰度特征的特征空间。
从乳腺影像数字数据库DDSM数据库中,选取500幅乳腺肿块图像作为训练图像,采用主成分分析PCA方法,训练得到各图像层灰度特征的特征空间。
第一步,按照步骤2的塔形结构划分方法,分别将500幅训练图像中每幅训练图像划分为5层图像层。
第二步,采用灰度特征提取方法,逐层提取500幅训练图像中每幅训练图像各图像层的灰度特征向量,将第一层所提取的500个灰度特征向量按列组成第一层灰度特征矩阵G1,将第二层所提取的500个灰度特征向量按列组成第二层灰度特征矩阵G2,将第三层所提取的500个灰度特征向量按列组成第三层灰度特征矩阵G3,将第四层所提取的500个灰度特征向量按列组成第四层灰度特征矩阵G4,将第五层所提取的500个灰度特征向量按列组成第五层灰度特征矩阵G5。
采用灰度特征提取方法逐层提取每幅训练图像各图像层的灰度特征向量的具体实施方法如下:
逐列提取构成第i幅训练图像第k层图像层的乳腺图像区域的灰度值。
组合提取的各列灰度值,得到构成第i幅训练图像第k层图像层的乳腺图像区域的灰度特征列向量。
第三步,采用主成分分析PCA方法,分别提取各层灰度特征矩阵的主成分,得到由20个主成分组成的第一层灰度特征的特征空间D1,由16个主成分组成的第二层灰度特征的特征空间D2,由8个主成分组成的第三层灰度特征的特征空间D3,由4个主成分组成的第四层灰度特征的特征空间D4,由2个主成分组成的第五层灰度特征的特征空间D5。
采用主成分分析PCA方法分别提取各层灰度特征矩阵的主成分组成各层灰度特征的特征空间的具体实施方法如下:
本步骤中第二步得到的第k层灰度特征矩阵Gk的构成结构如下:
Gk=[gk1,gk2,…gki,…gk500]
其中,Gk表示第k层灰度特征矩阵,gki表示第i幅训练图像在第k层的灰度特征列向量。
按照下式,计算第k层的灰度特征向量平均值Ψk:
其中,Ψk表示第k层的灰度特征向量平均值,i表示训练图像的标号,gki表示第i幅训练图像在第k层的灰度特征列向量。
按照下式,计算得到每一幅训练图像在第k层的灰度特征列向量与第k层的灰度特征向量平均值的差值:
dki=gki-Ψk
其中,dki表示第i幅训练图像在第k层的灰度特征列向量与第k层的灰度特征向量平均值的差值,Ψk表示第k层的灰度特征向量平均值,i表示训练图像的标号,gki表示第i幅训练图像在该层的灰度特征列向量。
按照下式,构建第k层的差值矩阵Ak:
Ak=[dk1,dk2,…dki,…dk500]
其中,Ak表示第k层的差值矩阵,i表示训练图像的标号,dki表示第i幅训练图像在第k层的灰度特征列向量与该层的灰度特征向量平均值的差值。
按照下式,构建第k层的协方差矩阵Ck:
其中,Ck表示第k层的协方差矩阵,Ak表示第k层的差值矩阵,Ak T表示第k层的差值矩阵Ak的转置。
计算第k层的协方差矩阵Ck的特征值λki和正交归一化特征向量uki,根据贡献率选择前pk个最大特征值对应的特征向量,其中贡献率是指所选取的前pk个最大特征值之和与所有特征值之和的比值。将贡献率设定为90%,使满足前pk个最大特征值之和与所有特征值之和的比值大于等于90%的条件。按照下式,得到第k层灰度特征的特征空间:
其中,Dk表示第k层灰度特征的特征空间,表示前pk个最大特征值对应的特征向量,pk的值在第一层至第五层中分别对应于20、16、8、4、2。
步骤5,获得各图像层的主成分特征。
分别将乳腺钼靶X线图像块各图像层的灰度特征向量映射到相应图像层灰度特征的特征空间上,分层提取乳腺钼靶X线图像块各图像层灰度特征的主成分特征,达到分层降维的目的。
第一步,用乳腺钼靶X线图像块第一层图像层的灰度特征向量左乘第一层灰度特征的特征空间D1的转置,得到乳腺钼靶X线图像块第一个图像层的主成分特征,将第一个图像层灰度特征维数降低至20维。
第二步,用乳腺钼靶X线图像块第二层图像层的灰度特征向量左乘第二层灰度特征的特征空间D2的转置,得到乳腺钼靶X线图像块第二个图像层的主成分特征,将第二个图像层灰度特征维数降低至16维。
第三步,用乳腺钼靶X线图像块第三层图像层的灰度特征向量左乘第三层灰度特征的特征空间D3的转置,得到乳腺钼靶X线图像块第三个图像层的主成分特征,将第三个图像层灰度特征维数降低至8维。
第四步,用乳腺钼靶X线图像块第四层图像层的灰度特征向量左乘第四层灰度特征的特征空间D4的转置,得到乳腺钼靶X线图像块第四个图像层的主成分特征,将第四个图像层灰度特征维数降低至4维。
第五步,用乳腺钼靶X线图像块第五层图像层的灰度特征向量左乘第五层灰度特征的特征空间D5的转置,得到乳腺钼靶X线图像块第五个图像层的主成分特征,将第五个图像层灰度特征维数降低至2维。
步骤6,获得基于塔形PCA的乳腺钼靶X线图像块特征。
将获得的乳腺钼靶X线图像块5个图像层的主成分特征,按第一层至第五层的顺序依次首尾相连构成一个50维的列向量,获得基于塔形主成分分析PCA的乳腺钼靶X线图像块特征向量。
本发明的效果可以通过以下仿真实验做进一步的说明。
1.仿真条件:
本发明是在中央处理器为Intel(R)Core i3-2100 3.10GHZ、内存4G、WINDOWS 7操作***上,运用MATLAB软件进行的仿真。
2.仿真内容:
本发明对大量乳腺钼靶X线摄影图像进行了测试实验,实验图像来自于乳腺影像数字数据库DDSM数据库中任意选取的1191幅乳腺钼靶X线摄影图像。
本发明以检出率和假阳性率为指标对方法性能进行评测,仿真对比了不同特征提取方法对乳腺钼靶X线摄影图像进行肿块检测的检出率和假阳性率。仿真实验中,选取1191幅乳腺钼靶X线摄影图像中的200幅乳腺钼靶X线摄影图像作为肿块检测的训练集,其中包含肿块的乳腺钼靶X线摄影图像和正常的乳腺钼靶X线摄影图像各100幅,其余991幅乳腺钼靶X线摄影图像作为肿块检测的测试集,其中包含恶性肿块的乳腺钼靶X线摄影图像有508幅,包含良性肿块的乳腺钼靶X线摄影图像有483幅。对肿块检测的训练集图像进行特征提取形成字典,对肿块检测的测试图像进行滑动窗提取乳腺钼靶X线图像块而后进行特征提取,运用稀疏表示分类器得到第一次稀疏表示检测结果,再将标记出的肿块区域进行滑动窗合并,运用区域生长算法提取感兴趣区域,进行第二次稀疏表示检测,最终标记疑似肿块区域,达到检测的目的,得到检出率和假阳性率。检出率表征二次稀疏表示检测对肿块检测的测试集中正确检测出的肿块结果个数与肿块检测的测试集中所有肿块个数之比。假阳性率表征二次稀疏表示检测在肿块检测的测试集中平均每幅用作肿块检测的图像标记出的假阳个数。在保证检测模型相同的情况下,检出率和假阳性率直接反映了图像特征的优劣,因此检出率越高,假阳性率越低,表明图像特征越好。对于辅助放射科医生进行医学诊断的检测技术而言,两种指标中提高检出率更为重要。
本发明的仿真实验是对991幅乳腺钼靶X线摄影图像中,包含恶性肿块的乳腺钼靶X线摄影图像和包含良性肿块的乳腺钼靶X线摄影图像,进行肿块检测的检出率和假阳性率的进行了对比。对比实验结果如表1所示。
表1中的第一列中cancer表示数据库中包含恶性肿块的乳腺钼靶X线摄影图像的不同case,第三列中benign表示包含良性肿块的乳腺钼靶X线摄影图像的不同case,第二列和第五列中的分数表示检出率,其中,分子表示检测出的肿块数,分母表示该case中所有肿块数之和,第三列和第六列中的数字表示假阳性率。
由表1可见,恶性肿块的检出率更高,比良性肿块的检出率高8个百分点,同时恶性肿块的假阳性率相对良性肿块较低,平均每幅乳腺钼靶X线摄影图像中少0.7个。在对实验结果的分析中,发现本发明对于中心亮度区域较为敏感,这是因为本发明突出了乳腺肿块区域中间密度大边缘密度小的特点,所以能够更好地描述恶性乳腺肿块特征,由此获得在检出率上优于良性肿块的效果,验证了算法的特性。
表1本发明特征提取方法的乳腺肿块检测结果
本发明的第二个仿真实验是对多种特征提取方法,对钼靶X线摄影图像肿块检测的检出率进行对比,对比的多种特征提取方法包括对灰度特征直接降维的方法、提取方向梯度直方图(Histogram of Oriented Gradient,HOG)特征并进行降维的方法和本发明方法。对比实验结果如表2所示。
表2灰度特征直接降维以及HOG特征降维与本发明检出率对比
Cases | 直接降维 | HOG特征降维 | 本发明 |
cancer_01 | 19/41 | 34/41 | 37/41 |
cancer_02 | 30/62 | 48/62 | 54/62 |
cancer_05 | 35/50 | 43/50 | 43/50 |
cancer_06 | 16/31 | 23/31 | 28/31 |
平均检出率 | 100/184=0.54 | 148/184=0.80 | 162/184=0.88 |
表2中第一列中cancer表示数据库中包含恶性肿块的乳腺钼靶X线摄影图像的不同case,第二列中的分数表示利用灰度特征直接降维的方法进行肿块检测的检出率,第三列中的分数表示利用方向梯度直方图HOG特征降维的方法进行肿块检测的检出率,第四列中的分数表示用本发明的方法进行肿块检测的检出率。
由表2可见,本发明的检出率是三种方法中最高的,这是因为本发明突出了乳腺肿块区域中间密度大边缘密度小的特点,所以能够更好地描述乳腺肿块特征,由此获得在检出率上优于其他特征提取方法的效果,进一步验证了算法的先进性。
综上所述,本发明能有效地表示乳腺钼靶X线图像块的特征,提高了乳腺肿块的检出率,从而辅助放射科医生进行医学诊断。
Claims (6)
1.一种基于塔形PCA的乳腺钼靶X线图像块特征提取方法,包括如下步骤:
(1)预处理:
(1a)采用中值滤波的方法,对乳腺钼靶X线摄影图像进行去噪处理;
(1b)对去噪后的乳腺钼靶X线摄影图像进行下5采样,得到下采样后的乳腺钼靶X线图像;
(1c)对下采样后的乳腺钼靶X线图像,从其上边缘向下裁剪40行,从其下边缘向上裁剪40行,从其左边缘向右裁剪10列,从其右边缘向左裁剪10列,得到剪裁后的乳腺钼靶X线摄影图像;
(1d)采用最大类间方差法,对裁剪后的乳腺钼靶X线图像进行二值化处理,获得乳腺组织区域;
(1e)设置滑动窗窗口的大小为100×100个像素,在获得的乳腺组织区域中按行的方向滑动扫描,滑动窗每次滑动截取一个大小为100×100个像素乳腺钼靶X线图像块;
(2)构成塔形结构:
(2a)将乳腺钼靶X线图像块的第34行、第65行、第34列及第65列所围成的正方形区域作为第一层图像层;
(2b)由第一层图像层向上、下、左、右四个方向各延伸8个像素,将延伸的区域作为第二层图像层;
(2c)由第二层图像层向上、下、左、右四个方向各延伸8个像素,将延伸的区域作为第三层图像层;
(2d)由第三层图像层向上、下、左、右四个方向各延伸8个像素,将延伸的区域作为第四层图像层;
(2e)由第四层图像层向上、下、左、右四个方向延伸至填充整个乳腺钼靶X线图像块,将延伸的区域作为第五层图像层;
(3)获得各图像层的灰度特征向量:
采用灰度特征提取方法,逐层提取乳腺钼靶X线图像块的灰度特征,获得乳腺钼靶X线图像块各图像层的灰度特征向量;
(4)训练各图像层灰度特征的特征空间:
从乳腺影像数字数据库DDSM数据库中,选取500幅乳腺肿块图像作为训练图像,采用主成分分析PCA方法,训练得到各图像层灰度特征的特征空间:
(4a)按照步骤(2)的塔形结构划分方法,分别将500幅训练图像中每幅训练图像划分为5层图像层;
(4b)采用灰度特征提取方法,逐层提取500幅训练图像中每幅训练图像各图像层的灰度特征向量,将第一层所提取的500个灰度特征向量按列组成第一层灰度特征矩阵G1,将第二层所提取的500个灰度特征向量按列组成第二层灰度特征矩阵G2,将第三层所提取的500个灰度特征向量按列组成第三层灰度特征矩阵G3,将第四层所提取的500个灰度特征向量按列组成第四层灰度特征矩阵G4,将第五层所提取的500个灰度特征向量按列组成第五层灰度特征矩阵G5;
(4c)采用主成分分析PCA方法,分别提取各层灰度特征矩阵的主成分,得到由20个主成分组成的第一层灰度特征的特征空间D1,由16个主成分组成的第二层灰度特征的特征空间D2,由8个主成分组成的第三层灰度特征的特征空间D3,由4个主成分组成的第四层灰度特征的特征空间D4,由2个主成分组成的第五层灰度特征的特征空间D5;
(5)获得各图像层的主成分特征:
(5a)用乳腺钼靶X线图像块第一层图像层的灰度特征向量左乘第一层灰度特征的特征空间D1的转置,得到乳腺钼靶X线图像块第一个图像层的主成分特征,将第一个图像层灰度特征维数降低至20维;
(5b)用乳腺钼靶X线图像块第二层图像层的灰度特征向量左乘第二层灰度特征的特征空间D2的转置,得到乳腺钼靶X线图像块第二个图像层的主成分特征,将第二个图像层灰度特征维数降低至16维;
(5c)用乳腺钼靶X线图像块第三层图像层的灰度特征向量左乘第三层灰度特征的特征空间D3的转置,得到乳腺钼靶X线图像块第三个图像层的主成分特征,将第三个图像层灰度特征维数降低至8维;
(5d)用乳腺钼靶X线图像块第四层图像层的灰度特征向量左乘第四层灰度特征的特征空间D4的转置,得到乳腺钼靶X线图像块第四个图像层的主成分特征,将第四个图像层灰度特征维数降低至4维;
(5e)用乳腺钼靶X线图像块第五层图像层的灰度特征向量左乘第五层灰度特征的特征空间D5的转置,得到乳腺钼靶X线图像块第五个图像层的主成分特征,将第五个图像层灰度特征维数降低至2维;
(6)获得基于塔形PCA的乳腺钼靶X线图像块特征:
将获得的乳腺钼靶X线图像块5个图像层的主成分特征,按第一层至第五层的顺序依次首尾相连,获得基于塔形主成分分析PCA的乳腺钼靶X线图像块特征向量。
2.根据权利要求1所述的基于塔形PCA的乳腺钼靶X线图像块特征提取方法,其特征在于,步骤(1a)所述的中值滤波方法的步骤如下:
第一步,将中值滤波器的滑动窗设置为3×3个像素的正方形窗;
第二步,用正方形窗沿着乳腺钼靶X线摄影图像行的方向逐像素滑动,在每一次滑动期间内,将正方形窗中的所有像素的灰度值,按照由小到大的顺序进行排序,选取排序结果的中间值,替代正方形窗中心位置像素的灰度值。
3.根据权利要求1所述的基于塔形PCA的乳腺钼靶X线图像块特征提取方法,其特征在于,步骤(1b)所述的下5采样的步骤如下:
第一步,将下采样的采样间隔设置为5;
第二步,在去噪后的乳腺钼靶X线摄影图像中,每隔5个像素保留一个像素,将保留的所有像素构成下采样后的乳腺钼靶X线图像。
4.根据权利要求1所述的基于塔形PCA的乳腺钼靶X线图像块特征提取方法,其特征在于,步骤(1d)所述的最大类间方差法,按如下步骤进行:
第一步,对裁剪后的乳腺钼靶X线图像中所有像素的灰度值求平均值,得到裁剪后的乳腺钼靶X线图像的平均灰度值u;
第二步,在裁剪后的乳腺钼靶X线图像中所有像素的灰度值中,选取最小值与最大值范围之间的任意一个灰度值,作为目标与背景的分割阈值t;
第三步,按照下式,计算目标与背景的类间方差:
G=w1×(u1-u)2+w2×(u2-u)2
其中,G表示裁剪后的乳腺钼靶X线图像目标与背景的类间方差,w1表示裁剪后的乳腺钼靶X线图像中灰度值大于分割阈值t的目标像素个数与乳腺钼靶X线图像总像素个数之比,u1表示裁剪后的乳腺钼靶X线图像目标像素的平均灰度值,u表示裁剪后的乳腺钼靶X线图像的平均灰度值,w2表示裁剪后的乳腺钼靶X线图像中灰度值小于或等于分割阈值t的背景像素个数与乳腺钼靶X线图像总像素个数之比,u2表示裁剪后的乳腺钼靶X线图像背景像素的平均灰度值;
第四步,遍历目标与背景的分割阈值t的所有取值,找寻类间方差G最大时,分割阈值t所对应的取值,将该值作为最佳分割阈值;
第五步,提取裁剪后的乳腺钼靶X线图像所有灰度值大于最佳分割阈值t的像素,构成乳腺组织区域。
5.根据权利要求1所述的基于塔形PCA的乳腺钼靶X线图像块特征提取方法,其特征在于,步骤(3)、步骤(4b)所述的灰度特征提取方法的步骤如下:
第一步,逐层提取乳腺钼靶X线图像块的灰度特征;
第二步,组合提取的各层灰度值,得到乳腺钼靶X线图像块的灰度特征列向量。
6.根据权利要求1所述的基于塔形PCA的乳腺钼靶X线图像块特征提取方法,其特征在于,步骤(4c)所述的主成分分析PCA方法的步骤如下:
第一步,按照下式,构建第k层的灰度特征矩阵Gk:
Gk=[gk1,gk2,…gki,…gk500]
其中,Gk表示第k层灰度特征矩阵,gki表示第i幅训练图像在第k层的灰度特征列向量;
第二步,按照下式,计算第k层的灰度特征向量平均值Ψk:
其中,Ψk表示第k层的灰度特征向量平均值,i表示训练图像的标号,gki表示第i幅训练图像在第k层的灰度特征列向量;
第三步,按照下式,计算得到每一幅训练图像在第k层的灰度特征列向量与第k层的灰度特征向量平均值的差值:
dki=gki-Ψk
其中,dki表示第i幅训练图像在第k层的灰度特征列向量与第k层的灰度特征向量平均值的差值,Ψk表示第k层的灰度特征向量平均值,i表示训练图像的标号,gki表示第i幅训练图像在该层的灰度特征列向量;
第四步,按照下式,构建第k层的差值矩阵Ak:
Ak=[dk1,dk2,…dki,…dk500]
其中,Ak表示第k层的差值矩阵,i表示训练图像的标号,dki表示第i幅训练图像在第k层的灰度特征列向量与该层的灰度特征向量平均值的差值;
第五步,按照下式,构建第k层的协方差矩阵Ck:
其中,Ck表示第k层的协方差矩阵,Ak表示第k层的差值矩阵,Ak T表示第k层的差值矩阵Ak的转置;
第六步,计算第k层的协方差矩阵Ck的特征值λki和正交归一化特征向量uki,选择前pk个最大特征值对应的特征向量,按照下式,得到第k层灰度特征的特征空间:
其中,Dk表示第k层灰度特征的特征空间,表示前pk个最大特征值对应的特征向量。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201410437632.4A CN104182755B (zh) | 2014-08-30 | 2014-08-30 | 基于塔形pca的乳腺钼靶x线图像块特征提取方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201410437632.4A CN104182755B (zh) | 2014-08-30 | 2014-08-30 | 基于塔形pca的乳腺钼靶x线图像块特征提取方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN104182755A CN104182755A (zh) | 2014-12-03 |
CN104182755B true CN104182755B (zh) | 2017-04-12 |
Family
ID=51963782
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201410437632.4A Expired - Fee Related CN104182755B (zh) | 2014-08-30 | 2014-08-30 | 基于塔形pca的乳腺钼靶x线图像块特征提取方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN104182755B (zh) |
Families Citing this family (9)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN105023023B (zh) * | 2015-07-15 | 2018-08-17 | 福州大学 | 一种用于计算机辅助诊断的乳腺b超图像特征自学习提取方法 |
CN105405105B (zh) * | 2015-10-07 | 2017-07-21 | 南京巨鲨显示科技有限公司 | 针对乳腺钼靶图像的显示器灰度曲线校正***及方法 |
CN107273899B (zh) * | 2016-04-07 | 2020-08-14 | 富士通株式会社 | 对象分类方法和对象分类设备 |
CN107784285B (zh) * | 2017-10-26 | 2020-06-09 | 中国电子科技集团公司第五十四研究所 | 一种光学遥感影像舰船目标的军民属性自动判别方法 |
CN109598709B (zh) * | 2018-11-29 | 2023-05-26 | 东北大学 | 基于融合深度特征的乳腺辅助诊断***及方法 |
CN109800813B (zh) * | 2019-01-24 | 2023-12-22 | 青岛中科智康医疗科技有限公司 | 一种数据驱动乳腺钼靶肿块检测的计算机辅助***及方法 |
CN111554380A (zh) * | 2019-02-11 | 2020-08-18 | 东软医疗***股份有限公司 | 乳腺图像文件生成方法和装置、乳腺图像加载方法和装置 |
CN111339899B (zh) * | 2020-02-21 | 2020-12-22 | 腾讯科技(深圳)有限公司 | 导管特征获取方法、装置、设备、介质和智能显微镜 |
CN113283378B (zh) * | 2021-06-10 | 2022-09-27 | 合肥工业大学 | 一种基于梯形区域归一化像素差异特征的猪脸检测方法 |
Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
EP0657838A3 (en) * | 1993-12-09 | 1995-11-22 | Canon Kk | Apparatus and method for processing images. |
CN101373479A (zh) * | 2008-09-27 | 2009-02-25 | 华中科技大学 | 一种乳腺x线摄片计算机图像检索方法及*** |
CN103425986A (zh) * | 2013-08-31 | 2013-12-04 | 西安电子科技大学 | 基于边缘邻域加权的乳腺肿块图像特征提取方法 |
-
2014
- 2014-08-30 CN CN201410437632.4A patent/CN104182755B/zh not_active Expired - Fee Related
Patent Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
EP0657838A3 (en) * | 1993-12-09 | 1995-11-22 | Canon Kk | Apparatus and method for processing images. |
CN101373479A (zh) * | 2008-09-27 | 2009-02-25 | 华中科技大学 | 一种乳腺x线摄片计算机图像检索方法及*** |
CN103425986A (zh) * | 2013-08-31 | 2013-12-04 | 西安电子科技大学 | 基于边缘邻域加权的乳腺肿块图像特征提取方法 |
Non-Patent Citations (2)
Title |
---|
Image feature extraction in the last screening mammograms prior to detection of breast cancer;M. Sameti 等;《IEEE Journal or selected topics in signal processing》;20091231;第3卷(第1期);第46-52页 * |
基于MCA的乳腺X线图像中肿块的自适应检测方法;王颖 等;《电子学报》;20110331;第39卷(第3期);第525-530页 * |
Also Published As
Publication number | Publication date |
---|---|
CN104182755A (zh) | 2014-12-03 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN104182755B (zh) | 基于塔形pca的乳腺钼靶x线图像块特征提取方法 | |
CN109615636B (zh) | Ct影像的肺叶段分割中的血管树构造方法、装置 | |
CN106056595B (zh) | 基于深度卷积神经网络自动识别甲状腺结节良恶性的辅助诊断*** | |
Jin et al. | 3D convolutional neural networks with graph refinement for airway segmentation using incomplete data labels | |
Rangayyan et al. | A review of computer-aided diagnosis of breast cancer: Toward the detection of subtle signs | |
US20200380673A1 (en) | Systems and methods for integrating tomographic image reconstruction and radiomics using neural networks | |
CN111243042A (zh) | 基于深度学习的超声甲状腺结节良恶性特征可视化的方法 | |
US20100086188A1 (en) | Breast Tomosynthesis With Display Of Highlighted Suspected Calcifications | |
CN110728239B (zh) | 一种利用深度学习的胃癌增强ct图像自动识别*** | |
CN112263217B (zh) | 一种基于改进卷积神经网络的非黑素瘤皮肤癌病理图像病变区域检测方法 | |
Pavithra et al. | Prediction and classification of breast cancer using discriminative learning models and techniques | |
Palma et al. | Detection of masses and architectural distortions in digital breast tomosynthesis images using fuzzy and a contrario approaches | |
Costaridou | Medical image analysis methods | |
CN113706435A (zh) | 基于传统影像组学的胸部增强ct图像处理方法 | |
CN111553892A (zh) | 基于深度学习的肺结节分割计算方法、装置及*** | |
Maitra et al. | Automated digital mammogram segmentation for detection of abnormal masses using binary homogeneity enhancement algorithm | |
Fan et al. | Mass detection and segmentation in digital breast tomosynthesis using 3D-mask region-based convolutional neural network: a comparative analysis | |
CN103324940A (zh) | 基于多示例多标签学习的皮肤病理图片特征识别方法 | |
Rabottino et al. | Performance evaluation of a region growing procedure for mammographic breast lesion identification | |
CN111899850A (zh) | 医学影像的信息处理方法、显示方法及可读存储介质 | |
Wang et al. | Tumor detection for whole slide image of liver based on patch-based convolutional neural network | |
Kaliyugarasan et al. | Pulmonary nodule classification in lung cancer from 3D thoracic CT scans using fastai and MONAI | |
Leichter et al. | Improved mammographic interpretation of masses using computer-aided diagnosis | |
Teuwen et al. | Soft tissue lesion detection in mammography using deep neural networks for object detection | |
CN110738649A (zh) | 一种用于胃癌增强CT图像自动识别的Faster RCNN网络的训练方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
C06 | Publication | ||
PB01 | Publication | ||
C10 | Entry into substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant | ||
CF01 | Termination of patent right due to non-payment of annual fee |
Granted publication date: 20170412 |