CN109460768A - 一种用于组织病理学显微图像的文本检测与去除方法 - Google Patents

一种用于组织病理学显微图像的文本检测与去除方法 Download PDF

Info

Publication number
CN109460768A
CN109460768A CN201811361398.6A CN201811361398A CN109460768A CN 109460768 A CN109460768 A CN 109460768A CN 201811361398 A CN201811361398 A CN 201811361398A CN 109460768 A CN109460768 A CN 109460768A
Authority
CN
China
Prior art keywords
image
text
feature
text filed
micro
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN201811361398.6A
Other languages
English (en)
Other versions
CN109460768B (zh
Inventor
李晨
薛丹
姚育东
许宁
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Northeastern University China
Original Assignee
Northeastern University China
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Northeastern University China filed Critical Northeastern University China
Priority to CN201811361398.6A priority Critical patent/CN109460768B/zh
Publication of CN109460768A publication Critical patent/CN109460768A/zh
Application granted granted Critical
Publication of CN109460768B publication Critical patent/CN109460768B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/10Character recognition
    • G06V30/14Image acquisition
    • G06V30/148Segmentation of character regions
    • G06V30/153Segmentation of character regions using recognition of characters or words
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/24Classification techniques
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/20Image preprocessing
    • G06V10/22Image preprocessing by selection of a specific region containing or referencing a pattern; Locating or processing of specific regions to guide the detection or recognition
    • G06V10/225Image preprocessing by selection of a specific region containing or referencing a pattern; Locating or processing of specific regions to guide the detection or recognition based on a marking or identifier characterising the area
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/10Character recognition

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Physics & Mathematics (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Data Mining & Analysis (AREA)
  • Multimedia (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Evolutionary Biology (AREA)
  • Evolutionary Computation (AREA)
  • Artificial Intelligence (AREA)
  • General Engineering & Computer Science (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Image Analysis (AREA)

Abstract

本发明涉及医学显微图像处理技术领域,尤其涉及一种用于组织病理学显微图像的文本检测与去除方法,包括以下步骤:将输入图像分别在不同通道下进行预处理;然后进行图像分割得到子图像;对子图像进行二值化处理后进行投影分析得到候选文本区域;对候选文本区域运用Haar小波变换进行特征提取;对候选文本区域进行第一级分类,得到确定的文本区域及其特征;然后对确定的文本区域进行第二级分类,得到单个文本词及其特征;将确定的单个文本词去除,输出每一个通道的结果,合并所有通道后输出的图像为最终结果。本发明将文字检测与去除技术应用到了组织病理学显微图像上,为以后对组织病理学显微图像的继续研究扫除了初级障碍。

Description

一种用于组织病理学显微图像的文本检测与去除方法
技术领域
本发明涉及图像处理技术领域,尤其涉及一种用于组织病理学显微图像的文本检测与去除方法。
背景技术
显微图像的采用计算机技术组成的显微细胞图像分析***是当今国际计算机技术应用中十分热门的课题,尤其是计算机技术发展的速度特别快,加上开发应用的软件功能的不断升级,因此世界各国,包括我国都有一定数量的科研机构、高等院校在从事医学、生物等领域的显微细胞图像分析***的应用研究,并推出了多种一般性的图像处理分析***,而专业的图像细胞分析技术(Image Cytometry,ICM,即专门用于生物组织细胞分子级甚至基因单元的量值化分析研究的技术)从硬件、软件构成到体系结构都要比现在通用的图像处理分析***复杂得多。显微图像处理的基本过程为:(1)制作切片;(2)显微细胞图像采集;(3)图像预处理;(4)图像分割;(5)特征参数抽取;(6)统计分析;(7)结果输出。
而对于现在的医疗诊断来说,组织病理学显微图像的分析在对癌症的诊断方面起重要作用,但是现在往往会有一些组织病理学显微图像带有一些文字标注信息,其图像上的文字会对图像的分析产生干扰作用,干扰作用主要体现在两个方面,一方面是会对计算机对图像进行分割时产生扰乱作用,另一方面是文字标注部分会遮挡图像可能会掩盖住关键部位影响对病情的判断。因此亟需对其进行处理去除显微图像上的文字,帮助对组织病理学显微图像的继续研究。对于去除图像上的文字来说,现有技术使用基于区域的文本检测方法和基于纹理的方法进行文本检测。
对于基于区域的文本检测,一种是Shim等人使用图像文本区域强度的同质性,使具有相似灰度的像素被合并成一个组,将较大的区域作为背景去除后,利用灰度对比度进行区域边界分析来锐化文本区域,然后使用大小、面积、填充因子和对比度对候选区域进行验证,检查邻近的文本区域以提取任何文本字符串;另一种是R.Jiang等人介绍了一种新的连接组件(CC)方法,其工作原理如下:首先,使用颜色聚类算法将输入图像分解为CCs。为了从背景中分割文本,采用两阶段分类模块,首先通过级联分类器对所有的CCs进行验证,然后通过支持向量机(Support Vector Machine,SVM)对剩余的组件进行进一步分类。
对于基于纹理的文本检测方法,一种是D.Chen提出的一种基于两步纹理的文本检测方法,采用了机器学习本地化方案,其主要包括两步:第一步是快速定位潜在的具有低拒绝率和合理精度的文本区域,第二步中,应用机器学习验证以忽略假阳性;另一种是Z.Ji等提出的一种混合特征的视频帧文本检测方法,该种方法首先在图像上扫描一个小的重叠滑动窗口,从中提取语言无关的、基于纹理的和基于边缘的特征,然后通过SVM分类器将每个窗口分类为文本窗口或非文本窗口,然后使用投票机制将每个小块判断为文本或非文本,最后通过形态学滤波对文本区域进行精确定位。
然而对于以上的现有技术,存在要求文本背景对比度要高,而且文本轮廓区域的边缘密度比图像的其他部分更高,而且还要求图像中的文本的具有不同的纹理属性以与背景相区分,不仅如此,对于图像需要提取很多纹理特征,计算负担较大。
因此,亟需提供一种计算负担小的用于组织病理学显微图像的文本检测与去除技术。
发明内容
(一)要解决的技术问题
为了解决现有技术的上述问题,本发明提供一种图像提取特征计算负担小的用于组织病理学显微图像的文本检测与去除方法。
(二)技术方案
为了达到上述目的,本发明采用的主要技术方案包括:
本发明提供一种用于组织病理学显微图像的文本检测与去除方法,包括以下步骤:
步骤S1:将输入图像分别在不同通道下进行预处理;
步骤S2:对预处理后的每一个通道图像进行图像分割,得到每一个通道的子图像;
步骤S3:对于步骤S2得到的每一个通道的子图像进行二值化处理,然后对处理后的子图像进行投影分析,得到候选文本区域;
步骤S4:对步骤S3得到的候选文本区域进行特征提取,得到候选文本区域特征;
步骤S5:根据步骤S4得到的候选文本区域特征对候选文本区域进行第一级分类,确定出文本区域,同时得到文本区域特征;
步骤S6:根据步骤S5得到的文本区域特征进行第二级分类,确定出单个文本词,同时得到单个文本词特征;
步骤S7:根据步骤S6得到的单个文本词特征将步骤S6确定的单个文本词去除,输出去除单个文本词后的每一个通道的结果,并将所有通道合并,合并后输出的图像为最终结果。
根据本发明,步骤S3中进行投影分析时,分别对子图像进行水平方向投影和垂直方向投影,得到子图像的水平投影和垂直投影,将水平投影和垂直投影的交叉部分标记为候选文本区域,如果没有子图像被标记为候选文本区域,则结果确定为输入图像不包含文本。
根据本发明,步骤S4中对步骤S3标记为候选文本区域进行特征提取包括:通过Haar小波对候选文本区域进行一级分解并根据max-min组合规则采集样本点,对样本点求取特征得到候选文本区域的纹理特征,然后对候选文本区域纹理特征进行降维处理得到候选文本区域特征。
根据本发明,在执行步骤S5之前,采用训练图像的文本区域及背景图像预先训练第一支持向量机,得到第一级分类模型;
相应地,步骤S5包括:将步骤S4得到的候选文本区域的必要纹理特征作为第一级分类模型的输入向量进行第一级分类,得到确定的文本区域,同时得到确定的文本区域的特征;
在步骤S6之前,采用训练图像的文本词及背景图像训练第二支持向量机,得到第二级分类模型;
相应地,步骤S6包括:将步骤S5得到的确定的文本区域特征作为第二级分类模型的输入向量进行第二级分类,得到单个文本词,同时得到单个文本词特征。
根据本发明,步骤S2中图像分割具体为用大小为100×100像素的滑动窗口以100像素的滑动步长迭代处理每一个通道图像,得到每一通道的子图像。
根据本发明,步骤S1中输入的图像为组织病理学显微图像,不同通道为RGB三个通道,预处理为将RGB三个通道进行大小归一化处理并应用小波变换去除噪声。
根据本发明,步骤S1中的去除噪声所用的小波变换能够用邻域平均法或维纳滤波法代替。
根据本发明,步骤S4中降维处理为采用协方差法进行主成分分析对候选文本区域的纹理特征去冗余,得到候选文本区域特征。
根据本发明,步骤S4中采用协方差法进行主成分分析能够用LAD,SVD,t-SNE,LASSO,小波分析,拉普拉斯映射,稀疏编码方法中的一种所替代。
(三)有益效果
本发明的有益效果是:
(1)本发明的一种用于组织病理学显微图像的文本检测与去除方法,把基础研究向实用技术进行了转化,应用基于区域的文本检测和基于纹理的文本检测相结合的算法,将文字检测与去除技术应用到了组织病理学显微图像上,提供了一种去除组织病理学显微图像上文字注释的方法,有利于图像的辨别,提高了根据组织病理学显微图像进行诊断的医学质量,相比较现有技术来说,提供的方法对于文本轮廓区域的边缘密度要求较小,对图像中的文本的纹理属性要求较小,对于图像提取纹理特征的计算负担小。
(2)本发明提供的方法所使用的特征提取算法是基于二维Haar小波分解,是共现直方图法的扩展,对P.S.Hiremath和S.Shivashankar开发的特征提取算法进行了改进,采用协方差法将其最终得到的384个特征通过主成分分析减少到45个特征,计算量大幅减少,避免出现特征重叠的情况,使后续对特征进行分类的结果更加准确。
(3)对提取到的特征运用支持向量机进行分类,消除了候选文本区域中的假警报,得到确定的文本区域,并运用了采用训练图像的文本词及背景图像训练得到的支持向量机进一步分类,得到文本区域中的单个文本词,提高了图像中文字识别的精度。
附图说明
图1为本发明的总体方案流程图;
图2为本发明的特征提取算法演示示意图;
图3(a)为本发明的图像文本去除过程演示的原始图像;
图3(b)为本发明的图像文本去除过程演示的文本图;
图3(c)为本发明的图像文本去除过程演示的处理结果图;
图4(a)为本发明实施例的R通道原始图像;
图4(b)为本发明实施例的R通道文字去除后图像;
图5(a)为本发明实施例的G通道原始图像;
图5(b)为本发明实施例的G通道文字去除后图像;
图6(a)为本发明实施例的B通道原始图像;
图6(b)为本发明实施例的B通道文字去除后图像。
具体实施方式
为了更好的解释本发明,以便于理解,下面结合附图,通过具体实施方式,对本发明作详细描述。
实施例1
本发明提供一种用于组织病理学显微图像的文本检测与去除方法,包括以下步骤:
步骤S1:将输入图像分别在不同通道下进行预处理;
步骤S2:对预处理后的每一个通道图像进行图像分割,得到每一个通道的子图像;
步骤S3:对于步骤S2得到的每一个通道的子图像,进行二值化处理,然后对处理后的子图像进行投影分析,得到候选文本区域;
步骤S4:对步骤S3得到的候选文本区域进行特征提取,得到候选文本区域特征;
步骤S5:根据步骤S4得到的候选文本区域特征对候选文本区域进行第一级分类,得到确定的文本区域,同时得到确定的文本区域特征;
步骤S6:根据步骤S5得到的确定的文本区域特征进行第二级分类,得到单个文本词,同时得到单个文本词特征;
步骤S7:根据步骤S6得到的单个文本词特征将步骤S6确定的单个文本词去除,输出去除单个文本词后的每一个通道的结果,并将所有通道合并,合并后输出的图像为最终结果。
具体地,步骤S1中获取图像为组织病理学显微图像,如图3(a)所示,对获取的组织病理学显微图像即图3(a)按RGB三个通道即图4(a)、图5(a)、图6(a)所示分别进行预处理;预处理主要包括进行大小归一化处理,即通过大小归一化处理将各个通道的图像像素大小保持一致,防止因为图像像素大小不同导致结果异常,以及运用小波变换去除噪声。
具体地,步骤S2中对步骤S1预处理后的RGB三个通道图像分别进行图像分割,图像分割具体为用大小为100×100像素的滑动窗口以100像素的滑动步长迭代分别处理每一个通道图像即图4(a)、图5(a)和图6(a),得到子图像。
具体地,步骤S3中对步骤S2得到的每一个子图像,进行二值化处理后,对处理后的子图像进行水平方向投影和垂直方向投影分析,得出水平投影和垂直投影,将水平投影和垂直投影的交叉部分标记为候选文本区域,如果没有子图像被标记为候选文本区域,则结果确定为输入图像不包含文本,不再进行下面的步骤。
具体地,步骤S4中进行特征提取时,运用Haar小波变换计算得到候选文本区域的纹理特征,并通过采用协方差法进行主成分分析进行降维处理得到候选文本区域特征,降维处理即为对候选文本区域的纹理特征去冗余减少不必要的纹理特征,进一步得到候选文本区域的必要纹理特征,候选文本区域的必要纹理特征为本步骤得到的最终结果即候选文本区域特征。
具体地,在执行步骤S5之前,采用训练图像的文本区域及背景图像预先训练第一支持向量机,得到第一级分类模型;
相应地,步骤S5包括:将步骤S4得到的候选文本区域特征作为第一支持向量机的输入向量进行第一级分类,得到确定的文本区域,同时得到确定的文本区域特征。
本步骤S5中的支持向量机专门用于区分文本区域和非文本区域,以排除假警报并最终确定标记为候选文本区域是否为确定的文本区域或非文本区域,由于机器识别会将非文本区域误认为文本区域,因此通过第一级分类消除假警报即候选文本区域中实际上的非文本区域,以此得到确定的文本区域,同时得到确定的文本区域特征。
具体地,在步骤S6之前,采用训练图像的文本词及背景图像训练第二支持向量机,得到第二级分类模型;
相应地,步骤S6包括:将步骤S5得到的确定的文本区域的特征作为第二支持向量机的输入向量进行第二级分类,以排除文本区域中非文本词的部分,进一步得到单个文本词,同时得到单个文本词特征。
具体地,步骤S7包括:将步骤S6确定的单个文本词如图3(b)所示去除,输出去除单个文本词后的每一个通道的结果如图4(b)、5(b)和6(b)所示,将RGB三个通道合并,合并所输出的图像如图3(c)所示即为最终结果。
如图1所示,其中“图像输入,进行预处理”属于步骤S1,“进行投影分析”为步骤S2,“图像分割”属于步骤S3;“特征提取”属于步骤S4;“第一级分类,确定文本非文本”属于步骤S5;“第二级分类,确定单个文本词”属于步骤S6;“文本去除,输出结果”属于步骤S7。
具体地,步骤S4中对步骤S3中标记为候选文本区域的子图像进行纹理特征提取,由于通过Haar小波变换最终得到的纹理特征数量多,会出现特征重叠的现象,导致结果不正确,所以本发明进行了改进,即通过采用协方差法进行主成分分析,能够将通过Haar小波变换最终计算得到的纹理特征进行降维处理,消除了特征量大而导致特征重叠的情况,同时也减少了计算负担。
进一步具体地,对于步骤S4中运用Haar小波变换进行特征提取时,在当前特征提取算法上进行了改进具体如下:
(1)首先输入图像X及其补码利用Haar小波对输入图像X进行一级分解,这里的图像X即为如前所述步骤S3中的候选文本区域,得到逼近系数(A)和细节系数:水平(H)、垂直(V)和对角线(D),即将输入的图像分成四个子图像,四个子图像分别为:低频图像(a),垂直高频图像(V),水平高频图像(H)和对角高频图像(D),这些子图像对于计算共现直方图是必要的,或者换句话说,这些子图像唯一确定原图像,共现直方图是通过图像的不同小波系数构造的。
所考虑的组合为(A,V),(A,H),(A,D),(A,|(D H V)|)。通过考虑3x3邻域分别计算每个纹理块的特征,以3x3邻域正中为原点,用平移向量t[a,d]来表示3x3邻域,其中a为角度,d为距离。将平移向量的距离设为单位距离(即d=1),平移向量的角度为8个,即a=0°,45°,90°,135°,180°,225°,270°,315°,其中角度为0°对应图2中A或H中光圈圈住的位置,其余角度与图2中A中3x3邻域xi对正中x或H中3x3邻域yi对正中y的方位一一对应。
根据图2所示,下面以一对(A,H)的直方图计算和特征提取方法为例进行说明。
(2)根据下面的max-min组合规则,为A构建两个直方图F1和F2:
α=max(min(x,hi),min(y,ai))
x∈F1,ifα=min(x,hi)
x∈F2,ifα=min(y,ai)
其中每个领域中i=1,2,...,8,对A按照上述规则进行构建产生16个直方图。
(3)其次,对上述(1)中得到的16个直方图的每个直方图F均进行累积得到CH(cumulative histogram,累积直方图),对CH再进行归一化处理令直方图的值在0到1之间得到NCH(Normalized cumulativehistogram,归一化累积直方图),将NCH上的点(nch1,nch2,…,nch256)作为样本点,根据样本点,计算以下三个特征:
特征a、整个NCH的两个样本点之间的平均斜率:
式中:Snch为整个NCH的平均斜率;slopei表示第i种组合中两个样本点之间的斜率,i=1,2,3,4表示第i种组合包括(A,V),(A,H),(A,D),(A,|(D H V)|);
特征b、NCH样本点的均值:
式中:nchi为样本点,i表示样本点序号,μnch为NCH样本点的均值;
特征c、标准差:
式中:nchi为样本点,i表示样本点序号,μnch为NCH样本点的均值,Dnch为NCH样本点的标准差。
(4)对于其余的组合(A,V),(A,D),(A,|(D H V)|)重复以上步骤获取特征,这样就会得到192个特征(4个组合×3个特征×16个直方图)。
(5)再对互补图像重复上述步骤,这样最后结果是得到384个特征(即2个图像×4个组合×3个特征×16个直方图),384个特征即为如上所述的步骤S4中候选文本区域的纹理特征。
现有的方法是直接用384个特征构成特征向量进行后续的分类处理,但是由于特征量大,会导致特征重叠,进而导致结果不正确。
因此,本发明在这里进行了改进,进行了如下的步骤,即:
(6)对得到的384个特征进行降维处理,采用协方差法进行主成分分析,即通过对384个特征线性组合得到一个新的特征子集从而实现降低维数的效果,简单就结果而言,将384个特征进一步去冗余精简到45个特征,用45个特征代替384个特征进行后续的分类处理,45个特征即为如上所述的步骤S4中最终得到的结果即候选文本区域特征。
可选地,还可以用线性判别分析(linear discriminant analysis,LDA),SVD,t-SNE,LASSO,小波分析,拉普拉斯映射,稀疏编码的方法替代采用协方差法进行主成分分析。
因为特征数量减少了,计算量大幅减少,就能避免出现特征重叠的情况,使后续对特征进行分类的结果更加准确。
实施例2
本实施例是在实施例1的基础上略有不同,不同之处如下:
可选地,步骤S1中预处理进行去噪采用的小波变换方法能够用邻域平均法或维纳滤波法代替。
可选地,步骤S5中能够用随机森林(Random Forest)算法或ANN深度学习网络代替第一支持向量机训练得到第一分类模型。
本发明把基础研究向实用技术进行了转化,应用基于区域的文本检测和基于纹理的文本检测相结合的算法,将文字检测与去除技术应用到了组织病理学显微图像上,提供了一种去除组织病理学显微图像上文字注释的方法,有利于图像的辨别,提高了依据图像的诊断质量,相比较现有技术来说,提供的方法对于文本轮廓区域的边缘密度要求较小,对图像中的文本的纹理属性要求较小,对于图像提取纹理特征的计算负担小,为以后对组织病理学显微图像处理技术方面的继续研究提供一些经验,有利于关于组织病理学显微图像处理技术方面的发展。
需要理解的是,以上对本发明的具体实施例进行的描述只是为了说明本发明的技术路线和特点,其目的在于让本领域内的技术人员能够了解本发明的内容并据以实施,但本发明并不限于上述特定实施方式。凡是在本发明权利要求的范围内做出的各种变化或修饰,都应涵盖在本发明的保护范围内。

Claims (9)

1.一种用于组织病理学显微图像的文本检测与去除方法,其特征在于,包括以下步骤:
步骤S1:将输入图像分别在不同通道下进行预处理;
步骤S2:对预处理后的每一个通道图像进行图像分割,得到每一个通道的子图像;
步骤S3:对于步骤S2得到的每一个通道的子图像进行二值化处理,然后对处理后的子图像进行投影分析,得到候选文本区域;
步骤S4:对步骤S3得到的候选文本区域进行特征提取,得到候选文本区域特征;
步骤S5:根据步骤S4得到的候选文本区域特征对候选文本区域进行第一级分类,得到确定的文本区域,同时得到确定的文本区域特征;
步骤S6:根据步骤S5得到的确定的文本区域特征进行第二级分类,得到单个文本词,同时得到单个文本词特征;
步骤S7:将步骤S6确定的单个文本词去除,输出去除单个文本词后的每一个通道的结果,并将所有通道合并,合并后输出的图像为最终结果。
2.根据权利要求1所述的用于组织病理学显微图像的文本检测与去除方法,其特征在于,
步骤S3中进行投影分析时,分别对子图像进行水平方向投影和垂直方向投影,得到子图像的水平投影和垂直投影,将水平投影和垂直投影的交叉部分标记为候选文本区域,如果没有子图像被标记为候选文本区域,则结果确定为输入图像不包含文本。
3.根据权利要求1所述的用于组织病理学显微图像的文本检测与去除方法,其特征在于,
步骤S4中对步骤S3标记为候选文本区域进行特征提取包括:
通过Haar小波对候选文本区域进行一级分解并根据max-min组合规则采集样本点,对样本点求取特征得到候选文本区域纹理特征,然后对候选文本区域纹理特征进行降维处理得到候选文本区域特征。
4.根据权利要求3所述的用于组织病理学显微图像的文本检测与去除方法,其特征在于,
在执行步骤S5之前,采用训练图像的文本区域及背景图像预先训练第一支持向量机,得到第一级分类模型;
相应地,步骤S5包括:将步骤S4得到的候选文本区域特征作为第一级分类模型的输入向量进行第一级分类,得到确定的文本区域,同时得到确定的文本区域的特征;
在步骤S6之前,采用训练图像的文本词及背景图像训练第二支持向量机,得到第二级分类模型;
相应地,步骤S6包括:将步骤S5得到的确定的文本区域的特征作为第二级分类模型的输入向量进行第二级分类,得到单个文本词,同时得到单个文本词特征。
5.根据权利要求1所述的用于组织病理学显微图像的文本检测与去除方法,其特征在于,
步骤S2中图像分割具体为用大小为100×100像素的滑动窗口以100像素的滑动步长迭代处理每一个通道图像,得到每一通道的子图像。
6.根据权利要求1所述的用于组织病理学显微图像的文本检测与去除方法,其特征在于,
步骤S1中输入的图像为组织病理学显微图像,所述不同通道为RGB三个通道,所述的预处理为将RGB三个通道进行大小归一化处理并应用小波变换去除噪声。
7.根据权利要求6所述的用于组织病理学显微图像的文本检测与去除方法,其特征在于,
步骤S1中的去除噪声所用的小波变换能够用邻域平均法或维纳滤波法代替。
8.根据权利要求3所述的用于组织病理学显微图像的文本检测与去除方法,其特征在于,
步骤S4中所述降维处理为采用协方差法进行主成分分析对候选文本区域的纹理特征去冗余,得到候选文本区域特征。
9.根据权利要求8所述的用于组织病理学显微图像的文本检测与去除方法,其特征在于,
步骤S4中所述采用协方差法进行主成分分析能够用LAD,SVD,t-SNE,LASSO,小波分析,拉普拉斯映射,稀疏编码方法中的一种所替代。
CN201811361398.6A 2018-11-15 2018-11-15 一种用于组织病理学显微图像的文本检测与去除方法 Active CN109460768B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201811361398.6A CN109460768B (zh) 2018-11-15 2018-11-15 一种用于组织病理学显微图像的文本检测与去除方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201811361398.6A CN109460768B (zh) 2018-11-15 2018-11-15 一种用于组织病理学显微图像的文本检测与去除方法

Publications (2)

Publication Number Publication Date
CN109460768A true CN109460768A (zh) 2019-03-12
CN109460768B CN109460768B (zh) 2021-09-21

Family

ID=65610574

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201811361398.6A Active CN109460768B (zh) 2018-11-15 2018-11-15 一种用于组织病理学显微图像的文本检测与去除方法

Country Status (1)

Country Link
CN (1) CN109460768B (zh)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110797097A (zh) * 2019-10-11 2020-02-14 武汉兰丁医学高科技有限公司 人工智能云诊断平台
CN111310758A (zh) * 2020-02-13 2020-06-19 上海眼控科技股份有限公司 文本检测方法、装置、计算机设备和存储介质

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101593277A (zh) * 2008-05-30 2009-12-02 电子科技大学 一种复杂彩色图像中文本区域自动定位方法及装置
CN101833664A (zh) * 2010-04-21 2010-09-15 中国科学院自动化研究所 基于稀疏表达的视频图像文字检测方法
CN102081731A (zh) * 2009-11-26 2011-06-01 ***通信集团广东有限公司 一种从图像中提取文本的方法和装置
US20140003723A1 (en) * 2012-06-27 2014-01-02 Agency For Science, Technology And Research Text Detection Devices and Text Detection Methods
CN107038409A (zh) * 2016-02-03 2017-08-11 斯特拉德视觉公司 检测图像中所含文本的方法、装置和计算机可读记录介质

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101593277A (zh) * 2008-05-30 2009-12-02 电子科技大学 一种复杂彩色图像中文本区域自动定位方法及装置
CN102081731A (zh) * 2009-11-26 2011-06-01 ***通信集团广东有限公司 一种从图像中提取文本的方法和装置
CN101833664A (zh) * 2010-04-21 2010-09-15 中国科学院自动化研究所 基于稀疏表达的视频图像文字检测方法
US20140003723A1 (en) * 2012-06-27 2014-01-02 Agency For Science, Technology And Research Text Detection Devices and Text Detection Methods
CN107038409A (zh) * 2016-02-03 2017-08-11 斯特拉德视觉公司 检测图像中所含文本的方法、装置和计算机可读记录介质

Non-Patent Citations (6)

* Cited by examiner, † Cited by third party
Title
KHUSHBU C. SANER: "ROBUST APPROACH TO DETECT AND LOCALIZE TEXT FROM NATURAL SCENE IMAGES", 《INTERNATIONAL JOURNAL OF ELECTRICAL, ELECTRONICS AND COMPUTER ENGINEERING》 *
Q.YUAN ETC.: "Text extraction from gray scale document images using edge information", 《IEEEXPLORER》 *
SHURONG LIU ETC.: "Texture characteristic extraction of medical images based on pyramid structure wavelet transform", 《201O INTERNATIONAL CONFERENCE ON COMPUTER DESIGN AND APPLIATIONS》 *
姚育东等: "拉曼光谱成像技术及其在生物医学中的应用", 《中国激光》 *
邓勇等: "基于Gabor滤波与边缘特征的场景文字检测", 《计算机应用与软件》 *
颜子夜: "视频图像中文本区域提取算法的研究", 《万方数据知识服务平台》 *

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110797097A (zh) * 2019-10-11 2020-02-14 武汉兰丁医学高科技有限公司 人工智能云诊断平台
WO2021068857A1 (zh) * 2019-10-11 2021-04-15 武汉兰丁智能医学股份有限公司 人工智能云诊断平台
CN111310758A (zh) * 2020-02-13 2020-06-19 上海眼控科技股份有限公司 文本检测方法、装置、计算机设备和存储介质

Also Published As

Publication number Publication date
CN109460768B (zh) 2021-09-21

Similar Documents

Publication Publication Date Title
JP7458328B2 (ja) マルチ分解能登録を介したマルチサンプル全体スライド画像処理
Pan et al. Accurate segmentation of nuclei in pathological images via sparse reconstruction and deep convolutional networks
Tan et al. Efficient and robust segmentation of noisy iris images for non-cooperative iris recognition
Gao et al. On combining morphological component analysis and concentric morphology model for mammographic mass detection
CN108537751B (zh) 一种基于径向基神经网络的甲状腺超声图像自动分割方法
Bhattacharjee et al. Review on histopathological slide analysis using digital microscopy
CN110956632B (zh) 钼靶图像中胸大肌区域自动检测方法及装置
CN108830842B (zh) 一种基于角点检测的医学图像处理方法
Jia et al. Multi-layer segmentation framework for cell nuclei using improved GVF Snake model, Watershed, and ellipse fitting
CN110826389A (zh) 基于注意力3d频率卷积神经网络的步态识别方法
Chen et al. Segmentation of overlapping cervical cells with mask region convolutional neural network
De Automatic data extraction from 2D and 3D pie chart images
CN109460768A (zh) 一种用于组织病理学显微图像的文本检测与去除方法
Li et al. A surface-based 3-d dendritic spine detection approach from confocal microscopy images
Cao et al. 3D convolutional neural networks fusion model for lung nodule detection onclinical CT scans
Rege et al. Automatic leukemia identification system using otsu image segmentation and mser approach for microscopic smear image database
Zhao et al. A survey of semen quality evaluation in microscopic videos using computer assisted sperm analysis
CN111429436B (zh) 一种基于多尺度注意力和标签损失的本质图像分析方法
Gim et al. A novel framework for white blood cell segmentation based on stepwise rules and morphological features
Su et al. Roi-bmc-dnnet: An efficient automatic analysis model of whole-slide scanned bone marrow aspirate images for the diagnosis of hematological disorders
Mao et al. W-net: A two-stage convolutional network for nucleus detection in histopathology image
Pan et al. Preferential image segmentation using trees of shapes
Gunjan et al. An effective user interface image processing model for classification of Brain MRI to provide prolific healthcare
Yan et al. An effective system for optical microscopy cell image segmentation, tracking and cell phase identification
Liu et al. Medical image segmentation and retrieval via deformable models

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant