CN106446885A - 纸介盲文识别方法和*** - Google Patents
纸介盲文识别方法和*** Download PDFInfo
- Publication number
- CN106446885A CN106446885A CN201610840331.5A CN201610840331A CN106446885A CN 106446885 A CN106446885 A CN 106446885A CN 201610840331 A CN201610840331 A CN 201610840331A CN 106446885 A CN106446885 A CN 106446885A
- Authority
- CN
- China
- Prior art keywords
- braille
- grey scale
- value
- gray
- pixel
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V10/00—Arrangements for image or video recognition or understanding
- G06V10/20—Image preprocessing
- G06V10/22—Image preprocessing by selection of a specific region containing or referencing a pattern; Locating or processing of specific regions to guide the detection or recognition
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/22—Matching criteria, e.g. proximity measures
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/23—Clustering techniques
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V20/00—Scenes; Scene-specific elements
- G06V20/60—Type of objects
- G06V20/62—Text, e.g. of license plates, overlay texts or captions on TV images
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Data Mining & Analysis (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- Artificial Intelligence (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Evolutionary Biology (AREA)
- Evolutionary Computation (AREA)
- Bioinformatics & Computational Biology (AREA)
- General Engineering & Computer Science (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Life Sciences & Earth Sciences (AREA)
- Multimedia (AREA)
- Image Processing (AREA)
Abstract
本发明提供一种纸介盲文识别方法及***,所述方法包括:使用采集装置将纸介盲文转换成图像文件;对采集后的图像文件进行预处理;识别盲文点;识别盲文方。所述***包括:采集装置,用于将纸介盲文转换成图像文件;预处理模块,用于对采集后的图像文件进行预处理;盲文点识别模块,用于识别盲文点;盲文方识别模块,用于识别盲文方。本发明提供了一种可行的、高效的针对纸介盲文自动识别的解决方案,能够准确地识别纸介盲文,并将盲文转换成电子文本,克服了纸介盲文不易保存容易损坏的缺欠,实现了盲文信息化,为盲文电子库建设打下了坚实的基础。
Description
技术领域
本发明涉及计算机图像识别技术领域,尤其涉及一种纸介盲文识别方法及***。
背景技术
根据世界卫生组织的统计,2010年,全球盲人达到3900万,低视力人数达到2.46亿,我国盲人和低视力人数分别达到800多万和6700万,占全球比例为20.9%和27.3%。盲文由法国人布莱尔发明,专为低视力和全盲人群设计。由于其使用简单,方式灵活,已经成为全球盲文书写标准。盲人通过手指触摸含有凸起盲文的盲文纸,可以“读”出对应的字符。但是纸介盲文的使用有以下缺点:由于长期、大量地“读”盲文纸,将会使凸起的盲文点逐渐损坏,不利于多次重复使用;纸介盲文无法让多人共享使用,其复制非常复杂,需要使用昂贵的专用盲文复印机才可以。如何实现盲文信息化、盲文电子库建设已经成为亟待解决的问题。
在申请号为200910260893.2的中国专利申请中公开了一种盲文转换和显示方法、实现该方法的设备、以及通信终端,用于将不同类型的文本信息转换成盲文信息并将其显示。但该专利无法实现盲文识别,也不能将盲文转换成电子文本。现有技术的盲文识别与转换技术仅限于将盲文转换成图片信息,无法实现真正真正意义上的盲文信息化。
发明内容
针对背景技术中所出现的问题,本发明提供了一种纸介盲文识别方法,包括:使用采集装置将纸介盲文转换成图像文件;对采集后的图像文件进行预处理;识别盲文点;识别盲文方。
可选的是,所述所述采集装置包括扫描仪和数码摄影装置。
在上述任一方案中可选的是,所述图像文件的预处理包括对采集后的图像文件进行灰度处理和三值化处理。
在上述任一方案中可选的是,所述灰度处理包括将彩色的盲文图像灰度化。
在上述任一方案中可选的是,所述三值化处理包括:确定像素灰度阈值;根据像素灰度阈值对经过灰度化处理的盲文图像中的像素灰度值进行三值化计算;用三值化计算的像素灰度结果代替经过灰度化处理后的像素灰度值。
在上述任一方案中可选的是,所述确定像素灰度阈值包括:绘制经过灰度化处理的盲文图像的直方图;根据直方图确定像素灰度阈值,所述像素灰度阈值包括:左最佳阈值和右最佳阈值。
在上述任一方案中可选的是,所述确定像素灰度阈值还包括:根据直方图确定像素最大值;使用最大类间方差法计算求得所述左最佳阈值和所述右最佳阈值。
在上述任一方案中可选的是,所述三值化计算的像素灰度结果包括:背景灰度值、暗域灰度值和亮域灰度值。
在上述任一方案中可选的是,所述用三值化计算的像素灰度结果代替经过灰度化处理后的像素灰度值,包括:若经过灰度化处理的盲文图像的像素灰度小于等于所述左最佳阈值,用所述暗域灰度值代替原来的像素灰度值;若经过灰度化处理的盲文图像的像素灰度大于所述左最佳阈值且小于所述右最佳阈值,用所述背景灰度值代替原来的像素灰度值;若经过灰度化处理的盲文图像的像素灰度大于等于所述右最佳阈值,用所述亮域灰度值代替原来的像素灰度值。
在上述任一方案中可选的是,所述识别盲文点包括将像素灰度值为暗域灰度值的暗区域和像素灰度值为亮域灰度值的亮区域匹配,组合成盲文点区域。
在上述任一方案中可选的是,所述将暗区域和亮区域匹配,包括将距离最近一个暗区域和一个亮区域组合成一个盲文点区域。
在上述任一方案中可选的是,所述识别盲文方包括:创建定位网格;根据盲文点的网格位置将盲文点组合成盲文方。
在上述任一方案中可选的是,所述创建定位网格包括:将每一个盲文点区域的外接矩形的几何中心点作为盲文点的中心点;根据盲文点的中心点确定行线的水平位置坐标和列线的垂直位置坐标;根据所述行线的水平位置坐标和列线的垂直位置坐标创建定位网格。
在上述任一方案中可选的是,所述确定行线的水平位置坐标和列线的垂直位置坐标,包括:将盲文点的中心点水平位置坐标聚类分析,将坐标值接近的水平位置坐标的平均值确定一条行线的水平位置坐标;将盲文点的中心点垂直位置坐标聚类分析,将坐标值接近的垂直位置坐标的平均值确定一条行线的水平位置坐标。
在上述任一方案中可选的是,还包括:分别将与盲文点的中心点水平、垂直位置坐标接近的行线的水平位置坐标、列线的垂直位置坐标确定盲文点的网格位置坐标;根据盲文点的网格位置坐标将盲文点组合成盲文方。
在上述任一方案中可选的是,所述根据盲文点的网格位置坐标将盲文点组合成盲文方,还包括:预先设盲文方定行数m和盲文方列数n,依次将m行n列所在网格区域内盲文点组合成盲文方。
在上述任一方案中可选的是,根据布莱尔盲文***,预先设定盲文方行数m为3,盲文方列数n为2。
在上述任一方案中可选的是,还包括在所述识别盲文方之后,将盲文方转换成电子文本。
在上述任一方案中可选的是,还包括根据UNICODE编码将盲文方转换成电子文本。
本发明还提供了一种纸介盲文识别***,包括:采集装置,用于将纸介盲文转换成图像文件;预处理模块,用于对采集后的图像文件进行预处理;盲文点识别模块,用于识别盲文点;盲文方识别模块,用于识别盲文方。
可选的是,所述采集装置包括扫描仪和数码摄影装置。
在上述任一方案中可选的是,所述预处理模块包括灰度处理模块和三值化处理模块。
在上述任一方案中可选的是,所述灰度处理模块用于将彩色的盲文图像灰度化。
在上述任一方案中可选的是,所述三值化处理模块包括:阈值确定单元,用于确定像素灰度阈值;计算单元,用于根据像素灰度阈值对经过灰度化处理的盲文图像中的像素灰度值进行三值化计算;灰度处理单元,用三值化计算的像素灰度结果代替经过灰度化处理后的像素灰度值。
在上述任一方案中可选的是,所述阈值确定单元包括:直方图绘制子单元,用于绘制经过灰度化处理的盲文图像的直方图;阈值计算子单元,用于根据直方图确定像素灰度阈值,所述像素灰度阈值包括:左最佳阈值和右最佳阈值。
在上述任一方案中可选的是,所述阈值计算子单元还配置为:根据直方图确定像素最大值;使用最大类间方差法计算求得所述左最佳阈值和所述右最佳阈值。
在上述任一方案中可选的是,所述三值化计算的像素灰度结果包括:背景灰度值、暗域灰度值和亮域灰度值。
在上述任一方案中可选的是,所述灰度处理单元还配置为:若经过灰度化处理的盲文图像的像素灰度小于等于所述左最佳阈值,用所述暗域灰度值代替原来的像素灰度值;若经过灰度化处理的盲文图像的像素灰度大于所述左最佳阈值且小于所述右最佳阈值,用所述背景灰度值代替原来的像素灰度值;若经过灰度化处理的盲文图像的像素灰度大于等于所述右最佳阈值,用所述亮域灰度值代替原来的像素灰度值。
在上述任一方案中可选的是,所述盲文点识别模块配置为:将像素灰度值为暗域灰度值的暗区域和像素灰度值为亮域灰度值的亮区域匹配,组合成盲文点区域。
在上述任一方案中可选的是,所述盲文点识别模块配置为:将距离最近一个暗区域和一个亮区域组合成一个盲文点区域。
在上述任一方案中可选的是,所述盲文方识别模块包括:网格创建单元,用于创建定位网格;盲文方组合单元,用于根据盲文点的网格位置将盲文点组合成盲文方。
在上述任一方案中可选的是,所述网格创建单元还配置为:将每一个盲文点区域的外接矩形的几何中心点作为盲文点的中心点;根据盲文点的中心点确定行线的水平位置坐标和列线的垂直位置坐标;根据所述行线的水平位置坐标和列线的垂直位置坐标创建定位网格。
在上述任一方案中可选的是,所述网格创建单元还配置为:将盲文点的中心点水平位置坐标聚类分析,将坐标值接近的水平位置坐标的平均值确定一条行线的水平位置坐标;将盲文点的中心点垂直位置坐标聚类分析,将坐标值接近的垂直位置坐标的平均值确定一条行线的水平位置坐标。
在上述任一方案中可选的是,所述盲文方组合单元还配置为:分别将与盲文点的中心点水平、垂直位置坐标接近的行线的水平位置坐标、列线的垂直位置坐标确定盲文点的网格位置坐标;根据盲文点的网格位置坐标将盲文点组合成盲文方。
在上述任一方案中可选的是,所述盲文方组合单元还配置为:预先设盲文方定行数m和盲文方列数n,依次将m行n列所在网格区域内盲文点组合成盲文方。
在上述任一方案中可选的是,所述盲文方组合单元还配置为:根据布莱尔盲文***,预先设定盲文方行数m为3,盲文方列数n为2。
在上述任一方案中可选的是,所述纸介盲文识别***还包括转换模块,所述转换模块配置为:在识别盲文方之后,将盲文方转换成电子文本。
在上述任一方案中可选的是,所述转换模块还配置为:根据UNICODE编码将盲文方转换成电子文本。
本发明提供了一种可行的、高效的针对纸介盲文自动识别的解决方案,能够准确地识别纸介盲文,并将盲文转换成电子文本,克服了纸介盲文不易保存容易损坏的缺欠,实现了盲文信息化,为盲文电子库建设打下了坚实的基础。
附图说明
图1是本发明应用的纸介盲文识别方法的整体框架图。
图2是本发明应用的经过采集装置转换后的盲文图像。
图3是本发明应用的纸介盲文识别方法的一种优选的流程图。
图4是本发明应用的灰度化后的盲文图像。
图5是本发明应用的三值化方法的一种优选的流程图。
图6是本发明实施例盲文图像的直方图以及最大值和左、右最佳阈值。
图7是本发明应用的三值化后的盲文图像效果图。
图8是本发明应用的盲文点识别示意图。
图9是本发明应用的盲文方识别方法的一种优选的流程图。
图10是本发明应用的盲文方定位网格示意图。
图11是本发明应用的转换后的电子文本盲文示意图;
图12是本发明应用的纸介盲文识别***的一种优选的结构示意图。
图13是本发明应用的三值化处理模块的一种优选的结构示意图。
具体实施方式
下面将参照附图来详细描述本发明的各种示例性实施例。应注意到:除非另外具体说明,否则在这些实施例中阐述的部件和步骤的相对布置、数字表达式和数值不限制本发明的范围。
以下对至少一个示例性实施例的描述实际上仅仅是说明性的,决不作为对本发明及其应用或使用的任何限制。
本发明提供了一种纸介盲文识别方法。图1是本发明应用的纸介盲文识别方法的整体框架图。如图1所示,纸介盲文识别方法包括:步骤S100:使用采集装置将纸介盲文转换成图像文件;步骤S200:对采集后的图像文件进行预处理;步骤S300:识别盲文点;步骤S400:识别盲文方。
根据本发明纸介盲文识别方法的实施方式,在步骤S100中,采集装置包括扫描仪和数码摄影装置。盲文图像以位图(BMP)形式保存,虽然这种格式没有进行压缩处理,会占用较大的存储空间,但由于采集时可以选择较低的分辨率(比如100DPI),因此一整篇纸介盲文扫描后,只会占到3M左右的存储空间(分辨率为240DPI时,存储空间为17M左右),另外,在后面的算法处理上由于不需要解压缩等处理,因此采用位图格式存储的图像识别速度更快。图2是经过采集装置转换后的盲文图像。
图3是本发明应用的纸介盲文识别方法的一种优选的流程图。如图3所示,在步骤S100使用采集装置将纸介盲文转换成图像文件之后,执行步骤S200:对采集后的图像文件进行预处理。盲文图像是彩色图像,识别盲文点和盲文方比较困难,因此要先进行一些预处理操作。所述图像文件的预处理包括对采集后的图像文件进行灰度处理S210和三值化处理S220。步骤S210t步骤S220顺序执行。
首先执行步骤S210灰度处理,包括将彩色的盲文图像灰度化。彩色盲文图像的颜色值比较多,为了更好地进行处理,先要将彩色的盲文图像灰度化。其公式是:
P=CR*0.299+CG*0.587+CB*0.114
其中P表示像素新的灰度值,CR表示原像素的红色分量,CG表示原像素的绿色分量,CB表示原像素的蓝色分量。灰度化后的盲文图像如图4所示。
在步骤S210灰度处理之后,执行步骤S220三值化处理。
纸介盲文是在盲文专用纸上打出“凹”或“凸”两种类型的点,颜色上没有区别,无法通过简单的方法将盲文点与盲文纸分割出来。但是在采集过程中扫描设备会使用强光照射盲文纸,增加扫描效果,而盲文点凸起因存在高度上差异,因此在扫描后,每一个盲文点会出现一半偏亮、另一半偏暗的效果,加上盲文纸的背景色,一共有三种灰度不同的颜色。通过识别这三种颜色,就可以从盲文纸中识别出盲文点。
再参照图5,步骤S220三值化处理包括步骤S221、S224和S225顺序执行:
步骤S221确定像素灰度阈值,包括:步骤S222和步骤S223;
步骤S222:绘制经过灰度化处理的盲文图像的直方图;
步骤S223:根据直方图确定像素灰度阈值,所述像素灰度阈值包括:左最佳阈值和右最佳阈值。根据直方图确定像素最大值;使用最大类间方差法计算求得所述左最佳阈值和所述右最佳阈值。
图6是本发明实施例盲文图像的直方图以及最大值和左、右最佳阈值,横坐标表示灰度值,纵坐标表示某灰度值在图像中的像素个数。如图6所示,首先绘制经过灰度化处理的盲文图像的直方图,然后找出其中的像素最大值(MaxValue),即像素个数最多的灰度值。以此为中间,将直方图分成左右两个部分。再使用最大类间方差法(即大津法,简称为OTSU),分别对左、右两部分进行计算,求得左最佳阈值和右最佳阈值(LeftThreshold和RightThreshold),见图中虚线所示。
步骤S224:根据像素灰度阈值对经过灰度化处理的盲文图像中的像素灰度值进行三值化计算。
计算出左、右最佳阈值后,使用下面的公式对每一个像素进行三值化计算,以便求出新的像素值。
其中f(x,y)表示像素经灰度化处理后的原始灰度值,g(x,y)表示三值化后的新灰度值,其只能取0(表示盲文点的暗部分),255(表示盲文点的亮部分)和128(表示盲文纸的背景)。
上述计算之后执行步骤S225:用三值化计算的像素灰度结果代替经过灰度化处理后的像素灰度值。三值化计算的像素灰度结果包括:背景灰度值、暗域灰度值和亮域灰度值。在步骤S225中,用三值化计算的像素灰度结果代替经过灰度化处理后的像素灰度值,包括:若经过灰度化处理的盲文图像的像素灰度小于等于所述左最佳阈值,用所述暗域灰度值代替原来的像素灰度值;若经过灰度化处理的盲文图像的像素灰度大于所述左最佳阈值且小于所述右最佳阈值,用所述背景灰度值代替原来的像素灰度值;若经过灰度化处理的盲文图像的像素灰度大于等于所述右最佳阈值,用所述亮域灰度值代替原来的像素灰度值。三值化后的盲文图像将转换成如图7所示的效果。
盲文图像预处理后,执行步骤S300识别盲文点。这时图像包含三种颜色,灰色区域是盲文纸的背景色,这个不用考虑识别问题,黑色区域是盲文点的暗区域,白色区域是盲文点的亮区域。为识别出每一个盲文点,需要将暗区域和亮区域匹配,形成盲文点,进而计算其位置。在三值化处理后的图像中,对暗区域和亮区域分别进行标识,使得每一个独立区域都有一个唯一的标识号。同时为了区分颜色,简化操作,在标识时将暗区域标识为奇数值,亮区域标识为偶数值。然后将两个区域的值进行比较,找到距离最近的区域对(一个暗区域、一个亮区域),即可组合成一个盲文点。即将距离最近的一对像素灰度值为暗域灰度值的暗区域和像素灰度值为亮域灰度值的亮区域匹配,组合成盲文点区域。图8中方框框起来的就是盲文点识别处理后组合在一起的每一个盲文点。
盲文点确定后,执行步骤S400识别盲文方。需要将符合距离条件的点组成为一个盲文方,并确定每一个点在方中的位置,进而判断出每一行盲文,这需要构建一个定位网格。网格由行线和列线组成,其分别进行创建。
步骤S400识别盲文方包括:步骤S410创建定位网格;步骤S420根据盲文点的网格位置将盲文点组合成盲文方。步骤S410和步骤S420顺序执行。图9是本发明应用的盲文方识别方法的一种优选的流程图。
步骤S410创建定位网格包括:步骤S411将每一个盲文点区域的外接矩形的几何中心点作为盲文点的中心点。步骤S412根据盲文点的中心点确定行线的水平位置坐标和列线的垂直位置坐标。确定行线的水平位置坐标和列线的垂直位置坐标,包括:将盲文点的中心点水平位置坐标聚类分析,将坐标值接近的水平位置坐标的平均值确定一条行线的水平位置坐标;将盲文点的中心点垂直位置坐标聚类分析,将坐标值接近的垂直位置坐标的平均值确定一条行线的水平位置坐标。步骤S413根据所述行线的水平位置坐标和列线的垂直位置坐标创建定位网格。步骤S411、S412、S413顺序执行。图10中显示了生成定位网格后的盲文图像。
网格中每一条行线和每一条列线的交叉位置的坐标,如果与某一盲文点坐标相近似,则可以确定此点在所属盲文方中的位置。步骤S410创建定位网格之后执行步骤S420根据盲文点的网格位置将盲文点组合成盲文方。步骤S420包括:步骤S421分别将与盲文点的中心点水平、垂直位置坐标接近的行线的水平位置坐标、列线的垂直位置坐标确定盲文点的网格位置坐标;步骤S422根据盲文点的网格位置坐标将盲文点组合成盲文方。步骤S421和步骤S422顺序执行。
上述根据盲文点的网格位置坐标将盲文点组合成盲文方,还包括:预先设盲文方定行数m和盲文方列数n,依次将m行n列所在网格区域内盲文点组合成盲文方。根据布莱尔盲文***,可预先设定盲文方行数m为3,盲文方列数n为2。由于布莱尔盲文一方盲文最多是由3行、2列共6个盲文点组成,因此将每3条行线组成一盲文行,每两条列线组成一盲文列,盲文行列交叉的位置就可以确定为一个盲文方。同时由于三条行线与两条列线分别相交叉,因此上行线(三条行线中位于上方的行线)与左列线的交叉点上存在的盲文点为1点,上行线与右列线的门交叉点上存在的盲文点为4点。同理中行线与列线可以确定2、5点,下行线与列线可以确定3、6点。
参看图1和图2,步骤S400识别盲文方之后,可执行步骤S500将盲文方转换成电子文本。根据本发明的盲文转换的实施例,可根据UNICODE编码将盲文方转换成电子文本。完成判断后,首先将一方中每一个盲文点按数值相加。其中每个盲文点的数值规定如下:盲文点为1点,对应的盲文点的数值是1;盲文点为2点,对应的盲文点的数值是2;盲文点为3点,对应的盲文点的数值是4;盲文点为4点,对应的盲文点的数值是8;盲文点为5点,对应的盲文点的数值是16;盲文点为6点,对应的盲文点的数值是32;也就是说,盲文点为n点,对应的盲文点的数值是2n-1。在UNICODE编码中的盲文点是从0x2800开始的,将一方中每一个盲文点按数值相加后,再加上计算机编码中盲文点的起始编码值(UNICODE中的盲文点是从0x2800开始的),即可得到对应盲文的编码,完成转换,图11是本发明应用的转换后的电子文本盲文示意图。转换后的电子文本可以方便地存在文本文件中,方便存储与读取。用电子媒介的方式保存,克服了纸介盲文不易保存容易损坏的缺欠,实现了盲文信息化,为盲文电子库建设打下了坚实的基础。
本发明还提供了一种纸介盲文识别***。图12是本发明应用的纸介盲文识别***的一种优选的结构示意图。如图12所示,本发明纸介盲文识别***包括:采集装置100,用于将纸介盲文转换成图像文件;预处理模块200,用于对采集后的图像文件进行预处理;盲文点识别模块300,用于识别盲文点;盲文方识别模块400,用于识别盲文方。
根据本发明纸介盲文识别***的一种实施方式,所述采集装置100包括扫描仪和数码摄影装置。
根据本发明纸介盲文识别***的一种实施方式,所述预处理模块200包括灰度处理模块210和三值化处理模块220。
根据本发明纸介盲文识别***的一种实施方式,所述灰度处理模块210用于将彩色的盲文图像灰度化。
图13是本发明应用的三值化处理模块的一种优选的结构示意图。如图13所示,所述三值化处理模块220包括:阈值确定单元221,用于确定像素灰度阈值;计算单元224,用于根据像素灰度阈值对经过灰度化处理的盲文图像中的像素灰度值进行三值化计算;灰度处理单元225,用三值化计算的像素灰度结果代替经过灰度化处理后的像素灰度值。
根据本发明纸介盲文识别***的一种实施方式,所述阈值确定单元221包括:直方图绘制子单元222,用于绘制经过灰度化处理的盲文图像的直方图;阈值计算子单元223,用于根据直方图确定像素灰度阈值,所述像素灰度阈值包括:左最佳阈值和右最佳阈值。
根据本发明纸介盲文识别***的一种实施方式,所述阈值计算子单元223还配置为:根据直方图确定像素最大值;使用最大类间方差法计算求得所述左最佳阈值和所述右最佳阈值。
根据本发明纸介盲文识别***的一种实施方式,所述三值化计算的像素灰度结果包括:背景灰度值、暗域灰度值和亮域灰度值。
根据本发明纸介盲文识别***的一种实施方式,所述灰度处理单元225还配置为:若经过灰度化处理的盲文图像的像素灰度小于等于所述左最佳阈值,用所述暗域灰度值代替原来的像素灰度值;若经过灰度化处理的盲文图像的像素灰度大于所述左最佳阈值且小于所述右最佳阈值,用所述背景灰度值代替原来的像素灰度值;若经过灰度化处理的盲文图像的像素灰度大于等于所述右最佳阈值,用所述亮域灰度值代替原来的像素灰度值。
根据本发明纸介盲文识别***的一种实施方式,所述盲文点识别模块300配置为:将像素灰度值为暗域灰度值的暗区域和像素灰度值为亮域灰度值的亮区域匹配,组合成盲文点区域。
根据本发明纸介盲文识别***的一种实施方式,所述盲文点识别模块300配置为:将距离最近一个暗区域和一个亮区域组合成一个盲文点区域。
根据本发明纸介盲文识别***的一种实施方式,所述盲文方识别模块400包括:网格创建单元410,用于创建定位网格;盲文方组合单元420,用于根据盲文点的网格位置将盲文点组合成盲文方。
根据本发明纸介盲文识别***的一种实施方式,所述网格创建单元410还配置为:将每一个盲文点区域的外接矩形的几何中心点作为盲文点的中心点;根据盲文点的中心点确定行线的水平位置坐标和列线的垂直位置坐标;根据所述行线的水平位置坐标和列线的垂直位置坐标创建定位网格。
根据本发明纸介盲文识别***的一种实施方式,所述网格创建单元410还配置为:将盲文点的中心点水平位置坐标聚类分析,将坐标值接近的水平位置坐标的平均值确定一条行线的水平位置坐标;将盲文点的中心点垂直位置坐标聚类分析,将坐标值接近的垂直位置坐标的平均值确定一条行线的水平位置坐标。
根据本发明纸介盲文识别***的一种实施方式,所述盲文方组合单元420还配置为:分别将与盲文点的中心点水平、垂直位置坐标接近的行线的水平位置坐标、列线的垂直位置坐标确定盲文点的网格位置坐标;根据盲文点的网格位置坐标将盲文点组合成盲文方。
根据本发明纸介盲文识别***的一种实施方式,所述盲文方组合单元420还配置为:预先设盲文方定行数m和盲文方列数n,依次将m行n列所在网格区域内盲文点组合成盲文方。
根据本发明纸介盲文识别***的一种实施方式,所述盲文方组合单元420还配置为:根据布莱尔盲文***,预先设定盲文方行数m为3,盲文方列数n为2。
根据本发明纸介盲文识别***的一种实施方式,所述纸介盲文识别***还包括转换模块500,所述转换模块500配置为:在识别盲文方之后,将盲文方转换成电子文本。
根据本发明纸介盲文识别***的一种实施方式,所述转换模块500还配置为:根据UNICODE编码将盲文方转换成电子文本。
本发明提供了一种可行的、高效的针对纸介盲文自动识别的解决方案,能够准确地识别纸介盲文,并将盲文转换成电子文本,克服了纸介盲文不易保存容易损坏的缺欠,实现了盲文信息化,为盲文电子库建设打下了坚实的基础。
为了更好地理解本发明,以上结合本发明的具体实施例做了详细描述,但并非是对本发明的限制。凡是依据本发明的技术实质对以上实施例所做的任何简单修改,均仍属于本发明技术方案的范围。本说明书中每个实施例重点说明的都是与其它实施例的不同之处,各个实施例之间相同或相似的部分相互参见即可。对于***实施例而言,由于其与方法实施例基本对应,所以描述的比较简单,相关之处参见方法实施例的部分说明即可。
可能以许多方式来实现本发明的方法、装置和***。例如,可通过软件、硬件、固件或者软件、硬件、固件的任何组合来实现本发明的方法和***。用于所述方法的步骤的上述顺序仅是为了进行说明,本发明的方法的步骤不限于以上具体描述的顺序,除非以其它方式特别说明。此外,在一些实施例中,还可将本发明实施为记录在记录介质中的程序,这些程序包括用于实现根据本发明的方法的机器可读指令。因而,本发明还覆盖存储用于执行根据本发明的方法的程序的记录介质。
本发明的描述是为了示例和描述起见而给出的,而并不是无遗漏的或者将本发明限于所公开的形式。很多修改和变化对于本领域的普通技术人员而言是显然的。选择和描述实施例是为了更好说明本发明的原理和实际应用,并且使本领域的普通技术人员能够理解本发明从而设计适于特定用途的带有各种修改的各种实施例。
Claims (10)
1.一种纸介盲文识别方法,包括:
使用采集装置将纸介盲文转换成图像文件;
对采集后的图像文件进行预处理;
识别盲文点;
识别盲文方。
2.如权利要求1所述的方法,其特征在于,所述采集装置包括扫描仪和数码摄影装置。
3.如权利要求1所述的方法,其特征在于,所述图像文件的预处理包括对采集后的图像文件进行灰度处理和三值化处理。
4.如权利要求3所述的方法,其特征在于,所述灰度处理包括将彩色的盲文图像灰度化。
5.如权利要求3所述的方法,其特征在于,所述三值化处理包括:
确定像素灰度阈值;
如像素灰度阈值对经过灰度化处理的盲文图像中的像素灰度值进行三值化计算;
用三值化计算的像素灰度结果代替经过灰度化处理后的像素灰度值。
6.如权利要求5所述的方法,其特征在于,所述确定像素灰度阈值包括:
绘制经过灰度化处理的盲文图像的直方图;
根据直方图确定像素灰度阈值,所述像素灰度阈值包括:左最佳阈值和右最佳阈值。
7.如权利要求6所述的方法,其特征在于,还包括:
根据直方图确定像素最大值;
使用最大类间方差法计算求得所述左最佳阈值和所述右最佳阈值。
8.如权利要求5-7任一项所述的方法,其特征在于,所述三值化计算的像素灰度结果包括:背景灰度值、暗域灰度值和亮域灰度值。
9.如权利要求5-8任一项所述的方法,其特征在于,所述用三值化计算的像素灰度结果代替经过灰度化处理后的像素灰度值,包括:
若经过灰度化处理的盲文图像的像素灰度小于等于所述左最佳阈值,用所述暗域灰度值代替原来的像素灰度值;
若经过灰度化处理的盲文图像的像素灰度大于所述左最佳阈值且小于所述右最佳阈值,用所述背景灰度值代替原来的像素灰度值;
若经过灰度化处理的盲文图像的像素灰度大于等于所述右最佳阈值,用所述亮域灰度值代替原来的像素灰度值。
10.一种纸介盲文识别***,包括:
采集装置,用于将纸介盲文转换成图像文件;
预处理模块,用于对采集后的图像文件进行预处理;
盲文点识别模块,用于识别盲文点;
盲文方识别模块,用于识别盲文方。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201610840331.5A CN106446885A (zh) | 2016-09-21 | 2016-09-21 | 纸介盲文识别方法和*** |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201610840331.5A CN106446885A (zh) | 2016-09-21 | 2016-09-21 | 纸介盲文识别方法和*** |
Publications (1)
Publication Number | Publication Date |
---|---|
CN106446885A true CN106446885A (zh) | 2017-02-22 |
Family
ID=58166922
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201610840331.5A Pending CN106446885A (zh) | 2016-09-21 | 2016-09-21 | 纸介盲文识别方法和*** |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN106446885A (zh) |
Cited By (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN107393126A (zh) * | 2017-07-12 | 2017-11-24 | 深圳怡化电脑股份有限公司 | 一种纸币版本分类的方法、装置、设备及存储介质 |
CN107958261A (zh) * | 2017-11-03 | 2018-04-24 | 中国科学院计算技术研究所 | 一种盲文点检测方法及*** |
CN108052936A (zh) * | 2017-11-03 | 2018-05-18 | 中国科学院计算技术研究所 | 一种盲文图像自动倾斜校正方法及*** |
CN108052955A (zh) * | 2017-11-03 | 2018-05-18 | 中国科学院计算技术研究所 | 一种高精度盲文识别方法及*** |
CN108062548A (zh) * | 2017-11-03 | 2018-05-22 | 中国科学院计算技术研究所 | 一种盲文方自适应定位方法及*** |
CN108062886A (zh) * | 2017-11-03 | 2018-05-22 | 中国科学院计算技术研究所 | 盲文点交互式标注方法及*** |
CN113379680A (zh) * | 2021-05-18 | 2021-09-10 | 上海闻泰信息技术有限公司 | 缺陷检测方法、装置、电子设备和计算机可读存储介质 |
Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN102063628A (zh) * | 2011-01-14 | 2011-05-18 | 长春大学 | 双面盲文点字的提取方法 |
US20130088747A1 (en) * | 2011-10-10 | 2013-04-11 | King Saud University | Braille-to-braille facsimile machine using image processing |
-
2016
- 2016-09-21 CN CN201610840331.5A patent/CN106446885A/zh active Pending
Patent Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN102063628A (zh) * | 2011-01-14 | 2011-05-18 | 长春大学 | 双面盲文点字的提取方法 |
US20130088747A1 (en) * | 2011-10-10 | 2013-04-11 | King Saud University | Braille-to-braille facsimile machine using image processing |
Non-Patent Citations (3)
Title |
---|
AMANY AL-SALEH 等: "Dot Detection of Optical Braille Images for Braille Cells Recognition", 《ICCHP 2008: COMPUTERS HELPING PEOPLE WITH SPECIAL NEEDS》 * |
APOSTOLOS ANTONACOPOULOS 等: "A Robust Braille Recognition System", 《DAS 2004: DOCUMENT ANALYSIS SYSTEMS VI 》 * |
尹佳: "纸介盲文自动识别***关键技术研究", 《中国优秀硕士学位论文全文数据库 信息科技辑》 * |
Cited By (11)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN107393126A (zh) * | 2017-07-12 | 2017-11-24 | 深圳怡化电脑股份有限公司 | 一种纸币版本分类的方法、装置、设备及存储介质 |
CN107393126B (zh) * | 2017-07-12 | 2019-10-11 | 深圳怡化电脑股份有限公司 | 一种纸币版本分类的方法、装置、设备及存储介质 |
CN107958261A (zh) * | 2017-11-03 | 2018-04-24 | 中国科学院计算技术研究所 | 一种盲文点检测方法及*** |
CN108052936A (zh) * | 2017-11-03 | 2018-05-18 | 中国科学院计算技术研究所 | 一种盲文图像自动倾斜校正方法及*** |
CN108052955A (zh) * | 2017-11-03 | 2018-05-18 | 中国科学院计算技术研究所 | 一种高精度盲文识别方法及*** |
CN108062548A (zh) * | 2017-11-03 | 2018-05-22 | 中国科学院计算技术研究所 | 一种盲文方自适应定位方法及*** |
CN108062886A (zh) * | 2017-11-03 | 2018-05-22 | 中国科学院计算技术研究所 | 盲文点交互式标注方法及*** |
CN108062548B (zh) * | 2017-11-03 | 2020-11-03 | 中国科学院计算技术研究所 | 一种盲文方自适应定位方法及*** |
CN108052955B (zh) * | 2017-11-03 | 2021-03-05 | 中国科学院计算技术研究所 | 一种高精度盲文识别方法及*** |
CN108052936B (zh) * | 2017-11-03 | 2021-06-29 | 中国科学院计算技术研究所 | 一种盲文图像自动倾斜校正方法及*** |
CN113379680A (zh) * | 2021-05-18 | 2021-09-10 | 上海闻泰信息技术有限公司 | 缺陷检测方法、装置、电子设备和计算机可读存储介质 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN106446885A (zh) | 纸介盲文识别方法和*** | |
CN101295359B (zh) | 图像处理装置及图像处理方法 | |
CN101432761B (zh) | 将包含文字的数字图像转换为用于再现的基于记号的文件的方法 | |
CN106682629B (zh) | 一种复杂背景下身份证号识别算法 | |
CN102682307A (zh) | 基于图像处理的可编辑答题卡***及其实现方法 | |
KR20220050977A (ko) | 의료 이미지 처리 방법, 이미지 처리 방법 및 장치 | |
CN104268615A (zh) | 一种彩色二维码的编码与解码方法 | |
CN101615244A (zh) | 手写板坯号自动识别方法及识别装置 | |
TWI514840B (zh) | 半色調資料隱寫編碼系統及半色調資料隱寫解碼系統 | |
CN108052936B (zh) | 一种盲文图像自动倾斜校正方法及*** | |
CN108052955B (zh) | 一种高精度盲文识别方法及*** | |
CN109902751B (zh) | 融合卷积神经网络和半字模板匹配的表盘数字字符识别法 | |
CN107958261B (zh) | 一种盲文点检测方法及*** | |
CN106599010B (zh) | 图码搜索法 | |
Herwanto et al. | Zoning feature extraction for handwritten Javanese character recognition | |
CN110298236B (zh) | 一种基于深度学习的盲文图像自动识别方法和*** | |
CN108062548B (zh) | 一种盲文方自适应定位方法及*** | |
CN109543803B (zh) | 可编辑子母式色彩二维码的编码***及解码*** | |
CN106648171B (zh) | 一种基于书写笔的交互***及方法 | |
CN113065407B (zh) | 基于注意力机制和生成对抗网络的财务票据***擦除方法 | |
CN111985479B (zh) | 一种用于列车综合线路图的智能识别*** | |
CN114723601A (zh) | 一种虚拟场景下的模型结构化建模及快速渲染方法 | |
CN107886808B (zh) | 一种盲文方辅助标注方法及*** | |
CN111046874A (zh) | 一种基于模板匹配的单号识别方法 | |
CN110781884A (zh) | 一种实现电表数据智能读取的方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
C06 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
RJ01 | Rejection of invention patent application after publication |
Application publication date: 20170222 |
|
RJ01 | Rejection of invention patent application after publication |