WO2017118356A1

WO2017118356A1 - 文本图像处理方法和装置

Info

Publication number: WO2017118356A1
Application number: PCT/CN2016/113843
Authority: WO
Inventors: 周龙沙; 王红法
Original assignee: 腾讯科技（深圳）有限公司
Priority date: 2016-01-05
Filing date: 2016-12-30
Publication date: 2017-07-13
Also published as: EP3401842B1; MY184167A; JP2018519574A; US20180053048A1; EP3401842A1; KR20170137170A; US10572728B2; EP3401842A4; KR102012819B1; JP6628442B2; CN106940799A; CN106940799B

Abstract

一种文本图像处理方法和装置，所述方法包括：预处理文本图像得到二值化图像和所述二值化图像包含的多个连通域（210）；通过凸包算法得到所述多个连通域分别对应的凸包以及外接于所述凸包的字符区域（230）；对得到的所述字符区域进行水平方向的字符切分得到所述二值化图像中分布的多个字符块（250）；根据二值化图像中字符块高度进行字符块的合并处理，得到所述文本图像包含的字块（270）。上述文本图像处理方法和装置能够提高字符分割的通用性和准确性。

Description

文本图像处理方法和装置

本申请要求于2016年1月5日提交中国专利局，申请号为201610004431.4，发明名称为“文本图像处理方法和装置”的中国专利申请的优先权，其全部内容通过引用结合在本申请中。

技术领域

本申请涉及字符识别技术领域，特别涉及一种文本图像处理方法和装置。

背景技术

文本图像处理中，字符分割在字符识别领域有着重要的作用，其主要是在获取到图像文字区域的基础上对字符所在位置进行字符的切分。

字符分割方法通常包括投影分割法、聚类法和模板匹配法。其中，投影分割法利用对图像预处理后的二值化图像，通过投影来确定出字符所在区域；聚类法所使用的是字符的连通区域，通过整体页面的字符分布特性对连通区域的字符块进行合并；而模板匹配法则主要是应用于固定字体或者字符，因此未得到广泛使用。

上述字符分割方法可以在一定程度上分割出字符，但是在现实的应用中往往受到限制，一方面，投影分割法在字符本身有倾斜的情况下会出现多个字符被分割到一块的问题，而模板匹配法则使用性更低，仅在特定的文字场合方能够使用。

另一方面，对于利用连通区域来实现字符分割的聚类法而言，如若获取到的字符中有笔画断裂或者粘连时将无法完成字符的分割。

因此，上述的字符分割方法存在诸多问题，特别是在现实的应用上受到限制，通用性和准确性不高。

发明内容

基于此，本申请提供一种文本图像处理方法和文本图像处理装置，所述方法和装置能够提高字符分割的通用性和准确性。

一种文本图像处理方法，所述方法包括如下步骤：

预处理文本图像得到二值化图像，其中所述二值化图像包含多个连通区域；

通过凸包算法得到所述多个连通区域分别对应的凸包以及获取外接于所述凸包的字符区域；

对得到的所述字符区域进行字符切分得到多个字符块；

根据所述字符块的高度进行字符块的合并处理得到文本图像的字块。

一种文本图像处理装置，所述装置包括：

预处理模块，用于预处理文本图像得到二值化图像，所述二值化图像包含多个连通区域；

凸包获取模块，用于通过凸包算法得到所述多个连通区域分别对应的凸包以及获取外接于所述凸包的字符区域；

切分模块，用于对得到的字符区域进行字符切分得到多个字符块；

合并处理模块，用于根据所述字符块的高度进行字符块的合并处理得到文本图像的字块。

由上述技术方案可知，文本图像处理中首先进行预处理得到二值化图像和二值化图像中包含的多个连通区域，通过凸包算法得到多个连通区域分别对应的凸包以及外接于凸包的字符区域，在此字符区域中进行字符切分得到二值化图像中分布的多个字符块，根据字符块高度进行字符块的合并处理得到文本图像所包含的字块。此文本图像处理中进行了字符切分以及根据字符块高度所完成的合并，在将一些粘连的字符拆分开来的基础上又避免了字符行中具有上下结构的字符被分割，进而提高了字符分割的准确性，另外，由于此处理过程中并不存在任何限制，是基于文本中字符的分布和高度来实现的，因此也提高了字符分割的通用性。

附图说明

图1是根据本发明一个实施例的一种电子设备的结构示意图；

图2是根据本发明一个实施例的文本图像处理方法的流程图；

图3是根据本发明一个实施例对字符区域进行字符切分得到二值化图像的多个字符块的方法流程图；

图4是根据本发明一个实施例定位字符的连接部分的方法流程图；

图5是根据本发明一个实例由两个字符形成的字符区域示意图；

图6是在图5的字符区域中进行定位得到的连接部分的示意图；

图7是对图5的字符区域切分得到的字符块示意图；

图8是根据本发明一个实施例根据字符块的高度进行字符块的合并处理，得到文本图像的字块的方法流程图；

图9是根据本发明一个实施例的文本图像处理装置的结构示意图；

图10是根据本发明一个实施例的切分模块的结构示意图；

图11是根据本发明一个实施例的连接定位单元的结构示意图；

图12是根据本发明一个实施例的合并处理模块的结构示意图。

具体实施方式

体现本申请特征与优点的典型实施方式将在以下的说明中详细叙述。应理解的是本申请能够在不同的实施方式上具有各种的变化，其皆不脱离本发明的范围，且其中的说明及图示在本质上是当作说明之用，而非用以限制本发明。

采用上文所述的投影分割法、聚类法和模板匹配法等字符分割方法的文本识别应用中，字符分割的实现通常只在特定的场景下具备准确性，而其它场景下的字符分割准确性较低，进而影响了文本识别应用中内容识别的准确性。

因此，为提高通用性和准确性，本申请提出了一种文本图像处理方法和文本图像处理装置。所述方法包括预处理文本图像得到二值化图像，其中所述二值化图像包含多个连通区域；通过凸包算法得到所述多个连通区域分别对应的凸包；获得外接于所述凸包的字符区域；对得到的所述字符区域进行字符切分得到多个字符块；根据所述字符块的高度进行字符块的合并处理。

图1示出了根据本发明实施例的一种电子设备的结构。该电子设备100只是一个适用本发明的示例，而不能认为是提供了对本发明的使用范围的任何限制。

如图1所示，电子设备100包括处理器110、存储器120和***总线130。包括存储器120和处理器110在内的各种组件将连接到***总线130上。处理器110是一个用于通过计算机***中基本的算术和逻辑运算来执行计算机程序指令的硬件。存储器120是一个用于临时或永久性存储计算机程序或数据的物理设备。

其中，存储器120中存储了程序指令和若干个文本图像；处理器110将执行存储器120中的程序指令，以对文本图像进行处理。

电子设备100还包括各种输入接口170、输入装置140，以实现各种操作的输入。其中，该输入装置140可以是触摸屏、按键、键盘和鼠标等至少一种。

电子设备100还可以包括用于执行通信功能的局域网接口150和移动通信单元160。

电子设备100还包括存储设备180，存储设备180可以从多种计算机可读存储介质中选择，计算机可读存储介质是指可以进行访问的任何可利用的介质，包括移动的和固定的两种介质。例如，计算机可读介质，包括但不限于闪速存储器(例如微型SD卡)、CD-ROM、数字通用光盘(DVD)或其它光盘、磁带盒、磁带存储或其它存储设备、或者可用于存储所需信息并可访问的任何其它介质。

电子设备100可以执行本发明实施例的文本图像处理的各种操作，即通过处理器110运行存储器120中的程序指令的形式执行文本图像处理方法的各个步骤。

此外，通过硬件电路或者硬件电路结合软件指令也能同样实现本发明，因此，实现本发明并不限于任何特定硬件电路、软件以及两者的组合。

在一个实施例中，该文本图像处理方法如图2所示，包括：

步骤210，预处理文本图像得到二值化图像，该二值化图像包含多个连通区域。

文本图像是任意包含了文本内容的图像，其包括了组成文本的字符，这些字符可以排列成一个或多个行，文本图像还可以包括字符行间和字符间的空白和标点符号等。对文本图像进行预处理以得到最能够体现图像信息并包含多个连通区域(简称为连通域)的二值化图像。下文中为了描述方便，将字符行的方向称为水平方向。

其中，此预处理过程包括：对文本图像进行平滑滤波并检测边缘得到文本图像中的边缘，在此基础上利用形态学得到字符的分布区域，从而得到字符的连通区域。

也就是说，二值化图像中包含的多个连通区域中，每一连通区域中存在着一个或者多个字符。

步骤230，通过凸包算法得到多个连通区域分别对应的凸包以及外接于凸包的字符区域。

通过凸包算法得到每一连通区域所对应的凸包，并依据凸包进行框选，以得到外接于凸包的字符区域。在可选的实施例中，通过凸包算法得到每一连通区域所对应的最大凸包，以避免与字符相关的信息被去除，保证了字符相关的信息的完整性。

另外，在可选的实施例中，外接于凸包的字符区域为矩形区域，例如，用最小的矩形对凸包进行框选得到的矩形区域，以与字符的外形相适应，进一步保证文本图像处理的准确性。

对应于连通区域的多个凸包中，每一凸包均有对应的字符区域，由此将得到二值化图像中的多个字符区域。

步骤250，对得到的字符区域进行字符切分得到二值化图像的多个字符块。

对二值化图像中的多个字符区域基于文本中字符的分布特性进行水平方向的字符切分，以将每个字符区域中连接在一起的字符切分开来，例如，对于相互之间在某笔画上相连的字符，通过水平方向的字符切分来进行分离，以得到相应的字符块。

在完成字符切分之后，将得到二值化图像的多个字符块。通过水平方向的字符切分，以尽可能得到单个字符所对应的字符块。

步骤270，根据字符块的高度进行字符块的合并处理，得到文本图像的字块。

在得到二值化图像的字符块之后，将根据二值化图像中所有字符块的高度进行字符块的合并处理，由此使得同一字符行中相互之间形成上下结构的字符块被合并。

在通过水平方向的切分最大程度地使得字符区域被切分得足够细的基础上，通过根据字符块高度实现的合并处理来使得被切分为两部分的字符块得以合并在一起，进而提高了后续的识别率。

通过如上所述的过程，在水平方向的字符切分和字符块的合并处理的配合下，文本图像中每个字符行得到足够细的切分，以尽可能切分出单个字符，在此基础上所进行的合并，将使得同一字符行中在上下结构上构成一个整体的字符块被合并在一起，进而有利于后续的字符识别。

通过如上所述的过程，所利用的是字符本身的特性，而不依赖于其它的一些因素，因此，将极大地提高了此字符分割过程的通用性，由此，也将极大地提高了执行上述文本图像处理方法的文字识别应用的通用性和准确性。

在一个实施例中，该步骤250如图3所示，包括：

步骤251，在字符区域中定位字符的连接部分。

由连通区域中的凸包所得到的字符区域实质为字符的初步框选，字符区域中往往存在着相互连接的字符，为将字符区域中的字符拆分，在本发明的实施例中，在垂直方向上定位字符之间的连接部分。

如若在字符区域中字符定位得到连接部分，则说明字符区域中存在相互连接的字符，需要以连接部分为依据完成字符区域中水平方向的切分。

步骤253，按照连接部分切分字符区域得到二值化图像的多个字符块。

具体的，将此连接部分所对应的像素值置为0即可完成字符区域按照连接部分所进行的切分。

字符块是字符区域经过水平切分所得到的，并且是尽可能细分的字符所对应的，一方面，对字符区域在水平方向根据连接部分进行切分，以得到由此字符连接区域拆分出的至少两个字符块；另一方面，对于并未存在连接部分的字符区域，此字符区域即为字符块。

因此，通过上述过程完成字符区域的切分，得到二值化图像中分布的多个字符块，进而使得字符的切分足够精细，切分后每一字符行中各字符块都是一个单独的字符，极大地提高了字符分割的精准性。

进一步的，在一个实施例中，如图4所示，该步骤251包括：

步骤2511，对字符区域的每列像素中的相邻像素进行像素值比对，得到每列像素中属于前景部分且连续的像素的数量。

二值化图像中的多个字符区域中，每一字符区域都是由多个像素所组成的。因此，二值化图像的多个字符区域中均以列为单位进行连接部分的定位。

在此定位中，对于字符区域的每一列像素，通过相邻像素之间的两两比对来得到此列像素中属于前景部分且连续的像素。其中，前景部分是像素中像素值为1的部分，在每一列像素中属于前景部分且连续的像素指的是此列像素中像素值为1且连续的像素。

步骤2513，对每列像素，判断属于前景部分且连续的像素的数量是否小于或者等于预设数量，若为是，则进入步骤2515，若为否，则结束。

步骤2515，确定属于前景部分且连续的像素为字符的连接部分。

在以列为单位所进行的连接部分定位中，预设数量用以进行连接部分的识别。其中，预设数量可以根据经验预先确定。

如果一列像素中属于前景部分且连续的像素所对应的数量小于或者等于预设数量，例如，该预设数量可为3，则说明这些属于前景部分且连续的像素为字符的连接部分。

在定位连接部分的具体实现中，对于二值化图像中的多个字符区域，首先计算字符区域的高度和宽度(以像素数表示)，在一个实施例中，所计算的是矩形区域的高度和宽度。其中，以下将以rect_width为宽度，rect_hight为高度进行说明，并定义1≤i≤rect_width，1≤j≤rect_hight。

任意字符区域中，初始化j＝1，取出第i列像素，以得到第i列像素中的像素值image(i，1≤j≤rect_hight)。

在第i列像素中比较像素image(i，j)和像素image(i，j+1)中的值，如若其像素是由0跳变到1或者从1到1，则对记录一列像素中1的个数的line_num_1所对应的数值进行自增运算，即line_num_1＝line_num_1+1；

由此将得到第i列像素中的line_num_1所对应的数值，此数值即为第i列像素中属于前景部分且连续的像素的数量。

判断line_num_1所对应的数值是否小于或者等于预设数量m，若此line_num_1所对应的数值小于或者等于预设数量m，则此连续的像素为字符之间的连接部分。此时，把当前列像素置为0，即可实现切分。

在完成第i列像素的比较和判断之后进行第i+1列像素的比较和判断，以此类推，直至i＝rect_width时完成整个字符区域中水平方向上连接部分的定位。

例如，如图5所示，对于Sa两个字符所形成的字符区域310而言，其通过上述所进行的连接部分的定位，将得到图6所示的字符区域310中的连接部分330，即垂直方向上的三个连续的像素(这三个像素在同一列中)，这三个连续的像素所对应的像素值均为1。

根据定位得到的连接部分，进行切分得到如图7所示的两个字符块，即字符S所在的字符块410和字符a所在的字符块430。

在一个实施例中，如图8所示，步骤270包括：

步骤271，计算二值化图像中的各个字符块的高度以得到二值化图像中的字符块的高度分布。

可选的，在该步骤中还计算二值化图像中的字符块的总高度，即二值化图像中所有字符块的高度之和。

如前所述的，二值化图像中包含了多个字符块，对于任意字符块，都将计算其高度，以得到二值化图像中每一字符块所对应的高度。然后通过统计二值化图像中具备相同高度的字符块数量以得到二值化图像中字符块的高度分布。

具体的，统计二值化图像中所有字符块的高度，把具有相同高度的字符块归为一组，并统计每组的字符块数量。例如，二值化图像中各组字符块的高度用数组static_height[n]表示，而每一高度所对应的字符块数量则对应存储于数组num_rect[n]中，其中，1≤n。

步骤273，根据得到的二值化图像中字符块的高度分布确定哪些字符块的高度之和与二值化图像中字符块的总高度的比超出预设的值。

也就是说，从二值化图像的字符块中选择目标字符块，所述目标字符块的高度之和与所述二值化图像的字符块的总高度的比超出预设值。

例如，确定一些组，这些组的字符块的高度之和与二值化图像中所有字符块的高度之和的比大于预设值。该预设值例如是大于50％的一个值，例如，是80％。

具体实现中，可首先对数组static_height[n]按照数组num_rect[n]进行从大到小或者从小到大的排序，以得到按照num_rect[n]降序排序或者升序排序的static_height[n]。

通过对二值化图像中字符块的高度和字符块数量进行运算得到高度的总合sum_height；

按照大小顺序，取出前k个字符块高度，例如，此时所取出的字符块的高度分别为static_height[1]，……，static_height[k]，使得下式第一次成立，即：

(num_rect_h[1]*static_height[1]+num_rect_h[2]*static_height[2]+......+num_rect_h[k]*static_height[k])/sum_height≥0.8；

步骤275，计算所述目标字符块的高度平均值。

在该步骤，根据步骤273选择的字符块以及这些字符块高度的和，进行高度平均值的运算。

对得到的static_height[1]，……，static_height[k]进行高度平均值的运算，以得到高度平均值height_avg，即：

(num_rect_h[1]*static_height[1]+num_rect_h[2]*static_height[2] +......+num_rect_h[k]*static_height[k])/k＝height_avg。

步骤277，根据高度平均值在二值化图像中合并处于同字符行且在水平方向上有交叠的字符块，得到文本图像的字块。

在运算得到高度平均值之后，二值化图像中，对任意字符行，如果两个字符块高度之和小于高度平均值，且水平方向上有交叠，则对这两个字符块进行合并。

也就是说，二值化图像中字符块的合并将满足如下两条件，即：

条件1：|middle_rect_x(i)-middle_rect_x(k)|-(middle_rect_width(i)+middle_rect_width(k))/2<0；

条件2：rect_height(i)+rect_height(k)<＝height_avg。

其中，1<＝i<＝m，m为字符块的个数，middle_rect_x(i)为第i个字符块中心的x轴坐标值，middle_rect_width(i)为第i个字符块的宽度值，rect_height(i)为第i个字符块的高度。

第i个字符块将与其余的字符块进行对比，若某个字符块k与当前第i个字符块高度之和小于高度平均值且在水平方向上有交叠，则满足上述两个条件。

在此基础上，将认为当前的两个字符块应当合并。

通过上述过程，能够很好地把具有上下结构的且高度和小于平均高度的字符块合并，保证了水平方向上字符块的分布，使得后续识别的过程中能够很好对水平方向的字符块进行组合和识别。

在一个实施例中，如上所述的方法还包括：

识别包含字块的文本图像，并在文本图像的识别中根据字块的顺序进行字块的组合，以得到文本图像中的文本内容。

在此过程中，将根据需要设定策略对字块在识别算法中进行处理，例如，对字块进行选择性的合并，这里所说的选择性的合并指的是根据字符行中平均字块的宽度和高度对某些过窄的相邻字块进行合并，或者某些过宽的字块进行更细的切分。

需要说明的是，所采用的识别算法可以是基于字符特征提取所对应的识别算法，例如，灰度图像梯度特征和字符的HOG特征等。

在一个实施例中，还相应地提供了一种文本图像处理装置。如图9所示，该装置包括预处理模块510、凸包获取模块530、切分模块550和合并处理模块570，其中：

预处理模块510，用于预处理文本图像得到二值化图像，该二值化图像包含多个连通区域；

凸包获取模块530，用于通过凸包算法得到所述多个连通区域分别对应的凸包以及获取外接于凸包的字符区域；

切分模块550，用于对得到的字符区域进行字符切分得到二值化图像的多个字符块；

合并处理模块570，用于根据字符块高度进行字符块的合并处理，得到文本图像的字块。

在一个实施例中，如图10所示，该切分模块550包括连接定位单元551和切分执行单元553，其中：

连接定位单元551，用于在字符区域中定位字符的连接部分。

切分执行单元553，用于按照连接部分切分字符区域得到二值化图像的多个字符块。

在一个实施例中，如图11所示，该连接定位单元551包括像素比对子单元5511和判断子单元5513，其中：

像素比对子单元5511，用于对字符区域的每列像素中的相邻像素进行像素值比对，得到每列像素中属于前景部分且连续的像素的数量。

判断子单元5513，用于对每列像素，判断属于前景部分且连续的像素的数量是否小于或者等于预设数量，若为是，则定位属于前景部分且连续的像素为字符的连接部分。

在一个实施例中，如图12所示，该合并处理模块570包括分布统计单元571、像素选择单元573、平均值计算单元575和合并执行单元577，其中：

分布统计单元571，用于计算二值化图像中各个字符块的高度以得到二值化图像中字符块高度的分布。可选的，所述分布统计单元571还计算所述字符块的总高度，即二值化图像中所有字符块的高度之和。

像素选择单元573，用于根据得到的二值化图像中字符块的高度分布确定哪些字符块的高度之和与二值化图像中字符块的总高度的比超出预设的值。也就是说，像素选择单元573从所述字符块中选择目标字符块，目标字符块的高度之和与所述字符块的总高度的比超出预设值。

平均值计算单元575，用于计算目标字符块的高度平均值。

合并执行单元577，用于根据高度平均值在二值化图像中合并处于同字符行且水平方向上有交叠的字符块，得到文本图像的字块。

在一个实施例中，如上所述的装置还包括识别模块，该识别模块用于识别包含字块的文本图像，并在该文本图像的识别中根据字块的顺序进行字块的组合，以得到文本图像中的文本内容。

本领域普通技术人员可以理解实现上述实施例的全部或部分步骤可以通过硬件来完成，也可以通过程序来指令相关的硬件完成，所述的程序可以存储于一种计算机可读存储介质中，上述提到的存储介质可以是只读存储器，磁盘或光盘等。

虽然已参照几个典型实施方式描述了本发明，但应当理解，所用的术语是说明和示例性、而非限制性的术语。由于本发明能够以多种形式具体实施而不脱离发明的精神或实质，所以应当理解，上述实施方式不限于任何前述的细节，而应在随附权利要求所限定的精神和范围内广泛地解释，因此落入权利要求或其等效范围内的全部变化和改型都应为随附权利要求所涵盖。

Claims

一种文本图像处理方法，包括：

预处理文本图像得到二值化图像，其中所述二值化图像包含多个连通区域；

通过凸包算法得到所述多个连通区域分别对应的凸包；

获取外接于所述凸包的字符区域；

对得到的所述字符区域进行字符切分得到多个字符块；

根据所述字符块的高度进行字符块的合并处理得到文本图像的字块。
根据权利要求1所述的方法，其中，所述对得到的所述字符区域进行字符切分得到多个字符块的步骤包括：

在字符区域中定位字符的连接部分；

按照所述连接部分切分所述字符区域得到所述多个字符块。
根据权利要求2所述的方法，其中，所述在字符区域中定位字符的连接部分的步骤包括：

对字符区域的每列像素中的相邻像素进行像素值比对，得到每列像素中属于前景部分且连续的像素的数量；

对每列像素，判断所述属于前景部分且连续的像素的数量是否小于或者等于预设数量，若为是，则确定所述属于前景部分且连续的像素为字符的连接部分。
根据权利要求1所述的方法，其中，所述根据所述字符块的高度进行字符块的合并处理的步骤包括：

计算所述字符块的高度以得到所述字符块的高度分布和所述字符块的总高度；

从所述字符块中选择目标字符块，所述目标字符块的高度之和与所述字符块的总高度的比超出预设值；

计算所述目标字符块的高度平均值；

根据所述高度平均值合并在所述二值化图像中处于同字符行且在水平方向上有交叠的字符块。
根据权利要求1所述的方法，

所述方法还包括：

根据所述字块在所述文本图像中的顺序对所述字块进行组合，得到所述文本图像的文字内容。
一种文本图像处理装置，包括：

预处理模块，用于预处理文本图像得到二值化图像，所述二值化图像包含多个连通区域；

凸包获取模块，用于通过凸包算法得到所述多个连通区域分别对应的凸包以及获取外接于所述凸包的字符区域；

切分模块，用于对得到的字符区域进行字符切分得到多个字符块；

合并处理模块，用于根据所述字符块的高度进行字符块的合并处理得到文本图像的字块。
根据权利要求6所述的装置，其中，所述切分模块包括：

连接定位单元，用于在字符区域中定位字符的连接部分；

切分执行单元，用于按照所述连接部分切分所述字符区域得到所述多个字符块。
根据权利要求6所述的装置，其中，所述连接定位单元包括：

像素比对子单元，用于对字符区域的每列像素中的相邻像素进行像素值比对，得到每列像素中属于前景部分且连续的像素的数量；

判断子单元，用于对每列像素，判断属于前景部分且连续的像素的数量是否小于或者等于预设数量，若为是，则确定所述属于前景部分且连续的像素为字符的连接部分。
根据权利要求6所述的装置，其中，所述合并处理模块包括：

分布统计单元，用于计算所述字符块的高度以得到所述字符块的高度分布和所述字符块的总高度；

像素选择单元，用于从所述字符块中选择目标字符块，所述目标字符块的字符块的高度之和与所述字符块的总高度的比超出预设值；

平均值计算单元，用于计算所述目标字符块的高度平均值；

合并执行单元，用于根据所述高度平均值合并在所述二值化图像中处于同字符行且水平方向上有交叠的字符块。
根据权利要求6所述的装置，

所述装置还包括：

识别模块，用于根据字块在所述文本图像中的顺序对所述字块进行组合，得到所述文本图像的文本内容。
一种文本图像处理设备，包括：

一个或多个处理器；和

存储器，所述存储器存储有程序指令，所述指令当由所述处理器执行时配置所述装置执行根据权利要求1-5中任一项所述的方法。
一种计算机可读存储介质，包括程序指令，所述指令当由计算装置的处理器执行时配置所述装置执行根据权利要求1-5中任一项所述的方法。