CN102819739B - 一种版心定位方法和装置 - Google Patents

一种版心定位方法和装置 Download PDF

Info

Publication number
CN102819739B
CN102819739B CN201110153129.2A CN201110153129A CN102819739B CN 102819739 B CN102819739 B CN 102819739B CN 201110153129 A CN201110153129 A CN 201110153129A CN 102819739 B CN102819739 B CN 102819739B
Authority
CN
China
Prior art keywords
page
identification information
scanned
region
file
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201110153129.2A
Other languages
English (en)
Other versions
CN102819739A (zh
Inventor
郭健
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Hanwang Technology Co Ltd
Original Assignee
Hanwang Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Hanwang Technology Co Ltd filed Critical Hanwang Technology Co Ltd
Priority to CN201110153129.2A priority Critical patent/CN102819739B/zh
Publication of CN102819739A publication Critical patent/CN102819739A/zh
Application granted granted Critical
Publication of CN102819739B publication Critical patent/CN102819739B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Landscapes

  • Image Analysis (AREA)
  • Character Input (AREA)

Abstract

本发明实施例公开了一种版心定位方法和装置,用以解决现有技术中的版心定位方法速度慢且精度低的问题。该方法实施例包括:确定待扫描文件的标识信息与版心区域的相对位置关系;根据所述相对位置关系,以及在待扫描文件的扫描图像中获取的标识信息的位置,确定所述扫描图像中版心区域的位置。本发明实施例中,首先将版面上位置固定且易于识别的区域作为标识信息,并确定出标识信息与版心区域的相对位置关系,从而可以通过确定标识信息的位置,来确定版心区域的位置,由于标识信息易于识别且位置固定,实现了对批量待扫描文件的版心区域进行定位,具有速度快且精度高的优点,实现快速对批量待扫描文件的版心区域进行定位。

Description

一种版心定位方法和装置
技术领域
本发明涉及数据加工领域,特别涉及一种版心定位方法和装置。
背景技术
数据加工是一种近期兴起的行业,即把纸质的报纸、杂志、文档、资料、和档案等加工成电子文档。加工过程一般包含扫描、图像倾斜校正、文字内容居中、图像处理、文字录入、版面还原等流程。由于在对纸质的书籍等文件进行扫描时,书籍中各页的版面相对于扫描区域的位置可能发生变化,再加上其他因素的影响,使得扫描之后的各个版面的版心相对于整个版面的位置也可能发生变化,即扫描后的图像并没有像原来的书籍中那样,每页版心都位于版面的正中。这样,如果直接将扫描后的图像加工为电子书,则会造成电子书上的各个版面的版心位置不一致,相对于整个版面出现不同程度的歪斜等情况,使得读者阅读时体验度很差。为此,需要对扫描后的图像进行版心定位,确定出扫描后图像中版心在版面中的具***置,进而可以将版心调整到版面的特定区域。
现有技术中在实现版心定位时通常采用如下几种方式:首先,可以采用人工版心定位的方法,通过Photoshop等图像处理工具对版心位置进行定位,但该方式需要操作人员手工完成,因此速度慢、精度低。其次,可以通过专用程序,事先由操作人员人工框定位置,或者调整预设大小的版心框位置,然后由程序进行定位以及自动居中等处理,该方式虽然较第一种方式稍快,但依然需要人工调整版心位置,因此精度较低。或者,可以通过模式识别等方式完成对版心的自动定位,但是由于模式识别的不确定性,需要对处理完成的每一张图像进行人工检查,以确保处理的正确性,所以正确率低且耗费时间。
由此可见,现有技术中的版心定位方式普遍存在速度慢且精度低的问题。
发明内容
本发明提供了一种版心定位方法和装置,用以解决现有技术中的版心定位方式速度慢且精度低的问题。
一种版心定位方法,包括:
确定待扫描文件的标识信息与版心区域的相对位置关系;
根据所述相对位置关系,以及在待扫描文件的扫描图像中获取的标识信息的位置,确定所述扫描图像中版心区域的位置。
一种版心定位装置,包括:
第一确定单元,用于确定待扫描文件的标识信息与版心区域的相对位置关系;
第二确定单元,用于根据所述相对位置关系,以及在待扫描文件的扫描图像中获取的标识信息的位置,确定所述扫描图像中版心区域的位置。
本发明实施例中,首先将版面上位置固定且易于识别的区域作为标识信息,并确定出标识信息与版心区域的相对位置关系,从而可以通过确定标识信息的位置,来确定版心区域的位置,由于标识信息易于识别且位置固定,实现了对批量待扫描文件的版心区域进行定位,具有速度快且精度高的优点,实现快速对批量待扫描文件的版心区域进行定位。
附图说明
图1为本发明实施例提供的版心定位方法流程图;
图2为本发明实施例中的版面模板图;
图3为本发明实施例提供的版心定位装置结构图。
具体实施方式
本发明实施例提供了一种版心定位方法和装置,可以解决现有技术中的版心定位方式速度慢且精度低的问题。
本发明实施例提供了一种版心定位方法,如图1所示,包括以下步骤:
S101:确定待扫描文件的标识信息与版心区域的相对位置关系。
其中,可以根据待扫描文件的特点,将版面上位置固定且易于识别的区域内的信息作为标识信息,例如,可以选择页码、页眉、每页的版面上方或下方的下划线以及待扫描文件指定位置上的固定图案中的其中之一或任意组合作为标识信息,这里,待扫描文件指定位置上的固定图案是指印刷在待扫描的书本等文件中每页的固定位置上的图案,例如,可以是印刷在书页侧面的花纹等。由于标识信息的位置固定,所以,标识信息和版心区域的相对位置关系也是固定的,因此,在后续处理时只要确定了标识信息的位置,也就可以确定出版心区域的位置。具体的,在确定标识信息和版心区域的相对位置关系时,可以事先选取一页有代表性的内容,针对该页内容确定标识信息和版心区域的相对位置关系,或者,也可以事先选取多页内容,结合这多页内容来综合确定标识信息和版心区域的相对位置关系。这里,版心区域具体指版面上印刷文字或图像等有效信息的区域。具体的,在确定待扫描文件的标识信息与版心区域的相对位置关系时,可以直接根据待扫描文件确定,例如,直接对待扫描文件进行测量,得到待扫描文件上标识信息和版心区域的相对位置;或者,也可以根据待扫描文件的扫描图像确定,例如,通过模式识别等方式确定扫描图像中标识信息和版心区域的相对位置,对扫描图像进行版面分析,并对扫描图像的特定位置进行检测,检测出版心区域和候选的标识信息对应的区域,如页码、页眉、每页的版面上方或下方的下划线以及指定位置上的固定图案中的其中之一或任意组合,根据用户的触发从候选的标识信息对应的区域确定标识信息后,记录标识信息对应的坐标,从而得到标识信息和版心区域的相对位置。
并且,由于一些待扫描文件,如书籍等,奇数页和偶数页上的标识信息的位置并不一致,例如,很多书籍将页眉置于奇数页的右上角以及偶数页的左上角。但是通常情况下,针对所有的奇数页而言,页眉与版心区域的位置关系是固定的,而针对所有的偶数页而言,页眉与版心区域的位置关系也是固定的。因此,这时,还需要事先确定待扫描文件的奇数页与偶数页中版面上的标识信息与版心区域的相对位置关系是否一致,如果不一致,则需要分别确定待扫描文件的奇数页中版面上的标识信息与版心区域的相对位置关系以及偶数页中版面上的标识信息与版心区域的相对位置关系。
而且,当采用页码作为标识信息时,由于有些书籍页数很多,导致页码范围从1位数字一直延续到4位数字,这时,当页码位数超过一位时,为了提高版心定位的精确度,还需要预先定义页码的对齐方式,这时,可以事先获取各个不同位数的页码在版面中的位置,根据这些位置关系确定出页码的对齐方式。这样,可以使获取到的页码位置更为精确,进而可使最终确定的版心区域的位置更为精确。
S102:根据所述待扫描文件的标识信息与版心区域的相对位置关系,以及在待扫描文件的扫描图像中获取的标识信息的位置,确定所述扫描图像中版心区域的位置。
具体的,在获取待扫描文件的扫描图像中标识信息的位置时,可以通过模式识别的方式来获取待扫描文件的扫描图像中标识信息的位置,例如通过文字识别或图像识别等方式来获取,本实施例中,对扫描图像进行版面分析,并对扫描图像的特定位置进行检测,检测出版心区域和候选的标识信息对应的区域,如页码、页眉、每页的版面上方或下方的下划线以及指定位置上的固定图案中的其中之一或任意组合,根据用户的触发选择页码作为标记信息,记录页码区域对应的坐标,并调用识别核心对页码进行OCR识别,从而标识信息和得到标识信息和版心区域的相对位置。在其他实施例中,还可以由人工手动识别,或者,还可以将模式识别和手动识别的方式结合起来。为了提高处理效率,可以针对版面上的特定区域进行优先处理,例如对于左上、左下、右上、右下、上、下等位置进行优先提取和识别。
本实施例中采用页码作为标识信息,可以按照页码顺序对待扫描文件进行扫描,从而获取按照页码顺序排列的待扫描文件的扫描图像,并在获取到扫描图像中的页码信息后,根据页码顺序判断获取到的页码信息是否正确。若不正确,则可以判断出这一页内容在识别时出现错误,从而可重新识别或改由人工识别。这样,页码不但可以用于确定版心的位置,还可以进一步用于校验扫描图像的排列顺序以及识别结果,从而大大提高了本方法的准确性。
由于标识信息与版心区域的相对位置关系是确定的,因此,在获得扫描图像的标识信息的位置后,即可相应获知版心区域的位置。
下面详细描述一下本发明中利用标识信息来确定版心位置时的实现方式,这里,以标识信息为页码为例进行描述。
首先,在确定待扫描文件版面上的标识信息与版心区域的相对位置关系时,为了记录这一位置关系并便于在后续处理过程中调用,可以根据该相对位置关系为待扫描文件设定一个版面模板。该版面模板的设计方式为:分别确定待扫描文件版面上的标识信息的位置坐标以及版心区域的位置坐标;根据所述标识信息的位置坐标以及版心区域的位置坐标建立版面模板,所述版面模板中至少包括所述标识信息和版心区域的位置信息,这里,位置信息可以以位置坐标来表示。选取版面模板的时候应该尽可能选择版面比较丰满、或者能够包含最大版面信息的模板,以免由于设定的版面区域过小而导致图像内容的丢失。常用的版面模板如图2所示,其中,该模板的版心区域22位于扫描图像21的中部,且标识信息,如页码区域23位于模板左上方。并且,版心区域22和页码区域23的相对位置关系是固定的。
假设该模板中版心的坐标为(100(左),100(上),800(右),1000(下))且页码的坐标为(150(左),150(上),180(右),180(下)),该页序号为8。其中,版心坐标(100(左),100(上),800(右),1000(下))的具体含义如下:版心区域所限定的矩形由左边、上边、右边、下边这四条边组成,其中,矩形左边距离版面的左边的距离为100,矩形上边距离版面的上边的距离为100,矩形右边距离版面的左边的距离为800,矩形下边距离版面的上边的距离为1000,由此可以看出,版心区域所限定矩形的宽为800-100=700,该矩形的长为1000-100=900。同理,页码坐标(150(左),150(上),180(右),180(下))表示该页码区域所限定的矩形的宽为180-150=30,长为180-150=30。
如果获取到的待扫描文件的扫描图像中的页码坐标为(160(左),170(上),190(右),200(下)),则说明该扫描图像中的页码位置相对于版面模板中的页码位置右移了10,且下移了20,由于页码和版心的相对位置是固定的,因此可以确定该扫描图像中的版心区域的位置相对于版面模板中版心区域的位置也右移了10,且下移了20。因此,该扫描图像中的版心区域的坐标应该为(110(左),120(上),810(右),1020(下))。这样,就可以准确确定出扫描图像中的版心坐标,从而确定出版心的位置,明确扫描图像中版心的位置坐标之后,在后续的图像处理环节中,就可以根据该坐标信息对扫描图像进行处理了,例如可以首先根据该坐标定位出版心区域的位置,然后可以对扫描图像中版心区域的位置进行调整,例如,可对其进行页面居中的操作。或者,由于版心坐标确定了,还可以将该坐标所限定的区域以外的部分噪声删除,从而避免由于杂质等因素对扫描图像的边缘部分,即版心区域以外的部分产生影响,也就是进行去噪的操作,等等。这里,页面居中以及去噪等操作的具体实现方式采用本领域技术人员所熟知的方式即可,此处不再赘述。另外,还可以进行其他的图像处理等操作,并不局限于上述描述的几种操作类型。
通过本发明实施例提供的版心定位方法,由于事先确定了标识信息与版心区域的位置关系,从而可以通过获取标识信息的位置来获得版心区域的位置。这里,标识信息是位置固定且易于识别的信息,而且,在识别之前,就可以明确该标识信息的内容,例如,识别之前就明确了需要识别的是第多少页的相应的页码信息,或者,需要识别的是以该待扫描文件的书名作为页眉的文字信息,或者,需要识别的是印在每页固定位置的特定图片信息等。这样,在识别时可以有针对性的去获取该部分内容,而且还可以进一步判断获取到的内容与事先得知的信息是否匹配,并在不匹配时判断出识别出错,实现了对批量待扫描文件的版心区域进行定位,具有速度快且精度高的优点,实现快速对批量待扫描文件的版心区域进行定位。
本发明实施例还提供了一种版心定位装置,如图3所示,包括:
第一确定单元31,用于确定待扫描文件的标识信息与版心区域的相对位置关系;
第二确定单元32,用于根据所述相对位置关系,以及在待扫描文件的扫描图像中获取的标识信息的位置,确定所述扫描图像中版心区域的位置。
较佳的,所述标识信息包括:页码、页眉、版面上方或下方的下划线以及待扫描文件指定位置上的固定图案中的其中之一或任意组合。
较佳的,所述第二确定单元32具体用于:通过模式识别的方式获取待扫描文件的扫描图像中标识信息的位置。
较佳的,当所述标识信息包括页码时,所述第二确定单元32进一步用于:获取按照页码顺序排列的待扫描文件的扫描图像,并在获取到扫描图像中的页码信息后,根据页码顺序判断获取到的页码信息是否正确。
较佳的,所述第一确定单元31,具体用于:确定待扫描文件中奇数页与偶数页中的标识信息与版心区域的相对位置关系是否一致,若不一致,则分别确定待扫描文件的奇数页中的标识信息与版心区域的相对位置关系以及偶数页中的标识信息与版心区域的相对位置关系。
本发明实施例提供的版心定位装置,由于事先确定了标识信息与版心区域的位置关系,从而可以通过获取标识信息的位置来获得版心区域的位置。这里,标识信息是位置固定且易于识别的信息,而且,在识别之前,就可以明确该标识信息的内容,例如,识别之前就明确了需要识别的是第多少页的相应的页码信息,或者,需要识别的是以该待扫描文件的书名作为页眉的文字信息,或者,需要识别的是印在每页固定位置的特定图片信息等。这样,在识别时可以有针对性的去获取该部分内容,而且还可以进一步判断获取到的内容与事先得知的信息是否匹配,并在不匹配时判断出识别出错,实现了对批量待扫描文件的版心区域进行定位,具有速度快且精度高的优点,实现快速对批量待扫描文件的版心区域进行定位。
本领域技术人员可以理解,虽然上述说明中,为便于理解,对方法的步骤采用了顺序性描述,但是应当指出,对于上述步骤的顺序并不作严格限制。
本领域普通技术人员可以理解实现上述实施例方法中的全部或部分步骤是可以通过程序来指令相关的硬件来完成,该程序可以存储于一计算机可读取存储介质中,如:ROM/RAM、磁碟、光盘等。
还可以理解的是,附图或实施例中所示的装置结构仅仅是示意性的,表示逻辑结构。其中作为分离部件显示的模块可能是或者可能不是物理上分开的,作为模块显示的部件可能是或者可能不是物理模块。
显然,本领域的技术人员可以对本发明进行各种改动和变型而不脱离本发明的精神和范围。这样,倘若本发明的这些修改和变型属于本发明权利要求及其等同技术的范围之内,则本发明也意图包含这些改动和变型在内。

Claims (7)

1.一种版心定位方法,其特征在于,包括:
确定待扫描文件的标识信息与版心区域的相对位置关系,包括:分别确定待扫描文件的标识信息的位置坐标以及版心区域的位置坐标;根据所述标识信息的位置坐标以及版心区域的位置坐标建立版面模板,所述版面模板中包括所述标识信息和版心区域的位置信息;
所述标识信息包括:页码、页眉、版面上方或下方的下划线以及待扫描文件指定位置上的固定图案中的其中之一或任意组合;
根据所述相对位置关系,以及在待扫描文件的扫描图像中获取的标识信息的位置,确定所述扫描图像中版心区域的位置;
所述确定待扫描文件的标识信息与版心区域的相对位置关系包括:
事先选取一页有代表性的内容,针对该页内容确定标识信息和版心区域的相对位置关系;或,事先选取多页内容,结合这多页内容来综合确定标识信息和版心区域的相对位置关系。
2.如权利要求1所述的方法,其特征在于,所述标识信息的位置通过模式识别的方式从待扫描文件的扫描图像中获取。
3.如权利要求1所述的方法,其特征在于,当所述标识信息包括页码时,所述方法进一步包括:
获取按照页码顺序排列的待扫描文件的扫描图像,并在获取到扫描图像中的页码信息后,根据页码顺序判断获取到的页码信息是否正确。
4.如权利要求1或3所述的方法,其特征在于,当所述标识信息包括页码且页码位数超过一位时,所述方法进一步包括:
预先定义页码的对齐方式。
5.如权利要求1所述的方法,其特征在于,所述确定待扫描文件的标识信息与版心区域的相对位置关系包括:
确定待扫描文件的奇数页与偶数页中的标识信息与版心区域的相对位置关系是否一致,若不一致,则分别确定待扫描文件的奇数页中的标识信息与版心区域的相对位置关系以及偶数页中的标识信息与版心区域的相对位置关系。
6.一种版心定位装置,其特征在于,包括:
第一确定单元,用于确定待扫描文件的标识信息与版心区域的相对位置关系,包括:分别确定待扫描文件的标识信息的位置坐标以及版心区域的位置坐标;根据所述标识信息的位置坐标以及版心区域的位置坐标建立版面模板,所述版面模板中包括所述标识信息和版心区域的位置信息;
所述标识信息包括:页码、页眉、版面上方或下方的下划线以及待扫描文件指定位置上的固定图案中的其中之一或任意组合,所述确定待扫描文件的标识信息与版心区域的相对位置关系包括:
事先选取一页有代表性的内容,针对该页内容确定标识信息和版心区域的相对位置关系;或,事先选取多页内容,结合这多页内容来综合确定标识信息和版心区域的相对位置关系;
第二确定单元,用于根据所述相对位置关系,以及在待扫描文件的扫描图像中获取的标识信息的位置,确定所述扫描图像中版心区域的位置。
7.如权利要求6所述的装置,其特征在于,当所述标识信息包括页码时,所述第二确定单元进一步用于:
获取按照页码顺序排列的待扫描文件的扫描图像,并在获取到扫描图像中的页码信息后,根据页码顺序判断获取到的页码信息是否正确。
CN201110153129.2A 2011-06-09 2011-06-09 一种版心定位方法和装置 Active CN102819739B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201110153129.2A CN102819739B (zh) 2011-06-09 2011-06-09 一种版心定位方法和装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201110153129.2A CN102819739B (zh) 2011-06-09 2011-06-09 一种版心定位方法和装置

Publications (2)

Publication Number Publication Date
CN102819739A CN102819739A (zh) 2012-12-12
CN102819739B true CN102819739B (zh) 2016-08-10

Family

ID=47303848

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201110153129.2A Active CN102819739B (zh) 2011-06-09 2011-06-09 一种版心定位方法和装置

Country Status (1)

Country Link
CN (1) CN102819739B (zh)

Families Citing this family (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103170660A (zh) * 2013-03-22 2013-06-26 沈阳飞机工业(集团)有限公司 有三维模型的零件曲面孔位钻孔划线方法
CN106372562B (zh) * 2016-08-31 2022-08-26 北京数码通科技有限公司 一种包装卷材、定位卷材上二维码位置的方法及***
CN107169486B (zh) * 2017-05-12 2018-06-15 掌阅科技股份有限公司 文本版心识别方法、电子设备及计算机存储介质
CN109146011B (zh) * 2017-06-16 2021-12-21 北京京华印象科技文化发展有限公司 一种信息分类处理方法与装置
CN109146010B (zh) * 2017-06-16 2021-12-21 北京京华印象科技文化发展有限公司 一种电子信息自动化处理方法与***
CN110942054B (zh) * 2019-12-30 2023-06-30 福建天晴数码有限公司 页面内容识别方法

Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101470698A (zh) * 2007-12-26 2009-07-01 北京大学 一种发文机关标识的排版方法及相应***

Patent Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101470698A (zh) * 2007-12-26 2009-07-01 北京大学 一种发文机关标识的排版方法及相应***

Also Published As

Publication number Publication date
CN102819739A (zh) 2012-12-12

Similar Documents

Publication Publication Date Title
CN102819739B (zh) 一种版心定位方法和装置
EP1628240A2 (en) Outlier detection during scanning
CN114299528B (zh) 一种针对扫描文档的信息提取和结构化方法
WO2011129113A1 (ja) 帳票処理装置及び帳票処理方法及び記録媒体
JP2008192032A (ja) 文書処理装置、文書処理方法、プログラム
CN107067399A (zh) 一种试卷图像分割处理方法
JP2004258706A (ja) 帳票定義データ作成方法および帳票処理装置
JP4437756B2 (ja) 情報抽出方法および情報抽出装置および情報抽出プログラムおよび記憶媒体
US8068261B2 (en) Image reading apparatus, image reading method, and image reading program
JP4655824B2 (ja) 画像認識装置、画像認識方法および画像認識プログラム
JP6454962B2 (ja) ドキュメントを編集する装置、方法及びプログラム
CN107066939A (zh) 一种网上阅卷***的试卷切割处理方法
CN114267046A (zh) 一种文档图像的方向校正方法与装置
JP2008003647A (ja) 追記情報処理方法、追記情報処理装置、およびプログラム
JP2012221372A (ja) 帳票、帳票処理装置、帳票処理方法及び記録媒体
JP3031579B2 (ja) 帳票の文字認識領域指定方法
CN110941947A (zh) 一种文档编辑的方法、装置、计算机存储介质及终端
JP2016225699A (ja) 画像形成装置及び画像形成プログラム
JP4798296B1 (ja) 帳票
JP2001052110A (ja) 文書処理方法、文書処理プログラムを記録した記録媒体及び文書処理装置
JP2002024838A (ja) 画像処理装置及び画像処理方法並びに記憶媒体
CN107045635A (zh) 一种网上阅卷***的试卷图像分页分题处理方法
JP4710707B2 (ja) 追記情報処理方法、追記情報処理装置、およびプログラム
CN112434641A (zh) 一种试题图像处理方法、装置、设备和介质
KR20090006986A (ko) 화상형성장치 및 그 제어방법

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
C14 Grant of patent or utility model
GR01 Patent grant