CN109145751A - 翻页检测方法及装置 - Google Patents
翻页检测方法及装置 Download PDFInfo
- Publication number
- CN109145751A CN109145751A CN201810813117.XA CN201810813117A CN109145751A CN 109145751 A CN109145751 A CN 109145751A CN 201810813117 A CN201810813117 A CN 201810813117A CN 109145751 A CN109145751 A CN 109145751A
- Authority
- CN
- China
- Prior art keywords
- image
- detection
- detection image
- wire
- vegetarian refreshments
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000001514 detection method Methods 0.000 title claims abstract description 397
- 238000000034 method Methods 0.000 claims abstract description 46
- 230000001052 transient effect Effects 0.000 claims description 6
- 238000012545 processing Methods 0.000 claims description 5
- 238000000605 extraction Methods 0.000 claims description 4
- 238000004891 communication Methods 0.000 claims description 3
- 230000008569 process Effects 0.000 abstract description 17
- 238000005516 engineering process Methods 0.000 abstract description 4
- 238000004883 computer application Methods 0.000 abstract description 2
- 238000007689 inspection Methods 0.000 description 13
- 238000012360 testing method Methods 0.000 description 8
- 238000010586 diagram Methods 0.000 description 6
- 238000012163 sequencing technique Methods 0.000 description 4
- 101100394230 Caenorhabditis elegans ham-1 gene Proteins 0.000 description 3
- 101100394231 Caenorhabditis elegans ham-2 gene Proteins 0.000 description 3
- 101100045395 Mus musculus Tap1 gene Proteins 0.000 description 3
- 101100045406 Mus musculus Tap2 gene Proteins 0.000 description 3
- 230000006870 function Effects 0.000 description 3
- 239000011159 matrix material Substances 0.000 description 3
- 238000011161 development Methods 0.000 description 2
- 230000009471 action Effects 0.000 description 1
- 230000003044 adaptive effect Effects 0.000 description 1
- 230000001934 delay Effects 0.000 description 1
- 230000002045 lasting effect Effects 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 238000000926 separation method Methods 0.000 description 1
- 238000003756 stirring Methods 0.000 description 1
- 230000002459 sustained effect Effects 0.000 description 1
- 230000007306 turnover Effects 0.000 description 1
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V40/00—Recognition of biometric, human-related or animal-related patterns in image or video data
- G06V40/20—Movements or behaviour, e.g. gesture recognition
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/24—Classification techniques
- G06F18/241—Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches
- G06F18/2413—Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches based on distances to training or reference patterns
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V10/00—Arrangements for image or video recognition or understanding
- G06V10/20—Image preprocessing
- G06V10/22—Image preprocessing by selection of a specific region containing or referencing a pattern; Locating or processing of specific regions to guide the detection or recognition
- G06V10/235—Image preprocessing by selection of a specific region containing or referencing a pattern; Locating or processing of specific regions to guide the detection or recognition based on user input or interaction
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V10/00—Arrangements for image or video recognition or understanding
- G06V10/40—Extraction of image or video features
- G06V10/44—Local feature extraction by analysis of parts of the pattern, e.g. by detecting edges, contours, loops, corners, strokes or intersections; Connectivity analysis, e.g. of connected components
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- Multimedia (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Data Mining & Analysis (AREA)
- General Engineering & Computer Science (AREA)
- Evolutionary Computation (AREA)
- Evolutionary Biology (AREA)
- Bioinformatics & Computational Biology (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Artificial Intelligence (AREA)
- Life Sciences & Earth Sciences (AREA)
- Health & Medical Sciences (AREA)
- General Health & Medical Sciences (AREA)
- Psychiatry (AREA)
- Social Psychology (AREA)
- Human Computer Interaction (AREA)
- Image Analysis (AREA)
Abstract
本发明实施例提供一种翻页检测方法及装置,属于计算机应用技术领域。该方法包括:在获取多个检测图像以对待检测实体书进行检测的过程中,提取多个检测图像中每一检测图像的图像特征;对于多个检测图像中获取顺序连续的任意N个检测图像,若任意N个检测图像中最后一个检测图像的图像特征与其它检测图像的图像特征之间满足预设条件,则确定最后一个检测图像是在待检测实体书处于翻页稳定状态下拍摄得到的;其中,翻页稳定状态是指完成对待检测实体书的翻页动作后,待检测实体书所处的稳定状态。由于不用经过逐一匹配的过程,对于任一检测图像,只需依据该检测图像前面的几个检测图像即可确定该检测图像对应的翻页状态,从而提高了检测效率。
Description
技术领域
本发明实施例涉及计算机应用技术领域,更具体地,涉及一种翻页检测方法及装置。
背景技术
随着信息化及智能化的发展,用于阅读实体书的智能阅读设备越来越普及。其中,用户在使用智能阅读设备阅读实体书时,通常是由智能阅读设备上的摄像头按照预设频率拍摄实体书,从而依据拍摄得到的图像,获取待检测的内容页图像。其中,由于摄像头可能会拍摄到用户正在翻页的图像,从而需要获取用户翻页动作完成后的内容页图像。在相关技术中,通常是依次将拍摄得到的图像与预存的实体书内容页图像进行逐一匹配,直至检测到与预存的实体书内容页图像相匹配的拍摄图像,则将该拍摄图像作为待检测的内容页图像。由于需要将拍摄得到的图像逐一进行匹配以确定待检测的内容页图像,从而效率较低。
发明内容
为了解决上述问题,本发明实施例提供一种克服上述问题或者至少部分地解决上述问题的翻页检测方法及装置。
根据本发明实施例的第一方面,提供了一种翻页检测方法,该方法包括:
在获取多个检测图像以对待检测实体书进行检测的过程中,提取多个检测图像中每一检测图像的图像特征;
对于多个检测图像中获取顺序连续的任意N个检测图像,若任意N个检测图像中最后一个检测图像的图像特征与其它检测图像的图像特征之间满足预设条件,则确定最后一个检测图像是在待检测实体书处于翻页稳定状态下拍摄得到的;其中,N为大于1的整数,翻页稳定状态是指完成对待检测实体书的翻页动作后,待检测实体书所处的稳定状态。
本发明实施例提供的方法,通过在获取多个检测图像以对待检测实体书进行检测的过程中,提取多个检测图像中每一检测图像的图像特征。对于多个检测图像中获取顺序连续的任意N个检测图像,若任意N个检测图像中最后一个检测图像的图像特征与其它检测图像的图像特征之间满足预设条件,则确定最后一个检测图像是在待检测实体书处于翻页稳定状态下拍摄得到的。由于不用经过逐一匹配的过程,对于任一检测图像,只需依据该检测图像前面的几个检测图像即可确定该检测图像对应的翻页状态,从而提高了检测效率。
根据本发明实施例的第二方面,提供了一种翻页检测装置,该装置包括:
提取模块,用于在获取多个检测图像以对待检测实体书进行检测的过程中,提取多个检测图像中每一检测图像的图像特征;
第一确定模块,用于对于多个检测图像中获取顺序连续的任意N个检测图像,若任意N个检测图像中最后一个检测图像的图像特征与其它检测图像的图像特征之间满足预设条件,则确定最后一个检测图像是在待检测实体书处于翻页稳定状态下拍摄得到的;其中,N为大于1的整数,翻页稳定状态是指完成对待检测实体书的翻页动作后,待检测实体书所处的稳定状态。
根据本发明实施例的第三方面,提供了一种电子设备,包括:
至少一个处理器;以及
与处理器通信连接的至少一个存储器,其中:
存储器存储有可被处理器执行的程序指令,处理器调用程序指令能够执行第一方面的各种可能的实现方式中任一种可能的实现方式所提供的翻页检测方法。
根据本发明的第四方面,提供了一种非暂态计算机可读存储介质,非暂态计算机可读存储介质存储计算机指令,计算机指令使计算机执行第一方面的各种可能的实现方式中任一种可能的实现方式所提供的翻页检测方法。
应当理解的是,以上的一般描述和后文的细节描述是示例性和解释性的,并不能限制本发明实施例。
附图说明
图1为本发明实施例的一种翻页检测方法的流程示意图;
图2为本发明实施例的一种翻页检测方法的流程示意图;
图3为本发明实施例的一种翻页检测方法的流程示意图;
图4为本发明实施例的一种翻页检测方法的流程示意图;
图5为本发明实施例的一种翻页检测装置的框图;
图6为本发明实施例的一种电子设备的框图。
具体实施方式
下面结合附图和实施例,对本发明实施例的具体实施方式作进一步详细描述。以下实施例用于说明本发明实施例,但不用来限制本发明实施例的范围。
随着信息化及智能化的发展,用于阅读实体书的智能阅读设备越来越普及。智能阅读设备主要是通过预先存储一些实体书的讲解录音,以及实体书的封面图像及内容页图像,来实现智能阅读的。用户在使用智能阅读设备阅读实体书时,通常是由智能阅读设备上的摄像头按照预设频率拍摄实体书,从而依据拍摄得到的图像,获取待检测的内容页图像。智能设备在拍摄过程中,用户可能会翻动实体书,从而导致拍摄得到的图像可能会包含用户翻动实体书的手势动作,也即会拍摄到用户正在翻页的图像。而正在翻页的图像会由于内容不够清晰,从而导致无法进行内容检测。
在相关技术中,通常是依次将拍摄得到的图像与预存的实体书内容页图像进行逐一匹配,直至检测到与预存的实体书内容页图像相匹配的拍摄图像,则将该拍摄图像作为待检测的内容页图像。由于需要将拍摄得到的图像逐一进行匹配以确定待检测的内容页图像,从而效率较低。例如,由于用户翻页动作需要持续段时间,而摄像头会持续不断的拍摄图像,从而需要等到翻页动作对应的拍摄图像均匹配失败后,才能检测到与实体书内容页图像相匹配的拍摄图像。因此,整体过程耗费时间过长且效率较低。
针对上述需求,本发明实施例提供了一种翻页检测方法。需要说明的是,本发明实施例涉及到的实体书可以为绘本、杂志及画报等不同读物类型,本发明实施例对此不作具体限定。另外,该方法对应的执行主体可以为带有阅读功能的智能阅读设备,或者为解耦出阅读功能,仅带有实体书检测功能的智能设备,本发明实施例对此也不作具体限定。为了便于说明,本发明实施例以执行主体为智能阅读设备为例,对本发明实施例提供的翻页检测方法进行阐述。参见图1,该方法包括:
101、在获取多个检测图像以对待检测实体书进行检测的过程中,提取多个检测图像中每一检测图像的图像特征。
在执行101之前,用户可将先将待检测实体书翻至封面,从而由摄像头进行封面检测,以确定该实体书为哪本实体书。在确定该实体书为哪本实体书后,用户可将实体书翻至内容页,并通过智能阅读设备进行阅读。智能阅读设备上的摄像头按照预设频率对实体书进行实时拍摄,获取多个检测图像并进行内容检测。
对于任一检测图像,该检测图像对应的图像特征用于确定该检测图像对应的翻页状态。其中,该检测图像对应的图像特征是基于该检测图像自身而提取的,翻页状态可包括翻页进行状态及翻页稳定状态。翻页稳定状态是指完成对待检测实体书的翻页动作后,待检测实体书所处的稳定状态。翻页进行状态是指对待检测实体书的翻页动作正在进行时,待检测实体书所处的被翻动状态。
102、对于多个检测图像中获取顺序连续的任意N个检测图像,若任意N个检测图像中最后一个检测图像的图像特征与其它检测图像的图像特征之间满足预设条件,则确定最后一个检测图像是在待检测实体书处于翻页稳定状态下拍摄得到的。
其中,N为大于1的整数,翻页稳定状态是指完成对待检测实体书的翻页动作后,待检测实体书所处的稳定状态。对于多个检测图像中获取顺序连续的任意N个检测图像,可将该N个检测图像中最后一个检测图像的图像特征(也即第N个检测图像)与前面N-1个检测图像的图像特征进行比较,以确定是否满足预设条件。若满足预设条件,则可确定第N个检测图像是在待检测实体书处于翻页稳定状态下拍摄得到的。
由于摄像头拍摄频率通常较快,在翻页动作进行时以及翻页动作完成后,摄像头可拍摄到翻页动作进行时的多个检测图像,以及翻页动作完成后的多个图像。例如,若在翻页动作进行时摄像头拍摄到了M个检测图像,而翻页动作完成后,摄像头拍摄到了Z个检测图像。按照上述判断方式,若确定Z个检测图像均是在待检测实体书处于翻页稳定状态下拍摄得到的,则实际实施过程中可将Z个检测图像中第一个检测图像作为内容检测的检测对象,或者从Z个检测图像中任选一个检测图像作为内容检测的检测对象,或者将Z个检测图像中最后一个检测图像作为内容检测的检测对象,或者将Z个检测图像的下一个检测图像作为内容检测的检测对象,本发明实施例对此不作具体限定。其中,上述Z的取值可以根据需求进行设置,如取值2至6,本发明实施例对此也不作具体限定。
需要说明的是,考虑到实际实施过程中,按照上述判断方式,可能会出现连续多个检测图像被确定是在待检测实体书处于翻页进行状态下拍摄得到的,但用户翻一页的过程是不可能会持续这么长时间的,从而若出现连续Y个检测图像被确定是在待检测实体书处于翻页稳定状态下拍摄得到的,且Y大于预设阈值,则可直接将Y+1个检测图像作为内容检测的检测对象,以避免因持续判断出错而耽误太长时间。
本发明实施例提供的方法,通过在获取多个检测图像以对待检测实体书进行检测的过程中,提取多个检测图像中每一检测图像的图像特征。对于多个检测图像中获取顺序连续的任意N个检测图像,若任意N个检测图像中最后一个检测图像的图像特征与其它检测图像的图像特征之间满足预设条件,则确定最后一个检测图像是在待检测实体书处于翻页稳定状态下拍摄得到的。由于不用经过逐一匹配的过程,对于任一检测图像,只需依据该检测图像前面的几个检测图像即可确定该检测图像对应的翻页状态,从而提高了检测效率。
基于上述实施例的内容,作为一种可选实施例,图像特征为哈希差异值,N为大于2的整数,预设条件为最后一个图像对应的平均汉明距离不大于第一预设阈值或最后一个图像对应的最大汉明距离不大于第二预设阈值;相应地,在确定最后一个检测图像是在待检测实体书处于翻页稳定状态下拍摄得到的之前,还可以计算平均汉明距离及最大汉明距离,本发明实施例对此不作具体限定。参见图2,包括但不限于:
201、分别计算最后一个图像的哈希差异值与其它检测图像中每一检测图像的哈希差异值之间的差值。
为了便于理解,以N为3为例,N个检测图像的哈希矩阵可分别用p1、p2及p3进行表示。计算p3与p1之间的汉明距离ham1,以及p3与p2之间的汉明距离ham2。其中,哈希矩阵可以为9*8的0、1二值矩阵,汉明距离为两个矩阵中位置相同但数值不同的元素数量。例如,若A为(1,0,0,1,1,0,1),B为(0,1,1,0,0,1,1),则AB之间的汉明距离为6。需要说明的是,实际实施过程中N可以取值3至6,本发明实施例对此不作具体限定。
202、计算所有差值的平均值,将平均值作为平均汉明距离,并从所有差值中选取最大值,将最大值作为最大汉明距离。
具体地,由于所有差值的数量为2,从而所有差值的平均值即为(ham1+ham2)/2,也即为平均汉明距离。而所有差值的最大值可表示为max(ham1,ham2),也即为最大汉明距离。需要说明的是,每次在计算第Z个检测图像对应的平均汉明距离及最大汉明距离时,可基于第(Z-N-1)个检测图像至第Z个检测图像,也即总数量为N的检测图像的图像特征,以计算第Z个检测图像对应的平均汉明距离及最大汉明距离。
由上述实施例可知,翻页状态除了包括翻页稳定状态之外,还包括翻页进行状态。相应地,若第Z个检测图像的对应的平均汉明距离大于第一预设阈值且第Z个检测图像的对应的最大汉明距离大于第二预设阈值,则可确定第Z个检测图像是在待检测实体书处于翻页进行状态下拍摄得到的。
需要说明的是,由上述201中的内容可知,汉明距离可度量通过字符替换的方式将一个字符串转换成另一个字符串时所需的最小替换次数,而平均汉明距离及最大汉明距离,都是依据第Z个检测图像与前面的其它检测图像之间哈希差异值的差值计算得到的。因此,平均汉明距离及最大汉明距离越大,则说明第Z个检测图像与前面的其它检测图像之间的差异也就越大,也即越能说明第Z个检测图像与前面的其它检测图像对应的是不同的翻页状态。而Z个检测图像是在翻页动作完成后拍摄得到的,从而当第Z个检测图像的对应的平均汉明距离大于第一预设阈值且第Z个检测图像的对应的最大汉明距离大于第二预设阈值时,则可确定第Z个检测图像是在待检测实体书处于翻页进行状态下拍摄得到的。反之,则可确定第Z个检测图像是在待检测实体书处于翻页稳定状态下拍摄得到的。
本发明实施例提供的方法,通过计算最后一个图像对应的平均汉明距离及最大汉明距离,并分别判断最后一个图像对应的平均汉明距离是否大于第一预设阈值或最后一个图像对应的最大汉明距离是否大于第二预设阈值,并依据判断结果确定最后一个图像对应的翻页状态。由于可根据检测图像之间哈希差异值的变化,以确定检测图像对应的翻页状态,从而可提高检测效率及准确率。
基于上述实施例的内容,作为一种可选实施例,每一检测图像的图像特征为每一检测图像中包含的轮廓线段,N为2;相应地,对于任意N个检测图像中的前一个检测图像和最后一个检测图像,预设条件为前一个检测图像中包含的轮廓线段与最后一个检测图像中包含的轮廓线段之间匹配。
由于N为2,从而N个检测图像实则包含两个检测图像,分别为前一个检测图像和最后一个检测图像。在确定检测图像中包含的轮廓线段之前,可先对检测图像作二值处理。具体地,可通过自适应阈值法将检测图像转换为二值图像,本发明实施例对此不作具体限定。
在将检测图像变为二值图像后,可确定二值图像中包含的轮廓线段。需要说明的是,由于检测图像是对待检测实体书进行拍摄而获取的,从而可能会拍到实体书封面的边缘轮廓,或者实体书内容页的边缘轮廓。相应地,检测图像中可能会包含边缘轮廓的轮廓线段。在对检测图像作二值处理后,这些边缘轮廓会更加凸显。具体体现为这些边缘轮廓对应的像素点在二值图像中的灰度值大多均为指定值,也即均为255,或者均为0。还需要说明的是,由于边缘轮廓可能为实体书封面的边缘轮廓,也可能为实体书内容页的边缘轮廓,从而检测图像中包含的轮廓线段可能会有多个。
由于待检测实体书在处于翻页稳定状态时,连续拍摄得到的检测图像中包含的轮廓线段是不会变化的,从而对于连续拍摄得到的前一个检测图像及最后一个检测图像,也即两者包含的轮廓线段应当匹配。反而言之,若前一个检测图像中包含的轮廓线段与最后一个检测图像中包含的轮廓线段之间匹配,则可确定最后一个检测图像是在待检测实体书处于翻页稳定状态下拍摄得到的。基于上述原理,若前一个检测图像中包含的轮廓线段与最后一个检测图像中包含的轮廓线段之间不匹配,则可确定最后一个检测图像是在待检测实体书处于翻页进行状态下拍摄得到的。
本发明实施例提供的方法,通过判断前一个检测图像中包含的轮廓线段与最后一个检测图像中包含的轮廓线段之间是否匹配,并依据判断结果确定最后一个图像对应的翻页状态。由于可根据检测图像之间包含的轮廓线段的匹配状态,以确定检测图像对应的翻页状态,从而可提高检测效率及准确率。
基于上述实施例的内容,作为一种可选实施例,在确定最后一个检测图像是在待检测实体书处于翻页稳定状态下拍摄得到的之前,还可确定检测图像中包含的轮廓线段。本发明实施例不对确定检测图像中包含的轮廓线段的方式作具体限定,包括但不限于:对于任意N个检测图像中的任一检测图像,确定任一检测图像内的轮廓像素点集合,对每一轮廓像素点集合中的轮廓像素点进行拟合,得到任一检测图像中包含的轮廓线段。
由上述实施例的内容可知,检测图像中包含的轮廓线段可能会有多个。因此,对于任意N个检测图像中的任一检测图像,可先确定该检测图像中每一轮廓线段对应的轮廓像素点集合。通过对每一轮廓像素点集合中的轮廓像素点进行拟合,得到该检测图像中包含的轮廓线段。其中,轮廓像素点是对该检测图像作二值处理后,灰度值为指定值的像素点。指定值的定义可参考上述实施例的内容,此处不再赘述。另外,拟合的方式可以为线性拟合或近似线性拟合,本发明实施例对此不作具体限定。
基于上述实施例的内容,作为一种可选实施例,本发明实施例不对确定任一检测图像内的轮廓像素点集合的方式作具体限定,包括但不限于:对任一检测图像内的像素点进行逐行检索,对于检索到的任一轮廓像素点,若当前轮廓像素点集合的总数量为0或不存在满足第一指定条件的轮廓像素点集合,且存在与任一轮廓像素点之间满足第二指定条件的指定轮廓像素点,则建立新的轮廓像素点集合,并将任一轮廓像素点以及指定轮廓像素点添加至新的轮廓像素点集合,若当前轮廓像素点集合的总数量为0或不存在满足第一指定条件的轮廓像素点集合,且不存在与任一轮廓像素点之间满足第二指定条件的指定轮廓像素点,则将任一轮廓像素点添加至轮廓像素点淘汰集合,若当前存在满足第一指定条件的轮廓像素点集合,则将任一轮廓像素点添加至满足第一指定条件的轮廓像素点集合,重复执行上述检索以及添加过程,直至检索完任一检测图像内的所有像素点;其中,指定轮廓像素点为任一轮廓像素点后面检索到的下一个轮廓像素点或者轮廓像素点淘汰集合中的轮廓像素点。
基于上述实施例的内容,作为一种可选实施例,第一指定条件为轮廓像素点集合内存在轮廓像素点在任一轮廓像素点周围的指定范围内或者存在轮廓像素点与任一轮廓像素点之间的距离小于第三预设阈值;第二指定条件为指定轮廓像素点在任一轮廓像素点周围的指定范围内或者任一轮廓像素点与指定轮廓像素点之间的距离小于第三预设阈值。
其中,对于轮廓像素点A,轮廓像素点A周围的指定范围指的是:以轮廓像素点A为中心周围一圈像素点。例如,以轮廓像素点A的坐标为(5,5)为例,则该轮廓像素点周围的指定范围即为坐标为(4,6)、(5,6)、(6,6)、(4,5)、(6,5)、(4,4)、(5,4)及(6,4)这8个像素点。若轮廓像素点B的坐标为上述8个坐标中的任意一个坐标,则可确定轮廓像素点B在轮廓像素点A周围的指定范围内。需要说明的是,上述实施例涉及到的第一预设阈值、第二预设阈值及第三预设阈值的取值可根据实际情况进行设置,本发明实施例对此不作具体限定。
为了便于理解,对于N个检测图像中的任一检测图像,以该检测图像包含5*5个像素点为例,对确定该检测图像内的轮廓像素点集合的过程进行说明。需要说明的是,确定该检测图像内的轮廓像素点集合的过程,即为将构成不同轮廓线段的轮廓像素点进行聚合的过程。其中,对该检测图像内的像素点进行逐行检索的方式,可以从左上角第一个像素点开始,从左至右逐行向下检索。或者,还可以从左下角第一个像素点开始,从左至右逐行向上检索。当然,还可以采用其它逐行检索方式,或者不同的逐列检索方式,本发明实施例对此不作具体限定。
以从左上角第一个像素点开始,从左至右逐行向下检索为例,对于第一个检索到的轮廓像素点(该轮廓像素点并非一定是第一个像素点,轮廓像素点的定义可参考上述实施例的内容),由于当前不存在轮廓像素点集合,也即当前轮廓像素点集合的总数量为0,从而可确定当前是否存在与任一轮廓像素点之间满足第二指定条件的指定轮廓像素点。
由于指定轮廓像素点为第一个轮廓像素点后面检索到的下一个轮廓像素点(也即第二个轮廓像素点),或者轮廓像素点淘汰集合中的轮廓像素点,而当前轮廓像素点淘汰集合为空,从而指定轮廓像素点为第二个轮廓像素点。接着,可判断第二个轮廓像素点是否在第一个轮廓像素点周围的指定范围内或者第二个轮廓像素点与第一个轮廓像素点之间的距离是否小于第三预设阈值,若满足其中一个条件,即可确定第二个轮廓像素点与第一个轮廓像素点之间满足第二指定条件,从而可创建新的轮廓像素点集合,并将第一个轮廓像素点与第二个轮廓像素点添加至新的轮廓像素点集合。
若两个条件均不满足,也即第二个轮廓像素点与第一个轮廓像素点之间不满足第二指定条件,而当前轮廓像素点淘汰集合为空,从而可确定当前不存在与第一个轮廓像素点之间满足第二指定条件的指定轮廓像素点,从而可将第一个轮廓像素点添加至轮廓像素点淘汰集合。
在上述过程结束后,可继续检索后面的像素点。对于上述过程中的第一种情况,也即将第一个轮廓像素点与第二个轮廓像素点添加至新的轮廓像素点集合。此时,由于第二个轮廓像素点已经被检索到且被添加至建立的轮廓像素点集合中,从而在第一种情况下,下一个被检索到的轮廓像素点为第三个轮廓像素点。由于当前轮廓像素点集合的总数量为1而不为0,从而可判断当前是否存在满足第一指定条件的轮廓像素点集合,也即判断之前创建的轮廓像素点集合是否满足第一指定条件。
具体地,可判断该轮廓像素点集合内是否存在轮廓像素点在第三个轮廓像素点周围的指定范围内或者存在轮廓像素点与第三个轮廓像素点之间的距离小于第三预设阈值。若满足其中一个条件,即可确定该轮廓像素点集合满足第一指定条件,从而可将第三个轮廓像素点添加至该轮廓像素点集合。
然而,若该轮廓像素点集合不满足第一指定条件,则可判断是否存在与第三个轮廓像素点之间满足第二指定条件的指定轮廓像素点。由于指定轮廓像素点为第三个轮廓像素点后面检索到的下一个轮廓像素点(也即第四个轮廓像素点),或者轮廓像素点淘汰集合中的轮廓像素点,而当前轮廓像素点淘汰集合还是为空,从而指定轮廓像素点为第四个轮廓像素点。接着,可判断第四个轮廓像素点是否在第三个轮廓像素点周围的指定范围内或者第四个轮廓像素点与第三个轮廓像素点之间的距离是否小于第三预设阈值,若满足其中一个条件,即可确定第四个轮廓像素点与第三个轮廓像素点之间满足第二指定条件,从而可创建新的轮廓像素点集合,并将第四个轮廓像素点与第三个轮廓像素点添加至新的轮廓像素点集合。
若两个条件均不满足,也即第四个轮廓像素点与第三个轮廓像素点之间不满足第二指定条件,而当前轮廓像素点淘汰集合为空,从而可确定当前不存在与第三个轮廓像素点之间满足第二指定条件的指定轮廓像素点,从而可将第三个轮廓像素点添加至轮廓像素点淘汰集合。
对于上述过程中的第二种情况,也即将第一个轮廓像素点添加至轮廓像素点淘汰集合。此时,由于第二个轮廓像素点还未找到归属,从而在第二种情况下,下一个被检索到的轮廓像素点还是为第二个轮廓像素点。由于当前轮廓像素点集合的总数量还是为0,从而可确定当前是否存在与第二个轮廓像素点之间满足第二指定条件的指定轮廓像素点。
由于指定轮廓像素点为第二个轮廓像素点后面检索到的下一个轮廓像素点(也即第三个轮廓像素点),或者轮廓像素点淘汰集合中的轮廓像素点,而轮廓像素点淘汰集合中只有一个轮廓像素点,也即第一个轮廓像素点,而第一个轮廓像素点与第二个轮廓像素点之前已经判断过,两者之间是不满足第二指定条件的,从而指定轮廓像素点即为第三个轮廓像素点。接着,可判断第三个轮廓像素点是否在第二个轮廓像素点周围的指定范围内或者第三个轮廓像素点与第二个轮廓像素点之间的距离是否小于第三预设阈值,若满足其中一个条件,即可确定第三个轮廓像素点与第二个轮廓像素点之间满足第二指定条件,从而可创建新的轮廓像素点集合,并将第二个轮廓像素点与第三个轮廓像素点添加至新的轮廓像素点集合。
若两个条件均不满足,也即第三个轮廓像素点与第二个轮廓像素点之间不满足第二指定条件,而轮廓像素点淘汰集合中的第一个轮廓像素点与第二个轮廓像素点之间也不满足第二指定条件,从而可确定当前不存在与第二个轮廓像素点之间满足第二指定条件的指定轮廓像素点,从而可将第二个轮廓像素点也添加至轮廓像素点淘汰集合。此时,轮廓像素点淘汰集合有两个轮廓像素点,分别为第一个轮廓像素点及第二个轮廓像素点。
后续过程可依次类推,直至检索完该检测图像内的所有像素点,从而可得到该检测图像内的轮廓像素点集合。需要说明的是,在检索与添加的过程中,若从轮廓像素点淘汰集合中选出了一个轮廓像素点并添加至某一轮廓像素点集合中,则在轮廓像素点淘汰集合中需要删掉该轮廓像素点。在检索完该检测图像内的所有像素点,即可得到该检测图像内的轮廓像素点集合。通过上述过程,可得到N个检测图像中每一检测图像内的轮廓像素点集合。
本发明实施例提供的方法,由于可通过迭代判断的方式将检测图像内构成不同轮廓线段的轮廓像素点进行聚合,以得到检测图像内的轮廓像素点集合,从而基于轮廓像素点集合对轮廓线段进行拟合时,可提高拟合的准确率。
基于上述实施例的内容,作为一种可选实施例,在确定最后一个检测图像是在待检测实体书处于翻页稳定状态下拍摄得到的之前,还可判断前一个检测图像中包含的轮廓线段与最后一个检测图像中包含的轮廓线段之间是否匹配。参见图3,本发明实施例不对判断两者之间是否匹配的方式作具体限定,包括但不限于:
301、若前一个检测图像中包含的轮廓线段数量与最后一个检测图像中包含的轮廓线段数量相同,则判断前一个检测图像中包含的轮廓线段与最后一个检测图像中包含的轮廓线段之间是否一一对应匹配。
由于前一个检测图像中包含的轮廓线段数量与最后一个检测图像中包含的轮廓线段数量相同,从而在执行301之前,可预先为前一个检测图像中包含的轮廓线段与最后一个检测图像中包含的轮廓线段之间建立对应关系,如按照前一个检测图像中包含的轮廓线段的位置,以及最后一个检测图像中包含的轮廓线段的位置,建立两者之间的对应关系,本发明实施例对此不作具体限定。
另外,在判断前一个检测图像中包含的轮廓线段与最后一个检测图像中包含的轮廓线段之间是否一一对应匹配时,匹配可以指的是两个轮廓线段的形状是否近似,或者在相同坐标系下位置是否相似,本发明实施例对此不作具体限定。
需要说明的是,若前一个检测图像中包含的轮廓线段数量与最后一个检测图像中包含的轮廓线段数量不相同,则可确定前一个检测图像中包含的轮廓线段与最后一个检测图像中包含的轮廓线段之间不匹配。由上述实施例的内容可知,进而可确定最后一个检测图像是在待检测实体书处于翻页进行状态下拍摄得到的。
302、若前一个检测图像中包含的轮廓线段与最后一个检测图像中包含的轮廓线段之间一一对应匹配,则确定前一个检测图像中包含的轮廓线段与最后一个检测图像中包含的轮廓线段之间匹配。
需要说明的是,若前一个检测图像中包含的轮廓线段与最后一个检测图像中包含的轮廓线段之间并非一一对应匹配,则可确定前一个检测图像中包含的轮廓线段与最后一个检测图像中包含的轮廓线段之间不匹配。因此,可确定最后一个检测图像是在待检测实体书处于翻页进行状态下拍摄得到的。
本发明实施例提供的方法,由于两个检测图像之间轮廓线段的匹配程度能够反映出两个检测图像之间一致程度,从而以此判断检测图像的翻页状态,可提高检测准确率。
基于上述实施例的内容,作为一种可选实施例,本发明实施例不对判断前一个检测图像中包含的轮廓线段与最后一个检测图像中包含的轮廓线段之间是否一一对应匹配的方式作具体限定。参见图4,包括但不限于:
3011、按照轮廓线段的起始点横坐标的大小顺序,对前一个检测图像中包含的轮廓线段进行排序编号,并对最后一个检测图像中包含的轮廓线段进行排序编号,前一个检测图像与最后一个检测图像之间坐标系的建立方式相同。
需要说明的是,排序编号的方式还可以从小到大的方式。另外,排序编号的依据还可以为轮廓线段的起始点纵坐标,或者轮廓线段的结束点横坐标,或者轮廓线段的结束点纵坐标,本发明实施例对此不作具体限定。
3012、对于前一个检测图像与最后一个检测图像之间编号相同的任意两个轮廓线段,若任意两个轮廓线段之间在相同坐标轴上的夹角在第一预设范围内且在相同坐标轴上的截距差值在第二预设范围内,则确定任意两个轮廓线段相互匹配。
例如,若前一个检测图像中有5个轮廓线段,在经过排序编号后分别依次为A1、A2、A3、A4及A5。而最后一个检测图像中也有5个轮廓线段,在经过排序编号后分别依次为B1、B2、B3、B4及B5。其中,A1与B1编号相同,后面的依次类推。接着,可判定A1与B1之间在相同坐标轴上的夹角是否在第一预设范围内且在相同坐标轴上的截距差值是否在第二预设范围。若满足两个条件,即可确定A1与B1相互匹配。同理,可接着判定A2与B2、后面的依次类推。
需要说明的是,第一预设范围可以为正负5度之间,第二预设范围可以为正负15个像素点的距离,本发明实施例对此不作具体限定。
3013、若前一个检测图像与最后一个检测图像之间编号相同的轮廓线段均相互匹配,则确定前一个检测图像中包含的轮廓线段与最后一个检测图像中包含的轮廓线段之间一一对应匹配。
例如,结合上述示例,若A1与B1、A2与B2、A3与B3、A4与B4以及A5与B5均相互匹配,则可确定前一个检测图像中包含的轮廓线段与最后一个检测图像中包含的轮廓线段之间一一对应匹配。
需要说明的是,若存在一对编号相同的轮廓线段均不匹配,则可确定确前一个检测图像中包含的轮廓线段与最后一个检测图像中包含的轮廓线段之间并非一一对应匹配,进而可确定前一个检测图像中包含的轮廓线段与最后一个检测图像中包含的轮廓线段之间不匹配。
需要说明的是,上述所有可选实施例,可以采用任意结合形成本发明的可选实施例,在此不再一一赘述。
基于上述实施例的内容,本发明实施例提供了一种翻页检测装置,该装置用于执行上述方法实施例中的翻页检测方法。参见图5,该装置包括:
提取模块501,用于在获取多个检测图像以对待检测实体书进行检测的过程中,提取多个检测图像中每一检测图像的图像特征;
第一确定模块502,用于对于多个检测图像中获取顺序连续的任意N个检测图像,若任意N个检测图像中最后一个检测图像的图像特征与其它检测图像的图像特征之间满足预设条件,则确定最后一个检测图像是在待检测实体书处于翻页稳定状态下拍摄得到的;其中,N为大于1的整数,翻页稳定状态是指完成对待检测实体书的翻页动作后,待检测实体书所处的稳定状态。
作为一种可选实施例,图像特征为哈希差异值,N为大于2的整数,预设条件为最后一个图像对应的平均汉明距离不大于第一预设阈值或最后一个图像对应的最大汉明距离不大于第二预设阈值;相应地,该装置还包括:
第一计算模块,用于分别计算最后一个图像的哈希差异值与其它检测图像中每一检测图像的哈希差异值之间的差值;
第二计算模块,用于计算所有差值的平均值,将平均值作为平均汉明距离,并从所有差值中选取最大值,将最大值作为最大汉明距离。
作为一种可选实施例,每一检测图像的图像特征为每一检测图像中包含的轮廓线段,N为2;相应地,对于任意N个检测图像中的前一个检测图像和最后一个检测图像,预设条件为前一个检测图像中包含的轮廓线段与最后一个检测图像中包含的轮廓线段之间匹配。
作为一种可选实施例,该装置还包括:
第二确定模块,用于对于任意N个检测图像中的任一检测图像,确定任一检测图像内的轮廓像素点集合;
拟合模块,用于对每一轮廓像素点集合中的轮廓像素点进行拟合,得到任一检测图像中包含的轮廓线段;其中,轮廓像素点是对任一检测图像作二值处理后,灰度值为指定值的像素点。
作为一种可选实施例,拟合模块,用于对任一检测图像内的像素点进行逐行检索,对于检索到的任一轮廓像素点,若当前轮廓像素点集合的总数量为0或不存在满足第一指定条件的轮廓像素点集合,且存在与任一轮廓像素点之间满足第二指定条件的指定轮廓像素点,则建立新的轮廓像素点集合,并将任一轮廓像素点以及指定轮廓像素点添加至新的轮廓像素点集合,若当前轮廓像素点集合的总数量为0或不存在满足第一指定条件的轮廓像素点集合,且不存在与任一轮廓像素点之间满足第二指定条件的指定轮廓像素点,则将任一轮廓像素点添加至轮廓像素点淘汰集合,若当前存在满足第一指定条件的轮廓像素点集合,则将任一轮廓像素点添加至满足第一指定条件的轮廓像素点集合,重复执行上述检索以及添加过程,直至检索完任一检测图像内的所有像素点;其中,指定轮廓像素点为任一轮廓像素点后面检索到的下一个轮廓像素点或者轮廓像素点淘汰集合中的轮廓像素点。
作为一种可选实施例,第一指定条件为轮廓像素点集合内存在轮廓像素点在任一轮廓像素点周围的指定范围内或者存在轮廓像素点与任一轮廓像素点之间的距离小于第三预设阈值;第二指定条件为指定轮廓像素点在任一轮廓像素点周围的指定范围内或者任一轮廓像素点与指定轮廓像素点之间的距离小于第三预设阈值。
作为一种可选实施例,该装置还包括:
判断模块,用于当前一个检测图像中包含的轮廓线段数量与最后一个检测图像中包含的轮廓线段数量相同时,则判断前一个检测图像中包含的轮廓线段与最后一个检测图像中包含的轮廓线段之间是否一一对应匹配;
第三确定模块,用于当前一个检测图像中包含的轮廓线段与最后一个检测图像中包含的轮廓线段之间一一对应匹配时,则确定前一个检测图像中包含的轮廓线段与最后一个检测图像中包含的轮廓线段之间匹配。
作为一种可选实施例,判断模块,用于按照轮廓线段的起始点横坐标的大小顺序,对前一个检测图像中包含的轮廓线段进行排序编号,并对最后一个检测图像中包含的轮廓线段进行排序编号,前一个检测图像与最后一个检测图像之间坐标系的建立方式相同;对于前一个检测图像与最后一个检测图像之间编号相同的任意两个轮廓线段,若任意两个轮廓线段之间在相同坐标轴上的夹角在第一预设范围内且在相同坐标轴上的截距差值在第二预设范围内,则确定任意两个轮廓线段相互匹配;若前一个检测图像与最后一个检测图像之间编号相同的轮廓线段均相互匹配,则确定前一个检测图像中包含的轮廓线段与最后一个检测图像中包含的轮廓线段之间一一对应匹配。
本发明实施例提供的装置,通过在获取多个检测图像以对待检测实体书进行检测的过程中,提取多个检测图像中每一检测图像的图像特征。对于多个检测图像中获取顺序连续的任意N个检测图像,若任意N个检测图像中最后一个检测图像的图像特征与其它检测图像的图像特征之间满足预设条件,则确定最后一个检测图像是在待检测实体书处于翻页稳定状态下拍摄得到的。由于不用经过逐一匹配的过程,对于任一检测图像,只需依据该检测图像前面的几个检测图像即可确定该检测图像对应的翻页状态,从而提高了检测效率。
其次,通过计算最后一个图像对应的平均汉明距离及最大汉明距离,并分别判断最后一个图像对应的平均汉明距离是否大于第一预设阈值或最后一个图像对应的最大汉明距离是否大于第二预设阈值,并依据判断结果确定最后一个图像对应的翻页状态。由于可根据检测图像之间哈希差异值的变化,以确定检测图像对应的翻页状态,从而可提高检测效率及准确率。
另外,通过判断前一个检测图像中包含的轮廓线段与最后一个检测图像中包含的轮廓线段之间是否匹配,并依据判断结果确定最后一个图像对应的翻页状态。由于可根据检测图像之间包含的轮廓线段的匹配状态,以确定检测图像对应的翻页状态,从而可提高检测效率及准确率。
最后,由于可通过迭代判断的方式将检测图像内构成不同轮廓线段的轮廓像素点进行聚合,以得到检测图像内的轮廓像素点集合,从而基于轮廓像素点集合对轮廓线段进行拟合时,可提高拟合的准确率。
本发明实施例提供了一种电子设备。参见图6,该设备包括:处理器(processor)601、存储器(memory)602和总线603;
其中,处理器601及存储器602分别通过总线603完成相互间的通信;
处理器601用于调用存储器602中的程序指令,以执行上述实施例所提供的翻页检测方法,例如包括:在获取多个检测图像以对待检测实体书进行检测的过程中,提取多个检测图像中每一检测图像的图像特征;对于多个检测图像中获取顺序连续的任意N个检测图像,若任意N个检测图像中最后一个检测图像的图像特征与其它检测图像的图像特征之间满足预设条件,则确定最后一个检测图像是在待检测实体书处于翻页稳定状态下拍摄得到的;其中,N为大于1的整数,翻页稳定状态是指完成对待检测实体书的翻页动作后,待检测实体书所处的稳定状态。
本发明实施例提供一种非暂态计算机可读存储介质,该非暂态计算机可读存储介质存储计算机指令,该计算机指令使计算机执行上述实施例所提供的翻页检测方法,例如包括:在获取多个检测图像以对待检测实体书进行检测的过程中,提取多个检测图像中每一检测图像的图像特征;对于多个检测图像中获取顺序连续的任意N个检测图像,若任意N个检测图像中最后一个检测图像的图像特征与其它检测图像的图像特征之间满足预设条件,则确定最后一个检测图像是在待检测实体书处于翻页稳定状态下拍摄得到的;其中,N为大于1的整数,翻页稳定状态是指完成对待检测实体书的翻页动作后,待检测实体书所处的稳定状态。
本领域普通技术人员可以理解:实现上述方法实施例的全部或部分步骤可以通过程序指令相关的硬件来完成,前述的程序可以存储于一计算机可读取存储介质中,该程序在执行时,执行包括上述方法实施例的步骤;而前述的存储介质包括:ROM、RAM、磁碟或者光盘等各种可以存储程序代码的介质。
以上所描述的电子设备等实施例仅仅是示意性的,其中作为分离部件说明的单元可以是或者也可以不是物理上分开的,作为单元显示的部件可以是或者也可以不是物理单元,即可以位于一个地方,或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部模块来实现本实施例方案的目的。本领域普通技术人员在不付出创造性的劳动的情况下,即可以理解并实施。
通过以上的实施方式的描述,本领域的技术人员可以清楚地了解到各实施方式可借助软件加必需的通用硬件平台的方式来实现,当然也可以通过硬件。基于这样的理解,上述技术方案本质上或者说对现有技术做出贡献的部分可以以软件产品的形式体现出来,该计算机软件产品可以存储在计算机可读存储介质中,如ROM/RAM、磁碟、光盘等,包括若干指令用以使得一台计算机设备(可以是个人计算机,服务器,或者网络设备等)执行各个实施例或者实施例的某些部分方法。最后,本申请的方法仅为较佳的实施方案,并非用于限定本发明实施例的保护范围。凡在本发明实施例的精神和原则之内,所作的任何修改、等同替换、改进等,均应包含在本发明实施例的保护范围之内。
Claims (11)
1.一种翻页检测方法,其特征在于,包括:
在获取多个检测图像以对待检测实体书进行检测的过程中,提取所述多个检测图像中每一检测图像的图像特征;
对于所述多个检测图像中获取顺序连续的任意N个检测图像,若所述任意N个检测图像中最后一个检测图像的图像特征与其它检测图像的图像特征之间满足预设条件,则确定所述最后一个检测图像是在所述待检测实体书处于翻页稳定状态下拍摄得到的;其中,所述N为大于1的整数,所述翻页稳定状态是指完成对所述待检测实体书的翻页动作后,所述待检测实体书所处的稳定状态。
2.根据权利要求1所述的方法,其特征在于,所述图像特征为哈希差异值,所述N为大于2的整数,所述预设条件为所述最后一个图像对应的平均汉明距离不大于第一预设阈值或所述最后一个图像对应的最大汉明距离不大于第二预设阈值;相应地,所述确定所述最后一个检测图像是在所述待检测实体书处于翻页稳定状态下拍摄得到的之前,还包括:
分别计算所述最后一个图像的哈希差异值与所述其它检测图像中每一检测图像的哈希差异值之间的差值;
计算所有差值的平均值,将所述平均值作为所述平均汉明距离,并从所有差值中选取最大值,将所述最大值作为所述最大汉明距离。
3.根据权利要求1所述的方法,其特征在于,每一检测图像的图像特征为每一检测图像中包含的轮廓线段,所述N为2;相应地,对于所述任意N个检测图像中的前一个检测图像和所述最后一个检测图像,所述预设条件为所述前一个检测图像中包含的轮廓线段与所述最后一个检测图像中包含的轮廓线段之间匹配。
4.根据权利要求3所述的方法,其特征在于,所述确定所述最后一个检测图像是在所述待检测实体书处于翻页稳定状态下拍摄得到的之前,还包括:
对于所述任意N个检测图像中的任一检测图像,确定所述任一检测图像内的轮廓像素点集合,对每一轮廓像素点集合中的轮廓像素点进行拟合,得到所述任一检测图像中包含的轮廓线段;其中,所述轮廓像素点是对所述任一检测图像作二值处理后,灰度值为指定值的像素点。
5.根据权利要求4所述的方法,其特征在于,所述确定所述任一检测图像内的轮廓像素点集合,包括:
对所述任一检测图像内的像素点进行逐行检索,对于检索到的任一轮廓像素点,若当前轮廓像素点集合的总数量为0或不存在满足第一指定条件的轮廓像素点集合,且存在与所述任一轮廓像素点之间满足第二指定条件的指定轮廓像素点,则建立新的轮廓像素点集合,并将所述任一轮廓像素点以及所述指定轮廓像素点添加至所述新的轮廓像素点集合,若当前轮廓像素点集合的总数量为0或不存在满足所述第一指定条件的轮廓像素点集合,且不存在与所述任一轮廓像素点之间满足所述第二指定条件的指定轮廓像素点,则将所述任一轮廓像素点添加至轮廓像素点淘汰集合,若当前存在满足所述第一指定条件的轮廓像素点集合,则将所述任一轮廓像素点添加至满足所述第一指定条件的轮廓像素点集合,重复执行上述检索以及添加过程,直至检索完所述任一检测图像内的所有像素点;
其中,所述指定轮廓像素点为所述任一轮廓像素点后面检索到的下一个轮廓像素点或者所述轮廓像素点淘汰集合中的轮廓像素点。
6.根据权利要求5所述的方法,其特征在于,所述第一指定条件为轮廓像素点集合内存在轮廓像素点在所述任一轮廓像素点周围的指定范围内或者存在轮廓像素点与所述任一轮廓像素点之间的距离小于所述第三预设阈值;所述第二指定条件为所述指定轮廓像素点在所述任一轮廓像素点周围的指定范围内或者所述任一轮廓像素点与所述指定轮廓像素点之间的距离小于第三预设阈值。
7.根据权利要求3至6中任一项所述的方法,其特征在于,所述确定所述最后一个检测图像是在所述待检测实体书处于翻页稳定状态下拍摄得到的之前,还包括:
若所述前一个检测图像中包含的轮廓线段数量与所述最后一个检测图像中包含的轮廓线段数量相同,则判断所述前一个检测图像中包含的轮廓线段与所述最后一个检测图像中包含的轮廓线段之间是否一一对应匹配;
若所述前一个检测图像中包含的轮廓线段与所述最后一个检测图像中包含的轮廓线段之间一一对应匹配,则确定所述前一个检测图像中包含的轮廓线段与所述最后一个检测图像中包含的轮廓线段之间匹配。
8.根据权利要求7所述的方法,其特征在于,所述判断所述前一个检测图像中包含的轮廓线段与所述最后一个检测图像中包含的轮廓线段之间是否一一对应匹配,包括:
按照轮廓线段的起始点横坐标的大小顺序,对所述前一个检测图像中包含的轮廓线段进行排序编号,并对所述最后一个检测图像中包含的轮廓线段进行排序编号,所述前一个检测图像与所述最后一个检测图像之间坐标系的建立方式相同;
对于所述前一个检测图像与所述最后一个检测图像之间编号相同的任意两个轮廓线段,若所述任意两个轮廓线段之间在相同坐标轴上的夹角在第一预设范围内且在相同坐标轴上的截距差值在第二预设范围内,则确定所述任意两个轮廓线段相互匹配;
若所述前一个检测图像与所述最后一个检测图像之间编号相同的轮廓线段均相互匹配,则确定所述前一个检测图像中包含的轮廓线段与所述最后一个检测图像中包含的轮廓线段之间一一对应匹配。
9.一种翻页检测装置,其特征在于,包括:
提取模块,用于在获取多个检测图像以对待检测实体书进行检测的过程中,提取所述多个检测图像中每一检测图像的图像特征;
第一确定模块,用于对于所述多个检测图像中获取顺序连续的任意N个检测图像,若所述任意N个检测图像中最后一个检测图像的图像特征与其它检测图像的图像特征之间满足预设条件,则确定所述最后一个检测图像是在所述待检测实体书处于翻页稳定状态下拍摄得到的;其中,所述N为大于1的整数,所述翻页稳定状态是指完成对所述待检测实体书的翻页动作后,所述待检测实体书所处的稳定状态。
10.一种电子设备,其特征在于,包括:
至少一个处理器;以及
与所述处理器通信连接的至少一个存储器,其中:
所述存储器存储有可被所述处理器执行的程序指令,所述处理器调用所述程序指令能够执行如权利要求1至8任一所述的方法。
11.一种非暂态计算机可读存储介质,其特征在于,所述非暂态计算机可读存储介质存储计算机指令,所述计算机指令使所述计算机执行如权利要求1至8任一所述的方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201810813117.XA CN109145751A (zh) | 2018-07-23 | 2018-07-23 | 翻页检测方法及装置 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201810813117.XA CN109145751A (zh) | 2018-07-23 | 2018-07-23 | 翻页检测方法及装置 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN109145751A true CN109145751A (zh) | 2019-01-04 |
Family
ID=64801490
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201810813117.XA Pending CN109145751A (zh) | 2018-07-23 | 2018-07-23 | 翻页检测方法及装置 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN109145751A (zh) |
Cited By (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN110443224A (zh) * | 2019-08-14 | 2019-11-12 | 广东小天才科技有限公司 | 翻页检测方法、装置、电子设备及存储介质 |
CN110516634A (zh) * | 2019-08-30 | 2019-11-29 | 安徽淘云科技有限公司 | 一种翻页检测方法、装置、设备及存储介质 |
CN111639713A (zh) * | 2020-06-01 | 2020-09-08 | 广东小天才科技有限公司 | 一种翻页检测的方法、装置、电子设备和存储介质 |
Citations (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2012167110A2 (en) * | 2011-06-02 | 2012-12-06 | Honda Motor Co., Ltd. | Target recognition and localization methods using a laser sensor for wheeled mobile robots |
US20130329262A1 (en) * | 2012-06-08 | 2013-12-12 | Casio Computer Co., Ltd. | Image reading apparatus and computer-readable storage medium |
CN103759638A (zh) * | 2014-01-10 | 2014-04-30 | 北京力信联合科技有限公司 | 一种零件检测方法 |
CN104574403A (zh) * | 2015-01-12 | 2015-04-29 | 飞天诚信科技股份有限公司 | 一种智能裁剪方法 |
CN107734254A (zh) * | 2017-10-14 | 2018-02-23 | 上海瞬动科技有限公司合肥分公司 | 一种无人机自动择机拍照方法 |
CN108229406A (zh) * | 2018-01-11 | 2018-06-29 | 海信集团有限公司 | 一种车道线检测方法、装置及终端 |
-
2018
- 2018-07-23 CN CN201810813117.XA patent/CN109145751A/zh active Pending
Patent Citations (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2012167110A2 (en) * | 2011-06-02 | 2012-12-06 | Honda Motor Co., Ltd. | Target recognition and localization methods using a laser sensor for wheeled mobile robots |
US20130329262A1 (en) * | 2012-06-08 | 2013-12-12 | Casio Computer Co., Ltd. | Image reading apparatus and computer-readable storage medium |
CN103759638A (zh) * | 2014-01-10 | 2014-04-30 | 北京力信联合科技有限公司 | 一种零件检测方法 |
CN104574403A (zh) * | 2015-01-12 | 2015-04-29 | 飞天诚信科技股份有限公司 | 一种智能裁剪方法 |
CN107734254A (zh) * | 2017-10-14 | 2018-02-23 | 上海瞬动科技有限公司合肥分公司 | 一种无人机自动择机拍照方法 |
CN108229406A (zh) * | 2018-01-11 | 2018-06-29 | 海信集团有限公司 | 一种车道线检测方法、装置及终端 |
Non-Patent Citations (4)
Title |
---|
刘凯伦 等: "基于图像感知哈希的运动目标跟踪", 《电脑知识与技术》 * |
刘凯伦 等: "基于图像感知哈希的运动目标跟踪", 《电脑知识与技术》, vol. 12, no. 14, 27 June 2016 (2016-06-27), pages 1 - 2 * |
童礼华 等: "建筑轮廓的车载和航空LiDAR数据配准", 《测绘学报》 * |
童礼华 等: "建筑轮廓的车载和航空LiDAR数据配准", 《测绘学报》, vol. 42, no. 5, 15 October 2013 (2013-10-15), pages 702 - 703 * |
Cited By (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN110443224A (zh) * | 2019-08-14 | 2019-11-12 | 广东小天才科技有限公司 | 翻页检测方法、装置、电子设备及存储介质 |
CN110516634A (zh) * | 2019-08-30 | 2019-11-29 | 安徽淘云科技有限公司 | 一种翻页检测方法、装置、设备及存储介质 |
CN111639713A (zh) * | 2020-06-01 | 2020-09-08 | 广东小天才科技有限公司 | 一种翻页检测的方法、装置、电子设备和存储介质 |
CN111639713B (zh) * | 2020-06-01 | 2023-09-08 | 广东小天才科技有限公司 | 一种翻页检测的方法、装置、电子设备和存储介质 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN108665508B (zh) | 一种即时定位与地图构建方法、装置及存储介质 | |
CN104850858B (zh) | 一种注塑制品缺陷检测识别方法 | |
CN107953329B (zh) | 物体识别和姿态估计方法、装置及机械臂抓取*** | |
CN109145751A (zh) | 翻页检测方法及装置 | |
CN110473254A (zh) | 一种基于深度神经网络的位姿估计方法及装置 | |
WO2022033076A1 (zh) | 目标检测方法、装置、设备、存储介质及程序产品 | |
CN111126412B (zh) | 基于特征金字塔网络的图像关键点检测方法 | |
CN107329962B (zh) | 图像检索数据库生成方法、增强现实的方法及装置 | |
CN105453132B (zh) | 实施图像处理的信息处理设备和图像处理方法 | |
CN107423306B (zh) | 一种图像检索方法及装置 | |
CN112132279B (zh) | 卷积神经网络模型压缩方法、装置、设备及存储介质 | |
CN110879982A (zh) | 一种人群计数***及方法 | |
CN113132717A (zh) | 数据处理方法、终端和服务器 | |
CN103578093A (zh) | 图像配准方法、装置及增强现实*** | |
CN112307984B (zh) | 基于神经网络的安全帽检测方法和装置 | |
CN109034002A (zh) | 实体书检测方法及装置 | |
CN108052918A (zh) | 一种笔迹比对***及方法 | |
JP7336653B2 (ja) | ディープラーニングを利用した屋内位置測位方法 | |
CN109117748A (zh) | 翻页检测方法及装置 | |
CN108876776B (zh) | 一种分类模型生成方法、眼底图像分类方法及装置 | |
CN113918744A (zh) | 相似图像检索方法、装置、存储介质及计算机程序产品 | |
CN113610967A (zh) | 三维点检测的方法、装置、电子设备及存储介质 | |
US11127158B2 (en) | Image indexing and retrieval using local image patches for object three-dimensional pose estimation | |
CN108563769A (zh) | 移动终端的图片显示方法、装置、设备及存储介质 | |
CN112288817B (zh) | 基于图像的三维重建处理方法及装置 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
CB02 | Change of applicant information |
Address after: 230031 China (Anhui) pilot Free Trade Zone, Hefei, Anhui province 6 / F and 23 / F, scientific research building, building 2, zone a, China sound Valley, No. 3333 Xiyou Road, high tech Zone, Hefei Applicant after: Anhui taoyun Technology Co.,Ltd. Address before: 230031 9th floor, building 1, tianyuandike science and Technology Park, 66 Qianshui East Road, high tech Zone, Hefei City, Anhui Province Applicant before: ANHUI TAOYUN TECHNOLOGY Co.,Ltd. |
|
CB02 | Change of applicant information |