CN110555435B - 一种点读互动实现方法 - Google Patents

一种点读互动实现方法 Download PDF

Info

Publication number
CN110555435B
CN110555435B CN201910853992.5A CN201910853992A CN110555435B CN 110555435 B CN110555435 B CN 110555435B CN 201910853992 A CN201910853992 A CN 201910853992A CN 110555435 B CN110555435 B CN 110555435B
Authority
CN
China
Prior art keywords
image
page
feature
feature points
point
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201910853992.5A
Other languages
English (en)
Other versions
CN110555435A (zh
Inventor
江周平
杨锐
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Beijing Anxin Zhitong Technology Co ltd
Original Assignee
Shenzhen Yikuai Interactive Network Technology Co ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Shenzhen Yikuai Interactive Network Technology Co ltd filed Critical Shenzhen Yikuai Interactive Network Technology Co ltd
Priority to CN201910853992.5A priority Critical patent/CN110555435B/zh
Publication of CN110555435A publication Critical patent/CN110555435A/zh
Application granted granted Critical
Publication of CN110555435B publication Critical patent/CN110555435B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/20Image preprocessing
    • G06V10/26Segmentation of patterns in the image field; Cutting or merging of image elements to establish the pattern region, e.g. clustering-based techniques; Detection of occlusion
    • G06V10/267Segmentation of patterns in the image field; Cutting or merging of image elements to establish the pattern region, e.g. clustering-based techniques; Detection of occlusion by performing operations on regions, e.g. growing, shrinking or watersheds
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/40Extraction of image or video features
    • G06V10/46Descriptors for shape, contour or point-related descriptors, e.g. scale invariant feature transform [SIFT] or bags of words [BoW]; Salient regional features
    • G06V10/462Salient features, e.g. scale invariant feature transforms [SIFT]
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V20/00Scenes; Scene-specific elements
    • G06V20/60Type of objects
    • G06V20/62Text, e.g. of license plates, overlay texts or captions on TV images
    • GPHYSICS
    • G09EDUCATION; CRYPTOGRAPHY; DISPLAY; ADVERTISING; SEALS
    • G09BEDUCATIONAL OR DEMONSTRATION APPLIANCES; APPLIANCES FOR TEACHING, OR COMMUNICATING WITH, THE BLIND, DEAF OR MUTE; MODELS; PLANETARIA; GLOBES; MAPS; DIAGRAMS
    • G09B5/00Electrically-operated educational appliances
    • G09B5/04Electrically-operated educational appliances with audible presentation of the material to be studied

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Theoretical Computer Science (AREA)
  • Multimedia (AREA)
  • Business, Economics & Management (AREA)
  • Educational Administration (AREA)
  • Educational Technology (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Image Analysis (AREA)

Abstract

本发明公开了一种点读互动实现方法,包括以下步骤:获得封面页特征库和内容页特征库;利用点读笔点的图像采集组件采集封面页的局部图像,处理器对局部图像进行特征点提取,将提取到特征点与封面页特征库进行匹配,获得印刷品信息;利用点读笔的图像采集组件采集到页码图像,处理器对页码图像中的数字进行OCR(Optical Character Recognition,光学字符识别)识别,获得页码信息;利用点读笔点触印刷品内容页上感兴趣的区域,图像采集组件采集到感兴趣区域的区域图像,处理器对区域图像进行特征点提取,将提取到特征点与内容页特征库进行匹配,根据匹配结果获得点读位置信息。本发明无需在书本上预制编码,摆脱了因编码局限性对点读内容的限制。

Description

一种点读互动实现方法
技术领域
本发明涉及多媒体教育技术领域,特别涉及一种点读互动实现方法。
背景技术
点读是利用光学图像识别技术和数字语音技术实现的智能阅读和学习方式,它体现了电子多媒体技术与教育行业的完美融合,实现了科技以人为本的理念。
就现有的点读设备而言,通常需要对书本做预先处理,在书本上印制或黏贴特定的编码,否则将无法识别书本内容。另外,由于编码规则的限制,使得总编码数量有限,对于内容较多的书本来说,读识编码的方式就表现出了明显的局限性。
发明内容
本发明的目的在于提供一种点读互动实现方法,其无需在书本上预制编码,摆脱了因编码局限性对点读内容的限制。
为实现上述目的,本发明采用以下技术方案:
一种点读互动实现方法,其基于点读笔实现,所述点读笔包括笔主体、压力感应组件及图像采集组件,所述笔主体内设有处理器和存储器,所述压力感应组件设于所述笔主体的笔尖位置,所述图像采集组件设于所述笔主体上且位于笔尖的上方,所述压力感应组件、图像采集组件及存储器分别连接所述处理器,该方法包括以下步骤:
S1、预先针对印刷品的封面页和内容页分别进行特征点提取,从而获得封面页特征库和内容页特征库,并存储到所述存储器;
S2、利用点读笔点触印刷品封面页,图像采集组件采集封面页的局部图像,处理器对局部图像进行特征点提取,将提取到特征点与封面页特征库进行匹配,获得印刷品信息;
S3、利用点读笔点触印刷品内容页的页码位置,图像采集组件采集到页码图像,处理器对页码图像中的数字进行OCR识别,获得页码信息;
S4、利用点读笔点触印刷品内容页上感兴趣的区域,图像采集组件采集到感兴趣区域的区域图像,处理器对区域图像进行特征点提取,将提取到特征点与内容页特征库进行匹配,根据匹配结果获得点读位置信息。
优选地,其还包括步骤S5、基于印刷品信息、页码信息及点读位置信息获取对应的音频文件,并进行播放。
进一步地,所述步骤S1、S2及S4中的特征点提取通过以下方法实现:
图像灰度化处理;
利用关键点检测算法提取特征点;
基于直方图统计进行特征点方向识别;
对特征点进行描述,获得特征描述子。
优选地,所述的利用关键点检测算法提取特征点具体为:
将原始图像不断降阶采样,得到一系列大小不一的图像,并进一步对这些图像进行不同尺度的高斯滤波,同一图像的相近尺度高斯滤波后两个图像相减,得到高斯差分图像,进行极值检测,满足曲率条件的极值点即为特征点。
优选地,所述步骤S1具体包括以下分步骤:
S11、针对印刷品的封面页,对封面页图像进行特征点提取,然后对特征描述子进行降维处理,降维处理后进行哈希变换、排序,并存储到封面页特征库;
S12、针对印刷品的内容页,先将内容页图像其分割成一组图像块,分割方法包括但不限于均匀分割、选定区域分割,然后对图像块进行特征点提取,最后对特征描述子进行降维处理,降维处理后进行哈希变换、排序,并存储到内容页特征库。
优选地,所述步骤S2中的将提取到特征点与封面页特征库进行匹配具体通过以下方法实现:
将所述局部图像上提取到的特征点对应的特征描述子进行降维处理、哈希变换、排序,然后将其哈希值与封面页特征库中所存储特征点的哈希值进行比对,若距离小于预先设定的第一阈值,则认定该对特征点匹配;
统计匹配的特征点数量,若大于预先设定的第二阈值,则认定该局部图像与相应的封面页图像匹配。
优选地,所述步骤S4中的将提取到特征点与内容页特征库进行匹配具体通过以下方法实现:
将所述区域图像上提取到的特征点对应的特征描述子进行降维处理、哈希变换、排序,然后将其哈希值与内容页特征库中所存储特征点的哈希值进行比对,若距离小于预先设定的第一阈值,则认定该对特征点匹配;
统计匹配的特征点数量,若大于预先设定的第二阈值,则认定该区域图像与相应的图像块匹配。
优选地,所述哈希变换采用局部敏感哈希函数,将多维度特征映射为单一数值,并且满足多维度空间距离远的点对在映射后数值差距大,距离近的点对在映射后数值差距小。
优选地,所述降维处理采用主成分分析降维方法,筛选出高维度特征中具备高区分度的若干维特征。
采用上述技术方案后,本发明与背景技术相比,具有如下优点:
1、本发明基于图像特征点提取与匹配的方式来实现对点读内容区域的识别,无需在书本上预制编码,摆脱了因编码局限性对点读内容的限制。
2、本发明对封面页、页码、感兴趣的点读区域分别进行识别,实现了“书籍-页码-内容位置”的查询方式,识别匹配过程数据处理量小,处理效率高。
3、本发明在特征点提取操作之后,进行了降维、哈希变换、排序处理,降低了数据量,便于提升后续识别匹配步骤的效率。
附图说明
图1为本发明的工作流程示意图;
图2为本发明封面页识别的流程示意图;
图3为本发明内容页的流程示意图;
图4为本发明图像采集组件安装高度计算方法示意图。
具体实施方式
为了使本发明的目的、技术方案及优点更加清楚明白,以下结合附图及实施例,对本发明进行进一步详细说明。应当理解,此处所描述的具体实施例仅仅用以解释本发明,并不用于限定本发明。
实施例
本发明公开了的点读互动实现方法是其基于点读笔实现。为便于更好的理解本发明,在对点读互动实现方法进行详细描述之前,先对点读笔的结构进行阐述。
本发明涉及的点读笔包括笔主体、压力感应组件及图像采集组件,笔主体内设有处理器和存储器,压力感应组件设于笔主体的笔尖位置,图像采集组件设于笔主体上且位于笔尖的上方,压力感应组件、图像采集组件及存储器分别连接处理器。点读笔使用时,用户将点读笔点到印刷品上,压力感应组件检测到压力信号并传送给处理器,处理器控制图像采集组件进行拍照。在本实施例中,压力感应组件采用压电传感器,图像采集组件采用摄像头。图像采集组件的高度决定直接影响到拍摄结果以及识别结果,对此说明如下(配合图4所示):
摄像头在点读笔的高度h确定办法如下:当选用视角为
Figure BDA0002197763360000041
的常见镜头时,要拍摄半径约为r区域才能保证图像块匹配成功,r的大小取决于内容分割,必须满足
Figure BDA0002197763360000042
以A4纸为例,w对应A4的宽度等于21cm,l对应A4的长度等于29cm,假定单个A4页面需要划分为20个子图区域,每个区域大小约为5cm*5cm,为了冗余(有部分必然被遮挡),必须保证摄像头在垂直向下拍时捕捉区域的半径约为5cm,然后根据此来确定摄像头的高度h。
当选用视角为60度的常见镜头时,要拍摄半径约为5cm区域,进一步考虑握笔高度和倾斜度,摄像头可以设置更高些,可取h=9cm。
配合图1-3所示,本发明的点读互动实现方法包括以下步骤:
S1、预先针对印刷品的封面页和内容页分别进行特征点提取,从而获得封面页特征库和内容页特征库,并存储到存储器。该步骤具体包括以下分步骤:
S11、针对印刷品的封面页,对封面页图像进行特征点提取,然后对特征描述子进行降维处理,降维处理后进行哈希变换、排序,并存储到封面页特征库。
S12、针对印刷品的内容页,先将内容页图像其分割成一组图像块,然后对图像块进行特征点提取,最后对特征描述子进行降维处理,降维处理后进行哈希变换、排序,并存储到内容页特征库。
S2、利用点读笔点触印刷品封面页,图像采集组件采集封面页的局部图像,处理器对局部图像进行特征点提取,将提取到特征点与封面页特征库进行匹配,获得印刷品信息(即确定了哪一本书籍)。上述的将提取到特征点与封面页特征库进行匹配具体通过以下方法实现:
将局部图像上提取到的特征点对应的特征描述子进行降维处理、哈希变换、排序,然后将其哈希值与封面页特征库中所存储特征点的哈希值进行比对,若距离小于预先设定的第一阈值,则认定该对特征点匹配;
统计匹配的特征点数量,若大于预先设定的第二阈值,则认定该局部图像与相应的封面页图像匹配。
S3、利用点读笔点触印刷品内容页的页码位置,图像采集组件采集到页码图像,处理器对页码图像中的数字进行OCR识别,获得页码信息。
S4、利用点读笔点触印刷品内容页上感兴趣的区域,图像采集组件采集到感兴趣区域的区域图像,处理器对区域图像进行特征点提取,将提取到特征点与内容页特征库进行匹配,根据匹配结果获得点读位置信息。上述的将提取到特征点与内容页特征库进行匹配具体通过以下方法实现:
将区域图像上提取到的特征点对应的特征描述子进行降维处理、哈希变换、排序,然后将其哈希值与内容页特征库中所存储特征点的哈希值进行比对,若距离小于预先设定的第一阈值,则认定该对特征点匹配;
统计匹配的特征点数量,若大于预先设定的第二阈值,则认定该区域图像与相应的图像块匹配。
在本实施例中,步骤S1、S2及S4中涉及的特征点提取动作通过以下方法实现:
a.图像灰度化处理。由此采集到图像为彩色图像(以RGB三通道彩色图像为例),需要先进行灰度化处理,以便于后续步骤的执行。在本实施例中,灰度化的计算公式采用:
Gray=(R*30+G*59+B*11+50)/100
其中,Gray为灰度值。
b.利用关键点检测算法提取特征点。将原始图像不断降阶采样,得到一系列大小不一的图像,并进一步对这些图像进行不同尺度的高斯滤波,同一图像的相近尺度高斯滤波后两个图像相减,得到高斯差分图像,进行极值检测,满足曲率条件的极值点即为特征点。高斯差分图像D(x,y,σ)操作如下,G(x,y,σ)为高斯滤波函数,I(x,y)对应原始图像,L(x,y,σ)表示经过尺度σ的高斯滤波后图像:
D(x,y,σ)=(G(x,y,σ(s+1))-G(x,y,σ(s)))*I(x,y)
=L(x,y,σ(s+1))-L(x,y,σ(s))
c.基于直方图统计进行特征点方向识别。在完成特征点的梯度计算后,使用直方图统计邻域内像素的梯度和方向。梯度直方图将0~360度的方向范围分为18个柱(bins),其中每柱20度。直方图的峰值方向代表了特征点的主方向。L为关键点所在的尺度空间值,每个像素点的梯度m和方向θ计算公式如下:
Figure BDA0002197763360000071
θ(x,y)=tan-1((L(x,y+1)-L(x,y-1))/L(x+1,y)-L(x-1,y)))
对特征点进行描述,获得特征描述子。对特征点确定一个大小为21×21的邻域,旋转这个邻域到主方向;计算邻域内像素点的水平梯度与垂直梯度,这样每个特征点确定了一个大小为19×19×2=722维的特征描述子;特征点的描述包括坐标、尺度、方向。在此要说明的是,由于获得特征描述子是高维的(本实施例中是722维),为便于后续处理所以要做降维和哈希变换,本实施例中,采用主成分分析降维方法进行降维处理,即图2中的PCA,降维处理后为20维,通过局部敏感哈希变换后,即图2中的LSH,将20维的特征描述子映射为1个32位浮点值。PCA的具体操作如下:
先使用大量采集图像的特征数据构造特征矩阵X,求得矩阵X的特征值,特征值按大小排序,并求得特征值对应的特征向量构成变换矩阵W.已有变换矩阵W情况下,对于任意一幅采集图像的特征数据Y,使得Z=YWT,原特征矩阵Y通过投影到矩阵Z,高维度的特征矩阵Y缩减为低维度新特征矩阵Z,且新特征是线性无关的。
LSH的具体操作如下:
(1)选取满足(d1,d2,p1,p2)敏感的局部敏感哈希函数;
(2)根据对查找结果的准确率确定哈希表的个数L,每个表内的哈希函数的个数K,以及跟敏感哈希自身有关的参数;
(3)将所有数据经过局部敏感哈希函数哈希到相应的桶内,构成了一个或多个哈希表;
匹配计算距离过程如下:
计算查询特征点的哈希值与数据库中2L个数据之间的距离,距离定义为但不限于两数差的绝对值,小于设定的第二阈值则判定为该特征点对匹配。
S5、基于印刷品信息、页码信息及点读位置信息获取对应的音频文件,并进行播放。
以上所述,仅为本发明较佳的具体实施方式,但本发明的保护范围并不局限于此,任何熟悉本技术领域的技术人员在本发明揭露的技术范围内,可轻易想到的变化或替换,都应涵盖在本发明的保护范围之内。因此,本发明的保护范围应该以权利要求的保护范围为准。

Claims (6)

1.一种点读互动实现方法,其特征在于,其基于点读笔实现,所述点读笔包括笔主体、压力感应组件及图像采集组件,所述笔主体内设有处理器和存储器,所述压力感应组件设于所述笔主体的笔尖位置,所述图像采集组件设于所述笔主体上且位于笔尖的上方,所述图像采集组件采用摄像头,所述摄像头在所述点读笔的高度h满足条件:h > r * tan(90º- Ø/2),其中,r为拍摄半径,r的大小取决于内容分割的子区域的边长,Ø为摄像头镜头视角的角度,所述压力感应组件、图像采集组件及存储器分别连接所述处理器,该方法包括以下步骤:
S1、预先针对印刷品的封面页和内容页分别进行特征点提取,从而获得封面页特征库和内容页特征库,并存储到所述存储器;
所述步骤S1具体包括以下分步骤:
S11、针对印刷品的封面页,对封面页图像进行特征点提取,然后对特征描述子进行降维处理,降维处理后进行哈希变换、排序,并存储到封面页特征库;
S12、针对印刷品的内容页,先将内容页图像其分割成一组图像块,分割方法包括但不限于均匀分割、选定区域分割,然后对图像块进行特征点提取,最后对特征描述子进行降维处理,降维处理后进行哈希变换、排序,并存储到内容页特征库;
S2、利用点读笔点触印刷品封面页,图像采集组件采集封面页的局部图像,处理器对局部图像进行特征点提取,将提取到特征点与封面页特征库进行匹配,获得印刷品信息;
S3、利用点读笔点触印刷品内容页的页码位置,图像采集组件采集到页码图像,处理器对页码图像中的数字进行OCR识别,获得页码信息;
S4、利用点读笔点触印刷品内容页上感兴趣的区域,图像采集组件采集到感兴趣区域的区域图像,处理器对区域图像进行特征点提取,将提取到特征点与内容页特征库进行匹配,根据匹配结果获得点读位置信息;
所述步骤S4中的将提取到特征点与内容页特征库进行匹配具体通过以下方法实现:
将所述区域图像上提取到的特征点对应的特征描述子进行降维处理、哈希变换、排序,然后将其哈希值与内容页特征库中所存储特征点的哈希值进行比对,若距离小于预先设定的第一阈值,则认定该对特征点匹配;
统计匹配的特征点数量,若大于预先设定的第二阈值,则认定该区域图像与相应的图像块匹配。
2.如权利要求1所述的一种点读互动实现方法,其特征在于:其还包括步骤S5、基于印刷品信息、页码信息及点读位置信息获取对应的音频文件,并进行播放。
3.如权利要求1所述的一种点读互动实现方法,其特征在于,所述步骤S1、S2及S4中的特征点提取通过以下方法实现:
图像灰度化处理;
利用关键点检测算法提取特征点;
基于直方图统计进行特征点方向识别;
对特征点进行描述,获得特征描述子。
4.如权利要求3所述的一种点读互动实现方法,其特征在于,所述的利用关键点检测算法提取特征点具体为:
将原始图像不断降阶采样,得到一系列大小不一的图像,并进一步对这些图像进行不同尺度的高斯滤波,同一图像的相近尺度高斯滤波后两个图像相减,得到高斯差分图像,进行极值检测,满足曲率条件的极值点即为特征点。
5.如权利要求3所述的一种点读互动实现方法,其特征在于,所述步骤S2中的将提取到特征点与封面页特征库进行匹配具体通过以下方法实现:
将所述局部图像上提取到的特征点对应的特征描述子进行降维处理、哈希变换、排序,然后将其哈希值与封面页特征库中所存储特征点的哈希值进行比对,若距离小于预先设定的第一阈值,则认定该对特征点匹配;
统计匹配的特征点数量,若大于预先设定的第二阈值,则认定该局部图像与相应的封面页图像匹配。
6.如权利要求5所述的一种点读互动实现方法,其特征在于,所述降维处理采用主成分分析降维方法。
CN201910853992.5A 2019-09-10 2019-09-10 一种点读互动实现方法 Active CN110555435B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201910853992.5A CN110555435B (zh) 2019-09-10 2019-09-10 一种点读互动实现方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201910853992.5A CN110555435B (zh) 2019-09-10 2019-09-10 一种点读互动实现方法

Publications (2)

Publication Number Publication Date
CN110555435A CN110555435A (zh) 2019-12-10
CN110555435B true CN110555435B (zh) 2022-06-07

Family

ID=68739604

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201910853992.5A Active CN110555435B (zh) 2019-09-10 2019-09-10 一种点读互动实现方法

Country Status (1)

Country Link
CN (1) CN110555435B (zh)

Families Citing this family (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111191059B (zh) * 2019-12-31 2023-05-05 腾讯科技(深圳)有限公司 图像处理方法、装置、计算机存储介质及电子设备
CN112199522B (zh) * 2020-08-27 2023-07-25 深圳一块互动网络技术有限公司 互动实现方法、终端、服务端、计算机设备及存储介质
CN113223007A (zh) * 2021-06-28 2021-08-06 浙江华睿科技股份有限公司 视觉里程计的实现方法、装置及电子设备

Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN105447499A (zh) * 2015-10-23 2016-03-30 北京爱乐宝机器人科技有限公司 一种图书互动方法、装置和设备
CN106126668A (zh) * 2016-06-28 2016-11-16 北京小白世纪网络科技有限公司 一种基于哈希重建的图像特征点匹配方法
CN107705641A (zh) * 2017-09-26 2018-02-16 青岛罗博数码科技有限公司 一种点读普通印刷读物的装置及方法
CN108710877A (zh) * 2018-04-28 2018-10-26 北京奇禄管理咨询有限公司 一种图像采集方法
CN110059218A (zh) * 2019-04-26 2019-07-26 兰州理工大学 一种基于快速傅里叶逆变换的语音检索方法及***
CN110058705A (zh) * 2019-04-28 2019-07-26 视辰信息科技(上海)有限公司 绘本辅助阅读方法、计算设备、点读侧设备与电子设备

Patent Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN105447499A (zh) * 2015-10-23 2016-03-30 北京爱乐宝机器人科技有限公司 一种图书互动方法、装置和设备
CN106126668A (zh) * 2016-06-28 2016-11-16 北京小白世纪网络科技有限公司 一种基于哈希重建的图像特征点匹配方法
CN107705641A (zh) * 2017-09-26 2018-02-16 青岛罗博数码科技有限公司 一种点读普通印刷读物的装置及方法
CN108710877A (zh) * 2018-04-28 2018-10-26 北京奇禄管理咨询有限公司 一种图像采集方法
CN110059218A (zh) * 2019-04-26 2019-07-26 兰州理工大学 一种基于快速傅里叶逆变换的语音检索方法及***
CN110058705A (zh) * 2019-04-28 2019-07-26 视辰信息科技(上海)有限公司 绘本辅助阅读方法、计算设备、点读侧设备与电子设备

Also Published As

Publication number Publication date
CN110555435A (zh) 2019-12-10

Similar Documents

Publication Publication Date Title
KR101959831B1 (ko) 이미지 인식 처리 장치 및 방법
CN110555435B (zh) 一种点读互动实现方法
Yao et al. A new pedestrian detection method based on combined HOG and LSS features
US20190180094A1 (en) Document image marking generation for a training set
Garz et al. Layout analysis for historical manuscripts using sift features
CN110569818A (zh) 一种智能阅读学习方法
Hua et al. Content-based image retrieval using color volume histograms
WO2011044058A2 (en) Detecting near duplicate images
US9542756B2 (en) Note recognition and management using multi-color channel non-marker detection
CN109947273B (zh) 一种点读定位方法及装置
Su et al. Robust video fingerprinting based on visual attention regions
CN114092938B (zh) 图像的识别处理方法、装置、电子设备及存储介质
Saïdani et al. Pyramid histogram of oriented gradient for machine-printed/handwritten and Arabic/Latin word discrimination
CN110991371A (zh) 一种基于坐标识别的智能阅读学习方法
Liu et al. Text segmentation based on stroke filter
CN101727579B (zh) 变形字的检测方法、变形字中水印信息的确定方法及装置
WO2019071476A1 (zh) 一种基于智能终端的快递信息录入方法及录入***
CN101118544A (zh) 一种图像形状轮廓描述符的构造方法
CN110796119A (zh) 一种互动阅读实现方法
CN110765997B (zh) 一种互动阅读实现方法
Yao et al. Locating text based on connected component and SVM
CN110737364B (zh) 一种安卓***下触摸书写加速的控制方法
Elsayed et al. Hybrid method based on multi-feature descriptor for static sign language recognition
CN110647844A (zh) 一种儿童用物品拍摄识别方法
Mondal Hog Feature-A Survey

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant
TR01 Transfer of patent right

Effective date of registration: 20230705

Address after: 1320-2, Floor 13, Building 1, Yard 59, Gao Liangqiao Xiejie Street, Haidian District, Beijing 100082

Patentee after: Beijing Anxin Zhitong Technology Co.,Ltd.

Address before: Room 403, C4, building 2, software industry base, No. 87, 89, 91, South 10th Road, Gaoxin, Binhai community, Yuehai street, Nanshan District, Shenzhen, Guangdong 518000

Patentee before: Shenzhen yikuai Interactive Network Technology Co.,Ltd.

TR01 Transfer of patent right