CN115331213A - 字符识别方法、芯片、电子设备及存储介质 - Google Patents
字符识别方法、芯片、电子设备及存储介质 Download PDFInfo
- Publication number
- CN115331213A CN115331213A CN202211265372.8A CN202211265372A CN115331213A CN 115331213 A CN115331213 A CN 115331213A CN 202211265372 A CN202211265372 A CN 202211265372A CN 115331213 A CN115331213 A CN 115331213A
- Authority
- CN
- China
- Prior art keywords
- character
- point
- recognized
- sampling
- vector
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000000034 method Methods 0.000 title claims abstract description 56
- 239000013598 vector Substances 0.000 claims abstract description 219
- 238000005070 sampling Methods 0.000 claims abstract description 174
- 230000008859 change Effects 0.000 claims description 27
- 238000004590 computer program Methods 0.000 claims description 5
- 238000012545 processing Methods 0.000 claims description 4
- 238000004364 calculation method Methods 0.000 abstract description 3
- 238000010586 diagram Methods 0.000 description 3
- 230000008569 process Effects 0.000 description 3
- 238000013461 design Methods 0.000 description 2
- 238000012986 modification Methods 0.000 description 2
- 230000004048 modification Effects 0.000 description 2
- 230000009286 beneficial effect Effects 0.000 description 1
- 230000006870 function Effects 0.000 description 1
- 238000010295 mobile communication Methods 0.000 description 1
- 230000003287 optical effect Effects 0.000 description 1
- 239000007787 solid Substances 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V20/00—Scenes; Scene-specific elements
- G06V20/60—Type of objects
- G06V20/62—Text, e.g. of license plates, overlay texts or captions on TV images
- G06V20/635—Overlay text, e.g. embedded captions in a TV program
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V30/00—Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
- G06V30/10—Character recognition
- G06V30/19—Recognition using electronic means
- G06V30/19007—Matching; Proximity measures
Landscapes
- Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- Multimedia (AREA)
- Theoretical Computer Science (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Character Input (AREA)
Abstract
本申请实施例涉及图像识别技术领域,公开了一种字符识别方法、芯片、电子设备及存储介质。字符识别方法包括:对待识别字符的第一轨迹按书写顺序以预设的采样距离进行采样,获取多个采样点;首个采样点为第一轨迹的起点,最后一个采样点为第一轨迹的终点;在多个采样点中选取第一轨迹的走向发生变化处的采样点作为特征点,按书写顺序依次连接第一轨迹的起点、特征点和第一轨迹的终点,得到各线段对应的特征向量;将待识别字符对应的特征向量与字符库中标准字符的特征向量进行对比,确定待识别字符与各标准字符的匹配度;根据匹配度确定待识别字符的识别结果。本申请可有效识别,速度快、内存占用少,适用于内存和算力都较弱的嵌入式触控***。
Description
技术领域
本申请实施例涉及图像识别技术领域,特别涉及一种字符识别方法、芯片、电子设备及存储介质。
背景技术
在常见消费电子类设备、如智能手机、智能平板、智能手表等设备,为了便于快速打开常用APP,通常会通过用户在屏幕表面画定义好的字符,来快速打开对应的应用,这种操作简单高效,很受消费者喜爱,为此对于用户所画的轨迹字符进行高效识别,成为了必要的技术需求。
目前字符识别方法常用图像对比法,即获取用户所输入的字符的多个采样点,构成采样点集,将字符的采样点集与字符库中每个字符的点集一一对比,计算点距(如欧式距离),将所有点距之和最小的字符作为用户输入字符的识别结果。为保证识别准确率,每个字符最少需要采集32个点,而每个点至少占用4个字节存放该点的x、y坐标,则每个字符的点集最少占128字节,如此当字符库中的字符数量庞大时,就需要消耗较多的内存空间。另外若用户输入的字符比例较大,为了能有效地识别字符就需要增加更多采样点,比对的点数量变多,导致运算量大,对于内存和算力有限的触控芯片来说字符识别较为困难。
发明内容
本申请实施方式的目的在于提供一种字符识别方法、芯片、电子设备及存储介质,以最少的特征向量表示出字符的轨迹特点,每个字符最少需要2个特征向量即可完成有效识别,速度快、内存占用少,适用于内存和算力都较弱的嵌入式触控***。
为解决上述技术问题,本申请的实施方式提供了一种字符识别方法,包括:对待识别字符的第一轨迹按书写顺序以预设的采样距离进行采样,获取多个采样点;其中首个采样点为所述第一轨迹的起点,最后一个采样点为所述第一轨迹的终点;在所述多个采样点中选取所述第一轨迹的走向发生变化处的采样点作为特征点,并按所述书写顺序依次连接所述第一轨迹的起点、所述特征点和所述第一轨迹的终点,得到多个线段及描述各线段走向的多个特征向量;将所述待识别字符对应的特征向量与字符库中标准字符的特征向量进行对比,确定所述待识别字符与各所述标准字符的匹配度;根据所述匹配度确定所述待识别字符的识别结果。
本申请的实施方式还提供了一种芯片,包括:
字符处理单元,用于对待识别字符的第一轨迹按书写顺序以预设的采样距离进行采样,获取多个采样点;其中首个采样点为所述第一轨迹的起点,最后一个采样点为所述第一轨迹的终点;在所述多个采样点中选取所述第一轨迹的走向发生变化处的采样点作为特征点,并按所述书写顺序依次连接所述第一轨迹的起点、所述特征点和所述第一轨迹的终点,得到多个线段及描述各线段走向的多个特征向量;
字符识别单元,用于将所述待识别字符对应的特征向量与字符库中标准字符的特征向量进行对比,确定所述待识别字符与各所述标准字符的匹配度;根据所述匹配度确定所述待识别字符的识别结果。
本申请的实施方式还提供了一种电子设备,包括:至少一个处理器;以及,与至少一个处理器通信连接的存储器;其中,存储器存储有可被至少一个处理器执行的指令,指令被至少一个处理器执行,以使至少一个处理器能够执行如上述实施方式提及的字符识别方法。
本申请的实施方式还提供了一种计算机可读存储介质,存储有计算机程序,计算机程序被处理器执行时实现上述实施方式提及的字符识别方法。
本申请实施方式提供的字符识别方法,通过从待识别字符的多个采样点中选取用于表示字符轨迹趋势发生变化的特征点,将字符轨迹的起点、特征点和字符轨迹的终点依次连接获取多个线段以及各线段对应的特征向量,将字符的特征向量与字符库中标准字符的特征向量对比,即可确定输入的字符与字符库中标准字符的匹配度,根据匹配度得到字符的识别结果,如此本申请可以以最少的特征点和最少的特征向量表示出字符的轨迹特点,每个字符最少需要2个特征向量即可完成有效识别,速度快、内存占用少,适用于内存和算力都较弱的嵌入式触控***,使得字符识别功能可以轻松地在触控芯片中直接完成,而不会给触控芯片的内存及运算带来大的挑战,调试过程直观、简单,识别方法简洁高效,从而带来嵌入式***对于字符手势识别的快速、低功耗优势。
另外,本申请实施方式提供的字符识别方法,在所述多个采样点中选取所述第一轨迹的走向发生变化处的采样点作为特征点,包括:以所述第一轨迹的起点作为首个参考点,执行第一操作:按书写顺序依次判断所述参考点之后的所述采样点中是否存在第一采样点;所述参考点到所述第一采样点的线段和所述第一采样点到下一个采样点的线段所对应的特征向量之间符合预设的走向变化条件;当存在所述第一采样点时,将所述参考点之后的首个第一采样点作为一个所述特征点,并以所述参考点之后的首个第一采样点作为下一个参考点,继续执行所述第一操作,直到遍历完所有的采样点。本申请从字符的第一轨迹的起点开始,判断之后的采样点中是否存在第一采样点,若存在,则首个第一采样点为特征点,并从该特征点开始继续确定是否存在第一采样点。若不存在,则说明第一轨迹中没有特征点,即第一轨迹的趋势没有发生变化。如此通过特征点的数量和位置可以快速确定字符轨迹的走向是否发生变化,变化的次数以及变换的方向。
另外,本申请实施方式提供的字符识别方法,按书写顺序依次判断所述参考点之后的所述采样点中是否存在第一采样点,包括:选取所述参考点之后的首个采样点作为当前采样点,执行第二操作:构建所述参考点到所述当前采样点的线段所对应的第一向量,和所述当前采样点到所述当前采样点的下一个采样点的线段所对应的第二向量;当所述第一向量和所述第二向量符合预设的走向变化条件时,确定所述当前采样点为一个所述第一采样点;当所述第一向量和所述第二向量不符合预设的走向变化条件时,将所述下一个采样点作为所述当前采样点继续执行所述第二操作,直到遍历完所有的采样点。本申请通过不断构建第一向量和第二向量,并判断第一向量和第二向量是否符合预设的走向变化条件,即快速确定采样点是否为第一采样点。
另外,本申请实施方式提供的字符识别方法,走向变化条件为所述第一向量和所述第二向量属于基准坐标系中的不同象限,所述基准坐标系为以所述第一向量和所述第二向量的起始点作为原点,水平方向作为x轴,竖直方向作为y轴所建立的坐标系;或者,所述走向变化条件为所述第一向量和所述第二向量属于基准坐标系中的不同象限,且所述第一向量和所述第二向量构成的夹角大于预设的角度阈值。本申请当第一向量和第二向量属于不同象限时,即第一向量和第二向量属于不同方向时,确定两者的起始点处字符轨迹发生变化,为特征点。
附图说明
一个或多个实施例通过与之对应的附图中的图片进行示例性说明,这些示例性说明并不构成对实施例的限定,附图中具有相同参考数字标号的元件表示为类似的元件,除非有特别申明,附图中的图不构成比例限制。
图1是本申请的实施方式提供的字符识别方法的流程图一;
图2是本申请的实施方式提供的一种角度坐标系;
图3是本申请的实施方式的提供的字符“c”的特征向量的示意图;
图4是本申请的实施方式的提供的字符识别方法的流程图二;
图5是本申请的实施方式的提供的芯片的结构示意图;
图6是本申请的实施方式的提供的电子设备的结构示意图。
具体实施方式
为使本申请实施例的目的、技术方案和优点更加清楚,下面将结合附图对本申请的各实施方式进行详细的阐述。然而,本领域的普通技术人员可以理解,在本申请各实施方式中,为了使读者更好地理解本申请而提出了许多技术细节。但是,即使没有这些技术细节和基于以下各实施方式的种种变化和修改,也可以实现本申请所要求保护的技术方案。
下面对本实施方式的字符识别方法的实现细节进行举例说明。以下内容仅为方便理解而提供的实现细节,并非实施本方案的必须。
本申请的实施方式涉及一种字符识别方法,如图1所示,包括:
步骤101,对待识别字符的第一轨迹按书写顺序以预设的采样距离进行采样,获取多个采样点;其中首个采样点为第一轨迹的起点,最后一个采样点为第一轨迹的终点。
本实施例中,待识别字符可以为英文字符、汉字字符、韩文字符、拉丁字符等等任何一种需要进行识别的字符。第一轨迹可以是字符的完整书写轨迹,也可以是待识别字符中根据字符结构和字符书写顺序拆分的部分字符的书写轨迹。比如:以字符b、c、q、@、&为待识别字符,由于这些字符为单笔字符,因此第一轨迹为这些字符的完整轨迹。以汉字“像”作为待识别字符,在识别时,可以根据字符结构将字符“像”进行拆分为两个字符“亻”和“象”分别进行识别,在识别“亻”时,第一轨迹就是这个字符的完整轨迹,在识别“象”时,第一轨迹就是这个字符的完整轨迹。当然,此处仅为具体的举例,在对字符进行拆分时,可以根据字符特点、对计算速度的要求、对识别率的要求等自行调整设计字符拆分规则。
在以预设的采样距离对第一轨迹进行采样获取采样点时,不同字符的采样距离可以相同,也可以不同。不同大小的字符采样距离可以相同,也可以不同。不同类型的字符采样距离可以相同,也可以不同。比如:待识别字符为英文字符,对于单笔英文字符,采样距离为d1,对于多笔英文字符,采样距离为d2,即根据英文字符的书写特点设计不同的采样距离。比如:对于字符“c”,当字符“c”的大小为4号时,采样距离为d1,当字符“c”的大小为12号时,采样距离为d2,即书写的字符较大时,采样距离可以适应性增加。又比如:对于韩文字符和汉字字符,可以采用不同的采样距离进行采样。
采样完成后每个字符对应一个采样点集,采样点集中每个采样点按照采样顺序(书写顺序)依次排列,当采样点的数量多到一定程度时,按照采样顺序依次连接可以得到待识别字符的第一轨迹。
步骤102,在多个采样点中选取第一轨迹的走向发生变化处的采样点作为特征点,并按书写顺序依次连接第一轨迹的起点、特征点和第一轨迹的终点,得到多个线段及描述各线段走向的多个特征向量。
本实施例中,在选取用于表示第一轨迹趋势发生变化的特征点后,将第一轨迹的起点、特征点和第一轨迹的终点依次连接即可得到多条线段,每个线段对应一个特征向量。待识别字符的第一个特征向量为第一轨迹的起点到第一个特征点的有向线段,待识别字符的第二个特征向量为第一个特征点到第二个特征点的有向线段,以此类推,最后一个特征向量为最后一个特征点到第一轨迹终点的有向线段。即每个待识别字符都有对应的特征向量集,特征向量集中每个特征向量按照顺序依次排列。
需要说明的是,当待识别字符没有特征点时,待识别字符的特征向量只有一个,即第一轨迹的起点到第一轨迹的终点的有向线段。当待识别字符有特征点时,待识别字符的特征向量至少有两个。
步骤103,将待识别字符对应的特征向量与字符库中标准字符的特征向量进行对比,确定待识别字符与各标准字符的匹配度。
具体地,字符识别设备中预先存储有不同类型的字符库(英文字符库、汉字字符库、韩文字符库等等),每个字符库中有多个标准字符的特征向量,将待识别字符的特征向量与对应类型的字符库中各个标准字符的特征向量进行对比,即可得到待识别字符与各个标准字符的匹配度。在对比时,将待识别字符的第一个特征向量与各个标准字符的第一个特征向量进行对比,将待识别字符的第二个特征向量与各个标准字符的第二个特征向量进行对比,依次类推,直到对比完待识别字符的所有特征向量。
需要说明的是,标准字符的特征向量的确定方法与前述待识别字符的特征向量的确定方法相同,因此,在用户正常书写时,待识别字符的基本符合书写规范,此时待识别字符与对应的标准字符的特征向量数量相同。也就是说,当待识别字符的特征向量的数量与标准字符的特征向量的数量不同时,无需比对,可以直接确定待识别字符与该标准字符不是同一字符。
在一实施例中,步骤103包括:根据预设的角度坐标系确定待识别字符的每个特征向量所属的角度区间对应的编码值;将待识别字符的每个特征向量对应的编码值与各标准字符的每个特征向量的编码值进行对比,得到待识别字符的每个特征向量与各标准字符的每个特征向量的匹配度;根据待识别字符的特征向量与各标准字符的特征向量的匹配度平均值,得到待识别字符与各标准字符的匹配度;其中角度坐标系为以每个特征向量的起点作为原点,水平方向作为x轴、竖直方向作为y轴,并从x轴正方向开始围绕原点逆时针或顺时针按照预设的角度间隔对平面进行分割所得到包含多个角度区间的坐标系。
具体地说,预设的角度坐标系为从x轴正方向开始围绕原点逆时针或顺时针按照预设的角度间隔对坐标系平面进行分割所得到的坐标系,图2为一种实施例中的角度坐标系,该角度坐标系以15°为角度间隔将坐标系平面划分为了24个角度区间,第1个角度区间为0-15°,第2个角度区间为15°-30°,依次类推,第24个角度区间为345°-360°。当然角度坐标系也可以有其他形式和其他角度划分方法,只要能为待识别字符的每个特征向量确定唯一一个角度值即可。
在确定特征向量的编码值时,将预设的角度坐标系的原点放置于特征向量的起点,确定特征向量位于角度坐标系中哪一个角度区间,将该角度区间的编码值作为特征向量的编码值。比如:待识别字符的第一个特征向量落在角度坐标系中的第二个角度区间15°-30°的范围内,第二个角度区间对应的编码值为22.5°,则待识别字符的第一个特征向量的编码值为22.5。
又比如:待识别字符的第3个特征向量属于角度坐标系中第5个角度区间(编码值为5),待识别字符的第4个特征向量属于角度坐标系中第1个角度区间(编码值为1),则待识别字符的第3个特征向量的编码值为5,第4个特征向量的编码值为1。也就是说,特征向量对应的编码值的具体内容本申请不做限定,可以是角度值,也可以是角度区间的标号,还可以是按照其他规则为每个角度区间一一对应的一个值,只要能表示出特征向量所属的角度区间即可。如图3所示,为字符“c”的特征向量的示意图,其中特征向量上标识的数字为图2所示的角度坐标系的角度区间标号。
在将待识别字符的特征向量与各标准字符的特征向量的编码值进行对比时,需要按照顺序进行一一比对。即将第一轨迹的起点、特征点和第一轨迹的终点依次连接后,起点和第一个特征点对应的特征向量为第一个特征向量,第一个特征点和第二个特征点对应的特征向量为第二个特征向量,其余特征向量的顺序以此类推,那么在比对时需要将待识别字符的第一个特征向量的编码值与各标准字符的第一个特征向量的编码值进行对比,得到对应的第一个匹配度;将待识别字符的第二个特征向量的编码值与各标准字符的第二个特征向量的编码值进行对比,得到对应的第二个匹配度,以此类推,得到待识别字符的特征向量对应的多个匹配度。然后计算多个匹配度的平均值即可得到待识别字符与各标准字符的匹配度。具体地,待识别字符的特征向量的特征值与标准字符的特征向量的编码值的差值越小,匹配度越高,差值越大,匹配度越低。
当然,预先存储的字符库中标准字符的特征向量的编码值与前述待识别字符的编码值的确定方法相同,本申请在此不做赘述。
另外,在特征向量比对之前,可以筛选出待识别字符的特征向量的长度小于预设的长度阈值的特征向量,特征向量长度较小的,表示该特征向量对应的字符轨迹曲线较短,为减少计算量、提高比对效率,这些向量可以不参与比对过程。
步骤104,根据匹配度确定待识别字符的识别结果。
具体地,待识别字符与某一标准字符的匹配度越高,说明待识别字符与该标准字符越相似,即两者越有可能为同一字符。
在一些实施例中,步骤103包括:获取待识别字符与字符库中各标准字符的匹配度的最大值;判断匹配度的最大值是否大于预设的识别阈值;若是,则将匹配度的最大值在字符库中对应的标准字符作为待识别字符的识别结果;若否,则识别失败。
具体地,在获取待识别字符与各标准字符的匹配度后,确定匹配度的最大值是否大于预设的识别阈值,若是,则可以得到识别结果,若否,则说明字符库中没有与待识别字符的匹配度达到识别阈值要求的标准字符。
在另一些实施例中,步骤103之后,还包括:若针对同一待识别字符的识别失败次数超过预设的失败次数,则获取每次识别得到的待识别字符的特征向量,及各特征向量对应的编码值;针对各次识别得到的处于同一顺位的编码值,将出现次数最多的编码值作为该待识别字符在相应顺位上的特征向量对应的编码值,并将该待识别字符的编码值添加到字符库中。
本实施例中,若针对同一待识别字符的识别失败次数超过预设的失败次数,则说明该待识别字符为用户常用字符而字符库中没有保存对应的标准字符,则需要获取该字符的标准字符,即标准字符的特征向量和编码值。具体地,假设某一字符X被多次书写并输入字符识别设备10次(X1、X2、X3、…、X10),均识别失败,则获取这10个字符(同一字符)的特征向量,若该字符有3个特征向量,对于第一个特征向量(起点到第一个特征点),若特征向量X1-1、X2-1、X3-1、…、X8-1的角度值均位于第二个角度区间,特征向量X9-1、X10-1的角度值均位于第三角度区间,则该字符在字符库中对应的标准字符的特征向量的编码值为第二个角度区间对应的编码值,其中,Xi-j表示第i次识别时的该字符的第j个特征向量。对于第二个特征向量和第三个特征向量,确定标准字符的编码值的方法与此类似。
由于在字符识别时只需比对特征向量的编码值,因此在获取识别失败次数超过预设的失败次数的待识别字符所对应的标准字符时,可以无需获取特征向量的长度。若要获取,也可以计算处于同一顺序的特征向量的长度平均值,作为标准字符的特征向量的长度。
本申请实施方式提供的字符识别方法,通过从待识别字符的多个采样点中选取用于表示字符轨迹趋势发生变化的特征点,将字符轨迹的起点、特征点和字符轨迹的终点依次连接获取多个线段以及各线段对应的特征向量,将字符的特征向量与字符库中标准字符的特征向量对比,即可确定输入的字符与字符库中标准字符的匹配度,根据匹配度得到字符的识别结果,如此本申请可以以最少的特征点和最少的特征向量表示出字符的轨迹特点,每个字符最少需要2个特征向量即可完成有效识别,速度快、内存占用少,适用于内存和算力都较弱的嵌入式触控***,使得字符识别功能可以轻松地在触控芯片中直接完成,而不会给触控芯片的内存及运算带来大的挑战,调试过程直观、简单,识别方法简洁高效,从而带来嵌入式***对于字符手势识别的快速、低功耗优势。
本申请的实施方式涉及一种字符识别方法,如图4所示,包括:
步骤201,对待识别字符的第一轨迹按书写顺序以预设的采样距离进行采样,获取多个采样点;其中首个采样点为第一轨迹的起点,最后一个采样点为第一轨迹的终点。
本实施例中,步骤201的具体实施细节与步骤101基本相同,在此不做赘述。
步骤202,以第一轨迹的起点作为首个参考点,执行第一操作:按书写顺序依次判断参考点之后的采样点中是否存在第一采样点;参考点到第一采样点的线段和第一采样点到下一个采样点的线段所对应的特征向量之间符合预设的走向变化条件。
本实施例中,若存在第一采样点,则执行步骤203,若不存在,则执行步骤204。
具体地说,从第一轨迹的起点,即首个参考点开始,判断之后的采样点中是否存在第一采样点,而第一采样点的限定条件为参考点到第一采样点的线段和第一采样点到下一个采样点的线段所对应的特征向量之间符合预设的走向变化条件,若存在第一采样点,则说明该点处字符的第一轨迹的走向发生变化,若不存在第一采样点,则说明从字符的第一轨迹的起点到终点轨迹的走向一直未发生变化,即第一轨迹为从起点到终点的直线。
在一实施例中,按书写顺序依次判断参考点之后的采样点中是否存在第一采样点,包括:选取参考点之后的首个采样点作为当前采样点,执行第二操作:构建参考点到当前采样点的线段所对应的第一向量,和当前采样点到当前采样点的下一个采样点的线段所对应的第二向量;当第一向量和第二向量符合预设的走向变化条件时,确定当前采样点为一个第一采样点;当第一向量和第二向量不符合预设的走向变化条件时,将下一个采样点作为当前采样点继续执行第二操作,直到遍历完所有的采样点。
具体地说,分别构建第一向量(参考点到当前采样点)和第二向量(当前采样点到当前采样点的下一个采样点),当第一向量和第二向量符合预设的走向变化条件时,当前采样点为第一采样点,当第一向量和第二向量不符合预设的走向变化条件时,继续从下一个采样点开始构建第一向量和第二向量,直到遍历到第一轨迹的终点。
其中,走向变化条件为第一向量和第二向量属于基准坐标系中的不同象限,基准坐标系为以第一向量和第二向量的起始点作为原点,水平方向作为x轴,竖直方向作为y轴所建立的坐标系;或者,走向变化条件为第一向量和第二向量属于基准坐标系中的不同象限,且第一向量和第二向量构成的夹角大于预设的角度阈值。
基准坐标系的不同象限表示不同方向,第一向量和第二向量属于不同方向,即两者的共用点处字符轨迹发生变化,共用点为特征点。另外,若第一向量和第二向量虽属于不同的象限,但第一向量和第二向量构成的夹角较小时,说明该点处字符轨迹虽然有变化,但变化幅度较小可以忽略不考虑,只有当第一向量和第二向量属于基准坐标系中的不同象限,且第一向量和第二向量构成的夹角大于预设的角度阈值时,才将第一向量和第二向量的共用点作为特征点。
需要说明的是,基准坐标系可以是以第一向量和第二向量的共用点作为原点,水平方向作为x轴,竖直方向作为y轴所建立的四象限坐标系,也可以是以第一向量和第二向量的共用点作为原点建立的八象限坐标系,还可以是以第一向量和第二向量的共用点作为原点建立的任意象限数量的坐标系。也就是说,基准坐标系的不同象限的划分方法本申请在此不做限定,只要可以判断出第一向量和第二向量属于不同的方向即可。
步骤203,将参考点之后的首个第一采样点作为一个特征点,并以参考点之后的首个第一采样点作为下一个参考点,继续执行第一操作,直到遍历完所有的采样点。
本实施例中,若按书写顺序依次判断参考点之后的采样点存在第一采样点,则将首个第一采样点作为一个特征点,并以该特征点作为下一个参考点继续判断后续采样点中是否存在第一采样点,直到遍历到第一轨迹的终点。
步骤204,按书写顺序依次连接第一轨迹的起点和第一轨迹的终点,或者,依次连接第一轨迹的起点、特征点和第一轨迹的终点,得到多个线段及描述各线段走向的多个特征向量。
具体地说,若存在特征点,则依次连接第一轨迹的起点、特征点和第一轨迹的终点,得到多个线段对应的特征向量,若不存在特征点,则依次连接第一轨迹的起点和终点,得到一个特征向量。
步骤205,将待识别字符对应的特征向量与字符库中标准字符的特征向量进行对比,确定待识别字符与各标准字符的匹配度。
本实施例中,步骤205的具体实施细节与步骤103基本相同,在此不做赘述。
步骤206,根据匹配度确定待识别字符的识别结果。
本实施例中,步骤206的具体实施细节与步骤104基本相同,在此不做赘述。
本申请实施方式提供的字符识别方法,通过从待识别字符的多个采样点中选取用于表示字符轨迹趋势发生变化的特征点,将字符轨迹的起点、特征点和字符轨迹的终点依次连接获取多个线段以及各线段对应的特征向量,将字符的特征向量与字符库中标准字符的特征向量对比,即可确定输入的字符与字符库中标准字符的匹配度,根据匹配度得到字符的识别结果,如此本申请可以以最少的特征点和最少的特征向量表示出字符的轨迹特点,每个字符最少需要2个特征向量即可完成有效识别,速度快、内存占用少,适用于内存和算力都较弱的嵌入式触控***,使得字符识别功能可以轻松地在触控芯片中直接完成,而不会给触控芯片的内存及运算带来大的挑战,调试过程直观、简单,识别方法简洁高效,从而带来嵌入式***对于字符手势识别的快速、低功耗优势。
上面各种方法的步骤划分,只是为了描述清楚,实现时可以合并为一个步骤或者对某些步骤进行拆分,分解为多个步骤,只要包括相同的逻辑关系,都在本专利的保护范围内;对算法中或者流程中添加无关紧要的修改或者引入无关紧要的设计,但不改变其算法和流程的核心设计都在该专利的保护范围内。
本申请的实施方式还涉及一种芯片,如图5所示,包括:
字符处理单元301,用于对待识别字符的第一轨迹按书写顺序以预设的采样距离进行采样,获取多个采样点;其中首个采样点为所述第一轨迹的起点,最后一个采样点为所述第一轨迹的终点;在所述多个采样点中选取所述第一轨迹的走向发生变化处的采样点作为特征点,并按所述书写顺序依次连接所述第一轨迹的起点、所述特征点和所述第一轨迹的终点,得到多个线段及描述各线段走向的多个特征向量;
字符识别单元302,用于将所述待识别字符对应的特征向量与字符库中标准字符的特征向量进行对比,确定所述待识别字符与各所述标准字符的匹配度;根据所述匹配度确定所述待识别字符的识别结果。
本申请的实施方式还涉及一种电子设备,如图6所示,包括:
至少一个处理器401;以及,与至少一个处理器401通信连接的存储器402;其中,存储器402存储有可被至少一个处理器401执行的指令,指令被至少一个处理器401执行,以使至少一个处理器401能够执行如上述实施方式提及的字符识别方法。
该电子设备包括:一个或多个处理器401以及存储器402,图6中以一个处理器401为例。处理器401、存储器402可以通过总线或者其他方式连接,图6中以通过总线连接为例。存储器402作为一种非易失性计算机可读存储介质,可用于存储非易失性软件程序、非易失性计算机可执行程序以及模块。处理器401通过运行存储在存储器402中的非易失性软件程序、指令以及模块,从而执行设备的各种功能应用以及数据处理,即实现上述字符识别方法。
存储器402可以包括存储程序区和存储数据区,其中,存储程序区可存储操作***、至少一个功能所需要的应用程序;存储数据区可存储选项列表等。此外,存储器402可以包括高速随机存取存储器,还可以包括非易失性存储器,例如至少一个磁盘存储器件、闪存器件、或其他非易失性固态存储器件。在一些实施方式中,存储器402可选包括相对于处理器401远程设置的存储器,这些远程存储器可以通过网络连接至外接设备。上述网络的实例包括但不限于互联网、企业内部网、局域网、移动通信网及其组合。
一个或者多个模块存储在存储器402中,当被一个或者多个处理器401执行时,执行上述任意实施方式中的字符识别方法。
上述产品可执行本申请实施方式所提供的方法,具备执行方法相应的功能模块和有益效果,未在本实施方式中详尽描述的技术细节,可参见本申请实施方式所提供的方法。
本申请的实施方式涉及一种计算机可读存储介质,存储有计算机程序。计算机程序被处理器执行时实现上述字符识别方法实施例。
即,本领域技术人员可以理解,实现上述实施例方法中的全部或部分步骤是可以通过程序来指令相关的硬件来完成,该程序存储在一个存储介质中,包括若干指令用以使得一个设备(可以是单片机,芯片等)或处理器(processor)执行本申请各个实施例方法的全部或部分步骤。而前述的存储介质包括:U盘、移动硬盘、只读存储器(ROM,Read-OnlyMemory)、随机存取存储器(RAM,Random Access Memory)、磁碟或者光盘等各种可以存储程序代码的介质。
本领域的普通技术人员可以理解,上述各实施方式是实现本申请的具体实施例,而在实际应用中,可以在形式上和细节上对其作各种改变,而不偏离本申请的精神和范围。
Claims (10)
1.一种字符识别方法,其特征在于,包括:
对待识别字符的第一轨迹按书写顺序以预设的采样距离进行采样,获取多个采样点;其中首个采样点为所述第一轨迹的起点,最后一个采样点为所述第一轨迹的终点;
在所述多个采样点中选取所述第一轨迹的走向发生变化处的采样点作为特征点,并按所述书写顺序依次连接所述第一轨迹的起点、所述特征点和所述第一轨迹的终点,得到多个线段及描述各所述线段走向的多个特征向量;
将所述待识别字符的特征向量与字符库中标准字符的特征向量进行对比,确定所述待识别字符与各所述标准字符的匹配度;
根据所述匹配度确定所述待识别字符的识别结果。
2.根据权利要求1所述的字符识别方法,其特征在于,所述在所述多个采样点中选取所述第一轨迹的走向发生变化处的采样点作为特征点,包括:
以所述第一轨迹的起点作为首个参考点,执行第一操作:按所述书写顺序依次判断所述参考点之后的所述采样点中是否存在第一采样点;所述参考点到所述第一采样点的线段和所述第一采样点到下一个采样点的线段所对应的特征向量之间符合预设的走向变化条件;
当存在所述第一采样点时,将所述参考点之后的首个第一采样点作为一个所述特征点,并以所述参考点之后的首个第一采样点作为下一个参考点,继续执行所述第一操作,直到遍历完所有的所述采样点。
3.根据权利要求2所述的字符识别方法,其特征在于,所述按书写顺序依次判断所述参考点之后的所述采样点中是否存在第一采样点,包括:
选取所述参考点之后的首个采样点作为当前采样点,执行第二操作:
构建所述参考点到所述当前采样点的线段所对应的第一向量,和所述当前采样点到所述当前采样点的下一个采样点的线段所对应的第二向量;
当所述第一向量和所述第二向量符合所述走向变化条件时,确定所述当前采样点为一个所述第一采样点;当所述第一向量和所述第二向量不符合所述走向变化条件时,将所述下一个采样点作为所述当前采样点继续执行所述第二操作,直到遍历完所有的所述采样点。
4.根据权利要求3所述的字符识别方法,其特征在于,所述走向变化条件为所述第一向量和所述第二向量属于基准坐标系中的不同象限;
或者,所述走向变化条件为所述第一向量和所述第二向量属于所述基准坐标系中的不同象限,且所述第一向量和所述第二向量构成的夹角大于预设的角度阈值;
所述基准坐标系为以所述第一向量和所述第二向量的起始点作为原点,水平方向作为x轴,竖直方向作为y轴所建立的坐标系。
5.根据权利要求1所述的字符识别方法,其特征在于,所述将所述待识别字符的特征向量与字符库中标准字符的特征向量进行对比,确定所述待识别字符与各所述标准字符的匹配度,包括:
根据预设的角度坐标系确定所述待识别字符的每个特征向量所属的角度区间对应的编码值;
将所述待识别字符的每个特征向量对应的编码值与各所述标准字符的每个特征向量的编码值进行对比,得到所述待识别字符的每个特征向量与各所述标准字符的每个特征向量的匹配度;
根据所述待识别字符的特征向量与各所述标准字符的特征向量的匹配度平均值,得到所述待识别字符与各所述标准字符的匹配度;
其中所述角度坐标系为以每个所述特征向量的起点作为原点,水平方向作为x轴、竖直方向作为y轴,并从x轴正方向开始围绕原点逆时针或顺时针按照预设的角度间隔对平面进行分割所得到的包含多个角度区间的坐标系。
6.根据权利要求1至权利要求5中任一项所述的字符识别方法,其特征在于,所述根据所述匹配度确定所述待识别字符的识别结果,包括:
获取所述待识别字符与所述字符库中各标准字符的匹配度的最大值;
判断所述匹配度的最大值是否大于预设的识别阈值;
若是,则将所述匹配度的最大值在所述字符库中对应的标准字符作为所述待识别字符的识别结果;若否,则识别失败。
7.根据权利要求6所述的字符识别方法,其特征在于,所述根据所述匹配度确定所述待识别字符的识别结果之后,还包括:
若针对同一所述待识别字符的识别失败次数超过预设的失败次数,则获取每次识别得到的所述待识别字符的特征向量,及各所述特征向量对应的编码值;
针对各次识别得到的处于同一顺位的编码值,将出现次数最多的编码值作为所述待识别字符在相应顺位上的特征向量对应的编码值,并将所述待识别字符的编码值添加到字符库中。
8.一种芯片,其特征在于,包括:
字符处理单元,用于对待识别字符的第一轨迹按书写顺序以预设的采样距离进行采样,获取多个采样点;其中首个采样点为所述第一轨迹的起点,最后一个采样点为所述第一轨迹的终点;在所述多个采样点中选取所述第一轨迹的走向发生变化处的采样点作为特征点,并按所述书写顺序依次连接所述第一轨迹的起点、所述特征点和所述第一轨迹的终点,得到多个线段及描述各所述线段走向的多个特征向量;
字符识别单元,用于将所述待识别字符对应的特征向量与字符库中标准字符的特征向量进行对比,确定所述待识别字符与各所述标准字符的匹配度;根据所述匹配度确定所述待识别字符的识别结果。
9.一种电子设备,其特征在于,包括:
至少一个处理器;以及,
与所述至少一个处理器通信连接的存储器;其中,所述存储器存储有可被所述至少一个处理器执行的指令,所述指令被所述至少一个处理器执行,以使所述至少一个处理器能够执行如权利要求1至权利要求7中任一所述的字符识别方法。
10.一种计算机可读存储介质,存储有计算机程序,其特征在于,所述计算机程序被处理器执行时实现权利要求1至权利要求7中任一项所述的字符识别方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202211265372.8A CN115331213A (zh) | 2022-10-17 | 2022-10-17 | 字符识别方法、芯片、电子设备及存储介质 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202211265372.8A CN115331213A (zh) | 2022-10-17 | 2022-10-17 | 字符识别方法、芯片、电子设备及存储介质 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN115331213A true CN115331213A (zh) | 2022-11-11 |
Family
ID=83915230
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202211265372.8A Pending CN115331213A (zh) | 2022-10-17 | 2022-10-17 | 字符识别方法、芯片、电子设备及存储介质 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN115331213A (zh) |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN115657925A (zh) * | 2022-12-28 | 2023-01-31 | 上海海栎创科技股份有限公司 | 触摸输入识别***及方法、设备、计算机可读存储介质 |
CN117058688A (zh) * | 2023-08-14 | 2023-11-14 | 北京东舟技术股份有限公司 | 一种书写轨迹相似度评估方法及处理设备 |
Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
EP2733643A2 (en) * | 2012-11-16 | 2014-05-21 | Tata Consultancy Services Limited | System and method facilitating designing of classifier while recognizing characters in a video |
CN105117054A (zh) * | 2015-08-12 | 2015-12-02 | 珠海优特电力科技股份有限公司 | 一种手写输入的识别方法及*** |
CN110796130A (zh) * | 2019-09-19 | 2020-02-14 | 北京迈格威科技有限公司 | 用于文字识别的方法、装置及计算机存储介质 |
CN111931710A (zh) * | 2020-09-17 | 2020-11-13 | 开立生物医疗科技(武汉)有限公司 | 一种联机手写文字识别方法、装置、电子设备及存储介质 |
-
2022
- 2022-10-17 CN CN202211265372.8A patent/CN115331213A/zh active Pending
Patent Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
EP2733643A2 (en) * | 2012-11-16 | 2014-05-21 | Tata Consultancy Services Limited | System and method facilitating designing of classifier while recognizing characters in a video |
CN105117054A (zh) * | 2015-08-12 | 2015-12-02 | 珠海优特电力科技股份有限公司 | 一种手写输入的识别方法及*** |
CN110796130A (zh) * | 2019-09-19 | 2020-02-14 | 北京迈格威科技有限公司 | 用于文字识别的方法、装置及计算机存储介质 |
CN111931710A (zh) * | 2020-09-17 | 2020-11-13 | 开立生物医疗科技(武汉)有限公司 | 一种联机手写文字识别方法、装置、电子设备及存储介质 |
Non-Patent Citations (1)
Title |
---|
任民宏: ""基于矢量特征编码的手写字符识别技术"", 《微计算机信息》 * |
Cited By (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN115657925A (zh) * | 2022-12-28 | 2023-01-31 | 上海海栎创科技股份有限公司 | 触摸输入识别***及方法、设备、计算机可读存储介质 |
CN115657925B (zh) * | 2022-12-28 | 2023-03-14 | 上海海栎创科技股份有限公司 | 触摸输入识别***及方法、设备、计算机可读存储介质 |
CN117058688A (zh) * | 2023-08-14 | 2023-11-14 | 北京东舟技术股份有限公司 | 一种书写轨迹相似度评估方法及处理设备 |
CN117058688B (zh) * | 2023-08-14 | 2024-04-05 | 北京东舟技术股份有限公司 | 一种书写轨迹相似度评估方法及处理设备 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN115331213A (zh) | 字符识别方法、芯片、电子设备及存储介质 | |
CN114186632B (zh) | 关键点检测模型的训练方法、装置、设备、存储介质 | |
CN109117854B (zh) | 关键点匹配方法、装置、电子设备以及存储介质 | |
CN113657397B (zh) | 循环生成网络模型的训练方法、建立字库的方法和装置 | |
CN110503682B (zh) | 矩形控件识别方法、装置、终端及存储介质 | |
CN111767965B (zh) | 图像匹配方法、装置、电子设备及存储介质 | |
CN113205041A (zh) | 结构化信息提取方法、装置、设备和存储介质 | |
CN115620321A (zh) | 表格识别方法及装置、电子设备和存储介质 | |
CN111681282A (zh) | 一种栈板识别处理方法及装置 | |
CN115359308A (zh) | 模型训练、难例识别方法、装置、设备、存储介质及程序 | |
CN114022865A (zh) | 基于车道线识别模型的图像处理方法、装置、设备和介质 | |
CN113627298A (zh) | 目标检测模型的训练方法及检测目标对象的方法、装置 | |
CN113254712A (zh) | 视频匹配方法、视频处理方法、装置、电子设备及介质 | |
CN114662607B (zh) | 基于人工智能的数据标注方法、装置、设备以及存储介质 | |
CN113032071B (zh) | 页面元素定位方法、页面测试方法、装置、设备和介质 | |
CN113887535A (zh) | 模型训练方法、文本识别方法、装置、设备和介质 | |
CN111511016B (zh) | 确定同源无线网络的方法、装置、服务器及存储介质 | |
CN113327194A (zh) | 图像风格迁移方法、装置、设备和存储介质 | |
CN111222590A (zh) | 形近字确定方法、电子设备和计算机可读存储介质 | |
CN114115640B (zh) | 图标的确定方法、装置、设备以及存储介质 | |
CN114639096B (zh) | 文本识别方法、装置、电子设备和存储介质 | |
CN115171110B (zh) | 文本识别方法及装置、设备、介质和产品 | |
CN113408661B (zh) | 误匹配确定方法、装置、设备和介质 | |
CN113705513B (zh) | 模型训练和车道线预测方法、电子设备和自动驾驶车辆 | |
CN114897073B (zh) | 面向智能工业的模型迭代方法、装置及电子设备 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
RJ01 | Rejection of invention patent application after publication |
Application publication date: 20221111 |
|
RJ01 | Rejection of invention patent application after publication |