CN111381683A

CN111381683A - 一种拍照识别输入法及软件

Info

Publication number: CN111381683A
Application number: CN201811620611.0A
Authority: CN
Inventors: 薛康泰华
Original assignee: Individual
Current assignee: Individual
Priority date: 2018-12-28
Filing date: 2018-12-28
Publication date: 2020-07-07

Abstract

本发明公开一种基于拍照功能的文字输入方法及软件，主要用于扩展输入法功能，特别适用于移动终端应用场景，如用户使用移动终端的字典APP软件来查阅生字生词，具体步骤为：1、用户选择拍照识别输入法，软件启动；2、软件调用拍照功能抓拍一幅含待输入字词的照片显示在输入界面的照片区；3、用户用手指触击或触划照片区内的待输入字词，软件从触击或触划位置分割出字词图片并调用文字识别模块识别出字词；4、软件显示识别结果供用户确认。本发明通过拍照识别来扩展移动终端或其它终端的输入法功能，提高了文字输入便利性。

Description

一种拍照识别输入法及软件

技术领域

本发明涉及一种拍照识别输入法及软件，属于软件技术领域。

背景技术

输入法软件是移动终端及个人电脑等其它终端的基础软件之一，现有的输入法软件除了支持拼写输入外，还支持手写输入、语音输入等，不同的输入法有不同的特点，也都有不足之处，比如拼写输入法不够便捷，手写输入法如果遇到不会写的字词，就无法输入，语音输入法如果遇到不会读的字词，就无法输入。本发明涉及的输入法，采用拍照识别的方法，只要能拍到包含字词的照片，就可以完成输入，不仅便捷，而且不受读写问题的限制，特别适用于移动终端应用场景。

发明内容

发明目的：本发明目的在于提供一种拍照识别输入法，提高移动终端或其它终端输入的便利性。

技术方案：本发明所述拍照识别输入法，其关键步骤如附图1所示，说明如下：

(1)软件启动后调用拍照功能，用户抓拍一幅含待输入字词的照片显示在输入界面的照片区；

(2)用户用手指触击或触划照片区内的待输入字词，软件从触击或触划位置分割出字词图片并调用文字识别模块识别出字词；

(3)软件显示识别结果供用户确认。

进一步完善上述技术方案，所述软件从用户触击位置分割出字词图片，方案之一为边界搜索法，说明如下：

(1)以触击点为中心设定一个初始大小的分割取景框，如10*10像素大小的；

(2)先从分割取景框的一个边开始，判断其是否与字词相交，如果相交，向外延展一个像素，循环往复直到该边不与字词相交，即确定搜索到字词的一个边界；

(3)依次对分割取景框的其它三个边，执行步骤(2)，直到字词的四个边界都确定。

进一步地，为了让用户直观看到上述方案的边界搜索过程，以让用户及时进行干预，软件在动态调整分割取景框边界的同时，在照片上实时显示出分割取景框，当用户看到待输入字词已完全落入分割取景框时，可以松开手指，软件即结束搜索。如果用户未松开手指，则软件在上次搜索结果的基础上，固定上下边界，再次执行搜索算法来搜索字词的左右边界，直到用户松手确认。

进一步完善上述技术方案，所述软件从用户触划位置分割出字词图片，方案也可使用边界搜索法，区别在于分割取景框的初始大小设定，说明如下：

(1)以触划起始点为起点设定一个初始大小的分割取景框，分割取景框的初始长度为手指触划轨迹的长度，初始宽度为一个经验值，如10个像素；

同样地，软件也在照片上实时显示动态分割取景框，以让用户确认什么时候可以结束分割过程，此处不再赘述。

上述边界搜索法为本发明可使用的字词分割方案之一，但该方案不作为约束本发明权利范围的限制条件，在技术实现上，可以选择其它分割方案，或使用多种分割方案互相进行验证来提高分割的可靠性。

进一步完善上述技术方案，所述软件调用文字识别模块来识别分割图片中的字词，文字识别模块由多个子模块组成，子模块可以扩充，每个子模块对应一种语言。识别子模块可使用成熟的开源字符识别OCR程序代码来实现，如用Tesserac OCR程序代码实现，或用GOCR程序代码实现，不同的语言可能使用不同的算法与程序，但使用何种算法与程序，不作为约束本发明权利范围的限制条件。

按照上述技术方案设计的拍照识别输入法软件，至少包括以下功能模块：

(1)拍照模块，用于拍摄包含待输入字词的照片。输入法软件启动后，即调用该模块拍摄照片，并把照片显示在照片区。

(2)文字分割模块，用于从照片中分割出包含待输入字词的图片。除了本说明书描述的基于边界搜索法的分割方案外，也可以采用其它分割方案。当用户用手指触击或触划照片时，文字分割模块被调用。

(3)文字识别模块，分割完成后，调用文字识别模块从分割图片中识别出字词。文字识别模块由多个文字识别子模块组成，子模块可扩充，每个子模块对应一种语言。识别子模块可使用成熟的开源字符识别OCR程序代码来实现，如用Tesserac OCR程序代码实现，或用GOCR程序代码实现，不同的语言可能使用不同的算法与程序。

本发明还提供了上述拍照识别输入法在手机输入法与幼儿识字软件中的应用。

有益效果：本发明通过拍照识别来扩展输入法，只要能拍到包含字词的照片，就可以完成输入，不仅便捷，而且不受读写问题的限制，特别适用于移动终端应用场景。例如，在移动终端电子字典APP中使用该输入法，当用户在阅读文章过程中，遇到生词，可以直接对着读物拍照，用手指触击或触划照片中的生字生词，输入法自动识别出单词，并查字典；或者用户到陌生语镜旅游，遇到不认识的招牌或路牌，可以直接拍照识别并查字典，使用非常便利。

附图说明

附图1为本发明所述拍照识别输入法的步骤图。

在附图1中，当输入法软件被调用后，先调用拍照模块拍摄一幅含待输入字词的照片显示出来，用户触击或触划照片中的待输入字词，软件调用分割模块分割出字词，在分割完成后，软件调用识别模块识别出分割图片中的字词，并把识别结果显示出来供用户确认。

实施方式

下面对本发明技术方案进行详细说明，但是本发明的保护范围不局限于所述实施例。

实施例1：本发明用于手机输入法，在手机输入法软件中扩充本发明所述拍照识别输入法模块，输入法模块由以下几个子模块组成：

(1)拍照子模块。当用户打开输入法，选择“拍照识别”输入法时，调用拍照子模块，抓取一幅包含待输入字词的照片，显示在输入界面的照片区。

(2)分割子模块。当用户用手指触击或触划照片区中的字词时，调用分割子模块，使用边界搜索法分割生词，获得分割图片，具体方法参见本发明所述方案。

(3)英语文字识别子模块。该模块用Tesserac OCR程序代码实现。软件获得分割图片后，调用该模块识别出分割图片中的英语字词。

实施例2：本发明用于手机幼儿识字APP软件，在手机幼儿识字APP软件中内置本发明所述拍照识别输入模块，来帮助幼儿认字。输入模块由以下几个子模块组成

(1)拍照子模块。幼儿打开识字APP软件，调用拍照子模块，拍摄幼儿识字卡片照片，显示在照片区。

(2)分割子模块。当幼儿用手指触击照片区中的单词时，调用分割子模块，使用边界搜索法分割单词，获得分割图片，具体方法参见本发明所述方案。

(3)英语文字识别子模块。该模块用GOCR程序代码实现。在获得分割图片后，调用该模块识别出分割图片中的英语单词，APP软件讲解单词意思、读音与例句等，帮助幼儿认字。

如上所述，尽管参照特定的优选实施例已经表示和表述了本发明，但其不得解释为对本发明自身的限制。在不脱离所附权利要求定义的本发明的精神和范围前提下，可对其在形式上和细节上做出各种变化。

Claims

1.一种拍照识别输入法及软件，其特征在于：包括以下步骤，

(2)用户用手指触击或触划照片区内的待输入字词，软件自动识别出触击或触划位置的字词；

(3)软件显示识别结果供用户确认。

2.根据权利要求1所述的拍照识别输入法及软件，其特征在于：所述软件自动识别出触击或触划位置的字词，包括以下两个步骤，

(1)从触击或触划位置分割出字词图片；

(2)调用文字识别模块识别出字词。

3.根据权利要求2所述的软件从用户触击点分割字词图片，其特征在于：软件以触击点为基准位置实时显示动态分割取景框，直到取景框已框住待输入字词，用户松手确认，软件完成分割。

4.根据权利要求2所述的软件从用户触划位置分割字词图片，其特征在于：软件以手指触划动作轨迹为参考实时显示动态分割取景框，直到取景框已框住待输入字词，用户松手确认，软件完成分割。

5.根据权利要求3与权利要求4所述的软件实时显示动态分割取景框，其特征在于：动态取景框的中心位置与长宽调整受分割算法控制。

6.根据权利要求2所述的软件调用文字识别模块识别字词，其特征在于：文字识别模块支持多语言切换。

7.一种拍照识别输入法及软件，其特征在于：软件包含以下模块，

(1)拍照模块，用于抓拍含待输入字词的照片；

(2)字词分割模块，以用户手指触击或触划位置为基准位置，在分割算法的控制下，动态调整并实时显示取景框，完成字词分割；

(3)文字识别模块，由多个文字识别子模块组成，每个子模块对应一种语言，且子模块可扩充。