CN111381683A - 一种拍照识别输入法及软件 - Google Patents

一种拍照识别输入法及软件 Download PDF

Info

Publication number
CN111381683A
CN111381683A CN201811620611.0A CN201811620611A CN111381683A CN 111381683 A CN111381683 A CN 111381683A CN 201811620611 A CN201811620611 A CN 201811620611A CN 111381683 A CN111381683 A CN 111381683A
Authority
CN
China
Prior art keywords
software
input
word
user
words
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201811620611.0A
Other languages
English (en)
Inventor
薛康泰华
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Individual
Original Assignee
Individual
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Individual filed Critical Individual
Priority to CN201811620611.0A priority Critical patent/CN111381683A/zh
Publication of CN111381683A publication Critical patent/CN111381683A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F3/00Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
    • G06F3/01Input arrangements or combined input and output arrangements for interaction between user and computer
    • G06F3/02Input arrangements using manually operated switches, e.g. using keyboards or dials
    • G06F3/023Arrangements for converting discrete items of information into a coded form, e.g. arrangements for interpreting keyboard generated codes as alphanumeric codes, operand codes or instruction codes
    • G06F3/0233Character input methods
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/10Character recognition
    • G06V30/14Image acquisition
    • G06V30/148Segmentation of character regions
    • G06V30/153Segmentation of character regions using recognition of characters or words

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Multimedia (AREA)
  • Human Computer Interaction (AREA)
  • User Interface Of Digital Computer (AREA)
  • Machine Translation (AREA)
  • Character Discrimination (AREA)

Abstract

本发明公开一种基于拍照功能的文字输入方法及软件,主要用于扩展输入法功能,特别适用于移动终端应用场景,如用户使用移动终端的字典APP软件来查阅生字生词,具体步骤为:1、用户选择拍照识别输入法,软件启动;2、软件调用拍照功能抓拍一幅含待输入字词的照片显示在输入界面的照片区;3、用户用手指触击或触划照片区内的待输入字词,软件从触击或触划位置分割出字词图片并调用文字识别模块识别出字词;4、软件显示识别结果供用户确认。本发明通过拍照识别来扩展移动终端或其它终端的输入法功能,提高了文字输入便利性。

Description

一种拍照识别输入法及软件
技术领域
本发明涉及一种拍照识别输入法及软件,属于软件技术领域。
背景技术
输入法软件是移动终端及个人电脑等其它终端的基础软件之一,现有的输入法软件除了支持拼写输入外,还支持手写输入、语音输入等,不同的输入法有不同的特点,也都有不足之处,比如拼写输入法不够便捷,手写输入法如果遇到不会写的字词,就无法输入,语音输入法如果遇到不会读的字词,就无法输入。本发明涉及的输入法,采用拍照识别的方法,只要能拍到包含字词的照片,就可以完成输入,不仅便捷,而且不受读写问题的限制,特别适用于移动终端应用场景。
发明内容
发明目的:本发明目的在于提供一种拍照识别输入法,提高移动终端或其它终端输入的便利性。
技术方案:本发明所述拍照识别输入法,其关键步骤如附图1所示,说明如下:
(1)软件启动后调用拍照功能,用户抓拍一幅含待输入字词的照片显示在输入界面的照片区;
(2)用户用手指触击或触划照片区内的待输入字词,软件从触击或触划位置分割出字词图片并调用文字识别模块识别出字词;
(3)软件显示识别结果供用户确认。
进一步完善上述技术方案,所述软件从用户触击位置分割出字词图片,方案之一为边界搜索法,说明如下:
(1)以触击点为中心设定一个初始大小的分割取景框,如10*10像素大小的;
(2)先从分割取景框的一个边开始,判断其是否与字词相交,如果相交,向外延展一个像素,循环往复直到该边不与字词相交,即确定搜索到字词的一个边界;
(3)依次对分割取景框的其它三个边,执行步骤(2),直到字词的四个边界都确定。
进一步地,为了让用户直观看到上述方案的边界搜索过程,以让用户及时进行干预,软件在动态调整分割取景框边界的同时,在照片上实时显示出分割取景框,当用户看到待输入字词已完全落入分割取景框时,可以松开手指,软件即结束搜索。如果用户未松开手指,则软件在上次搜索结果的基础上,固定上下边界,再次执行搜索算法来搜索字词的左右边界,直到用户松手确认。
进一步完善上述技术方案,所述软件从用户触划位置分割出字词图片,方案也可使用边界搜索法,区别在于分割取景框的初始大小设定,说明如下:
(1)以触划起始点为起点设定一个初始大小的分割取景框,分割取景框的初始长度为手指触划轨迹的长度,初始宽度为一个经验值,如10个像素;
(2)先从分割取景框的一个边开始,判断其是否与字词相交,如果相交,向外延展一个像素,循环往复直到该边不与字词相交,即确定搜索到字词的一个边界;
(3)依次对分割取景框的其它三个边,执行步骤(2),直到字词的四个边界都确定。
同样地,软件也在照片上实时显示动态分割取景框,以让用户确认什么时候可以结束分割过程,此处不再赘述。
上述边界搜索法为本发明可使用的字词分割方案之一,但该方案不作为约束本发明权利范围的限制条件,在技术实现上,可以选择其它分割方案,或使用多种分割方案互相进行验证来提高分割的可靠性。
进一步完善上述技术方案,所述软件调用文字识别模块来识别分割图片中的字词,文字识别模块由多个子模块组成,子模块可以扩充,每个子模块对应一种语言。识别子模块可使用成熟的开源字符识别OCR程序代码来实现,如用Tesserac OCR程序代码实现,或用GOCR程序代码实现,不同的语言可能使用不同的算法与程序,但使用何种算法与程序,不作为约束本发明权利范围的限制条件。
按照上述技术方案设计的拍照识别输入法软件,至少包括以下功能模块:
(1)拍照模块,用于拍摄包含待输入字词的照片。输入法软件启动后,即调用该模块拍摄照片,并把照片显示在照片区。
(2)文字分割模块,用于从照片中分割出包含待输入字词的图片。除了本说明书描述的基于边界搜索法的分割方案外,也可以采用其它分割方案。当用户用手指触击或触划照片时,文字分割模块被调用。
(3)文字识别模块,分割完成后,调用文字识别模块从分割图片中识别出字词。文字识别模块由多个文字识别子模块组成,子模块可扩充,每个子模块对应一种语言。识别子模块可使用成熟的开源字符识别OCR程序代码来实现,如用Tesserac OCR程序代码实现,或用GOCR程序代码实现,不同的语言可能使用不同的算法与程序。
本发明还提供了上述拍照识别输入法在手机输入法与幼儿识字软件中的应用。
有益效果:本发明通过拍照识别来扩展输入法,只要能拍到包含字词的照片,就可以完成输入,不仅便捷,而且不受读写问题的限制,特别适用于移动终端应用场景。例如,在移动终端电子字典APP中使用该输入法,当用户在阅读文章过程中,遇到生词,可以直接对着读物拍照,用手指触击或触划照片中的生字生词,输入法自动识别出单词,并查字典;或者用户到陌生语镜旅游,遇到不认识的招牌或路牌,可以直接拍照识别并查字典,使用非常便利。
附图说明
附图1为本发明所述拍照识别输入法的步骤图。
在附图1中,当输入法软件被调用后,先调用拍照模块拍摄一幅含待输入字词的照片显示出来,用户触击或触划照片中的待输入字词,软件调用分割模块分割出字词,在分割完成后,软件调用识别模块识别出分割图片中的字词,并把识别结果显示出来供用户确认。
实施方式
下面对本发明技术方案进行详细说明,但是本发明的保护范围不局限于所述实施例。
实施例1:本发明用于手机输入法,在手机输入法软件中扩充本发明所述拍照识别输入法模块,输入法模块由以下几个子模块组成:
(1)拍照子模块。当用户打开输入法,选择“拍照识别”输入法时,调用拍照子模块,抓取一幅包含待输入字词的照片,显示在输入界面的照片区。
(2)分割子模块。当用户用手指触击或触划照片区中的字词时,调用分割子模块,使用边界搜索法分割生词,获得分割图片,具体方法参见本发明所述方案。
(3)英语文字识别子模块。该模块用Tesserac OCR程序代码实现。软件获得分割图片后,调用该模块识别出分割图片中的英语字词。
实施例2:本发明用于手机幼儿识字APP软件,在手机幼儿识字APP软件中内置本发明所述拍照识别输入模块,来帮助幼儿认字。输入模块由以下几个子模块组成
(1)拍照子模块。幼儿打开识字APP软件,调用拍照子模块,拍摄幼儿识字卡片照片,显示在照片区。
(2)分割子模块。当幼儿用手指触击照片区中的单词时,调用分割子模块,使用边界搜索法分割单词,获得分割图片,具体方法参见本发明所述方案。
(3)英语文字识别子模块。该模块用GOCR程序代码实现。在获得分割图片后,调用该模块识别出分割图片中的英语单词,APP软件讲解单词意思、读音与例句等,帮助幼儿认字。
如上所述,尽管参照特定的优选实施例已经表示和表述了本发明,但其不得解释为对本发明自身的限制。在不脱离所附权利要求定义的本发明的精神和范围前提下,可对其在形式上和细节上做出各种变化。

Claims (7)

1.一种拍照识别输入法及软件,其特征在于:包括以下步骤,
(1)软件启动后调用拍照功能,用户抓拍一幅含待输入字词的照片显示在输入界面的照片区;
(2)用户用手指触击或触划照片区内的待输入字词,软件自动识别出触击或触划位置的字词;
(3)软件显示识别结果供用户确认。
2.根据权利要求1所述的拍照识别输入法及软件,其特征在于:所述软件自动识别出触击或触划位置的字词,包括以下两个步骤,
(1)从触击或触划位置分割出字词图片;
(2)调用文字识别模块识别出字词。
3.根据权利要求2所述的软件从用户触击点分割字词图片,其特征在于:软件以触击点为基准位置实时显示动态分割取景框,直到取景框已框住待输入字词,用户松手确认,软件完成分割。
4.根据权利要求2所述的软件从用户触划位置分割字词图片,其特征在于:软件以手指触划动作轨迹为参考实时显示动态分割取景框,直到取景框已框住待输入字词,用户松手确认,软件完成分割。
5.根据权利要求3与权利要求4所述的软件实时显示动态分割取景框,其特征在于:动态取景框的中心位置与长宽调整受分割算法控制。
6.根据权利要求2所述的软件调用文字识别模块识别字词,其特征在于:文字识别模块支持多语言切换。
7.一种拍照识别输入法及软件,其特征在于:软件包含以下模块,
(1)拍照模块,用于抓拍含待输入字词的照片;
(2)字词分割模块,以用户手指触击或触划位置为基准位置,在分割算法的控制下,动态调整并实时显示取景框,完成字词分割;
(3)文字识别模块,由多个文字识别子模块组成,每个子模块对应一种语言,且子模块可扩充。
CN201811620611.0A 2018-12-28 2018-12-28 一种拍照识别输入法及软件 Pending CN111381683A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201811620611.0A CN111381683A (zh) 2018-12-28 2018-12-28 一种拍照识别输入法及软件

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201811620611.0A CN111381683A (zh) 2018-12-28 2018-12-28 一种拍照识别输入法及软件

Publications (1)

Publication Number Publication Date
CN111381683A true CN111381683A (zh) 2020-07-07

Family

ID=71219079

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201811620611.0A Pending CN111381683A (zh) 2018-12-28 2018-12-28 一种拍照识别输入法及软件

Country Status (1)

Country Link
CN (1) CN111381683A (zh)

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101059840A (zh) * 2007-05-24 2007-10-24 深圳市杰特电信控股有限公司 一种用手机拍照方式的文字输入方法
CN101667251A (zh) * 2008-09-05 2010-03-10 三星电子株式会社 具备辅助定位功能的ocr识别方法和装置

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101059840A (zh) * 2007-05-24 2007-10-24 深圳市杰特电信控股有限公司 一种用手机拍照方式的文字输入方法
CN101667251A (zh) * 2008-09-05 2010-03-10 三星电子株式会社 具备辅助定位功能的ocr识别方法和装置

Similar Documents

Publication Publication Date Title
US10599914B2 (en) Method and apparatus for human face image processing
CN111353501A (zh) 一种基于深度学习的书本点读方法及***
US20170139911A1 (en) Address book based picture matching method and terminal
WO2022089170A1 (zh) 字幕区域识别方法、装置、设备及存储介质
WO2021097750A1 (zh) 人体姿态的识别方法、装置、存储介质及电子设备
CN110298380A (zh) 图像处理方法、装置及电子设备
WO2017197593A1 (en) Apparatus, method and computer program product for recovering editable slide
CN111709414A (zh) Ar设备及其文字识别方法、装置和计算机可读存储介质
US20190155480A1 (en) Data entry system with drawing recognition
CN108256523A (zh) 基于移动终端的识别方法、装置及计算机可读存储介质
US9904361B2 (en) Electronic device and facial expression operation method
WO2023138403A1 (zh) 确定触发手势的方法、装置及设备
CN104765796A (zh) 一种图像识别搜索方法及装置
CN109376618B (zh) 图像处理方法、装置及电子设备
CN112738555B (zh) 视频处理方法及装置
CN112163513A (zh) 信息选取方法、***、装置、电子设备及存储介质
CN111381683A (zh) 一种拍照识别输入法及软件
CN106557766B (zh) 模糊字符处理方法、***及电子设备
CN114281236B (zh) 文本处理方法、装置、设备、介质和程序产品
CN110969161B (zh) 图像处理方法、电路、视障辅助设备、电子设备和介质
US11367296B2 (en) Layout analysis
CN111753715B (zh) 点读场景下试题拍摄的方法、装置、电子设备和存储介质
CN111582281B (zh) 一种图片显示优化的方法、装置、电子设备和存储介质
KR20140134844A (ko) 객체 기반 사진 촬영 방법 및 장치
CN116434253A (zh) 图像处理方法、装置、设备、存储介质及产品

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
WD01 Invention patent application deemed withdrawn after publication
WD01 Invention patent application deemed withdrawn after publication

Application publication date: 20200707