CN102221976A - 基于非完整识别的词语快速输入方法 - Google Patents

基于非完整识别的词语快速输入方法 Download PDF

Info

Publication number
CN102221976A
CN102221976A CN2011101876921A CN201110187692A CN102221976A CN 102221976 A CN102221976 A CN 102221976A CN 2011101876921 A CN2011101876921 A CN 2011101876921A CN 201110187692 A CN201110187692 A CN 201110187692A CN 102221976 A CN102221976 A CN 102221976A
Authority
CN
China
Prior art keywords
word
input
identification
complete
individual character
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN2011101876921A
Other languages
English (en)
Inventor
周红全
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
SHANGHAI YICHUANG INFORMATION TECHNOLOGY CO LTD
Original Assignee
SHANGHAI YICHUANG INFORMATION TECHNOLOGY CO LTD
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by SHANGHAI YICHUANG INFORMATION TECHNOLOGY CO LTD filed Critical SHANGHAI YICHUANG INFORMATION TECHNOLOGY CO LTD
Priority to CN2011101876921A priority Critical patent/CN102221976A/zh
Publication of CN102221976A publication Critical patent/CN102221976A/zh
Pending legal-status Critical Current

Links

Images

Landscapes

  • Character Discrimination (AREA)

Abstract

随着智能手机的普及和推广,平板电脑的流行,触摸屏的使用越来越广泛了,联机手写识别技术的应用也越来越受到重视。传统的手写识别基本上是单字识别技术,本发明公开了一种联机手写识别的方法。该方法提供了针对词语输入的快速手写识别功能。利用该方法输入词语时,不需要把词语中的每个字完整的写完,每个字仅需要书写一笔或几笔,***就可以自动识别用户想要输入的词语,从而可以大大提高联机手写识别作为输入法的效率。

Description

基于非完整识别的词语快速输入方法
技术领域
本发明涉及联机手写识别技术中的词语识别和输入方法。
背景技术
目前用于联机手写识别输入法主要是三种方式,一是单(整)字识别技术,二是整句识别输入技术,三是叠写输入技术。
方式一是目前主流的技术,其缺点在于,每个字都必须完整的写完,用户确认识别结果后再写下一个字,相对拼音等其他输入法,输入效率十分低下。
方式二是对方式一的改善,允许用户一次书写多字或整句,相对减小用户和机器交互次数,其缺点在于,每个字都必须完整写完,用户书写时间并没有减少,且一旦识别出错,交互时间将大大增加,因此目前并不太流行。
方式三是对方式一的改善,允许用户在书写完第一个字时,不等待识别结果继续书写第二个字,从而减小用户和机器交互次数,其缺点在于,每个字都必须完整写完,用户书写时间并没有减少,书写强度反而提高了,且一旦识别出错,交互时间将大大增加,是目前刚刚推出的一项新技术。
由于目前联机手写识别的理念和方法缺陷,造成手写识别输入效率很低,尤其是在手机,平板电脑等触摸屏上,大部分都没有手写笔,迫切需要一种使用方便,输入正确率高,用户书写强度小的手写识别输入法。
发明内容
本发明的目的在于克服目前联机手写识别输入法现有技术的不足,提供了基于非完整识别的词语快速输入方法。利用该方法,用户不需要任何学习,就能大大减少输入强度,同时避免用户在有些字不会完整写的情况下而造成无法通过手写识别来输入的情况,相对于单字联机手写识别输入法,可以把输入效率提高几倍。本发明的技术基础是非完整模式识别,基于此基础,可以实现单字非完整识别,词语非完整识别、拼音手写联合词语输入和词语智能联想识别。其中词语非完整识别和拼音手写联合词语输入是本发明的核心。
本发明提供了一种供用户快速、准确手写输入的方法。该方法共包括4种方式,第一种方式为单字非完整识别,第二种方式为词语非完整识别,第三种方式为拼音手写联合词语输入,第四种方式为词语智能联想识别。
第一种方式:单字非完整识别,基于用户书写的笔迹进行单字模式识别,每书写一笔都出现一个非完整识别的预测候选字系列,并把预测候选字作为识别结果按照使用频率排列。单字非完整识别的一个主要核心是模板派生,所谓模板派生,就是对于每一个字,我们可以按照书写过程派生出很多子字模板。这样对于每一个子字,我们可以利用整字识别算法,从而达到用户没有书写完就能进行正确识别和预测。该方法也允许用户自己创建、派生个性化模板,以输入自己的一些独特写法,例如签名等。
第二种方式:词语非完整识别,用户书写词语中每个字的几笔或部分笔划、部分部件或部首,识别***自动分析用户输入笔迹,分解成多个单字非完整识别,得到多个预测候选字系列,把不同预测候选字系列进行概率组合,同时搜索词语库中的词语进行识别,并把词语识别结果按照使用频率排序。用户也可以自己定义词语笔迹模板库,用户将自己常用词语的首几笔做为模板存入模板库,这样可以提高用户自定义的个性化词汇的输入速度和识别效率。
词语非完整识别共分为三大区域:1.用户书写区域,2.识别候选区域,3.智能联想区域。
1.用户书写区域,对于词组输入既可界面分区,也可根据输入笔迹由识别***自动分区。界面分区相对于自动分区的优点在于识别率更高,但自动分区更符合用户输入习惯。
2.识别候选区域,把词语识别结果按照使用频率排序显示,供用户选择。
3.智能联想区域,根据用户选择的词语输入结果,预测词语后续相关联字或词,并根据概率排序预测字或词。
对于一般词组,只需书写每字头几笔,即可精确找到该词组。并且词语非完整识别输入是依赖于单字非完整识别技术,不管词语手写输入还是不构成词语的单字手写输入都能大大降低用户书写次数,从而极大提高效率。
表一以“评说”为例对词语非完整识别输入原理进行说明。
表一:
Figure BSA00000532057800021
Figure BSA00000532057800031
第三种方式:拼音手写联合词语输入。用户在输入词语时,首先给出词语中第一个字或每个字的声母或者拼音,再书写词语中第一个字或每个字的一笔或几笔,根据拼音的信息和词语非完整识别技术来预测候选词语,并把词语预测结果按照使用频率排序。在拼音词组输入时,输入词组中每个字的声母相对应的组合很多,但加上词组中第一个字或每个字的一笔或几笔特征后就能快速精确的找到该词组。对于一般词组,只需输入每字首字母后,再书写首字的头几笔画,结合单字非完整识别技术,即可精确找到该词组。对于一般单字输入,只需输入该字拼音的声母或首字母,再书写输入该字的一笔或几笔特征就能精准找到该字,减少用户在键盘上寻找字母的时间和点击次数。利用以上技术,对于使用触摸屏的智能设备,有效降低用户输入点击或书写次数,减小交互时间。
表二以“nh”为例对拼音手写联合词语输入原理进行说明。
表二:
Figure BSA00000532057800032
词语智能联想识别:单字输入确定后,待输入字书写一笔或几笔,根据单字非完整识别结果并结合词语联想功能,智能预测待输入字,并把预测候选字按照词语使用频率排序。
附图说明
图1整字模板。
图2派生模板一。
图3派生模板二。
图4派生模板三。
图5单字非完整识别图一。其中①为用户书写区,②为识别候选区域,③为智能联想区。
图6单字非完整识别图二。其中①为用户书写区,②为识别候选区域,③为智能联想区。
图7词语非完整识别输入图一。其中①为用户书写区,②为识别候选区域,③为智能联想区。其中用户书写区为自动分区。
图8词语非完整识别输入图二。其中①为用户书写区,②为识别候选区域,③为智能联想区。其中用户书写区为界面分区。
图9词语非完整识别输入图三。其中①为用户书写区,②为识别候选区域,③为智能联想区。
图10拼音手写联合词语输入图一。其中①为拼音显示区,②为识别候选区域,③为编辑书写区,④为智能联想区。
图11拼音手写联合词语输入图二。其中①为拼音显示区,②为识别候选区域,③为编辑书写区,④为智能联想区。
图12词语智能联想识别图一。其中①为用户书写区,②为识别候选区域,③为智能联想区。
图13词语智能联想识别图二。其中①为用户书写区,②为识别候选区域,③为智能联想区。
具体实施方式
1.单字非完整识别
(1)进入本输入法。
(2)单字非完整识别计算是以模板、派生模板的匹配值与统计数值相结合。计算公式如下:P=r1*P1+r2*P2(其中P是单字非完整识别概率,P1是手写输入的笔迹与模板、派生模板库的匹配值,P2是特征统计值,r1、r2是权重系数)。以“她”为例讲述模板与派生模板的概念,图1是“她”字的模板,图2,图3,图4是“她”字的派生模板。
(3)在用户书写区书写字形。
(4)如图5所示,根据识别概率预测候选字,并按照使用频率排列
(5)如图6所示,再继续书写该字,循环(3)-(4),直至出现该字。
(6)点击候选字,根据词汇,智能联想该候选字的后续字或词。
(7)循环(3)-(7)直至退出该输入法。
2.词语非完整识别输入
(1)进入本输入法。
(2)假设期望输入的词语中共包含n个单字,对于每一个单字的非完整识别都会得到一个预测候选字系列且假设每个单字取前m个预测候选字,若第i个单字的预测候选字系列表达为P(i,1),P(i,2),…P(i,m),则词语联合识别概率系列可表达为:∑(P(1,J(1)),P(2,J(2)),…P(i,J(i)),…P(n,J(n)),其中1<=J(i)<=m,为第i个单字非完整识别概率系列。词语非完整识别匹配的过程:所有单字非完整识别候选字序列排序组合得到概率序列,再与词语库进行匹配,得出词语非完整识别候选系列。
(3)在用户书写区书写词组每个字的几个笔划。
(4)如图7所示,根据识别概率预测候选词或字,并按照使用频率排列。其中图7中书写区是程序自动分区,图8中书写区是界面分区。
(5)如图9所示,继续书写,循环(3)-(4),直至出现该词或字。
(6)点击候选字或词,根据词汇,智能联想该候选字或词的后续字或词。
(7)循环(3)-(7)直至退出该输入法。
3.拼音手写联合词语输入
(1)进入本输入法。
(2)如图10所示,点击字母键,输入词组或字的拼音首字母。
(3)如图11所示,在文本编辑框内书写该词组或该字的头几笔。
(4)根据拼音手写联合词语联合概率,计算候选字或词。
(5)点击候选字或词。
(6)根据词汇,智能联想该候选字的后续字或词。
(7)循环(2)-(6)直至退出该输入法。
4.词语智能联想识别
(1)进入本输入法。
(2)书写词语的首字。
(3)如图12所示,根据识别概率,确定候选字。
(4)如图13所示,继续书写该词语下一个字的头几笔。
(5)根据词语智能联想识别联合概率,计算候选字。
(6)循环(2)-(5)直至退出该输入法。

Claims (4)

1.单字非完整识别:联机手写识别时,每个字不需要完整的写完就能进行识别,并给出预测候选字,预测候选字按照使用频率排序。
2.词语非完整识别:联机手写识别时,用户书写词语中每个字的一笔或几笔,根据单字非完整识别的预测候选字,按照预测候选字概率组合搜索词语库中的词语进行识别,并把词语识别结果按照使用频率排序。
3.拼音手写联合词语输入:用户在输入词语时,给出词语中第一个字或每个字的声母或者拼音,再书写词语中第一个字或每个字的一笔或几笔,根据拼音的信息和词语非完整识别来预测候选词语,并把词语预测结果按照使用频率排序。
4.词语智能联想识别:单字输入确定后,待输入字书写一笔或几笔,根据单字非完整识别结果并结合词语联想功能,智能预测待输入字,并把预测结果按照词语使用频率排序。
CN2011101876921A 2011-07-06 2011-07-06 基于非完整识别的词语快速输入方法 Pending CN102221976A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN2011101876921A CN102221976A (zh) 2011-07-06 2011-07-06 基于非完整识别的词语快速输入方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN2011101876921A CN102221976A (zh) 2011-07-06 2011-07-06 基于非完整识别的词语快速输入方法

Publications (1)

Publication Number Publication Date
CN102221976A true CN102221976A (zh) 2011-10-19

Family

ID=44778538

Family Applications (1)

Application Number Title Priority Date Filing Date
CN2011101876921A Pending CN102221976A (zh) 2011-07-06 2011-07-06 基于非完整识别的词语快速输入方法

Country Status (1)

Country Link
CN (1) CN102221976A (zh)

Cited By (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102937837A (zh) * 2012-08-10 2013-02-20 上海驿创信息技术有限公司 基于非完整识别的词语快速输入方法
CN104516669A (zh) * 2013-09-27 2015-04-15 株式会社东芝 电子设备及方法
CN104808806A (zh) * 2014-01-28 2015-07-29 北京三星通信技术研究有限公司 根据不确定性信息实现汉字输入的方法和装置
CN105183205A (zh) * 2014-09-23 2015-12-23 洪赖帛 一种轨迹式文字输入装置及方法
CN105607750A (zh) * 2014-11-17 2016-05-25 联想(新加坡)私人有限公司 生成候选语标
JP2016537728A (ja) * 2013-11-27 2016-12-01 シャープ株式会社 手書き文字の識別方法とシステム
CN111079503A (zh) * 2019-08-02 2020-04-28 广东小天才科技有限公司 一种文字识别方法及电子设备

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN1226019A (zh) * 1998-02-13 1999-08-18 字原(加拿大)有限公司 汉字字符输入的方法和***
CN101620480A (zh) * 2008-06-30 2010-01-06 戴静芬 触摸屏上实现手写笔画输入的方法

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN1226019A (zh) * 1998-02-13 1999-08-18 字原(加拿大)有限公司 汉字字符输入的方法和***
CN101620480A (zh) * 2008-06-30 2010-01-06 戴静芬 触摸屏上实现手写笔画输入的方法

Cited By (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102937837A (zh) * 2012-08-10 2013-02-20 上海驿创信息技术有限公司 基于非完整识别的词语快速输入方法
CN104516669A (zh) * 2013-09-27 2015-04-15 株式会社东芝 电子设备及方法
JP2016537728A (ja) * 2013-11-27 2016-12-01 シャープ株式会社 手書き文字の識別方法とシステム
CN104808806A (zh) * 2014-01-28 2015-07-29 北京三星通信技术研究有限公司 根据不确定性信息实现汉字输入的方法和装置
US10242296B2 (en) 2014-01-28 2019-03-26 Samsung Electronics Co., Ltd. Method and device for realizing chinese character input based on uncertainty information
CN105183205A (zh) * 2014-09-23 2015-12-23 洪赖帛 一种轨迹式文字输入装置及方法
CN105607750A (zh) * 2014-11-17 2016-05-25 联想(新加坡)私人有限公司 生成候选语标
US10095673B2 (en) 2014-11-17 2018-10-09 Lenovo (Singapore) Pte. Ltd. Generating candidate logograms
CN111079503A (zh) * 2019-08-02 2020-04-28 广东小天才科技有限公司 一种文字识别方法及电子设备
CN111079503B (zh) * 2019-08-02 2023-08-25 广东小天才科技有限公司 一种文字识别方法及电子设备

Similar Documents

Publication Publication Date Title
CN102449640B (zh) 识别手写单词
US9798393B2 (en) Text correction processing
US8363949B2 (en) Character recognition for overlapping textual user input
CN102221976A (zh) 基于非完整识别的词语快速输入方法
JP3141015B2 (ja) 手書き漢字認識方法および装置
CN100587660C (zh) 一种手写字符预测识别的方法和装置
Hussain et al. A comprehensive survey of handwritten document benchmarks: structure, usage and evaluation
CN102937837A (zh) 基于非完整识别的词语快速输入方法
CN101556508A (zh) 一种输入法中候选词的生成方法、装置、***及设备
JP2010518534A (ja) 文脈上の入力方法
CN102073884A (zh) 一种手写识别方法、***及手写识别终端
CN102063620A (zh) 一种手写识别方法、***及手写识别终端
CN102208039B (zh) 一种多语言混合手写文本行的识别方法及装置
CN103729087A (zh) 一种多点触摸手势识别的输入法
CN1862472B (zh) 借由提交不全字和/或任意给定字的不全笔画的表意语言短语的缩写手写输入的***和方法
CN102929394B (zh) 一种基于手势识别的盲文输入法
CN101986309A (zh) 查询题库的方法及装置
CN102243708B (zh) 一种手写识别方法、***及手写识别终端
CN101281449A (zh) 手写字识别方法和***
Ghods et al. Effect of delayed strokes on the recognition of online Farsi handwriting
TWI503740B (zh) A method of improving handwriting input efficiency
Wang et al. Conditional Random Field-based Parser and Language Model for Tradi-tional Chinese Spelling Checker
CN101216947B (zh) 基于笔段网格的手写汉字输入方法和汉字识别方法
CN102236799A (zh) 一种多字手写识别的方法及装置
Ma et al. A new database for online handwritten Mongolian word recognition

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
C02 Deemed withdrawal of patent application after publication (patent law 2001)
WD01 Invention patent application deemed withdrawn after publication

Application publication date: 20111019