CN108491084A - 基于词组的拼音输入法同音汉字过滤方法 - Google Patents

基于词组的拼音输入法同音汉字过滤方法 Download PDF

Info

Publication number
CN108491084A
CN108491084A CN201810086572.4A CN201810086572A CN108491084A CN 108491084 A CN108491084 A CN 108491084A CN 201810086572 A CN201810086572 A CN 201810086572A CN 108491084 A CN108491084 A CN 108491084A
Authority
CN
China
Prior art keywords
phrase
chinese character
filtering
target characters
chinese
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Withdrawn
Application number
CN201810086572.4A
Other languages
English (en)
Inventor
杨伟
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Individual
Original Assignee
Individual
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Individual filed Critical Individual
Priority to CN201810086572.4A priority Critical patent/CN108491084A/zh
Publication of CN108491084A publication Critical patent/CN108491084A/zh
Withdrawn legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F3/00Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
    • G06F3/01Input arrangements or combined input and output arrangements for interaction between user and computer
    • G06F3/02Input arrangements using manually operated switches, e.g. using keyboards or dials
    • G06F3/023Arrangements for converting discrete items of information into a coded form, e.g. arrangements for interpreting keyboard generated codes as alphanumeric codes, operand codes or instruction codes
    • G06F3/0233Character input methods
    • G06F3/0237Character input methods using prediction or retrieval techniques
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F3/00Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
    • G06F3/01Input arrangements or combined input and output arrangements for interaction between user and computer
    • G06F3/02Input arrangements using manually operated switches, e.g. using keyboards or dials
    • G06F3/023Arrangements for converting discrete items of information into a coded form, e.g. arrangements for interpreting keyboard generated codes as alphanumeric codes, operand codes or instruction codes
    • G06F3/0233Character input methods
    • G06F3/0236Character input methods using selection techniques to select from displayed items

Landscapes

  • Engineering & Computer Science (AREA)
  • General Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Human Computer Interaction (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Document Processing Apparatus (AREA)

Abstract

拼音输入法最大的缺点就是同音字词太多,过滤太繁。本发明的同音字过滤方法通过包含准备输入的目标汉字的词组来过滤汉字。“问:您贵姓。答:杨树的杨,太阳的阳,高楼大厦的楼。”当某个汉字同音字太多,我们习惯用包含该汉字的词组来过滤同音字和确认汉字。本发明过滤同音字符合我们日常交流习惯和思维习惯,是拼音输入法的有益补充。

Description

基于词组的拼音输入法同音汉字过滤方法
技术领域
本发明涉及拼音输入法,尤其涉及拼音输入法的同音汉字的过滤方法。
背景技术
汉字输入法,主要包括音码、形码、音形码、无理码以及手写、语音录入等方法。除了少数专业人士喜欢使用以五笔字型为首的形码外,大多数普通人士喜欢用拼音输入法。拼音输入法最大的缺点就是同音字太多,单字输入时,选字太慢。特别是yi、ji、yu、fu、zhi、li、qi、yuan、xi、jian、shi、wu、we、ju和bi这几个汉语拼音,同音字几十个甚至200多个,需要多次翻页。即使现在比较流行的搜狗、QQ、谷歌和百度等拼音输入法也束手无策。
发明内容
本发明要解决的技术问题是提供一种能够提高拼音汉字输入效率和速度的拼音输入法同音字过滤的方法。为了解决上述技术问题,本发明采用如下技术方案实现:
有人问:“您贵姓。”我们习惯这样回答:“杨树的杨,太阳的阳,高楼大厦的楼。”。当汉字同音字太多时,我们习惯用包含该汉字的词组来过滤同音字,定位汉字。本发明用包含准备输入的目标汉字的词组来过滤同音字。
我们在使用拼音输入法时,很多人习惯用下面的方法来过滤同音字。比如要输入汉字“杨”,当我们输入汉字“杨”的汉语拼音码“yang”,发现同音字太多,就顺势输入杨树,词组“杨树”的同音词比较少,很容易遴选出汉字“杨”,然后按Backspace回格键,删除汉字“树”。但是要通过词组“万寿无疆”来遴选“疆”,词组“高楼大厦”来遴选“楼”,比较麻烦,要多次按后退、前进方向键和回格键才能完成。本发明的基于词组的拼音输入法同音汉字过滤方法大多数情况下只需按一个同音字过滤确认键即可完成同音汉字过滤。
一种基于词组的拼音输入法同音字过滤方法,包含事前过滤模式和事后过滤模式。
当拼音输入开始之前,就预感目标汉字同音字太多需要过滤时,进入词组事前过滤模式。输入包含目标汉字的词组的汉语拼音输入码,然后遴选并确认过滤词组。如果目标汉字是过滤词组的首字(第1个汉字),按首字过滤确认键,拼音输入法***确认过滤词组第1个汉字是准备输入的目标汉字;如果目标汉字是过滤词组的尾字(最后1个汉字),按尾字过滤确认键,拼音输入法***确认过滤词组最后1个汉字是准备输入的目标汉字;如果目标汉字是过滤词组的第2个汉字,按第2汉字过滤确认键,拼音输入法***确认过滤词组的第2个汉字是准备输入的目标汉字;如果目标汉字是过滤词组的其他中间字(不是第1个也不是第2个并且不是最后1个汉字),先按其他中间字过滤确认键,最后按目标汉字在过滤词组的顺序号对应的数字键,拼音输入法***确认过滤词组的以数字键的数字为顺序号对应的汉字是准备输入的目标汉字。拼音输入法***确认了过滤词组中哪个汉字是目标汉字之后,保留目标汉字,自动删除过滤词组的所有其他组员汉字。
词组事前过滤模式相对比较简单,先直接输入包含准备输入的目标汉字的过滤词组,过滤词组有多个汉字,至于哪个汉字是目标汉字,则通过过滤确认键来人工完成。目标汉字不是过滤词组的第1个也不是第2个并且还不是最后1个汉字的情况极罕见,我们一般不习惯用中间字来确认汉字,首字、尾字和第2个汉字过滤确认的方法已经包括了大多数情况了。
当输入单个汉字的汉语拼音输入码之后,发现目标汉字的同音字数量太多需要过滤时,则进入词组事后过滤模式。接着输入包含目标汉字的过滤词组。如果目标汉字是过滤词组的首字,不需要重复输入该汉字的汉语拼音输入码,只需输入其他组员汉字的汉语拼音输入码。遴选出过滤词组之后按首字过滤确认键,输入法软件***保留词组的首字即目标汉字,删除其他组员汉字。
当输入单个汉字的汉语拼音输入码之后,发现目标汉字的同音字数量太多需要过滤时,如果目标汉字不是包含目标汉字的过滤词组的首字,则接着按目标汉字确认键,再次输入完整的包含目标汉字的过滤词组的所有汉语拼音输入码。输入法软件***以按目标汉字确认键之前输入的输入码字符队列对应的汉字为目标汉字,以按目标汉字确认键之后输入的输入码字符队列为过滤词组的输入码,遴选并确认过滤词组之后,输入法软件***保留目标汉字,删除其他所有的组员汉字。
本发明的事前过滤模式和事后过滤模式2种词组过滤模式,都是通过输入包含目标汉字的过滤词组来过滤汉字,输入法软件***都能够保留目标汉字自动删除过滤词组其他组员汉字。用过滤确认键来决定过滤词组中哪个汉字是目标汉字。目标汉字不是包含目标汉字的过滤词组的首字的词组事后过滤模式,目标汉字确认键前后输入的输入码队列分别是目标汉字和过滤词组,目标汉字确认键用于把目标汉字和过滤词组分割开来。
进一步地,用于过滤汉字同音字的词组的同音词没有或者尽可能的少。 过滤词组只是用于过滤汉字的同音字,用完即刻删除。如果用于过滤汉字的词组同音词太多,同音词本身需要过滤,这样的话输入速度缓慢。
具体实施方式
根据本发明的权利要求书和说明书的技术方案,构造一个包含本发明的汉字拼音输入法,暂命名为杨码拼音输入法,用于详细说明本发明的技术方案。
杨码拼音输入法包含词组事前过滤模式和词组事后过滤模式2种同音字模式。当汉字的拼音输入开始之前,就预感目标汉字同音字太多需要过滤时,进入事前过滤模式;输入包含目标汉字的词组的汉语拼音输入码,然后遴选出过滤词组;如果目标汉字是过滤词组的首字(第1个汉字),按首字过滤确认键,拼音输入法***确认过滤词组的第1个汉字是准备输入的目标汉字;如果目标汉字是过滤词组的尾字(最后1个汉字),按尾字过滤确认键,拼音输入法***确认过滤词组的最后1个汉字是准备输入的目标汉字;如果目标汉字是过滤词组的第2个汉字,按第2汉字过滤确认键,拼音输入法***确认过滤词组的第2个汉字是准备输入的目标汉字;如果目标汉字是过滤词组的其他中间字(不是第1个也不是第2个并且不是最后1个汉字),先按其他中间字过滤确认键,最后按目标汉字在过滤词组的顺序号对应的数字键,拼音输入法***确认过滤词组的以数字键的数字为顺序号对应的汉字是准备输入的目标汉字;拼音输入法***确认了目标汉字之后,保留目标汉字自动删除过滤词组的所有其他组员汉字;当输入汉字的汉语拼音输入码之后,发现目标汉字的同音字数量太多需要过滤时,进入事后过滤模式。
如果目标汉字是包含目标汉字的过滤词组的首字,则不需要重复输入该汉字的汉语拼音输入码,只需接着输入剩余其他组员汉字的汉语拼音输入码,遴选并确认过滤词组之后按首字过滤确认键,输入法软件***保留词组的首字即目标汉字,删除所有其他组员汉字;当输入汉字的汉语拼音输入码之后,发现目标汉字的同音字数量太多需要过滤时,如果目标汉字不是包含目标汉字的过滤词组的首字;接着按下目标汉字确认键,再次输入完整的包含目标汉字的过滤词组的所有汉语拼音输入码,遴选并确认过滤词组之后,输入法软件***保留目标汉字,删除过滤词组其他所有的组员汉字。
进一步地,构造的用于过滤同音字的词组的同音词没有或者尽可能的少。
本方法在统一的输入法界面下采用全拼编码和双拼编码双体模式输入,并规定,全拼用小写字母编码,双拼用大写字母编码,大小写字母的转换,按键盘上的Caps lock键。
输入字词候选数量为5,主键盘的数字键1、2、3、4、5是候选字和候选词的确认键。例如按5,就选择候选框的第5个字词。
如果候选字词的第1个字词就是准备输入的目标汉字,回车键和空格键就是确认键。
目标汉字确认键和首字过滤确认键、尾字过滤确认键、第2汉字过滤确认键、其他中间字过滤确认键分别是主键盘区的数字键6、7、8、9、0。
词组人工过滤模式举例:例1:准备输入汉字“楼”。先输入包含楼的词组“高楼大厦”的汉语拼音输入码“gaoloudasha”,遴选出过滤词组“高楼大厦”并确认后。然后按第2汉字过滤确认键即主键盘区的数字键9。输入法软件***保留第2个汉字“楼”,删除其他组员汉字“高大厦”。
例2:准备输入汉字“祀”。输入汉字“祀”的汉语拼音输入码“si”之后,发现“si”的同音字太多,构造一个包含汉字“祀”的词组“祭祀”;按目标汉字确认键即主键盘区的数字键6;然后接着输入“jisi”,于是已经输入的汉语拼音输入码队列为“si6jisi”。输入法软件***判定数字6前后的输入码队列“si”和“jisi”分别是目标汉字和过滤词组的输入码。
遴选并确认过滤词组“祭祀”之后,输入法软件***保留目标汉字“祀”,自动删除过滤词组的其他所有组员汉字“祭”。

Claims (2)

1.一种基于词组的拼音输入法同音字过滤方法,包含词组事前过滤模式和词组事后过滤模式,其特征在于:
当汉字的拼音输入开始之前,就预感目标汉字同音字太多需要过滤时,进入事前过滤模式;输入包含目标汉字的词组的汉语拼音输入码,然后遴选出过滤词组;
如果目标汉字是过滤词组的首字(第1个汉字),按首字过滤确认键,拼音输入法***确认过滤词组的第1个汉字是准备输入的目标汉字;
如果目标汉字是过滤词组的尾字(最后1个汉字),按尾字过滤确认键,拼音输入法***确认过滤词组的最后1个汉字是准备输入的目标汉字;
如果目标汉字是过滤词组的第2个汉字,按第2汉字过滤确认键,拼音输入法***确认过滤词组的第2个汉字是准备输入的目标汉字;
如果目标汉字是过滤词组的其他中间字(不是第1个也不是第2个并且不是最后1个汉字),先按其他中间字过滤确认键,最后按目标汉字在过滤词组的顺序号对应的数字键,拼音输入法***确认过滤词组的以数字键的数字为顺序号对应的汉字是准备输入的目标汉字;
拼音输入法***确认了目标汉字之后,保留目标汉字自动删除过滤词组的所有其他组员汉字;
当输入汉字的汉语拼音输入码之后,发现目标汉字的同音字数量太多需要过滤时,进入事后过滤模式;
如果目标汉字是包含目标汉字的过滤词组的首字,则不需要重复输入该汉字的汉语拼音输入码,只需接着输入剩余其他组员汉字的汉语拼音输入码,遴选并确认过滤词组之后按首字过滤确认键,输入法软件***保留词组的首字即目标汉字,删除所有其他组员汉字;
当输入汉字的汉语拼音输入码之后,发现目标汉字的同音字数量太多需要过滤时,如果目标汉字不是包含目标汉字的过滤词组的首字;接着按下目标汉字确认键,再次输入完整的包含目标汉字的过滤词组的所有汉语拼音输入码,遴选并确认过滤词组之后,输入法软件***保留目标汉字,删除过滤词组其他所有的组员汉字。
2.根据权利要求1的一种基于词组的拼音输入法同音单字的过滤方法,其特征在于:构造的用于过滤同音字的词组的同音词没有或者尽可能的少。
CN201810086572.4A 2018-01-30 2018-01-30 基于词组的拼音输入法同音汉字过滤方法 Withdrawn CN108491084A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201810086572.4A CN108491084A (zh) 2018-01-30 2018-01-30 基于词组的拼音输入法同音汉字过滤方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201810086572.4A CN108491084A (zh) 2018-01-30 2018-01-30 基于词组的拼音输入法同音汉字过滤方法

Publications (1)

Publication Number Publication Date
CN108491084A true CN108491084A (zh) 2018-09-04

Family

ID=63343838

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201810086572.4A Withdrawn CN108491084A (zh) 2018-01-30 2018-01-30 基于词组的拼音输入法同音汉字过滤方法

Country Status (1)

Country Link
CN (1) CN108491084A (zh)

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO1995007505A1 (fr) * 1993-09-11 1995-03-16 Beijing Xiaojun Office Equipment Co., Ltd. Procede et dispositif a clavier destines a l'entree rapide de caracteres chinois dans un ordinateur ou autre
CN1138714A (zh) * 1995-10-26 1996-12-25 杨卫东 基于词组的汉字输入方法
CN101038508A (zh) * 2007-04-24 2007-09-19 河南省信息中心 Gb拼音输入法
CN106959764A (zh) * 2016-07-19 2017-07-18 敬永权 一种有助于正确书写汉字的形码输入法

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO1995007505A1 (fr) * 1993-09-11 1995-03-16 Beijing Xiaojun Office Equipment Co., Ltd. Procede et dispositif a clavier destines a l'entree rapide de caracteres chinois dans un ordinateur ou autre
CN1138714A (zh) * 1995-10-26 1996-12-25 杨卫东 基于词组的汉字输入方法
CN101038508A (zh) * 2007-04-24 2007-09-19 河南省信息中心 Gb拼音输入法
CN106959764A (zh) * 2016-07-19 2017-07-18 敬永权 一种有助于正确书写汉字的形码输入法

Similar Documents

Publication Publication Date Title
CN100549915C (zh) 去多义性语音输入***和方法
CN104364739A (zh) 基于韵列的键盘输入方法
CN102023716A (zh) 26或者27或者29或者30字母键元的数字键中文输入法
CN100462901C (zh) Gb拼音输入法
CN111880667A (zh) 音素同声近位常用汉字码输入法
JPS5880729A (ja) 漢字を入力する方法および装置
CN108491084A (zh) 基于词组的拼音输入法同音汉字过滤方法
CN1039132A (zh) 音形笔画综合编码汉字高速输入法及所用键盘
CN1259698A (zh) 汉字双笔王码输入法
CN101089794A (zh) 中文简易检索与文字快速输入
CN103809770A (zh) 优拼码汉字输入法
CN1472626A (zh) 嵌入式智能文字输入解决方法和装置
CN108091325A (zh) 一种基于姓氏的语音识别***及方法
CN108363498A (zh) 拼音输入法同音字词的过滤方法
CN104731360A (zh) 分层首拼编码法
CN106292399A (zh) 非特定人外语语音现场控制舵机的方法
CN106292400A (zh) 一种外语自然语文本现场控制的舵机装置
CN112083813A (zh) 一种汉字输入法
JP2016526740A (ja) 記号イメージ検索サービス提供方法及びこれに用いる記号イメージ検索用サーバ
CN102117120B (zh) 九笔汉字输入法及其字母与数字键盘
CN101561712B (zh) 一种应用十二键朝鲜文字键盘输入朝鲜文字的方法
CN111158498A (zh) 一种计算机汉字输入方法及***
CN1167994C (zh) 一二三四输入法
CN106293112A (zh) 一种非特定人外语语音现场控制的舵机装置
CN106292691A (zh) 一种汉语语音遥控的舵机装置

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
WW01 Invention patent application withdrawn after publication

Application publication date: 20180904

WW01 Invention patent application withdrawn after publication