CN1228554A - 汉语词符键盘拼形输入法 - Google Patents

汉语词符键盘拼形输入法 Download PDF

Info

Publication number
CN1228554A
CN1228554A CN 99100055 CN99100055A CN1228554A CN 1228554 A CN1228554 A CN 1228554A CN 99100055 CN99100055 CN 99100055 CN 99100055 A CN99100055 A CN 99100055A CN 1228554 A CN1228554 A CN 1228554A
Authority
CN
China
Prior art keywords
keys
key
chinese
input method
word
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN 99100055
Other languages
English (en)
Other versions
CN1133115C (zh
Inventor
秦川昊
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Individual
Original Assignee
Individual
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Individual filed Critical Individual
Priority to CN 99100055 priority Critical patent/CN1133115C/zh
Publication of CN1228554A publication Critical patent/CN1228554A/zh
Application granted granted Critical
Publication of CN1133115C publication Critical patent/CN1133115C/zh
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Images

Landscapes

  • Document Processing Apparatus (AREA)
  • Input From Keyboards Or The Like (AREA)

Abstract

汉语词符键盘拼形输入法是一种拼形类汉语字、词、符号输入方法,可解决目前拼形类汉字输入的以下几点缺陷:不能支持国标扩展码(GBK),或虽能支持,但重码率很高;不能输出图形符号;词汇不够丰富;编码长度长。该输入法共使用44个码元,198个汉字部件,支持GBK字库,可输出20902个汉字、六百多图形符号及24个标点符号,词汇丰富,达四万二千多条,重码率低,编码长度短,可广泛用于各行各业的汉语计算机输入。

Description

汉语词符键盘拼形输入法
本发明涉及一种汉语汉字、词汇及符号的计算机键盘输入法,更准确地说,是涉及一种支持汉语国标扩展码(GBK)汉字、词汇及符号的拼形类计算机键盘输入方法。
现有的汉语计算机键盘输入法大多不支持20902个汉字的国标扩展码(GBK)字库,只支持6763个汉字的国标码(GB)字库,支持GBK字库的输入法则重码率高;已有的计算机键盘输入法的词汇量在6000至25000条之间,而现代汉语中较常用的词汇多达40000余条;已有的拼形类输入法汉字编码码长一般为4键,码长较长;已有的拼形类键盘输入法不能输出“‰”、“℃”、“★”、“①”、“¤”等图形符号。
本发明全面支持GBK字符集,可输出20902个汉字,包括日文、韩文用汉字及香港地区专用汉字;可输出600左右现代汉语用图形符号、标点符号;词汇量丰富,有4万2千条;汉字编码长度短,GB字符集中6763个汉字的编码长度不超过3键,GBK字符集所独有的14139个生僻字编码长度为4键;将重码率控制在7%水平以内。本发明的目的是让使用者可以输入GBK字符集中的全部汉字及符号,能以词汇方式输入绝大部分的常用词汇,降低重码率,提高输入速度。
本发明在部件选取方面完全符合国家语言文字工作委员会1997年12月颁布的《信息处理用GB13001字符集汉字部件规范》的要求,即所有非成字部件及大部分成字部件选自该规范的基础部件表,其余成字部件由该规范的基础部件组合而成的。同时拆分汉字进行编码时,严格按照国家语言文字工作委员会和新闻出版署1997年4月颁布的《现代汉语常用字笔顺规范》规定的笔画顺序进行拆分编码。
本发明共使用44个码元(码元是输入法所涉及的计算机键盘上的键位),即10个数字键、26个英文字母键及“;”、“,”、“·”、“/”、“-”、“=”、“[”、“]”8个键,选用198个汉字部件(部件是组成汉字的元件,即笔画或几个笔画的固定组合)。198个汉字部件分布在10个数字键、26个英文字母键及“;”键共37个键上,“-”、“=”两键作为生僻字专用键,“[”、“]”两键作为符号专用键,“,”、“·”、“/”三键是标点符号编码用键。部件大致按起始笔画或外形分为横、竖、撇、捺、点、折、钩、方框8个组。钓组部件排列在“M”、“N”两键上,其余各组部件排列在左右相连的五个键位上,同一组部件的键位分布规律是:后面键位上的部件是前一键位上部件添加一笔或几笔形成的;意义相同或外形相近的部件在同一键位。198个部件的具体键位分布见说明书附图。
GB字符集中的6763个汉字的编码规则是:按汉字的笔顺,先后取第一、第二及最后部件所在的键位形成该字的编码,编码长度为三码。根据这些字在现代汉语中的使用频率,将其分为最常用字、常用字及普通字三类。最常用字有“我”、“吧”、“在”、“到”、“了”、“不”、“着”、“会”、“小”、“是”、“你”、“大”、“人”、““个”、“他”、“就”、“这”、“时”、“把”、“和”、“有”、“得”、“很”、“下”、“上”、“一”、“的”、“地”、“都”、“被”、“使”、“要”、“日”、“为”、“中”、“过”、“也”,共37个,编码长度为一键;常用字1200个,同时具备一个三键编码和一个两键编码,只取三键编码的前两位即形成该字的两键编码;普通字编码长度为三键。
GBK字符集所独有的14139个生僻字的编码长度为四键,前两码按笔顺取前两个部件所在的键位,并根据前两码对生僻字分组;第三码是生僻字专用键——“-”,如该组生僻字字数超过四十个,则超过部分的生僻字第三码是另一生僻字专用键——“=”;生僻字编码的第四码随机地取数字键、字母键及“;”、“,”、“·、“/”共40键中的每一个键。
本发明将24个标点符号(含冒号加双引号(:“”)这一标点符号组合)及15个常用符号集中由“,”、“·、“/”三个键来编码,区分使用频率,码长分别为一键、两键或三键。
符号分成序号、拼音(带声调的元音字母)、注音(注音符号)、表符(制表符)、俄文(俄文字母)、希文(希腊字母)、日平(日文平假名)、日片(日文片假名)、数符(数学符号)、图符(图形符号)、部件(非成字部件)十一个组。每组的组名是两个汉字,每个汉字编码的第一码形成该组所有符号的前两码;编码的第三码是符号专用键——“[”键,如该组符号数目超过四十个,则超过部分的符号的第三码是另一符号专用键——“]”;编码的第四码随机地取四排键(即数字、字母及“;”、“,”、“·”、“/”共40个键)中的每一个。
词组的编码规则是:两字词取每个字的前两码;三字词取第一、第二字的第一码及第三字的前两码;三字以上的词取第一、第二、第三及最后一字的第一码。
本发明通过以下方法控制重码率:一是增加码元个数,从而增大编码空间,如GB字符集中的汉字使用37个码元,编码空间迭5万(37的3次方),词组共使用37个码元,编码空间达187万(37的4次方);二是在大量的数据统计分析的基础上,将198个部件合理分布在37个键位上,使每个键位的使用率大体相当;三是普通字与生僻字、词组之间码长不相等,生僻字、图形符号、标点符号各有专用键,避免相互之间的重码。
比较现有的其他拼形类输入法,本发明在全面支持GBK字符集、可输出图形符号、词汇有四万二千余条、GB字符集汉字码长不超过三键的情况下将重码率控制在7%以内。
附图说明:
附图中每个方框表示一个键位,方框中第一行的符号是该键位的名称,下边列示该键位上的所有部件。右边突出的“-”、“=”键是生僻字专用键,“[”、“]”键是图形符号专用键,右下角的“,”、“·”、“/”三个键是标点符号编码专用键。

Claims (2)

1.一种拼形类汉语字、词、符号计算机键盘输入方法,根据字形特征,以汉字部件为元件,利用计算机键盘输出汉字、词汇及符号。其特征在于选用“钅”至“也”198个汉字部件,使用“-”及“=”键作为生僻字专用键,使用“[”及“]”键作为符号专用键,使用“,”、“·”及“/”三个键对现代汉语标点符号编码。
2.权利要求1所述的198个汉字部件,分成8个组,分布在10个数字键,26个英文字母键及“;”键共37个键位上。
CN 99100055 1998-09-15 1999-01-04 汉语词符键盘拼形输入法 Expired - Fee Related CN1133115C (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN 99100055 CN1133115C (zh) 1998-09-15 1999-01-04 汉语词符键盘拼形输入法

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
CN98117588 1998-09-15
CN98117588.0 1998-09-15
CN 99100055 CN1133115C (zh) 1998-09-15 1999-01-04 汉语词符键盘拼形输入法

Publications (2)

Publication Number Publication Date
CN1228554A true CN1228554A (zh) 1999-09-15
CN1133115C CN1133115C (zh) 2003-12-31

Family

ID=25744728

Family Applications (1)

Application Number Title Priority Date Filing Date
CN 99100055 Expired - Fee Related CN1133115C (zh) 1998-09-15 1999-01-04 汉语词符键盘拼形输入法

Country Status (1)

Country Link
CN (1) CN1133115C (zh)

Also Published As

Publication number Publication date
CN1133115C (zh) 2003-12-31

Similar Documents

Publication Publication Date Title
US6604878B1 (en) Keyboard input devices, methods and systems
JPS61240365A (ja) コ−ド化システムを用いる、特定のキイボ−ドを有する文字印書装置
CN85100837A (zh) 优化五笔字型编码法及其键盘
US20040243746A1 (en) Character generation system
CN104850240B (zh) 一种基于手机20键位输入法的显示键盘及其输入方法
CN101093417B (zh) 中文标准键盘及千字文置换输入法
CN103744532A (zh) 二十六偏旁部首字根中英和谐输入方法
CN101359259B (zh) 数码声韵双拼输入法
CN101135938B (zh) 一种汉字元拼双音输入方法
CN102750009B (zh) 一种无切换汉字输入法及键盘
CN101976117B (zh) 汉字输入法及汉字输入键盘
CN1228554A (zh) 汉语词符键盘拼形输入法
CN104503599B (zh) 一种基于36键位的藏文输入***
CN105912139A (zh) 一种模块化笔画编码汉字对应识别的方法
CN104536590B (zh) 基于西夏文声韵字根输入法的嵌入式软键盘***
CN1018096B (zh) 藏文输入编码法及其键盘
CN1023842C (zh) 一种计算机汉字编码的输入方法及其键盘
CN1260528A (zh) 计算机中文输入方法
CN1022350C (zh) 汉字字母编码输入法
CN103576891A (zh) 一键快打字
CN201698340U (zh) 一种中文拼音键盘
CN1409201A (zh) 计算机彝文字输入法
CN100428121C (zh) 五加加汉字输入法
CN118092683A (zh) 基于10键键盘及应用于小屏电子设备的形码全拼输入法
CN1164701A (zh) 霹雳码计算机汉字输入方法

Legal Events

Date Code Title Description
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
C06 Publication
PB01 Publication
C14 Grant of patent or utility model
GR01 Patent grant
C19 Lapse of patent right due to non-payment of the annual fee
CF01 Termination of patent right due to non-payment of annual fee