CN1015218B - 字根编码输入法及其设备 - Google Patents

字根编码输入法及其设备

Info

Publication number
CN1015218B
CN1015218B CN89108851A CN89108851A CN1015218B CN 1015218 B CN1015218 B CN 1015218B CN 89108851 A CN89108851 A CN 89108851A CN 89108851 A CN89108851 A CN 89108851A CN 1015218 B CN1015218 B CN 1015218B
Authority
CN
China
Prior art keywords
character
mentioned
root
district
key
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired
Application number
CN89108851A
Other languages
English (en)
Other versions
CN1043210A (zh
Inventor
郑易里
郑珑
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Zheng Long
Original Assignee
Individual
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Family has litigation
First worldwide family litigation filed litigation Critical https://patents.darts-ip.com/?family=4857770&utm_source=***_patent&utm_medium=platform_link&utm_campaign=public_patent_search&patent=CN1015218(B) "Global patent litigation dataset” by Darts-ip is licensed under a Creative Commons Attribution 4.0 International License.
Application filed by Individual filed Critical Individual
Priority to CN89108851A priority Critical patent/CN1015218B/zh
Publication of CN1043210A publication Critical patent/CN1043210A/zh
Priority to GB9025725A priority patent/GB2238641B/en
Priority to US07/618,410 priority patent/US5119296A/en
Publication of CN1015218B publication Critical patent/CN1015218B/zh
Expired legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F3/00Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
    • G06F3/01Input arrangements or combined input and output arrangements for interaction between user and computer
    • G06F3/018Input/output arrangements for oriental characters

Landscapes

  • Engineering & Computer Science (AREA)
  • General Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Human Computer Interaction (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Document Processing Apparatus (AREA)

Abstract

针对现有技术中存在问题,本发明提供一种新的计算机汉字输入方法和汉字信息处理设备。本发明总结出楷书汉字的六种基本笔画,选定与其对应的若干个传统常用部首作基本字根,每根有独立代码,将它们合理地配置在计算机键盘的26个英文键位上,使用本发明键盘,根据基本字根标准拆分汉字,按照本发明概念化运算化的码式,可以非常方便地进行汉字代码的输入操作。

Description

本发明涉及一种计算机汉字输入方法及汉字输入装置;具体地讲,本发明涉及一种利用26键拆根编码向计算机等数据处理设备输入汉字的方法及输入汉字的装置。
计算机在中国已经得到广泛的应用,作为信息载体的语言文字,特别是表达汉语信息的中文书写***如何在继承传统汉字科学规律的基础上,与计算机输入紧密结合,使之能方便地让人们掌握成为中华民族文化的一个部分,而不仅仅是少数专业人员的一种工具,这个问题一直难以完善解决。虽然近年来汉字编码方案已多达几百种,在社会上应用的也多达十多种,但都存在程度不同的问题,影响了汉字输入技术的提高和普及。
在现有技术中采用的各种汉字编码方案有拼音法、音形结合法、整字大键盘法、笔划代码法、笔形编码法以及表形符号编码法等。在这些现有技术中,有的重码多;有的学用困难;有的好学但输入速度较慢;有的输入速度快,但理论概念混乱,不成体系;有的把汉字结构分解过细所需构件符号太多;有的不能仅用国际间通用的26个英文键位。总之在实用时都存在着程度不同的问题。虽然不少汉字编码法依靠计算机人工智能作用弥补欠缺,但同时也暴露了这些方法本身的不够合理之处。
汉语拼音已经列入中国小学的教学大纲,人人都学过,因此人们最容易接受拼音编码法。但是拼音编码法按拼音方式输入,输出的却不是拼音文字,而是汉字,而且同音字多,重码多。虽然采用了种种 软件设计方法尽量加以弥补,但由于中国方言杂多,人们不认识或者读不准音的字很多,使用受到一定限制。在台湾,汉字只标有“注音符号”,不标注用英文字母表示的拼音符号,所以拼音编码在台湾及一些东南亚国家推行也有一定困难。
音形结合法需要掌握汉字的读音和字形两种因素,用该方法输入汉字时人脑要多经过一道分辨和综合的程序,使用也不很方便。
本发明的目的是提供一种计算机汉字输入方法,该方法根据对汉字历史演进的科学分析,分清独体字(象形字和指事字)、部首(形声会意字中作为意旁的独体字)和字根(精选出的、按字型序位化的独体字)三者的一致性和互异性,把三者见字即知的特征发掘出来,形成楷书汉字编码的科学体系,而且从***的观点出发来考虑整个体系的最优化。本发明提出的汉字输入方法是优选汉字传统部首作为基本字根(单根),依据起笔的笔形及其他构形相似的特征将其分成“一、丨、丿、 ”六类,按英文字母***设置在计算机通用键盘的二十六个键位上,形成一个按基本字根拆根编码的方法及其输入键盘。本发明提出的字根结构和字型规律是汉字按基本字根标准拆分成单根的依据。本发明提出的规则划一的取码公式是汉字代码最多用四个字母及减少重码的保证。操作人员不但容易学习、记忆和使用,而且有利于普及。
本发明的另一个目的是提供一种执行上述汉字输入方法的汉字信息处理设备,该设备能方便地、准确地输入汉字信息,并对所输入的汉字信息进行存贮、显示、打印及传输。
利用本发明的编码方法和输入键盘给数千或上万个汉字编码后,可得到按英文字母排序的码本。由于每个单根都有自己独立的代码, 在排序码本上,汉字的有序特征充分显露,首根相同的汉字按其代码相对集中,而首根又多是传统部首,于是每个汉字依据字根排列方式有自己合理的序位。这一发掘对汉字信息处理技术的标准化有重要作用,也使得该编码更具通用性。
根据本发明,一种计算机汉字输入方法由下述步骤组成:首先,将楷书汉字的基本笔画总结为“横(一)、竖(丨)、撇(丿)、捺(
Figure 89108851_IMG13
)、弯( )、拐(
Figure 89108851_IMG15
)”六种;优选出二十六个最常用部首,根据起笔第一笔笔形将它们分为上述“一、丨、丿、
Figure 89108851_IMG16
”六类,按英文字母的自然序位,每个部首依次用一个英文字母表示,叫作一码主根。将一码主根配置在通用计算机键盘26个英文键名的键位上,故又叫键名根。一码主根分别形成二十六个根区。在部分根区内,再选定一至二个与键名根形状相关的常用部首作为二码主根。同一根区的二码主根与一码主根一起配置在上述键盘的同一键位上,由代表一码主根的英文字母加上另一个固定的英文字母表示;再选定若干个常用部首及个别偏旁作副根,分别附属在与其形状相关的一码主根根区内,该副根由代表该一码主根的英文字母(即根区的区码)加上另一个表示其方位的英文字母(即位码)表示。一码主根(键名根)、二码主根和副根一起形成一个基本字根(单根)集,用作汉字编码总纲。这个字根集的所有字根都是单根,本发明就以这些单根为单位给汉字编码输入计算机。编码或输入时,按照先左后右;先上后下;先左右后上下的视读根顺将汉字根据字型规律按基本字根集的标准拆成线性排列的单根,然后取代表各单根的英文字母做为该汉字的代码。但每个汉字最多只能取四个英文字母做代码,因此要按取码方式-码式取舍单根及代码。
本发明码式概述如下:
汉字拆成单根后,表示首根的英文字母要照实全部取用,不能舍略,在此前提下,有两种情况:
1.汉字各单根字母数的总和不超过四个时,不论首根用几个字母表示,第2或第3或第4单根的字母都照实取。但为了输入快捷,在汉字只有三个单根时,第2单根只取第一个字母。
2.汉字各单根字母数的总和超过四个时:
若首根用一个字母表示,再分别取第二个单根和最末两个单根的各一个字母(区码)。但在单字只有三个单根时,末根可取2个字母(区码加位码);
若首根用二个字母表示,再分别取最末两个单根的各一个字母(区码)。
关于本发明码式的详细图式及示例见12页<表3>和13页<表4>。
最后,在上述英文键盘上依次向计算机输入所选取的代表汉字的一至四个英文字母,通过计算机中的转换装置将其转换为一个内码序列,计算机据此从一个汉字库中选出该汉字,并执行显示、打印、传输或存贮等指令。
本发明的详细情况,可以从附图和下面给出的最佳实施例之一得到清楚的了解。
本发明的附图说明:
图1楷书汉字的六种基本笔画;
图2简体汉字的一种基本字根(单根)总表,
图2A简体汉字另一种基本字根(单根)总表;
图3复根的拆分示例;
图4楷书汉字的字型及根位顺序;
图5汉字信息处理设备的框图;
图6汉字信息处理设备中的一种中文键盘,
图6A汉字信息处理设备中的另一种中文键盘;
图7繁体汉字的一种基本字根(单根)总表,
图7A繁体汉字的另一种基本字根(单根)总表;
下面参照附图,详细介绍本发明其中的一个实施例。
在此实施例中,首先要明确本发明与汉字的演化发展有着密不可分的关系。初造汉字或象形或指事,囫囵一体不可分拆,各为一“形、音、义”单元,文字学中叫做独体字。汉代许慎把古代独体字归纳为五百多个。独体字可以合成成千上万个合体字。一般把形声会意字中那个做为意旁的独体字叫做“部首”。汉字楷化后,情况变化不少。现在我们把那些精选出来按字型序位化的独体字叫做字根。字根在单字中按字型定位排序,极便于按根形取码输入计算机或按码排序检索。单字中的首根永远处于起笔的位置,概念简明准确,而现在汉字检索法中的“部首”则无此优点,但却是选根排序的优良素材。
本发明认为楷书汉字的成形单元是笔画,成字单元是字根。
图1表示本发明所总结出的楷书汉字的六种基本笔画,即“一、丨、丿、
Figure 89108851_IMG17
”。六种笔画中,“一”与“丨”,“丿”与“ ”,“ ”与“
Figure 89108851_IMG20
”两相对应,规律严整。本发明认为楷书中的“点”笔不是圆点,而是“短撇”和“短捺”,分别叫做“撇点(丿)”和“捺点(丶)”。笔画中弯后带拐的“乙”、“
Figure 89108851_IMG21
”作弯笔处理;拐后带弯的“ ”、“
Figure 89108851_IMG23
”作拐笔处理。
图2是本发明简体汉字的一种基本字根(单根)表,图2A是本发明简体汉字的另一种基本字根(单根)表。本发明实施例说明中所举示例都按图2中的代码。本发明优选26个最常用惯用的部首,根据起笔一笔的笔形将它们分成“一、丨、丿、
Figure 89108851_IMG24
”六类,按 英文字母的自然序位,每个部首依次用一个英文字母作代码,叫一码主根。将一码主根配置在通用计算机键盘26个英文键名的键位上,故又叫键名根。一码主根形成26个根区,起笔“一”类是根区A-H;起笔“丨”类是根区I-L;起笔“丿”类是根区M-R;起笔“
Figure 89108851_IMG25
”类是根区S-W;起笔“
Figure 89108851_IMG26
”类是根区X-Y;起笔“
Figure 89108851_IMG27
”类是根区Z。“一、丨、丿、
Figure 89108851_IMG28
”作为单笔根使用时,代码分别为“A、I、M、S、X、Z”。此外,在部分根区选定一至二个具有根形代表性的常用部首作二码主根,即每根用二个英文字母作代码,一个区码加一个位码,区码用所在根区的区码,位码一律用一码主根“扌”的区码表示,即“F”(按图2),或“D”(按图2A)。一码和二码主根共49-52个,其代码是硬性规定的,必须首先记熟。此外还选定一百余个常用部首及少量偏旁作副根,按起笔构形分别把它们归属到各主根根区内,每根也用二个英文字母作代码,区码就用所在根区的区码,位码由各副根构形中含有的主根成分决定,以便在联想的作用下很快记熟。就这样,160-180个单根形成一个一码主根统帅下二码主根及二码副根各就各位的严整体系,这个体系联想性明显,见根即可判知其码,极便记忆。例如:副根“页”的代码是“GN”,因为一码主根“石”-G统属着G根区,二码主根“厂”表示了该根区根形的特征,而“页”,有起笔“厂”的特征,构形中又含有“人-N”的成分,所以纳入G根区N位。由此看出,只要记住49-52个主根的区码,一百余个副根的代码是容易记忆的。
在副根中,把那些具有外包围构形的字根叫“包根”,其余的叫“杂根”。有了包根,在字型分类里,就可以把“
Figure 89108851_IMG29
”的结构作为上下型(图式:
Figure 89108851_IMG31
)处理,例如:“式”字,拆作先 “弋”后“工”(先上后下)。把“
Figure 89108851_IMG32
”的结构作为左右型(图式:
Figure 89108851_IMG33
)处理,例如:“边”字,拆作先“辶”后“力”(先左后右),从而起到简化字型和规范字型的作用。杂根数量较多,但不需死记,虽然每根组字频度不很高,但有了杂根见字就可知根知码,便于实现高速盲打。
字根分为单根和复根。字根有几百之多,但本发明只能适用其中最基本的列入字根表,叫作单根,而把那些未列入字根表的字根看成是由字根表上的单根结合而成,叫作复根。就某字根而言是作为单根还是作为复根是相对的,在人为作用下可以变化。
单根由笔画构成,其笔画与笔画之间的结构方式有单笔、散笔、连笔、交笔和杂笔五种,由<表1>所示。
<表1>    笔画构成单根的方式
名称    结构方式    说明    实例
单笔单根 单式 单独一笔,无其他相 一、丨、丿、
关笔画
Figure 89108851_IMG35
、乙.
散笔单根    散式    笔画之间互无接触    二、三、冫、氵、
丷、
Figure 89108851_IMG36
、小.
连笔单根    连式    笔画与笔画间连接于    匚、冂、日、亻、
一点或几点    衤、阝、、弓.
交笔单根    交式    笔画与笔画间相交于    扌、丰、九、车、
一点或几点    也、女.
杂笔单根    杂式    笔画与笔画间有连有    西、牙、戊、田、
交    衣、木.
复根中单根与单根的结合方式有连式、交式、夹式、叠式四种,如<表2>所未:
<表2>    单根结合成复根的方式
名称    结合方式    说明    实例
连式复根    连接式    一个单笔单根与    天(“一、大”相连)
其他单根相连接    韭(“非、一”相连)
久(“、 ”相连)
交式复根    交叉式    单根与单根之间    末(“一、木”相交)
笔画互有交叉    未(“二、小”相交)
夷(“大、弓”相交)
夹式复根    夹心式    单根的上下或左    亘(“二”夹“日”)
右之间夹有其他    畺(“三”夹“田、田”)
单根 囊(“衣”夹“口、口、
Figure 89108851_IMG38
”)
叠式复根    重叠式    二个相同的单根    林(“木、木”相叠)
(或复根)互相    圭(“土、土”相叠)
重叠
Figure 89108851_IMG39
(“夫、夫”相叠)
在汉字字体结构中,单根是一个不可分拆的字根单元,例如:“湘”字拆成“氵、木、目”三个单根就可以编码。而复根是一个可以分拆的字根单元,要把它按叠、夹、交、连的结合方式拆成单根才能参加编码。复根为数不多,只要记牢了单根,无论复根是单独成字或是出现在字体结构中,都能迅敏地将它拆成单根,例如:“整”字,由三 个字根单元构成,其中“束”是“木、口”相交复根;“攵”是单根;“正”是“一、止”相连复根。
图3是复根拆分示例,每个复根拆出的应是最少的单根数。
图4是汉字的字型及根位顺序。汉字字体结构的字根单元与单元相互间按一定配列规律形成的一定结构类型,简称“字型”。有单体型和散型两类。单体型其结构只有一个字根单元,在这个字根单元中的字根可能是单根也可能是复根,因此有单根单体型(一个单根构成)和复根单体型(由二个或三、四个单根构成)两种,无论单根还是复根在字体内都视为一个字根单元,因此单体型图式为:囗。散型其结构是各个字根单元之间按一定间隙形成一定的配列规律,根据单元位置的排列方式可分为左右型和上下型两种,由图3看出左右型和上下型的图式两相对应,规律严整。在汉字中,大约90%以上的字都是散型字,单体型字为数不多。
图4图式中的数字表示字根单元的顺序,叫作根序。根序取决于视读根顺,符合传统习惯,例如“整”字,图式: ,拆作“束、攵、正”三个字根单元,依次叫作“首根、次根、末根”,其中一单根二复根。由于本发明揭示出汉字字型及根序的规律,因此方块汉字的拼读效应将象拼音文字那样日益显露。
值得注意的是,由于存在复根,各型汉字中的字根单元数不一定等于单根数,所以在说明本发明的编码规则-码式时,用“单根数”这一概念,例如上述的“整”字,有三个字根单元,但要拆作“木、口、攵、一、止”五个单根才能编码。
编码就是根据字型规律和单根的结合方式把汉字按字根表的标准,依根顺逐个拆成单根,呈线式展开为国际通用的英文字母代码,然后 按编码规则取码的过程。
本发明的编码规则是:
1.把汉字拆成单根,以单根为取码单位;
2.拆出的单根按“先左后右”、“先上后下”、“先左右后上下”的视读根顺排列先后。
3.每个汉字最多只能取四个英文字母做代码,要按照取码公式-码式取舍单根及代码。
本发明的码式概念简述如下:
汉字拆成单根后,首根的代码照实取。意思是:处于起笔位置的单根叫首根,首根代码的区码和位码要全部取用,不能有所舍略。在此前提下有两种情况:
1.汉字各单根代码数的总和不超过四个时,不论首根的代码是一码还是二码,第2或第3或第4单根的代码都照实取,但为了便于快速输入,在单字只含有三个单根时,第2单根只取区码一码,其位码可舍略
(即)    (取作)
例如:推-扌    隹→FOI
F    OI
栗-西    木→AOE
AO    E
猖-犭    日    日→PFKK
PF    K    K
谙-讠    立    日→SSK
S    SU    K
2.汉字各单根代码数的总和超过四个时:
若首根是一码单根,则取第2和最末两个单根的区码各一码,其余舍略;但在单字只含有三个单根时,末根可取二码(区码加位码),
例如:樟-木    立    日    十→ESKD
E    SU    K    DF
攀-木    ×    ×    木    大    手→ENEM
E    NF    EF    MF
曼-日    罒    又→KLYS
K    LU    YS
若首根是二码单根,则取最末两个单根的区码各一码,
例如:剽-西    示    刂→AOBK
AO    BP    KF
廓-广    亠    口    子    阝→TGYY
TG    YA    Y
本发明的码式符号定义见<表3>,码式及示例见<表4>。
<表3>码式符号定义
符号    定义    符号    定义
① 单根的一个区码 单根的代码舍略
②    单根的一个区码加一个位码    -    “即为”
某序位单根的代码N=1或N=2 → “取作”
n    单根的序位号n=1,2,3……10
<表4>码式及示例
Figure 89108851_IMG43
附注:
1.为减少不必要的重码,本发明采取以下几条措施:
(1).两个一码主根构成的单字,取码后加“VV”,
例如:柘-木    石→EGVV
E    G
(2).一个一码主根和一个高频字构成的单字,取码后加“V”
例如:侑-亻    有→OFV
O    ER
(3).一码主根作为单字使用时,在其代码后加“A”,
例如:作为单字使用时,“石-GA”;
作为单根参加编码时,“石-G”;
(4).一码主根“木、石、口、日、水”作为纯上根参加编码,要在其代码后加“V”,
例如:只-口    八→JVNS
J    NS
副根“山”作为纯上根参加编码,要将其位码“Z”改为“V”,
例如:巅-山    十    且    八    页→IVNG
I(Z)V    NS    GN
(5).设置同位根:对于笔形相同的单根;把其中的一个(或几个)作为另一个的同位根处理,在其代码后边加A(或加B或C) 就成为同位根的代码,例如:“刀”是“力”的同位根,“力-XF”,“刀-XFA”;又如:“田-KI”,“由-KIA”、“甲-KIB”、“申-KIC”。
同位根共有18个,未计入基本字根(单根)表的总数内,但在表中列出其代码;
同位根的码式为:③
Figure 89108851_IMG44
→③①
②③→②②
①③→①③
Figure 89108851_IMG45
2.为了认码方便
(1).若干个单根可与其笔形相似的单根用同一代码,免去进一步将其拆分的麻烦,例如:“冂-LF”,所有的“
Figure 89108851_IMG46
、冋、冏、 、冈、网、岡、罔、”都用“LF”作代码;又如:“羊-UC”,“
Figure 89108851_IMG49
、、 ”都用“UC”作代码;
当它们单独成字时,按编码规则编码例如:网-LFNN
(2)一码主根中的:“土-B”,“士-B”;
“日-K”,“曰-K”;
“人-N”,“入-N”;
作为单字使用时:“土-BA”,“士-BAA”;
“日-KA”,“曰-KAA”;
“人-NA”,“入-NAA”;。
3.基本字根(单根)表中,黑体实线表示单根,虚线表示给该根命名的字,例如:单根“”,其名字叫“斤”。
本发明为了适应计算机专业人员高速输入汉字的需要,设置了一、 二、三级简码。每一个键位上都安排一个使用频度特高的单字,其输入码为所在键打一下加空格,称为一级简码,一级简码可直接参与编码。原键位上的键名根在作为单字使用时,除打本键外,后边还要加打“A”和空格键。约有450个汉字只取用其全部编码的前两码加打空格键输入,称为二级简码。有几千个汉字采用全部编码的前三码加打空格键输入,称为三级简码。使用简码时,汉字的全码输入方式仍同时具备。同理,也可以只使用一级简码,其余按全码输入。
为提高输入速度,本发明有数万条通用词语码,也可按不同领域的需要编入有关专业的常用词语。词语码与单字码可以交替输入。词语码的编码形式与单字码一致,不论词语由几个单字组成,一律用一至四个英文字母做代码。
一字词就取该单字的代码;
两字词,取每个字的首根和次根的区码各一码,例如:
消    遥-氵        辶    爫→VPWQ
V    PI    W    QV
丰    富-丰    宀    一→CCTA
CI    TR    A
三字词,取前两字首根的区码各一码,取第三个字的首、次根的区码各一码,例如:
解放军-    方    冖    车→RSRH
RF    SR    RF    HD
四字词,取各字首根的区码各一码,例如:
轻重缓急-车    千    纟    →HMZR
BB    MD    Z    RF
多字词,取一、二、三、末四个字的首根的区码各一码,例如:
最高人民法院-日    亠    人    阝→KSNY
K    S    N    Y
图5表示本发明汉字信息处理设备的框图。其中包括一个本发明的键盘10、一个中央处理部件CPU20、一个转换装置30、一个汉字库40、一个显示装置50和一个打印装置60。
操作人员按照本发明的汉字输入法将一个汉字的代码由键盘10输入汉字信息处理设备。在CPU    20的控制之下,该汉字的代码被转换装置30(可以是内存中的一个映射表)转换为一个内码序列。利用该内码序列,便可以在汉字库40中唯一地确定该汉字。在CPU    20的控制下,可以对该汉字进行显示、打印、存贮和传输等项操作。
图6是本发明的一种键盘的示意图,图6A是本发明的另一种键盘示意图。该键盘的设计原则是:26个一码主根按其第一笔笔画特征分类排列后,依照英文字母的自然顺序取代码,分别固定在26个键位上,一个键位代表一个根区,键位的英文键名就是区码。黑体字是一码主根(即键名根),仿宋体字是二码主根(其区码用该键键名的英文字母表示,位码用固定字母“F”(按图6),或“D”(按图6A)表示,也即用一码主根“扌”的区码表示)。可以用本发明键盘键位的单面不干胶标签贴在现有计算机的键位上,把现有键盘改为本发明的键盘使用。
本发明编码的重码约250对,占国标6763个汉字的3.6%,其中95%以上是两个字相重。在遇到重码时,出现短报警声,这时出 现在显示屏幕编辑位置上的是重码中较常用的那个字。若用这个字,可继续键入下文。若不用这个字,则在提示行中选择所需的字,依其序号键入数字,该字便可替代编辑位置上的那个重码字。
对于复合根拆分及根序容易产生歧议的单字,本发明给予容错码。
键盘输入汉字代码时,若输入码无对应的字,即出现空码时,光标在原位置不动,并可听到长声报警,这时可重新键入正确的代码,或击提示码。
图7是本发明的一种繁体汉字字根(单根)总表,图7A是本发明的另一种繁体汉字字根(单根)总表,本发明所提出的汉字构形的理论体系、编码方法及输入键盘同样适用于楷书繁体汉字,这时只需将简体汉字字根(单根)总表中的简体字根变换成繁体字根,如“区”改换成“區”,“页”改换成“頁”,其中有的代码也相应变动,再加上6个繁体字常用的单根,就能形成处理繁体汉字的字根(单根)总表以及相同的汉字输入方法和汉字信息处理设备。
以上说明了本发明的一个具体实施方案,必须指出,本发明不仅仅限于上面给出的方案,在本领域中的技术人员根据本发明的构思,可以做出不脱离本发明本质的多种变型方案。因此本发明的保护范围根据所附的权利要求而定。

Claims (8)

1、一种字根编码法的汉字单字和词语的计算机输入***,其特征在于通过具有26个字符的专用键盘或用汉字字根定义键位的ASCLL通用键盘,依据汉字的单根特征;进行汉字单字和词语的计算机输入,输入一个单汉字或词语的代码时,最多只能敲击4个字符键。汉字输入步骤包括:
首先,将欲输入的单汉字分解成相应的单根;
(1)当上述单汉字所分解出的单根代码字符的总数不超过4个时;
A.敲击上述输入键盘上相应的一码主根键或二码主根键或副根键,输入上述单汉字首根的区码或区码加位码;
B.敲击上述输入键盘所述相应键,输入上述单汉字第二单根的区码或区码加位码;
C.敲击上述输入键盘所述相应键,输入上述单汉字第三单根的区码或区码加位码;
D.敲击上述输入键盘所述相应键,输入上述单汉字第四单根的区码;
其中,若上述单汉字仅由三个单根组成,且其第二单根代码是二码主根或副根时,上述步骤(B)仅输入其区码。
(2).当上述单汉字所分解出的单根代码的字母总数超过4小时;
A.若上述单汉字的首根为一码主根,则
(A).敲击上述输入键盘上相应键,输入上述单字首根的代码;
(B).敲击上述输入键盘上相应键,输入上述汉字第二单根的区码;
(C).敲击上述输入键盘上相应键,输入上述单汉字次末单根的区码;
(D).敲击上述输入键盘上相应键,输入上述单汉字末根的区码;
其中,若上述单汉字仅由三个单根组成时,上述步骤(C)中的次末根即成为三单根字的末根,若该末根是二码主根或副根时,则要输入其区码加位码。
B.若上述单汉字的首根为二码主根或副根,则
(A).敲击上述输入键盘上的相应键,输入上述单汉字首根的区码加位码;
(B).敲击上述输入键盘上的相应键,输入上述单汉字的次末单根的区码;
(C).敲击上述输入键盘上的相应键,输入上述单汉字的末单根的区码;
上述单汉字,凡是出现重码时,要按提示敲选择键;凡是由不足4码组成时,要敲空格键以示单汉字输入结束;
2、根据权利要求1所述的***,其特征在于可以依照汉字的单根特性进行汉字词语的计算机输入,词语的输入步骤包括:
首先,将欲输入汉字词语中的汉字分解成相应的单根:
(1).两字词输入:
A.利用上述键盘上的一码主根或二码主根或副根的相应键,敲击上述两字词第一个字首根的区码;
B.利用上述键盘上述相应键,敲击上述两字词第一个字次根的区码;
C.利用上述键盘上述相应键,敲击上述两字词第二个字首根的区码;
D.利用上述键盘上述相应键,敲击上述两字词第二个字次根的区码;
(2).三字词输入:
A.利用上述输入键盘上述相应键,敲击上述三字词第一个字首根的区码;
B.利用上述键盘上述相应键,敲击上述三字词第二个字首根的区码;
C.利用上述键盘上述相应键,敲击上述三字词第三个字首根的区码;
D.利用上述键盘上述相应键,敲击上述三字词第三个字次根的区码;
(3).四字和四字以上词的输入:
A.四字词输入:
利用上述输入键盘上述相应键,依次敲击上述四字词之第一、第二、第三和第四个字首根的区码各一键;
B.四字以上词语的输入;
利用上述输入键盘上述相应键,依次敲击第一、二、三和第末个字的首根的区码各一键;
凡上述词语出现重码时,要按提示敲选择键。
3、根据权利要求1所述的***,其特征在于单汉字和词语可以采用简码输入,其步骤包括:
(1).一级简码输入:
敲击键盘上的一个英文字符键,就可出现用该英文字符命名的使用频度最高的一个单汉字,并敲空格键以示该单汉字输入结束;
(2).二级简码的输入:
有二级简码的单汉字和词语有下述三种情况:
A.一码主根中的成字字根做为单字使用时,除了敲击键盘上表示该主根的一个字符键外,还需在其后加击“A”键及空格键。
B.二码主根和副根中的成字字根做为单字使用时,可直接敲击键盘上表示该根的一个区码键加一个位码键及空格键;
C.选择若干个较常用的单汉字,利用键盘上相应键,依次敲击该汉字的第一个单根的区码键和第二个单根的区码键及空格键;
D.选择若干个较常用的词语,利用键盘上相应的键,依次分别敲击第一个字的第一个单根的区码键和第二个字的第一个单根的区码键及空格键;
(3).三级简码输入:
A.利用键盘之相应键,依次敲击单汉字第一、二、三个单根的各一区码键;
B.敲击重码选择键或敲击空格键;
4、根据权利要求1所述的***,其特征在于当单汉字仅由两个一码主根构成时,在输入其全编码后,要加击区别键两次,区别键选用一码主根“氵”的区码键“V”,即加击“V”键两次,以避免与二码主根或副根重码;
5、根据权利要求1或4所述的***,其特征在于当单汉字由一个一码主根和一个高频字组成时,在输入其全编码后,要加击“V”键一次。
6、根据权利要求1所述的***,其特征在于用设置同位根的办法处理笔形相同的单根。同位根就是在原单根代码后加“A”(或“B”或“C”)键。
7、根据权利要求1所述的输入***,其特征在于每个一码主根作为字根参加编码时,敲击所在键位的英文字符作为代码输入;当每个一码主根作为单字输入时,敲击所在键位的英文字符之后,要再敲击“A”键和空格键;
8、根据权利要求1-7中的任一个***,其特征在于将26个一码主根依其第一笔的笔画特征分类后,按英文字符的自然顺序分别定义在ASCLL通用键盘的26个字符键上,形成确定的26个根区,其中:
第一笔画为“一”类是A-H键,形成8个根区;
第一笔画为“丨”类是I-L键,形成4个根区;
第一笔画为“丿”类是M-R键,形成6个根区;
第一笔画为“丶”类是S-W键,形成5个根区;
第一笔画为“
Figure 89108851_IMG2
”类是X-Y键,形成2个根区;
第一笔画为“ ”类是Z键,形成1个根区;
键盘上各键之英文键名与一码主根及二码主根的对应关系为下:
英文键名  一码主根  二码主根
A  一
B  土  二
C  王  三
D  扌
E  艹  十
F  木  酉
G  石  (大)
H  匚(臣)  七
I 虫 卜(
Figure 89108851_IMG4
J  口  囗
K 日 刂(
Figure 89108851_IMG5
L  目  冂(同)
M  
N 亻 川(
Figure 89108851_IMG6
O  八  人
P  金(钅)  斤()
Q  月  几
R  角  儿
S  言(亠)
(讠)
T  疒(病)  冫
U  忄()  丷
V 氵(
Figure 89108851_IMG8
W  之(辶)  宀(定)
X 马
Y  阝(廴)()  刀  乙
Z 纟(乚)(
Figure 89108851_IMG10
) 巛(巜)(
Figure 89108851_IMG11
CN89108851A 1989-11-27 1989-11-27 字根编码输入法及其设备 Expired CN1015218B (zh)

Priority Applications (3)

Application Number Priority Date Filing Date Title
CN89108851A CN1015218B (zh) 1989-11-27 1989-11-27 字根编码输入法及其设备
GB9025725A GB2238641B (en) 1989-11-27 1990-11-27 Method and apparatus for inputting radical-encoded chinese characters
US07/618,410 US5119296A (en) 1989-11-27 1990-11-27 Method and apparatus for inputting radical-encoded chinese characters

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN89108851A CN1015218B (zh) 1989-11-27 1989-11-27 字根编码输入法及其设备

Publications (2)

Publication Number Publication Date
CN1043210A CN1043210A (zh) 1990-06-20
CN1015218B true CN1015218B (zh) 1991-12-25

Family

ID=4857770

Family Applications (1)

Application Number Title Priority Date Filing Date
CN89108851A Expired CN1015218B (zh) 1989-11-27 1989-11-27 字根编码输入法及其设备

Country Status (3)

Country Link
US (1) US5119296A (zh)
CN (1) CN1015218B (zh)
GB (1) GB2238641B (zh)

Families Citing this family (47)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CA2006163A1 (en) * 1988-12-21 1990-06-21 Alfred B. Freeman Keyboard express typing system
US5295238A (en) * 1991-04-30 1994-03-15 Highlights For Children, Inc. System, method, and font for printing cursive character strings
CN1026525C (zh) * 1992-01-15 1994-11-09 汤建民 智能五笔双拼码计算机汉字输入方法
US5488363A (en) * 1993-03-03 1996-01-30 Peng; Jingmin Direction code for encoding Chinese characters using English alphabet and inputting method thereof
US5305207A (en) * 1993-03-09 1994-04-19 Chiu Jen Hwa Graphic language character processing and retrieving method
US5790055A (en) * 1994-09-22 1998-08-04 Yu; Cho Jen Method for encoding chinese and japanese ideographic characters for computer entry, retrieval and processing
US6041137A (en) 1995-08-25 2000-03-21 Microsoft Corporation Radical definition and dictionary creation for a handwriting recognition system
CN1067777C (zh) * 1995-09-14 2001-06-27 陆建南 意形码汉字输入法
US5903861A (en) * 1995-12-12 1999-05-11 Chan; Kun C. Method for specifically converting non-phonetic characters representing vocabulary in languages into surrogate words for inputting into a computer
US5802482A (en) * 1996-04-26 1998-09-01 Silicon Graphics, Inc. System and method for processing graphic language characters
US6157390A (en) * 1996-09-20 2000-12-05 Dynalab (S) Ltd. Stroke-based font generation
US6151032A (en) * 1996-09-20 2000-11-21 Dynalab, Inc. Stroke-based glyph-outline font generation in low/high resolution space
US5831636A (en) * 1996-11-26 1998-11-03 Motorola Method for compressing ideographic characters for storage decompression and display and a communication device therefor
US6007339A (en) * 1996-12-09 1999-12-28 Eten Information System Co., Ltd. Apparatus and method for inputting mandarin phonetic symbols by using sixteen keys
US6292768B1 (en) * 1996-12-10 2001-09-18 Kun Chun Chan Method for converting non-phonetic characters into surrogate words for inputting into a computer
CN1066272C (zh) * 1997-01-03 2001-05-23 邵永新 六笔十矩阵计算机汉字输入方法及其键盘
US6003049A (en) * 1997-02-10 1999-12-14 Chiang; James Data handling and transmission systems employing binary bit-patterns based on a sequence of standard decomposed strokes of ideographic characters
US5999706A (en) * 1997-04-28 1999-12-07 Pitney Bowes, Inc. Method and apparatus for substituting a 2-byte font character standard in a printer
US7257528B1 (en) 1998-02-13 2007-08-14 Zi Corporation Of Canada, Inc. Method and apparatus for Chinese character text input
CN1156741C (zh) * 1998-04-16 2004-07-07 国际商业机器公司 手写汉字识别方法及装置
US6094666A (en) * 1998-06-18 2000-07-25 Li; Peng T. Chinese character input scheme having ten symbol groupings of chinese characters in a recumbent or upright configuration
DE69840208D1 (de) * 1998-07-08 2008-12-24 D D B Entpr Co Verfahren und Vorrichtung zur Erzeugung von chinesischen Zeichencodes und Kommunikationscodes
US6687879B1 (en) * 1998-07-09 2004-02-03 Fuji Photo Film Co., Ltd. Font retrieval apparatus and method using a font link table
US6219448B1 (en) * 1999-06-25 2001-04-17 Gim Yee Pong Three-stroke chinese dictionary
US6501475B1 (en) 1999-10-22 2002-12-31 Dynalab Inc. Glyph-based outline font generation independent of resolution
US6349147B1 (en) * 2000-01-31 2002-02-19 Gim Yee Pong Chinese electronic dictionary
US6661417B1 (en) 2000-08-28 2003-12-09 Dynalab Inc. System and method for converting an outline font into a glyph-based font
US6393445B1 (en) * 2001-01-04 2002-05-21 Institute For Information Industry System for transforming Chinese character forms in real-time between a traditional character form and a simplified character form
US7319950B2 (en) * 2001-04-10 2008-01-15 Chang Po Liu Automated word processor for chinese-style languages
US6947771B2 (en) * 2001-08-06 2005-09-20 Motorola, Inc. User interface for a portable electronic device
KR20030021775A (ko) * 2001-09-07 2003-03-15 이관동 중문자 입력장치 및 방법
KR20040011816A (ko) * 2002-07-30 2004-02-11 이관동 중문자 입력장치 및 방법
US20050027534A1 (en) * 2003-07-30 2005-02-03 Meurs Pim Van Phonetic and stroke input methods of Chinese characters and phrases
US7395203B2 (en) * 2003-07-30 2008-07-01 Tegic Communications, Inc. System and method for disambiguating phonetic input
US20050185849A1 (en) * 2004-02-16 2005-08-25 Yongmin Wang Six-Code-Element Method of Numerically Encoding Chinese Characters And Its Keyboard
US7502632B2 (en) * 2004-06-25 2009-03-10 Nokia Corporation Text messaging device
US20070040707A1 (en) * 2005-08-16 2007-02-22 Lai Jenny H Separation of Components and Characters in Chinese Text Input
CA2705904C (en) * 2006-12-18 2015-08-18 Semantic Compaction Systems An apparatus, method and computer readable medium for chinese character selection and output
US20090060338A1 (en) * 2007-09-04 2009-03-05 Por-Sen Jaw Method of indexing Chinese characters
CN101408873A (zh) * 2007-10-09 2009-04-15 劳英杰 全范围语义信息综合认知***及其应用
US8725497B2 (en) * 2011-10-05 2014-05-13 Daniel M. Wang System and method for detecting and correcting mismatched Chinese character
CN104205018A (zh) * 2013-02-12 2014-12-10 林广生 汉字输入方法
CN103257720B (zh) * 2013-04-27 2019-02-22 白春荣 一种汉字输入法
CN104317426B (zh) * 2014-09-30 2018-02-27 联想(北京)有限公司 输入方法及电子设备
CN108008832A (zh) * 2016-10-31 2018-05-08 北京搜狗科技发展有限公司 一种输入方法和装置、一种用于输入的装置
CN106802725B (zh) * 2017-03-09 2018-07-24 重庆字曌教育科技有限公司 汉字构字构件、形成的榫卯结构汉字***及汉字输入方法
KR101872879B1 (ko) * 2017-09-18 2018-07-31 서울대학교 산학협력단 한자 입력용 키보드

Family Cites Families (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US4505602A (en) * 1982-09-30 1985-03-19 Wong Wyman S Method for encoding ideographic characters
GB8412135D0 (en) * 1984-05-11 1984-06-20 Wang Yong Min Encoding chinese characters and keyboard
US4758979A (en) * 1985-06-03 1988-07-19 Chiao Yueh Lin Method and means for automatically coding and inputting Chinese characters in digital computers
US4951202A (en) * 1986-05-19 1990-08-21 Yan Miin J Oriental language processing system
GB8629908D0 (en) * 1986-12-15 1987-01-28 Kemano Ltd Words & characters computer input device
US4920492A (en) * 1987-06-22 1990-04-24 Buck S. Tsai Method of inputting chinese characters and keyboard for use with same
US4949260A (en) * 1989-01-03 1990-08-14 Hsu Su Hsia Method for inputting chinese information through hieroglyphic approach and keyboard arrangement therefor

Also Published As

Publication number Publication date
CN1043210A (zh) 1990-06-20
GB2238641A (en) 1991-06-05
US5119296A (en) 1992-06-02
GB2238641B (en) 1993-07-14
GB9025725D0 (en) 1991-01-09

Similar Documents

Publication Publication Date Title
CN1015218B (zh) 字根编码输入法及其设备
CN1023916C (zh) 简繁五笔字根汉字输入***
CN1121645C (zh) 音形字理码汉字输入方法
CN1033540C (zh) 简易音形码汉字输入法
CN85100087A (zh) 《中文声数编码》方案及其实现方法
CN1108552C (zh) 拼音汉字完善汉字法(phf)
CN1020052C (zh) 形元汉字信息处理方法及其键盘
CN1129058C (zh) 仿真拼音汉字输入法
CN1062797A (zh) 文字输入键盘及方法
CN1256644C (zh) 一种偏旁部首汉字输入方法
CN1145098C (zh) 汉字数码输入法
CN1058342C (zh) 汉字编码的计算机输入方法
CN1089175C (zh) 规范部首笔画合成输入法
CN1055434A (zh) 字符的图元输入方法及其键盘
CN1088211C (zh) 汉字正负单数部首数码输入法
CN1093182A (zh) 声韵笔对码汉字输入方法及键盘
CN1825254A (zh) 汉字输入法及其所用的计算机键盘
CN1591293A (zh) 汉字拼形输入法
CN1023669C (zh) 一种字元拼形计算机中文输入法
CN1271492C (zh) 26104电脑汉字自动转换输入法
CN1080748A (zh) 简繁体声形特征码汉字输入法及其键盘
CN1209700C (zh) 数码识字输入法
CN1146572A (zh) 正字法汉字编码
CN1182235A (zh) 音素结构注音符号双拼及其加调双拼双打46键式输入法
CN1379307A (zh) 全息万能规范汉字编码及高速输入法

Legal Events

Date Code Title Description
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
C06 Publication
PB01 Publication
C13 Decision
GR02 Examined patent application
C14 Grant of patent or utility model
GR01 Patent grant
C15 Extension of patent right duration from 15 to 20 years for appl. with date before 31.12.1992 and still valid on 11.12.2001 (patent law change 1993)
OR01 Other related matters
EE01 Entry into force of recordation of patent licensing contract

Assignee: Beijing China-E China-S Electronics Co., Ltd.

Assignor: Zheng Long

Contract fulfillment period: The duration of the contract is from 1992.10.18 to 2009.11.27

Contract record no.: Contract filing No. 2007990000051

Denomination of invention: The invention of the root name encoding input method and device

Granted publication date: 19920722

License type: Common License

Record date: 20070926

LIC Patent licence contract for exploitation submitted for record

Free format text: COMMON LICENCE; TIME LIMIT OF IMPLEMENTING CONTACT: 1992.10.18 TO 2009.11.27

Name of requester: BEIJING ZHONG YI ZHONGBIAO ELECTRONICS INFORMATIO

Effective date: 20070926

C56 Change in the name or address of the patentee

Owner name: ZHENG LONG;

Free format text: FORMER NAME OR ADDRESS: ZHENG YILI; ZHENG LONG

CP01 Change in the name or title of a patent holder

Address after: Room 3, building 208, Chinese Academy of Agricultural Sciences, Shiqiao Road, Beijing

Patentee after: Zheng Long

Address before: Room 3, building 208, Chinese Academy of Agricultural Sciences, Shiqiao Road, Beijing

Co-patentee before: Zheng Long

Patentee before: Zheng Yili

C17 Cessation of patent right
CX01 Expiry of patent term

Granted publication date: 19920722