CN102830809B

CN102830809B - 汉字编码输入法

Info

Publication number: CN102830809B
Application number: CN201110160422.1A
Authority: CN
Inventors: 董为群
Original assignee: Individual
Current assignee: Wen Hua (beijing) Education Technology Co Ltd
Priority date: 2011-06-15
Filing date: 2011-06-15
Publication date: 2016-05-11
Anticipated expiration: 2031-06-15
Also published as: CN102830809A

Abstract

本发明公开了一种汉字编码输入法，其包括：按照汉字拆分程序对汉字结构进行拆分，将汉字分为独体字、左右相等或左中右相等、左少右多、左多右少、上下相等或上中下相等、上少下多、上多下少、两面包围、三面包围以及四面包围和特殊结构，并分别用一数字键作为其代码；将汉字的笔画分为横、竖、撇、点、折，并分别用一数字键作为其代码；根据所要输入汉字的特点，将其汉字结构的代码作为编码的第1位，将汉字的部件数量或笔画数作为编码的第2位，并将该汉字各个部件的笔画的代码作为编码的第3～6位；通过键盘或软键盘上的数字键将编码输入。

Description

汉字编码输入法

技术领域

本发明涉及中文信息处理技术领域，具体而言，涉及一种汉字编码输入法。

背景技术

目前的汉字编码大致可以分为四级模式：第一级是整字模式；第二级是符合国家标准的规范部件模式；第三级是介于规范部件与笔画之间的非规范部件拆分模式；第四级是笔画模式。

其中整字模式无需对汉字进行任何拆分，拼音输入法和区位码就是该模式的典型代表。当前拼音输入法是最为流行的汉字输入法。其优点是会拼音就会输入，是最为自然的中文输入法。其弱点是无法输入不会读音的汉字，由于编码空间过小，导致重码过多。更为严重的是长期使用拼音输入，会削弱对汉字字形的记忆，降低汉字的书写水平，甚至导致汉字遗忘症。

规范部件输入法的问题在于需要记忆大量的部件，2009年7月1日开始试行的《现代常用字部件及部件名称规范》GF0014-2009规定了514个部件。早在此前发布的GF3001-1997信息处理用GB13000.1字符集汉字部件规范规定了560个部件。数百个部件如何合理分布在标准键盘上，一直是没有解决的难题。

介于规范部件与笔画之间的第三级模式，由于较少考虑汉字自身规律，不受国家标准约束，或出于个人偏爱，或囿于一己之见，各种以己之长比人之短的方案层出不穷。这正是导致汉字形码和音形码“万码奔腾”低水平重复的重要原因。

笔画模式的优点是易学好记，会写就会输入；缺点是笔画多的输入慢，笔画少的重码多，不会写就不会输入。

由此可见，中国计算机用户最缺的还是真正符合汉字规律，易学好用的汉字输入方法。不仅如此，国内外汉字教学也需要能够真正有助于识字、写字、查字和打字的汉字输入编码。

汉字编码的作用不仅仅在于输入汉字。小学阶段语文课最重要的教学任务是识字，好的汉字编码输入法在识字上应该能够起到其他手段起不到的作用，可以有效帮助学生学习和记忆汉字，明显提高识字的时效，有利于学生对汉字的理解和热爱，让汉字规范的推广工作落到实处。这些正是当代汉字教学对汉字编码输入法提出的要求，如果汉字编码本身就是一种规范的识字法，并且有助于解决汉字难学的大问题，那就再好不过了！

发明内容

本发明提供一种汉字编码输入法，用以在汉字输入时帮助人们学习记忆汉字。

为达到上述目的，本发明提供了一种汉字编码输入法，其包括以下步骤：按照汉字拆分程序对汉字结构进行拆分，将汉字分为独体字、左右相等或左中右相等、左少右多、左多右少、上下相等或上中下相等、上少下多、上多下少、两面包围、三面包围以及四面包围和特殊结构，并分别用一数字键作为其代码；将汉字的笔画分为横、竖、撇、点、折，并分别用一数字键作为其代码；根据所要输入汉字的特点，将其汉字结构的代码作为编码的第1位，将汉字的部件数量或笔画数作为编码的第2位，并将该汉字各个部件的笔画的代码作为编码的第3～6位；通过键盘或软键盘上的数字键将编码输入。

较佳的，当汉字为独体字时，将该独体字的笔画数作为其编码的第2位。

较佳的，横的代码为1，竖的代码为2，撇的代码为3，点的代码为4，折的代码为5，与其他笔画交叉的横的代码为6，竖钩的代码为7，与其他笔画交叉的撇的代码为8，与其他笔画交叉的折的代码为9。

较佳的，当汉字为独体字，超过4画的独体字取其前4画进行编码。

较佳的，当汉字包括2个部件时，分别取其2个部件的前2笔进行编码；当汉字包括3个部件时，分别取前2个部件的第1笔和第3个部件的前2笔进行编码；当汉字包括4个及以上部件时，分别取前4个部件的第1笔进行编码；其中，若需要取前2笔的部件只有1个笔画时，则编码时将该笔画重复2次。

较佳的，用数字“0”用作编码提前结束的标志符。

较佳的，在编码中，用该汉字的拼音首字母作为该汉字编码的最后一位，其中该拼音首字母可以出现在该汉字编码的任何位置上。

上述实施例中，根据汉字的汉字结构、部件和笔画进行汉字的输入，不仅可以作为高效灵活的汉字输入方法，广泛用于计算机和各类采用数字小键盘的信息终端设备；还可以用来帮助人们学习记忆汉字，对汉字教学中的识字、习字和查字均有较大的辅助作用。

附图说明

为了更清楚地说明本发明实施例或现有技术中的技术方案，下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍，显而易见地，下面描述中的附图仅仅是本发明的一些实施例，对于本领域普通技术人员来讲，在不付出创造性劳动的前提下，还可以根据这些附图获得其他的附图。

图1为根据本发明一实施例的汉字输入法流程图；

图2为根据本发明一实施例的汉字编码输入界面屏幕截图；

图3为根据本发明一实施例的数字纯形码单字输入“汉”屏幕截图；

图4为根据本发明一实施例的数字纯形码单字输入“字”屏幕截图；

图5为根据本发明一实施例的数字纯形码单字输入“编”屏幕截图；

图6为根据本发明一实施例的数字纯形码单字输入“码”屏幕截图；

图7为根据本发明一实施例的数字纯形码词语输入“汉字编码”屏幕截图；

图8为根据本发明一实施例的形音码词语输入“汉字编码”屏幕截图；

图9为根据本发明一实施例的纯音码词语输入“汉字编码”屏幕截图；

图10为根据本发明一实施例的三码混合词语输入“汉字编码”屏幕截图。

具体实施方式

下面将结合本发明实施例中的附图，对本发明实施例中的技术方案进行清楚、完整的描述，显然，所描述的实施例仅仅是本发明一部分实施例，而不是全部的实施例。基于本发明中的实施例，本领域普通技术人员在没有付出创造性劳动前提下所获得的所有其他实施例，都属于本发明保护的范围。

本发明涉及一种符合国家标准规范，面向汉字教学，具有数字纯形、形音结合与字母纯音三种格式无切换混用功能的汉字编码输入法。该方法以数字表形为主，辅之以拼音首字母，故称之为“数形辅音”输入法。

汉字编码输入法是中文信息进入计算机和移动信息终端设备的最重要的入口。同时也是汉字教学的重要手段和工具，并且还是解决汉字排序检索问题的技术途径。

本发明在完全遵守国家语言文字有关标准和规范的基础上，从汉字结构与构形要素之间的数量关系入手，提取出“构形数量”这一新的编码元素，并且用0～9十个数字直接表达这种编码元素，辅之以汉语拼音首字母，形成了遵循国家标准规范，面向汉字教学，具有数字纯形、形音结合和字母纯音三种格式无切换混用功能的汉字编码输入法。

图1为根据本发明一实施例的汉字编码输入法流程图。如图1所示，该汉字输入法包括以下步骤：

S102，按照汉字拆分程序对汉字结构进行拆分，将汉字分为独体字、左右相等或左中右相等、左少右多、左多右少、上下相等或上中下相等、上少下多、上多下少、两面包围、三面包围以及四面包围和特殊结构，并分别用一数字键作为其代码；将汉字的笔画分为横、竖、撇、点、折，并分别用一数字键作为其代码；

S104，根据所要输入汉字的特点，将其汉字结构的代码作为编码的第1位，将汉字的部件数量或笔画数作为编码的第2位，并将该汉字各个部件的笔画的代码作为编码的第3～6位；

S106，通过键盘或软键盘上的数字键将编码输入。

本实施例中，根据汉字的汉字结构、部件和笔画进行汉字的输入，不仅可以作为高效灵活的汉字输入方法，广泛用于计算机和各类采用数字小键盘的信息终端设备；还可以用来帮助人们学习记忆汉字，对汉字教学中的识字、习字和查字均有较大的辅助作用。

根据部件在整字中的位置关系对汉字进行分类，完全符合《现代常用字部件及部件名称规范GF0014-2009》的要求。

在信息交换用汉字编码字符集-基本集GB2312的6763个汉字中，左右结构的汉字多达4272个，超过了63％。本着有效利用编码空间，尽量均衡编码分布的设计原则，将左右结构细分为三个子类：左(中)右相等、左少右多、左多右少。

上下结构的汉字的数量也相当多。GB2312的6763个汉字中，上下结构的汉字共有1560个，占到23％。故也将其分为三类：上(中)下相等、上少下多、上多下少。

无论是左右结构还是上下结构，所谓相等与多少，对于两部件字来说，指的是两个部件笔画之间的数量关系；对于三个或三个以上部件的汉字来说，则是指部件之间的数量关系。

关于汉字部件的拆分方法，以及如何确定左右或上下两个部分中部件的多与少。本发明主要依据《汉字部件规范》研制组在“关于制订《汉字部件规范》的若干问题”(简称部件规范)中相关规定。

部件规范将汉字的拆分程序定义为“汉字拆分为部件的次序。对层次结构的汉字递次进行有理据拆分，称层次拆分；对平面结构的汉字进行一次性的有理据拆分或无理据拆分，称平面拆分。”

本发明根据部件拆分程序中的首层拆分来确定左右结构和上下结构汉字中部件分布究竟是哪边少哪边多。例如，“做”由“亻、十、口、攵”四个部件组成。其首层拆分结果是“亻”和“故”，所以是“左少右多”结构。“新”由“立、木、斤”三个部件组成，其首层拆分结果是“亲”和“斤”，故为“左多右少”结构。“花”由“艹、亻、匕”三个部件组成，其首层拆分结果是“艹”和“化”，所以是“上少下多”结构。“想”由“木、目、心”三个部件组成，其首层拆分结果是“相”和“心”，故为“上多下少”结构。

由此可见，本发明不仅包含了部件数量信息，而且还反映了部件拆分的规范过程。

除了左右和上下结构，其他结构的汉字数量相对来说比较少。因此用8代表所有两面包围结构的汉字，包括上左包围、上右包围和左下包围三种；用9代表所有三面包围的汉字，其中包括左上右包围、上左下包围和左下右包围三种。用0代表四面包围和其他特殊结构的汉字。

汉字编码的关键在于如何分解数量庞大的汉字集合。本发明的第1位编码是对编码汉字集的第一次分解，其分解的效果(均匀度)对重码率和重码字相似度的影响非常大，上述方法比较均匀地分解了高度聚集在左右结构和上下结构区域的大量汉字。部件数量与位置关系属于汉字的宏观属性，显而易见，较少有二义性。本发明利用这些元素来描述汉字，巧妙规避了部件数量过多，拆分不规范、部件名称不定等一系列难题。

从图1的实施例中可以看出，<汉字数字纯形编码>::＝<结构码><数量码>{<笔画码>}。其中，<结构码>::＝<独体字>|<合体字>，例如可以将令独体字的代码为1，即<独体字>::＝1；<合体字>::＝<左右结构>|<上下结构>|<两面包围>|<三面包围>|<四面包围和特殊结构>，<左右结构>::＝<左(中)右相等>|<左少右多>|<左多右少>，令<左(中)右相等>::＝2，<左少右多>::＝3，<左多右少>::＝4；<上下结构>::＝<上(中)下相等>|<上少下多>|<上多下少>，<上(中)下相等>::＝5，<上少下多>::＝6，<上多下少>::＝7，<两面包围>::＝8，<三面包围>::＝9，<四面包围和特殊结构>::＝0。

在上述实施例中，数量码为汉字的部件数目，当汉字为独体字时，可以将该独体字的笔画数作为其编码的第2位。即<数量码>::＝<笔画数>|<部件数>，<笔画数>::＝1|2|3|4|5|6|7|8|9(数字9表示笔画等于或超过9画)，<部件数>::＝1|2|3|4|5|6|7|8|9(数字9表示部件数等于或超过9个)。

其中，本发明实施例中的部件是指《汉字部首表G0011-2009》中的部首和《现代常用字部件及部件名称规范GF0014-2009》中的基础部件。

《汉字部首表》采用的部首定义是“可以成批构字的一部分部件”(GB/T12200)；《现代常用字部件及部件名称规范》遵循的部件定义是：“由笔画组成的具有组配汉字功能的构字单位”(GB/T12200)。大部分规范部首即是规范基础部件。《汉字部首表》201个主部首中，只有22个不属于《现代常用字部件及部件名称规范》中的基础部件。本发明将属于部首的基础部件称为“部首部件”，将不是部首的基础部件称为“非部首部件”，将不属于基础部件的部首称为“非部件部首”。

只有按照部首和部件规范的要求拆分汉字，才能得到正确的部件数。这样设计是为了把汉字结构知识融入到编码中去，以便通过编码输入巩固对汉字形体结构的记忆，避免因为使用计算机而淡忘了汉字的字形。尽管这样做会提高编码的学习难度，但这正是面向汉字教学的需要，因为部件是汉字形体中承上启下的关键组配单位，若想正确理解和记忆汉字字形，掌握字形与字义的关系，就必须知道汉字是由哪几个部件组配而成的。

对于合体字来说，至少包含两个部件，因此数量码不可能为1。本发明中，数量码1并不表示合体字的部件数量，而是将合体字视为一个整体，不做拆分。也即像独体字那样输入汉字的前四笔。这样设计为的是，当不知道如何拆分，或无法确认某个汉字的部件数量时也能输入该汉字。

例如，笔画编码遵循国家标准，横的代码为1，竖的代码为2，撇的代码为3，点的代码为4，折的代码为5；为了分化使用频度较高的“横竖撇折”这四种笔画，并在笔画编码层面体现笔画的交叉关系，与其他笔画交叉的横的代码为6，竖钩(与竖相区别)的代码为7，与其他笔画交叉的撇的代码为8，与其他笔画交叉的折的代码为9。即<笔画码>::＝<横>|<竖>|<撇>|<点>|<折>，<横>::＝1|6，<竖>::＝2|7，<撇>::＝3|8，<点>::＝4，<折>::＝5|9。

例如，当汉字为独体字，笔画码的长度因笔画数而定，超过4画独体字取其前4画进行编码。

例如，当汉字包括2个部件时，分别取其2个部件的前2笔进行编码；当汉字包括3个部件时，分别取前2个部件的第1笔和第3个部件的前2笔进行编码；当汉字包括4个及以上部件时，分别取前4个部件的第1笔进行编码；其中，若需要取前2笔的部件只有1个笔画时，则编码时将该笔画重复2次。

例如，除了第一位用来表示四面包围结构之外，编码时数字“0”还可用作编码提前结束的标志符。本发明不但可以单字逐个输入汉字，也可以用来输入词语。本发明不设置任何简码，在输入词语时，可以用“0”来提前结束当前输入汉字的编码，并进入下一个汉字的输入。这样做的好处是无需固定码长，随时根据以往的经验和输入的内容，任意调节编码的长短(不包含结束符最短可以只有一位)，既可无拘无束，又能高效输入。

为了更好地适合汉字教学，本发明的输入法除了以上说明的数字纯形码(以下简称纯形码)之外，还利用拼音首字母，对其进行了扩展，从而形成“形音结合”和“字母纯音”另外两种方式(以下分别简称为“形音码”和“纯音码”)。

例如，在编码中，用该汉字的拼音首字母作为该汉字编码的最后一位，该拼音首字母可以出现在该汉字编码的任何位置上。本实施例的形音码是在纯形码的基础上，加上汉字拼音第一个字母所构成，属于以形为主，形音结合的一种汉字编码输入法。当小学生学会了汉语拼音之后，可以用形音码来输入汉字，这样不仅可以巩固所学拼音，还能进一步降低重码键选率，提高输入效率。

本发明的形音码中，拼音首字母位于编码的最后，但不固定其位置。拼音首字母有两个作用。其一是用来分解重码，其二是用作编码结束标志。第一个作用显而易见，而第二个作用则是本发明的一大特点。

就码长而言，汉字数字编码可以分为固定码长和非固定码长两种。等长编码的优点是无需结束符，缺点是存在大量只是为了凑齐长度的空码。而非等长编码虽然编码效率高，但是两个汉字编码之间需要分隔符，或者需要规定特定情况下(例如词语输入)的码长。而本发明的形音码只有最后一位是拼音字母，其余都是数字，所以这个拼音字母，既是有效码元，又起到了结束符的作用，而且可以在编码的第1至第6位的任何位置上键入该拼音首字母，作为编码提前结束的最后一个码元。

当拼音首字母出现在第一码位上时，就是本发明的纯音码。纯音码只有一位，主要用来快速输入较长的词语。

本发明的形音码只用一位拼音首字母，就实现了彻底的码长自由，在1至7的任何一个码位，都允许键入拼音首字母。本发明用的纯形码，需要用额外的“0”来提前结束编码，而形音码则实现了码长自由度与编码高效率的完美统一。

本发明的汉字数形辅音规范编码输入法不仅可以做到“见字识码”，对于相当一部分汉字来说，还能做到“见码识字”。

以下为根据本发明一优选实施例：

其实施软件是一个WPF(WindowsPresentationFoundation)程序，可以运行在WindowsXP以及更高版本的操作***环境下。其主要功能是将用户通过标准键盘输入的汉字编码转换成汉字或词语。

下面结合实施软件和附图，对本发明作进一步说明。

图2是该实施软件界面，左边是编码输入框，右边是候选字词选择框。在选择框上方显示选择结果，以及与候选字词相关的统计参数。

图3至图6是用纯形码分别输入单字“汉字编码”四个字，其中“汉”和“码”只需输入5位编码，即可唯一确定。“编”的编码与其他字相重，但是首选字，故无需键选。

图7是用纯形码输入词语“汉字编码”的过程。第一个汉字用了5位编码(42449)输入。当词语的第一个输入后，其余的字大都无需全码输入。本实施例中，只用了两位编码(52)即可输入“字”。而“编”和“码”只分别用了一位编码，就完成了整个词语的输入。由此可见，使用本发明的方法，即使只用十个数字，也能有效缩短码长，高速输入中文。

图8显示了用形音码输入词语“汉字编码”的过程。词语输入时，形音码可以进一步缩短码长。本实施例中四个字的平均码长只有1.75。

图9记录了纯音码输入词语“汉字编码”的过程。纯音码主要用来输入字数较多的词语(三字以上)。从本实施例可以看出，纯音码显然不适合输入单字和双字词，但是输入像“汉字编码”这样的多次词是非常高效的。本实施例的平均码长为1。

图10体现了本发明“三种方式无切换混用”的特点。使用者可以根据汉字学习进度，或者对具体汉字字形和读音的认知程度，以及汉字输入方面的经验积累，选择最适合自己的方式，从而避免单一输入方式的局限。

本发明不仅提供了适合汉字教学不同阶段使用的不同编码方式，同时还实现了相互之间的无切换混用。从只用十个数字输入汉字或词语(纯形)，到用数字和拼音首字母输入汉字或词语(形音结合)，再到只用拼音首字母输入词语(纯音)。均可以随字随词自由选择。

例如，输入词语“汉字编码”，可以有如表1所示的不同方法(但非全部)：

表1

其中，码长＝(实际输入编码+分隔符+键选符)÷4。

以上是利用本发明人自行编制的中文字词输入软件所得到的数据，所用汉字集为GB2312，词库容量为20万词以上。

下面对本发明的特点加以进一步说明。

规范编码输入法，顾名思义，必须符合“规范”。这里的规范是指国家颁布执行或试行的语言文字和汉字编码输入相关标准，如表2所示。

表2

本发明完全符合以上国家标准规范。

本发明的最大特点之一，体现在“用数字描述汉字字形”上。不仅用数字直接反映汉字的笔画和部件数量，而且将汉字的静态结构与部件动态拆分层次等难以表述的汉字构形特征，通过简单数字体现出来。

数量反映了汉字包含部件的多少，是对结构的二次分类。例如，将汉字最为集中的左右结构分为“左(中)右相等”、“左少右多”和“左多右少”三个子类，配合第二位数量码，能够较好体现部件的数量以及在汉字中的位置分布，反映出汉字结构的诸多特点。这样的设计还能有效降低重码字键选率。

部件是汉字的宏观特征，大部分汉字的部件结构非常明显，其部件数量一望便知。用简单的数量关系反映汉字字形结构，符合国家对输入法易用性的要求，也有利于对于汉字字形的归类记忆。

结合部件抽取笔画特征是本发明的另一个特点。尽量选取多个部件的笔画，让编码尽可能均匀分布在汉字的各个层次和局部上，使编码包含多一点汉字属性信息，并用码序反映汉字部件和笔画的书写顺序。这些均符合面向教学的要求。

此外，利用国家规范未作规定的数字键(6～9)，有效分化了使用频度较高的常用笔画，进一步降低了重码字键选率。

本发明最大特点之二体现在自由码长和末位编码的设计上。如果编码最后一位是数字，则为数字纯形码；如果是拼音首字母并且码长大于1，则是形音码；若码长缩短到一位并且是拼音首字母，那就是纯音码。

本发明的汉字编码码长CL变化范围规定如下：

纯形码：1≤CL≤6；

形音码：2≤CL≤7；

纯音码：CL＝1。

可以根据需要，任意选用编码第1位至第L位部分(L≤最大码长)来输入汉字和词语。

编码末位和首位的作用不同，但都是最为重要的码位。本发明在末位设计上，用“0”作为纯形码的结束符，以保持形码的全数字特点；用拼音首字母作为形音码的末位码元，既可以省去编码之间的分隔符，又能有效降低重码率。正因为这样的设计，才能做到三种编码无需切换，即可混合使用。人们可根据需要，随字随词，任意选择适合自己的输入方法。

本发明规则简单易学，没有例外，没有简码，无需记忆，完全能够做到见字识码。有相当一部分编码还能见码识字。因此可以配合汉字教学，同步学习使用。

从“识字”的意义上说，由于本发明对汉字的编码具有很好的层次性和相似聚合度，可以作为识字法来使用，或者用来辅助学生整理、归类、理解和记忆所学汉字。

就“写字”而言，编码中包含的笔画、部件和结构信息有助于掌握汉字的字形特点和部件位置关系，有利于学生书写规范汉字。

对于“查字”说，本发明的纯形码仅用10个数字作为码元，加上自上而下的分级编码机制，只需经过程序上的简单处理，既可以生成直观合理的汉字序列。排序规则简明，符合汉字排序从整字到部件，从部件到笔画的基本要求。

对于“打字”来说，因为纯形码的码元只有10个数字，所以能够适合大到台式机，小到手机等各类信息终端输入汉字。因为具有良好的层次性和相似聚合度，可以逐位输入，同步出字，很多汉字无需全码输入即可提前确定。

可见，本发明是一种具有“打字、识字、写字和查字”四结合功能的规范汉字编码输入法。

本领域普通技术人员可以理解：附图只是一个实施例的示意图，附图中的模块或流程并不一定是实施本发明所必须的。

本领域普通技术人员可以理解：实现上述方法实施例的全部或部分步骤可以通过程序指令相关的硬件来完成，前述的程序可以存储于一计算机可读取存储介质中，该程序在执行时，执行包括上述方法实施例的步骤；而前述的存储介质包括：ROM、RAM、磁碟或者光盘等各种可以存储程序代码的介质。

最后应说明的是：以上实施例仅用以说明本发明的技术方案，而非对其限制；尽管参照前述实施例对本发明进行了详细的说明，本领域的普通技术人员应当理解：其依然可以对前述实施例所记载的技术方案进行修改，或者对其中部分技术特征进行等同替换；而这些修改或者替换，并不使相应技术方案的本质脱离本发明实施例技术方案的精神和范围。

Claims

1.一种汉字编码输入法，其特征在于，包括以下步骤：

按照汉字拆分程序对汉字结构进行拆分，根据部件在整字中的位置关系对汉字进行分类，将汉字分为独体字、左右相等或左中右相等、左少右多、左多右少、上下相等或上中下相等、上少下多、上多下少、两面包围、三面包围以及四面包围和特殊结构，并分别用一数字键作为其代码；将汉字的笔画分为横、竖、撇、点、折，并分别用一数字键作为其代码；

根据所要输入汉字的特点，将其汉字结构的代码作为编码的第1位，将汉字的部件数量或笔画数作为所述编码的第2位，并将该汉字各个部件的笔画的代码作为所述编码的第3～6位；

通过键盘或软键盘上的数字键将所述编码输入；

当汉字为独体字时，将该独体字的笔画数作为其编码的第2位。

横的代码为1，竖的代码为2，撇的代码为3，点的代码为4，折的代码为5，与其他笔画交叉的横的代码为6，竖钩的代码为7，与其他笔画交叉的撇的代码为8，与其他笔画交叉的折的代码为9；

当汉字为独体字，超过4画的独体字取其前4画进行编码；

当汉字包括2个部件时，分别取其2个部件的前2笔进行编码；

当汉字包括3个部件时，分别取前2个部件的第1笔和第3个部件的前2笔进行编码；

当汉字包括4个及以上部件时，分别取前4个部件的第1笔进行编码；

其中，若需要取前2笔的部件只有1个笔画时，则编码时将该笔画重复2次。

2.根据权利要求1所述的汉字输入法，其特征在于，在汉字编码的第1至第6位的任何位置上键入该汉字的拼音首字母，作为该汉字编码提前结束的最后一个码元。

3.根据权利要求1所述的汉字输入法，其特征在于，用数字“0”用作编码提前结束的标志符。