CN105511636A - 全部汉字汉词简易无重码统一输入法改进 - Google Patents
全部汉字汉词简易无重码统一输入法改进 Download PDFInfo
- Publication number
- CN105511636A CN105511636A CN201510823609.3A CN201510823609A CN105511636A CN 105511636 A CN105511636 A CN 105511636A CN 201510823609 A CN201510823609 A CN 201510823609A CN 105511636 A CN105511636 A CN 105511636A
- Authority
- CN
- China
- Prior art keywords
- word
- code
- block
- sound
- piece
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F3/00—Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
- G06F3/01—Input arrangements or combined input and output arrangements for interaction between user and computer
- G06F3/02—Input arrangements using manually operated switches, e.g. using keyboards or dials
- G06F3/023—Arrangements for converting discrete items of information into a coded form, e.g. arrangements for interpreting keyboard generated codes as alphanumeric codes, operand codes or instruction codes
- G06F3/0233—Character input methods
Landscapes
- Engineering & Computer Science (AREA)
- General Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Human Computer Interaction (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- Document Processing Apparatus (AREA)
Abstract
全部汉字汉词简易无重码统一输入法改进,用287构块组成全部汉字,构块都有大众熟知或易记的块音;串连每一汉字/汉词的最多4/5块音,即成它的拼块音,如同德国人能依简明规则从德语词形直接读出词音,中国人也能依简明规则从汉语字形/词形直接读出字拼块音/词拼块音;默念字/词的拼块音同时便确定它的拼块码或扩码,扩码字典序是汉语全部约十万/百万标准字形/词形的简易无重码序。应用本发明,任何汉字/汉词的辞书文档检索,查得其拼块码即查得该字/词;电脑手机输入,键完/写完/读完其扩码/扩码/扩音或简码/简码/简音即键入/写入/读入该字/词;中文作为全球主要文字之一将近似英文便于大众处理。
Description
技术领域
本发明涉及全部汉字汉词简易无重码统一输入法改进。
背景技术
汉字输入的要害在字词编码而不在现有编码基础上的“智能化”设计。至今,各种流行键盘输入法的普通用户在电脑/手机上平均输1000汉字究竟要击多少次键、费多长时间,如果把实际发生且理当计入的翻页点选、不时纠错、频繁移目都计算进去?哪里有可信统计数据?“智能化”事实上把很多选择的麻烦推给了用户。欲筑高楼,必先坚地基,基于不完善字词码的智能化输入法没有也难以突破汉字输入的整体低效瓶颈,更无法兼用于汉字检索;所谓完善的汉字码,衡量标准终归一条,即大众据之能快易统一地输入检索全部汉字汉词。申请人始终认为一种文字通用一种检索法兼输入法兼存储法(如果该种文字需要事先存储),才是计算机时代包括汉字处理在内的任何文字处理之大道;汉字编码不属于人类那些永无止境的事务,万码奔腾的结局是万码归一。
发明专利申请CN104571593A在申请人先前多个发明专利/申请基础上,将拼块码方法推向汉字处理最大限度的通用性,即通用于汉语全部字词,通用于电脑、手机及其它信息处理设备,通用于键盘、手写、语音等各种输入方式,通用于输入、存储、检索、写记等各个处理领域;基于拼块码,一旦启动国家规模的软、硬件全面配套工程,十几亿华人将从无一能快易处理所有汉字汉词的过去,很快进入初小以上全都能快易处理所有汉字汉词的未来。基本理念十分简单,就是尽量让大众能从母语任何字词形直接读音同时完成该字词的输入/检索,只不过德国人读多音节的词音而中国人读多音节的字词拼块音。对照拼音文字,汉字输入与检索麻烦的根源在于字音和字形全无同构关联,音形互转困难无比,CN104571593A提供了摆脱这一根源的路径。
CN104571593A尚未达到全面有效前提下汉语自然和逻辑精简的极致,从主干到细枝末节还有改进的余地。
汉语10万标准字形的结构复杂性、绝大多数汉字单音节字音的读不出性、5千高频汉字普通话字音的偏少且读不准性在可以预见的将来不会改变,三者共同注定了中文处理绝无可能全面达到英文处理的简单直接程度,前者多出来的第一环即汉字编码(英文无妨视为词、码同一文字),但是汉语较英语音节分明,汉词较英词反而能有更短的完善码。拼块码方法已近汉语自然并逻辑精简的极限,且使中文处理总体的方式和效率足堪比肩英文处理的方式和效率;于是道理上似已难有比汉字扩码更加简易通用但思路迥异的全汉字/汉词无重码,随之汉字处理总体上似已难有比拼块码方法更加简易有效的普适方法。
发明内容
本发明对CN104571593A作以下4类改进:
1.构块从313个调整、减少到用户更易识记、组字更合条理的287个,块顺规则1)及构块变形约定相应调变;
2.块码变通规则3)中的“末2字母为uo”改成“末字母为o”,以使块码兼容更多方言普通话块音,拼音ao相应换成au;
3.2字词和3字词的拼块音规则有合理修改;
4.语音输入时,“木、耳、十”的声调改为一声,以提高语音-字词转换准确率和用户的总体母语自然感;
此外,概念“准码/拼块码”更名为“拼块码/扩码”,对称于“扩码/简码”增加了概念“扩音/简音”,使相关表述更简洁清通,其它多处行文也有改善。
附图说明
图1是本发明的中英文两用键盘字母键位图;
图2是本发明的手机键盘数字/字母键位图。
具体实施方式
本发明的一个具体实施例由以下6个步骤组成:
1.拼音
汉语拼音恢复本来写法,再ü/ao换为y/au,声调不计;例如wu/yu/yao恢复成u/ü/iao,再ü/ao换为y/au,成u/y/iau。
2.子块
每个字中按笔顺的相继数画称为该字的一个子块;n画字恰有n(n+1)/2个子块,例如3画字“也”恰有3×4/2即6个子块“也,丨、乚”。子块既是不容歧解的数学式概念,又是选择余地极大的灵活概念(10万字形的子块总数超过1000万),这就给汉字编码排序打开了新域。
字中的几个子块称为相继的,若按笔顺其中每一个的末画与下一个的首画构成该字的上下两画,例如“解”中的“用、刀、牛”是相继的;字中无公共笔画的子块间的相交、相接关系按笔画间的同名关系理解。
3.构块、块音、块码
用来组成全部汉字的下列287子块称为构块,简称块:
构块表
0○口匚冂凵
1一乙乂衤
2二亠儿而
3三山
4四罒士尸巳石市市礻
5五无旡兀午勿
6六牛
7七气廾
8八丷巴扌
9九久臼纟
a下丅大瓦凹爪爫瓜甲
b卜匕比必白疒
c厂厂镸寸川臣虫 車
d丶丁亻电
e耳阝卩
f凡飞丰夫甫方
g亅干工弓个革宀冖冎艮
h禾彑
i又由尢酉也业幺用言
j几己巾井斤金
k口可丂
丨了勹立來
m门毛目母皿
n乃女内禸廿
o火灬或我
p彡片爿皮
q犬犭欠且丘求曲
r人亽亼入日
s丨十上彳手身
t土田
u亡王文夂
v水氺氵未隹鬼
w木
x夕习西乡心
y于予
z乚厶巛子止廴自舟
表中字号较大的称为根,较小的称为枝。大众极易见块读音:根的拼音属于常识(个别的或需说明一次),例如“门//衤”的拼音是men/hu/na/i;枝的拼音规定是其根的拼音(从枝的构形或读音易联想其根),例如“/氵/”的拼音即其根“习/亡/水/于”的拼音xi/uang/suei/y;块的拼音称为块音,仅几个枝的块音有别常用读法但不无依傍,例如“扌”(“把”的块)的块音是ba而非ti,旨在缩短很多高频字的码长。
块/非笔形根若是字则称块字/根字。
多画块的下列3种变形之一若不变各画间关系且未成别块则视同原块:1)块(“未”除外)中某一画的伸缩或位移,如视同“土/亠”;2)块中某一“乚”换为之一,或“丿”换为“丨”,或“一”换为“乛”,如“/忄/”视同“巳//土”;3)块中某一画或其末段换为它的对偶(称“一”与“”、“丨”与“亅”、“丶”与对偶),如“冫///”视同“亠/氵//寸//”。此外个别多画块的其它稍许变形亦视同原块,如视同“丰//电”;又视同“凹/巴/了/予/或/虎”。
上述构块表是完备的:凡标准汉字皆由表中某些块组成。
块码是块音首字母,但依次有下列5种变通之一:
1)若块(“耳、十”及其枝除外)音与“○、一、二、…、九”之一的块音相同(不区别起头的sh和s、n和l及结尾的ng和n),则块码是对应***数字(如“巴”的块码是8);
2)若块音末字母为a,则块码是a(如“下”的块码是a);
3)若块音末字母为o,则块码是o(如“火”的块码是o);
4)若块音末三字母为uei,则块码是v(如“未”的块码是v);
5)“木”的块码是w。
可见块码仅包括10个***数字和26个汉语拼音字母,且兼容许多方言普通话块音,大众极易见块定码;设置5种变通以激增码位,目的仍在缩短大量高频字的码长。块码按国际通行顺序列在构块表左端。
4.块顺
依次遵守下列3条简明规则逐一拆下某字的相继构块直至拆尽该字的全部笔画,得到的惟一一串块称为该字的块顺:
1)块少拆得的块尽量少(但多画字拆成至少2块,其构块“口、冂、厂、”依次力避拆散;字的等型子块单独分拆,且“*”的余部自成一块除非拆得的块更少;“斗、头”拆成3块);
2)字大拆得的诸根字总画数尽量大(但相继两块依次力避相交、相接);
3)先小先拆得的块画数尽量小。
规则的但书令拆字更轻松,例如“東”的块顺是(一日)而非(一未);当字含有笔顺难判的子块,其笔顺约定使拆分维持“块少、字大、先小”3规则,但字中包含该子块的列分明方块先写左列后写右列,例如的块顺是(一彑丶),的块顺是(刀刀干)。
块顺定义是在数百遍逐字敲拆74344标准字形的过程中,与构块表逐遍互相改善推进、一并确定的。块顺概念把每个汉字转化成大众易定的惟一块串。
字的块顺含n个块,该字即称n块字,例如“東”是3块字。
5.拼块音、拼块码
字的拼块音按下表简明确定:
词的拼块音按下表简明确定:
词字数 | 拼块音 |
1 | 字拼块音4 --> |
2 | 首字拼块音首次末块音+末字拼块音首末块音 |
3 | 首字拼块音首末块音+次字拼块音首末块音+末字拼块音首块音 |
4 | 首3字拼块音首块音+末字拼块音首末块音 |
≥5 | 首4及末字拼块音首块音 |
词中每个***数字和汉语拼音字母看做1块根字;2/3字词若首字/首次字的拼块音少于3/2块音,则从后续字的拼块音中增取块音力求词的拼块音各字均摊地达到5块音,例如“防潮/一部分”的拼块音是erfangsueishiye/ilierbadau。
高频词的拼块音按下表简明确定:
词字数 | ≤2 | 3 | ≥4 |
拼块音 | 各字音+末字首末块音 | 各字音 | 首3及末字音 |
这里一字的字音特指该字被看做根时赋有的块音,例如高频词“防潮/一部分”的拼块音是fangcausueiye/ibufen。高频词的拼块音无非其拼音的简单伸缩。
全部汉字汉词在万难通晓的单音节字音以外,从此赋有大众能直接读定的多音节码音即拼块音。
由字/词的拼块音将其中每一块音换为同块码,即成它的拼块码(因此字和高频词的拼块码长≤4,词的拼块码长≤5,这样定码长有算术与实践理据)。例如,由“个/一部分”的拼块音gerensu/ilierbadau(作为词)或ibufen(作为高频词)将其中每一块音换为同块码,即成“个/一部分”的拼块码grs/1le8d或1bf。于是任何汉字汉词按方言普通话默念其拼块音便可输入/检索其拼块码,一如任何常用汉词按方言普通话默念其拼音便可输入其简拼。
设依次按降频、CJK字符集、扩展A集、B集、…、各字块数、各块画数、各画笔形、各字结构排列的若干字的拼块码都是s1s2s3s4,规定第t字的扩码是s1s2s3s4后缀t-1个0;又设若干字的拼块码都是s1s2s3同时n个字的拼块码都是s1s2s30,规定前者第1字的扩码是s1s2s3,第t字的扩码是s1s2s3后缀n+t-1个0(t≥2);再设若干字的拼块码都是s1s2同时m个字的拼块码都是s1s20且n个字的拼块码都是s1s200,规定前者第1字的扩码是s1s2,第t字的扩码是s1s2后缀m+n+t-1个0(t≥2);如此继续直至不同字形赋有不同扩码(74344字形至少有60000不同拼块码,即形与码大体是一对一的,所以拼块码后缀0生成扩码可行)。同样处理,不同词形/高频词形也必有不同扩码。字/词的拼块音后缀同样多个lin即成它的扩音。由此,每一扩码、扩音以及稍后定义的简码、简音必对应惟一字形/词形,这些对应交付机器去记识,输入时也只需确定字/词的拼块码或拼块音。
在全部汉字汉词中,其扩码/扩音不同于拼块码/拼块音的大都罕用,而罕用字词的码长/音长几不影响绝大多数用户的中文输入效率:普通人平均读写40万字次难遇1次任意指定的非常用字,仅遇646次非常用字。
汉语字词的拼块音可比方德语词形,拼块码可视为拼块音缩写,扩码与简码/扩音与简音不过是拼块码/拼块音的简单伸缩。
以下例解供初习字/词的拼块码参照,用户适量练习后自能见/想字词立即出码:
【例:“午”,默念upiegan同时输入/检索5pg;
“亅”,默念gou同时输入/检索g;
“貔”,默念piequanpiebi同时输入/检索pqpb】
【例:“增收”,默念tubarizeuen同时输入/检索t8rzu;
“第二次世界大战”,默念zuererniaubu同时输入/检索z22nb】
【例:“增收”,默念zensouzeuen同时输入zszu;
“第二次世界大战”,默念diercizan同时输入d2cz】
下面给出按拼块码字典序排列的1)CJK字符集及其扩展A、B、C集74344字形表6部计660字形;2)2010年度媒体25546高频词语表u部计346词形【拼块码相同的按扩码字典序排列;附注了数字t/n的字词其扩码是拼块码后缀t个0且扩音是拼块音后缀t个lin/有n级简码(即拼块码的前n块码)和简音(即拼块音的前n块音),例如“生1/1”指“生”的扩码是610且扩音是niuilin/有1级简码6和简音niu、“外经贸1”指“外经贸”的扩码是ujm0且扩音是uaijinmaulin、“网站/2”指“网站”有2级简码uz和简音uangzan】供参验,其中拼块码附注*者不同于CN104571593A版本:
1 | 网/2 | u01 | 31 | 万物1/3 | u565 | 61 | 玩法/3 | uavz |
2 | 万一 | u11 | 32 | 外务/3 | u5ul | 62 | 问答/3 | uazk |
3 | 玩意儿1 | u12 | 33 | 挽留/2 | u6bt | 63 | 完败/3 | ub0u |
4 | 外衣/3 | u121 | 34 | 外流/3 | u6vc | 64 | 皖 | ub5 |
5 | 文艺/3 | u171 | 35 | 莞/2 | u75 | 65 | 晚报/3 | ub8i |
6 | 万亿/3 | u1d1 | 36 | 晚期/3 | u77y | 66 | 完毕/3 | ubbs |
7 | 文艺复兴/3 | u1fx | 37 | 外企/3 | u7rz | 67 | 腕表 | ubf1 |
8 | 文艺工作者/3 | u1gz | 38 | 挽 | u82 | 68 | 外表1/3 | ubf1 |
9 | 文艺界 | u1j | 39 | 网吧/2 | u8k8 | 69 | 温饱 | ubl4 |
10 | 万 | u1l | 40 | 翁 | u8x | 70 | 外包1/3 | ubl4 |
11 | 玩意 | u1lx | 41 | 丸 | u9d | 71 | 外部/2 | uble |
12 | 王/2 | u1t | 42 | 挽救/2 | u9qu | 72 | 外边 | ublz |
13 | 歪 | u1z | 43 | 纹 | u9u | 73 | 外币/3 | ubpj |
14 | 文/2 | u21 | 44 | 玩耍/3 | ua2n | 74 | 完备/3 | ubut |
15 | 弯 | u2g | 45 | 温差/3 | ua8g | 75 | 文博会 | uov* |
16 | 玩儿/3 | u2pz | 46 | 外挂 | ua8t | 76 | 文本/3 | ubw1 |
17 | 望而却步/3 | u2qb | 47 | *** | uaam | 77 | 文笔 | ubzm |
18 | 亡 | u2z | 48 | 文雅/3 | uaav | 78 | 稳步/3 | ubzp* |
19 | 完善/2 | u38k | 49 | 文化/2 | uad7 | 79 | 外出/3 | uc30 |
20 | 外事 | u41g | 50 | 文化馆1 | uag | 80 | 外层/3 | uc4z |
21 | 万事/1 | u41g | 51 | 玩家/3 | uagq | 81 | 晚餐/3 | ucbg |
22 | 往事2/3 | u41g | 52 | 文案 | uagw | 82 | 完成/2 | uccd |
23 | 碗/2 | u4e | 53 | 文化节 | uaj | 83 | 蚊虫1/3 | uccd |
24 | 王室 | u4gt | 54 | 文化界1 | uaj | 84 | 王储 | ucdb |
25 | 温室1/3 | u4gt | 55 | 文化教育 | uajy | 85 | 外传 | ucdd |
26 | 文史/3 | u4k1 | 56 | 文化课 | uak | 86 | 外侧/3 | ucdg* |
27 | 问世/3 | u4nz | 57 | 外加/3 | ualk | 87 | 温床 | ucdw |
28 | 万无一失/3 | u514 | 58 | 文化人 | uar | 88 | 王朝/3 | ucsy |
29 | 文武/3 | u52d | 59 | 网卡 | uasb | 89 | 蚊 | ucu |
30 | 文物/2 | u565 | 60 | 外卡1/3 | uasb | 90 | 往常/3 | ucxj |
91 | 豌豆/3 | ud1d | 121 | 完工/3 | uga1 | 151 | 弯腰/3 | uiyn |
92 | 忘掉/3 | ud8s | 122 | 王冠/3 | uggc | 152 | 往届/3 | uj4i |
93 | 晚点 | udbo | 123 | 文稿/3 | ughk | 153 | 外交/3 | uj61 |
94 | 网点1/3 | udbo | 124 | 外观/3 | ugi2 | 154 | 婉拒 | uj80 |
95 | 温度/3 | uddi | 125 | 外管局 | ugj | 155 | 问卷/3 | uj8e |
96 | 网店 | uddk | 126 | 文革/3 | ugns | 156 | 完结/3 | uj9k |
97 | 问道 | uddz | 127 | 网格/3 | ugwk | 157 | 顽疾/3 | ujba13 --> |
98 | 弯道1 | uddz | 128 | 王后 | uhck | 158 | 文件/2 | ujd6 |
99 | 王道2 | uddz | 129 | 往后1/3 | uhck | 159 | 稳健 | ujda |
100 | 稳定/2 | udgr | 130 | 问候/3 | uhda | 160 | 忘记/3 | ujdj |
101 | 温度计 | udj | 131 | 温和/3 | uhhk | 161 | 文静/3 | ujfg |
102 | 问鼎/3 | udmz | 132 | 外号 | uhkk* | 162 | 外交官 | ujg |
103 | 外地人 | udr | 133 | 问号1/3 | uhkk* | 163 | 旺季/3 | ujhz |
104 | 外电 | udrz | 134 | 完婚 | uhnr | 164 | 外经贸1 | ujm |
105 | 外地/3 | udti | 135 | 问好 | uhnz | 165 | 晚间/3 | ujmr |
106 | 文档/3 | udw3 | 136 | 完好1/3 | uhnz | 166 | 问及/3 | ujna |
107 | 稳定性 | udx | 137 | 吻合/3 | uhrk | 167 | 外景/3 | ujrx |
108 | 外方/3 | uf2l | 138 | 外行/3 | uhsd | 168 | 文教 | ujsu |
109 | 万分/3 | uf8d | 139 | 外环/3 | uhug | 169 | 外教1/3 | ujsu |
110 | 往返/2 | ufcz | 140 | 稳/2 | uhx | 170 | 外界/3 | ujt2 |
111 | 王府/3 | ufdc | 141 | ***/3 | uhzs | 171 | 问津/3 | ujv2 |
112 | 文风/3 | ufj1 | 142 | 外用/3 | ui02 | 172 | 文集 | ujvw |
113 | 晚饭/3 | ufli | 143 | 网页/3 | ui1r | 173 | 文具 | ujy8 |
114 | 王妃/3 | ufnj | 144 | 网瘾/3 | uibx | 174 | 玩具1/3 | ujy8 |
115 | UFO | ufo | 145 | 蜿蜒/3 | uica | 175 | 外籍/3 | ujzr |
116 | 稳固 | ug0k | 146 | 晚宴/3 | uign | 176 | 外壳/3 | uk4j |
117 | 顽固1 | ug0k | 147 | 外延 | uipa | 177 | 吻 | uk5 |
118 | 网购/3 | ug0z | 148 | 网银/3 | uipg | 178 | 外科/2 | ukhs |
119 | 完/2 | ug5 | 149 | 汪洋/2 | uivs | 179 | 文科1/3 | ukhs |
120 | 外公/3 | ug8z | 150 | 网游/3 | uivz | 180 | 外来/2 | ul1w |
181 | 往来1/3 | ul1w | 211 | 万能/3 | unzb | 241 | 晚清/3 | uqvy |
182 | 玩乐/3 | ulbx | 212 | 王国 | uo0d | 242 | 温情/3 | uqxy |
183 | 文联/3 | ulea | 213 | 万国1 | uo0d | 243 | 网签/3 | uqz1 |
184 | 弯路 | ulkk | 214 | 外国2/3 | uo0d | 244 | 往日/3 | ur01 |
185 | 问路1/3 | ulkk | 215 | 网罗/3 | uo4x | 245 | 晚/2 | ur2 |
186 | 外立面 | ulm | 216 | 网络/2 | uo9k | 246 | 宛如/3 | urnk |
187 | 紊乱/3 | ulqz | 217 | 网络化1 | uoa | 247 | 文人 | urpa |
188 | 文理 | ulut | 218 | 稳妥/3 | uoan | 248 | 外人1/3 | urpa |
189 | 纹理1/3 | ulut | 219 | 网络版 | uob | 249 | 旺 | uru |
190 | 完了/3 | ulzg | 220 | 玩偶/3 | uodn | 250 | 温润/3 | urvu |
191 | 外力 | ulzp | 221 | 网络游戏/3 | uoix | 251 | 温柔/3 | uryw |
192 | 外面/3 | um12 | 222 | 忘我/3 | uopd | 252 | 网商 | us6k |
193 | 网民/3 | um47 | 223 | 外国人 | uor | 253 | 外商1/3 | us6k |
194 | 完美/3 | um8a | 224 | 网络文学/3 | uoux | 254 | 外甥 | us6l |
195 | 文明办1 | umb | 225 | 外国语 | uoy | 255 | USB | usb14 --> |
196 | 外贸/3 | umbr | 226 | U盘/3 | upzm* | 256 | 旺盛/3 | uscm |
197 | 闻 | ume | 227 | 顽皮/3 | upci | 257 | 外伤/3 | usdl |
198 | 文秘/3 | umhb | 228 | 文凭/3 | updj | 258 | 网上银行/3 | usih |
199 | 问/2 | umk | 229 | 旺铺/2 | uppf | 259 | 外孙女 | usn |
200 | 外貌/3 | ump2 | 230 | 王牌/3 | upps | 260 | 网上/2 | uss2 |
201 | 玩命 | umre | 231 | 外婆 | uovn* | 261 | 晚上1/3 | uss2 |
202 | 文明/3 | umry | 232 | 歪曲 | uq0n | 262 | 往 | usu |
203 | 外卖/3 | umta | 233 | 弯曲1/3 | uq0n | 263 | 外省/3 | usxz |
204 | 网名 | umxk | 234 | 网球场 | uqc | 264 | 文书/3 | uszd |
205 | 闻名1/3 | umxk | 235 | 顽强/3 | uqgc | 265 | 外孙 | uszx |
206 | 晚年 | unps | 236 | 万千/3 | uqps | 266 | 外套/3 | utac |
207 | 往年1/3 | unps | 237 | 完全/2 | uqru | 267 | 文体/2 | utd1 |
208 | 温暖/2 | unri | 238 | 忘却 | uqte | 268 | 网帖/3 | utjk |
209 | 玩弄/3 | unu7 | 239 | 外墙/3 | uqtk | 269 | 问题/1 | utrr |
210 | 万能险 | unx | 240 | 网球/3 | uquq | 270 | 文坛 | uttz |
271 | 网坛1/3 | uttz | 301 | 温馨/3 | ux4r | 331 | 外债 | uzdr |
272 | 外逃/3 | utxz | 302 | 外线/3 | ux9d | 332 | 稳住/3 | uzdu |
273 | 温网/3 | uu01 | 303 | 文学家 | uxa | 333 | 问责/3 | uzfr |
274 | 万万/3 | uu1l | 304 | 外/2 | uxb | 334 | 文字/3 | uzgz |
275 | 外文/3 | uu21 | 305 | 问询 | uxdr | 335 | 网站/2 | uzlk |
276 | 玩/2 | uu5 | 306 | 闻讯 | uxds | 336 | 文章/3 | uzls |
277 | 稳稳/3 | uuhx | 307 | 文学/3 | uxdz | 337 | 外长/3 | uzpa |
278 | 嗡嗡/3 | uukx | 308 | 往昔/3 | uxnr | 338 | 稳重 | uzpt |
279 | 问问/3 | uumk | 309 | 旺销 | uxpy | 339 | 万众/3 | uzrr |
280 | 妄 | uun | 310 | 外销1/3 | uxpy | 340 | 完整/3 | uzsz |
281 | 温婉 | uune | 311 | 外星人 | uxr | 341 | 王者 | uztb |
282 | 往往/3 | uusu | 312 | 文献/3 | uxsq | 342 | 网址/3 | uztz |
283 | 望 | uuu | 313 | 万幸/3 | uxtg | 343 | 完整性 | uzx |
284 | 玩玩 | uuu5 | 314 | 外泄/3 | uxvz | 344 | 问责制1 | uzz |
285 | 忘 | uux | 315 | 外相/3 | uxwm | 345 | 蚊子 | uzzs |
286 | 挽回 | uv0k | 316 | 外向型1 | uxx | 346 | 王子1/3 | uzzs |
287 | ***/3 | uv0l | 317 | 惋惜/3 | uxxr | |||
288 | 万岁/3 | uv3x | 318 | 玩笑/3 | uxza | |||
289 | 网队/3 | uver | 319 | 外运/3 | uy2z | |||
290 | 湾 | uvg | 320 | 外援/2 | uy8i | |||
291 | 温水 | uvga | 321 | 外语/3 | uydk | |||
292 | 完税/3 | uvh2 | 322 | 腕 | uye | 15 --> | ||
293 | 玩味/3 | uvkv | 323 | 望远镜 | uyj | |||
294 | 温 | uvm | 324 | 文员/3 | uykr | |||
295 | 晚会/2 | uvrz | 325 | 文娱/3 | uyna | |||
296 | 汪 | uvu | 326 | 外遇/3 | uyrz | |||
297 | 外汇/3 | uvv0 | 327 | 外在/3 | uz1t | |||
298 | 外向 | uxpk* | 328 | 问政 | uz1u | |||
299 | 外需 | ux12 | 329 | 外资/3 | uz2r | |||
300 | 外形/3 | ux1p | 330 | 婉转/3 | uz7d |
6-1.电脑/手机汉字汉词键盘输入
中英文两用键盘由通用键盘经如下增补获得:按图1将26个汉语拼音字母块码abc…yz依次标注在26个英语字母键QWE…NM的右下角,10个***数字块码123…90在键盘原位,默认状态为高频汉词输入。
手机指安装了数字键、字母键和视屏的任何手持电子设备,手机键盘按图2将10个***数字块码123…90和26个汉语拼音字母块码abc…yz标注到18个键上,默认状态为高频汉词输入。
在中英文两用键盘上顺序单击某字词/高频词的扩码对应各键位及空格键,电脑视屏仅显示该字词/高频词(“显示某”指“在编辑位置显示某并进入下一输入”,下同)。例如,顺序单击“蜼/容易”的扩码cv0/r1r5对应的键c键v键0空格键/键r键1键r键5空格键,视屏仅显示“蜼/容易”;
在手机键盘上顺序单击或双击某字词/高频词的扩码对应各键位及*键(规定仅当输入块码i~z时双击对应键位),手机视屏仅显示该字词/高频词。例如,顺序单击键c双击键v单击键0单击键*/双击键r单击键1双击键r单击键5单击键*,视屏仅显示“蜼/容易”;
任何字/词的拼块码后缀多少0成其扩码让机器去记识,用户只消顺序键完所欲字/词的拼块码必要时接续键0直到该字/词在视屏出现(下简称“屏现”)。例如,顺序键完“蜼”的拼块码cv再键1个0,“蜼”才屏现。
至于简码键入方式,用户完全免记哪些字/词有哪级简码,他只消顺序键击所欲字/词的拼块码至该字/词屏现。例如,顺序键击“容易”的拼块码r1r5至r1,“容易”已屏现。
本键盘输入法的选字/选词键次绝对为0,兼容众多方言普通话音故适量练习后纠错键次几乎为0,总体输入效率极高。
6-2.PDA(个人数字助理)汉字汉词手写输入
在PDA中预置码感应模块、码识别模块、码-字词转换模块、字词显示模块。
在码感应区用手指或触笔顺序写完某字词/高频词的扩码并给结束信号(可以是延时停顿、单击感应区、或其它预定操作),码识别器接受该码,码-字词转换器检出赋有该码的惟一字词/高频词,视屏仅显示该字词/高频词。例如,在码感应区用手指或触笔顺序写完“蜼/容易”的扩码cv0/r1r5并给结束信号,码识别器接受该码,码-字词转换器检出赋有该码的惟一字词/高频词即“蜼/容易”,视屏仅显示“蜼/容易”;
任何字/词的拼块码后缀多少0成其扩码让机器去记识,用户只消顺序写完所欲字/词的拼块码必要时接续写0直到该字/词屏现。例如,顺序写完“蜼”的拼块码cv再写1个0,“蜼”才屏现。
至于简码写入方式,用户完全免记哪些字/词有哪级简码,他只消顺序书写所欲字/词的拼块码至该字/词屏现。例如,顺序书写“容易”的拼块码r1r5至r1,“容易”已屏现。
本手写输入法的码-字词转换准确率极高,因为块码只有012…9abc…z这36个,数字0与字母o之别,写成前者竖扁后者横扁即可;在感应区手写字词码时,只消保持各块码顺序,容许大小不一甚至位置重叠,用户无需将注意力集中在感应区,PDA的尺寸可以很小。总体效率,写字词码较写字词快易无算。
6-3.车载导航设备汉字汉词语音输入
在车载导航设备中预置音感应模块、音-码转换模块、码识别模块、码-字词转换模块、字词显示模块。
在音感应区顺序读完某字词/高频词的扩音并给结束信号(可以是延时停顿、或其它预定操作),音-码转换器将该扩音转换成对应扩码,码识别器接受该码,码-字词转换器检出赋有该码的惟一字词/高频词,视屏仅显示该字词/高频词。例如,在音感应区顺序读完“蜼/容易”的扩音congcueilin/rongiriu并给结束信号,音-码转换器将该扩音转换成对应扩码cv0/r1r5,码识别器接受该码,码-字词转换器检出赋有该码的惟一字词/高频词即“蜼/容易”,视屏仅显示“蜼/容易”;
任何字/词的拼块音后缀多少丨in成其扩音由机器去记识,用户只需顺序读完所欲字/词的拼块音必要时接续读lin直到该字/词屏现。例如,顺序读完“蜼”的拼块音congcuei再读1个lin,“蜼”才屏现。
至于简音读入方式,用户完全免记哪些字/词有哪级简音,他只消顺序朗读所欲字/词的拼块音至该字/词屏现。例如,顺序朗读“容易”的拼块音rongiriu至rongi,“容易”已屏现。
本语音输入法的音-字词转换准确率和总体输入效率都很高,因为机器在最易出问题的音-码转换环节只需识别拼块音读中的涉码音素;对于可能惹事的几组构块如“木、目”,“耳、儿”,“十、石”的声调,则规定唯“木”的读法是mu一声,“耳”及其枝的读法是er一声,“十”及其枝的读法是shi一声。
一般人早已能读会写上万高频词,故稍经练习便能盲念其拼块音同时完成其想输(不拘键入、写入、读入),兼得其写记巩固之利。
上面严格而完备地描述了本发明的一个具体实施例,即将本发明实施于全部汉字汉词的电脑/手机键盘输入、PDA手写输入、车载导航设备语音输入。应当明白,这只是帮助理解本发明的一个例子,并不构成对本发明保护范围的限制,本发明当然能按同样方式在任何信息处理设备上键入、写入、读入任何汉字集或汉词集,只要该设备配置了步骤6-1、6-2、6-3中描述的那些键盘和内置模块。另外,为完善本发明而对键盘设置、构块表以及确定块音、块码、块顺、拼块音、拼块码的规则等可能作出的调整【譬如在把中文大规模书名录、人名录、企业名录、动植物名录、习语名句录等特殊文本当成汉词集来处理时,词的拼块音规则宜做适应性调整】均落在本发明范围内。
Claims (4)
1.全部汉字汉词简易无重码统一输入法改进,其特征是包括下列步骤:
汉语拼音恢复本来写法,再ü/ao换成y/au,声调不计;
每个字中按笔顺的相继数画称为该字的一个子块,n画字恰有n(n+1)/2个子块;字中的几个子块称为相继的,若按笔顺其中每一个的末画与下一个的首画构成该字的上下两画;字中无公共笔画的子块间的相交、相接关系按笔画间的同名关系理解;
用来组成全部汉字的下列287子块称为构块,简称块:
构块表
表中字号较大的称为根,较小的称为枝;根的拼音属于常识,枝的拼音规定是其根的拼音,块的拼音称为块音;
块/非笔形根若是字则称块字/根字;
多画块的下列3种变形之一若不变各画间关系且未成别块则视同原块:1)“未”除外的块中某一画的伸缩或位移;2)块中某一“乚”换为之一,或“丿”换为“丨”,或“一”换为“乛”;3)块中某一画或其末段换为它的对偶,这里称“一”与“丨”与“亅”、“丶”与对偶;视同“丰/冎//电”,视同“凹/巴/了/予/或/虎”;
块码是块音首字母,但依次有下列5种变通之一:1)若“耳、十”及其枝除外的块音与“〇、一、二、…、九”之一的块音在不区别起头的sh和s、n和I及结尾的ng和n这一前提下相同,则块码是对应***数字;2)若块音末字母为a,则块码是a;3)若块音末字母为o,则块码是o;4)若块音末三字母为uei,则块码是v;5)“木”的块码是w;
依次遵守下列3条简明规则逐一拆下某字的相继构块直至拆尽该字的全部笔画,得到的惟一一串块称为该字的块顺:1)块少拆得的块尽量少,但多画字拆成至少2块,其构块“口、冂、厂、”依次力避拆散,字的型子块单独分拆,且“*”的余部自成一块除非拆得的块更少,“斗、头”拆成3块;2)字大拆得的诸根字总画数尽量大,但相继两块依次力避相交、相接;3)先小先拆得的块画数尽量小;
当字含有笔顺难判的子块,其笔顺约定使拆分维持“块少、字大、先小”3规则,但字中包含该子块的列分明方块先写左列后写右列;
字的块顺含n个块,该字即称n块字;
字的拼块音按下表简明确定:
词的拼块音按下表简明确定:
词中每个***数字和汉语拼音字母看做1块根字;2/3字词若首字/首次字的拼块音少于3/2块音,则从后续字的拼块音中增取块音力求词的拼块音各字均摊地达到5块音;
高频词的拼块音按下表简明确定:
这里一字的字音特指该字被看做根时赋有的块音;
由字/词的拼块音将其中每一块音换为同块码,即成该字/词的拼块码;
设依次按降频、CJK字符集、扩展A集、B集、…、各字块数、各块画数、各画笔形、各字结构排列的若干字的拼块码都是S1S2S3S4,规定第t字的扩码是S1S2S3S4后缀t-1个0;又设若干字的拼块码都是S1S2S3同时n个字的拼块码都是S1S2S30,规定前者第1字的扩码是S1S2S3,第t字的扩码是S1S2S3后缀n+t-1个0,这里t≥2;如此继续直至不同字形赋有不同扩码;同样处理,不同词形/高频词形也必有不同扩码;字/词的拼块音后缀同样多个lin即成它的扩音;
字/词的拼块码前n块码称为它的n级简码,拼块音前n块音称为它的n级简音;
任何汉字汉词的键盘输入步骤如下:
在中英文两用键盘上顺序单击某字词/高频词的扩码对应各键位及空格键,电脑视屏仅显示该字词/高频词;在手机键盘上顺序单击或双击某字词/高频词的扩码对应各键位及*键,手机视屏仅显示该字词/高频词,这里规定仅当输入块码i~z时双击对应键位;字/词的拼块码后缀多少0成其扩码让机器去记识,用户只消顺序键完所欲字/词的拼块码必要时接续键0直到该字/词屏现;
简码键入方式,用户完全免记哪些字/词有哪级简码,他只消顺序键击所欲字/词的拼块码至该字/词屏现;
任何汉字汉词的手写输入步骤如下:
在既定设备的码感应区用手指或触笔顺序写完某字词/高频词的扩码并给结束信号,码识别器接受该码,码-字词转换器检出赋有该码的惟一字词/高频词,视屏仅显示该字词/高频词;字/词的拼块码后缀多少0成其扩码让机器去记识,用户只消顺序写完所欲字/词的拼块码必要时接续写0直到该字/词屏现;
简码写入方式,用户完全免记哪些字/词有哪级简码,他只消顺序书写所欲字/词的拼块码至该字/词屏现;
任何汉字汉词的语音输入步骤如下:
在既定设备的音感应区顺序读完某字词/高频词的扩音并给结束信号,音-码转换器将该扩音转换成对应扩码,码识别器接受该码,码-字词转换器检出赋有该码的惟一字词/高频词,视屏仅显示该字词/高频词;字/词的拼块音后缀多少lin成其扩音让机器去记识,用户只消顺序读完所欲字/词的拼块音必要时接续读lin直到该字/词屏现;
简音读入方式,用户完全免记哪些字/词有哪级简音,他只消顺序朗读所欲字/词的拼块音至该字/词屏现。
2.如权利要求1所述的全部汉字汉词简易无重码统一输入法改进,其特征在于,它的键盘输入部分所称中英文两用键盘由通用键盘经如下增补获得:按图1将26个汉语拼音字母块码abc…yz依次标注在26个英语字母键QWE…NM的右下角,10个***数字块码123…90在键盘原位,默认状态为高频汉词输入;所称手机指安装了数字键、字母键和视屏的任何手持电子设备,手机键盘按图2将10个***数字块码123…90和26个汉语拼音字母块码abc…yz标注到18个键上,默认状态为高频汉词输入。
3.如权利要求1所述的全部汉字汉词简易无重码统一输入法改进,其特征在于,它的手写输入部分所称既定设备指预置了码感应模块、码识别模块、码-字词转换模块、字词显示模块的任何信息处理设备。
4.如权利要求1所述的全部汉字汉词简易无重码统一输入法改进,其特征在于,它的语音输入部分所称既定设备指预置了音感应模块、音-码转换模块、码识别模块、码-字词转换模块、字词显示模块的任何信息处理设备。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201510823609.3A CN105511636B (zh) | 2015-11-25 | 2015-11-25 | 改进的全部汉字汉词简易无重码统一输入法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201510823609.3A CN105511636B (zh) | 2015-11-25 | 2015-11-25 | 改进的全部汉字汉词简易无重码统一输入法 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN105511636A true CN105511636A (zh) | 2016-04-20 |
CN105511636B CN105511636B (zh) | 2018-05-04 |
Family
ID=55719685
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201510823609.3A Active CN105511636B (zh) | 2015-11-25 | 2015-11-25 | 改进的全部汉字汉词简易无重码统一输入法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN105511636B (zh) |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN106774987A (zh) * | 2017-01-10 | 2017-05-31 | 秦明 | 全部汉字汉词简易无重码统一输入法定型 |
CN108304082A (zh) * | 2018-02-27 | 2018-07-20 | 秦明 | 全部汉字汉词简易无重码通用输入法 |
Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
TWI280491B (en) * | 2002-05-03 | 2007-05-01 | Easyten Technology Ltd | Easyten Chinese text processing and inputting method |
CN101183279A (zh) * | 2007-11-14 | 2008-05-21 | 秦一明 | 汉字输入拼块音方案 |
CN103246363A (zh) * | 2013-05-24 | 2013-08-14 | 秦一明 | 高频词语并全部汉字电脑/手机快易键盘输入法 |
CN104571593A (zh) * | 2015-02-10 | 2015-04-29 | 秦一明 | 全部汉字汉词简易无重码统一输入法 |
-
2015
- 2015-11-25 CN CN201510823609.3A patent/CN105511636B/zh active Active
Patent Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
TWI280491B (en) * | 2002-05-03 | 2007-05-01 | Easyten Technology Ltd | Easyten Chinese text processing and inputting method |
CN101183279A (zh) * | 2007-11-14 | 2008-05-21 | 秦一明 | 汉字输入拼块音方案 |
CN103246363A (zh) * | 2013-05-24 | 2013-08-14 | 秦一明 | 高频词语并全部汉字电脑/手机快易键盘输入法 |
CN104571593A (zh) * | 2015-02-10 | 2015-04-29 | 秦一明 | 全部汉字汉词简易无重码统一输入法 |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN106774987A (zh) * | 2017-01-10 | 2017-05-31 | 秦明 | 全部汉字汉词简易无重码统一输入法定型 |
CN108304082A (zh) * | 2018-02-27 | 2018-07-20 | 秦明 | 全部汉字汉词简易无重码通用输入法 |
Also Published As
Publication number | Publication date |
---|---|
CN105511636B (zh) | 2018-05-04 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
Lee et al. | A history of the Korean language | |
CN103838392B (zh) | 高频词语并全部汉字快易的键盘、手写、语音输入法 | |
Ngu et al. | Ethnic minority language culture, places with original tay language elements and names inconsistence in Tuyen Quang provinces | |
CN103336803B (zh) | 一种嵌名春联的计算机生成方法 | |
CN105511636A (zh) | 全部汉字汉词简易无重码统一输入法改进 | |
CN102053719A (zh) | 华文汉字输入法 | |
Stec | The Genizah Psalms: A Study of MS 798 of the Antonin Collection. Cambridge Genizah Studies Series, Volume 5 | |
CN104571593B (zh) | 全部汉字汉词简易无重码统一输入法 | |
Miller | Juba Arabic as a written language | |
CN106774987A (zh) | 全部汉字汉词简易无重码统一输入法定型 | |
Zhao | Cultural Characteristics and Literature Value of Traditional Guqin Music | |
CN103777771B (zh) | 易捷速录系列输入方法 | |
CN103176614A (zh) | 多键共击速录 | |
Nissan et al. | One zoonym, two parents: mendele’s phono-semantic matching of animal terms, and Later Developments of Lexical confluence in Modern Hebrew zoonymy | |
Birkenes | North Frisian dialects: A quantitative investigation using a parallel corpus of translations | |
CN101303626A (zh) | 一种拼音输入法重码多的解决方法 | |
CN100440113C (zh) | 计算机汉字输入法 | |
CN112328095B (zh) | 基本不用数字键选字的四用音形码汉字输入法及输入平台 | |
CN101706685A (zh) | 一种汉字输入法 | |
CN117612553B (zh) | 一种现代语音采录、分析及展示*** | |
Guangguang | The Tongcheng School and the social thought of the late Qing dynasty | |
US20240143089A1 (en) | Digitized New Language, Input Method Therefor, and Input Tool Therefor | |
CN1328649C (zh) | 汉字“三形联想”形码输入法 | |
CN101813979B (zh) | 汉字拼音文字码输入法 | |
Holm | Vernacular Chinese-Character Manuscripts from East and Southeast Asia |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
C06 | Publication | ||
PB01 | Publication | ||
C10 | Entry into substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |