CN104537079B - 易通汉字字词新查法 - Google Patents
易通汉字字词新查法 Download PDFInfo
- Publication number
- CN104537079B CN104537079B CN201410851284.5A CN201410851284A CN104537079B CN 104537079 B CN104537079 B CN 104537079B CN 201410851284 A CN201410851284 A CN 201410851284A CN 104537079 B CN104537079 B CN 104537079B
- Authority
- CN
- China
- Prior art keywords
- word
- chinese
- character
- chinese character
- information
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired - Fee Related
Links
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/30—Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
- G06F16/36—Creation of semantic tools, e.g. ontology or thesauri
- G06F16/374—Thesaurus
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/30—Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
- G06F16/33—Querying
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Computational Linguistics (AREA)
- Data Mining & Analysis (AREA)
- Databases & Information Systems (AREA)
- Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Document Processing Apparatus (AREA)
Abstract
本发明公开了一种易通汉字字词新查法,通过给当前操作***汉字库所含GB13000.1字符集的20902个汉字,建立包含“汉字、部件、汉字笔顺码、笔画数、拼音、字级……”等信息的Access数据表,根据数据表中可用于解决汉字查询的数据信息、Access提供的排序、筛选、查询和查找重复项等功能及科学精准的获取优质汉字字词新查法的实际需要,开发专用的汉字拆字查字研究工具,找出能用汉字的部件信息、汉字笔顺码信息、笔画数信息和拼音信息等四种查字信息组合而成的综合查询信息的子信息,将计算机操作***汉字库所含GB13000.1字符集的20902个汉字的查字问题解决好的汉字部件选取办法、汉字部件查询办法、汉字查字办法和汉字词语查询法。
Description
技术领域
本发明涉及计算机中文信息处理技术,具体来说是一种易通汉字字词新查法。
背景技术
目前网络汉语字词典能查到操作***汉字库所含每一汉字的释义,除给出部首、拼音、笔画等检索办法外,还给出直接输入汉字检索的办法。因所给汉字检索办法不够好,许多陌生字没法较顺利的查出输出,没法让其作用很好发辉。
把汉字输入计算机的方法很多,不管是谁用什么汉字输入法输字,都可能会遇到不会输的汉字,不会输的汉字可能属于操作***汉字库中的汉字,也可能不属于操作***汉字库中的汉字。现在投稿件、上报材料、填写报表都要求使用电子文档或计算机打印,面对此情况,对每个用计算机办公写文章的人员而言,能圆满完成输字工作任务的标准应当是:输相关文件、填相关报表与写相关文章时,凡用到属于操作***汉字库中的汉字,都能用计算机输出,对操作***汉字库中没有的汉字,能用操作***提供的造字工具造出。
上述情况表明,获取用国家语委制定的标准化汉字字形信息和字音信息将含于操作***汉字库中的不会输汉字字词顺利查出输出的办法,除能帮助用计算机输汉字的人员圆满完成输字工作外,还能帮助用户通过网络中的汉语字词典给用户提供的直接输入汉字字词检索功能,方便的查到操作***汉字库中任意一个汉字字词的拼音与释义等信息。既有利用计算机输汉字的人员圆满完成输字工作,也有利人们对汉字字词信息的了解,有利写文章能正确用字用词,看文章能正确理解文章含意,有利电脑字词典效果的发挥,有利语言文字规范化,有利汉字所具优越性的展示,有利汉字文化传承。
申请人于2011年6月1日获国家知识产权局发明专利证书的“计算机输字易通汉字编码输入法”(专利号:ZL200610010783.7)的权利要求4给出了解决此问题的一个办法。提交该专利申请时,还没有完成GB13000.1字符集的20902个汉字的拆字工作,所以专利号为ZL200610010783.7的“计算机输字易通汉字编码输入法”的权利要求4所述办法存在对问题考虑不周,所述办法有缺点,必须在其基础上获取改进办法。
发明内容
本发明的目的在于针对上述现有技术中存在的不足,提供一种易通汉字字词新查法,通过给当前操作***汉字库所含GB13000.1字符集的20902个汉字,建立包含“汉字、部件、汉字笔顺码、笔画数、拼音、字级……”等信息的Access数据表,根据数据表中可用于解决汉字查询的数据信息、Access提供的排序、筛选、查询和查找重复项等功能及科学精准的获取优质汉字字词新查法的实际需要,开发专用的汉字拆字查字研究工具,找出能用汉字的部件信息、汉字笔顺码信息、笔画数信息和拼音信息等四种查字信息组合而成的综合查询信息的子信息,将计算机操作***汉字库所含GB13000.1字符集的20902个汉字的查字问题解决好的汉字部件选取办法、汉字部件查询办法、汉字查字办法和汉字词语查询法。
本发明通过如下技术方案予以实现:
易通汉字字词新查法,将查询汉字的字形信息取为部件,对计算机操作***汉字库所含GB13000.1字符集的20902个汉字,建立包含“汉字、部件、汉字笔顺码、笔画数、拼音、字级”等6信息的Access数据表,对数据表中用于解决汉字查询的“部件、汉字笔顺码、笔画数、拼音”四信息,用Access的排序、筛选、查询和查找重复项功能,获取用每一汉字所含“部件、汉字笔顺码、笔画数、拼音”四种查字信息组合而成的综合查字信息的子信息,解决GB13000.1字符集中的汉字查字办法,其中“汉字、汉字笔顺码、笔画数、拼音、字级”5信息取国家语委标准化工作委员会颁布的标准化信息,部件选取遵循的主要原则是:对GB13000.1字符集的全部汉字,每个汉字的每个部件的选取都在含相交笔画的组字笔画结构一律不拆、不能按被拆汉字的笔顺码顺序选取得到的部件一律不取的前提下,根据被拆汉字的规范字形体结构,按照被拆汉字的笔顺码顺序依次选取被拆汉字所含的组字笔画结构为被拆汉字的查字部件,简称部件,只与其它汉字有相同组字笔画结构的被拆汉字,取其它汉字也含的相同组字笔画结构为被拆汉字的部件;既含其它汉字含有的相同组字笔画结构,也含其它汉字没有的组字笔画结构的汉字,除被拆汉字所含其它汉字也含的相同组字笔画结构取为被拆汉字的部件外,被拆汉字所含其它汉字没有的组字笔画结构,也取为被拆汉字的部件;与其它汉字没有相同组字笔画结构的汉字,取自身为部件;全包围结构的汉字和含全包围结构的汉字所含全包围部件一律不拆,其中每个全包围结构的汉字都取自身为部件,每个含全包围结构的汉字,都将所含全包围结构取为一个部件;特殊半包围结构的汉字和含特殊半包围结构的汉字所含特殊半包围部件一律不拆,其中每个特殊半包围结构的汉字都取自身为部件,每个含特殊半包围结构的汉字,都将所含特殊半包围结构取为一个部件;能拆复合部件的汉字,不拆复合部件所含的子部件;每一汉字所含各个部件的部件笔顺码都用该汉字的汉字笔顺码依次获得,每一汉字的汉字笔顺码都等于自身依次拆得的各个部件的部件笔顺码之和。
在限定每字最多只拆四个部件的前提下,用汉字部件信息解决操作***汉字库所含GB13000.1字符集20902个汉字的查字问题时,使用的部件有1105个,其中成字部件有780个,非成字部件有325个,
780个成字部件是:一二丅十丁厂丆匚匸七丂三干亍于亏亐工土士扌艹卄才下寸不廾大丈兀尢万弋夨丰王开井天夫元无韦弌云专耂丐廿木朩五帀巿支丏卅不犬太区歹友尤匹车巨牙屯戈比旡兂互瓦弍玉匞未末示戋正甘世丗卌古本术可叵匝丙左石夲戊龙匛平东匜戉弎匡耒式戎圭吉耳共亚亘臣吏再覀襾朿西亙戌百而页匠戍匢死成匟夹夷至匤戒走贡赤声巫求車甫匣更亜束豆戓两酉丽医辰丣夾豕尨来亊忒匥巠武青甙匦者夌幸亞其昔若直林來東或事雨匼豖贰匧垚壴哉革匽畐柬咸威頁匨匩珤敖匿匪髟栽馬载貢烖盍莫莧尃彧鬲烕原匫彗匭貮埶黄萑戜匮區戚帶匬爽匾貳臷蛓胾裁壹黃棥厤尞雲載酨畺匯雷匲截匱匰監爾臧奭韯匳噩匴匵戴匶匷丨亅丄刂卜冂上小口囗山巾止卝攴少曰日冄中円贝罓内內水见禸北凸歺业氺旦目且曱甲申电田由史央兄叹甴冉罒皿冊凹冋囚四囙囜尗虍光早吋曳虫曲团団吅吕同因回网肉囝囡貝見囯里呆囲园围囩足男困串囨邑囤囬囦囮囧冏囵囫囥図非齿虎果国門囸固丳囷囶囹图囻囼韭昜禺品囿圀骨幽鬥丵畢圃圄圂圆圁鹵堂圊曼圉國圇圈歮猒晶單買圌圐圏黑圍圎黽園圔圑睘蜀圓圕團圖圙圗齒畾嘼圚圛圜豳圝圞丿亻八人入乂勹儿匕几九千乇乞川彳彡亇犭夕久夂夊么勺凡丸及饣午牛手气毛壬牜升夭攵长片化币斤爪丯戶父从仌爻爫仒今凶分月厃氏勿欠匁风丹乌殳钅生矢失乍禾丘白斥瓜乎令用甩尔乐句匆匃册处鸟刍年朱缶先舌臼乑自血向囟舟合兆旨各多色我呑每身囱佥釆谷豸角夆系垂幷秉臾隹卑金釒侖飠周鱼兔卸乗香重复泉鬼禹盾俞兪爰食風埀乘倠奚鬯倉眞鳥魚鼠僉會鼻龜龠丶乁乀亠冫丷冖讠丬广亡门丫氵忄宀辶之六文方火为斗灬户礻冘心主疒立玄半头穴衤必永亦衣产吂亥羊米屰农言訁辛羌弟良京育单炏炎畄官音前酋高剡窊麻鹿章産寅戠寍惢廌褱龍嬴贏乛乚乙了凵丩卩阝刀力乃又厶乄廴巜乜彐卂尸己已巳弓子孑屮孓卪也女乆刃刄飞叉马彑纟乡幺巛肀尹卐尺夬弔丑卍爿巴刅办以予毌书毋司民弗疋出氶丱召皮发癶矛母聿帇艮劦羽叒厽糸糹戼夋肃录帚承叕韋孨飛弱能粛敢尋發肅辟歰維;325个非成字部件是:
查字软件给用户提供用查询部件的“部件笔顺码”信息和查询部件的“笔画数”信息,查询“查字部件”和输入“查字部件”的办法,其中查询部件的“部件笔顺码”信息的输入信息是含“代表一个笔形代码的通配符?、代表0至多个笔形代码的通配符*、查询部件所含笔顺码”的部件笔顺码字符串,其特征在于,查询部件的“笔画数”信息的输入信息有以下3种格式:①1至26间的某一正整数、②介于1至26间的某二正整数间的全部自然数、③代表1至26间的全部笔画数的通配符*,打开部件笔顺码查询部件对话框,用户按规定输入查询部件所含上述查询信息中的任意一子信息,发出“查询”指令后,查字软件磁盘文件中的程序,除能按用户所输查询信息的情况,迅速从查字软件部件信息表的全部记录中,筛选出满足用户所输查询条件的每一目标记录,除将筛选出的每一目标记录在部件信息表中存储着的“部件、笔画数、部件笔顺码、首部件用量、末部件用量、笔顺情况、部件情况”共七种信息列表显示给用户外,还将满足查询条件的记录数量显示给用户,用户看了满足查询条件的记录后,根据满足查询条件的记录情况,在原来所输查询信息的基础上对原来所输查询信息作修改和修改后的查询;显示内容标题栏中的“部件、笔画数、部件笔顺码、首部件用量、末部件用量、笔顺情况、部件情况”,既是满足查询条件的记录列表显示的列标题,也是满足查询条件的记录按指定顺序排序的命令按钮,简称排序按钮,单击不同的排序按钮,使满足查询条件的记录产生不同的排序方式,给准确获取所需部件提供不同的方便,用户从满足查询条件的记录中找到所须“查询部件”后,选中所须查询部件,单击“复制”按钮,返回需要输入查询部件的地方,按Ctrl+V,查询部件就能粘贴到需要输入查询部件的地方。
所述查字软件对操作***汉字库所含GB13000.1字符集的20902个汉字给出的汉字综合信息查字法,用查询汉字所含“部件、汉字笔顺码、笔画数、拼音”4种信息组合而成的综合查询信息的任意一个子信息,获取查询汉字的办法,查询汉字的“部件”信息的输入信息是含“代表一个部件的通配符?、代表0至多个部件的通配符*、查询汉字所含部件”的部件字符串;查询汉字的“汉字笔顺码”信息的输入信息是含“代表一个笔形代码的通配符?、代表0至多个笔形代码的通配符*、查询汉字所含笔顺码”的汉字笔顺码字符串;查询汉字的“笔画数”信息的输入信息有以下3种格式:①1至48间的某一正整数、②介于1至48间的某二正整数间的全部自然数、③代表1至48间的全部笔画数的通配符*;查询汉字的“拼音”信息的输入信息是含“代表一个拼音字符的通配符?、代表0至多个拼音字符的通配符*、查询汉字所含拼音字符”的拼音字符串;打开综合信息查字法对话框,用户按规定输入查询汉字所含上述查询中的一子信息,发出执行指令后,查字软件磁盘文件中的程序,除能按用户所输查询信息的情况,迅速从GB13000.1字符集的20902个汉字存储在查字信息表的全部记录中,筛选出满足用户所输查询信息条件的每一目标记录,除将筛选出的每一目标记录在“汉字、拼音、部件、笔画数、部件式汉字笔顺码、字级”共6个字段中的字段值,用列表显示法显示给用户外,还将全部目标记录的数量显示给用户,用户看了满足查询条件的记录后,根据满足查询条件的记录情况,在原来所输查询信息的基础上对原来所输查询信息作修改和修改后的查询;显示内容标题栏中的“汉字、拼音、部件、笔画数、部件式汉字笔顺码、字级”,既是满足查询条件的记录列表显示的列标题,也是满足查询条件的记录按指定顺序排序的命令按钮,简称排序按钮,单击不同的排序按钮,使满足查询条件的记录产生不同的排序方式,给准确解决查字问题提供不同的方便。
所述查字软件对操作***汉字库所含GB13000.1字符集的20902个汉字还给出:①1至数片断汉字笔顺码查字法、②首末部件查字法、③首部件加后数汉字笔顺码查字法、④前数汉字笔顺码加末部件查字法共四种简单信息查字法,其中一至数片断汉字笔顺码查字法使用的查询信息,是查询汉字所含笔顺码、通配符?、通配符*组成的1至数片断汉字笔顺码字符串和查询汉字的笔画数二查询信息;首末部件查字法使用的查询信息由查询汉字所含的第一部件、末部件和查询汉字的笔画数3查询信息组成;首部件加后数笔顺码查字法使用的查询信息由查询汉字的首部件,查询汉字首部件后数个笔画的笔形代码、通配符?、通配符*组成的后数笔顺码字符串和查询汉字的笔画数3查询信息组成;前数笔顺码加末部件查字法使用的查询信息由查询汉字末部件前的数个笔画的笔形代码、通配符?、通配符*组成的前数笔顺码字符串,查询汉字的末部件和查询汉字的笔画数3查询信息组成;用户选定上述四种查字法中的任意一种查字法,打开相应查字法对话框,并按选定查字法给出的查询信息输入方式输完查询信息后,发出执行指令,查字软件磁盘文件中的程序,除能按用户所输查询信息的情况,迅速从GB13000.1字符集的20902个汉字存储在查字信息表的全部记录中,筛选出满足相应查询条件的每一目标记录,除将筛选出的每一目标记录在“汉字、拼音、部件、笔画数、部件式汉字笔顺码、字级”共6个字段中的字段值,用列表显示法显示给用户外,还将全部目标记录的数量显示给用户,用户看了满足查询条件的记录后,根据满足查询条件的记录情况,在原来所输查询信息的基础上对原来所输查询信息作修改和修改后的查询;显示内容标题栏中的“汉字、拼音、部件、笔画数、部件式汉字笔顺码、字级”,既是满足查询条件的记录列表显示的列标题,也是满足查询条件的记录按指定顺序排序的命令按钮,简称排序按钮,单击不同的排序按钮,使满足查询条件的记录产生不同的排序方式,给准确解决查字问题提供不同的方便。
所述查字软件对操作***汉字库所含GB13000.1字符集的20902个汉字中,含有查字关键字的二部件字、三部件字和四部件字等3种汉字,还给出输查字关键字查字的特殊信息查字法,输查字关键字查字法使用的查询信息是查询汉字所含的“查字关键字”,用户选定输查字关键字查字法,打开输查字关键字查字法对话框,并在“查字关键字”信息输入框中输入查询汉字所含的一个查字关键字,发出“查询”指令,查字软件磁盘文件中的程序,能迅速从GB13000.1字符集的20902个汉字存储在查字信息表的全部记录中找到用户所输查字关键字所在的记录,将用户所输查字关键字的部件情况显示给用户,并根据查字关键字的部件数量,给出获取查询汉字可作的相关选择,用户根据查询汉字的构字情况,作出获取查询汉字应作的选择后,查字软件磁盘文件中的程序,能按用户所作选择,迅速从GB13000.1字符集的20902个汉字存储在查字信息表的全部记录中,筛选出满足用户所作选择的每一目标记录,除将筛选出的每一目标记录在“汉字、拼音、部件、笔画数、部件式汉字笔顺码、字级”等6个字段中的字段值,用列表显示法显示给用户外,还将全部目标记录的数量显示给用户,显示内容标题栏中的“汉字、拼音、部件、笔画数、部件式汉字笔顺码、字级”,既是满足查询条件的记录列表显示的列标题,也是满足查询条件的记录按指定顺序排序的命令按钮,简称排序按钮,单击不同的排序按钮,能让满足查询条件的记录产生不同的排序方式,给准确解决查字问题提供不同的方便。
所述查字软件对汉字词语给出的汉字词语综合信息查询法由查询汉字词语的“词语字数、词语汉字、词语汉字首部件、词语汉字末部件、词语简拼、词语全拼”等6种查询信息组成,其中查询词语的“词语字数”信息输入框中的输入信息是查询词语所含汉字的字数;查询词语的“词语汉字”信息输入框中的输入信息是查询词语所含的汉字与通配符?、*组成的词语汉字字符串;查询词语的“词语汉字首部件”信息输入框中的输入信息是查询词语所含汉字的首部件与通配符?、*组成的词语汉字首部件字符串;查询词语的“词语汉字末部件”信息输入框中的输入信息是查询词语所含汉字的末部件与通配符?、*组成的词语末部件字符串;查询词语的“词语简拼”信息输入框中的输入信息是查询词语所含汉字的拼音首字母与通配符?、*组成的词语简拼字符串;查询词语的“词语全拼”信息输入框中的输入信息是查询词语所含汉字的拼音字母与通配符?、*组成的词语全拼字符串;打开汉字词语综合信息查询法对话框,用户按规定输入查询汉字所含上述查询信息中的任意一子信息,发出“查询”指令后,查字软件磁盘文件中的程序,除能按用户所输查询信息的情况,迅速从汉字字词查询软件中的汉字词语信息表的全部记录中,筛选出相应字段的字段值分别满足相应查询条件的每一目标记录,除将筛选出的每一目标记录在“词语字数、词语汉字、词语汉字首部件、词语汉字末部件、词语全拼”等5个字段中的字段值,用列表显示法显示给用户外,还将全部目标记录的数量显示给用户,用户看了满足查询条件的记录后,可根据满足查询条件的记录情况,在原来所输查询信息的基础上对原来所输查询信息作修改和修改后的查询;显示内容标题栏中的“词语字数、词语汉字、词语汉字首部件、词语汉字末部件、词语全拼”,既是满足查询条件的记录列表显示的列标题,也是满足查询条件的记录按指定顺序排序的命令按钮,简称排序按钮,单击不同的排序按钮,能让满足查询条件的记录产生不同的排序方式,给准确解决汉字词语查询问题提供不同的方便。
所述的选取汉字部件遵循的主要原则,用于限定每字最多只拆五个部件至五部件以上的多种汉字部件选取办法的汉字字词查询,还用于《通用规范汉字表》的汉字字词查询与其它汉字字集的汉字字词查询、还用于含汉字部件查字的汉语电脑字词典的汉字部件产生办法。
所述的查字软件给用户提供用部件笔顺码或部件笔顺码字符串查询“查字部件”和输入“查字部件”的办法,用于含汉字部件查字的汉语电脑字词典的汉字部件的查询和输入。
所述查字软件用于含汉字部件查字的汉语电脑字词典的汉字字词查询。
通过上述方法将查询汉字使用的字形信息由部首变为部件,让每一汉字所含每个部件都能根据该汉字的形体结构和国家语委标准化工作委员会制定的汉字笔顺规范获得,都能用于汉字查询,除让每一汉字所含的部件信息、笔顺码信息、笔画数信息和拼音信息等查字信息的子信息都可任意的合在一起用于汉字查询外,还让汉字词语的词语字数信息、词语汉字信息、词语汉字首部件信息、词语汉字末部件信息、词语简拼信息、词语全拼信息等各词语查询信息的子信息也可任意合在一起用于汉字词语查询。具体办法是,通过给计算机操作***汉字库所含GB13000.1字符集的20902个汉字,建立包含“汉字、部件、汉字笔顺码、笔画数、拼音、字级”等信息的Access数据表,对数据表中可用于解决汉字查询的“部件、汉字笔顺码、笔画数、拼音”等信息,用Access的排序、筛选、查询和查找重复项等功能,获取与规范汉字书写知识结合得好,易掌握易应用且查字效果好的部件信息,除用每一汉字所含的“部件信息、笔顺码信息、笔画数信息和拼音信息”等查字信息组合而成的综合查字信息的子信息,解决GB13000.1字符集中的20902个汉字的查字办法外,还用汉字词语所含的“词语字数、词语汉字、词语汉字首部件、词语汉字末部件、词语简拼、词语全拼”等汉字词语查询信息组合而成的综合查询信息的子信息解决汉字词语的查询办法。
本易通汉字字词新查法的获得,找到了用计算机技术和国家语委标准化工作委员会制定的标准化汉字信息获取优质汉字字词查询法必须使用的工具和办法,找到了能让国家语委标准化工作委员会制定的规范汉字具有的标准化信息解决汉字字词查询问题具有的优越性得到应有发挥的办法,找到了能让计算机技术解决汉字字词查询问题具有的优越性得到应有发挥的办法,和当前网络汉语字词典解决汉字字词查询办法相比,在以下5问题上有改进。
①本汉字字词新查法使用的汉字部件,根据汉字与汉字间具有的相同组字笔画结构情况和国家语委制定的标准化汉字形体结构与汉字笔顺规范依次选取得到,能获得上述用部件笔顺码或部件笔顺码表达式查询“查字部件”和输入“查字部件”的办法,使每一知道规范汉字书写情况的汉字,都能根据汉字的形体结构和汉字笔顺码,将汉字所含每个部件依次准确查出输出,并让每一汉字拆得的每一部件都能用于汉字查询和汉字词语查询,使查询汉字字词所用信息都能用国家语委制定的标准化汉字信息得到,都有能让计算机解决汉字字词查询问题具有的优越性得到很好发挥的优点,所以所得汉字字词查询办法都在易掌握易应用和查询效果好等方面,分别具有优于当前网络汉语字词典和汉语电脑字词典所用汉字字词查询办法的优点。当使用了部件信息和笔顺码信息进行查字,出现不能用查询信息获得查询汉字的问题时,是否存在输错部件信息和笔顺码信息的问题能够查出,能使当前网络汉语字词典使用的部首查字法和汉字笔画信息查字法解决查字问题存在的不确定因素得到消除,能让每一知道规范汉字书写情况的汉字查字问题与汉字词语的查询问题,都能获得方便快速准确的解决。
②能帮助会用任何一种汉字输入法输汉字的人员,遇到知道规范汉字书写情况的不会输汉字时,能用其所含“部件、汉字笔顺码、笔画数、拼音”等查字信息组合而成的综合查字信息中的子信息,准确确定不会输汉字是否属于操作***汉字库中的汉字,对属于操作***汉字库中的汉字,能用复制粘贴等办法将其输出;对不属于操作***汉字库中的汉字,能方便的找到造字所须的参考字,用操作***提供的造字工具,较快较好的将其造出输出,让会用本汉字字词新查法查询汉字和汉字词语的输字人员能方便的圆满完成汉字输字工作。
③能帮助用汉字搞学习、阅读汉字文章与写汉字文章的人员遇到释义不清楚的,知道规范汉字书写情况的不会输汉字和汉字词语时,能用不会输汉字所含“部件、汉字笔顺码、笔画数、拼音”等查字信息组合而成的综合查询信息的子信息,准确确定不会输汉字是否属于操作***汉字库中的汉字,对属于操作***汉字库中的汉字和汉字词语,能方便的用网络汉语字词典提供的输汉字与输汉字词语查释义功能,将属于操作***汉字库中的释义不清楚的,知道规范汉字书写情况的不会输汉字及不会输汉字词语的释义查出,有利写文章能正确用字用词,读文章能正确理解含义。
④本发明所述汉字字词新查法能将规范汉字书写知识的掌握,转化为部件笔顺码的掌握,让写字不规范问题能在查字过程中得到发现和纠正。实际情况表明,汉字数量比汉字部件数量明显多,约为20倍至20多倍,且大多数部件的笔顺码不难掌握,绝大多数部件含于多个汉字,对笔顺码难掌握且又含于多个汉字的部件而言,该部件存在的笔形笔顺不规范问题可在多个汉字的查字过程中得到发现和纠正;一个汉字所含笔形笔顺不规范部件的发现和纠正,能让多个汉字的笔形笔顺不规范问题得到发现和纠正,因此本易通汉字字词新查法的使用能将规范汉字书写知识的掌握由多变少由难变易,能让写字不规范问题的发现与纠正变容易。写规范汉字和查字典是小学语文的必学必用知识,字词典是中小学学生学习语文知识和写作文的必用工具,易通汉字字词新查法在中小学的使用,有利每一汉字的顺利查出输出,有利学生对含相同组字笔画结构汉字的了解,有利识字教育、有利中小学语文教学质量提高、有利写字不规范问题的发现与纠正、有利语言文字规范化。
⑤能让须对汉字所具“部件、汉字笔顺码、笔画数、拼音”等基本信息有了解的相关汉字语言文字工作者,方便的知道GB13000.1字符集的20902个汉字中,含“部件、汉字笔顺码、笔画数、拼音”等4信息组合而成的综合查字信息中的任意一指定子信息的汉字有几字,具体是哪几字,各字具有的“部件、汉字笔顺码、笔画数、拼音、字级”等信息,给须对汉字所含这些基本信息有了解的相关语言文字工作者对相关问题的研究和解决带来极大方便,给进一步用计算机全面的、快速准确的获取汉字所具其它各种信息的办法带来方便,有利相关中文信息技术问题的解决和发展,有利汉字所具优越性的深入研究和展示。
本汉字字词新查法的获得,得益于计算机解决汉字字词查询问题具有的优越性、得益于国家语委标准化工作委员会制定的汉字笔顺规范解决汉字字词查询问题具有的优越性及汉字构字特点具有的优越性。本汉字字词新查法的获得,找到了根据汉字构字特点和国家语委标准化工作委员会制定的汉字笔顺规范,用计算机技术获取汉字字词查询好办法必须使用的工具和方法。
发明最显著的特征有以下七项:
1.现有中文信息技术解决汉字查询问题还没有获得的,用Access数据表获取与规范汉字书写知识结合得好,易掌握且能用计算机科学精准的将汉字查字输字问题及汉字词语查询问题解决好的汉字部件必须遵循的主要原则。
2.现有中文信息技术解决汉字查询问题和汉字词语查询问题还没有获得的,在限定每字最多只拆四个部件的前提下,科学精准的获取GB13000.1字符集的20902个汉字的查字办法及汉字词语查询问题宜使用的汉字部件。
3.现有中文信息技术解决汉字查询问题和汉字词语查询问题还没有获得的,查字软件给用户提供用查询部件的部件笔顺码或查询部件所含任意数个笔顺码码值与通配符?、*组成的部件笔顺码表达式,获取查询部件和输入查询部件的办法。
4.现有中文信息技术解决汉字查询问题还没有使用的,用查询汉字所含的部件信息、汉字笔顺码信息、笔画数信息和拼音信息等4种查询信息组成的综合查询信息的任意一个子信息获取查询汉字的办法。
5.现有中文信息技术还没有获得的,①1至数片断汉字笔顺码查字法、②首末部件查字法、③首部件加后数汉字笔顺码查字法、④前数汉字笔顺码加末部件查字法等四种专用信息查字法。
6.现有中文信息技术解决汉字查询问题还没有使用的,输查询汉字所含查字关键字查字的特殊信息查字法。
7.现有中文信息技术解决汉字词语查询问题还没有使用的,用查询汉字词语所含的“词语字数、词语汉字、词语汉字首部件、词语汉字末部件、词语简拼、词语全拼”等汉字词语所含查询信息组合而成的综合查询信息的子信息解决汉字词语的查询办法。
本发明与现有技术比较具有以下积极效果:
当前网络汉语字词典给出的部首检字、拼音检字、按汉字笔画查字等办法建立在书本字词典的相应查字法的基础上,既不能让国家语委标准化工作委员会制定的规范汉字所含标准化信息解决汉字字词查询问题具有的优越性得到应有发挥,也不能让计算机技术解决汉字字词查询问题具有的优越性得到应有发挥,主要缺点为:①查字使用的拼音、部首、笔画等信息割裂开来单独使用且不可用通配符,可用于查字的信息少而死,用户手中掌握的查询汉字所含查字信息多数没法发挥作用,和书本字词典解决查字问题的相应办法相比无大的改进。②知道字形,不知读音的汉字一般用部首查字法,查字使用的部首因字而异,不能包含查询汉字的全部字形信息,相当一部分汉字的部首,不能根据汉字的形体结构和汉字笔顺规范准确获得,与规范汉字书写知识的掌握结合得不好,缺乏应有的规范性和完整性。相当一部分汉字的查字问题,存在查字法给出的部首(字形信息)不便使用,方便使用的字形信息不能发辉作用等问题;有些不会读的不常用汉字,会因查字使用的部首不规范不易掌握和查字须用的笔画信息不便使用等多种因素,让人白白花费很多时间,没法让查字问题获得解决;有些部首易准确确定的汉字,如“氵艹木扌口亻阝”等部首的汉字,由于相同部首的汉字数量太多,其中笔画数较多,结构较复杂的汉字,会因要查询汉字的笔画数难准确确定及满足查询条件的汉字信息的排序显示方式单一等原因而给查字工作带来不便;③查字使用的部首不规范,与国家语委标准化工作委员会制定的汉字笔顺规范不全相符,除不利查字问题的解决外,也不利规范汉字书写知识的掌握、不利笔画信息查字法的掌握,解决查字问题存在的不确定因素多,不能查出的汉字,是查字使用的信息不当,还是要查汉字不在字典的收字范围,没法论证、没法知道。
以上讨论表明,当前网络中文字词典使用的查字技术存在的缺点是:查字使用的字形信息(部首)缺乏应有的规范性和完整性,不能包含查询汉字所含全部字形信息,除被取为部首的汉字外,其它汉字所含的部首之外的字形信息没法用于查字,导致查字可用字形信息的浪费,查字使用的部首位于查询汉字的部位因字而异,使许多汉字没有方便易用的查字部首,给许多汉字的查字工作带来不便,不能让国家语委标准化工作委员会制定的规范汉字具有的标准化字形信息和汉字笔顺规范解决查字问题具有的优越性得到应有发挥,不能让计算机技术解决汉字查询问题具有的优越性得到应有发挥,解决汉字查字问题的汉字字形信息、笔画信息和拼音信息被割裂开来分别单独用于查字,不仅查字可用的方法少而死,每种查字方法可使用的信息也少而死,用户手中掌握的可用于汉字查询的信息多数不能发挥作用。导致影响汉字查字问题不能顺利解决的因素多,有些难查汉字的查字工作展转多次都不能解决;解决查字问题存在的不确定因素多,不能查出的汉字,是查字使用的信息不当,还是查询汉字不在字典的收字范围,没法论证、没法知道。这些问题的存在给汉字查字工作带来极大不便和时间浪费,不利于计算机技术解决汉字查询问题具有的优越性的发挥,不利于网络汉语字词典和汉语电脑字词典效果的发挥,不利于国家语委标准化工作委员会制定的规范汉字具有的标准化信息解决查字问题具有的优越性的发挥,不利于汉字所具优越性的发挥。
易通汉字字词新查法的最大特点是,用部件代替部首,让每一汉字所含每一部件都能根据查询汉字的形体结构和国家语委标准化工作委员会制定的汉字笔顺规范,用查询汉字的笔顺码或笔顺码表达式准确获得,并让每一汉字所含每一部件都能用于汉字查询,让汉字字形信息解决查字问题具有的规范性和完整性由差变好,让汉字字形信息解决查字问题具有的科学性和优越性通过计算机技术得到发挥,使查字使用的“部件、汉字笔顺码、笔画数、拼音”等四种查字信息全都能根据国家语委标准化工作委员会制定的标准化信息准确得到,全都能让计算机解决汉字字词查询问题具有的优越性得到发挥,通过通配符的引用,使用户手中掌握的每一查询汉字所含“汉字部件、汉字笔顺码、笔画数、拼音”等4种查字信息组合而成的综合查询信息中的每一子信息个个都能用于汉字查询,不仅查字可用的信息多方法灵活,还能让部首查字法和笔画检字法解决查字问题存在的不确定因素得到消除,不能查出的汉字,是查字使用的信息不当,还是要查汉字不在字典的收字范围,能科学论证,准确知道。能让计算机技术解决查字问题具有的科学性和优越性及国家语委标准化工作委员会制定的规范汉字具有的形体结构、汉字笔顺规范等标准化汉字字形信息和笔画信息解决汉字查询问题具有的科学性和优越性得到应有发挥,让规范汉字书写知识的学习掌握和应用与查字技术的学习掌握和应用相辅相成都变容易,能让当前网络汉语字词典解决查字问题的办法具有的多个缺点得到克服,让汉字查字难和不会输汉字的输入难的难度明显变小,让每个查字输字人员遇到的没法查出输出的汉字字词数量和没法查出输出的汉字字词数量都能明显减少,让每个查字输字人员花费在每个不会输汉字字词上的时间明显节省,有利输字人员圆满完成汉字输字工作,有利写文章能正确用字用词,读文章看文章能正确理解文章含意,有利汉语电脑字词典效果的发挥,有利不会输的汉字字词以同音字词代替的避免,有利汉字所具基本信息的了解,有利语言文字规范化,有利汉字所具优越性的发挥和深入研究。
具体实施方式
本发明的易通汉字字词新查法,是将查询汉字的字形信息取为部件,对计算机操作***汉字库所含GB13000.1字符集的20902个汉字,建立包含“汉字、部件、汉字笔顺码、笔画数、拼音、字级”等6信息的Access数据表,对数据表中可用于解决汉字查询的“部件、汉字笔顺码、笔画数、拼音”四信息,用Access的排序、筛选、查询和查找重复项功能,获取用每一汉字所含“部件、汉字笔顺码、笔画数、拼音”四种查字信息组合而成的综合查字信息的子信息,解决GB13000.1字符集中的汉字查字办法,其中“汉字、汉字笔顺码、笔画数、拼音、字级”5信息取国家语委标准化工作委员会颁布的标准化信息,部件选取遵循的主要原则是:对GB13000.1字符集的全部汉字,每个汉字的每个部件的选取都在含相交笔画的组字笔画结构一律不拆、不能按被拆汉字的笔顺码顺序选取得到的部件一律不取的前提下,根据被拆汉字的规范字形体结构,按照被拆汉字的笔顺码顺序依次选取被拆汉字所含的组字笔画结构为被拆汉字的查字部件,简称部件,只与其它汉字有相同组字笔画结构的被拆汉字,取其它汉字也含的相同组字笔画结构为被拆汉字的部件;既含其它汉字含有的相同组字笔画结构,也含其它汉字没有的组字笔画结构的汉字,除被拆汉字所含其它汉字也含的相同组字笔画结构取为被拆汉字的部件外,被拆汉字所含其它汉字没有的组字笔画结构,也取为被拆汉字的部件;与其它汉字没有相同组字笔画结构的汉字,取自身为部件;全包围结构的汉字和含全包围结构的汉字所含全包围部件一律不拆,其中每个全包围结构的汉字都取自身为部件,每个含全包围结构的汉字,都将所含全包围结构取为一个部件;特殊半包围结构的汉字和含特殊半包围结构的汉字所含特殊半包围部件一律不拆,其中每个特殊半包围结构的汉字都取自身为部件,每个含特殊半包围结构的汉字,都将所含特殊半包围结构取为一个部件;能拆复合部件的汉字,不拆复合部件所含的子部件;每一汉字所含各个部件的部件笔顺码都用该汉字的汉字笔顺码依次获得,每一汉字的汉字笔顺码都等于自身依次拆得的各个部件的部件笔顺码之和。
说明:GB13000.1字符集的20902个汉字中有许多字是多音字,为简单起见,当前查字软件汉字信息库中,每一汉字的拼音只取一音。
下边着重对“部件选取遵循的主要原则”的获取依据进行说明。
“部首排检法为东汉许慎《说文解字》所创”至今已有1800年左右的历史,现在使用的部首检字法已经过许多辞书编篆学家的改进,经受了汉字文化发展的长期考验。部首和部件都是介于汉字笔画和汉字间的字形信息,所不同的是部首检字,一般一字只归一部,为减少部首用量,部首须取组字频度高的组字笔画结构;用汉字部件构字信息解决汉字查询及有相同字形结构的汉字信息查询问题,除了组字频度高的组字笔画结构要取外,组字频度低的组字笔画结构和只含于一个汉字的组字笔画结构(孤立部件)也要取。用部首检字法检字,确定被检汉字的部首本身也有拆字问题,部首检字法具有的悠久历史及部首检字存在的困难表明,只有通过优化部首的选取办法来解决汉字部件的拆分问题,才能获得与汉字结构实际相符的易掌握易运用的汉字拆分办法,让与汉字字形信息相关的中文信息技术问题找到好的解决办法,本汉字字词新查法所用的部件就是通过优化部首选取办法得来的。
语文出版社1997年8月出版,国家语言文字工作委员会标准化工作委员会编《现代汉语通用字笔顺规范》一书中,将“每个汉字的笔顺用三种形式表示:一是跟随式,一笔接一笔地写出整字;二是笔画式,用一(横)、丨(竖)、丿(撇)、丶(点)、乛(折)五个基本笔画表示,其中,(提)归为一(横),亅(竖钩)归为丨(竖),乀(捺)归为丶(点),各种折笔笔画归为乛(折);三是序号式,用横、竖、撇、点、折五个基本笔画的序号1、2、3、4、5表示”。
上海教育出版社2000年5月出版,国家语言文字工作委员会语言文字规范GF3003—1999《GB13000.1字符集汉字字序(笔画序)规范》一书对GB13000.1字符集的20902字中的每一汉字给出了序号式笔顺,本发明所述的“汉字笔顺码”就是指汉字的序号式笔顺。
汉字从结构上看,分独体字和合体字,合体字有形声字和会意字,据介绍绝大多数汉字是形声字,任意一个形声字的形旁和声旁都分别含于多个不同的汉字,我们将同含于若干个汉字的相同组字笔画结构称为此若干个汉字的公部件;将同含于若干个汉字的最大相同组字笔画结构称为此若干个汉字的最大公部件。如,以“扌”为左偏旁的汉字都有相同组字笔画结构“扌”,我们称“扌”是以“扌”为左偏旁的汉字的公部件。又如“贡”是同含于汉字“贡唝赣戆”4字的最大组字笔画结构,我们称“贡”是汉字“贡唝赣戆”4字的最大公部件;将只含于一个汉字的组字笔画结构叫孤立部件。
构成汉字的部件,有的是GB13000.1字符集中的汉字,有的不是,如构成“规范汉字”四字的部件为:规=夫见、范=艹氵、汉=氵又、字=宀子。构成此4字的8个部件中,“夫、见、艹、氵、又、宀、子”等7个部件都是GB13000.1字符集中的汉字,我们称此种部件为成字部件,“范”字中的部件“”不是GB13000.1字符集中的汉字,我们称此种部件为非成字部件。成字部件含于操作***汉字库中,使用很方便;非成字部件不含于操作***汉字库,须用操作***提供的造字工具造,使用相当不便。
有公部件或相同组字笔画结构的汉字,其公部件或相同组字笔画结构不仅笔顺码相同,相同码值的相关笔画的长短及彼此间的位置关系也分别相同。如“工土士扌”四个成字部件都分别含于许多汉字,它们有相同的笔顺码121(笔画数、各笔画的笔形代码和笔顺情况分别依次相同),但各相同笔形代码笔画的长短、位置关系和具体笔形有差别;此外“夕久夂么勺凡丸及”8个成字部件及“木朩”2成字部件也各有相同笔顺码和类似差别,有此种差别的部件还很多,这种差别的存在能让用汉字部件查字可在与规范字书写知识结合得好,易掌握易应用及查字效果好、有利识字教育、有利规范汉字书写知识的准确掌握等多方面都优于部首查字法、笔顺码查字法和汉字笔画查字法。
汉字笔画与笔画间有相分、相连、相交三种基本关系,此三种关系决定了汉字的组字笔画结构间也只有相分(即相离)、相连(即相接)、相交三种基本关系。用部首检字法检字,部首笔画与非部首笔画有相分关系者,如“今”在“人”部,“想”在“心”部,“明”在“日”部,“朗”在“月”部,无论部首在汉字中的什么部位,其部首都易确定;部首笔画与非部首笔画有相连(或相接)关系者,如“古”在“十”部,“币”在“巾”部。“巨”在“匚”部,“成”在“戊”部,无论部首在汉字中的什么部位,其部首也较易确定;部首笔画与非部首笔画有相交关系者,如“内”在“冂”部,“本”在“木”部,“戋”在“戈”部,“臾”在“臼”部,其部首都难记难确定。部首和部件都是介于汉字笔画和汉字之间的字形信息,都是汉字的组字笔画结构,用部首检字,被检汉字的部首就是一个能从被检汉字身上拆出的含于多个汉字的,能用于查字的组字笔画结构。汉字由部件组成,部件由笔画组成,可用于解决将汉字拆为部件的笔画信息只有汉字笔画与笔画间的分、连、交三种基本关系。分、连、交三者不加区别的都用,肯定会给拆字规定的制定及掌握带来困难。为使汉字部件的选取有易掌握和易应用的优点,必须规定含相交笔画的组字笔画结构一律不拆。易通汉字字词新查法的部件选取遵循的主要原则规定“所有部件的选取,全都在含相交笔画的组字笔画结构一律不拆的前提下,根据被拆汉字的形体结构和汉字笔顺码顺序获得”是根据汉字结构实际,通过优化部首选取办法获得的,能让部件选取具有易掌握及易与识字教育结合的优点。
较复杂的汉字由较简单的汉字和较简单的组字笔画结构组合而成,汉字形体结构(即汉字字型)是根据汉字所含组字笔画结构的情况进行确定的。若将汉字形体结构类型按小学教学的惯例分为“独体、上下、上中下、左右、左中右、半包围、全包围、品字形、特殊”等九种,根据各种结构类型的特点,将“上下、左右、半包围、全包围”四种类型的汉字拆分为两个部分,将“上中下、左中右、品字形”等三种结构类型的汉字拆分为三个部分,将特殊型的汉字拆分为两个或两个以上部分后,所得每一部分的组字笔画结构的形体结构类型仍属上述九种类型的范畴。如艹部的上下型汉字中,“艺、艾、艽、芨、芜、苇、苗、英”等字拆为上下两部分后的下一部分是独体型且这些字的下一部分还会含于其它汉字;“芬、苦、苕、苔、草、茶、莫、菁、葜、蕖、蓿、蕹”等字拆上下两部分后的下一部分是上下型且这些字的下一部分还会含于其它汉字;“菱、萃、蔓、薏、藜、薹”等字拆上下两部分后的下一部分是上中下型且这些字的下一部分还会含于其它汉字;“花、苁、苻、范、茄、茹、葫、蔟、薄、藤、藻、蔹、薐、蔋、薿、”等字拆上下两部分后的下一部分是左右型且这些字的下一部分还会含于其它汉字;“薇、蘅”两字拆上下两部分后的下一部分是左中右型且此二字的下一部分还会含于其它汉字;“苈、苛、苟、茼、莲、葡、葴、蓬、蔗、蔺、蕨、藏、蘧”等字拆上下两部分后的下一部分是半包围型且这些字的下一部分还会含于其它汉字;“茵、茴、菌”等三字拆上下两部分后的下一部分是全包围型且这些字的下一部分还会含于其它汉字;“荔、蕌、藠、藟、蕊”等字拆上下两部分后的下一部分是品字型且这些字的下一部分还会含于其它汉字;“莁、菲、蘁、蓑、”四字拆上下两部分后的下一部分是特殊型且这些字的下一部分还会含于其它汉字。容易看出,上述汉字按形体结构进行拆分后,拆得的每个部分都是含于多个汉字的公部件或组字笔画结构,实际情况表明,含孤立部件的汉字很少,除含孤立部件的汉字外,每一汉字的形体结构都由自身所含其它汉字也含的相同组字笔画结构形成。此情况表明,“根据被拆汉字的形体结构和汉字笔顺码顺序”依次取被拆汉字所含的组字笔画结构作被拆汉字的查字部件,简称部件,能让汉字查字部件的选取有汉字部件不须死记,拆字情况易掌握,拆不对易纠正及查字效果好的优点。
绝大多数的汉字是形声字,形声字的形旁和声旁都分别含于多个不同的汉字且无相交关系,前述艹部汉字按形体结构进行拆分后,拆得的每个部分都是含于多个汉字的公部件或组字笔画结构的事实表明,用汉字部件查字,只与其它汉字有相同组字笔画结构的被拆汉字,必须取被拆汉字所含其它汉字也含的相同组字笔画结构为部件,才可有好的查字效果。
实际情况表明,也有极少数合体字,它们所含的组字笔画结构中,既有其它汉字含有的组字笔画结构,也有其它汉字都不含有的组字笔画结构,如:盥拆皿中的蒇拆艹中的临拆中的耉拆耂口中的……分别是其它汉字不含的组字笔画结构。为让含有其它汉字没有的组字笔画结构的汉字有好的查字效果,除能用自身所含其它汉字含有的相同组字笔画结构解决查字问题外,还能用自身所含的其它汉字不含的组字笔画结构解决查字问题,对含有其它汉字没有的组字笔画结构的汉字,除取被拆汉字所含其它汉字也含的组字笔画结构为部件外,被拆汉字所含其它汉字没有的组字笔画结构,也应取为被拆汉字的部件。
实际情况还表明,还有极少数汉字是与其它汉字没有相同组字笔画结构的汉字,如一级字和二级字中的“已书凸承乜孓卅”等字就是与其它汉字没有相同组字笔画结构的汉字。为使与其它汉字没有相同组字笔画结构的汉字,也能用部件查字法解决查字问题,并让我们能全面准确的了解汉字具有的字形情况和组字笔画结构情况,与其它汉字没有相同组字笔画结构的汉字,必须取自身为部件。
在GB13000.1字符集的全部汉字所含的,分别含于多个汉字的各种相同组字笔画结构中,只有全包围结构的汉字(如“因囟固鹵國”等)和含全包围结构(如含“国”等全包围结构)的汉字所含的全包围部件(囗占)与特殊半包围结构的汉字(如“可匝巫忒武或威幽载彧爽戠臧噩”等)和含特殊半包围结构(如含“或”等特殊半包围结构)的汉字所含的特殊半包围部件(丁匚工弋戈戊山大王),不能按被拆汉字的汉字笔顺码顺序取得,其它含于多个汉字的相同组字笔画结构,都能根据汉字形体结构和和汉字笔顺码顺序取得。为保证“不能按被拆汉字的笔顺码顺序选取得到的部件一律不取”的部件选取基本原则及“每一汉字所含各个部件的部件笔顺码都用该汉字的汉字笔顺码依次获得,每一汉字的汉字笔顺码都等于自身依次拆得的各个部件的部件笔顺码之和”的规定不出问题,必须规定“全包围结构的汉字和含全包围结构的汉字所含全包围部件一律不拆,其中每个全包围结构的汉字都取自身为部件,每个含全包围结构的汉字,都将所含全包围结构取为一个部件;特殊半包围结构的汉字和含特殊半包围结构的汉字所含特殊半包围部件一律不拆,其中每个特殊半包围结构的汉字都取自身为部件,每个含特殊半包围结构的汉字,都将所含特殊半包围结构取为一个部件”。
例1.1:如“因囟鹵”等3字都是全包围结构的汉字,它们依次所含的全包围部件(囗占)不拆,“因囟鹵”3字都分别取自身为部件。
例1.2:含全包围结构的汉字中,如“卤巤鬛”3字所含相同全包围结构含有的全包围部件“囗”不拆;“笝”所含全包围结构含有的全包围部件“囗”不拆;“囪卥”2字所含相同全包围结构含有的全包围部件“囗”不拆。“卤巤鬛笝囪卥”6字的部件选取情况是:卤拆,巤拆巛,鬛拆髟,笝拆,囪拆丿,卥拆。
例1.3:特殊半包围结构的汉字中,如“可巫爽幽噩叵式武或载威臧”等12字依次所含特殊半包围部件“丁工大山王匚弋戈戊”都不拆,每字都分别取自身为部件。
例1.4:含特殊半包围结构的汉字中,如“河诬酆钷试斌诫谶崴藏”等10字依次所含的特殊半包围结构“可巫叵式武戒威臧”含有的的特殊半包围部件不拆,每字所含特殊半包围结构都取为一个部件,此10字的部件选取情况是:河拆氵可、诬拆讠巫、酆拆豆阝、钷拆钅叵、试拆讠式、斌拆文武、谶拆讠从、崴拆山威、藏拆艹臧。
以上4例所含汉字的部件选取情况表明,“全包围结构的汉字和含全包围结构的汉字所含全包围部件一律不拆与特殊半包围结构的汉字和含特殊半包围结构的汉字所含特殊半包围部件一律不拆”的部件选取办法,虽然增加了部件用量,但对熟悉规范字书写知识的人说来,这些部件的选取不难且查字效果好,对不熟悉规范汉字书写知识的人员,通过对相关汉字的查找,有帮助掌握汉字构字特点和相关规范字书写知识的作用,让写字不规范问题得到纠正。
“十日立”3字是简单汉字,“早音章”3字是由简单汉字组成的简单合体字,“卓草覃棹罩谭潭镡、竟暗意境韶薏噫镜黯、鄣障彰樟赣戆”等字分别是由简单合体字“早音章”与其它组字笔画结构组成的较复杂汉字或复杂汉字。汉字的这种构字特点,导致了限定每字最多能拆部件数较少时,查字使用的部件,也有简单部件与由简单部件和其它组字笔画结构组合而成的复合部件。当取了“早音章”为“十立日”3简单部件组成的的复合部件时,“鄣障彰樟赣戆”六字中的“章”只取为一个部件,它们的拆分情况是:鄣=章阝、障=阝章、彰=章彡、樟=木章、赣=章夂贡、戆=章夂贡心。此拆分情况表明,查“章”和含“章”的汉字时,既不能用“十日立”3部件,也不能用“早音”二部件,只能用部件“章”和查询汉字所含的除“章”以外的其它相关部件,如查“鄣”,能用的部件就只有“章”和“阝”;同理,查含部件“早”不含部件“章”的“卓草覃棹罩谭潭镡”等汉字时,只能用部件“早”和查询汉字所含的除“早”以外的其它相关部件,不能用部件“日十”,如查“草”,能用的部件只有“艹”和“早”两个,“日”和“十”都不能用;查含部件“音”,不含部件“章”的“竟暗意境韶薏噫镜黯”等汉字时,只能用部件“音”和查询汉字所含的除“音”以外的其它相关部件,不能用部件“立”和“日”,如查“意”,能用的部件只有“音”和“心”,“立”和“日”都不能用。这是“能拆复合部件的汉字,不拆复合部件所含的子部件”一语的含意。
以上具体规定,保证了易通汉字字词新查法使用的每个部件的部件笔顺码都能用国家语委标准化工作委员会制定的汉字笔顺规范获得,保证了部件信息查字能和笔顺码信息查字方便的合在一起使用,既让每一汉字所含各个部件的部件笔顺码都用该汉字的汉字笔顺码依次获得,也让每一汉字的汉字笔顺码都能用自身所含各部件的部件笔顺码获得。
根据上述部件选取遵循的主要原则,可得“规范汉字”四字的“汉字与部件”和“汉字笔顺码与部件笔顺码间”的关系如下表1.1所示:
表1.1:“规范汉字”四字的“汉字与部件”和“汉字笔顺码与部件笔顺码间”的关系表
上表中,1134+2535、122+441+55、441+54、445+521依次为“规、范、汉、字”四字的部件式汉字笔顺码。
上关系具有的优点是:易通汉字字词新查法使用的部件与规范汉字书写知识结合得好,使易通汉字字词新查法使用的“汉字、部件、汉字笔顺码、笔画数、拼音”等5信息,全都能用国家语委标准化工作委员会制定的标准化信息获得,使“部件、汉字笔顺码、笔画数、拼音”等四种查字信息的子信息可任意的合在一起使用,让易通汉字字词新查法有易掌握易应用和查找汉字字词效果好的优点。
本说明书将GB13000.1字符集所含20902个汉字分为四级,其中属于国家标准信息交换汉字编码GB2312-80字符集16区—55区的3755字叫一级字,属于GB2312-80字符集56区—87区的3008字叫二级字,将1997年8月语文出版社出版国家语言文字工作委员会标准化工作委员会编《现代汉语通用字笔顺规范》的7000通用字中属GB13000.1字符集,但不属于属GB2312-80字符集16区至87区的407字叫三级字,将GB13000.1字符集中不属于GB2312-80字符集16区至87区的汉字及不属于7000通用字的13732字叫四级字。通常情况下,一级字的使用频度最高,二级字次之,四级字最低。
特别说明:2013年6月5日国务院发出关于公布《通用规范汉字表》的通知,国务院同意***、国家语言文字工作委员会组织制定的《通用规范汉字表》,并予公布。由于《通用规范汉字表》的二级字表和三级字表中都含有GB13000.1字符集20902字中没有的汉字,而国家语言文字工作委员会组织制定的《通用规范汉字表》又还没有装在计算机上供一般人员使用,所以这里未根据通用规范汉字表的字级来确定操作***汉字库所含GB13000.1字符集20902字的字级。一旦社会上使用的操作***汉字库中的汉字有变更,可根据所作变更进行相应修改。
2.易通汉字字词新查法限定每字最多只拆四个部件的前提下,用汉字部件信息解决操作***汉字库所含GB13000.1字符集20902个汉字的查字问题时,宜使用的部件有1105个,其中成字部件有780个,非成字部件有325个,780个成字部件是:一二丅十丁厂丆匚匸七丂三干亍于亏亐工土士扌艹卄才下寸不廾大丈兀尢万弋夨丰王开井天夫元无韦弌云专耂丐廿木朩五帀巿支丏卅不犬太区歹友尤匹车巨牙屯戈比旡兂互瓦弍玉匞未末示戋正甘世丗卌古本术可叵匝丙左石夲戊龙匛平东匜戉弎匡耒式戎圭吉耳共亚亘臣吏再覀襾朿西亙戌百而页匠戍匢死成匟夹夷至匤戒走贡赤声巫求車甫匣更亜束豆戓两酉丽医辰丣夾豕尨来亊忒匥巠武青甙匦者夌幸亞其昔若直林來東或事雨匼豖贰匧垚壴哉革匽畐柬咸威頁匨匩珤敖匿匪髟栽馬载貢烖盍莫莧尃彧鬲烕原匫彗匭貮埶黄萑戜匮區戚帶匬爽匾貳臷蛓胾裁壹黃棥厤尞雲載酨畺匯雷匲截匱匰監爾臧奭韯匳噩匴匵戴匶匷丨亅丄刂卜冂上小口囗山巾止卝攴少曰日冄中円贝罓内內水见禸北凸歺业氺旦目且曱甲申电田由史央兄叹甴冉罒皿冊凹冋囚四囙囜尗虍光早吋曳虫曲团団吅吕同因回网肉囝囡貝見囯里呆囲园围囩足男困串囨邑囤囬囦囮囧冏囵囫囥図非齿虎果国門囸固丳囷囶囹图囻囼韭昜禺品囿圀骨幽鬥丵畢圃圄圂圆圁鹵堂圊曼圉國圇圈歮猒晶單買圌圐圏黑圍圎黽園圔圑睘蜀圓圕團圖圙圗齒畾嘼圚圛圜豳圝圞丿亻八人入乂勹儿匕几九千乇乞川彳彡亇犭夕久夂夊么勺凡丸及饣午牛手气毛壬牜升夭攵长片化币斤爪丯戶父从仌爻爫仒今凶分月厃氏勿欠匁风丹乌殳钅生矢失乍禾丘白斥瓜乎令用甩尔乐句匆匃册处鸟刍年朱缶先舌臼乑自血向囟舟合兆旨各多色我呑每身囱佥釆谷豸角夆系垂幷秉臾隹卑金釒侖飠周鱼兔卸乗香重复泉鬼禹盾俞兪爰食風埀乘倠奚鬯倉眞鳥魚鼠僉會鼻龜龠丶乁乀亠冫丷冖讠丬广亡门丫氵忄宀辶之六文方火为斗灬户礻冘心主疒立玄半头穴衤必永亦衣产吂亥羊米屰农言訁辛羌弟良京育单炏炎畄官音前酋高剡窊麻鹿章産寅戠寍惢廌褱龍嬴贏乛乚乙了凵丩 卩阝刀力乃又厶乄廴巜乜彐卂尸己已巳弓子孑屮孓卪也女乆刃刄飞叉马彑纟乡幺巛肀尹卐尺夬弔丑卍爿巴刅办以予毌书毋司民弗疋出氶丱召皮发癶矛母聿帇艮劦羽叒厽糸糹戼夋肃录帚承叕韋孨飛弱能粛敢尋發肅辟歰維;325个非成字部件是:
用上述1105个部件解决GB13000.1字符集20902个汉字的查字问题时,二部件字有8319字,其中有8277字含有成字部件,有42字不含成字部件,此42个全拆非成字部件的二部件字的部件拆分情况如下:
三部件字有9048字,其中有9032字含有成字部件,有16字不含成字部件,此16个全拆非成字部件的三部件字的部件拆分情况如下:
四部件字有2755字,字字都含成字部件,其中有32字每字只含1个成字部件,此32字的部件拆分情况是:
①第一部件是一级字,后3部件是非成字部件的汉字有9字,此9字的拆分情况为:
②第一部件是二级字,后3部件是非成字部件的汉字有7字,此7字的拆分情况为:
③第一部件是四级字,后3部件是非成字部件的汉字有4字,此4字的拆分情况为:
④前3部件是非成字部件,第四部件是一级字的汉字有8字,此8字的拆分情况为:
⑤前3部件是非成字部件,第四部件是二级字的汉字有2字,此2字的拆分情况为:
⑥前3部件是非成字部件,第四部件是四级字的汉字有2字,此2字的拆分情况为:
汉字字数多构字情况复杂,限定每字最多能拆4个部件,能使复杂汉字和较复杂汉字的拆分情况与汉字形体结构较好结合,不显得零乱,不仅能给汉字部件选取和掌握带来方便,也能给查字使用部件情况的掌握带来方便。须要说明的是:
①受不确定因素的影响,相当一部分用量不多的组字笔画结构的部件选取不唯一,有些部件可以更换,部件数量也可有所增减。只要更换部件是按部件选取遵循的主要原则获得,并对查字软件中的相应数据信息作相应修改,如上述给出的查询“查字部件”和输入“查字部件”的办法、查字法解决查字问题的办法及给出的汉字词语综合信息查询法,是不会因为部分部件的更改而影响使用的。②部件选取遵循的主要原则还可用于限定每字最多只拆五个部件至五个以上部件的多种汉字部件选取办法。只要是所述的部件选取遵循的主要原则选取得到的部件,查询“查字部件”和输入“查字部件”的办法、查字办法、汉字词语综合信息查询法,都可用于汉字查字问题和汉字词语查询问题的解决。不同的是限定每字最多能拆部件数多者,部件用量可以减少,但笔画数较多结构较复杂的汉字的拆分情况会显得有些零乱,与汉字的形体结构结合得不够好,有些部件的查字效果会相对变得差点。具体限定每字最多拆几个部件好,有待进一步研究。
3.易通汉字字词新查法的特征在于查字软件给用户提供用查询部件的“部件笔顺码”信息和查询部件的“笔画数”信息,查询“查字部件”和输入“查字部件”的办法,其中查询部件的“部件笔顺码”信息的输入信息是含“代表一个笔形代码的通配符?、代表0至多个笔形代码的通配符*、查询部件所含笔顺码”的部件笔顺码字符串;查询部件的“笔画数”信息的输入信息有以下3种格式:①1至26间的某一正整数、②介于1至26间的某二正整数间的全部自然数、⑧代表1至26间的全部笔画数的通配符*,打开部件笔顺码查询部件对话框,用户按规定输入查询部件所含上述查询信息中的任意一子信息,发出“查询”指令后,查字软件磁盘文件中的程序,除能按用户所输查询信息的情况,迅速从查字软件部件信息表的全部记录中,筛选出满足用户所输查询条件的每一目标记录,除将筛选出的每一目标记录在部件信息表中存储着的“部件、笔画数、部件笔顺码、首部件用量、末部件用量、笔顺情况、部件情况”共七种信息列表显示给用户外,还将满足查询条件的记录数量显示给用户,用户看了满足查询条件的记录后,可根据满足查询条件的记录情况,在原来所输查询信息的基础上对原来所输查询信息作修改和修改后的查询;显示内容标题栏中的“部件、笔画数、部件笔顺码、首部件用量、末部件用量、笔顺情况、部件情况”,既是满足查询条件的记录列表显示的列标题,也是满足查询条件的记录按指定顺序排序的命令按钮,简称排序按钮,单击不同的排序按钮,能让满足查询条件的记录产生不同的排序方式,给准确获取所须部件提供不同的方便,用户从满足查询条件的记录中找到所须“查询部件”后,选中所须查询部件,单击“复制”按钮,返回须要输入查询部件的地方,按Ctrl+V,查询部件就能粘贴到需要输入查询部件的地方。
用给出的汉字综合信息查字法及给出的三种查字法进行查字及用给出的汉字词语综合信息查询法查询汉字词语时,会涉及部件输入问题,本汉字字词新查法使用的部件有成字部件和非成字部件,成字部件中会用输入法输出的成字部件可用输入法输,不会用输入法输出的成字部件和非成字部件的查询问题和输入问题就用给出的查询“查字部件”和输入“查字部件”的办法解决。用所述的1105个部件解决查字问题时,780个成字部件中,部件情况是一级字的部件有413个、部件情况是二级字的部件有108个、部件情况是三级字的部件有5个、部件情况是四级字的部件有254个。笔画数最多的部件是“圞”,有26画,所以“笔画数”信息的输入信息,应限定为1至26间的正整数。
打开部件笔顺码查询部件对话框时,查询部件的“部件笔顺码”信息输入框中的输入字符,是代表任意一个查询部件的部件笔顺码的通配符“*”,查询部件的“笔画数”输入框中的输入字符,是代表任意一个查询部件的笔画数的通配符“*”。此时,如果用户不改变查询部件的“部件笔顺码”信息输入框中的输入字符“*”和查询部件的“笔画数”信息输入框中的输入字符“*”,就直接单击“查询”按钮,得到的是本查字软件使用的全部部件的记录,即1105个部件的记录。
用本法解决“查字部件”和输入“查字部件”的办法是:
当查询部件笔画数少且部件笔顺码能完整准确掌握时,在查询部件的”部件笔顺码”信息输入框中输入查询部件的全部笔顺码码值;当查询部件笔画数多或较多及含不能准确掌握的笔顺码码值时,在查询部件的”部件笔顺码”信息输入框中输入查询部件所含的数个能准确知道笔形笔顺情况的笔顺码码值与通配符?、*组成的部件笔顺码字符串,笔画数信息一般可不用。输完查询部件的笔顺码或笔顺码字符串,单击查询按钮后,在部件笔顺码查询部件对话框下方,立即显示出,查字软件部件信息表中,满足所输查询条件的每一目标记录,从满足查询条件的记录中“选中”所须查询部件,单击“复制”按钮,返回须要输入查询部件的地方,按Ctrl+V,查询部件就能粘贴到需要输入查询部件的地方了。
如对不会输部件“扌”的用户,只要在查询部件的”部件笔顺码”信息输入框中输入“扌”的笔顺码“121”,单击查询按钮后,马上能得到部件信息库中部件笔顺码码值是121的4个部件“工土士扌”,部件“扌”就在其中了。所得4个记录的显示情况如下表3.1所示:
表3.1:部件笔顺码为121的四个记录的显示情况表
又如不会输部件“頁”的人,只要在查询部件的“部件笔顺码”信息输入框中输入“1325*”(“頁”的前4笔顺码加通配符*),单击查询按钮后,马上能得到部件信息库中前4笔顺码码值是1325的“石百而页頁”等11个部件,其中就有“頁”了。如果觉得满足查询条件的记录多,既可将“部件笔顺码”信息输入框中输入的“1325*”改为“1325111*”或“1325*34”等部件笔顺码字符串来减少满足查询条件的记录,也可用限定笔画数的取值情况来减少满足查询条件的记录,让获取所须查询部件容易。
再如不会输部件“鳥”,对鳥的前数笔顺码不清楚的人,只要在查询部件的“部件笔顺码”信息输入框中输入“*4444”(通配符*加“鳥”的后4笔顺码4444),单击查询按钮后,马上能得到部件信息库中后4笔顺码码值是4444的“灬糹雨馬鳥魚黑廌”等12个部件,其中就有“鳥”了(如果在查询部件的“部件笔顺码”信息输入框中输入“3*4444”所得满足查询条件的部件只有“鳥魚”3个)。
本查字软件给用户提供用查询部件的“部件笔顺码”信息和查询部件的“笔画数”信息,查询“查字部件”和输入“查字部件”的办法,具有以下四个优点:
①能让我们方便的用不会输部件的笔顺码或部分笔顺码与通配符?、*组成的笔顺码表达式,将不会输部件顺利查出输出;并让记错笔顺码和输错笔顺码的问题得到发现,让写字不规范问题得到纠正。
用此法获取汉字部件,如果部件笔顺码输得不正确,就不能获得所须部件,能让写字不规范问题得到发现和纠正。如有的人不会用输入法输“忄”,且会将“忄”的笔顺码误认为“424”,当在查询部件的”部件笔顺码”信息输入框中输入“424”,单击查询按钮后,满足查询条件的记录中没有“忄”时,表明“忄”的笔顺码输错。此时可在查询部件的”部件笔顺码”信息输入框中改输“4*”、并在查询部件的“笔画数”信息输入框中输笔画数等于3(或只在查询部件的”部件笔顺码”信息输入框中改输“4??”),单击查询按钮后,得部件信息库中的“丬广亡门丫氵忄宀辶之”等12个点起笔3画部件,“忄”与忄的笔顺码442就在其中,记错忄的笔顺码问题能得到发现与纠正。
②能方便地了解以某简单部件为子部件的复合部件,让不知部件拆分情况的汉字,能根据汉字的形体结构和汉字笔顺码,用本法将查字应当使用的部件全部查出输出,让错用部件的问题得到避免。
易通汉字字词新查法用所述1105个部件,解决查字问题时,所用部件有简单部件及以简单部件和其它组字笔画结构组合而成的复合部件,规定“能拆复合部件的汉字,不拆复合部件所含的子部件”。使用部件信息查字时,遇到查询汉字含有以简单部件和其它组字笔画结构组合而成的复合部件的汉字时,可能会出现取错部件的问题。当出现取错部件的问题时,查询汉字就不含于满足查询条件的记录中。
如所述的1105个部件中,“舌”是以部件“千口”为子部件的复合部件。查舌和含舌的汉字时,不能将“舌”拆为“千口”,一定要用“舌”才行。当查询汉字为“甜”,不知“甜”的首部件应如何取,比如对“舌”是否拆千口不清楚时,只要在查询部件的“部件笔顺码”信息输入框中输入“312*”(“舌”的前三码加通配符*),单击查询按钮后,就能得到查字软件的部件信息库中前三码码值同为312的“千壬牜乍禾先舌我香重复乘”等18个部件,部件“千”和以“千口”为子部件的复合部件“舌”就在其中,根据“能拆复合部件的汉字,不拆复合部件所含的子部件”,“甜”字的首部件应当取“舌”。
再如所述的1105个部件中,“章”是由“立日十”3个简单部件组成的的复合部件,查“章”和含“章”的汉字时,不能用“章”所含的“立日十”3个子部件及“音早”二子部件。如查询汉字为“鄣”时,如果用户用给出的首末部件查字法查“鄣”,在首”部件”输入框中输入“立”、在末部件输入框中输入“阝”,单击查询按钮,得满足查询条件的汉字只有“部”字一字,此情况表明,首部件可能输错,此时只要打开部件笔顺码查询部件对话框,在查询部件的“部件笔顺码”信息输入框中输入“41431*”(“立”的笔顺码加通配符*),单击查询按钮后,就能得到查字软件的部件信息库中前五码码值同为41341的“立产辛音章産戠龍”等8个部件,部件“立音章”都在其中,根据“能拆复合部件的汉字,不拆复合部件所含的子部件”,“鄣”字的首部件应当取“章”。
③能让我们用多种不同的部件笔顺码表达式,获取查字软件部件信息库所含的多种不同部件的集合,给出多渠道获取汉字部件信息的办法,既让我们能方便的将只知道部分笔顺码的部件查出输出,也让我们能方便的对本查字软件使用的汉字部件情况有较全面的多方位的了解。如:打开部件笔顺码查询部件对话框,直接单击查询按钮,得到的是查字软件使用的全部部件与数量;打开部件笔顺码查询部件对话框,单在查询部件的“部件笔顺码”信息输入框中输入“1*”,单击查询按钮后,得到的是部件信息库中的全部横起笔部件与数量;打开部件笔顺码查询部件对话框,单在查询部件的“部件笔顺码”信息输入框中输入“?”,单击查询按钮后,得到的是部件信息库中的全部一画部件,即单笔部件,及其数量;打开部件笔顺码查询部件对话框,单在查询部件的”部件笔顺码”信息输入框中输入“4”,单击查询按钮后,得到的是部件信息库中笔顺码是4的3个单笔部件“丶乁乀”;打开部件笔顺码查询部件对话框,单在查询部件的”部件笔顺码”信息输入框中输入“???*”,单击查询按钮后,得到的是部件信息库中的全部3画和3画以上部件”;打开部件笔顺码查询部件对话框,单在查询部件的”部件笔顺码”信息输入框中输入“*4”,单击查询按钮后,得到的是部件信息库中末笔是点的全部部件与数量,打开部件笔顺码查询部件对话框,在查询部件的”部件笔顺码”信息输入框中输入“4*”,在查询部件的“笔画数”信息输入框中输入“5”,单击查询按钮后,得到的是部件信息库中点起笔5画的“主疒立玄半 头穴衤必永”等14个部件;打开部件笔顺码查询部件对话框,在查询部件的”部件笔顺码”信息输入框中输入“4*”,在查询部件的“笔画数”信息输入框中输入“10-*”,单击查询按钮后,得到的是部件信息库中点起笔10画和10画以上部件。
④当遇到查询汉字不含于满足查询条件的记录问题时,能帮助我们方便的检查论证是否存在输错查询汉字所含“部件信息”和“笔顺码信息”的问题,让因输错查询汉字所含“部件信息”和“笔顺码信息”而没法获得所须查询汉字的问题得到避免。
4.易通汉字字词新查法的特征在于查字软件对操作***汉字库所含GB13000.1字符集的20902个汉字给出的汉字综合信息查字法,用查询汉字所含“部件、汉字笔顺码、笔画数、拼音”4种信息组合而成的综合查询信息的任意一个子信息,获取查询汉字的办法,查询汉字的“部件”信息的输入信息是含“代表一个部件的通配符?、代表0至多个部件的通配符*、查询汉字所含部件”的部件字符串;查询汉字的“汉字笔顺码”信息的输入信息是含“代表一个笔形代码的通配符?、代表0至多个笔形代码的通配符*、查询汉字所含笔顺码”的汉字笔顺码字符串;查询汉字的“笔画数”信息的输入信息有以下3种格式:①1至48间的某一正整数、②介于1至48间的某二正整数间的全部自然数、③代表1至48间的全部笔画数的通配符*;查询汉字的“拼音”信息的输入信息是含“代表一个拼音字符的通配符?、代表0至多个拼音字符的通配符*、查询汉字所含拼音字符”的拼音字符串;打开综合信息查字法对话框,用户按规定输入查询汉字所含上述查询中的一子信息,发出执行指令后,查字软件磁盘文件中的程序,除能按用户所输查询信息的情况,迅速从GB13000.1字符集的20902个汉字存储在查字信息表的全部记录中,筛选出满足用户所输查询信息条件的每一目标记录,除将筛选出的每一目标记录在“汉字、拼音、部件、笔画数、部件式汉字笔顺码、字级”共6个字段中的字段值,用列表显示法显示给用户外,还将全部目标记录的数量显示给用户,用户看了满足查询条件的记录后,可根据满足查询条件的记录情况,在原来所输查询信息的基础上对原来所输查询信息作修改和修改后的查询;显示内容标题栏中的“汉字、拼音、部件、笔画数、部件式汉字笔顺码、字级”,既是满足查询条件的记录列表显示的列标题,也是满足查询条件的记录按指定顺序排序的命令按钮,简称排序按钮,单击不同的排序按钮,能让满足查询条件的记录产生不同的排序方式,给准确解决查字问题提供不同的方便。
用户选中汉字综合信息查字法,打开汉字综合信息查字法对话框时,“部件”信息输入框中的输入信息是代表任意一个查询汉字所含部件的通配符*、“汉字笔顺码”信息输入框中的输入信息是代表任意一个查询汉字所含汉字笔顺码的通配符*、“笔画数”信息输入框中的输入信息是代表任意一个查询汉字所含笔画数的通配符*、“拼音”信息输入框中的输入信息是代表任意一个查询汉字所含拼音字符的通配符*。此时,如果用户什么信息也不输,直接单击查询按钮,得到的是查字软件汉字信息库所含20902个汉字的记录;只在“部件”信息输入框中输入一个“??”,单击“查询”按钮,得本查字软件汉字信息库中全部二部件字(8319字)的记录;只在”部件”信息输入框中输入一个“丨*”,单击“查询”按钮,得本查字软件汉字信息库的全部汉字中,汉字丨和首笔丨(竖)可拆单笔部件的“丨凣旧児頥”等5个汉字的记录;此5记录的显示内容如下表4.1所示。
表4.1:部件信息为“1*”的5个记录的显示内容
汉字 | 拼音 | 部件 | 笔画数 | 部件式汉字笔顺码 | 字级 |
丨 | gun | 丨 | 1 | 2 | 二级字 |
凣 | fan | 丨几 | 3 | 2+35 | 四级字 |
旧 | jiu | 丨日 | 5 | 2+2511 | 一级字 |
児 | er | 丨日儿 | 7 | 2+2511+35 | 四级字 |
頥 | yi | 丨臣頁 | 16 | 2+125125+132511134 | 四级字 |
只在”部件”信息输入框中输入一个“*丶”,单击“查询”按钮,得本查字软件汉字信息库中的全部汉字中,单部件字丶和末笔丶(点,含捺)可拆单笔部件的“丶亽圡尐玊丼朮……鯳鑧髖”等92个汉字的记录;只在“部件”信息输入框中输入“?口*”,单击“查询”按钮,得本查字软件汉字信息库中,第二部件是口的293个汉字的记录(其中二部件字有35字、三部件字有238字、四部件字有20字);只在“汉字笔顺码”信息输入框中输入“2*”,单击“查询”按钮得本查字软件汉字信息库中,第一笔是竖的3305个汉字所在的记录;只在“汉字笔顺码”信息输入框中输入“12341*35”,单击“查询”按钮,得本查字软件汉字信息库中前5笔顺码是12341最后2笔顺码是35(即前5笔是横竖撇点横最后2笔是撇折)的“杌杬枇栳桡椛槻棾橈麓欐欖欟”等13个汉字所在的记录;在“拼音”信息输入框中输入“j*”、“部件”信息输入框中输入“氵*”、“汉字笔顺码”信息输入框中输入“*34”、“笔画数”信息输入框中输入笔画数等于“*”,单击查询按钮,得本查字软件汉字信息库中,拼音首字母是“j”、第一部件是“氵”、最后二笔是撇点、笔画数任意的21个汉字是“決浅泬浃浹淗減溅滐漖漈潔濈潗澽激瀐濺瀸瀽灍”。
汉字字数多,构字情况复杂,人们方便使用的,可按国家语委标准化工作委员会制定的,可用于解决查字问题的信息就只有汉字的部件信息、笔顺码信息、笔画数信息和拼音信息等4种信息。不同的人对同一查询汉字所含此4种查字信息的了解情况不一样,本汉字综合信息查字法用任意一个汉字所含的部件、笔顺码、笔画数和拼音组合而成的综合查字信息中的任意一个子信息,作为查询信息,方便准确地快速获得GB13000.1字符集的20902个汉字中,满足查询条件的全部汉字的记录,让查询汉字可使用的信息最多,能给汉字查字工作与了解汉字所含部件、笔顺码、笔画数和拼音等4种信息情况的工作带来的方便最大。
用本汉字字词新查法查字,拿得准且能用输入法输出的成字部件,如“亻人入八扌阝卩艹口忄氵日月心皿”等成字部件,可用输入法输,拿不准及不会用输入法输出的成字部件和不能用输入法输出的非成字部件,可用给出的用查询部件的“部件笔顺码”信息和查询部件的“笔画数”信息,查询“查字部件”和输入“查字部件”的办法输。由于该办法能让用户根据查询汉字的笔顺码和形体结构,将查询汉字所含查字部件依次准确查出输出,所以本汉字字词新查法使用的部件虽多,但因部件选取与规范字书写知识结合得好,易掌握易应用,熟悉后,不会因为所用部件多,许多汉字所含的部件记不准或记不住,而给查字工作带来不便。
用本法查字的特点是速度快可用查询信息多,输完查询信息单击查询按钮后,马上能得到满足查询条件的记录。
初用本法查字时,可先输查询汉字所含最容易准确输出的一个查询信息,单击查询按钮,能很快得到查字软件的汉字信息库中,含所输查询信息的全部汉字的记录。当满足查询条件的记录不多,如少于20左右时,一般情况下通过单击显示内容标题栏中的排序按钮(如“部件”排序按钮)获得的排序方式,已能较方便准确的知道,查询汉字是否含于满足查询条件的记录中;当满足查询条件的记录较多,不便通过单击显示内容标题栏中的排序按钮获得的排序方式,确定查询汉字是否含于满足查询条件的记录中时,原来所输查询信息还保留着,可通过加输查询汉字所含其它查询信息的办法,来减少满足查询条件的记录,给获取查询汉字带来方便。
5.易通汉字字词新查法的特征在于查字软件对操作***汉字库所含GB13000.1字符集的20902个汉字还给出:①1至数片断汉字笔顺码查字法、②首末部件查字法、③首部件加后数汉字笔顺码查字法、④前数汉字笔顺码加末部件查字法共四种简单信息查字法,其中一至数片断汉字笔顺码查字法使用的查询信息,是查询汉字所含笔顺码、通配符?、通配符*组成的1至数片断汉字笔顺码字符串和查询汉字的笔画数二查询信息;首末部件查字法使用的查询信息由查询汉字所含的第一部件、末部件和查询汉字的笔画数3查询信息组成;首部件加后数笔顺码查字法使用的查询信息由查询汉字的首部件,查询汉字首部件后数个笔画的笔形代码、通配符?、通配符*组成的后数笔顺码字符串和查询汉字的笔画数3查询信息组成;前数笔顺码加末部件查字法使用的查询信息由查询汉字末部件前的数个笔画的笔形代码、通配符?、通配符*组成的前数笔顺码字符串,查询汉字的末部件和查询汉字的笔画数3查询信息组成;用户选定上述四种查字法中的任意一种查字法,打开相应查字法对话框,并按选定查字法给出的查询信息输入方式输完查询信息后,发出执行指令,查字软件磁盘文件中的程序,除能按用户所输查询信息的情况,迅速从GB13000.1字符集的20902个汉字存储在查字信息表的全部记录中,筛选出满足相应查询条件的每一目标记录,除将筛选出的每一目标记录在“汉字、拼音、部件、笔画数、部件式汉字笔顺码、字级”共6个字段中的字段值,用列表显示法显示给用户外,还将全部目标记录的数量显示给用户,用户看了满足查询条件的记录后,可根据满足查询条件的记录情况,在原来所输查询信息的基础上对原来所输查询信息作修改和修改后的查询;显示内容标题栏中的“汉字、拼音、部件、笔画数、部件式汉字笔顺码、字级”,既是满足查询条件的记录列表显示的列标题,也是满足查询条件的记录按指定顺序排序的命令按钮,简称排序按钮,单击不同的排序按钮,能让满足查询条件的记录产生不同的排序方式,给准确解决查字问题提供不同的方便。
下边依次对给出的四种简单信息查字法的使用情况作简要说明:
5.1、易通汉字字词新查法的查字软件对操作***汉字库所含GB13000.1字符集的20902个汉字给出的“一至数片断汉字笔顺码查字法使用的查询信息,是查询汉字所含笔顺码、通配符?、通配符*组成的1至数片断汉字笔顺码字符串和查询汉字的笔画数二查询信息。GB13000.1字符集的20902个汉字中,“龘”字的笔画数最多,有48画,所以笔画数可输1至48的整数;笔画数难准确数出的查询汉字,笔画数可输介于1至48间的某二整数i<j间的全部自然数“i-j”,也可不输(保留通配符*)。打开“一至数片断汉字笔顺码查字法”对话框时,“汉字笔顺码”信息输入框中的输入信息是代表任意一个汉字的笔顺码的通配符“*”,“笔画数”信息输入框中的输入信息是代表任意一个汉字的笔画数的通配符“*”。打开“一至数片断汉字笔顺码查字法”对话框后,用户什么信息也不输,直接单击查询按钮,得到的是查字软件汉字信息库所含20902个汉字的记录。
对笔画数较少,汉字笔顺码容易完整输出的查询汉字,只须在“汉字笔顺码”的输入框中,完整输入查询汉字的笔顺码,单击“查询按钮”后,就能获得当前查字软件中汉字笔顺码等于“汉字笔顺码”输入框中所输码值的全部汉字的记录。对GB13000.1字符集的20902个汉字,用完整输入汉字笔顺码的办法查字时,码值同为354的汉字最多,有“夕丸么久及凡勺夂夊”等9字;码值同为441354的汉字第2多,有“汐汲汷汋汣汍汎”等7字。
笔画数多或较多的汉字,用本一至数片断汉字笔顺码查字,其码值不用全输,当查询汉字含有笔顺码较难输出的组字笔画结构和笔顺码不能准确掌握的组字笔画结构时,其组字笔画结构的码值可用通配符*替代。用户可根据自己对查询汉字的形体结构和笔顺情况的了解,使用含通配符?、*的汉字笔顺码表达式将笔画数多或较多,构字情况复杂的汉字查字问题解决好,能让用查询汉字所含笔画信息解决查字问题变得方便灵活快速准确。
前数笔顺码与后数笔顺码都易输出的汉字,一般用“前数笔顺码+*+后数笔顺码”的办法查。使用本法查字时,有点小技巧。当首部件为四画和四画以下部件时,前数笔顺码应输首部件的笔顺码加第二部件的第1码至第2码。
如:当查字软件的汉字信息库收字为GB13000.1字符集的20902个汉字时,若用“251*34”查“噀=口巳巳共”,满足查询条件的汉字有524字,若改用“2515*34”查“噀”,满足查询条件的汉字降为14字;若进一步改用“2515*134”查“噀”,满足查询条件的汉字降为“呉吳吷呎唉噉嘨噀”8字。
又如查“薦=艹廌”,使用“122*4444”查时,有“焣蒍蓔蒸蔦……虉韉鸛”等50字;改用“1224*4444”查时,有“蒍蓔蔗薦藛藨鸏”7字。
注意:遇到前数笔顺码和后数笔顺码中含有不能准确掌握的笔顺码码值时,可用通配符?或*替代不能准确掌握的笔顺码码值。如騛=馬飛为查询汉字时,对馬的前数笔顺码与飛的后数笔顺码不熟悉的人员,可在汉字笔顺码输入框中输入“*4444534*”或“1*4444534*”等码值查騛(其中:4444是騛的首部件馬的后4笔顺码,534是騛的末部件飛的前3笔顺码)。
使用本法查字的最大优点是不用拆字,对前数笔顺码和后数笔顺码都易输出的查询汉字,在“汉字笔顺码”信息输入框中输入查询汉字的“前数笔顺码+*+后数笔顺码”后,单击查询按钮,马上可得查字软件汉字信息库中满足查询条件的全部记录,当满足查询条件的记录较多,不便从中找到要查汉字时,如果查询汉字的笔画数容易准确数出,输入查询汉字的笔画数,能让满足查询条件的记录减少,使查字工作方便。如果查询汉字的笔画数不易准确数出,限定笔画数的取值范围“i-j”,(i、j是正整数且1≤i<j≤48)也能让满足查询条件的记录减少,不输查询汉字的笔画数,单用适当多输汉字笔顺码的办法也能让满足查询条件的记录减少。
注意:当出现查询汉字不在满足查询条件的记录中时,应当用本查字软件提供的“部件查询”办法,检查所输笔顺码表达式是否正确。
5.2、易通汉字字词新查法的查字软件对操作***汉字库所含GB13000.1字符集的20902个汉字给出的“首末部件查字法”给用户提供用二部件字、三部件字和四部件字的第1个部件(首部件)和末部件(最后一个部件)查字的办法。该查字法使用的查询信息,由查询汉字所含的第一部件、末部件和查询汉字的笔画数3查询信息组成;打开“首末部件查字法”对话框时,“首部件”信息输入框中的输入信息是代表任意一个2至4部件汉字的首部件的通配符“?”、“末部件”信息输入框中的输入信息是代表任意一个2至4部件汉字的末部件的通配符“?”、“笔画数”信息输入框中的输入信息是代表任意一个汉字的笔画数的通配符“*”。笔画数可输1至48的整数;笔画数难准确数出的查询汉字,笔画数可输介于1至48间的某二整数i<j间的全部自然数“i-j”,也可不输(保留通配符*)。打开“首末部件查字法”对话框后,用户什么信息也不输,直接单击查询按钮,得能用本法查询的2部件至4部件汉字总数共计20122字。
用所述1105个部件解决GB13000.1字符集的20902个汉字查字问题时,2部件至4部件的汉字总数有20122字,其中有12444字是首末部件都是属于《中华人民共和国国家标准(GB2312-80)通讯用汉字字符集(基本集)》所含6763字中的汉字,此情况表明,有50%以上的汉字,其首末部件可直接用输入法将其输出。
用本法查字时,首部件为彳、末部件为亍的汉字数量最多,有25字,不输查询部件的笔画数,通过单击显示窗口中的排序按钮(如“部件”排序按钮),已能较方便准确的确定,查询汉字是否含于满足查询条件的记录中。
用本法查字,能用输入法输出的部件,如“艹、扌、氵、木、口、亻”等,可用输入法输,不能用输入输出的部件,可用查询部件的“部件笔顺码”信息和查询部件的“笔画数”信息,查询“查字部件”和输入“查字部件”的办法输。因为给出的查询“查字部件”和输入“查字部件”的办法,既让我们能根据查询汉字的形体结构情况和前一至数笔顺码,方便准确的输出查字应当使用的首部件;也让我们能根据查询汉字的后一至数笔顺码,方便准确的输出查字应当使用的末部件。所以本查字法的提供,能让任意一个属于GB13000.1字符集的可拆汉字(二部件字、三部件字和四部件字)的查字问题,基本都能获得快速准确的解决。
说明:用所述部件解决查字问题时。所用部件有简单部件及以简单部件和其它组字笔画结构组合而成的复合部件。使用部件信息查字时,遇到查询汉字含有以简单部件和其它组字笔画结构组合而成的复合部件的汉字时,可能会出现取错部件的问题。当出现取错部件的问题时,查询汉字就不含于满足查询条件的记录中。因此,当出现查询汉字不在满足查询条件的记录中时,应当用给出的“部件查询”办法,检查查询汉字的首部件是否是以所输首部件为第一子部件的复合部件、末部件是否是以所输末部件为后子部件的复合部件。
5.3、易通汉字字词新查法的特征在于查字软件对操作***汉字库所含GB13000.1字符集的20902个汉字给出的“首部件加后数汉字笔顺码查字法”给用户提供用二部件字、三部件字和四部件字的第一个部件和第一个部件后的任意数个笔画的笔顺码查字的办法。该查字法使用的查询信息,由查询汉字的“首部件”信息、首部件后的“后数笔顺码”信息和查询汉字的“笔画数”信息等3种查询信息组成。“首部件”信息的输入信息既可是查询汉字的首部件,也可以是代表任意一个查询汉字的首部件的通配符“?”;“后数笔顺码”信息的输入信息既可是代表查询汉字首部件后的任意数个笔画的笔顺码的通配符“*”,也可以是查询汉字首部件后的任意数个笔画的笔顺码与通配符?、*组成的笔顺码表达式;“笔画数”信息的输入信息既可是查询汉字的笔画数,也可以是代表任意一个查询汉字的笔画数的通配符“*”或介于1至48间的某二整数i<j间的全部自然数“i-j”。
打开“首部件加后数汉字笔顺码查字法”对话框时,“首部件”信息输入框中的输入信息是代表任意一个查询汉字的首部件的通配符“?”、“后数笔顺码”信息输入框中的输入信息是代表任意一个查询汉字的首部件后的任意数个笔画的笔顺码的通配符“*”、“笔画数”信息输入框中的输入信息是代表任意一个查询汉字的笔画数的通配符“*”。打开“首部件加后数汉字笔顺码查字法”对话框后,用户什么信息也不输,直接单击查询按钮,得能用本查字法查询的2部件汉字至4部件汉字的总数,共计20122字。
本查字法相当于用部首查字法中的“氵、艹、木、扌、口、釒、亻”等前置部首查字,不同的是:
①对任意一个知道规范字书写情况的汉字,给出的查询“查字部件”和输入“查字部件”的办法,能让我们根据查询汉字的前数笔顺码,方便准确的输出获取任意一个查询汉字应当使用的首部件,保证每个知道规范汉字书写情况的非单部件汉字都能顺利使用本查字法解决查字问题。
②当出现满足查询条件的记录中不含查询汉字的问题时,给出的查询“查字部件”和输入“查字部件”的办法,能帮助我们检查是否存在输错首部件或输错后数笔顺码的问题。
③查询汉字的首部件为组字数量多的首部件时,可通过加输查询汉字的后数笔顺码与查询汉字的笔画数来减少查询汉字的数量,使查询汉字的获取方便容易快速准确。
说明:
①后数笔顺码的输入支持通配符,不必一定要连续使用最后数个笔顺码,对后数笔顺码中含不熟悉码值的查询汉字,可通过用通配符*或?替代不熟悉码值的办法避开不熟悉的码值,来方便后数笔顺码的输入。如查鼆=冖日六黽,对黽的笔顺情况不熟悉的人员,后数笔顺码可取为4134*(4134是第3部件六的笔顺码,*代替黽的笔顺码)或2511*(2511是第2部件日的笔顺码,*代替第3部件六的笔顺码+第4部件黽的笔顺码)。
②当查询汉字的首部件为组字数量多的首部件时,若查询汉字的末部件是4画或4画以下汉字,输后数笔顺码时,除输末部件的笔顺码外,最好再多输上末部件的前一部件的最后1至2码。如在GB13000.1字符集的20902个汉字中,用本查字法查“垽”时,首部件输氵,后数笔顺码输121(“垽”的末部件土的笔顺码)时,满足查询条件的汉字有81字,首部件输氵,后数笔顺码输2121时,满足查询条件的汉字降为“淽泟壍瀝沚澁垽涶涩堻澀”11字。
③用所述的1105个部件解决查字问题时,有少量部件是以简单部件和其它组字笔画结构组合而成的复合部件,按本技术方案规定的能拆复合部件的汉字,不拆复合部件所含的子部件,当出现查询汉字不在满足查询条件的记录中时,应用给出的查询“查字部件”和输入“查字部件”的办法,检查查询汉字的首部件是否是以所输首部件为前子部件的复合部件。如“章”是以“立日十”3个简单部件组成的复合部件,当遇到“鄣彰赣戆”等以“章”打头的查询汉字时,首部件一定要取为“章”才能查到要查汉字,首部件取为“立”或“音”,是没法获得要查汉字的。显然,如果首部件没有取错,须进一步检查后数笔顺码是否输对。
5.4、易通汉字字词新查法的查字软件对操作***汉字库所含GB13000.1字符集的20902个汉字给出的“前数汉字笔顺码加末部件查字法”给用户提供用二部件字、三部件字和四部件字的末部件和末部件前的任意数个笔画的笔顺码查字的办法。该查字法使用的查询信息,由查询汉字的“末部件”信息、末部件前的“前数笔顺码”信息和查询汉字的“笔画数”信息等3种查询信息组成。“末部件”信息的输入信息既可是查询汉字的末部件,也可以是代表任意一个查询汉字的末部件的通配符“?”;“前数笔顺码”信息的输入信息既可是代表查询汉字末部件前的任意数个笔画的笔顺码的通配符“*”,也可以是查询汉字末部件前的任意数个笔画的笔顺码与通配符?、*组成的笔顺码字符串;“笔画数”信息的输入信息既可是查询汉字的笔画数,也可是代表任意一个查询汉字的笔画数的通配符“*”或介于1至48间的某二整数i<j间的全部自然数“i-j”。
打开“前数汉字笔顺码加末部件查字法”对话框时,“末部件”信息输入框中的输入信息是代表任意一个查询汉字的末部件的通配符“?”、“前数笔顺码”信息输入框中的输入信息是代表任意一个查询汉字的末部件前的任意数个笔画的笔顺码的通配符“*”、“笔画数”信息输入框中的输入信息是代表任意一个查询汉字的笔画数的通配符“*”。打开“前数笔顺码加末部件查字法”对话框后,用户什么信息也不输,直接单击查询按钮,得能用本查字法查询的2部件字、3部件字和4部件汉字的总数,共计20122字。
本查字法相当于用部首查字法中的“刂卩阝(在右)廴亍彡辶灬心皿”等后置部首查字,不同的是:
①对任意一个知道规范字书写情况的汉字,给出的查询“查字部件”和输入“查字部件”的办法,能让我们根据查询汉字的后数笔顺码,方便准确的输出获取任意一个查询汉字应当使用的末部件,让任意一个知道规范汉字书写情况的非单部件汉字都能顺利使用本查字法解决查字问题。
②当出现满足查询条件的记录中不含查询汉字的问题时,给出的查询“查字部件”和输入“查字部件”的办法,能帮助我们检查是否存在输错末部件或输错前数笔顺码的问题;
③查询汉字的末部件为组字数量多的末部件时,可通过加输查询汉字的前数笔顺码与查询汉字的笔画数来减少查询汉字的数量,使查询汉字的获取方便容易快速准确。
GB13000.1字符集的20902个汉字中,二部件字、三部件字和四部件字的数量为20122字,其中有15880字的末部件是GB2312-80的汉字,这些汉字的末部件既可用输入法直接将其输出,也可用给出的查询“查字部件”和输入“查字部件”的办法将其输出。末部件组字数量最多的10个部件依次是,口434字、心392字、辶377字、木330字、鳥297字、日273字、貝272字、寸234字、女233字、刂231字。
用前4笔顺码加末部件查字时,前4笔顺码为1234、末部件为心的汉字数量最多,有23字;前4笔顺码为2511、末部件为鳥的汉字第2多,有22字、前4笔顺码为2512、末部件为木的汉字第3多,有20字。实际情况表明,用末部件加前数笔顺码查字,无论查询汉字的末部件的组字数量是多少,前数汉字笔顺码输入4码,不输查询汉字的笔画数,通过单击显示窗口中的排序按钮(如“部件”排序按钮),已能比较方便准确的解决问题。
说明:
①前数笔顺码的输入支持通配符,不必一定要用查询汉字的最前数个笔顺码(就效果而言,用最前数个笔顺码的效果最好)。对前数笔顺码中含有不熟悉的笔顺码码值的查询汉字,可用通配符*或?替换不熟悉的笔顺码码值。如用本查字法查闙=門户攵口时,对門的笔顺情况不熟悉的人员,前数笔顺码输入框中可输入“*4513”(*代替闙的首部件門的笔顺码,4513是闙的第二部件户的笔顺码,此时满足查询条件的汉字有“启扂梮焗啔啓駶闙”共8字)或*3134(*代替闙的首部件門和2部件户的笔顺码,3134是闙的第3部件攵的笔顺码,此时满足查询条件的汉字有“娢啓嗸鋡闙”共5字)。
②当查询汉字的末部件是组字数量多的末部件,查询汉字的第一部件是3画或3画以下部件时,输前数笔顺码时,输完第一部件的笔顺码后,最好再多输上第二部件的前1码至前2码。如在GB13000.1字符集的20902个汉字中,用本查字法查“佲”时,末部件输口,前数笔顺码输32(佲的首部件亻的笔顺码)时,满足查询条件的汉字有“佑俉俖僖佔侶倽佲……侰皓售嚳鼯”26字,末部件输口,前数笔顺码输323时,满足查询条件的汉字降为“佲俈倁俰倽倃”6字。
③用所述的1105个部件解决查字问题时,有少量部件是以简单部件和其它组字笔画结构组合而成的复合部件,当出现查询汉字不在满足查询条件的记录中时,应用权利要求3给出的“部件查询”办法,检查查询汉字的末部件是否是以所输末部件为后子部件的复合部件。如果末部件没有取错,须进一步检查前数笔顺码是否输对。
6.易通汉字字词新查法的特征在于查字软件对操作***汉字库所含GB13000.1字符集的20902个汉字中,含有查字关键字的二部件字、三部件字和四部件字等3种汉字,还给出输查字关键字查字的特殊信息查字法,输查字关键字查字法使用的查询信息是查询汉字所含的“查字关键字”,用户选定输查字关键字查字法,打开输查字关键字查字法对话框,并在“查字关键字”信息输入框中输入查询汉字所含的一个查字关键字,发出“查询”指令,查字软件磁盘文件中的程序,能迅速从GB13000.1字符集的20902个汉字存储在查字信息表的全部记录中找到用户所输查字关键字所在的记录,将用户所输查字关键字的部件情况显示给用户,并根据查字关键字的部件数量,给出获取查询汉字可作的相关选择,用户根据查询汉字的构字情况,作出获取查询汉字应作的选择后,查字软件磁盘文件中的程序,能按用户所作选择,迅速从GB13000.1字符集的20902个汉字存储在查字信息表的全部记录中,筛选出满足用户所作选择的每一目标记录,除将筛选出的每一目标记录在“汉字、拼音、部件、笔画数、部件式汉字笔顺码、字级”等6个字段中的字段值,用列表显示法显示给用户外,还将全部目标记录的数量显示给用户,显示内容标题栏中的“汉字、拼音、部件、笔画数、部件式汉字笔顺码、字级”,既是满足查询条件的记录列表显示的列标题,也是满足查询条件的记录按指定顺序排序的命令按钮,简称排序按钮,单击不同的排序按钮,能让满足查询条件的记录产生不同的排序方式,给准确解决查字问题提供不同的方便。
按规定的能拆复合部件的汉字,不拆复合部件所含的子部件,查“章”和含“章”的汉字时,不能用“章”所含的“立日十”3子部件及“音早”二子部件;查“音”和含“音”的汉字时,不能用“音”所含的“立日”2子部件;查“早”和含“早”的汉字时,不能用“早”所含的“日十”2子部件。
查字关键字的定义:查询汉字所含的小于查询汉字而又不含于查询汉字所含复合部件中的汉字,叫查询汉字的查字关键字。
注意:当查询汉字含有复合部件时,含于查询汉字所含复合部件中的全部小于复合部件的汉字(含成字子部件)不是查询汉字的查字关键字(参见后边的例6.2、例6.3、例6.4)。
例6.1.“骤=马耳又乑”是四部件字,“马耳又乑”都是成字部件,都是“骤”所含的小于“骤”的汉字,“聚”是小于“骤”且由骤所含的“耳又乑”3个部件组成的汉字,“取”是小于“骤”且由骤所含的“耳又”2个部件组成的汉字,骤没有复合部件,所以“聚取马耳又乑”6字都是“骤”的查字关键字。此6字中的任意一字都可作为“骤”的查字关键字,用本查字法提供的输查字关键字查字功能查到“骤”所在的记录,不过效果会不一样。
打开输查字关键字查字法对话框,若在“查字关键字”信息输入框中输入查字关键字“聚”,单击“查询”按钮后,“查字关键字”信息输入框右侧立即显示,查字关键字的部件是“耳又乑”,并在下方给出:“显示前三部件是﹝耳又乑﹞的汉字”与“显示后三部件是﹝耳又乑﹞的汉字”两个选择。“耳又乑”是“骤”的后三部件,单击“显示后三部件是﹝耳又乑﹞的汉字”,立即得到GB13000.1字符集的20902个汉字中后三部件是“耳又乑”的记录是:
汉字hzpy | 部件 | 笔画数 | 部件式汉字笔顺码 | 字级 |
藂Cong | 艹耳又乑 | 17 | 122+122111+54+323334 | 4级字 |
骤Zhou | 马耳又乑 | 17 | 551+122111+54+323334 | 1级字 |
驟Zhou | 馬耳又乑 | 24 | 1211254444+122111+54+323334 | 4级字 |
若在“查字关键字”信息输入框中输入的查字关键字是“取”,单击“查询”按钮后,“查字关键字”信息输入框右侧立即显示,查字关键字的部件是“耳又”,并在下方给出:“显示前二部件是﹝耳又﹞的汉字”、“显示中间二部件是﹝耳又﹞的汉字”与“显示后二部件是﹝耳又﹞的汉字”三个选择。“耳又”是“骤”的中间二部件,单击“显示中间二部件是﹝耳又﹞的汉字”,立即得到GB13000.1字符集的20902个汉字中,中间二部件是“耳又”的汉字有“摄藂驟嗫蹑镊滠慑骤”等9字,骤就在其中了。
若在“查字关键字”信息输入框中输入的查字关键字是“乑”,单击“查询”按钮后,“查字关键字”信息输入框右侧立即显示,查字关键字的部件是“乑”,并在下方给出:“显示首部件是﹝乑﹞的汉字”、“显示第二部件是﹝乑﹞的汉字”、“显示第三部件是﹝乑﹞的汉字”与“显示第四部件是﹝乑﹞的汉字”四个选择。“乑”是“骤”的第四部件,单击“显示第四部件是﹝乑﹞的汉字”,立即得到GB13000.1字符集的20902个汉字中第四部件是“乑”的记录是:
汉字 | hzpy | 部件 | 笔画数 | 部件式汉字笔顺码 | 字级 |
藂 | Cong | 艹耳又乑 | 17 | 122+122111+54+323334 | 4级字 |
骤 | Zhou | 马耳又乑 | 17 | 551+122111+54+323334 | 1级字 |
驟 | Zhou | 馬耳又乑 | 24 | 1211254444+122111+54+323334 | 4级字 |
取“马耳又”作“骤”的查字关键字的查字情况就不详细讨论了,在此仅指出,GB13000.1字符集的20902个汉字中,第一部件是“马”的汉字有53字,其中第一部件是“马”的4部件汉字有5字;第二部件是“耳”的汉字有90字,其中第二部件是“耳”的4部件汉字有25字;第三部件是“又”的汉字有181字,其中第三部件是“又”的4部件汉字有42字。
例6.2.“戆=章夂贡心”是4部件字,此4部件都是成字部件,其中“章贡”二部件为成字复合部件。“赣”是小于“戆”且由戆所含的“章夂贡”3个部件组成的汉字,“戆”的查字关键字是“赣章夂贡心”5字。此5字中的任意一字,都可作为查字关键字,用“输查字关键字查字”功能查到“戆”。因“章贡”二部件是戆所含的复合部件,所以章所含的“立日十音早”5个成字子部件和贡所含的“工贝”二个成字子部件,都不是“戆”的查字关键字。
例6.3.是4部件字,其中“鼻吅”2部件是成字复合部件、2部件是非成字复合部件,是小于齉且由齉所含的吅3个部件组成的汉字,齉的查字关键字是“囊鼻吅”3字。此3字中的任意一字,都可作为查字关键字,用“输查字关键字查字”功能查到“齉”。含于齉的复合部件鼻中的全部小于复合部件鼻的汉字“自田不畀”四字(此4字中“自田不”是“鼻”的成字子部件,“畀”是小于“鼻”的汉字)、含于齉的复合部件吅中的汉字口及含于齉的复合部件中的汉字冖,都不是齉的查字关键字。
例6.4.是3部件字,其中“艹子”是成字部件,是非成字复合部件。是小于孽且由孽所含的2部件组成的汉字,孽的查字关键字是“薛艹子”3字,此3字中的任意一字,都可作为查字关键字,用“输查字关键字查字”功能查到“孽”。含于孽的非成字复合部件中的全部小于的汉字“立十辛”,不是孽的查字关键字。
例6.5.是3部件字,此3部件中忄和旡是成字部件,“既”是小于慨且由“慨”的后二部件组成的非成字复合部件的汉字,“慨”的查字关键字有“忄旡既”3字。
说明:单部件字无查字关键字,当用限定每字最多只拆四个部件的办法解决查字问题时,只有至少含有一个GB13000.1字符集中的汉字的二部件字、三部件字和四部件字才能成为具有查字关键字的汉字,或才有查字关键字。四部件字所含的查字关键字,只可能是一部件至三部件的汉字;三部件字所含的查字关键字,只可以是一部件至二部件的汉字;二部件字所含的查字关键字,只能是成字部件的汉字。注意,含复合部件的查询汉字,查询汉字所含的小于查询汉字的汉字中,含于查询汉字所含复合部件中的全部小于查询汉字的汉字,不为查询汉字的查字关键字。
根据以上的5例,我们得:不含复合部件的汉字,其查询汉字为自身所含的小于自身的全部汉字。含有复合部件的汉字,除查询汉字所含的含于复合部件中的汉字外,查询汉字所含小于自身且又不含于自身所含复合部件中的汉字都可作为查询汉字的查字关键字。
不难想到,当查询汉字含有两个或两个以上查字关键字时,用小于查询汉字的最大成字作查字关键字,获取查询汉字效果最好。
准确确定每一汉字所含的查字关键字,可能会有一定困难,实际解决问题时,可用查询汉字所含的,自己会用输入法输出的小于查询汉字的最大汉字作查询汉字的查字关键字来获取查询汉字,当出现不能用所输查字关键字获得查询汉字的问题时,很可能是所输查字关键字不是查询汉字所含的真正的查字关键字或查询汉字是单部件字(成字复合部件)。遇到此种情况时,最好改用软件提供的其它查字法获取查询汉字,也可调出权利要求3给出的用“部件笔顺码”信息查询部件和输入部件的功能,检查所输查字关键字是否真是查询汉字所含复合部件中的汉字,或查询汉字是否为单部件字。
用所含的1105个部件解决GB13000.1字符集20902个汉字的查字问题时,单部件字有780字,有20122字是二部件字至四部件字,此20122字中,全是非成字部件的汉字有58字,含成字部件的汉字有20064字。即能用“输查字关键字查字”功能解决查字问题的二部件字至四部件字有20064字,此20064字中有17655字含国家标准信息交换汉字编码GB2312-80字符集16区—55区的一级字(17655÷20902≈0.8447);有1897字是GB2312-80字符集56区至87区的二级字,所以查字软件配备“输查字关键字查字”功能,可让84%以上的GB13000.1字符集20902个汉字,可以不用考虑查询汉字的部件拆分情况,直接通过输查询汉字所含的GB2312-80字符集16区—55区的3755个一级字将查询汉字查出,能给用户带来的方便是大的。
以上讨论表明,易通汉字字词新查法配备“输查字关键字查字”功能具有以下三个作用:①给用户提供直接用查询汉字所含的能用输入法输出的查字关键字,将查询汉字查出的办法。用查询汉字所含的查字关键字查字,可不必考虑获取查询汉字的查字关键字的拆分情况,能给查字工作带来方便。②让用户能方便的了解GB13000.1字符集20902个汉字中,任意一个会输汉字的汉字部件拆分情况。③让用户能方便的了解任意一个会输汉字含于GB13000.1字符集的20902个汉字中的汉字情况,有利汉字构字情况的深入了解。
7.易通汉字字词新查法的特征在于查字软件对汉字词语给出的汉字词语综合信息查询法由查询汉字词语的“词语字数、词语汉字、词语汉字首部件、词语汉字末部件、词语简拼、词语全拼”等6种查询信息组成,其中查询词语的“词语字数”信息输入框中的输入信息是查询词语所含汉字的字数;查询词语的“词语汉字”信息输入框中的输入信息是查询词语所含的汉字与通配符?、*组成的词语汉字字符串;查询词语的“词语汉字首部件”信息输入框中的输入信息是查询词语所含汉字的首部件与通配符?、*组成的词语汉字首部件字符串;查询词语的“词语汉字末部件”信息输入框中的输入信息是查询词语所含汉字的末部件与通配符?、*组成的词语末部件字符串;查询词语的“词语简拼”信息输入框中的输入信息是查询词语所含汉字的拼音首字母与通配符?、*组成的词语简拼字符串;查询词语的“词语全拼”信息输入框中的输入信息是查询词语所含汉字的拼音字母与通配符?、*组成的词语全拼字符串;打开汉字词语综合信息查询法对话框,用户按规定输入查询汉字所含上述查询信息中的任意一子信息,发出“查询”指令后,查字软件磁盘文件中的程序,除能按用户所输查询信息的情况,迅速从汉字字词查询软件中的汉字词语信息表的全部记录中,筛选出相应字段的字段值分别满足相应查询条件的每一目标记录,除将筛选出的每一目标记录在“词语字数、词语汉字、词语汉字首部件、词语汉字末部件、词语全拼”等5个字段中的字段值,用列表显示法显示给用户外,还将全部目标记录的数量显示给用户,用户看了满足查询条件的记录后,可根据满足查询条件的记录情况,在原来所输查询信息的基础上对原来所输查询信息作修改和修改后的查询;显示内容标题栏中的“词语字数、词语汉字、词语汉字首部件、词语汉字末部件、词语全拼”,既是满足查询条件的记录列表显示的列标题,也是满足查询条件的记录按指定顺序排序的命令按钮,简称排序按钮,单击不同的排序按钮,能让满足查询条件的记录产生不同的排序方式,给准确解决汉字词语查询问题提供不同的方便。
易通汉字字词新查法的查字软件对汉字词语给出的汉字词语综合信息查询法的汉字词语由两个或两个以上汉字组成,词语字数的输入值至少是2。本汉字词语综合信息查询法,通过给汉字词语建立含“词语字数、词语汉字、词语汉字首部件、词语汉字末部件、词语简拼、词语全拼”等字段的Access数据表,用Access数据表的筛选功能实现汉字词语的综合信息查询。
特别说明:单部件字只有一个部件,对词语汉字中的单部件字,词语汉字中的末部件和首部件都取为单部件字本身。如“汉字词语”四字的部件情况是:汉=氵又、字=宀子、词=讠司、语=讠五口。“汉字词语”的词语汉字首部件是“氵宀讠讠”、“汉字词语”的词语汉字末部件是“又子司口”;“电子计算机”五字的部件情况是:电=电、子=子、计=讠十、算=目廾、机=木几。“电子计算机”的词语汉字首部件是“电子讠木”、“电子计算机”的词语汉字末部件是“电子十廾几”。
打开汉字词语综合信息查询法对话框,查询词语的“词语字数”信息输入框中的输入信息是代表任意一个查询词语所含汉字字数的通配符*、查询词语的“词语汉字”信息输入框中的输入信息是代表任意一个查询词语所含全部汉字的通配符*、查询词语的“词语汉字首部件”信息输入框中的输入信息是代表任意一个查询词语所含全部汉字首部件的通配符*、查询词语的“词语汉字末部件”信息输入框中的输入信息是代表任意一个查询词语所含全部汉字末部件的通配符*、查询词语的“词语简拼”信息输入框中的输入信息是代表任意一个查询词语所含全部汉字的拼音首字母的通配符*、查询词语的“词语全拼”信息输入框中的输入信息是代表任意一个查询词语所含全部汉字的全部拼音字母的通配符*,如果用户什么信息也不输,就直接单击查询按钮,得到的是汉字字词查询软件所含汉字词语信息表的全部记录的“词语字数、词语汉字、词语汉字首部件、词语汉字末部件、词语全拼”等信息及汉字词语信息表中全部汉字词语记录的数量。
打开汉字词语综合信息查询法对话框,如果用户只在查询词语的“词语字数”信息输入框中输入“2”后,就单击查询按钮,得到的是汉字字词查询软件所含汉字词语信息表中的全部二字词所在记录的“词语字数、词语汉字、词语汉字首部件、词语汉字末部件、词语全拼”等信息及汉字词语信息表中全部二字词记录的数量。
打开汉字词语综合信息查询法对话框,如果用户只在查询词语的“词语汉字”信息输入框中输入“??机*”,就单击查询按钮,得到的是汉字字词查询软件所含汉字词语信息表中的全部第三字是“机”的3字和3字以上词语,如“计算机、空调机、洗衣机、收录机、……、别出机杼、国家机关、激励机制、面授机宜……、计算机科学、计算机技术、计算机知识、……、计算机处理器、计算机等级考、国家机关工作人员、计算机汉字输入法、计算机汉字处理***、计算机汉字输入***、计算机汉字输入技术、计算机等级考必考知识、计算机软件著作权登记证书……”等词语。如果用户只在查询词语的“词语字数”信息输入框中输入“5”,查询词语的“词语汉字”信息输入框中输入“??机*”,就单击查询按钮,得到的是汉字字词查询软件所含汉字词语信息表中的全部第三字是“机”的5字词,如“计算机科学、计算机技术、计算机知识、计算机程序、计算机键盘、计算机网络、计算机软件、计算机输字、计算机教师、计算机***、计算机领域、计算机病毒、农业机械化”等13个五字词。此13个五字词的显示信息见下表5.1.
表5.1:第三字是机的13个五字词的显示内容:
就目前申请人使用的“易通输入法”词库中收集的48383条词语而言,二字词最多,有24353条、四字词第二多有13928条、三字词有6098条、五字词有1186条,五字以上词语随词语字数的增加而减少。单用词语简拼搞词语查询时,二字词有480组重复值,其中简拼为zz的二字词有222词、简拼为yy的二字词有212词、简拼为ss的二字词有203词、简拼为zs的二字词有198词;三字词有1416组重复值,其中简拼为yzy、yly、zys、zyy的三字词分别都有9词,简拼为yzy的9词是“也只有、有助于、有志于、用之于、以至于、一昼夜、要注意、养猪业、养殖业”、简拼为yly的9词是“养老院、一溜烟、一律以、以利于、游乐园、有赖于、有利于、愈来愈、越来越”、简拼为zys的9词是“占优势、这也是、针叶树、志愿书、主要是、自由式、总预算、左右手、作用是”、简拼为zyy的9词是“只应用、中医药、众议员、众议院、主要有、着眼于、自由泳、总医院、作用于”,其它的都不到9组;四字词有1461组重复值,其中简拼为gjzy的四字词有7词,此7词为“甘居中游、高级专员、更加重要、故伎重演、关键在于、关键作用、国际主义”、简拼为sfzy的四字词有6词,此6词为“三分之一、十分重要、十分注意、示范作用、是否属于、四分之一”、简拼为gzzd的四字词也有6词,此6词为“耕作制度、工资制度、工作制度、工作重点、工作做得、规章制度”,其它的都不到6词。
下边着重讨论对二字词使用部分综合信息查词法的查询效果。
就目前我自己使用的“易通输入法”词库中随意收集的24353条二字词而言,单用词语首字解决二字词的查询问题时,首字为大的二字词最多,有206词;;首字为“不”的二字词第2多,有192词;首字为“一”的二字词第3多,有148词;首字为“开”的二字词第4多,有89词。
用词语首字加末字首部件解决二字词的查询问题时,首字为不、末字首部件为亻的二字词最多,有12词,此12词为:不仅、不但、不作、不住、不佳、不使、不依、不便、不信、不值、不倦、不停。首字为电、末字首部件为钅的二字词和首字为一、末字首部件为亻的二字词并列第二多,各有10词,期中首字为电、末字首部件为钅的10词为:电钟、电钮、电钻、电铃、电铲、电铸、电键、电锯、电镀、电镐。首字为一、末字首部件为亻的10词为:一代、一件、一任、一伙、一体、一位、一例、一侧、一俟、一倍。
用词语首字加末字末部件解决二字词的查询问题时,首字为不、末字末部件为心的二字词最多,有8词,此8词为:不惑、不想、不愿、不息、不稳、不忘、不意、不忍。首字为不、末字末部件为口的二字词与首字为大、末字末部件为攵的二字词并列第二多,各有7词。其中首字为不、末字末部件为口的7词为“不含、不知、不和、不问、不容、不善、不如”,首字为大、末字末部件为攵的7词为“大故、大致、大赦、大败、大敌、大政、大数”。
用词语首字加简拼解决二字词的查询问题时,首字为大简拼为dy的二字词和首字为不简拼为by的二字词并列第一多,各有19词。首字为大简拼为dy的19个二字词为:大于、大有、大雨、大样、大雁、大雅、大业、大员、大印、大爷、大鱼、大义、大衣、大洋、大烟、大庸、大意、大约、大院。首字为不简拼为by的19个二字词为:不一、不与、不有、不远、不严、不要、不愿、不由、不易、不用、不依、不移、不义、不应、不宜、不悦、不意、不已、不予。首字为不简拼为bj的二字词第三多,有“不尽、不及、不见、不解、不久、不禁、不静、不倦、不仅、不佳、不拘、不绝、不经、不羁、不均、不讲、不计、不觉”等18词。
汉字词语综合信息查询法,能让可用于查询汉字词语的数个常用不同信息可任意的合在一起,解决汉字词语的查询问题,使查询汉字词语可用的信息和办法都多而活,让汉字词语的查询变得简单容易,有利网络汉语字词典效果的发挥,有利优质汉语电脑词典的产生,有利写文章能正确用字用词、读文章能正确理解文章含意。
Claims (8)
1.易通汉字字词新查法,其特征在于,将查询汉字的字形信息取为部件,对计算机操作***汉字库所含GB13000.1字符集的20902个汉字,建立包含“汉字、部件、汉字笔顺码、笔画数、拼音、字级”等6信息的Access数据表,对数据表中用于解决汉字查询的“部件、汉字笔顺码、笔画数、拼音”四信息,用Access的排序、筛选、查询和查找重复项功能,获取用每一汉字所含“部件、汉字笔顺码、笔画数、拼音”四种查字信息组合而成的综合查字信息的子信息,解决GB13000.1字符集中的汉字查字办法,其中“汉字、汉字笔顺码、笔画数、拼音、字级”5信息取国家语委标准化工作委员会颁布的标准化信息,部件选取遵循的主要原则是:对GB13000.1字符集的全部汉字,每个汉字的每个部件的选取都在含相交笔画的组字笔画结构一律不拆、不能按被拆汉字的笔顺码顺序选取得到的部件一律不取的前提下,根据被拆汉字的规范字形体结构,按照被拆汉字的笔顺码顺序依次选取被拆汉字所含的组字笔画结构为被拆汉字的查字部件,简称部件,只与其它汉字有相同组字笔画结构的被拆汉字,取其它汉字也含的相同组字笔画结构为被拆汉字的部件;既含其它汉字含有的相同组字笔画结构,也含其它汉字没有的组字笔画结构的汉字,除被拆汉字所含其它汉字也含的相同组字笔画结构取为被拆汉字的部件外,被拆汉字所含其它汉字没有的组字笔画结构,也取为被拆汉字的部件;与其它汉字没有相同组字笔画结构的汉字,取自身为部件;全包围结构的汉字和含全包围结构的汉字所含全包围部件一律不拆,其中每个全包围结构的汉字都取自身为部件,每个含全包围结构的汉字,都将所含全包围结构取为一个部件;特殊半包围结构的汉字和含特殊半包围结构的汉字所含特殊半包围部件一律不拆,其中每个特殊半包围结构的汉字都取自身为部件,每个含特殊半包围结构的汉字,都将所含特殊半包围结构取为一个部件;能拆复合部件的汉字,不拆复合部件所含的子部件;每一汉字所含各个部件的部件笔顺码都用该汉字的汉字笔顺码依次获得,每一汉字的汉字笔顺码都等于自身依次拆得的各个部件的部件笔顺码之和;
限定每字最多只拆四个部件的前提下,用汉字部件信息解决操作***汉字库所含GB13000.1字符集20902个汉字的查字问题时,使用的部件有1105个,其中成字部件有780个,非成字部件有325个,780个成字部件是:一二丅十丁厂丆匚匸七丂三干亍于亏亐工土士扌艹卄才下寸不廾大丈兀尢万弋夨丰王开井天夫元无韦弌云专耂丐廿木朩五帀巿支丏卅不犬太区歹友尤匹车巨牙屯戈比旡兂互瓦弍玉匞未末示戋正甘世丗卌古本术可叵匝丙左石夲戊龙匛平东匜戉弎匡耒式戎圭吉耳共亚亘臣吏再覀襾朿西亙戌百而页匠戍匢死成匟夹夷至匤戒走贡赤声巫求車甫匣更亜束豆戓两酉丽医辰丣夾豕尨来亊忒匥巠武青甙匦者夌幸亞其昔若直林來東或事雨匼豖贰匧垚壴哉革匽畐柬咸威頁匨匩珤敖匿匪髟栽馬载貢烖盍莫莧尃彧鬲烕原匫彗匭貮埶黄萑戜匮區戚帶匬爽匾貳臷蛓胾裁壹黃棥厤尞雲載酨畺匯雷匲截匱匰監爾臧奭韯匳噩匴匵戴匶匷丨亅丄刂卜冂上小口囗山巾止卝攴少曰日冄中円贝罓内內水见禸北凸歺业氺旦目且曱甲申电田由史央兄叹甴冉罒皿冊凹冋囚四囙囜尗虍光早吋曳虫曲团団吅吕同因回网肉囝囡貝見囯里呆囲园围囩足男困串囨邑囤囬囦囮囧冏囵囫囥図非齿虎果国門囸固丳囷囶囹图囻囼韭昜禺品囿圀骨幽鬥丵畢圃圄圂圆圁鹵堂圊曼圉國圇圈歮猒晶單買圌圐圏黑圍圎黽園圔圑睘蜀圓圕團圖圙圗齒畾嘼圚圛圜豳圝圞丿亻八人入乂勹儿匕几九千乇乞川彳彡亇犭夕久夂夊么勺凡丸及饣午牛手气毛壬牜升夭攵长片化币斤爪丯戶父从仌爻爫仒今凶分月厃氏勿欠匁风丹乌殳钅生矢失乍禾丘白斥瓜乎令用甩尔乐句匆匃册处鸟刍年朱缶先舌臼乑自血向囟舟合兆旨各多色我呑每身囱佥釆谷豸角夆系垂幷秉臾隹卑金釒侖飠周鱼兔卸乗香重复泉鬼禹盾俞兪爰食風埀乘倠奚鬯倉眞鳥魚鼠僉會鼻龜龠丶乁乀亠冫丷冖讠丬广亡门丫氵忄宀辶之六文方火为斗灬户礻冘心主疒立玄半头穴衤必永亦衣产吂亥羊米屰农言訁辛羌弟良京育单炏炎畄官音前酋高剡窊麻鹿章産寅戠寍惢廌褱龍嬴贏乛乚乙了凵丩卩阝刀力乃又厶乄廴巜乜彐卂尸己已巳弓子孑屮孓卪也女乆刃刄飞叉马彑纟乡幺巛肀尹卐尺夬弔丑卍爿巴刅办以予毌书毋司民弗疋出氶丱召皮发癶矛母聿帇艮劦羽叒厽糸糹戼夋肃录帚承叕韋孨飛弱能粛敢尋發肅辟歰維;325个非成字部件是:
查字软件给用户提供用查询部件的“部件笔顺码”信息和查询部件的“笔画数”信息,查询“查字部件”和输入“查字部件”的办法,其中查询部件的“部件笔顺码”信息的输入信息是含“代表一个笔形代码的通配符?、代表0至多个笔形代码的通配符*、查询部件所含笔顺码”的部件笔顺码字符串,其特征在于,查询部件的“笔画数”信息的输入信息有以下3种格式:①1至26间的某一正整数、②介于1至26间的某二正整数间的全部自然数、③代表1至26间的全部笔画数的通配符*,打开部件笔顺码查询部件对话框,用户按规定输入查询部件所含上述查询信息中的任意一子信息,发出“查询”指令后,查字软件磁盘文件中的程序,除能按用户所输查询信息的情况,迅速从查字软件部件信息表的全部记录中,筛选出满足用户所输查询条件的每一目标记录,除将筛选出的每一目标记录在部件信息表中存储着的“部件、笔画数、部件笔顺码、首部件用量、末部件用量、笔顺情况、部件情况”共七种信息列表显示给用户外,还将满足查询条件的记录数量显示给用户,用户看了满足查询条件的记录后,根据满足查询条件的记录情况,在原来所输查询信息的基础上对原来所输查询信息作修改和修改后的查询;显示内容标题栏中的“部件、笔画数、部件笔顺码、首部件用量、末部件用量、笔顺情况、部件情况”,既是满足查询条件的记录列表显示的列标题,也是满足查询条件的记录按指定顺序排序的命令按钮,简称排序按钮,单击不同的排序按钮,使满足查询条件的记录产生不同的排序方式,给准确获取所需部件提供不同的方便,用户从满足查询条件的记录中找到所须“查询部件”后,选中所须查询部件,单击“复制”按钮,返回需要输入查询部件的地方,按Ctrl+V,查询部件就能粘贴到需要输入查询部件的地方。
2.根据权利要求1所述的易通汉字字词新查法,其特征在于,所述查字软件对操作***汉字库所含GB13000.1字符集的20902个汉字给出的汉字综合信息查字法,用查询汉字所含“部件、汉字笔顺码、笔画数、拼音”4种信息组合而成的综合查询信息的任意一个子信息,获取查询汉字的办法,查询汉字的“部件”信息的输入信息是含“代表一个部件的通配符?、代表0至多个部件的通配符*、查询汉字所含部件”的部件字符串;查询汉字的“汉字笔顺码”信息的输入信息是含“代表一个笔形代码的通配符?、代表0至多个笔形代码的通配符*、查询汉字所含笔顺码”的汉字笔顺码字符串;查询汉字的“笔画数”信息的输入信息有以下3种格式:①1至48间的某一正整数、②介于1至48间的某二正整数间的全部自然数、③代表1至48间的全部笔画数的通配符*;查询汉字的“拼音”信息的输入信息是含“代表一个拼音字符的通配符?、代表0至多个拼音字符的通配符*、查询汉字所含拼音字符”的拼音字符串;打开综合信息查字法对话框,用户按规定输入查询汉字所含上述查询中的一子信息,发出执行指令后,查字软件磁盘文件中的程序,除能按用户所输查询信息的情况,迅速从GB13000.1字符集的20902个汉字存储在查字信息表的全部记录中,筛选出满足用户所输查询信息条件的每一目标记录,除将筛选出的每一目标记录在“汉字、拼音、部件、笔画数、部件式汉字笔顺码、字级”共6个字段中的字段值,用列表显示法显示给用户外,还将全部目标记录的数量显示给用户,用户看了满足查询条件的记录后,根据满足查询条件的记录情况,在原来所输查询信息的基础上对原来所输查询信息作修改和修改后的查询;显示内容标题栏中的“汉字、拼音、部件、笔画数、部件式汉字笔顺码、字级”,既是满足查询条件的记录列表显示的列标题,也是满足查询条件的记录按指定顺序排序的命令按钮,简称排序按钮,单击不同的排序按钮,使满足查询条件的记录产生不同的排序方式,给准确解决查字问题提供不同的方便。
3.根据权利要求1所述的易通汉字字词新查法,其特征在于,所述查字软件对操作***汉字库所含GB13000.1字符集的20902个汉字还给出:①1至数片断汉字笔顺码查字法、②首末部件查字法、③首部件加后数汉字笔顺码查字法、④前数汉字笔顺码加末部件查字法共四种简单信息查字法,其中一至数片断汉字笔顺码查字法使用的查询信息,是查询汉字所含笔顺码、通配符?、通配符*组成的1至数片断汉字笔顺码字符串和查询汉字的笔画数二查询信息;首末部件查字法使用的查询信息由查询汉字所含的第一部件、末部件和查询汉字的笔画数3查询信息组成;首部件加后数笔顺码查字法使用的查询信息由查询汉字的首部件,查询汉字首部件后数个笔画的笔形代码、通配符?、通配符*组成的后数笔顺码字符串和查询汉字的笔画数3查询信息组成;前数笔顺码加末部件查字法使用的查询信息由查询汉字末部件前的数个笔画的笔形代码、通配符?、通配符*组成的前数笔顺码字符串,查询汉字的末部件和查询汉字的笔画数3查询信息组成;用户选定上述四种查字法中的任意一种查字法,打开相应查字法对话框,并按选定查字法给出的查询信息输入方式输完查询信息后,发出执行指令,查字软件磁盘文件中的程序,除能按用户所输查询信息的情况,迅速从GB13000.1字符集的20902个汉字存储在查字信息表的全部记录中,筛选出满足相应查询条件的每一目标记录,除将筛选出的每一目标记录在“汉字、拼音、部件、笔画数、部件式汉字笔顺码、字级”共6个字段中的字段值,用列表显示法显示给用户外,还将全部目标记录的数量显示给用户,用户看了满足查询条件的记录后,根据满足查询条件的记录情况,在原来所输查询信息的基础上对原来所输查询信息作修改和修改后的查询;显示内容标题栏中的“汉字、拼音、部件、笔画数、部件式汉字笔顺码、字级”,既是满足查询条件的记录列表显示的列标题,也是满足查询条件的记录按指定顺序排序的命令按钮,简称排序按钮,单击不同的排序按钮,使满足查询条件的记录产生不同的排序方式,给准确解决查字问题提供不同的方便。
4.根据权利要求1所述的易通汉字字词新查法,其特征在于,所述查字软件对操作***汉字库所含GB13000.1字符集的20902个汉字中,含有查字关键字的二部件字、三部件字和四部件字等3种汉字,还给出输查字关键字查字的特殊信息查字法,输查字关键字查字法使用的查询信息是查询汉字所含的“查字关键字”,用户选定输查字关键字查字法,打开输查字关键字查字法对话框,并在“查字关键字”信息输入框中输入查询汉字所含的一个查字关键字,发出“查询”指令,查字软件磁盘文件中的程序,能迅速从GB13000.1字符集的20902个汉字存储在查字信息表的全部记录中找到用户所输查字关键字所在的记录,将用户所输查字关键字的部件情况显示给用户,并根据查字关键字的部件数量,给出获取查询汉字可作的相关选择,用户根据查询汉字的构字情况,作出获取查询汉字应作的选择后,查字软件磁盘文件中的程序,能按用户所作选择,迅速从GB13000.1字符集的20902个汉字存储在查字信息表的全部记录中,筛选出满足用户所作选择的每一目标记录,除将筛选出的每一目标记录在“汉字、拼音、部件、笔画数、部件式汉字笔顺码、字级”等6个字段中的字段值,用列表显示法显示给用户外,还将全部目标记录的数量显示给用户,显示内容标题栏中的“汉字、拼音、部件、笔画数、部件式汉字笔顺码、字级”,既是满足查询条件的记录列表显示的列标题,也是满足查询条件的记录按指定顺序排序的命令按钮,简称排序按钮,单击不同的排序按钮,能让满足查询条件的记录产生不同的排序方式,给准确解决查字问题提供不同的方便。
5.根据权利要求1所述的易通汉字字词新查法,其特征在于,所述查字软件对汉字词语给出的汉字词语综合信息查询法由查询汉字词语的“词语字数、词语汉字、词语汉字首部件、词语汉字末部件、词语简拼、词语全拼”等6种查询信息组成,其中查询词语的“词语字数”信息输入框中的输入信息是查询词语所含汉字的字数;查询词语的“词语汉字”信息输入框中的输入信息是查询词语所含的汉字与通配符?、*组成的词语汉字字符串;查询词语的“词语汉字首部件”信息输入框中的输入信息是查询词语所含汉字的首部件与通配符?、*组成的词语汉字首部件字符串;查询词语的“词语汉字末部件”信息输入框中的输入信息是查询词语所含汉字的末部件与通配符?、*组成的词语末部件字符串;查询词语的“词语简拼”信息输入框中的输入信息是查询词语所含汉字的拼音首字母与通配符?、*组成的词语简拼字符串;查询词语的“词语全拼”信息输入框中的输入信息是查询词语所含汉字的拼音字母与通配符?、*组成的词语全拼字符串;打开汉字词语综合信息查询法对话框,用户按规定输入查询汉字所含上述查询信息中的任意一子信息,发出“查询”指令后,查字软件磁盘文件中的程序,除能按用户所输查询信息的情况,迅速从汉字字词查询软件中的汉字词语信息表的全部记录中,筛选出相应字段的字段值分别满足相应查询条件的每一目标记录,除将筛选出的每一目标记录在“词语字数、词语汉字、词语汉字首部件、词语汉字末部件、词语全拼”等5个字段中的字段值,用列表显示法显示给用户外,还将全部目标记录的数量显示给用户,用户看了满足查询条件的记录后,可根据满足查询条件的记录情况,在原来所输查询信息的基础上对原来所输查询信息作修改和修改后的查询;显示内容标题栏中的“词语字数、词语汉字、词语汉字首部件、词语汉字末部件、词语全拼”,既是满足查询条件的记录列表显示的列标题,也是满足查询条件的记录按指定顺序排序的命令按钮,简称排序按钮,单击不同的排序按钮,能让满足查询条件的记录产生不同的排序方式,给准确解决汉字词语查询问题提供不同的方便。
6.根据权利要求1所述的易通汉字字词新查法,其特征在于,所述的选取汉字部件遵循的主要原则,用于限定每字只拆五个部件至五部件以上的多种汉字部件选取办法的汉字字词查询,还用于《通用规范汉字表》的汉字字词查询与其它汉字字集的汉字字词查询、还用于含汉字部件查字的汉语电脑字词典的汉字部件产生办法。
7.根据权利要求1所述的易通汉字字词新查法,其特征在于,所述的查字软件给用户提供用部件笔顺码或部件笔顺码字符串查询“查字部件”和输入“查字部件”的办法,用于含汉字部件查字的汉语电脑字词典的汉字部件的查询和输入。
8.根据权利要求2-5任一项所述的易通汉字字词新查法,其特征在于,所述查字软件用于含汉字部件查字的汉语电脑字词典的汉字字词查询。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201410851284.5A CN104537079B (zh) | 2014-12-31 | 2014-12-31 | 易通汉字字词新查法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201410851284.5A CN104537079B (zh) | 2014-12-31 | 2014-12-31 | 易通汉字字词新查法 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN104537079A CN104537079A (zh) | 2015-04-22 |
CN104537079B true CN104537079B (zh) | 2017-11-28 |
Family
ID=52852607
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201410851284.5A Expired - Fee Related CN104537079B (zh) | 2014-12-31 | 2014-12-31 | 易通汉字字词新查法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN104537079B (zh) |
Families Citing this family (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN105069171B (zh) * | 2015-08-31 | 2018-07-13 | 百度在线网络技术(北京)有限公司 | 汉字查询方法和*** |
CN107241100B (zh) * | 2016-03-29 | 2019-11-08 | 北大方正集团有限公司 | 字库部件压缩方法及装置 |
CN115510328A (zh) * | 2022-10-11 | 2022-12-23 | 江苏云机汇软件科技有限公司 | 一种基于大数据的商品品牌营销数据分析方法 |
Citations (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN101187915A (zh) * | 2007-12-06 | 2008-05-28 | 无敌科技(西安)有限公司 | 汉字学习***及其方法 |
Family Cites Families (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
KR100837750B1 (ko) * | 2006-08-25 | 2008-06-13 | 엔에이치엔(주) | 성조를 이용하여 중국어를 검색하는 방법 및 상기 방법을수행하는 시스템 |
-
2014
- 2014-12-31 CN CN201410851284.5A patent/CN104537079B/zh not_active Expired - Fee Related
Patent Citations (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN101187915A (zh) * | 2007-12-06 | 2008-05-28 | 无敌科技(西安)有限公司 | 汉字学习***及其方法 |
Also Published As
Publication number | Publication date |
---|---|
CN104537079A (zh) | 2015-04-22 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
Cornwall | Readings in gender in Africa | |
CN104537079B (zh) | 易通汉字字词新查法 | |
Liu et al. | Palaeoboganium gen. nov. from the Middle Jurassic of China (Coleoptera: Cucujoidea: Boganiidae): the first cycad pollinators? | |
CN104951096A (zh) | 汉字编码八类笔形座标形码输入法 | |
Hsiung | Pursuing Qualitative Research From the Global South:" Investigative Research" During China's" Great Leap Forward"(1958-62) | |
CN100478853C (zh) | 和码汉字形义信息码输入法 | |
Van Der Linden | Pre-Twentieth-Century Sikh Sacred Music: The Mughals, Courtly Patronage and Canonisation | |
Funk | Adam Zalužanský’s “De sexu plantarum”(1592): an early pioneering chapter on plant sexuality | |
CN102163087A (zh) | 一种汉字形码输入法 | |
Terrill | China and the world: self-reliance or interdependence? | |
Wolhuter et al. | The worldwide expansion of education since the middle of the Twentieth Century: reconstruction and assessment | |
Benharrech | Botanical Palimpsests, or Erasure of Women in Science: The Case Study of Mme Dugage de Pommereul (1733–1782) | |
Alabi et al. | The role of home economics in poverty alleviation for national development | |
Barton | Preaching by Example and Learning for Life: Understanding the Gülen Hizmet in the Global Context of Religious Philanthropy and Civil Religion | |
Wang et al. | Comparing Twitter and Chinese native microblog | |
Zhang | Slapping the Table in Amazement: A Ming Dynasty Story Collection | |
Cornish et al. | The Economic Botany Collection at Kew: Analysis of Accessions Data | |
CN1828494B (zh) | 计算机输字易通汉字编码输入法 | |
Evans | Book Cultures, Gentry Identities and The Welsh Country House Library: Problems and Possibilities for Future Research | |
CN110502128A (zh) | 一种汉字多元输入方法及*** | |
CN101344820A (zh) | 一种计算机汉字输入方法及其键盘 | |
Zang | Writing media, script styles and literary forms: Reasons behind the development of the writing system during the Wei, Jin and Southern and Northern dynasties and its significance | |
Kiritsi | W. PUCHNER assisted by AW WHITE Greek Theatre Between Antiquity and Independence: A History of Reinvention from the Third Century BC to 1830. Cambridge: Cambridge University Press, 2017. Pp. xvii+ 355.£ 99.99. 9781107059474. | |
Brummitt | Richard Kenneth Brummitt, 1937–2013 | |
Wang et al. | Research into the Mental Lexicon Representation of Chinese English Learners Based on Spreading Activation Model1 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
C10 | Entry into substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant | ||
CF01 | Termination of patent right due to non-payment of annual fee |
Granted publication date: 20171128 Termination date: 20181231 |
|
CF01 | Termination of patent right due to non-payment of annual fee |