CN1084900C - 中文汉字的检索方式 - Google Patents

中文汉字的检索方式 Download PDF

Info

Publication number
CN1084900C
CN1084900C CN95113184A CN95113184A CN1084900C CN 1084900 C CN1084900 C CN 1084900C CN 95113184 A CN95113184 A CN 95113184A CN 95113184 A CN95113184 A CN 95113184A CN 1084900 C CN1084900 C CN 1084900C
Authority
CN
China
Prior art keywords
chinese character
chinese
character
file
literal
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
CN95113184A
Other languages
English (en)
Other versions
CN1131770A (zh
Inventor
高桥忠雄
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
NEC Corp
Original Assignee
NEC Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by NEC Corp filed Critical NEC Corp
Publication of CN1131770A publication Critical patent/CN1131770A/zh
Application granted granted Critical
Publication of CN1084900C publication Critical patent/CN1084900C/zh
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Images

Landscapes

  • Document Processing Apparatus (AREA)
  • Machine Translation (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

本发明的中文汉字的检索方式,其构成: 中文汉字文件3中容纳有与中文汉字及汉字编码相对应的信息。汉字文件检索部6自中文汉字文件3读出与由拼音记号输入部4输入的拉丁字母文字和特殊信号文字及数字对应的汉字编码。文字图形文件检索部5从中文文字图形文件2读出与由汉字文件检索部6读出的与汉字编码对应的汉字文字图形,基于此读出在显示装置8显示检索后补表示信息,基于对该检索后补表示信息的选择指定以确定作为检索对象的中文汉字。

Description

中文汉字检索方法
本发明涉及借助于拼音记号(发音记号)和声调记号(四声记号)的组合显示的中文汉字进行中文汉字检索的中文汉字检索方法。
过去,在这种中文汉字的检索方法中,中文汉字的拼音记号用拉丁字母(在此是指英语的26个字母)显示,而声调记号用数字显示,按照这种显示方法进行中文汉字的检索。也就是说,制成按此方法显示的各种外存储器,并且利用这种显示方法采用键盘等输入装置进行检索输入(中文汉字检索处理时的信息输入)。
其中,作为利用这种显示方法的发明,有由本申请的发明人和申请人提出的以下①-③中所示的发明等等:
①特开昭62-47774号公报上的有关“中文汉字的检索方法”
②特开昭62-210578号公报上的有关“汉译日的方法”
③特开昭63-10264号公报上的关于“汉译日的方法”。
其中,中文的拼音记号主要是使用拉丁字母表示。因此,上述那种表示方法在中文汉字的检索中可以说是妥当的。
但是,由于中文发音上的多样性,中文中还存在lü、lüe、nu和nue之类的拼音记号。按照过去中文汉字的检索方法,有关这样的拼音记号是使用类似的拉丁字母lu、lue、nu和nue处理的(本来也存在只用lu、lue、nu和nue这样的拉丁字母文字表示的拼音记号)。
上述的已有的中文汉字检索方法中,由于拼音记号是只用拉丁字母表示的,而且关于拉丁字母之外字母所使用的拼音记号是用类似的拉丁字母加以表示的,因而造成某些中文汉字的检索中检索候补数目增加,存在检索效率、检索精度和检索速度低等问题(这些问题成为中文文字处理等过程中的重大问题)。
具体讲,lü、lüe、nü和nüe这种拼音记号的表示,是使用lu、lue、nu和nue处理的,参考到原来还存在由lu、lue、nu和nue这种拉丁字母所表示的拼音记号,所以使得由相同拼音记号(例如lu)所限定的中文汉字数目(检索时向检索者提示的检索后补数)增大,引起检索效率等降低。
鉴于上述问题,本发明目的在于提供这样一种中文汉字的检索方法,该方法借助于将拉丁字母和特殊记号文字组合起来显示中文汉字,可以使用与原来的拼音记号相近的显示进行检索输入,使得中文汉字能够在更细化的形态下输入和显示(能够降低由同一内容的检索输入所限定的中文汉字数目),而且能够提高中文汉字检索处理中的检索效率、检索精度和检索速度。
根据本发明的一种中文汉字检索方法,其特征在于该方法包括以下步骤:
第1步骤,存储与汉字编码和汉字文字图形对应的信息,以形成中文文字图形文件;
第2步骤,存储与由拉丁字母文字和特殊记号文字所表示的拼音记号和由数字所表示的声调记号所限定的中文汉字和汉字编码相对应的信息,以形成中文汉字文件;
第3步骤,通过拼音记号等的输入部,输入表示拼音记号的拉丁字母文字和特殊记号文字以及表示声调记号的数字;
第4步骤,在显示装置上显示输入的信息;
第5步骤,在中文汉字检索处理时,从上述中文汉字文件读出与由上述拼音记号等输入部输入的拉丁字母文字和特殊记号文字以及数字相对应的汉字代码;
第6步骤,从上述的中文文字图形文件读出与由上述第5步骤读出之汉字编码相对应的汉字文字图形;
第7步骤,根据该读出在显示装置上显示检索后补显示信息;
第8步骤,根据针对该检索后补显示信息的选择指定,确定检索对象的中文汉字;和
第9步骤,在上述第8步骤中,在中文汉字文件形成处理时,从中文文字图形文件读出与由所述拼音记号等输入部输入的汉字编码对应的汉字文字图形,通过在显示装置上显示该汉字文字图形进行由“表示拼音记号的拉丁字母文字和特殊记号文字以及表示声调记号的数字”的输入装置的输入。
本发明的中文汉字检索方法中,中文文字图形文件中容纳有与汉字编码和汉字文字图形相对应的信息;中文汉字文件中,容纳有与由拉丁字母文字和特殊记号文字表示的拼音记号和数字表示的声调记号所限定的中文汉字和汉字编码相对应的信息;拼音记号等输入部,用来在中文汉字检索处理时输入表示拼音记号的拉丁字母文字和特殊记号文字以及表示声调记号的数字,在显示装置上显示该输入信息;汉字文件检索部在中文汉字检索处理时从中文汉字文件读出与由拼音记号等输入部输入的拉丁字母文字和特殊记号文字以及数字相对应的汉字编码;文字图形文件检索部,在中文汉字检索处理时从中文文字图形文件读出与由汉字文件检索部读汉字编码相对应的汉字文字图形,基于该读出的在显示装置上显示的检索后补显示信息,而且根据对于该检索候补显示信息的选择指定,确定作为检索对象的中文汉字。
图1是表示有关本发明的一种实施例中中文汉字检索方法之构成的方框图。
图2是表示图1中中文文字图形文件内容的具体例的说明图。
图3是表示图1中中文汉字文件内容的具体例之说明图。
图4是说明在图1所示中文汉字检索方法中中文汉字文件形成处理的流程图。
图5是表示图1所示中文汉字检索方法中中文汉字检索处理的流程图。
图6是说明本发明的中文汉字检索方法效果的图。
以下,参照附图就本发明作详细说明。
附图1是表示有关本发明的一种实施例中中文汉字检索方法构成的方框图。
本实施例的中文汉字检索方法是由所包含的以下九部分构成的:
输入装置1,使用人(文件制作者或检索人等)用它来输入表示拼音记号的拉丁字母文字和特殊记号文字以及表示声调记号的数字作为限定中文汉字的信息;
中文文字图形文件2,其中容纳有与汉字编码和汉字文字图形相对应的信息,具体容纳的信息参见图2;
中文汉字文件3,其中容纳有与由拉丁字母文字和特殊记号文字表示的拼音记号以及由数字表示的声调记号所限定的中文汉字和汉字代码相对应的信息,具体容纳的信息参见图3。
拼音记号等输入部4,由它输入表示汉字编码、拼音记号的拉丁字母文字和特殊记号文字以及表示声调记号的数字,并将其显示在显示装置8上;
文字图形文件检索部5,由它对中文文字图形文件2进行检索处理;
汉字文件检索部6,由它对中文汉字文件3进行检索处理;
汉字文件形成部7,由它进行中文汉字文件3的形成处理;
显示装置8,用来显示出表示汉字代码、拼音记号的拉丁字母文字和特殊记号文字,表示声调记号的数字,表示检索后补的信息以及检索结果(作为检索对象的中文汉字);以及
打印装置9,进行检索结果等的打印输出。如果最初就制成中文汉字文件3,则也可不需要汉字文件形成部7。
以下说明有关下面①-④以及上述诸构成要素中均适用的具体实例。
①输入装置1,可以用符合JIS规定的标准键盘实现。
②中文字母图形文件2,可以使用符合中国GB代码的文字组(GB-2312-80标准文字组等)实现。
③显示装置8,可以使用CRT(阴极射线管)显示和液晶显示等实现。
④打印装置9,可以利用点式打印机实现,这种打印机不仅可以打印输出编码数据,而且还可以打印输出图像数据。
附图2是说明中文文字图形文件2内容具体实例的说明图。中文文字图形文件2是具有与“汉字编码”和“汉字文字图形”相对应信息的输入项目的集合。
附图3是表示中文汉字文件3内容具体实例的说明图。中文汉字文件3,是含有与“拼音(表示拼音记号的拉丁字母文字和特殊记号文字)”、“声调(表示声调记号的文字)”和“汉字编码”对应信息的输入项目的集合。“备注”项是为了便于说明而图示出的,在实际中文汉字文件3中并不存在。
附图4是说明利用本实施例的中文汉字检索方法进行中文汉字文件形成处理的流程图。这种处理由汉字编码输入步骤401、汉字编码显示步骤402、汉字编码送回步骤403、汉字文字图形读出步骤404、汉字文字图形显示步骤405、拼音记号信息等输入步骤406、拼音记号信息等显示步骤407、拼音记号信息等送回步骤408、汉字编码送回步骤409、中文汉字文件输入项目设定步骤410和终止判定步骤411所组成。
附图5是表示利用本实施例的中文汉字检索方法进行中文汉字检索处理的流程图。这种处理由拼音记号信息等输入步骤501、拼音记号信息等显示步骤502、拼音记号信息等送回步骤503、汉字编码读出步骤504、汉字编码送回步骤505、汉字文字图形读出步骤506、检索后补显示信息显示步骤507、选择指定输入步骤508、检索对象有中文汉字确定步骤509和检索结果显示步骤510所组成。
以下,就按此方法构成的本实施例之中文汉字检索方法的操作进行说明。
首先就制作中文汉字文件时(中文汉字文件形成处理时)的操作加以说明(参见图4)。
文件制作者由输入装置1依次就希望将信息容纳在中文汉字文件3中的各中文汉字输入诸汉字编码。
拼音记号等输入部4,输入该汉字编码(步骤401),并在显示装置8显示该汉字编码(步骤402),同时,将该汉字编码送回到文字图形文件检索部5(步骤403)。其中,步骤402的显示是为了便于文件制作者的确认等而进行的(与步骤405的显示等也相同)。
文字图形文件检索部5,由中文文字图形文件2读出与该汉字编码对应的汉字文字图形(步骤404),并在显示装置8显示该汉字文字图形(步骤405)。
接着,文件制作者参照该显示,由输入装置1输入表示该中文汉字(由步骤401输入了汉字编码的中文汉字)拼音记号的信息和表示该中文汉字声调记号的信息。其中,对于表示拼音记号的信息,使用拉丁字母文字和特殊记号文字。作为特殊记号文字,例如使用中黑点“·”。按此方法,可以用lu·、lu·e、nu·和nu·e表示lü、lüe、nü和nüe。而且为了表示声调记号的信息,可以使用数字。其中,用u·表示u的理由是因为用“·”容易想起原拼音记号上方的点,因而可以减轻利用者(检索者等)的负担(但是为表示拼音记号用的特殊记号文字当然不受“·”限制)。
拼音记号等输入部4,输入表示该拼音记号的信息和表示该声调记号的信息(步骤406),在显示装置8显示这些信息(步骤407),将这些信息送回到汉字文件形成部7(步骤408)。
此外,汉字文件形成部7通过文字图形文件检索部5接收经步骤401输入的汉字编码(也可以直接从拼音记号等输入部4接收)(步骤409)。
不仅如此,汉字文件形成部7,把经步骤408接收的、表示该拼音记号的信息和表示该声调记号的信息,以及经步骤409接收的该汉字编码信息,一起设定(步骤410)为中文汉字文件3内的一个输入项目(与该中文汉字对应的输入项目)。
对应当将信息容纳在中文汉字文件3中的全部中文汉字反复进行以上方法处理(参见步骤411),可以制成图3所示的中文汉字文件3。
例如,以下就图3中“噜”这个中文汉字在中文汉字文件3中的设定进行说明。
经由拼音记号等输入部4,可以输入由输入装置1输入的“Cn01Cm01”这个汉字编码。
而且,通过文字图形文件检索5之检索,可以读出与来自中文文字图形文件2的该汉字编码对应的汉字文字图形(“噜”的“汉字文字图形”)并将其显示在显示装置8上。
此外,借助于拼音记号等输入部4,还可以输入表示与该汉字文字图形对应的拼音记号和声调记号的“lui”。
基于这些输入等,利用汉字文件形成部7中文汉字文件3内的输入项目(图3中第一个输入项目)中,在“拼音”项设定为“lu”,在“声调项”设定为“1”,在汉字编码项设定为“Cn01Cm01”。
此外,就图3中“驴”这个中文汉字在中文汉字外存储器3内的信息设定加以说明。
有关此中文汉字,由输入装置1输入的汉字编码“Cn27Cm27”是经由拼音记号等输入部4被输入的。
而且,通过文字图形文件检索部5的检索,由中文文字图形文件2读出与该汉字编码对应的汉字文字图形(“驴”这个“汉字文字图形),并在显示装置8上加以显示”。
进而由拼音记号等输入部4输入表示与该汉字文字图形对应的拼音记号和声调记号的“lu·2”。因此,拼音记号中的“u”就由“u·”加以显示。
基于这些输入等,通过汉字文件形成部7在中文汉字文件3内的输入项目(图3中第27输入项)中,在“拼音”项设定为“lu·”在“声调”项设定为“2”,在“汉字编码”项设定为“Cn27Cm27”。
其次,就使用按以上方法形成的中文汉字文件3进行中文汉字检索处理时的操作加以说明(参照图5)。
检索者由输入装置1输入表示为限定作为检索对象的中文汉字用的拼音记号信息和表示声调记号的信息。其中,对于表示拼音记号的信息来说,使用拉丁字母文字和特殊记号文字。作为特殊记号文字,例如可以使用黑点“·”。按此方法,可以用lu·、lu·e、nu·和nu·e表示lü、lüe、nü和nüe。此外,为了表示声调记号的信息而言,可以使用数字。其中,决定输入拼音记号“lu·”和声调记号“2”。
拼音记号等输入部4,输入表示该拼音记号的信息和表示该声调记号的信息(步骤501),将这些信息显示在显示装置8上(步骤502),并将这些信息送回到汉字文件检索部6(步骤503)。
汉字文字检索部6,从中文汉字文件3读出与表示该拼音记号的信息和表示该声调记号的信息对应的全部汉字(步骤504),并将读出的汉字代码(其中,与“lu·2”对应的是“Cn27Cm27”和“Cn28Cm28”)送回到文字图形文件检索部5(步骤505)。
文字图形文件检索部5,从中文汉字图形文件2读出与该汉字代码对应的汉字图形(这里是“驴”的汉字图形和“闾”的汉字图形)(步骤506),在显示装置8上显示出在这些全部汉字上各附有数字(符号)的显示信息(检索后补显示信息。其中“1”:驴,2:闾”这样的显示信息)(步骤507)。其中,向检索者提示检索候补用的显示方法,当然并不限制在这种“具有符号的检索后补显示信息的显示”方法上。
检索者用输入装置1,参照显示装置8上显示的检索后补显示信息,对于在所需的中文汉字(作为检索对象的中文汉字)上所附的符号进行选择指定(这里选择指定“1”)。
文字图形文件检索部5输入该选择指定(步骤508),基于该选择指定确定作为检索对象的中文汉字(步骤509),在显示装置8上显示出作为检索结果的该中文汉字的汉字文字图形(在这里是“驴”这个“汉字文字图形”)(步骤510)。
通过反复进行上述的处理(基于输入表示拼音记号的拉丁字母文字和特殊记号以及表示声调记号的数字之检索处理),可以进行中文汉字群的检索。因此,例如一旦将本实施例的中文汉字检索方法用于中文文字处理上,就可以边进行上述中文汉字检索处理,边制成中文文章。
此外,还可以用打印装置9打印输出在显示装置8上显示的、作为检索结果的中文汉字。在这种情况下,通过文字图形文件检索部5基于由输入装置输入的打印指令等控制作用,可以使打印装置9(还可以打印输出图像数据的点或打印机等)进行打印输出。
如上面说明的那样,本发明通过将拉丁字母文字和特殊记号文字的组合,可以在与按照类似于原拼音记号表示法相近的表示下进行中文汉字的检索,可以使中文汉字在已有技术更细化的形态下输入和表示(按此方法,中文汉字检索时的击中率提高),能够提高中文汉字检索处理时的检索效率、检索精度和检索速度。这些都是本发明的效果。
以下,参照图6(a)和6(b),说明上述效果。
如图6(a)所示,按照本发明可以在和中文汉字原来的拼音记号和声调记号(参照图6(a)中①、②…各项内箭头左侧的内容(相近的形式下表示“表示拼音记号和声调记号的信息”(参照图6(a)中①、②…各项内箭头右侧项)。而且图6(a)中各种拼音记号用另一种“拉丁字母文字和特殊记号文字”表示(已有技术中,不同的拼音记号往往用同一个拉丁字母文字表示)。
因此,如图6(b)所示,例如在检索“驴”这个中文汉字时,按已有技术必须从10个字中选出一个字,而按本发明只要从二个字“驴”和“闾”中选出一个字即可,具有提高检索效率的效果(此外,按照本发明,还有能够在和原来的拼音记号表示相近的表示下进行中文汉字检索的效果。

Claims (2)

1.一种中文汉字检索方法,其特征在于该方法包括以下步骤:
第1步骤,存储与汉字编码和汉字文字图形对应的信息,以形成中文文字图形文件;
第2步骤,存储与由拉丁字母文字和特殊记号文字所表示的拼音记号和由数字所表示的声调记号所限定的中文汉字和汉字编码相对应的信息,以形成中文汉字文件;
第3步骤,通过拼音记号等的输入部,输入表示拼音记号的拉丁字母文字和特殊记号文字以及表示声调记号的数字;
第4步骤,在显示装置上显示输入的信息;
第5步骤,在中文汉字检索处理时,从上述中文汉字文件读出与由上述拼音记号等输入部输入的拉丁字母文字和特殊记号文字以及数字相对应的汉字代码;
第6步骤,从上述的中文文字图形文件读出与由上述第5步骤读出之汉字编码相对应的汉字文字图形;
第7步骤,根据该读出在显示装置上显示检索后补显示信息;
第8步骤,根据针对该检索后补显示信息的选择指定,确定检索对象的中文汉字;和
第9步骤,在上述第8步骤中,在中文汉字文件形成处理时,从中文文字图形文件读出与由所述拼音记号等输入部输入的汉字编码对应的汉字文字图形,通过在显示装置上显示该汉字文字图形进行由“表示拼音记号的拉丁字母文字和特殊记号文字以及表示声调记号的数字”的输入装置的输入。
2.如权利要求1所述的中文汉字检索方法,其特征在于,为表示拼音记号的特殊记号文字是“·”。
CN95113184A 1994-12-29 1995-12-29 中文汉字的检索方式 Expired - Fee Related CN1084900C (zh)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
JP339142/94 1994-12-29
JP6339142A JPH08185396A (ja) 1994-12-29 1994-12-29 中国語漢字検索方式

Publications (2)

Publication Number Publication Date
CN1131770A CN1131770A (zh) 1996-09-25
CN1084900C true CN1084900C (zh) 2002-05-15

Family

ID=18324640

Family Applications (1)

Application Number Title Priority Date Filing Date
CN95113184A Expired - Fee Related CN1084900C (zh) 1994-12-29 1995-12-29 中文汉字的检索方式

Country Status (2)

Country Link
JP (1) JPH08185396A (zh)
CN (1) CN1084900C (zh)

Families Citing this family (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR20010067827A (ko) * 2001-04-02 2001-07-13 금하연 다국어 한자 데이터 베이스 구조
KR100517970B1 (ko) * 2002-08-01 2005-09-30 엘지전자 주식회사 이동통신 단말기의 일본어 입력 장치 및 방법
KR100606807B1 (ko) * 2004-12-07 2006-08-02 엘지전자 주식회사 중문 데이터베이스의 실시간 검색 및 정렬 방법, 그리고그를 위한 단말기
KR100837750B1 (ko) 2006-08-25 2008-06-13 엔에이치엔(주) 성조를 이용하여 중국어를 검색하는 방법 및 상기 방법을수행하는 시스템
KR100900564B1 (ko) * 2007-03-30 2009-06-02 (주)에이트리 휴대단말기 및 그를 이용한 문자 획순 표시방법

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN1031143A (zh) * 1987-07-30 1989-02-15 夏普株式会社 汉字处理装置
CN1090070A (zh) * 1993-01-11 1994-07-27 松下电器产业株式会社 汉语汉字变换装置

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN1031143A (zh) * 1987-07-30 1989-02-15 夏普株式会社 汉字处理装置
CN1090070A (zh) * 1993-01-11 1994-07-27 松下电器产业株式会社 汉语汉字变换装置

Also Published As

Publication number Publication date
JPH08185396A (ja) 1996-07-16
CN1131770A (zh) 1996-09-25

Similar Documents

Publication Publication Date Title
CN1156741C (zh) 手写汉字识别方法及装置
CN1133918C (zh) 符号输入
CN1008016B (zh) 输入处理***
CN1084900C (zh) 中文汉字的检索方式
CN1434365A (zh) 中文字形输入装置及中文字形输入法
CN1601451A (zh) 表意符号的拼写及编码方法
CN1645356A (zh) 多维汉语学习***
CN1019425B (zh) 中文输入装置及其键盘
CN1274883A (zh) 简化拼音-触摸屏鼠标式汉字输入方法
CN1177285C (zh) 超大型汉字信息处理装置及方法
CN1257445C (zh) 音义码汉字输入方法
CN1118085A (zh) 可用数字键盘输入的汉字输入***及其键盘
CN1310371B (zh) 字符输入方法和装置
CN1047678C (zh) 电子汉日辞典编辑检索装置
CN1303506C (zh) 汉字拼音标调定型输入法
CN1873589A (zh) 基于音码的汉字输入方法
CN1419179A (zh) 按笔顺输入的汉字输入法及其键盘
CN1043490C (zh) 叠词变换方法和汉字变换装置
CN1558317A (zh) 汉字对字码输入法
CN1244855C (zh) 中文信息处理汉字数字化规范编码输入技术
CN117917621A (zh) 汉字输入方法和***以及键盘
CN1598743A (zh) 按规范笔顺输入汉字的输入法及其键盘
CN1485716A (zh) 普通话拼音汉文输入法及其设备
CN86102418A (zh) 汉语音节处理机及汉语音节处理方法
CN1093183A (zh) 智能双拼汉字输入方法

Legal Events

Date Code Title Description
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
C06 Publication
PB01 Publication
C14 Grant of patent or utility model
GR01 Patent grant
C17 Cessation of patent right
CF01 Termination of patent right due to non-payment of annual fee

Granted publication date: 20020515

Termination date: 20111229