CN1525388A - 汉字处理设备和汉字处理方法 - Google Patents

汉字处理设备和汉字处理方法 Download PDF

Info

Publication number
CN1525388A
CN1525388A CNA2004100072858A CN200410007285A CN1525388A CN 1525388 A CN1525388 A CN 1525388A CN A2004100072858 A CNA2004100072858 A CN A2004100072858A CN 200410007285 A CN200410007285 A CN 200410007285A CN 1525388 A CN1525388 A CN 1525388A
Authority
CN
China
Prior art keywords
character
language
code
kanji
input
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CNA2004100072858A
Other languages
English (en)
Inventor
辉 刘
刘辉
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Toshiba Corp
Original Assignee
Toshiba Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Toshiba Corp filed Critical Toshiba Corp
Publication of CN1525388A publication Critical patent/CN1525388A/zh
Pending legal-status Critical Current

Links

Images

Landscapes

  • Document Processing Apparatus (AREA)
  • Character Discrimination (AREA)

Abstract

一种汉字处理设备,包括:用于指定第一和第二种语言的单元(31),用于输入关于手写字符的数据的单元(30),用于搜索所述关于手写字符的数据对应的第一种语言的汉字码的单元(32,33);以及用于将由所述搜索单元搜索的所述汉字码转换成第二种语言的汉字码的单元(33)。

Description

汉字处理设备和汉字处理方法
技术领域
本发明涉及一种用于在多种语言(简体和繁体汉字,日语汉字,朝鲜语汉字,以及其他汉字)中输入汉字的字符输入设备和方法。
背景技术
一些现代语言通常使用称为汉字的符号。在书写***中使用汉字的主要语种包括日语、朝鲜语,以及汉语方言(标准汉语,粤语,以及其他方言)。
用于在计算机中输入汉字的字符输入方法包括将从键盘等输入的汉字的读音转换为对应的汉字的“中式读音输入法”和将使用诸如图形输入板或鼠标的手写输入装置书写的字符图案转换为字符码的“手写输入法”。
在现有技术中,日本专利申请公开出版物No.8-137885描述了一种基于“中式读音输入法”的方法,以根据字典输入包括日语、朝鲜语和汉语的多种语言的字符串作为中式读音符号序列。
在日本专利申请公开出版物No.8-137885描述的方法中,基于输入的语言标志为要处理的语言加载一个字符输入程序,并利用基于该字符标志加载的用于该语言的字符输入程序将与该语言标志一起输入的读音符号转换为对应这种语言的字符码。
因此,现有技术使用“中式读音输入法”来从键盘输入中式读音符号(例如,罗马字母),接着将该符号转换为汉字。因此,除非输入中式读音符号,否则现有技术无法实现转换为汉字。利用这种方法,当操作员输入了一篇以一门外语(汉语,日语或朝鲜语)书写的文档时,如果操作员无法准确地输入对应的中式读音符号或根本就不了解中式读音,则这些汉字无法被输入或转换。例如,当日本操作员输入汉字(简体或繁体)时,由于一些汉字在日本并不存在,因此他很难输入这些汉字。
此外,必须准备每种语言所对应的字符输入程序。还必须准备一本字典,这本字典包含大量字词,而且还对每种语言提供输入字符串和显示字符串之间的对应关系。日语中一个汉字有多种读音。因此,必须有一本字典,其包含大量字词,而且还对该语言提供输入字符串(字词的中式读音符号)和显示字符串(汉字,假名等)之间的对应关系。因此,采用只有有限存储容量的存储器的小型便携设备很难输入多种语言的字符串。
发明内容
本发明的目的是提供一种无需准备每种语言对应的字符输入程序和字典就能输入读音未知的多种语言中的字符的字符输入设备和方法。
根据本发明的一个实施例,提供一种汉字处理设备,包括:用于指定第一和第二种语言的单元,用于输入关于手写字符的数据的单元,用于产生关于所述手写字符的数据所对应的第一种语言的汉字码的单元,以及用于将由所述产生单元产生的汉字码转换为第二种语言的汉字码的单元。
附图说明
图1是实现根据本发明一个实施例的字符处理设备的计算机1的***配置框图;
图2是在根据本发明的***配置中通过执行程序实现的功能配置框图;
图3是计算机1的外部配置图以及根据本发明用于输入多种语言中的字符的一个显示屏例子;
图4是示意根据本发明的多语言汉字码表24的一个例子的表格;
图5是由根据本实施例的语言属性部分和号码部分的组合构成的汉字码;
图6是示意根据本实施例的多语言汉字码表25的一个例子的表格;
图7是根据本实施例的拼音码和复合词之间的对应关系表;
图8A和8B是根据本发明,具有相同含义的日语复合词和(简体)汉语复合词之间的对应关系表;
图9是示意根据本实施例的字符输入操作的流程图;
图10是示意根据本实施例的字符输入操作的流程图;
图11是示意根据本实施例的字符输入操作的流程图;
图12是根据本实施例基于手写输入输入(转换)日语汉字的一个例子;
图13是根据本实施例将基于手写输入的日语汉字转换为简体汉字来输入的一个例子;
图14是根据本实施例将基于手写输入的简体汉字转换为日语汉字来输入的一个例子;
图15是根据本实施例将基于手写输入的汉语复合词(简体)转换为日语复合词来输入的一个例子;
图16是根据实施例(1)将基于手写输入的日语复合词转换为汉语复合词(简体)来输入的一个例子;
图17是根据实施例(2)将基于手写输入的日语复合词转换为汉语复合词(简体)来输入的一个例子;
图18是根据实施例(2)将基于手写输入的日语复合词转换为汉语复合词(简体)来输入的一个例子;
图19是根据本实施例将基于手写输入的汉语复合词(简体)转换为日语复合词来输入的一个例子;以及
图20是根据本实施例将基于手写输入的汉语复合词(简体)转换为日语复合词来输入的一个例子的示意图;
具体实施方式
下面参照附图描述本发明的实施例。
图1是实现根据本发明一个实施例的字符处理设备的计算机1的***配置框图(只显示主要组件)。计算机1加载在诸如半导体存储器、CD-ROM、DVD或磁盘的记录媒介上记录的一个程序。计算机1的操作受这个程序的控制。计算机1是利用例如,被配置为,例如小型便携设备的个人数字助理(PDA)实现的。计算机1具有通过手写输入多种语言中的汉字,识别这些汉字,将这些汉字转换为多种语言的功能。
如图1所示,计算机1(根据本实施例的字符处理设备)装有CPU 10,存储器12,显示板14,图形输入板16(笔19)以及输入装置18。
CPU 10根据存储器12中记录的各种程序控制每个部分。如果字符被输入,则根据在存储器12中存储的手写识别程序20(和全球IME 21)和字符输入程序(包含汉字转换程序22和复合词转换程序23)控制字符输入。
根据本实施例的计算机1使用“手写输入法”来基于从图形输入板16输入的关于手写字符的数据输入字符。通过根据字符输入程序输入关于手写字符的数据,就能以任意选择的语言输入(汉语)字符并将经手写和输入的字符转换为任意选择的语言中的相同(汉语)字符,也就是说,与输入字符具有相同的起源但笔划稍有不同的汉字。
此外,字符输入程序不仅能使字符单位发生转换,而且能使各自包含多个(汉语)字符的词(下文中称为复合词)作为单位被转换。在此情况下,对于具有相同含义,但在不同语言中使用不同字符的复合词,被手写和输入的字符被转换为具有正确的含义和使用不同汉字的复合词。
由CPU 10所执行的各种程序和数据被记录在存储器12中。所记录的程序和数据不仅包括基本控制程序(OS),还包括与字符的输入有关的手写字符识别程序20,全球IME 21,字符输入程序(汉字转换程序22和复合词转换程序23),以及汉字码表24(参见图4(下文描述))和复合词码表25(参见图6(下文描述)),这两个码表分别与汉字转换程序22和复合词转换程序23的执行关联使用。
显示板14在CPU执行各种程序时显示各种屏面。显示板14在输入手写字符时提供手写字符用的输入接口(参见图3(下文描述))。
图形输入板16被用作指示装置。输入面和显示板14相互重叠。利用在显示板上显示的对象(按键和按钮)可在图形输入板16的输入面上给出直接指令。此外,通过利用笔19在该显示器的指定区域手写字符可输入字符图案(座标数据序列(coordinate data sequences))。
输入装置18包括机械开关和按键,即,电源键,光标键,以及其他功能按钮和按键。
图2是在图1所示的***配置中通过执行包含字符输入程序的程序由CPU 10实现的功能配置框图。如图2所示,计算机设备1(字符处理设备)具有手写输入单元30,模式选择单元31,手写字符识别单元32,汉字转换单元33,复合词转换单元35以及汉字显示单元37。
手写输入单元30通过图形输入板16输入关于手写字符的数据,即,表示构成字符的笔划的座标数据序列。
模式选择单元31通过图形输入板16基于对在显示板14上显示的输入接口中提供的键的位置指令输入对于模式选择等的指定。模式选择单元31具有一个第一输入单元,一个第二输入单元,一个第三输入单元,以及转换指令输入单元。第一输入单元输入输入模式选择,指定手写输入的字符的语言(第一种语言)。第二输入单元输入转换模式选择,指定输入模式选择所指定的语言中字符的目的语言(第二种语言)。第三输入单元输入复合词转换指定,指定输入一个由多个(汉语)字符构成的复合词。
手写字符识别单元32识别通过手写输入单元30输入的关于手写字符的数据。
汉字转换单元44搜索汉字码表24中所述输入模式选择指定的语言用的汉字码,即,手写汉字识别单元32所识别的字符对应的码。对于在汉字码表24中记录的汉字码,向表示通用字符码的号码部分添加指示语言的语言属性部分数据(参见图5)。此外,汉字转换单元33将从汉字码表24检索到的汉字码转换为由转换模式选择所指定的语言用的汉字码。
如果输入了复合词转换指定,则复合词转换单元35将通过汉字转换单元33的转换所得到的多个汉字码转换为,转换模式选择所指定的语言用的在复合词码表25记录的复合词(字符串)的汉字码序列。另一方面,如果在复合词码表25中没有记录对应的复合词,则复合词转换单元35将通过汉字转换单元33的转换所得到的多个汉字码转换为拼音码序列(通用码序列),搜索汉字码序列中对应这个拼音码序列的复合词,并将其作为转换结果输出。拼音码表示汉字用的中式读音符号,并且包括相应汉字所用的特定码。
汉字转换显示单元37根据通过汉字转换单元33得到的汉字码或通过复合词转换单元35得到的汉字码序列在显示板14上以由转换模式选择指定的语言显示汉字。
图3是计算机1的外部配置图和用于输入多种语言的字符的显示屏(输入接口)的一个例子。
如图3所示,计算机1被配置成小型便携设备。计算机1的顶面部分装有输入显示部分和输入装置18中包含的按键18a,在输入显示部分,显示板14的输入面和图形输入板1 6的输入面相互重叠。
图3所示的输入显示部分显示了一个用于通过手写输入多种语言的字符的显示屏(输入接口)例子。如图3所示,输入显示部分具有输入手写字符的手写字符区40,用于输入模式选择和指示语种的多个语言选择键41到44,用于命令执行语言转换的语言转换键45,用于指定复合词转换的复合键46,在被转换为由模式转换选择指定的语言中的字符后显示被手写和输入的字符的字符显示区50,以及用于编辑字符显示区50中的字符串(句子)的退格(BS)键47和删除(Del)键48。
手写输入区40可以是固定的,或者在需要输入手写字符时弹出。图3示意了可以输入相应字符的三个区域。然而,手写字符区40的形式可以随意设置。根据本实施例的语言选择键41到44被用于指定四种语言,包括日语(JP)键41,朝鲜语(KR)键42,简体汉语(CJ)键43,以及繁体汉语(CF)键44。
通过提供语言选择键41到44(“CJ”,”CF”,”JP”和”KR”),语言转换键45,复合键46以及用于在图形输入板16上给出指令的其他键,能很容易地为输入模式选择和转换模式选择切换语种和转换模式。此外,通过提供用于命令转换包含两个或多个汉字的复合(词)的复合键46,能快速和准确地输入复合词。
如果例如,将经手写和输入的汉字转换为在另一种语言中具有相同概念和起源的汉字,以及如果例如,用户不会写目的语言中的汉字,则用户按下语言选择键41到44(“CJ”,”CF”,”JP”和”KR”中的任何一种)以切换到其能手写输入的语言用的输入模式。于是,用户类似地按下任何一个语言选择键41到44以指定另一语种为转换目的语言。接着,用户按下语言转换键45命令执行转换。在此状态下,当用户在图形输入板16上手写一个字符时,该字符被自动转换为被指定为目的语言的语言用的汉字。接着显示(输入)所得到的字符。
另一方面,如果一种语言的复合词要被转换为另一种语言的复合词,则再按下复合键46。这使得能输入复合词和其正确的转换(例如,将该复合词转换为具有相同含义但字符不同的复合词)。
现在参照图4描述多语言汉字码表24的一个例子。
对于多种语言通用的汉字而言,汉字码表24包含每种语言用的汉字码和汉字码通用的码(在此情况下为拼音码),汉字码和通用码对多种语言都彼此关联。图4只示出了简体汉字,繁体汉字以及日语汉字作为语言例子。
汉语、日语和朝鲜语(CJK)中包含的汉字数量大约为21,000。字符的主要基本组合有中国的GB2312(简体汉语)和Big-5(繁体汉语),日本的JIS×0208和JIS×0212和韩国的KSC5601。在这些国家中,即使具有相同概念和起源的汉字(即,多种语言通用的汉字)由于历史和文化原因形状也经常稍有区别(笔划的方向或长度)。
具有相同起源但笔划稍有不同的汉字由汉字码表示,每个汉字码由指示语种的语言属性部分(CJ、CF、JP和KR)和四位数的号码部分(从0000到9999)的组合构成。
此外,由于语言的不同,具有相同起源的汉字读音不同,而且同一个汉字有不同读音。因此,汉字与拼音码结合记录,拼音码是在多种语言中具有相同起源的汉字通用的,而且由标准汉语用的中式读音符号构成。在汉语中,不论是简体还是繁体,同一个汉字读音相同,而且不论在什么地区使用总是有固定的读法。“拼音”是指表示发音的读音符号。使用拼音码输入汉字对应输入利用罗马字母表示的日语汉字的读音,接着将罗马字母转换为汉字。在汉字码表24中,各个汉字和对应的汉字码具有一一对应关系。然而,有多个汉字对应一个拼音码。
现在参考图6描述多语言复合词码表25的一个例子。
对于多种语言通用的字符串(复合词)而言,复合词码表25包含每种语言用的汉字码序列以及该汉字码序列通用的码序列(相同的拼音码序列),汉字码序列和通用码序列对于多种语言都彼此关联。图5只示出了简体汉字,繁体汉字和日语汉字作为语言例子。
在复合词码表25中,在汉语中具有相近读音的不同语言的中复合词被与相同拼音码序列关联记录。例如,对于图7所示的汉语(日语)复合词来说,不同复合词都与图左边所示的拼音码序列关联记录。例如,拼音码序列“Shi Jian”可与不同复合词(用日语书写)“時間”,“実践”,“事件”,和“世間”关联。
在每种语言中,在汉语复合词中使用的汉字可能具有相同起源但笔划稍有不同或者具有完全不同的起源或具有相反顺序。
例如,如图8A和8B所示,对于日语复合(词)“課長”、“計画”、“仕樣”、“工場”、“予測”、“慣習”、“施設”、“売買”、“工事”,和“扶餋者”,与它们具有相同含义的汉语(简体)复合词在对应的下一区域显示。如图8A和8B所示,即使具有相同含义的复合词也包含不同的汉字。例如,“科”是对应日语词“課長”中的“課”的汉字(简体)。然而,拼音码“Ke”同时对应“課”和“科”。因此,如图7所示,对应“課長”的拼音码序列在日语和汉语(简体)中都为“Ke Zhang”。也就是说,这些词通过拼音码彼此关联。
通过在复合词码表25如此记录多种语言中的复合词用的汉字码序列和拼音码序列,就能简单和准确地将一种语言中的复合词转换为另一种语言中的复合词,而不用使用基于不同语言之间的相同含义并包含大量数据的语言转换程序等等。
图6只展示了各自包含两个汉字的复合(词)。可以为各自包含三个或更多字符的复合词记录汉字码序列和拼音码序列。
现在参照图9、10和11所示的流程图描述根据本实施例的字符输入操作。
(1)图12示出了通过手写输入(转换)日语汉字的一个例子。
首先,如果通过手写输入了一个(汉语)字符,则选择输入模式(步骤A1)。在此情况下,为选择输入模式,用户利用笔19在图形输入板16上指定日语(JP)键41(201)。CPU 10启动手写字符识别程序20和全球IME,并等待输入一个手写字符(步骤S21)。
接着,当在图形输入板16的手写字符区40中手写了一个字符时,关于该手写字符的数据被输入。图12所示的例子示意了通过手写输入日语汉字“実”(202)。
当自手写字符被输入到手写字符区40中的一个区域过去预定时间(例如,2秒)时,或当用户开始输入手写字符到下一区域时,手写字符识别程序20确定已经完整输入了关于一个手写字符的数据。手写字符识别程序20对输入的数据执行识别手写汉字的过程(步骤A22)(203)。
接着,如果无法识别该手写字符,则显示一条消息,提示用户例如,重新输入该手写字符。接着,在再次输入了关于该手写字符的数据后,类似地执行字符识别过程。
另一方面,如果已经成功识别了该字符,则CPU 10启动汉字转换程序(步骤A23)。根据汉字转换程序22,CPU 10从汉字码表24检索和获得由输入模式选择指定的语言(在此情况下为日语)用的汉字码(JP2040),这个汉字码对应所识别的字符(205)。
最后,CPU 10允许从汉字码表24所获得的汉字码(JP2040)所对应的字符在已经手写了该字符的手写字符区40和字符显示区50显示(步骤A24)(204)。
通过由输入模式选择如此指定语言和输入手写字符,就能输入指定语言中的(汉语)字符。
(2)图13示出了被手写和输入的日语汉字被转换成简体汉字来输入的一个例子。
首先,如果通过手写输入了一个(汉语)字符,则选择输入模式。如果在被转换成不同于该手写字符所属语言的语言中的字符后还输入该手写字符,则用户选择转换模式并命令执行转换(步骤A1)。在此情况下,为选择输入模式,用户利用笔19在图形输入板16上指定日语(JP)键41。此外,用户指定简体汉语(CJ)键43用于目的语言,接着利用语言转换键45命令执行转换(301)。CPU 10启动手写字符识别程序20和全球IME并等待输入一个手写字符(步骤S31)。
接着,当在图形输入板16的手写字符区40手写一个字符时,关于该手写字符的数据被输入。图13所示的例子示意通过手写输入日语汉字“実”(302)。
当自手写字符被输入到手写字符区40中的一个区域过去预定时间(例如,2秒)时,或当用户开始输入手写字符到下一区域时,手写字符识别程序20确定已经完整输入了关于一个手写字符的数据。手写字符识别程序20对输入的数据执行识别手写汉字的过程(步骤A32)(303)。
接着,如果无法识别该手写字符,则显示一条消息,提示用户例如,重新输入该手写字符。接着,在再次输入了关于该手写字符的数据后,类似地执行字符识别过程。
另一方面,如果已经成功识别了该字符,则CPU 10启动汉字转换程序(步骤A33)。根据汉字转换程序22,CPU 10从汉字码表24检索和获得由输入模式选择指定的语言(在此情况下为日语)用的汉字码(JP2040),这个汉字码对应所识别的字符(304)。此外,根据汉字转换程序22,CPU 10从汉字码表24检索和获得由输入模式选择指定的语言用的汉字码,这个汉字码对应从汉字码表24检索到的汉字码(A34)。
在此情况下,如果无法检索到对应语言用的汉字码,则例如,CPU 10显示消息“找不到匹配”,并等待输入下一个汉字(步骤A35,A37)。
另一方面,如果已经从汉字码表24成功检索到该对应语言用的汉字码,则执行到此汉字码的转换(305)。在此情况下,日语汉字“実”用的汉字码(JP2040)被转换成简体汉语用的汉字码(CJ2040)。
最后,CPU 10允许被转换成简体汉字的汉字码(J2040)所对应的字符在已经手写了该字符的手写字符区40和字符显示区50显示(步骤A36)(306)。
通过由输入模式选择如此指定语言和输入手写字符,可以输入指定语言中的(汉语)字符。
如果在汉字码表24中记录的每种语言用的所有汉字码都与对应的汉字关联记录,则汉字码的语言属性部分可单独被转换成由转换模式选择指定的语言。也就是说,汉字码的号码部分(4位)对不同语言都通用,这样例如,语言属性部分中的“JP”只需转换成“CJ”。
如果手写日语汉字被转换成简体汉字来输入,则执行类似于前述图13(和图9中的步骤A1到A37)所示过程的过程。因此,省略了对此过程的详细描述。在此情况下,日语(JP)键41被用于指定日语为输入模式选择。繁体汉语(CF)键44被用于指定繁体汉语为转换模式选择。如前所述,通过在图形输入板16的手写字符区40手写日语汉字输入繁体汉字。
(3)图14示出了手写简体汉字被转换成日语汉字来输入的一个例子。
在此情况下,执行类似于前述图13(和图9中的步骤A1到A37)所示过程的过程。因此,省略了对此过程的详细描述。在此情况下,简体汉语(CJ)键43被用于指定简体汉语为输入模式选择。日语(JP)键41被用于指定日语为转换模式选择。如前所述,通过在图形输入板16的手写字符区40手写简体汉字(402)输入日语汉字(406)。
如果手写繁体汉字被转换成日语汉字来输入,则执行类似于前述图14(和图9中的步骤A1到A37)所示过程的过程。因此,省略了对此过程的详细描述。在此情况下,繁体汉语(CF)键44被用于指定繁体汉语为输入模式选择。日语(JP)键41被用于指定日语为转换模式选择。如前所述,通过在图形输入板16的手写字符区40手写繁体汉字输入日语汉字。
(4)图15示出了手写汉语复合词(简体汉字)被转换成日语复合词来输入的一个例子。
首先,如果通过手写输入一个复合(词),则选择输入模式。如果在被转换成不同于该手写复合词所属语言的语言中的复合词后还输入该手写复合词,则用户选择转换模式并命令转换该复合词。在此情况下,为选择输入模式,用户利用笔19在图形输入板16上指定简体汉语(CJ)键43。此外,用户指定日语(JP)键41用于目的语言,接着利用复合键46命令转换该复合词(501)。CPU 10启动手写字符识别程序20和全球IME并等待输入一个手写字符(步骤A42)。
接着,当在图形输入板16的手写字符区40手写一个复合词(字符串)时,关于该手写字符的数据被输入。图15所示的例子示意通过手写输入由两个简化汉字构成的复合词(502)。
接着,当语言转换键45被用于命令执行转换时,手写字符识别程序20对在手写字符区40的对应区域手写的字符的数据执行识别该手写汉字的过程(步骤A43)(503)。
接着,如果无法识别该手写字符,则显示一条消息,提示用户例如,重新输入该手写字符。接着,当再次输入了关于该手写字符的数据时,类似地执行字符识别过程。
另一方面,如果已经成功识别了该字符,则CPU 10启动汉字转换程序。根据汉字转换程序22,CPU 10从汉字码表24检索和获得由输入模式选择指定的语言(在此情况下为简体汉语)用的汉字码(CJ2040和CJ1255),这些汉字码对应所识别的字符(504)。此外,根据汉字转换程序22,CPU 10从汉字码表24检索和获得由输入模式选择指定的语言(在此情况下为日语)用的汉字码,这些汉字码对应从汉字码表24检索到的汉字码(步骤A44)。在本例中,对应的简体汉字所用的汉字码(CJ2040和CJ1255)被转换成对应的日语汉字所用的相应汉字码(JP2040和JP1255)(505)。
最后,CPU 10允许被转换成日语复合词的汉字码(JP2040和JP1255))所对应的字符串在已经手写了该字符的手写字符区40和字符显示区50显示(步骤A52)(507)。
(5)图16示出了手写日语复合词被转换成汉语复合词(简体汉字)来输入的一个例子。
在此情况下,执行类似于前述图13(和图10中的步骤A42到A47)所示过程的过程。因此,省略了对此过程的详细描述。在此情况下,日语(JP)键41被用于指定日语为输入模式选择。简体汉语(CJ)键43被用于指定简体汉语为转换模式选择。如前所述,通过在图形输入板16的手写字符区40手写日语复合词输入汉语复合词(繁体汉字)(607)。
(6)图17和18示出了手写日语复合词被转换成汉语复合词(简体汉字)来输入的一个例子(2)。
在参考图16描述的例子中,通过汉字转换程序22的转换得到的汉字码序列被从复合词码表25中检索到。然而,图17和18示出了无法从复合词码表25检索到相关汉字码序列的例子。
在此,假设通过手写输入了字符串“課長”,一个日语复合词(702)。通过处理该手写字符串(复合词)得到的汉字码序列(JP1010和JP2580)根据汉字转换程序22被转换成汉语复合词(简体汉字)用的汉字码序列(CJ1010和CJ2580)(705)。如同前述的步骤A42到A46的情况那样执行上述过程。
接着,根据复合转换程序23,通过搜索复合词表25中的简体汉字确定是否确实存在由两个汉字码(CJ1010和CJ2580)构成的简体汉语复合词(步骤S47)(706)。结果,无法从复合词码表25检索到该汉语复合词用的汉字码序列(CJ1010和CJ2580)。
在此情况下,根据复合词转换程序23,基于该汉语复合词用的汉字码序列(CJ1010和CJ2580),该字符串被另外转换成表示相应汉字的中式读音的拼音码。也就是说,从汉字码表24获得该相应汉字码所对应的拼音码以产生拼音码序列。在此情况下,拼音码序列“Ke Zhang”对应汉字码(CJ1010和CJ2580)。接着,搜索复合词码表2 5的拼音码列表中是否有所产生的拼音码序列(步骤A50)(707)。即,通过搜索在复合词码表25中记录的拼音码序列确定从该汉字码产生的拼音码的组合是否确实包含在该汉语复合词中。
接着,如果在复合词码表25中没有记录该相关拼音码序列,则显示消息“找不到匹配”(步骤A57)。
另一方面,如果只有一个拼音码序列匹配,则对应该匹配的汉字码序列的汉语复合词被作为字符显示(步骤A57)。
另一方面,如果有多个拼音码序列匹配,则搜索每个汉字码组合的两个汉字码。例如,图17示出了对应这两个汉字码序列(CJ1355和CJ2600)和(CJ1360和CJ2580)的拼音码序列(“Ke Zhang”)。因此,对应这些拼音码序列的汉字码序列被作为候选列表记录。
接着,根据复合词转换程序23,对照该候选列表中包含的汉字码序列检查基于该拼音码序列检索到的字符码序列。例如,如果搜索后面的汉字码(步骤A53和A54)只找到一个匹配的复合词,则这个汉字码序列被确定为转换结果(步骤A53、A54和A55)(708)。在此情况下,对应的汉字码序列(CJ1360和CJ2580)被确定为转换结果。
如果例如,搜索后面的汉字码(步骤A53和A54)找到多个复合词候选对象,那么例如,第一个复合词候选对象的汉字码序列被确定为搜索结果(步骤A53、A54和A56)。
另一方面,如果在该候选列表中没有记录相关汉字码序列,则显示消息“无匹配”(步骤A57)。
最后,CPU 10允许被转换成简体汉语复合词的汉字码(CJ1360和CJ2580))所对应的字符串在已经手写了该字符的手写字符区40和字符显示区50显示(步骤A55)。
在步骤A48,如果在步骤A47的搜索无法在复合词码表25中找到匹配的汉字码序列,则可通过反转该汉字码(如果该复合词包含两个字符)来再次搜索复合词码表25。因此,即使对于具有相同含义但不同语言之间字符顺序不同的复合词,例如,对应图8B所示的日语中的“慣習”、“施設”等的简体汉语复合词,通过搜索复合词码表25可以获得对应的汉字码序列作为候选对象。
因此,如果复合词码表25不包含通过汉字转换程序22的转换所得到的汉字码序列所对应的复合词,则可以通过以下方式获得作为最终转换结果的汉字码序列(复合词)。该复合词被转换成拼音码序列。接着,搜索复合词码表25中匹配的汉字码序列。随后,比较该匹配的汉字码序列与通过汉字转换程序22的转换所得到的汉字码序列。
(7)图19和20示出了手写简体汉语复合词被转换成日语复合词来输入的一个例子。
在此情况下,执行类似于前述图17和18(和图10和11中的步骤A42到A53)所示过程的过程。因此,省略了对此过程的详细描述。在此情况下,简体汉语(CJ)键43被用于指定简体汉语为输入模式选择。日语(JP)键41被用于指定日语为转换模式选择。此外,复合键46被用于命令转换复合词。如前所述,通过在图形输入板16的手写字符区40手写汉语(简体)输入日语(809)。
在此情况下,基于汉字码序列(JP1360和JP2580)被转换成的拼音码序列搜索复合词码表25(807)。因此,指示日语字“課長”的汉字码序列(JP1360和JP2580)被检索和显示。
在上文的说明中,在输入手写字符之前,指定输入和搜索模式语言并操作转换键45以命令执行转换。然而,在输入了一个将要被转换成不同语言中的复合词(字符串)的字符串之后可给出执行转换的命令。例如,如果手写了一个包含两个字符的日语字符串(复合词)以输入一个简体汉字字符串(复合词),则首先操作适当键以指定日语作为输入模式,指定简体汉语作为转换模式,以及命令转换复合词。接着,手写两个日语汉字,并操作转换键45。因此,根据汉字转换程序22和复合词转换程序23,利用两个字符的字符串作为转换单位来执行该过程。接着,如果连续输入了多个字符串,则每次手写了一个要转换的字符串时操作一次转换键。因此,根据先前指定的输入模式和转换模式,该手写字符串被处理并被转换为指定语言中的字符串。例如,如果连续输入了都由三个字符构成的字符串,则在连续输入了三个字符后可操作转换键45。因此,如果连续输入了多个字符串,则由于用户除了手写字符串只需执行转换键45的操作,因此可以有效输入这些字符串。
因此,即使对于读音、书写或含义未知的外国字符或复合词,只要通过手写该汉字或该复合词的字符串,操作员就能将其转换成操作员已知的语言中的字符或复合词来显示。此外,本发明还能处理复合词中使用的字符具有相同起源但笔划稍有不同的情况,具有完全不同的起源的情况,或不同语言之间顺序相反的情况。因此,通过输入,通过手写操作员已知的语言中的复合词,就能准确地将这个复合词转换为目的语言中的复合词来输入。在本实施例中,汉字码和拼音码(汉字的中式读音符号)的组合被用来将一个国家用的汉字或复合词变换为另一个国家用的汉字或复合词。这就不需要使用包含多种语言用的大量数据的多语言翻译程序。此外,仅通过在复合词码表25中记录要转换的复合词,一种语言中的复合词能被有效转换成另一种语言中的复合词。
本领域的技术人员很容易想到其他的优点和修改。因此,本发明在其更广的层面上并不局限于在此示意和描述的具体细节以及代表性实施例。因此,可不偏离所附权利要求书及其等同物所定义的一般性发明概念的精神或范围而进行各种修改。

Claims (16)

1.一种汉字处理设备,其特征在于包括:
用于指定第一和第二种语言的装置(31);
用于输入关于一个手写字符的数据的装置(30);
用于产生与关于所述手写字符的数据对应的第一种语言的一个汉字码的装置(32,33);以及
用于将由所述产生装置产生的所述汉字码转换成所述第二种语言的一个汉字码的装置(33)。
2.根据权利要求1的设备,其特征在于,还包括字符码表(24),用于对所述第一和第二种语言通用的字符彼此关联地存储所述第一和第二种语言的汉字码,以及
特征在于,所述转换装置(33)通过利用所述字符码表转换由所述产生装置产生的所述汉字码。
3.根据权利要求1或2的设备,其特征在于还包括用于将通过所述转换装置得到的多个汉字码转换成多个第二种语言的汉字码的装置(35)。
4.根据权利要求3的设备,其特征在于还包括字符串码表(25),用于对所述第一和第二种语言通用的字符的字符串彼此关联地存储所述第一和第二种语言的汉字码的字符串,以及
特征在于,所述转换装置(33)通过利用所述字符串码表转换所述第一种语言的所述多个汉字码。
5.根据权利要求1的设备,其特征在于还包括用于输入执行转换的指令的装置,以及
特征在于,所述转换装置在所述输入指令的装置输入所述指令后转换所述汉字码。
6.根据权利要求1的设备,其特征在于所述输入装置从图形输入板输入关于所述手写字符的数据。
7.根据权利要求1的设备,其特征在于向指示语言的属性数据中添加由所述产生装置产生的所述汉字码。
8.根据权利要求7的设备,其特征在于所述转换装置将向所述字符码添加的属性数据转换为所述第二种语言的属性数据。
9.一种汉字处理设备,其特征在于包括:
用于指定第一和第二种语言的装置(31);
用于输入关于手写字符的数据的装置(30);
用于产生与关于所述手写字符的数据对应的所述第一种语言的汉字码的装置(32,33);以及
用于将由所述产生装置产生的所述汉字码转换成所述第二种语言的汉字码的第一转换装置(33);
用于存储多个码集合的字符码表(24),每个码集合包含所述第一种语言的汉字码,所述第二种语言的汉字码,以及所述第一和第二种语言的汉字码通用的通用码;
用于存储多个汉字码集合的字符串码表(25),每个码集合包含所述第一种语言的多个汉字码,所述第二种语言的多个汉字码,以及所述第一和第二种语言的汉字码通用的多个通用码;
用于通过利用所述字符码表将由所述第一转换装置得到的多个字符码转换成多个第一通用码的第二转换装置(35);
用于搜索所述字符串码表中对应所述多个第一通用码的多个第二通用码的装置(35);以及
用于获得对应所述多个第二通用码的所述第二种语言的多个字符码的装置(35)。
10.根据权利要求9的设备,其特征在于所述通用码为拼音码。
11.根据权利要求9的设备,其特征在于还包括用于输入执行转换的指令的装置,以及
特征在于,所述第一转换装置在所述输入指令的装置输入所述指令后转换所述字符码。
12.根据权利要求9的设备,其特征在于所述输入装置从图形输入板输入关于所述手写字符的数据。
13.根据权利要求9的设备,其特征在于向指示语言的属性数据中添加由所述产生装置产生的所述汉字码。
14.根据权利要求13的设备,其特征在于所述转换装置将向所述字符码中添加的属性数据转换为所述第二种语言的属性数据。
15.一种汉字处理方法,其特征在于包括:
指定第一和第二种语言(A1);
输入关于手写字符的数据(A31);
产生关于所述手写字符的输入数据所对应的所述第一种语言的汉字码(A32);以及
将所述产生的汉字码转换成所述第二种语言的汉字码(A34)。
16.根据权利要求15的方法,其特征在于还包括:
将被转换成所述第二种语言的多个汉字码转换成所述第二种语言的汉字码序列(A46)。
CNA2004100072858A 2003-02-28 2004-02-27 汉字处理设备和汉字处理方法 Pending CN1525388A (zh)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
JP2003054682A JP2004265136A (ja) 2003-02-28 2003-02-28 文字入力装置、文字入力方法、及び文字入力プログラム
JP054682/2003 2003-02-28

Publications (1)

Publication Number Publication Date
CN1525388A true CN1525388A (zh) 2004-09-01

Family

ID=33118949

Family Applications (1)

Application Number Title Priority Date Filing Date
CNA2004100072858A Pending CN1525388A (zh) 2003-02-28 2004-02-27 汉字处理设备和汉字处理方法

Country Status (2)

Country Link
JP (1) JP2004265136A (zh)
CN (1) CN1525388A (zh)

Families Citing this family (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US7428516B2 (en) * 2005-06-23 2008-09-23 Microsoft Corporation Handwriting recognition using neural networks
JP5239419B2 (ja) 2008-03-14 2013-07-17 オムロン株式会社 文字認識プログラム、文字認識電子部品、文字認識装置、文字認識方法、およびデータ構造
CN102915215B (zh) 2011-08-03 2015-05-27 精工爱普生株式会社 控制装置以及控制方法
JP5790267B2 (ja) * 2011-08-03 2015-10-07 セイコーエプソン株式会社 出力制御システム、及び、制御方法
JP5984375B2 (ja) * 2011-12-15 2016-09-06 株式会社日立公共システム 簡体字・正字変換装置及び当該装置を用いた簡体字・正字変換方法
JP2013125450A (ja) * 2011-12-15 2013-06-24 Hitachi Government & Public Corporation System Engineering Ltd 外国人氏名正字出力システム及び外国人氏名正字出力方法
JP6297449B2 (ja) * 2014-08-19 2018-03-20 アルパイン株式会社 オーディオ装置及びコンピュータプログラム

Also Published As

Publication number Publication date
JP2004265136A (ja) 2004-09-24

Similar Documents

Publication Publication Date Title
CN1296806C (zh) 去多义性的简化键盘***
CN1024050C (zh) 对汉字进行编码和译码的方法和装置
CN1269014C (zh) 字符输入装置
CN1648828A (zh) 去多义性语音输入***和方法
CN1607491A (zh) 使用操纵杆输入中文的***和方法
CN1232226A (zh) 句子处理装置及其方法
CN1777858A (zh) 用于触摸屏和简化的键盘***的准确文本输入方法
CN100342317C (zh) 字符的输入装置和方法
CN101079268A (zh) 进行手语合成与显示的***和方法
CN1095560C (zh) 修改汉字转换结果的***
CN1591297A (zh) 汉字输入方法及装置
CN101038508A (zh) Gb拼音输入法
CA2496872C (en) Phonetic and stroke input methods of chinese characters and phrases
CN1525388A (zh) 汉字处理设备和汉字处理方法
CN1704879A (zh) 用于输入中文汉字短语的方法和设备
CN1556458A (zh) 一种中文整句输入法
CN1991743A (zh) 一种语音输入法方法及其装置
CN1106619C (zh) 汉语输入变换处理装置和汉语输入变换处理方法
CN1136496C (zh) 简化拼音-触摸屏鼠标式汉字输入方法
CN101046706A (zh) 用于不同人群电脑和手机可通用的输入法
CN1053976C (zh) 全拼双拼混用型中文输入方法
CN101714141A (zh) 手写辨识文字的查找翻译***及其方法
CN100339808C (zh) U码汉字输入法
CN1177285C (zh) 超大型汉字信息处理装置及方法
CN1679023A (zh) 创建和使用中文语言数据和用户自纠正数据的方法和***

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
C02 Deemed withdrawal of patent application after publication (patent law 2001)
WD01 Invention patent application deemed withdrawn after publication