CN101553810A - 字符转换装置和字符转换装置控制方法 - Google Patents

字符转换装置和字符转换装置控制方法 Download PDF

Info

Publication number
CN101553810A
CN101553810A CNA2007800376037A CN200780037603A CN101553810A CN 101553810 A CN101553810 A CN 101553810A CN A2007800376037 A CNA2007800376037 A CN A2007800376037A CN 200780037603 A CN200780037603 A CN 200780037603A CN 101553810 A CN101553810 A CN 101553810A
Authority
CN
China
Prior art keywords
character
word
mentioned
hand over
chinese
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CNA2007800376037A
Other languages
English (en)
Inventor
广濑齐志
斗谷充宏
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Sharp Corp
Original Assignee
Sharp Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Sharp Corp filed Critical Sharp Corp
Publication of CN101553810A publication Critical patent/CN101553810A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/10Text processing
    • G06F40/12Use of codes for handling textual entities
    • G06F40/126Character encoding
    • G06F40/129Handling non-Latin characters, e.g. kana-to-kanji conversion
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/10Text processing
    • G06F40/103Formatting, i.e. changing of presentation of documents
    • G06F40/109Font handling; Temporal or kinetic typography

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Health & Medical Sciences (AREA)
  • Artificial Intelligence (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Computational Linguistics (AREA)
  • General Health & Medical Sciences (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Document Processing Apparatus (AREA)

Abstract

字符转换装置(1)包括:汉字辞典部(41),具有汉字对应信息(144)和汉字索引(145),在上述汉字对应信息(144)中,汉字与该汉字的读音相对应,在上述汉字索引(145)中,拼音的起首字符与以该起首字符为起首的汉字在汉字对应信息(144)中的保存目的地的地址信息相对应;单词辞典,具有单词对应信息(162)和单词索引(161),在上述单词对应信息(162)中,单词与该单词的读音相对应,在上述单词索引(161)中,单词起首字符与以该单词起首字符为起首的单词在单词对应信息(162)中的保存目的地的地址信息相对应;以及单词获取部,根据输入字符串的起首拼音的起首字符并参照汉字辞典部(41)和单词辞典部(42)来获取与输入字符串一致的单词。根据本发明,能够缩短与输入读音相对应的单词的检索时间。

Description

字符转换装置和字符转换装置控制方法
技术领域
本发明涉及一种由用户通过键盘、触屏、图形板(tablet)、鼠标等指示器件(pointing device)输入字符或字符串的装置,尤其涉及这样一种字符转换装置,即:在接受转换指示后,根据所输入的字符或字符串进行转换并以可由用户选择的方式对转换后的字符或字符串进行显示,由用户选择所显示的上述字符或字符串从而输入所需的字符或字符串。
背景技术
用户在利用键盘向信息设备中输入日文、中文等语言的汉字或单词并对输入内容进行字符显示时,需要输入汉字或单词的读音(表音字符)并进行转换指示操作。将读音转换成汉字需要可使读音与汉字或单词之间具有关联关系的辞典数据。辞典数据的词汇量表示信息设备(输入***)功能的一个方面。
但是,如果词汇量增多,信息设备在辞典数据中检索与所输入的读音一致的汉字时所需的时间就会增加。因此,从用户输入读音并发出转换指示到对转换结果进行显示需要很长的响应时间,这就导致信息设备的使用性能变差。
对此,人们进行了各种研究以缩短汉字或单词的检索时间。例如,有人提出了这样一种转换装置,即:关于辞典中的单词,在索引信息中就每一个读音起首字符设定自该起首字符的读音开始的单词的读音最大字符数,由此对输入字符串进行检索对象的限制,从而减少检索处理量(例如,参照专利文献1)。
专利文献1:日本国专利申请公开特开平6-149787号公报,公开日:1994年5月31日。
但是,根据上述现有的装置,如果所输入的读音的字符数在索引信息所记录的自输入读音字符串的起首字符读音开始的单词的读音最大字符数以内,就需要彻底核对是否与上述读音范围内的所有辞典数据一致。因此,如果为了增加可转换的词汇量而增加辞典数据收录的词汇量,那么,各起首读音字符的汉字、单词量就会增多,从而导致在上述条件下的处理时间增加。结果,到进行显示输出为止所需的响应时间变长,从而导致信息设备的使用性能变差。
发明内容
本发明是鉴于上述问题而进行开发的,其目的在于提供一种可缩短与已输入的表音字符相应的单词的检索时间的字符转换装置、字符输入方法、字符输入程序和计算机可读取记录介质。
为解决上述课题,本发明的字符转换装置能够将所输入的由一个以上表音字符构成的输入字符串转换成转换字符并确定由该转换字符构成的单词,其包括:
转换字符辞典,具有(a-1)转换字符对应信息和(a-2)转换字符索引,在上述转换字符对应信息中,用于识别转换字符的转换字符识别信息与用于表示该转换字符的表音的转换字符表音信息对应,在上述转换字符索引中,输入的表音字符与表示上述转换字符识别信息在上述转换字符对应信息中的保存目的地的转换字符保存目的地信息对应,该转换字符识别信息以该表音字符作为上述转换字符表音信息的起首表音字符;
单词辞典,具有(b-1)单词对应信息和(b-2)单词索引,在上述单词对应信息中,用于识别单词的单词识别信息与用于表示该单词的表音的单词表音信息对应,在上述单词索引中,用于识别成为单词起首的起首转换字符的起首转换字符识别信息与用于表示单词在上述单词对应信息中的保存目的地的单词保存目的地信息对应,该单词以上述起首转换字符识别信息所表示的起首转换字符为起首字符;
(c)起首转换字符获取部,根据所输入的上述输入字符串的起首表音字符并参照上述转换字符辞典,获取以该输入字符串的起首表音字符为上述转换字符表音信息的起首字符的转换字符识别信息;以及
(d)单词获取部,根据所获取的上述起首转换字符识别信息并参照上述单词辞典,获取以该起首转换字符识别信息所表示的转换字符为起首字符的单词。
根据上述结构,首先,起首转换字符获取部可参照转换字符辞典并根据输入字符串的起首表音字符对转换字符进行检索,接着,单词获取部可参照单词辞典来获取以起首转换字符获取部已获取的转换字符为起首转换字符的单词。因此,能够缩短进行单词检索处理所需的时间。即,因为能够限制对输入字符串和表音(读音)信息的比较次数,因此,能够提供一种响应速度较快的字符转换装置。
其中,转换字符表示进行转换之后的字符。假定转换字符为汉字,表音字符(读音)中的起首字符就如后所述。例如,中文的“每年(以下,称之为“字符1”)”的读音表述为“meinian”,“m”成为读音的起首字符。另一方面,日文的“每年”的读音表述为“まいとし”,“ま”就成为读音的起首字符。
另外,以“字符1”为例,其中的“每(以下,称之为“字符2”)”是起首转换字符,“meinian”是转换字符表音信息。
另外,关于转换字符识别信息,如果是能够识别转换后的字符、即转换字符的信息,就无需对其进行限制。转换字符识别信息也可以是转换字符本身。例如,当转换字符是汉字时,转换字符识别信息既可以是汉字本身,也可以是汉字代码。另外,关于单词识别信息和起首转换字符识别信息,也同样如此。
本发明的其他目的、特征和优点在以下的描述中会变得十分明了。此外,以下参照附图来明确本发明的优点。
附图说明
图1表示本发明的实施方式,是表示字符转换装置的要部结构的框图。
图2是表示由上述字符转换装置执行的字符转换处理的流程图。
图3是说明本发明实施例的汉字索引的图。
图4是说明本发明实施例的汉字对应信息的图。
图5是说明本发明实施例的一次索引的图。
图6是说明本发明实施例的二次索引的图。
图7是说明本发明实施例的单词对应信息的图。
图8是说明本发明实施例的拼音辞典索引的图。
图9是说明本发明实施例的拼音辞典的图。
图10是表示本发明实施例的拼音切分处理示例的图。
图11是表示在本发明实施例的拼音切分处理中对已确定拼音以外的拼音进行切分处理的示例的图。
图12是表示本发明的实施方式的字符转换装置的要部结构的框图。
图13是表示采用了本发明的字符转换装置的多功能打印机的概略结构的框图。
图14是表示由字符转换装置的操作面板显示的、在进行字符输入处理时的操作画面的一个示例的图。
图15是表示字符转换装置的候选提取部在提取候选汉字时参照的、在汉字辞典记录部中记录的汉字辞典示例的图。
图16是表示本发明的其他实施方式的、用于提取候选熟语的字符转换装置的要部结构的框图。
图17是表示由字符转换装置的操作面板的显示部显示的候选熟语的示例的图。
图18是表示熟语辞典记录部记录的熟语辞典的示例的图。
图19是表示本发明的其他实施方式的字符转换装置的处理流程的流程图。
图20是表示操作面板上的候选字符显示区及确定字符显示区的显示示例的图。
图21是表示本发明的其他实施方式的、具备学习功能(learningfunction)的字符转换装置的要部结构的框图。
图22是表示候选顺序确定部32的详细结构的框图。
图23是表示连结度记录部记录的连结度表的示例的图,在该连结度表中,表示各汉字(熟语)与前接(前方)字符串之间的连结度。
图24是表示在字符转换装置的候选顺序确定部确定显示顺序时对候选对象进行分类的步骤的图。
图25是表示数据结构的一个示例的图,在该数据结构中存储就每一个候选对象计算出的显示顺序的评价值。
图26是表示由候选顺序确定要素记录部记录的优先级信息的一个示例的图。
图27是表示在操作面板的字符输入框中手写的汉字示例以及该汉字的坐标信息示例的图。
图28是表示操作面板的显示示例的图,其中,(a)表示在显示一体型图形板的字符输入框中手写的汉字示例,(b)表示在候选字符显示区中显示的识别字符候选的示例,(c)表示在候选字符显示区中显示的候选熟语的示例。
图29是表示对手写数据“字符2”的识别结果的示例的图。
图30是表示本发明的其他实施方式的、输入繁体字的字符转换装置的要部结构的框图。
图31是表示本发明的其他实施方式的、进行注音字母输入处理以输入繁体字时的操作画面的一个示例的图。
图32是表示在本发明的其他实施方式中字符转换装置的候选提取部在提取候选汉字时参照的、在汉字辞典记录部中记录的汉字辞典示例的图。
图33是表示在本发明的其他实施方式中字符转换装置的熟语辞典记录部记录的熟语辞典的示例的图。
图34是表示本发明的其他实施方式的由字符转换装置的连结度记录部记录的连结度表的示例的图,在该连结度表中,表示各汉字(熟语)与前接(前方)字符串之间的连结度。
图35是表示由操作面板的显示部显示的操作画面的一个示例的图。
图36是表示由操作面板的显示部显示的操作画面的一个示例的图。
图37是表示由操作面板的显示部显示的操作画面的一个示例的图。
图38是表示由操作面板的显示部显示的操作画面的一个示例的图。
具体实施方式
下面,根据图12至图38说明本发明的实施方式(实施例1至4)。在本发明的实施方式中,作为一个示例,对本发明的字符转换装置应用于多功能打印机(复印机)时的情况进行说明。其中,上述多功能打印机(复印机)所具备的触屏包括形成为一体的输入装置和输出装置。然而,在本发明的实施方式中说明的复印机只是本发明的一个示例,本发明的字符转换装置还可应用于便携式电话、便携式终端、电脑、遥控器等装置中。
(背景技术及其缺陷)
根据现有的字符转换装置,较之于表音字符,获取表意字符时的操作更为繁琐复杂。表意字符的字符种类数量庞大,要对每一种表意字符分配一个键并不现实。并且,一般而言,在表意字符中存在很多同音异义字。所以,多个表音字符的组合所对应的表意字符的候选对象数量庞大。其结果,用户要从数量庞大的候选对象中选择出适当的表意字符时,往往不得不在操作上花费很多时间。
并非只有日文字符输入***才会发生上述缺陷。如果是与日文同样的表意字符输入***就会发生同样的缺陷。例如,中文字符输入***利用拼音(省略了作为中文特征的四声)进行字符输入。通过下述步骤来实现汉字输入。通过键盘输入待输入汉字的拼音符号(拉丁字母字符串),并通过转换操作将所输入的拼音符号转换为与其相对应的汉字从而得到所需的汉字。以下,为解决上述缺陷,阐释一种可简化用于获取所需的表意字符的表意字符输入操作的字符转换装置。
在本发明的实施方式中,将阐述可通过拼音符号(拉丁字母串)实现中文(简体字)输入的字符转换装置,但是,本发明的字符转换装置并不限于此,还可以是由各种表音字符来获取所需的表意字符的字符转换装置。另外,关于上述拼音符号,中文中本来存在用于表示四种不同发音的四声,为简化说明,省略四声的概念。
(实施方式1)
[多功能打印机的结构]
图13是表示采用了本发明的字符转换装置的多功能打印机的概略结构的框图。
如图13所示,多功能打印机具有控制部10、操作面板(图形板)2、临时存储部3、记录部40、图像读取单元4、图像转印单元5和送纸单元6。另外,在本实施方式中说明的多功能打印机结构只是用于实施本发明的一个示例,本发明的范围并不受其限定。
控制部10对多功能打印机进行整体控制。控制部10从记录部40中读出所记录的各种程序,对图像读取单元4、图像转印单元5和送纸单元6等实施控制,执行诸如复印等处理,从而实现作为复印机的功能。另外,本发明的用于执行字符输入处理的各部也包括在上述控制部10中。
记录部40记录下述程序,即:操作面板2的控制程序、作为复印机进行动作的上述各单元的控制程序以及字符转换装置1的控制程序。记录部40由ROM(read only memory:只读存储器)等非易失性存储元件来实现。
临时存储部3是用于进行程序处理的工作区,用于临时存储读取图像。此外,在本实施方式中还用于临时存储字符输入处理时的学习字符(串)等。临时存储部3由RAM(random access memory:随机存取存储器)等易失性存储元件来实现。
用户通过操作面板2指示多功能打印机执行各种处理。操作面板2例如由触屏或显示一体型图形板来实现,上述触屏包括形成为一体的输入装置和输出装置。操作面板2还可以具备手写字符识别功能,通过该功能来识别利用显示一体型图形板手写的字符。另外,操作面板2具备这样的功能,即:根据用户在显示一体型图形板的指示位置来检测被指示的字符、字符串和其他功能键等的信息。
用户可通过笔、手指等轻触在操作面板2上显示的与各拉丁字母(表音字符)分别对应的各个键,将所需的拉丁字母输入到多功能打印机中。
另外,上述多功能打印机也可以构成为:除上述操作面板2之外,还包括键盘(第1输入部/第3输入部)7(例如,个人电脑使用的通用键盘)。在这种情况下,无论是由操作面板2显示的键,还是键盘7的键,都可以用于进行拉丁字母输入。其中具备用于输入表音字符的键的输入部(第1输入部)可同时由操作面板2及键盘7这二者来实现,也可仅由键盘7来实现。或者,也可以对表音字符的输入方式进行切换,确定是通过操作面板2进行输入还是通过键盘7进行输入。
以下,进一步详细说明本发明的进行上述字符输入处理的字符转换装置1。
[字符转换装置的结构]
图12是表示本发明的实施方式的字符转换装置1的要部结构的框图。如图12所示,字符转换装置1具有操作面板2、控制部10、记录部40和临时存储部3。
如上所述,操作面板2由触屏来实现,该触屏包括形成为一体的输入装置和输出装置。
显示部12对用户提供各种信息。图14是表示由操作面板2显示的、在进行字符输入处理时的操作画面的一个示例的图。如图14所示,显示部12包括:字符输入区121,显示用于由用户输入字符的键盘;候选字符(串)显示区122,显示被列为输入候选对象的字符(字符串);以及确定字符(串)显示区123,显示已被输入并确定的输入确定字符。用户通过输入部11输入表示中文发音符号的拼音(表音字符串/表音信息)。当用户触按由字符输入区121显示的拉丁字母键时,与显示面板上的上述触按位置对应的拉丁字母的信号被输入至字符转换装置1的输入输出控制部20。输入部11用于由用户选择要确定输入的字符。当用户触按由候选字符显示区122显示的汉字(表意字符/转换字符)时,上述触按位置显示的汉字的信号被输入至输入输出控制部20,并确定上述汉字的输入。
控制部10对输入输出控制部20和字符输入控制部30进行控制。输入输出控制部20对在操作面板2与控制部10之间交换的信号的输入输出进行控制。输入输出控制部20包括输入接受部21、显示控制部22(显示控制机构)和候选选择接受部23。字符输入控制部30执行字符输入处理,其包括候选提取部(候选字符提取部/候选字符串提取部)31、候选顺序确定部32和字符确定部(字符输入确定部)33。另外,控制部10内的各部由计算机的中央运算装置(CPU)以及由CPU执行的软件来实现。该软件也被记录在上述记录部40中。将上述记录部40所记录的上述软件读出到临时存储部3中并通过CPU来执行。
输入输出控制部20的输入接受部21接受由输入部11输入的字符(拉丁字母等)的信号并将其提供给候选提取部31。显示控制部22对显示部12进行控制,使得显示部12的字符输入区121、候选字符显示区122和确定字符显示区123分别显示应该显示的信息。候选选择接受部23接受由输入部11输入的在候选字符显示区122内选择的候选汉字的信号以及用于确定上述已选择的候选汉字的输入的指示信号,并将所接受的上述信号提供给字符确定部33。
字符输入控制部30的候选提取部31根据所输入的字符从记录部40记录的各辞典部中获取候选的汉字(或)单词。在本实施方式中,候选提取部31根据所输入的拉丁字母(串)从记录部40的汉字辞典部(字符记录部)41中提取候选的汉字。
具体而言,首先,指定与所输入的拉丁字母(串)对应的拼音,并将与所指定的各拼音对应的汉字作为候选汉字提取出来。候选提取部31将所提取的汉字存储在内部缓冲器(未图示)中,并指示候选顺序确定部32和显示控制部22显示候选汉字。
拉丁字母(串)-拼音-汉字对应地记录在候选提取部31所参照的汉字辞典部41中。关于汉字辞典部41,详见后述。
候选顺序确定部32根据规定的条件来确定候选提取部31所提取的候选汉字的显示顺序。如图14所示那样,显示顺序是在候选字符显示区122显示候选汉字的顺序。如果所提取的所有候选汉字能一次全显示在候选字符显示区122内,那么,将顺序靠上的候选汉字优先显示在候选字符显示区122的上部以便于用户选择即可。如果候选汉字的数量超过了一次可显示的数量,那么,进行换页以显示低阶顺序的候选汉字即可。在这种情况下,预先进行设定,将顺序靠上的候选汉字显示在首页,从而使得用户容易选择高阶顺序的候选汉字。所以,候选顺序确定部32根据规定的条件并按照用户选择由易到难的顺序来确定所提取的候选汉字的显示顺序。在后述的说明中将阐述根据何种条件确定候选汉字的显示顺序。
字符确定部33由候选选择接受部23取得自输入部11输入的已由用户选择的候选汉字的信号以及用于确定上述已选择的候选汉字的输入的指示信号,并确定已由用户选择的候选汉字的输入。首先,在确定字符显示区123同时显示已选择候选汉字和用于表示该已选择候选汉字的确定前选择状态的下划线。字符确定部33根据输入确定的指示信号来确定候选汉字,由显示控制部22进行控制,使得在确定字符显示区123将上述已确定候选汉字作为输入确定字符并使其以无下划线状态进行显示。
[汉字辞典]
接着,对汉字辞典部41记录的汉字辞典进行说明。图1 5是表示候选提取部31在提取候选汉字时参照的、在汉字辞典部41中记录的汉字辞典示例的图。
如图15所示,本实施方式的汉字辞典140包括拉丁字母-拼音对应表(A/P对应表141)和拼音-汉字对应表(P/C对应表142),在拉丁字母-拼音对应表中记录了输入接受部21所接受的拉丁字母(串)与拼音之间的对应关系,在拼音-汉字对应表中记录了拼音与汉字之间的对应关系。由此,能够直接提取与输入的拉丁字母(串)对应的候选汉字。
具体而言,用户在要输入汉字“字符2”(相应的拼音为“mei”)时,使用输入部11,首先触按“m”键。当输入接受部21提供“m”的信号时,候选提取部31首先从汉字辞典140的A/P对应表141中指定与“m”前方一致的拼音(在图15中,为“ma”和“mei”),并检测出P/C对应表142中记录有与上述拼音对应的汉字的地址(“cp_ml”和“cp_mi”)。
接着,候选提取部31根据P/C对应表142中的“cp_ml”和“cp_mi”来提取与“m”前方一致的拼音所对应的汉字(妈、麻、没、…、浼、…)。所提取的汉字如上所述地被作为候选汉字提供给候选顺序确定部32。在这种情况下,如果用户进一步输入“mei”,候选提取部31就将范围限定为与“mei”前方一致的汉字,并从汉字辞典部41中提取候选汉字。
根据上述结构,候选提取部31接受用户输入的拉丁字母并指定其中包含该拉丁字母的拼音。候选提取部31可根据所指定的拼音从汉字辞典部41中提取用户想要输入的候选汉字。
候选顺序确定部32根据规定的条件来重新排列上述候选提取部31所提取的候选汉字并确定候选汉字的显示顺序。显示控制部22对显示部12进行控制,使得按照上述候选顺序确定部32所确定的显示顺序对候选汉字进行显示。
最后,当用户从所显示的候选汉字中指定了想要输入的汉字时,字符确定部33确定所指定汉字的输入。
根据上述,能够简化用于获取所需汉字的输入操作。
另外,可通过用户的拉丁字母输入操作将候选提取部31要提取的候选汉字存储到外部存储装置(未图示)或者从外部存储装置读入上述候选汉字,也可以在显示候选汉字时利用所读入的汉字。
[变形例1-候选单词的输出]
另外,本发明的字符转换装置1优选的是:在某汉字被选为输入确定字符后,以该汉字为起首字符、由一个以上的汉字构成且具有一个含意的汉字串(以下,将其称之为“单词(表意字符串)”)作为候选单词,显示在候选字符显示区122(图14)中。由此,用户能够在候选字符显示区122获取可与上述某汉字共同形成单词的汉字,所以,无需另行输入后续汉字的拼音就能得到所需汉字。因此,能够简化用于获取所需汉字的输入操作。
图16是表示输出候选单词的字符转换装置1的要部结构的框图。另外,图16的各结构要素的符号与图12的各结构要素的符号对应,且相同的符号表示相同的结构要素。所以,对上述说明中已阐释的结构要素不再赘述。较之于图12的结构,其不同之处在于:在图16所示的字符转换装置1中,由字符确定部33向候选提取部31传送控制信号;记录部40中包括单词辞典部(字符串记录部)42。
当通过候选选择接受部23对字符确定部33输入由用户选择的汉字(或输入确定字符)时,字符确定部33对候选提取部31发送指示,使其提取以所选择的汉字为起首字符的单词。
候选提取部31根据上述指示,从单词辞典部42中提取以上述所选择的汉字为起首字符的单词作为候选单词。图17是表示由操作面板2的显示部12所显示的候选单词的示例的图。根据图17的示例,在选择汉字“字符2”后,以汉字“字符2”为起首字符的单词作为候选单词,显示在显示部12的候选字符显示区122中。
在候选提取部31参照的单词辞典部42中对应地记录有汉字-单词。图18是表示单词辞典部42记录的单词辞典的示例的图。如图18所示,本实施方式的单词辞典包括汉字-单词对应表(C/I对应表143),汉字-单词对应表中记录了汉字辞典部41所记录的汉字与以该汉字为起首字符的单词之间的对应关系。由此,能够进一步提取与所选择的汉字对应的候选单词。
具体而言,例如,当用户选择汉字“字符2”时,候选提取部31检测出P/C对应表142(图15)中的“字符2”的地址(“wp_mi+j”)。接着,参照单词辞典部42,并根据地址“wp_mi+j”提取以“字符2”为起首字符的单词(“字符2”月、“字符2”天、…)。与上述结构同样地,所提取的单词作为候选单词被提供给候选顺序确定部32并在候选字符显示区122中进行显示(图17)。
当输入某汉字时,较之于没有关联的汉字,所输入的汉字的后续字符(用户所需汉字)很可能是构成以上述所输入的汉字为起首字符的单词的汉字。所以,如果要将以输入确定的汉字为起首字符的单词作为候选单词进行显示,则用户只需从上述候选单词中选择所需的单词而无需另行输入拼音,就能够实现中文输入。由此,用户能够以更简便的拼音输入操作来实现所需汉字的输入。
[流程]
接着,根据图19所示的流程图以及图20所示的操作面板2上的候选字符显示区122及确定字符显示区123的显示示例,对本发明的字符转换装置1(图16)的处理流程进行说明。以下,说明用户想要输入“‘字符2’天到郊外散步”时的情况。
当用户通过操作面板2的输入部11输入拉丁字母(汉字“字符2”(mei)的拼音的起首拉丁字母“m”)时(S201中的“是”),输入接受部21将所输入的拉丁字母“m”的信号提供给候选提取部31。接着,候选提取部31指定与所输入的拉丁字母对应的拼音,并从汉字辞典部41中提取与所指定的拼音对应的汉字作为候选汉字(S202)。
候选顺序确定部32根据规定的条件来确定上述所提取的候选汉字的显示顺序(详见后述)(S203)。接着,显示控制部22确定显示位置使得按照候选顺序确定部32所确定的显示顺序显示n个候选汉字,对显示部12输出上述候选汉字,将其提示给用户(S204)。在图20的(a)所示的显示示例为:设n=5,每次显示5个候选汉字。
当用户输入用于显示下一候选汉字的指示(图20的(a)中没有所需的汉字“字符2”,所以,例如,触按“下一候选显示”的按钮)时(S205中的“否”,S206中的“是”),返回S204,显示控制部22显示下一个候选汉字的列表(图20的(b)),其中,上述下一候选汉字是第一次在候选字符显示区122显示的候选汉字之外的候选汉字。另外,在既未输入下一候选汉字的显示指示也未输入候选汉字的选择指示(S205、S206中的“否”)而又新输入了拉丁字母的情况下,返回S202,候选提取部31进一步缩小范围指定与至此输入的拉丁字母串对应的拼音,并提取与所指定的拼音对应的汉字作为候选汉字。
另一方面,当用户通过输入部11选择在候选字符显示区122显示的所需汉字“字符2”(图20的(b)中的“3011)时(S205中的“是”),候选选择接受部23接受所选择的候选汉字“字符2”的信号并将其提供给字符确定部33。
字符确定部33对显示控制部22发出指示使得显示所选择的“字符2”,并指示候选提取部31接下来提取以“字符2”为起首字符的单词。候选提取部31从单词辞典部42中提取以“字符2”为起首字符的单词作为候选单词(S207)(图20的(c))。
候选顺序确定部32根据规定的条件来确定上述所提取的候选单词的显示顺序(详见后述)(S208)。接着,显示控制部22按照候选顺序确定部32所确定的显示顺序对显示部12输出上述候选单词,将其提示给用户(S209)。
当用户输入用于显示下一候选单词的指示时(S210中的“否”,S211中的“是”),返回S209,显示控制部22显示下一个候选单词的列表。另外,在既未输入下一候选单词的显示指示也未输入候选单词的选择指示(S210、S211中的“否”)而又新输入了拉丁字母的情况下,返回S202,候选提取部31指定与至此输入的拉丁字母对应的拼音,并提取与所指定的拼音对应的汉字作为候选汉字。
另一方面,当用户通过输入部11选择在候选字符显示区122显示的所需单词“‘字符2’天”(图20的(c)中的“020”)时(S210中的“是”),候选选择接受部23接受所选择的候选单词“‘字符2’天”的信号并将其提供给字符确定部33。
字符确定部33对显示控制部22发出指示使得显示所选择的候选单词。显示控制部22在显示部12显示所选择的候选单词(S212)(图20的(d))。同时,指示候选提取部31接下来提取以该候选单词为首部的单词。如果未输入用于结束字符输入的指示(S213中的“否”),则返回S207,候选提取部31从单词辞典部42中提取以上述所选择的候选单词为首部的单词作为候选单词。
在用户的下一个所需汉字“到”未作为候选汉字进行显示的情况下,用户可输入“到”(dao)的起首拼音拉丁字母“d”(S211中的“否”,S201中的“是”),(图20的(e))。其后,反复同样的处理,由此能够输入所需汉字。
在选择了已选择的候选单词后(“散步”的输入确定后),如果输入用于结束字符输入的指示(S213中的“是”),就结束处理。
[变形例2-学习功能]
另外,本发明的字符转换装置1优选的是,具备用于记录根据用户的选择来输入确定的汉字(单词)的结构。根据这种结构,字符转换装置1可根据对过去已输入的汉字、即用户曾使用过的汉字的记录来进行候选汉字显示。关于过去曾使用的汉字,用户再次使用的可能性较大。所以,利用可反映上述使用履历的候选汉字一览,用户能够以较少的操作次数来获取所需汉字。
图21是表示具备学习功能的字符转换装置1的要部结构的框图。另外,图21的各结构要素的符号与图12的各结构要素的符号对应,且相同的符号表示相同的结构要素。所以,对上述说明中已阐释的结构要素不再赘述。较之于图12的结构,其不同之处在于:在图21所示的字符转换装置1中,字符输入控制部30还包括学习控制部(学习控制机构)34;记录部40中包括学习辞典记录部(学习词语记录部)43和成对学习(pair learning)辞典记录部(学习词语记录部)44。
学习控制部34根据用户指示,对字符转换装置1中输入(使用)的汉字的学习(记录)进行控制。具体而言,将用户曾经使用过的汉字作为学习汉字保存到学习辞典记录部43中(以下,称之为单独学习(功能)),或者,将用户曾经使用过的汉字与前接输入的汉字相关联地保存到成对学习辞典记录部44中(以下,称之为成对学习(功能))。用户曾经输入过的汉字很可能被用户再次使用,所以,通过将上述学习汉字用作候选汉字,能够以更少的操作次数来提高用户获取所需汉字的概率。
学习辞典记录部43将用户曾经使用过的汉字(输入确定字符)作为单独学习汉字进行记录。也可以构成为:上述单独学习汉字的记录时间信息及使用频度信息(例如,过去曾经使用过多少次?在规定时间内使用过多少次?)与每一个汉字对应地记录在由学习辞典记录部43所记录的学习辞典中。
当学习控制部34从字符确定部33接收到用户选择的候选汉字的信号时,将该所选择的候选汉字写入临时存储部3。字符确定部33根据确定指示信号对输入进行确定后,学习控制部34由字符确定部33接受上述输入确定汉字的单独学习处理的指示。学习控制部34将上述候选汉字由临时存储部3读出到内部缓冲器中,删除由临时存储部3读出的候选汉字并进行内容更新。然后,将内部缓冲器中存储的候选汉字作为单独学习汉字存储到学习辞典记录部43中。
成对学习辞典记录部44将用户曾经使用过的汉字与下述信息(前接汉字)关联地记录为成对学习汉字,即,表示用户曾经使用过的汉字是紧接在哪一个汉字之后被确定的信息。前接汉字是作为单独学习汉字已记录在学习辞典记录部43中的汉字。上述前接汉字与每一个上述成对学习汉字相关联地记录在成对学习辞典记录部44记录的学习辞典中。也可以构成为:将上述每一成对汉字与记录时间信息及使用频度信息对应地进行记录。
学习控制部34从字符确定部33接受输入确定字符的成对学习处理指示。学习控制部34将上述输入确定字符及其前接汉字由临时存储部3读出到内部缓冲器中,删除由临时存储部3读出的字符串并进行内容更新。然后,使内部缓冲器中存储的输入确定字符与其前接汉字相关联并作为成对学习汉字存储到成对学习辞典记录部44中。
另外,以上,说明了学习辞典记录部43和成对学习辞典记录部44在各学习辞典中记录每一个汉字的结构,但本发明并不限于此。除上述结构之外,还可以是在辞典中记录单词的结构。即,可利用学习控制部34的单独学习功能将用户曾经使用过的单词记录到学习辞典记录部43中。例如,如果用户曾经使用过“给水”这个单词,除汉字“给”之外,还将单词“给水”作为单独学习汉字(单词)记录到学习辞典记录部43中。
此外,根据学习控制部34的成对学习功能,在连续输入了单词“大学”和“教授”的情况下,还可将汉字“教”与“学”和/或“大学”的前接汉字(单词)关联地记录为成对学习汉字。另外,还可以将单词“教授”与“学”和/或“大学”的前接汉字(单词)关联地记录为成对学习单词。
[候选顺序确定要素]
接着,说明用于由字符转换装置1的候选顺序确定部32(图12、16、21)确定候选对象(候选汉字/候选单词)的显示顺序的规定条件(以下,称之为“候选顺序确定要素”)。
如上所述,在操作面板2的显示部12中,一次性显示多个候选的优点在于:用户能更快获取所需汉字的可能性增大。并且,在操作面板2由触屏等显示/输入一体型输入输出器件来实现的情况下,能够进一步减少用于获取所需汉字的用户操作次数。但是,另一方面,其问题在于:即使在大的显示画面中一览显示多个候选对象,要从中搜索所需的候选对象反而会增加用户负担。因此,较为理想的是:在有限的显示区域显示有限数量的候选对象时,按照被用户选择(需要)的可能性大小由高到低的顺序对汉字(单词)依次进行显示。
在本发明中,确定符合用户嗜好的显示候选顺序,使得能够以更高精度的显示顺序进行显示。由此,可实现一种能够简化用于获取所需汉字的输入操作的字符转换装置。
以下,说明候选单词的显示顺序的确定方法。候选汉字/候选单词的显示顺序均通过相同方法进行确定。
在本实施方式中,候选顺序确定部32根据下述7个候选顺序确定要素来确定候选的显示顺序。
<要素A>出现频度
出现频度是指,用于表示某种语言的字符(串)出现的频度的指标信息。字符(串)出现频度越高,表明在该语言使用环境下该字符(串)就越是被更多地使用。所以,出现频度高的候选对象的显示顺序被设定为高阶显示顺序。出现频度可采用基于已知统计数据的固定信息。
<要素B>拼音长度一致/不一致
根据所输入的拉丁字母(串)的字符数是否与所对应的候选对象的拼音的字符数一致来确定显示顺序。拼音长度与所输入的拼音字符数一致的候选对象的显示顺序被设定为高阶显示顺序。
<要素C>与前接字符串之间的连续性
紧接在至此已输入确定的输入确定字符和/或当前时刻处于选择中的字符(串)之后的可能性(与前接字符串之间的连续性)较大的候选对象被设定为高阶显示顺序。或者,根据过去的输入履历来判断是否曾经在上述前接字符串之后进行了后续输入,并将曾被后续输入的候选对象的显示顺序设定为高阶显示顺序。
<要素D>与前方字符串之间的关联性
与至此已输入确定的输入确定字符(串)之间具有关联并且在该字符(串)后方输入的可能性(与前方字符串之间的关联性)较大的候选对象的显示顺序被设定为高阶显示顺序。
<要素E>单独学习汉字/单词
根据是否为学习辞典记录部43记录的单独学习汉字(单词)来确定显示顺序。过去曾经输入(使用)过的汉字(单词)被再次使用的可能性较大。所以,作为单独学习汉字(单词)记录的候选对象的显示顺序被设定为高阶显示顺序。
<要素F>成对学习汉字/单词
根据是否为成对学习辞典记录部44记录的成对学习汉字(单词)来确定显示顺序。过去曾经输入(使用)过的汉字(单词)的组合被再次组合使用的可能性较大。所以,作为成对学习汉字(单词)记录的候选对象的显示顺序被设定为高阶显示顺序。
<要素G>学习时间
根据学习辞典记录部43和/或成对学习辞典记录部44对与候选汉字(单词)一致的学习汉字(单词)进行记录的记录时间来确定显示顺序。记录时间距当前时刻越近,被用户选择的可能性越大。所以,最近记录的汉字(单词)的候选对象的显示顺序被设定为高阶显示顺序。
以上述各要素为条件,可在候选字符显示区122(图14)对用户选择的可能性较大的候选对象进行优先显示。所以,用户能够以较少的键操作次数来获取所需的汉字。
如上所述,候选顺序确定要素是指,候选顺序确定部32确定候选汉字/候选单词的显示顺序所需的信息。更具体而言,候选顺序确定要素是指,候选顺序确定部32进行评价值计算所需的信息,其中,该评价值表示候选汉字/候选单词被用户选择的可能性的大小。候选顺序确定要素的信息与各候选(候选汉字/候选单词)对应地存储在记录部40的各(记录)部中,候选顺序确定部32可参照记录部40的各部,对每一个候选对象来指定候选顺序确定要素。另外,在记录部40中还可以存储有用于规定如何根据候选顺序确定部32指定的候选顺序确定要素来计算上述评价值的评价值计算规则。由此,候选顺序确定部32可按照所指定的候选顺序确定要素和评价值计算规则来求取每一个候选对象的评价值,从而确定候选对象的显示顺序。关于候选顺序确定部32的评价值计算方法,详见后述。
[候选顺序确定部的结构]
图22是表示候选顺序确定部32的详细结构的框图。候选顺序确定部32包括:学习汉字判断部131、拼音长度判断部132、连结度判断部133、出现频度判断部134和学习时间判断部135。除上述各存储部之外,记录部40(图12、16、21)还包括出现频度记录部45和连结度记录部(关联度记录部)46。临时存储部3的内部具有提取候选临时存储部51、评价值临时存储部52和显示顺序临时存储部53。
临时存储部3内的提取候选临时存储部51临时存储作为候选提取部31所提取的候选对象(以下,称为提取候选对象)的汉字和/或单词。候选顺序确定部32从提取候选临时存储部51中读出提取候选对象并确定各提取候选对象的显示顺序。
评价值临时存储部52临时存储根据候选顺序确定要素和评价值计算规则所计算出的被赋予上述各提取候选对象的评价值。可以根据最终计算出的评价值来确定显示顺序。
显示顺序临时存储部53临时存储对上述各提取候选对象已确定的显示顺序的信息。候选顺序确定部32将所确定的显示顺序保存到显示顺序临时存储部53中。在显示部12显示上述提取候选对象时,显示控制部22对显示顺序临时存储部53中的显示顺序信息进行参照。
候选顺序确定部32的学习汉字判断部131判断上述提取候选对象是否为学习汉字(单词)、以及是单独学习汉字(单词)还是成对学习汉字(单词)。具体而言,如果在学习辞典记录部43内记录有与所提取的候选对象一致的汉字(单词),就判断为单独学习汉字(单词),如果在成对学习辞典记录部44内记录有与所提取的候选对象一致的汉字(单词),就判断为成对学习汉字(单词)。学习汉字判断部131将判断结果反映到评价值临时存储部52的评价值中或者显示顺序临时存储部53的显示顺序中。由此,能够确定基于要素E和/或要素F的显示顺序。
拼音长度判断部132判断在输入接受部21(图12、16、21)中输入的拉丁字母(串)是否与所对应的候选对象的拼音的字符数一致。例如,假定为获取汉字“字符2(拼音:mei)”而输入了“me”。在该时刻,输入字符数为2,所对应的候选汉字“字符2(mei)”的拼音长度为3。所以,拼音长度判断部132将其判断为拼音长度不一致。另一方面,当用户输入了“mei”时,拼音长度判断部132就将其判断为拼音长度一致,并变更评价值临时存储部52的评价值或显示顺序临时存储部53的显示顺序,使得候选汉字“字符2”的显示顺序得到提升。由此,能够确定基于要素B的显示顺序。
连结度判断部133进行下述判断,即:根据与此前已输入确定的输入确定字符和/或当前时刻正处于选择中的字符(汉字/单词)之间的连接状况即连结度,来预测用户所需的下一个字符并将其列为候选对象。连结度判断部133参照连结度记录部46所记录的连结度表150,判断与已确定或已选择的前方字符串和/或前接字符串之间的连结度。与前方字符串和/或前接字符串之间的连结度越高,成为用户所需字符的概率也就越高,因此将其设定为高阶显示顺序。由此,能够确定基于要素C和/或要素D的显示顺序。关于连结度记录部46的连结度表150和连结度判断部133,详见后述。
出现频度判断部134根据出现频度记录部45记录的已知统计数据来判断候选汉字(单词)的出现(使用)频度。出现频度越高,该字符就会被更多地使用,所以,被用户选择使用的可能性也就越大。因此,出现频度较高的候选被设定为高阶显示顺序。由此,能够确定基于要素A的显示顺序。
学习时间判断部135对学习辞典记录部43和/或成对学习辞典记录部44记录与候选汉字(单词)一致的学习汉字(单词)的记录时间进行判断。学习汉字(单词)的记录时间距当前时刻越近,被用户选择的可能性越大。所以,确定显示顺序使得学习时间距当前时刻最近的汉字(单词)被设定为高阶显示顺序。由此,能够确定基于要素G的显示顺序。
根据上述结构,候选顺序确定部32可根据上述各种条件来确定候选对象的显示顺序。
由此,能够按照可更准确地反映用户需求的显示顺序对候选对象进行显示。其结果,能够以更简便的表音字符输入操作(以更少的输入操数)来实现用户所需的表意字符的输入。
[连结度判断]
接着,进一步对连结度判断部133的动作进行详细说明。
图23是表示连结度记录部46记录的连结度表150的一个示例的图,在该连结度表150中,表示了各汉字(单词)与前接(前方)字符串之间的连结度。如图23所示,连结度表150包括:连结度对应表151,用于检测就每一个汉字(单词)保存的、汉字(单词)与前接字符串之间的连续性信息的地址以及汉字(单词)与前方字符串之间的关联性信息的地址;连续性表152,就每一个汉字(单词)保存其与前接字符串之间的连续性信息;以及前方关联性表153,就每一个汉字(单词)保存其与前方字符串之间的关联性信息。
例如,当用户选择单词“交通”时,连结度判断部133就从连结度表150中检索紧邻前接字符串“交通”之后出现的概率较大的汉字(单词)。连结度判断部133参照连结度对应表151,检测到:与前接字符串“交通”的连续性信息被保存在连续性表152的地址“npi+l”。
接着,连结度判断部133参照连续性表152的地址“npi+l”,检测出连续性由高到低、即,“规则(连续性21)”、“大学(16)”、“工具(15)”、……的顺序。最后,将上述各候选单词的显示顺序确定为“规则”、“大学”、“工具”、……。
另外,在单词“上海”的输入被确定后选择单词“交通”时,连结度判断部133就在连结度表150中检索在前方字符串“上海”之后关联输入的概率较大的汉字(单词)。连结度判断部133参照连结度对应表151,检测到:与前方字符串“上海”的关联性信息被保存在前方关联性表153的地址“ppi+s”。
接着,连结度判断部1 33参照前方关联性表1 53的地址“ppi+s”,检测出关联性由高到低、即,“大学(关联性10)”、“规则(5)”、“警察(3)”、……的顺序。最后,将上述各候选单词的显示顺序确定为“大学”、“规则”、“警察”、……。
由此,可根据用户经常输入的单词的排列来确定候选汉字(单词)的显示顺序,所以,能够按照可反映用户嗜好的显示顺序对汉字/单词进行显示。其结果,能够减少用户的键操作次数,从而简化用于获取所需汉字的用户输入操作。
[连结度判断-变形例]
在根据要素C(与前接字符串的连续性)和要素D(与前方字符串的关联性)来确定显示顺序时,可以优先基于要素D的判断结果。在这种情况下,就上述示例而言,当选择了“交通”时,并非总是优先显示候选单词“规则”,当其前方输入了“上海”时,可优先显示候选单词“大学”。
假设用户在字符转换装置1中频繁地输入了“上海交通大学”。以下,说明在用户输入“上海交通大学”时上述字符转换装置1的动作。当用户为了输入“上”(shang)而输入拼音起首字符“s”时,按照上述步骤,将“上”作为候选汉字进行显示。当用户选择了“上”时,将起首字符为“上”的单词作为候选单词进行显示。
当用户选择了“上海”时,在确定字符显示区123(图14)显示单词“上海”。同时,字符转换装置1的候选提取部31提取要在已输入确定字符“上海”后输入的候选单词。候选顺序确定部32参照图22的连结度记录部46来确定候选单词的显示顺序,将“上海”之后后续输入的概率较大的单词以高阶显示顺序进行显示。
首先,连结度判断部133根据连结度对应表151(图23),并参照连续性表152的地址“npi+s”,按照在单词“上海”后直接后续输入的概率(连续度)由高到低的顺序对候选单词进行排列。即,根据图23的示例,按照“大学(15)”、“交通(13)”、“警察(12)”、“规则(8)”、……的顺序来求取候选对象。接着,连结度判断部133根据与输入确定字符“上海”前方的单词之间的关联性,对“上海”之后后续的候选单词的显示顺序进行重新排列。但是,在此,在“上海”的前方不存在汉字/单词,所以,无需根据与前方字符串之间的关联性对显示顺序进行变更。
当用户从按照上述步骤进行显示的候选单词中选择了“交通”时,字符转换装置1接着对显示顺序进行确定,使得按照高阶显示顺序对在输入确定字符“交通”之后直接后续输入的候选单词进行显示。
连结度判断部133参照连续性表152的地址“npi+l”,并基于连续度按照“规则(21)”、“大学(16)”、“工具(15)”、“警察(14)”、……的顺序来求取候选对象。接着,参照前方关联性表153的地址“ppi+s”,并根据与位于“交通”前方的汉字/单词(这里为“上海”)之间的关联性(关联度),对“交通”之后后续的候选单词的显示顺序进行重新排列。更具体而言,如图23所示,根据前方关联性表1 53,候选单词与“上海”之间的关联度由大到小排列为“大学(10)”、“规则(5)”、“警察(3)”、“工具(2)”、……。
因此,连结度判断部133优先上述候选单词的关联度并按照关联度由大到小的顺序对显示顺序进行变更。在这种情况下,在“上海交通”之后后续的候选单词的显示顺序由“规则”、“大学”、“工具”、“警察”、……变更为“大学”、“规则”、“警察”、“工具”、……。或者,也可以根据连结度与关联度的总和对显示顺序进行变更。另外,还可以根据连结度与关联度的平均值、最大值对显示顺序进行变更。例如,在记录部40中存储有用于规定将连结度与关联度的总和作为评价值进行计算的评价值计算规则,候选顺序确定部32可按照上述评价值计算规则将连结度与关联度的总和作为评价值进行计算,并根据该评价值来确定显示顺序。
如上所述,能够按照符合用户嗜好的更高精度的显示顺序对候选汉字/单词进行显示,所以,能够减少用户的键操作次数。其结果,能够简化用于获取所需汉字的用户输入操作。
[显示顺序确定步骤]
在本实施方式中,通过组合上述各候选顺序确定要素来确定所提取的候选对象的显示顺序。以下,对其中一个示例进行说明。但是,本发明并不限于下述组合,可通过适当地组合上述各要素对显示顺序进行确定。
图24是表示在候选顺序确定部32确定显示顺序时对候选对象进行分类的步骤的图。首先,对于每一种显示顺序,候选顺序确定部32按照规定的条件(上述要素A至G及其组合)对候选对象进行分类,将其分为若干个组,并在组内确定最终的显示顺序。
首先,将候选提取部31所提取的候选单词G保存到临时存储部3的提取候选临时存储部51(图22)。学习汉字判断部131(图22)判断所保存的候选单词G是否为学习单词(S301)。另外,拼音长度判断部132比较在提取候选单词G的时刻所输入的拼音长度(拉丁字母的字符数)和候选单词G的各拼音长度。
将候选单词G中被判断为学习单词并且拼音长度也一致的候选单词划分到最高阶显示顺序的组A中;将候选单词G中被判断为学习单词但拼音长度不一致的候选单词划分到显示顺序仅低于组A的高阶显示顺序的组B,将候选单词G中被判断为非学习单词但是拼音长度一致的候选单词划分到显示顺序低于组B的低阶显示顺序的组C,将候选单词G中被判断为既非学习单词且拼音长度也不一致的候选单词划分到最低阶显示顺序的组D。
学习汉字判断部131进一步判断被划分到组A和组B中的作为学习单词的候选单词是单独学习单词还是成对学习单词(S303)。连结度判断部133判断在与前接字符串之间是否存在连续性(S304)。
在此,将组A的候选单词中被判断为成对学习单词并且在与前接字符串之间存在连续性的候选单词划分到最高阶的组A1中,将组A的候选单词中被判断为成对学习单词但是在与前接字符串之间不存在连续性的候选单词划分到高阶的组A2中,将组A的候选单词中被判断为非成对学习单词但是在与前接字符串之间存在连续性的候选单词划分到低阶的组A3中,将组A的候选单词中被判断为既非成对学习单词并且在与前接字符串之间也不存在连续性的候选单词划分到最低阶的组A4中。关于组B的候选单词也进行同样的分类。
另一方面,连结度判断部1 33判断被划分到组C和组D中的候选单词与前接字符串之间是否存在连续性(S305),并将其进一步划分为高阶的组C(D)1和低阶的组C(D)2。
最终,按照自高阶组至低阶组的顺序将所有的候选单词(G)划分为小组,即:组A1、组A2、组A3、组A4、组B1、组B2、组B3、组B4、组C1、组C2、组D1、组D2。根据学习时间(要素G)进一步确定组A、组B中各小组的顺序(最近学习的汉字被设定为高阶显示顺序);根据出现频度(要素A)进一步确定组C、组D中各小组的顺序(一般使用频度高的单词被设定为高阶显示顺序)。
另外,在本实施方式中,说明了按照规定的条件(即,按照学习时间由近至远的顺序)重新排列曾经学习过的候选汉字/单词,但也可以在所提取的作为候选对象的候选汉字之后,排列作为过去曾经学习过的候选单词。或者,可以进行排列,使得较候选汉字优先显示过去曾经学习过的单词。另外,如果过去曾经使用过的单词(包括候选汉字)为多个时,可以按照字符数由少至多的顺序进行排列。或者,可以按照学习时间由远至近或由近至远的顺序进行排列。
[变形例3-四声的输入]
在本实施方式中,说明了忽略四声的区别而使拉丁字母(串)和拼音对应的结构。但本发明的字符转换装置1并不限于上述结构。也可以是在区别四声的情况下使拉丁字母(串)和拼音对应的结构。例如,生成图15所示A/P对应表141并使其包括四声代码(例如,在进行PC输入时,由1、2、3、4分别表示一声、二声、三声、四声,由5表示轻声)即可。具体而言,在图15所示A/P对应表141和P/C对应表142中,拼音“shang”和汉字“上”相关联。其中,“上”的四声拼音为“三声shang”,所以,将A/P对应表141中“cp_si”对应的“shang”记述为“shang3”,由此,能够使得四声拼音“shang3”与“上”建立关联关系。
(实施方式2)
本发明的字符转换装置1还可以构成为:对上述候选顺序确定要素赋予优先级的信息,用户可对候选汉字(单词)显示顺序的确定条件(评价值计算规则)进行任意设定。由于用户可对显示顺序的确定条件进行任意设定,所以,在具备字符转换装置1的多功能打印机中,能够按照符合用户嗜好的显示顺序对候选对象进行显示。其结果,能够简化用于获取所需汉字的用户输入操作。
[字符转换装置的结构]
在上述实施方式1的结构的基础上,本实施方式的字符转换装置1进一步在字符输入控制部30的内部追加了候选顺序确定要素设定部(候选顺序确定要素设定机构)35,并且,在记录部40的内部追加了候选顺序确定要素记录部47(图12)。
在本实施方式中,对每一个候选对象计算出的评价值,临时存储在图22所示的评价值临时存储部52中,并根据该评价值来确定显示顺序。即,由候选顺序确定要素设定部35设定的候选顺序确定要素的优先级越高,其对上述评价值计算产生的影响也就越大。由候选顺序确定要素设定部35设定的候选顺序确定要素及其优先级记录在候选顺序确定要素记录部47中。
首先,说明由评价值临时存储部52存储的各候选对象的评价值的数据结构。
图25是表示数据结构的一个示例的图,在该数据结构中存储就每一个候选对象计算出的显示顺序的评价值。在本实施方式中,各候选对象的评价值以16位(bit)表示。即,在图25所示的16个区域中存储用于表示某候选汉字(单词)的特性(要素A至G)的值“0”或“1”。在本实施方式中,位位置(bit position)与评价值的大小相关联,位位置越是处于高阶,其所表示的评价值也就越大。因此,高优先级的候选顺序确定要素的判断结果映射到高阶位。即,评价值计算规则规定如何根据候选汉字(单词)的候选顺序确定要素来求取“0”或“1”的值,并规定上述所求取的“0”或“1”的值映射到评价值的哪一个位位置。
根据上述数据结构,可按照位位置来调整在字符转换装置1计算各候选对象的评价值时影响评价值的各要素的重要度。即,由于重要的要素被分配到高阶位置,因此,仅需对位实施ON“1”/OFF“0”操作,就能够很容易地对候选对象的显示顺序的评价值进行适当的数值化处理。另外,如果对各要素分别分配变量,为确定显示顺序所需确保的评价值的数据量就会增加。因此,通过对1位分配基于各要素的判断结果,可减少数据量。
候选顺序确定要素记录部47记录用于确定候选对象的显示顺序的、候选顺序确定要素的优先级信息。图26的(a)和图26的(b)是表示由候选顺序确定要素记录部47记录的优先级信息的一个示例的图。
优先级信息包括位位置信息,该位位置信息表示关于各候选顺序确定要素的判断结果映射到评价值的数据结构中的哪一个位位置。在图26的(a)所示的示例中,进行设定使得将要素B的判断结果保存到图25所示的位位置12的区域中。即,如果拼音长度一致,将“1”作为评价值存储到位位置12的区域中,如果拼音长度不一致,将“0”作为评价值存储到位位置12的区域中。对候选顺序确定要素分配的位位置越高,该候选顺序确定要素的优先级也就越高,其对候选的评价值确定产生的影响也就越大。
另外,在本实施方式中,评价值由16位来表示,利用位位置0至12的区域计算评价值。但本发明并不限于此。在候选顺序确定要素的数量减少或者增加新的要素或各要素的评价值范围发生变化的情况下,也可以对位长度进行设定使其充分容纳上述候选顺序确定要素等。例如,在图26的(a)和图26的(b)所示的示例中,虽然由8位来表示出现频度,但是,为了明确出现频度的差,也可以确保16位,或者,在并不重视出现频度差的情况下也可以缩小到4位。另外,也可以使用空出的位位置13至15。
候选顺序确定要素设定部35对用户通过输入部11(图12)指定的候选顺序确定要素的优先级进行设定,并将优先级信息保存到候选顺序确定要素记录部47中。
具体而言,例如,当用户通过操作面板2指示字符转换装置1显示候选顺序确定要素的优先级设定菜单时,操作面板2的显示部12就显示用于提醒用户指定候选顺序确定要素的优先顺序的操作画面。例如,同时显示诸如“请按照所需的优先顺序指示(各要素(A至G))”等消息以及可设定优先级的候选顺序确定要素一览。当用户按照所需的优先顺序来指示正在显示的各要素后,就显示用于询问用户是否确定的消息。例如,显示诸如“如果要确定变更,请按确定键”等消息。
当用户按下操作面板2的确定键时,候选顺序确定要素设定部35根据所输入的指示信号来依次将较低的位位置分配为用户指定的低优先级候选顺序确定要素的区域,并对保存各候选顺序确定要素的判断结果的位位置进行变更。
例如,假定用户在图26的(a)所示的示例的状态下将要素F的成对学习汉字/单词作为最高优先级的候选顺序确定要素并依次指定要素E、要素F、要素B、要素C、要素D和要素A/G,则优先级信息变更为图26的(b)所示那样。在图26的(b)所示的示例中,要素F的判断结果被保存到位位置12的区域中。
根据上述结构,候选顺序确定部32的各部(图22)根据由候选顺序确定要素记录部47所指定的候选顺序确定要素的优先级信息来将判断结果的评价值保存到所指定的评价值临时存储部52的位位置。
由此,可根据用户想要优先的候选顺序确定要素对用于确定显示顺序的评价值进行计算,所以,能够按照更符合用户嗜好的显示顺序对候选对象进行显示。
另外,也可以是对候选汉字和候选单词分别设定上述候选顺序确定要素的优先级信息的结构,还可以是设定一个同样适用于候选汉字和候选单词的优先级信息的结构。在能对候选汉字和候选单词分别设定上述候选顺序确定要素的优先级信息的结构的情况下,可以实施优先级变更操作,以便通过进行一次优先级设定菜单调用操作而能进行按照候选汉字、候选单词的顺序对候选顺序确定要素实施优先级变更操作,或者,也可以实施优先级变更操作,以便能进行分别调用候选汉字用优先级设定菜单和候选单词优先级用设定菜单的操作及优先级变更操作。
此外,也可以为:设置设定结束键,对于用户触按设定结束键的时刻之前的内容,变更所需的优先级信息。例如,如果用户在变更候选顺序确定要素的优先级信息的过程中触按了设定结束键,则不反映优先级的变更内容,仅仅反映候选顺序确定要素的变更,等等。
接着,根据图22所示的候选顺序确定部32的各部的判断结果,对图25所示的评价值的计算方法进行详细说明。另外,在以下的说明中,假定按照图26的(a)所示那样设定优先级。
首先,将候选提取部31所提取的候选对象临时保存到提取候选临时存储部51中。在评价值临时存储部52中,对所保存的每一个候选对象,确保用于表示其评价值的16位的区域(图25)。
接着,如果候选对象是学习汉字(单词),则学习时间判断部135对学习时间进行计算并根据评价值计算规则将计算结果保存到位位置0至7(图25);如果候选对象不是学习汉字(单词),则出现频度判断部134对出现频度进行计算并根据评价值计算规则将计算结果保存到位位置0至7(图25)。
所谓出现频度,是指事先通过对大量的报纸、杂志等各种文档字符数据进行统计后求出的每一个字符和单词的出现频度。假定字符和单词的出现频度越高,就越是被经常使用的字符和单词。在本实施方式中,确保了8位的出现频度区域,所以,可根据出现频度并按照评价值计算规则,在0至255之间确定候选对象的评价值。
同样地,关于学习时间,也可以在0至255之间确定候选对象的评价值使得学习时间离当前时刻越近其评价值越高。学习时间是指候选汉字(单词)被学习的时间。以下,具体说明评价值计算规则。例如,设学习时间为X、可学习的最大个数为N、可学习的汉字/单词所学习的时刻为n、当前可学习的时刻为m,则可通过下式求取任意的汉字/单词的学习时间X。
当m-n≥0时,X=N+m-n-1    ……(式1-1);
当m-n<0时,X=n-m-1    ……(式1-2),
其中,关于学习时间X,X的值越小,表示学习时间离当前时刻越远。
另外,如果上式中X的值域超过了作为学习时间评价值所确保的位长度范围(在本实施方式中为8位),那么,在位长度范围内对X的值进行数值转换或者对位长度进行变更即可。
位位置8至12分别保存有要素D、C、F、E、B的判断结果。学习汉字判断部131、拼音长度判断部132、连结度判断部133在判断出候选对象的特性满足了条件时就对所指定的位位置设置“1”,否则,就对所指定的位位置设置“0”。例如,连结度判断部133在判断出候选对象与已输入的前方字符串之间存在关联性时,就对所指定的位位置8设置“1”。
当所有候选对象的显示顺序评价值被算出时,候选顺序确定部32按照评价值临时存储部52中存储的评价值由大到小的顺序对候选对象进行重新排列,并将最终的显示顺序保存到显示顺序临时存储部53中。最后,显示控制部22(图12)根据显示顺序临时存储部53中存储的上述显示顺序,在显示部12对候选对象进行显示。
(实施方式3)
在上述各实施方式中,说明了通过键输入构成拼音的拉丁字母来实现中文输入的结构。但是,本发明的字符转换装置1并不限于此。也可以构成为下述的字符转换装置1,即:操作面板2的输入部11(图12)具备手写字符输入功能,通过输入输出控制部20对手写字符进行识别,从而实现中文输入。
另外,例如,在作为显示一体型图形板的操作面板2的显示区域,显示用于输入手写字符的框,由此可实现上述用于输入手写字符的输入部11(手写字符输入部)。
在字符转换装置1的输入输出控制部20的内部具有字符识别部(字符识别机构)(未图示),用于识别用户在上述字符输入框内手写的字符的手写信息(坐标数据)。记录部40还包括用于与上述字符识别部所识别的输入字符图形匹配的识别辞典(未图示)。并且,显示控制部22对输入字符的识别结果进行输出。
当用户在操作面板2的字符输入框内手写所需的字符时,操作面板2检测出手写字符的坐标信息60(图27)并将其存储到输入输出控制部20的内部缓冲器中。字符识别部对内部缓冲器中存储的坐标信息和识别辞典的辞典图形进行匹配处理(例如,DP匹配),求出输入图形与辞典图形之间的类似度(例如,距离),并将辞典图形所对应的字符代码和类似度关联地存储到内部缓冲器中。当字符识别部对输入图形和识别辞典的各图形进行匹配处理时,按照类似度由高到低的顺序重新排列内部缓冲器的识别结果。然后,将识别结果作为候选汉字(单词)提供给候选提取部31。
以下,具体说明具备手写字符识别功能的字符转换装置1的动作。
当用户在显示一体型图形板的字符输入框内手写“字符2”时(图28的(a)),操作面板2检测出“字符2”的坐标数据并将其存储到内部缓冲器中(图27)。字符识别部对内部缓冲器中存储的“字符2”的坐标数据和识别辞典的各辞典图形进行DP匹配处理,计算出距离并按照距离由近至远的顺序进行重新排列(图29)。输入输出控制部20将识别结果传送给显示控制部22。
显示控制部22根据识别结果来求出n个成为识别字符候选对象的字符(这里为汉字)的显示位置,并由操作面板2的显示部12对显示位置的信息和n个识别字符候选对象进行显示(图28的(b))。操作面板2将所显示的识别字符候选对象与显示位置关联地存储到内部缓冲器中。
用户在确认当前正显示的“字符2”后,指定在操作面板2上的“字符2”。操作面板2检测出所指示的位置并将位置信息传送给输入输出控制部20的候选选择接受部23。然后,在候选选择接受部23中检测出用户已指示了“字符2”,并显示以“字符2”为起首字符的单词(“‘字符2’天”……)(图28的(c))。关于此时的动作,在上述的说明中已有阐述,就不再进行赘述。
由此,即使用户并未掌握与所需汉字对应的拼音也能够输入所需汉字,所以,能够简化用于获取所需汉字的输入操作。
另外,以多功能打印机为例说明了字符转换装置1的用于识别手写字符的上述字符识别部的功能。但是,本发明并不限于此。具备显示一体型触屏的设备均可采用上述字符识别部。所以,在上述多功能打印机之外的设备中也能够实现本发明的字符转换装置,即,可通过输入手写字符实现所需汉字/单词输入的字符转换装置。
(实施方式4)
[繁体字的输入]
在以上的实施方式中,说明了可通过拼音实现中文(简体字)输入的字符转换装置。但是,本发明的字符转换装置1并不限于上述结构。
例如,本发明的字符转换装置1也可以构成为用于输入主要在台湾使用的繁体字的字符转换装置。
以下,在本实施方式中对下述字符转换装置1进行说明,即:接受作为表音字符的注音字符(注音字母)的输入,并将表意字符的繁体字作为候选汉字(单词)提示给用户。
图30是表示本实施方式的字符转换装置1的要部结构的框图。另外,图30中的各结构要素的标号与图12、22中的各结构要素的标号对应,并且,相同的标号表示相同的结构要素。所以,关于上述各实施方式中已说明的结构要素,在本实施方式中不再赘述。
与图12、图22所示的结构相比,不同之处在于:在图30所示的字符转换装置1中,输入部11具备用于输入注音字符的与各注音字符对应的键;输入接受部21具备用于接受上述已输入的注音字符并将其提供给候选提取部31的注音字符输入接受部24;汉字辞典部41包括其中记录有注音字符-注音以及注音-繁体字的对应关系的对应表。
图31是表示本实施方式的、进行注音字符输入处理以输入繁体字时的操作画面的一个示例的图。本实施方式的显示一体型的操作面板2除了显示拉丁字母外,还可以显示注音字符(字符输入区121)。一般而言,繁体字输入是通过输入注音字符而非拉丁字母来实现的。如图31所示,对键盘的键分配注音字符,这样,就能够输入与繁体字对应的注音。
图32是表示在本实施方式中由汉字辞典部41(图30)记录的汉字辞典(繁体字)的示例的图。
图33是表示在本实施方式中由单词辞典部42记录的单词辞典的示例的图。
图34是表示在本实施方式中由连结度记录部46记录的连结度表150a的示例的图。
与中文(简体)输入同样地,根据上述结构,能够实现一种可简化用于获取所需表意字符(主要在台湾地区使用的繁体字)的表音字符(注音字母)输入操作的字符转换装置。
[关于学习功能]
<学习汉字/单词的显示顺序确定方法>
例如,通过下述计算方法对已学习的位次(称之为“学习位次Y”)进行计算,从而确定学习汉字/单词的显示顺序。可由图22所示的学习时间判断部135执行学习位次Y的计算。
Y=学习序号-学习计数-1……(式2)
学习序号表示分配给要新学习的汉字的唯一序号,将该序号作为学习计数与学习汉字一起进行记录,由此,可了解该汉字是何时被学习的。假定图21的学习辞典记录部43(或成对学习辞典记录部44)可记录500个学习汉字(单词),那么,学习序号为0至499即可。
通过上述式2进行计算,如果Y为负值,就对该负值加上学习序号的上限值(这里,为500左右)。
并且,为省去在重新排列候选对象时所需的工作,学习时间判断部135可以对学习位次Y实施修整处理,其中,该学习位次Y是就每一个候选对象计算出的学习位次。例如,可以按照下述步骤对学习位次实施修整处理。
(1)当0≤Y≤9时,Y←Y(保持不变)
(2)当10≤Y≤29时,Y←(Y-10)/2+10
(3)当30≤Y≤109时,Y←(Y-30)/8+20
(4)当Y≥110时,Y←(Y-110)/32+30,进而,当Y>39时,Y←39
如上所述,通过上述式2,能够按照学习顺序或者学习时间距当前时刻由近至远的顺序对学习汉字(单词)有效地重新排列,所以,可根据学习时间来确定作为候选对象的显示顺序。
<学习计数赋予方法>
接着,对图21所示的学习控制部34控制的学习序号(初始值=0)和学习计数(初始值=0)进行更具体的说明。设学习辞典记录部43可记录500个学习汉字,在学习辞典记录部43中的学习汉字的记录位置(地址)的初始值为ID=0。
设学习序号=0,在学习汉字“学”时,学习控制部34从学习辞典记录部43所记录的学习汉字中检索其学习计数与当前的学习序号相等的学习汉字。删除已检索的学习汉字的地址ID的汉字,并设置新的学习汉字。如果不存在其学习计数与当前的学习序号相等的学习汉字,就将学习汉字与学习计数一起记录在ID的位置,然后,对学习序号加1。由于是第一次学习,所以,将学习汉字“学”与学习计数=0一起记录到地址“ID=0”的位置,并对学习序号加1,使得学习序号=1。
反复上述动作。当在学习序号=499的情况下学习汉字“文”时,学习控制部34将学习汉字“文”与学习计数499一起记录到学习辞典记录部43的地址“k”的位置,进行更新使得学习序号=0(如果对学习序号499加1,则学习序号≥500,在这种情况下,减去500,使得学习序号返回到0)。
进而,在新学习汉字(例如“大”)时,学习控制部34以盖写与学习计数0一起记录的“学”的形式对新的学习汉字“大”进行记录。此时,“大”与学习计数0相关联地进行记录。接着,与上述同样地进行更新使得学习序号=2。
<学习辞典的数据结构>
接着,对学习辞典记录部43(以及成对学习辞典记录部44)记录的学习单词的数据结构进行说明。
对于学习辞典记录部43记录的学习单词,分配由构成该学习单词的汉字的字符代码生成的组标识符(GId值),学习单词与GId值关联地进行记录。利用上述GId值,能够提高由学习辞典记录部43检索目标学习单词时的处理效率。
举例说明GId值的生成方法。在以下的说明中,假定用16位表示用于唯一确定汉字的汉字代码和GId值。在本实施方式中,作为一个示例,GId值由表示单词字符数的高阶4位和表示通过汉字代码运算所得到的数值的低阶12位构成,其中,上述汉字代码是构成上述单词的各汉字的代码。但是,在本发明的字符转换装置1中使用的GId值的数据结构并不限于此。
例如,假定单词“上海”已经确定输入。在这种情况下,学习控制部34(图21)首先生成单词“上海”的GId值。为了生成GId值,将构成单词“上海”的各汉字的汉字代码的低阶8位用作为表示各汉字的数值(“上”=“009F(16进位)”、“海”=“00A3(16进位)”)。例如,在将上述汉字代码16位中的低阶8位彼此相加以求取GId值的低阶12位时,学习控制部34计算出9F+A3=“141(16进位)”并将其作为低阶12位。
接着,由于“上海”是由两个字符构成的单词,所以,作为高阶4位,计算出用于表示该单词由两个字符构成的“2(16进位)”。这样,计算出单词“上海”的GId值为“2141(16进位)”。
将上述生成的GId值一律归纳为固定长度(例如,16位),而与单词的构成字符数无关(如上所述,在用4位表示字符数时,设要学习的单词的最大字符数为8)。因此,利用由固定长度构成的GId值,在缩小检索范围后对目标单词进行检索处理,从而能够提高学习单词的检索效率。
[关于操作面板]
由操作面板2显示的字符输入处理时的操作画面并不限于图14或图17的示例。以下,说明由操作面板2显示的操作画面的其他示例。
由操作面板2显示的用于进行拼音输入的拉丁字母键可以如图35所示那样采用与PC键盘类似的键配置,也可以如图36所示那样按照拉丁字母顺序以m×n的键排列使得输入字符与各键对应。
另外,也可以将用于进行候选字符显示的候选字符显示区122与确定字符显示区123重叠在一起进行显示(图37的(a)至(c))。
进而,也可以在候选汉字被选择后,将用于显示以所选择的汉字为起首字符的候选单词的第二候选字符显示区122与候选字符显示区122及确定字符显示区123重叠在一起进行显示(图38的(a)),还可以与候选字符显示区122并列(图38的(b))。
(实施方式5)
以下,根据图1至图11说明本发明的实施方式5。在本实施方式中,说明一种通过输入汉字(转换字符、转换后的字符)读音(表音字符)来确定其中包括汉字的单词的装置,但是,本发明并不限于此。即,下述只是用于实施本发明的一个示例,而实现本发明的方式并不限于此。
图1是表示本实施方式的字符转换装置1的要部结构的框图。字符转换装置1具有:输入部11、辞典检索部310、显示控制部22、汉字辞典部(转换字符辞典)41、单词辞典部(单词辞典)42、临时存储部3、控制部10和显示部12。另外,图1中各结构要素的标号对应于图12、图16、图21、图22、图30中各结构要素的标号,相同的标号表示相同的结构要素。此外,图1中的字符转换装置1可以具有图1未示出的图12、图16、图21、图22、图30中的各部。
输入部11由键盘等构成,可输入用户所需的输入字符串的读音(表音字符)、下述的已选择汉字和已选择单词等。另外,用户可通过输入部11对字符转换装置1输入各种指示。还可以设置兼用作输入部11和显示部12的操作面板2(触屏)。
显示控制部22根据由输入部11输入的读音进行控制使得显示部12以可由用户选择的方式来显示显示辞典检索部310检索到的汉字、单词及其候选对象。显示部12在显示控制部22的控制下对各种数据进行显示。
在本实施方式中,候选提取部31具备辞典检索部310。辞典检索部310通过检索由记录部40所存储的各辞典部(汉字辞典部41和单词辞典部42),从而检测出成为候选对象的汉字(或单词)。在本实施方式中,辞典检索部310还包括汉字获取部(起首字符获取部)311和单词获取部312。
汉字获取部311将输入接受部(接受机构)21所接受的读音字符串作为输入,对汉字辞典部41进行检索并将符合所需条件的汉字(或者,下述的汉字信息)作为检索结果存储到临时存储部3。单词获取部312将汉字获取部311的检索结果和输入接受部21所接受的读音字符串作为输入,对单词辞典部42进行检索并将符合所需条件的单词(或者,下述的单词信息)作为检索结果存储到临时存储部3中。关于汉字获取及单词获取的情况,详见后述。
汉字辞典部41保持有使读音和汉字对应的汉字对应信息144。汉字辞典部41还保持有汉字索引(汉字索引表)145。在该汉字索引145中,读音的起首字符与以该起首字符起首的汉字在汉字对应信息144中的保存目的地地址信息对应。其中,汉字索引145按照汉字的读音顺序进行排列。
单词辞典部42保持有使单词和该单词的读音对应的单词对应信息162。单词辞典部42还保持有单词索引(单词索引表)161。在该单词索引161中,可成为单词首字的起首字符与以该起首字符起首的单词在单词对应信息162中的保存目的地地址信息对应。单词对应信息162和单词索引161根据单词的起首字符进行分组。
此外,在汉字对应信息144中保存有与汉字对应的辅助信息。在单词对应信息162中保存有与单词对应的辅助信息。这些辅助信息,例如,可以举出读音字符数(例如,上述各实施例中的拼音长度(要素B))(检索辅助信息)、出现频度(上述要素A)(显示辅助信息)等。上述辅助信息是在规定的值域内例如1至100的范围内对读音的字符数及出现频度进行转换后所得到的数值。以下,汉字信息是指,汉字以及与该汉字对应的信息(读音、辅助信息)。单词信息是指,单词以及与该单词所对应的信息(读音、辅助信息)。但是,辅助信息并不限于此,也可以是其他信息。例如,可以将上述各实施方式中所述的候选顺序确定要素(要素C至要素G)作为辅助信息,并将其与候选对象(汉字/单词)对应地存储起来。
控制部10对字符转换装置1的各种结构的动作进行整体控制。例如,对于由输入部11输入的字符串的字符数进行计数。另外,对辞典检索部310和显示控制部22进行控制。并且,控制部10具备输入接受部21,该输入接受部21接受用户从输入部11输入的字符串。
接着,根据图2所示的流程图对字符转换装置1的处理动作进行说明。
当用户通过输入部11输入由一个以上字符构成的读音字符串时,输入接受部21将所输入的读音字符串传送到控制部10,其中,上述读音字符串包括用户想通过输入部11输入的字符串的起首字符的读音字符。
控制部10对自输入部11传送来的读音字符串的字符数进行计数,并将读音字符串及其字符数存储到临时存储部3。然后,控制部10指示辞典检索部310进行汉字检索(S101)。
接着,辞典检索部310的汉字获取部311将读音字符串及其字符数由临时存储部3读入辞典检索部310的内部缓冲器(未图示)。汉字获取部311参照汉字索引145,根据读音字符串的起首字符来求出要在汉字对应信息144内检索的检索对象范围的结束位置地址(iNum)并将其保持在内部缓冲器中(S102)。进而,求出要在汉字对应信息144内检索的检索对象范围的开始位置地址(iStart)并将其保持在内部缓冲器中(S103)。
然后,汉字获取部311根据辞典检索部310的内部缓冲器所保持的地址并参照汉字对应信息144读入汉字信息,对汉字对应信息144的读音信息和输入字符串的读音进行比较(S104)。如果输入字符串的读音和汉字对应信息144中的读音一致(在S104中为“是”),则汉字获取部311就将满足读音一致条件的汉字信息存储到临时存储部3中(S105)。
然后,更新iStart(S106)。此后,汉字获取部311对内部缓冲器保持的iNum和在S106更新后的iStart进行比较(S107)。作为比较的结果,关于要检索的汉字,如果iStart大于或等于iNum(在S107中为“否”),就通知控制部10已结束汉字检索。
另外,关于汉字检索的具体说明,详见后述。
当控制部10从辞典检索部310接到汉字检索已结束的通知时,按照规定顺序对临时存储部3中存储的汉字检索结果进行重新排列(S108),并在附加上显示位置的信息后存储到临时存储部3中。显示控制部22进行控制以使显示部12显示汉字检索结果(S109)。另外,在按照上述规定顺序进行重新排列时,可以按照辅助信息中出现频度的顺序进行重新排列,也可以如上述各实施方式所述,由候选顺序确定部32根据候选顺序确定要素(和评价值计算规则)计算出评价值,并根据所计算出的评价值进行重新排列。
接着,确认用户是否已输入指示(S110)。用户对显示部12所显示的汉字检索结果进行观察,选择所需的汉字,并通过输入部11针对该汉字的显示位置来输入指示。当用户输入上述指示时(在S110中为“是”),输入部11将指示位置的位置信息发送给控制部10的输入接受部21。
控制部10对输入接受部21所接受的位置信息和临时存储部3所存储的汉字检索结果的显示位置信息进行比较,从而检测出所输入的汉字(S111)。然后,控制部10将用户所指定的汉字传送给辞典检索部310,并指示其进行单词检索。另外,此时也可以为:候选选择接受部23检测出用户所选择的汉字,且学习控制部将该汉字作为学习汉字存储到学习辞典记录部43或成对学习辞典记录部44中。
当辞典检索部310的单词获取部312接到单词检索指示时,参照单词索引161并根据已获取的汉字的识别信息(字符代码)来求出应该在单词对应信息162内检索的检索对象范围的结束位置地址(iNum)并将其保持在内部缓冲器中(S112)。进而,求出要在单词对应信息162内检索的检索对象范围的开始位置地址(iStart)并将其保持在内部缓冲器中(S113)。
然后,单词获取部312根据辞典检索部310的内部缓冲器所保持的地址并参照单词对应信息162来读入单词信息,将符合规定条件的单词信息存储到临时存储部3中(S114)。
此后,单词获取部312对作为检索对象的单词的iStart进行更新(S114a),并对内部缓冲器所保持的iNum和在S114a中更新后的iStart进行比较(S115)。作为比较后的结果,关于要检索的单词,如果iStart大于或等于iNum(在S115中为“否”),就通知控制部10已结束单词检索。
另外,关于单词检索的具体说明,详见后述的实施例。
当控制部10从辞典检索部310接到单词检索已结束的通知时,按照规定顺序对临时存储部3中存储的单词检索结果进行重新排列(S116),并在附加上显示位置信息后存储到临时存储部3中。而且,显示控制部22进行控制以使得显示部12显示单词检索结果(S117)。另外,在按照上述规定顺序进行重新排列时,可以按照辅助信息中出现频度的顺序进行重新排列,也可以如上述各实施方式所述,由候选顺序确定部32根据候选顺序确定要素(和评价值计算规则)计算出评价值,并根据所计算出的评价值进行重新排列。
而且,用户对显示部12所显示的单词检索结果进行观察,选择所需的单词并针对该单词的显示位置来输入指示。当用户输入指示时,输入部11将所输入的位置的位置信息发送给控制部10的输入接受部21。另外,此时也可以为:候选选择接受部23检测出用户所选择的汉字,学习控制部将该汉字作为学习汉字存储到学习辞典记录部43或成对学习辞典记录部44中。
控制部10对输入接受部21所接受的位置信息和临时存储部3所存储的单词检索结果的显示位置的信息进行比较,并检索由用户所指定的单词。然后,控制部22进行控制以使显示部12显示检索到的单词。
即,根据本发明的字符转换装置,汉字辞典部41和单词辞典部42包括索引、汉字对应信息144及单词对应信息162,同一汉字起首的单词被分成一组;并使汉字对应信息和单词对应信息含有辅助信息,根据辅助信息对成为检索对象的汉字和单词进行限制,因此,能够缩短检索时间。并且,候选顺序确定部32根据检索到的候选对象的辅助信息(候选顺序确定要素)来确定成为上述候选对象的汉字(单词)的显示顺序,使得按照被用户选择的可能性由大到小的顺序对候选汉字(单词)进行显示。所以,能够以更短的时间对已按照用户所需顺序重新排列的候选汉字(单词)进行显示。其结果,能够进一步便于用户的使用。
另外,在下述实施例5-1、5-2中,将上述字符转换装置1作为一种输入拼音(表音字符)并将其转换为汉字(转换字符)的中文转换装置进行说明。在这种情况下,汉字索引145、汉字对应信息144、单词索引161和单词对应信息162构成为下述。
如图3所示,在汉字索引145中,拼音的起首字符(起首的表音字符)与以该拼音的起首字符为汉字起首拼音(表音字符)的汉字在汉字对应信息144中的汉字地址(保存目的地信息)相对应。根据图3所示,汉字索引145左侧的描述(cidx_m1、cidx_m2等)是在汉字索引145内的地址。具体而言,所谓“cidx_m1”是指,“读音的起首字符是m,且为一声”的汉字在汉字索引145内的地址。
如图4所示,在汉字对应信息144中,汉字、该汉字的拼音与辅助信息(在图4中,是检索条件和频度信息)对应。图4所示的汉字对应信息144左侧的描述(cp_m1、cp_m2等)是在汉字对应信息144内的地址。
另外,单词索引161包括图5所示的一次索引(单词一次索引表)161a和图6所示的二次索引(单词二次索引表)161b。如图5所示,在一次索引161a中,汉字、其汉字代码和以该汉字起首的单词在二次索引161b中的地址相对应。在二次索引161b中,起首汉字、第二个汉字的起首拼音和在单词对应信息162中的地址相对应。图6所示的二次索引161b左侧的描述(widx_di、widx_gi等)是在二次索引161b内的地址。
如图7所示,在单词对应信息162中,单词和该单词的拼音对应。图7所示的单词对应信息162左侧的描述(wp_di、wp_gi等)是在单词对应信息162内的地址。另外,在汉字对应信息144中,如果汉字代码和拼音对应,则无需设置一次索引161a。
(实施例5-1)
在本实施例中,将上述字符转换装置1作为一种输入拼音并将该拼音转换为汉字的中文转换装置进行说明。但是,本发明并不限于此,例如,也可以是输入平假名(或片假名)并确定其中包括汉字的单词的装置。
具体而言,对于在已输入作为“字符2”的中文读音的拼音“mei”的情况下要输入“字符1”的情况进行说明。
首先,对汉字检索的处理进行说明。并且,假定输入读音与汉字信息的读音一致的条件是指输入读音与汉字信息的读音前方一致的条件。
[汉字检索]
辞典检索部310的汉字获取部311将读音字符串“mei”由临时存储部3读入辞典检索部310的内部缓冲器中。然后,辞典检索部310根据读音字符的起首字符“m”并通过下式来求出在汉字索引145内“m”范围的地址,并将这些地址记载的汉字地址存储到内部缓冲器中。
按照下述对地址进行确定,即,
<1>输入读音中存在四声代码的情况
起始地址=(输入读音的字符代码-基本读音的字符代码)×汉字索引的单位大小×5+(输入字符的四声代码-1)×汉字索引的单位大小
结束地址=(输入读音的字符代码-基本读音的字符代码)×汉字索引的单位大小×5+输入字符的四声代码×汉字索引的单位大小
<2>输入读音中不存在四声代码的情况
起始地址=(输入读音的字符代码-基本读音的字符代码)×汉字索引的单位大小×5
结束地址=(输入读音的字符代码-基本读音的字符代码+1)×汉字索引的单位大小×5
由于中文的发音是经组合诸如拼音、注音那样表示读音的部分和表示发音升降(节奏)的声调(四声)而形成的,并且,存在5种声调(一至四声和轻声),所以,在确定上述地址时乘以“5”。
在通过拼音进行中文输入时,拼音是由拉丁字母来表达的,所以,将基本读音的字符代码设定为“a(=0x61(ASCII:美国信息交换标准代码))”,另外,在通过注音进行中文输入时,将基本读音的字符代码设定为“ㄅ(=0xa373)”即可。
如果按照拼音的起首字符的拉丁字母顺序并且按照四声中1至5的顺序对同一拼音的起首字符进行排列来形成单词索引(单词索引表)51,那么,汉字索引(汉字索引表)41的单位大小就为汉字地址的字节长度。例如,在本实施例的装置中,上述汉字索引41的单位大小为4字节。
其中,由于不存在四声代码,所以,对于“m(=0x6d)”范围的地址,根据上述式<2>,通过“(0x6d-0x61)×汉字索引的单位大小×5”(即,图3的cidx_m1)来计算起始地址,通过“(0x6d-0x61+1)×汉字索引的单位大小×5”(即,图3的cidx_n1)来计算结束地址,并且,将各地址指示的汉字索引中记述的汉字地址(cp_m1、cp_n1)存储到内部缓冲器中。在图3中,cidx_m1表示读音的起首字符为“m”且声调为1声的汉字在汉字索引145内的地址,与cidx_m1对应的cp_m1表示读音的起首字符为“m”且声调为1声的汉字在汉字对应信息144内的地址。cidx_m5表示读音的起首字符为“m”且声调为轻声的汉字在汉字索引145内的地址,与cidx_m5对应的cp_m5表示读音的起首字符为“m”且声调为轻声的汉字在汉字对应信息144内的地址。
另外,(0x6d-0x61)=12,(0x6d-0x61+1)=13。
辞典检索部310将检索对象的地址cpi设定为cp_m1。接着,辞典检索部310从汉字对应信息144中读入地址cpi的汉字信息,根据输入拼音数对检索条件进行判断。其结果,如果满足检索条件,就对输入读音和汉字信息的读音进行比较,如果输入读音与汉字信息的读音前方一致,就将二者判断为一致并将该汉字信息存储到临时存储部3,且仅更新cpi。
在图4所示的汉字对应信息144的示例中,检索条件为下述,即:
0:无条件地作为检索对象;
1:如果输入拼音数为1,则不作为检索对象;
2:如果输入拼音数少于或等于2个字符,则不作为检索对象;
3:如果输入拼音数少于或等于3个字符,则不作为检索对象;
在输入拼音为“mei”时,由于输入拼音数为3,所以,检索条件与0、1、2对应的汉字成为检索处理的对象。
持续执行上述处理直到cpi与cp_n1相等,如果cpi与cp_n1相等,则根据辅助信息之一的出现频度对临时存储部3中存储的汉字信息进行重新排列,并结束汉字检索处理。
另外,在上述说明中,虽阐述了未输入四声代码的情况,但在输入了附有四声代码的“mei3”时,根据上述式<1>计算“m”的第三声的地址,通过“(0x6d-0x61)×汉字索引的单位大小×5+(3-1)×汉字索引的单位大小”(即,图3的cidx_m3)来计算起始地址,通过“(0x6d-0x61)×汉字索引的单位大小×5+3×汉字索引的单位大小”(即,图3的cidx_m4)来计算结束地址,并且,将各地址指示的汉字索引中记述的汉字地址(cp_m3、cp_m4)存储到内部缓冲器中。
另外,在求出汉字地址后所要执行的处理和上述检索处理相同,因此,省略其说明。
[单词检索]
以下,对单词检索进行说明。具体而言,假定:用户输入“字符1”的中文读音、即拼音“mei”,由临时存储部3保持汉字检索结果,显示控制部22进行控制使显示装置对汉字检索结果进行显示,然后,用户根据所显示的汉字检索结果输入了针对“字符2”的指示。在这种情况下展开对单词检索的说明。
如图5所示,单词辞典部42的一次索引161a按照汉字代码的升序进行存储。
控制部10对用户的指示位置(X1、Y1)和临时存储部3所存储的汉字检索结果的显示位置(xi_min、yi_min、xi_max、yi_max)(i=1~n,n为候选数)进行比较,当xi_min≤X1≤xi_max并且yi_min≤Y1≤yi_max时,判断为已选择第i个候选对象,将所对应的汉字传送给辞典检索部310,并指示其进行单词检索。
当辞典检索部310接到单词检索指示时,检索与所传送的汉字的代码一致的单词索引161,并求取在单词对应信息162中的检索对象范围。具体而言,辞典检索部310在一次索引161a中对所传送的“字符2”进行二分法查找(binary search),并获取与“字符2”一致的汉字代码C3BF。然后,利用与汉字代码C3BF对应的二次索引161b内的地址“widx_mi”,并参照二次索引161b,将“字符2”起首的单词在单词对应信息162中的地址(单词地址)“wp_mi”作为“字符2”起首的单词在单词对应信息162中的起始地址存储到内部缓冲器中。进而,辞典检索部310利用一次索引161a中的接续在上述汉字代码C3BF之后的汉字代码C3C0(图5中的“冒”,以下,称之为“字符6”)的二次索引地址“widx_mi+1”,并参照二次索引161b,将“字符6”起首的单词在单词对应信息162中的地址(单词地址)“wp_mi+1”作为“字符2”起首的单词在单词对应信息162中的结束地址存储到内部缓冲器中。
此后,辞典检索部310的单词获取部312读出“wp_mi”至“wp_mi+1”的单词信息,并将单词信息的汉字串作为检索结果存储到临时存储部3中。然后,候选顺序确定部32按照出现频度由高到低的顺序进行重新排列并结束单词检索处理,其中,上述出现频度是临时存储部3所存储的单词信息(候选单词)的辅助信息(未图示)。另外,上述重新排列情况只是一个示例,还可以通过其他方法进行重新排列。例如,可以根据候选顺序确定要素(要素A至要素G)来确定显示顺序。最后,如上所述,在显示部中按照重新排列后的顺序对检索到的单词进行显示。
(实施例5-2)
在本实施例5-2中,说明在用户输入单词的读音以实现单词输入时的装置的动作。在上述实施例5-1中输入的读音是用户想要输入的字符串的起首字符的读音,而在本实施例5-2中输入的读音是用户想要输入的单词的读音。但是,在本实施例5-2中控制部1 0的输入接受部21对通过输入部11输入的读音字符串进行的接受处理与上述实施例5-1的情况相同。因此,在本实施例中,为输入“字符1”,对用户输入作为“字符1”的中文读音的拼音“meinian”之后的处理情况进行说明。
另外,控制部10具备对输入读音字符串的拼音进行切分的功能。关于对输入读音字符串的拼音进行的切分处理,详见后述。
当控制部10接受通过输入部11输入的读音字符串“meinian”时,对读音字符串进行拼音切分,并将切分数(或者,表示切分位置为2的切分位置数)2作为切分结果存储到临时存储部3,其中,上述切分数2表示在对读音字符串“meinian”进行拼音切分后得到两个读音字符串、即,“mei”和“nian”。
辞典检索部310的汉字获取部311从临时存储部3中读入读音字符串“mei”并将其存储到辞典检索部310的内部缓冲器中。汉字获取部311根据“mei”的起首字符“m”,并利用上述式<2>且参照汉字索引145来求出在“m”范围内的地址,并将该地址所记载的汉字地址存储到内部缓冲器中。
由于在本实施例中也不存在四声代码,所以,通过“(0x6d-0x61)×汉字索引的单位大小×5”(即,图3的cidx_m1)来计算起始地址,通过“(0x6d-0x61+1)×汉字索引的单位大小×5”(即,图3的cidx_n1)来计算结束地址,并参照汉字辞典部41的汉字索引145,将各地址指示的汉字地址(cp_m1、cp_n1)存储到内部缓冲器中。
辞典检索部310的汉字获取部311将检索对象的地址cpi设定为cp_m1。接着,汉字获取部311读入地址cpi的汉字信息,并参照汉字对应信息144,根据输入拼音数对检索条件进行判断。其结果,如果满足检索条件,就对输入读音和汉字信息的读音进行比较。
如果输入读音与汉字信息的读音完全一致,就在临时存储部3中对应地存储用于表示与该汉字信息完全一致的信息(例如,“1”),并更新cpi。
如果输入读音与汉字信息的读音前方一致,就判断为一致,在临时存储部3中对应地存储用于表示与该汉字信息前方一致的信息(例如,“0”),并更新cpi。
如果既不是完全一致,也不是前方一致,就仅更新cpi。
当cpi与cp_n1相等时,候选顺序确定部32按照出现频度对临时存储部3所存储的汉字信息中的完全一致的汉字信息进行重新排列,接着,按照出现频度对前方一致的汉字信息进行重新排列使其候选位次居于完全一致的汉字信息之后,然后,结束汉字检索处理。另外,候选顺序确定部32还可以根据其他辅助信息(例如,候选顺序确定要素(要素A至要素G))来确定显示顺序。
通过对读音字符串“mei”实施上述处理,与“mei”完全一致的汉字信息、即,“字符2”的汉字信息作为检索结果被存储到临时存储部3中。
接着,对单词检索处理进行说明。
假定:用户根据在上述汉字检索处理后所显示的汉字检索候选对象中输入了针对“字符2”的指示。在这种情况下对单词检索处理进行说明。另外,关于用户输入的针对“字符2”的指示的候选对象选择处理,由于其和上述实施例5-1记载的处理相同,所以,省略其说明。
另外,一次索引161a、二次索引161b和单词对应信息162按照汉字代码的升序进行排列。
当辞典检索部310的单词获取部312接到单词检索的指示时,参照单词索引161的一次索引,获取与所传送的汉字的代码一致的第一索引信息。例如,在一次索引中按照单词的起首汉字的汉字代码顺序进行排列,单词获取部312检索与通过二分法查找传送来的汉字的代码一致的第一索引信息,并将与所传送的汉字代码一致的第一索引信息以及在一次索引内排列的下一个汉字代码的第一索引信息存储到内部缓冲器中。
在此,由于用户指定了“字符2”,所以,在一次索引161a中,与汉字代码一致的二次索引地址是widx_mi,下一个汉字代码的二次索引地址是widx_mi+1,widx_mi和widx_mi+1被存储到内部缓冲器中。
辞典检索部310的单词获取部312将切分所得的读音字符串中的第二个字符串及其之后的字符串从临时存储部3读入内部缓冲器。为了利用由第一个切分读音检索到的汉字(起首汉字、第一个汉字)和第二个切分读音的起首拼音字符来缩小单词对应信息162的检索范围,辞典检索部310根据一次索引161a中附带的二次索引161b的地址,由二次索引161b检索与第二个切分读音的起首字符“n”一致的索引信息,并将已检索的二次索引161b以及在二次索引161b内排列的下一个第二索引信息存储到内部缓冲器中。在此,与第一个汉字“字符2”及第二个切分读音的起首字符“n”一致的二次索引信息wp_mi以及在二次索引内排列的下一个二次索引信息wp_mi+k被存储到内部缓冲器中。
辞典检索部310的单词获取部312将检索对象的地址wpi设定为第二索引信息所附带的单词信息的地址wp_mi。读出“wp_mi”至“wp_mi+k”的单词信息。在此,为了将单词对应信息162中的单词信息的读音与单词的各个汉字对应起来,例如,用大写的字符来记载单词的各汉字所对应的读音的起首部分,比如,“字符1”的读音被记载为“MeiNian”。
接着,辞典检索部310的单词获取部312读入地址wpi的单词信息,并参照单词对应信息162对单词对应信息162的汉字个数和输入读音的切分数进行比较。如果单词信息的汉字个数小于等于输入读音的切分数,就从头比较单词信息的各汉字所对应的读音和切分读音,并对读音完全一致的汉字个数以及读音前方一致的汉字个数进行计数。
如果“单词信息的汉字个数”与“读音完全一致的汉字个数+读音前方一致的汉字个数”一致,就将单词信息、读音完全一致的汉字个数和读音前方一致的汉字个数存储到临时存储部3中,并更新wpi。如果“单词信息的汉字个数”与“读音完全一致的汉字个数+读音前方一致的汉字个数”不一致,就更新wpi。
然后,如果wpi<wp_mi+k,就继续进行处理。如果wpi=wp_mi+k,就结束处理。
辞典检索部310按照下述条件对临时存储部3所存储的单词信息赋予位次。
(i)关于读音的切分数与“读音完全一致的汉字个数+读音前方一致的汉字个数”相等的单词信息:
·将“读音完全一致的汉字个数”较多的单词信息列为高阶候选对象。
·对于“读音完全一致的汉字个数”相等的单词信息,按照出现频度来赋予位次。
(ii)关于读音的切分数与“读音完全一致的汉字个数+读音前方一致的汉字个数”不相等的单词信息:
·将“读音完全一致的汉字个数”较多的单词信息列为高阶候选对象。
·对于“读音完全一致的汉字个数”相等的单词信息,按照出现频度赋予位次。
最后,用户根据所显示的检索结果选择所需的字符串,由此进行输入。当用户选择与上述条件(i)对应的检索结果时,进行读音字符串的新输入。当用户选择与上述条件(ii)对应的检索结果时,由于对应于所输入的读音字符串的一部分,所以,可将读音字符串中除了与所选择的字符串对应的读音字符串之外的部分作为控制部10的输入读音,并反复执行上述处理。
在上述说明中,通过单词检索,仅在单词信息的汉字个数与“读音完全一致的汉字个数+读音前方一致的汉字个数”一致时显示单词检索结果。但是,在单词信息的汉字个数比“读音完全一致的汉字个数+读音前方一致的汉字个数”较多时,也可以显示单词检索结果。根据这种结构,在输入所需的单词时,只要输入自起首字符开始的几个字符的读音就能够实现单词输入。
另外,在上述说明中,用户根据所显示的汉字检索结果来选择所需汉字,从而开始进行单词检索。但是,也可以为:在结束汉字检索后并不显示汉字检索结果,而是就候选位次居于第一位的汉字开始单词检索,并在结束单词检索后显示检索结果;或者,在结束汉字检索后并不显示汉字检索结果,而是就一部分候选对象或全部候选对象开始单词检索,并在结束单词检索后显示检索结果。
接着,对输入读音的拼音(n字符)切分处理进行说明。在本发明中,将切分的单位称之为音节。
如下所述地进行切分处理。
(a)将切分位置i设定为1;
(b)将起首字符至第i个字符的部分设定为第1音节,求出由第(i+1)个字符及后续的韵母、声母、(声母+韵母)构成的最长的拼音,并将其设定为第2音节;
(c)保持第1音节长度+第2音节长度作为第i个字符的切分位置的评价值(以下,称之为“位置评价值”);
(d)对切分位置i加1(i=i+1),如果i>n,则处理进入下述的(e),否则,处理返回到上述(b);
(e)根据已作为具有最大位置评价值的切分位置进行处理的切分位置的个数来确定最终切分位置;
(e-1)如果已作为具有最大位置评价值的切分位置进行处理的切分位置的个数为1,就将已作为具有最大位置评价值的切分位置进行处理的切分位置确定为最终切分位置;
(e-2)如果已作为具有最大位置评价值的切分位置进行处理的切分位置的个数为多个,就按照下述顺序将具备高阶条件的切分位置确定为最终的切分位置,即:
(1)仅由一个音节构成;
(2)第1音节和第2音节均为2个字符以上;
(3)第1音节的字符数多于第2音节的字符数。
作为具体示例,以下,对“meini an”的切分处理进行说明。关于输入拼音的一部分或全部是否可构成拼音,将其与拼音辞典所收录的拼音进行比较,如果一致,就认为存在可构成拼音的可能性。如图9所示,拼音辞典收录有可能构成拼音的长度1至7的拼音。
其中,输入拼音是作为拼音输入的字符串,包括下述三种,即:
(1)作为拼音被收录的字符或字符串;
(2)通过组合作为拼音被收录的字符或字符串而成的字符串;
(3)除了上述(1)、(2)之外的字符串(错误输入的情况)。
另外,在本实施方式5中,在进行切分处理时计算的位置评价值是指,在确定用于将输入拼音切分成2个音节的切分位置时,对在该位置实施音节切分的合理性进行数值化处理后所得到的数值。对每一个音节切分位置计算上述位置评价值。由此,上述位置评价值区别于上述实施方式1至4所使用的对每一个候选汉字/候选单词计算的评价值(用于表示候选汉字/候选单词被用户选择的可能性大小的评价值)。
将输入拼音“meinian”的切分位置i设定为1。使用起首字符“m”,并参照图8所示的拼音辞典索引(拼音辞典索引表),读入拼音辞典地址pr_m1和pr_m2,其中,pr_m1表示起首字符为“m”的一字符的拼音辞典地址,pr_m2表示起首字符为“m”的二字符的拼音辞典地址。然后,将其与拼音辞典中pr_m1至pr_m2所存储的拼音进行比较。在这种情况下,因为存在“m”,所以可构成拼音。
接着,将除去“m”后所得的字符串“einian”作为第2音节,读入起首字符为“e”的六字符的拼音辞典地址pr_e6和七字符的拼音辞典地址pr_e7,并与pr_e6至pr_e7所存储的拼音进行比较。如果存在相一致的拼音,则第一个字符的位置评价值就为7。如果不存在相一致的拼音,就从第2音节的字符末尾除去一个字符从而构成新的第2音节,同样地与拼音辞典进行比较,如果存在相一致的拼音,就将该第2音节的长度+第1音节的长度(这里为1)作为切分位置1的位置评价值,如果不存在相一致的拼音,就进一步从该第2音节的字符末尾除去一个字符并与拼音辞典进行比较。在得出位置评价值之前,反复执行上述处理。
当上述处理结束时,将输入拼音“meinian”的切分位置i设定为i=i+1(=2)。根据其中包括起首字符“m”的二字符“me”,与拼音辞典索引表中起首字符为“m”的二字符的拼音辞典地址pr_m2至pr_m3所存储的拼音进行比较。如果存在“me”,就将“me”作为第1音节。接着,将除去“me”后所得的字符串“inian”作为第2音节,同样地,对拼音辞典中是否存在相一致的拼音进行检索。进行起首字符至切分位置7的处理,利用最大位置评价值对切分位置进行评价。在图10中,最大位置评价值是7,最大位置评价值为7的切分位置的个数为1,所以,将最终切分位置确定为3。另外,在图10中,与切分位置3对应的“切分位置数2”表示:在字符串“mainian”中,第一切分位置位于第3字符i与第4字符n之间,第二切分位置位于第7字符n与其后(无字符)之间,所以,基于上述判断,字符串“mainian”有两个切分位置。
接着,对于除去第一切分位置之前的拼音后所得的字符串“nian”,进行与上述同样的处理,求取输入拼音的切分位置。如图11所示,求取字符串“nian”的切分位置,有两个位置评价值为4的切分位置,所以,选择由一个音节构成的“nian”,求出切分位置4。
在除去第二切分位置之前的拼音后,由于已经不存在余下的拼音,所以,校正为输入拼音的自起首位置开始的位置(切分位置3、7),并结束处理。
另外,在上述说明中阐述了对拼音实施的切分处理。同样地,也可通过构成注音表对注音实施上述切分处理。在拼音辞典的检索表中拼音的最大长度为7,所以,由1至7的7个单位构成各拼音的起首字符。另一方面,由于注音的最大长度为4,所以,由1至4的4个单位构成各注音的起首字符即可。
如上所述,根据本发明,同一汉字起首的单词被分成一组,汉字辞典和单词辞典包括用于根据输入拼音对检索对象进行限制的信息。具体而言,汉字辞典包括用于表示是否为与拼音长度对应的检索对象的信息。在单词辞典中,索引信息包括第二个汉字的读音的起首字符,通过对拼音串(汉字n字符串)进行切分,可根据已检索到的第一个汉字以及第二个汉字的起首读音对单词检索对象进行限制。根据这种结构,对符合检索条件的检索对象进行检索,因此,即使词汇量增加,由于对输入字符串和读音信息所进行的比较次数得到限制,所以,能够实现高响应速度的字符串输入装置。在读音输入时,如果输入所需输入汉字的第2个汉字及其之后的读音,就能够进一步缩小检索对象范围,所以,能够提供可进行快速检索处理的字符串转换装置。
并且,对于通过上述检索处理而获得的候选汉字(单词),根据与各候选汉字(单词)对应的辅助信息(或者,候选顺序确定要素),按照用户选择可能性由大到小的顺序进行重新排列使得优先地显示用户选择可能性较大的候选汉字(单词)。所以,可缩短进行候选显示之前的响应时间,并且可按照用户所需的顺序进行候选显示,因此,能够进一步提高用户使用的便利性。
最后,字符转换装置1的各块,特别是候选顺序确定部32、辞典检索部310、显示控制部22和控制部10既可以由硬件逻辑构成,也可以如下所述利用CPU并通过软件来实现。具体而言,记录部40、汉字辞典部41、单词辞典部42、临时存储部3由诸如存储器、硬盘等存储装置来实现;候选顺序确定部32、辞典检索部310、显示控制部22、控制部10由计算机的中央运算装置(CPU)以及被CPU执行的软件来实现。该软件也被存储于存储装置,从存储器中读出并由CPU来执行。
即,字符转换装置1具有:执行用以实现各功能的控制程序的命令的CPU(中央处理器);存储有上述控制程序的ROM(只读存储器);展开上述程序的RAM(随机存取存储器);存储上述程序及各种数据的存储器等的存储装置(记录介质)等。而且,向上述字符转换装置1提供记录介质,该记录介质记录有可由计算机读取的并用于实现上述功能的软件,由其计算机(或CPU、MPU)读出并执行记录介质中记录的软件,这样也能够实现本发明的目的,其中,上述记录介质所记录的软件为上述字符转换装置1的控制程序的程序代码(执行形式程序、中间代码程序、源程序)。
作为上述记录介质,例如,可以是磁带、盒式带等的带类、包括软盘、硬盘等磁盘以及CD-ROM、MO、MD、DVD、CD-R等光盘的盘类、IC卡(包括存储卡)、光卡等的卡类或掩模型ROM、EPROM、EEPROM、闪存ROM等的半导体存储器类。
另外,字符转换装置1可以连接通信网络,借助于通信网络供给上述程序代码。作为上述通信网络,并没有特别的限制,例如,可利用互联网(internet)、内联网(intranet)、外联网(extranet)、LAN、ISDN、VAN、CATV通信网、虚拟专用网络(virtual private network)、电话回线网络、移动通信网络、卫星通信网络等。另外,作为构成通信网络的传送介质,并没有特别的限制,例如,可以利用IEEE1394、USB、电力线、电缆电视回线、电话线、ADSL回线等的有线通信,也可以利用诸如IrDA或遥控器等的红外线、Bluetooth(注册商标)、802.11无线通信、HDR、便携式电话网络、卫星回线、地面数字广播网络(terrestrial digital net)等的无线通信。另外,即使是以电子传送而实现了的、载置于载波的计算机数字信号的方式,也可以实现本发明。
如上所述,本发明的字符转换装置能够将所输入的由一个以上表音字符构成的输入字符串转换成转换字符并确定由该转换字符构成的单词,其包括:转换字符辞典,具有(a-1)转换字符对应信息和(a-2)转换字符索引,在上述转换字符对应信息中,用于识别转换字符的转换字符识别信息与用于表示该转换字符的读音的转换字符读音信息相对应,在上述转换字符索引中,输入的表音字符与表示上述转换字符识别信息在上述转换字符对应信息中的保存目的地的转换字符保存目的地信息相对应,该转换字符识别信息以该表音字符为上述转换字符读音信息的起首表音字符;单词辞典,具有(b-1)单词对应信息和(b-2)单词索引,在上述单词对应信息中,用于识别单词的单词识别信息与表示该单词的读音的单词读音信息相对应,在上述单词索引中,用于识别成为单词起首的起首转换字符的起首转换字符识别信息与用于表示单词在上述单词对应信息中的保存目的地的单词保存目的地信息相对应,该单词以上述起首转换字符识别信息所表示的起首转换字符为起首字符;(c)起首转换字符获取部,根据所输入的上述输入字符串的起首表音字符并参照上述转换字符辞典,获取以该输入字符串的起首表音字符为上述转换字符读音信息的起首字符的转换字符识别信息;以及(d)单词获取部,根据所获取的上述起首转换字符识别信息并参照上述单词辞典,获取以该起首转换字符识别信息所表示的转换字符为起首字符的单词。
另外,在上述结构的基础上,本发明的字符转换装置可以进一步构成为,包括:显示控制部,通过显示部以可由用户选择的方式对上述起首转换字符获取部已获取的起首转换字符识别信息所表示的起首转换字符进行显示;以及接受部,接受上述由用户选择的起首转换字符,其中,上述单词获取部根据上述所选择的起首转换字符的起首转换字符识别信息实施单词获取处理。
根据上述结构,能够根据用户选择的起首转换字符来获取单词,换言之,可在缩小起首转换字符的范围后获取单词。
另外,在上述结构的基础上,本发明的字符转换装置可以进一步构成为:在上述转换字符对应信息中,上述转换字符识别信息还与该转换字符识别信息表示的转换字符的显示辅助信息相对应,上述显示控制部根据上述显示辅助信息对起首转换字符进行重新排列,并通过显示部以可由用户选择的方式进行显示。
根据上述结构,可根据显示辅助信息对起首转换字符进行重新排列后,通过显示部以可由用户选择的方式进行显示。显示辅助信息例如可以是汉字的出现频度信息,也可以是除此之外的信息。只要是显示控制部能够对起首转换字符进行重新排列的信息即可。
另外,在上述结构的基础上,本发明的字符转换装置可以进一步构成为:在上述单词辞典的单词索引中,按照各单词的起首转换字符,对上述起首转换字符识别信息和单词的第二字符的起首表音字符、即第二字符起首表音字符的组合,分配在上述单词对应信息中的保存目的地。
根据上述结构,单词获取部可根据起首转换字符识别信息和单词的第二字符的起首表音字符、即第二字符起首表音字符的组合进行单词检索。因此,可进一步缩小检索范围,从而可实现更为快速的响应。
另外,在上述结构的基础上,本发明的字符转换装置可以进一步构成为:在上述转换字符对应信息中,上述转换字符识别信息还与该转换字符识别信息表示的转换字符的获取辅助信息相对应,上述起首转换字符获取部根据上述获取辅助信息获取上述转换字符识别信息。
根据上述结构,起首转换字符获取部可根据转换字符识别信息表示的转换字符的获取辅助信息来获取转换字符识别信息。获取辅助信息只要是可对起首转换字符获取部使用转换字符辞典进行检索提供辅助的信息即可。例如,起首转换字符的表音字符长度等。
另外,在上述结构的基础上,本发明的字符转换装置可以进一步构成为,上述获取辅助信息分为下述四种信息,即:
(1)转换字符识别信息所表示的转换字符相对于上述输入字符串无条件地成为获取对象的信息;
(2)当上述输入字符串的字符数为1时转换字符识别信息所表示的转换字符不能成为获取对象的信息;
(3)当上述输入字符串的字符数为2以下时转换字符识别信息所表示的转换字符不能成为获取对象的信息;
(4)当上述输入字符串的字符数为3以下时转换字符识别信息所表示的转换字符不能成为获取对象的信息。
根据上述结构,起首转换字符获取部能够快速而有效地获取起首转换字符。
另外,在上述结构的基础上,本发明的字符转换装置可以进一步构成为:在上述单词对应信息中,同一转换字符起首的单词被分成一组。
根据上述结构,单词获取部可对已实施分组的单词进行检索,能够快速而有效地获取单词。
并且,在上述组内,可以按照单词的起首表音字符的规定排列顺序对单词进行排列。
根据上述结构,单词获取部可以在组内检索按照单词的起首表音字符的规定排列顺序进行排列的单词,因此,能够更快速而有效地获取单词。其中,关于上述单词的起首表音字符的规定排列顺序,例如,如果单词的读音是拼音,则为拉丁字母顺序,如果单词的读音是日文假名,则为50音图顺序。
另外,在上述结构的基础上,本发明的字符转换装置可以进一步构成为:上述转换字符是汉字;在上述转换字符对应信息中,汉字的起首表音字符相同且声调代码相同的汉字识别信息被分成一组,其中,该汉字识别信息是上述转换字符识别信息。
根据上述结构,起首转换字符获取部在组内检索所需的起首转换字符即可,因此能够提高响应速度。
另外,可以构成为:在用作中文转换装置的上述字符转换装置的上述转换字符对应信息中,上述汉字识别信息在上述各组内按照汉字的起首表音字符的规定排列顺序进行排列。
由于汉字识别信息按照汉字的起首表音字符的规定排列顺序进行排列,因此,起首转换字符获取部能够更快地获取起首转换字符。
另外,可以构成为:在用作中文转换装置的上述任意的字符转换装置的上述转换字符索引中,上述汉字的起首表音字符为规定排列顺序;用于表示上述各组在上述转换字符对应信息中的保存目的地的信息作为上述转换字符保存信息与上述汉字的起首表音字符相对应。
根据上述结构,在转换字符索引中,汉字的起首表音字符为规定排列顺序,将用于表示上述各组在转换字符对应信息中的保存目的地的信息作为上述转换字符保存信息与汉字的起首表音字符相对应。因此,起首转换字符获取部能够根据组在转换字符对应信息中的保存目的地来缩小组的范围,从而能够以更快的响应速度进行检索。
其中,上述任意一种被用作中文转换装置的字符转换装置可以构成为:上述汉字是简体字并且上述读音由拼音进行表达。
根据上述结构,当用户输入一个以上汉字的拼音串时,可根据拼音串的起首字符缩小起首汉字候选范围并根据候选的起首汉字对检索对象单词进行限制,从而能够缩短辞典检索处理所需的时间。因此可提供一种响应速度较快的中文输入装置。并且可提供这样一种字符转换装置,即:在进行字符串输入时,仅输入起首汉字的拼音,或者,连续地输入第二及其之后的汉字的拼音,二者均能实现所需字符串的输入。另一方面,能够提供这样一种中文输入装置,即:即使在所要输入的字符串的起首汉字的拼音不全的情况下,通过输入第二及其之后的汉字的拼音也能实现所需字符串的输入。
或者,上述任意一种被用作中文转换装置的字符转换装置可以构成为:上述汉字是繁体字并且上述读音由注音进行表达。
根据上述结构,当用户输入一个汉字以上的注音字符串时,可根据注音字符串的起首字符缩小起首汉字候选范围并根据候选的起首汉字对检索对象单词进行限制,从而能够缩短辞典检索处理所需的时间。因此可提供一种响应速度较快的中文输入装置。并且可提供这样一种中文输入装置,即:在进行字符串输入时,仅输入起首汉字的注音字符,或者,连续地输入第二及其之后的汉字的注音字符,二者均能实现所需字符串的输入。另一方面,能够提供这样一种中文输入装置,即:即使在所要输入的字符串的起首字符的拼音不全的情况下,通过输入第二及其之后的汉字的注音也能实现所需字符串的输入。
如上所述,本发明的字符转换装置控制方法是能够将所输入的由一个以上表音字符构成的输入字符串转换成转换字符并确定由该转换字符构成的单词的字符转换装置的控制方法,在该字符转换装置控制方法中,使用转换字符辞典和单词辞典执行包括下述步骤的处理,即:起首转换字符获取步骤,根据所输入的上述输入字符串的起首表音字符并参照上述转换字符辞典,获取以该输入字符串的起首表音字符为上述转换字符读音信息的起首字符的转换字符识别信息;以及单词获取步骤,根据所获取的上述起首转换字符识别信息并参照上述单词辞典,获取以该起首转换字符识别信息所表示的转换字符为起首字符的单词;其中,上述转换字符辞典具有(a-1)转换字符对应信息和(a-2)转换字符索引,在上述转换字符对应信息中,用于识别转换字符的转换字符识别信息与用于表示该转换字符的读音的转换字符读音信息相对应,在上述转换字符索引中,输入的表音字符与表示上述转换字符识别信息在上述转换字符对应信息中的保存目的地的转换字符保存目的地信息相对应,该转换字符识别信息以该表音字符为上述转换字符读音信息的起首表音字符;上述单词辞典具有(b-1)单词对应信息和(b-2)单词索引,在上述单词对应信息中,用于识别单词的单词识别信息与用于表示该单词的读音的单词读音信息相对应,在上述单词索引中,用于识别单词起首字符、即起首转换字符的起首转换字符识别信息与用于表示单词在上述单词对应信息中的保存目的地的单词保存目的地信息相对应,该单词以上述起首转换字符识别信息所表示的起首转换字符为起首字符。
根据上述方法,能够与上述字符转换装置同样地缩短进行单词检索处理所需的时间。
另外,可以由计算机实现本发明的字符转换装置。在这种情况下,使计算机作为上述任意一种字符转换装置的上述各部进行动作从而由计算机实现上述字符转换装置的字符转换程序以及记录有该字符转换程序的计算机可读取记录介质也包括在本发明的范畴内。
根据上述结构,通过使计算机读取并执行字符转换程序,可取得与上述字符转换装置同样的作用效果。
[补充事项]
本发明的字符转换装置将所输入的表音字符或表音字符串转换成所对应的表意字符从而输入由用户选择的表意字符或表意字符串,其特征在于,包括:字符记录部,在上述表音字符与表意字符之间建立关联并进行记录,其中,该表意字符与包含上述表音字符的表音字符串相对应;候选字符提取部,在接受用户输入的表音字符后,从上述字符记录部中提取与该表音字符关联的表意字符作为表意字符的候选字符;候选顺序确定部,按照规定条件来确定上述候选字符提取部所提取的候选字符的显示顺序;以及显示控制部,进行数据输出使得按照上述候选顺序确定部所确定的显示顺序将候选字符进行显示。
根据上述结构,候选字符提取部在接受用户输入的表音字符后,指定其中包含该表音字符的表音字符串。表音字符串与表意字符相对应。字符记录部记录有表音字符与表音字符串之间的对应关系以及表音字符串与表意字符之间的对应关系。所以,候选字符提取部能够根据所接受的由用户输入的表音字符从上述字符记录部中提取用户所要输入的表意字符的候选字符。
接着,候选顺序确定部按照规定条件对上述候选字符提取部所提取的候选表意字符进行重新排列从而确定候选字符的显示顺序,显示控制部输出候选数据,使得按照上述候选顺序确定部所确定的显示顺序将候选表意字符进行显示。
因此,用户只需在所显示的候选表意字符中指定所需的表意字符,就能够实现该表意字符的输入。
通过上述,用户能够以更简便的表音字符输入操作(以更少的输入操作数)实现所需表意字符的输入。
具体而言,例如,假定表音字符是拉丁字母,表意字符是中文汉字。即,拉丁字母字符串表示拼音,一个拼音对应于一个或多个汉字。在上述字符记录部中记录有拉丁字母-拼音之间的对应关系以及拼音-汉字之间的对应关系。
所以,当输入一个拉丁字母时,候选字符提取部就参照字符记录部,指定以该拉丁字母起首的拼音,并提取一个或多个与所指定的拼音对应的汉字作为候选汉字。
作为上述候选汉字所提取的汉字被提示给用户。用户只需在所提示的候选汉字中指定所需的汉字即可。也就是说,用户在输入拉丁字母后无需进行用于选择与该拉丁字母对应的拼音的操作就能够实现所需汉字的输入。
通过上述,能够提供一种可简化用于获取所需表意字符(汉字)的表音字符(拼音)输入操作的字符转换装置。
另外,由于中文的发音具有四声的区别,所以,一个拼音符号对应于四种发音。可以记录上述四声的区分信息和所对应的汉字。例如,在上述字符记录部中设置用于存储四声的区分信息的区域,如果根据用户输入的四声的区分信息进一步缩小对应的汉字范围,上述候选字符提取部就能够有效地进行提取处理。
或者,例如,也可以构成为:表音字符是注音字母,表意字符是中文繁体字。即,表音字符串表示注音,一个注音对应于一个或多个中文繁体字。在上述字符记录部中记录有注音字母-注音之间的对应关系以及注音-中文繁体字之间的对应关系即可。
上述字符转换装置可以进一步包括:字符串记录部,在上述表意字符与表意字符串之间建立关联并进行记录,其中,该表意字符串包含上述表意字符;以及候选字符串提取部,在接受用户选择的表意字符后,从上述字符串记录部中提取与该表意字符关联的表意字符串作为表意字符串的候选字符串。
或者,本发明的字符转换装置将所输入的表音字符或表音字符串转换成所对应的表意字符从而输入由用户选择的表意字符,其特征在于,包括:字符串记录部,在上述表意字符与表意字符串之间建立关联并进行记录,其中,该表意字符串包含上述表意字符;候选字符串提取部,在接受用户选择的表意字符后,从上述字符串记录部中提取与该表意字符关联的表意字符串作为表意字符串的候选字符串;候选顺序确定部,按照规定条件来确定上述候选字符串提取部所提取的候选字符串的显示顺序;以及显示控制部,进行数据输出使得按照上述候选顺序确定部所确定的显示顺序对候选字符串进行显示。
根据上述结构,字符串记录部记录有表意字符(例如,汉字)与包含该表意字符的表意字符串(例如,以该汉字起首的熟语)之间的对应关系。所以,当用户选择了表意字符时,上述候选字符串提取部从上述字符串记录部中提取与该表意字符相关联的表意字符串作为候选字符串。
例如,以中文为例进行说明。在输入某一个汉字后,较之于和已输入汉字没有任何关联的汉字,构成以上述已输入汉字起首的熟语的汉字成为上述已输入汉字的后续汉字(用户所需汉字)的可能性较高。所以,如果将其起首汉字为输入已确定汉字的熟语作为候选熟语进行显示,那么,用户只需从候选熟语中选择所需的熟语就可实现中文输入而无需另行进行拼音输入。
通过上述,用户能够以更简便的表音字符输入操作实现所需表意字符的输入。
进而,上述字符转换装置优选的是,还包括:手写字符输入部,用于输入由用户手写的表意字符;以及字符识别部,用于识别通过上述手写字符输入部输入的表意字符并将该表意字符的信息提供给上述候选字符串提取部。
根据上述结构,即使在不了解与所需表意字符对应的表音字符(串)的情况下,也能够实现所需表意字符的输入。
另外,优选的是:在接受由用户输入的表音字符后,上述字符转换装置的候选字符提取部将连续接受的表音字符串所对应的表意字符作为候选字符进行提取。
根据上述结构,每当用户输入表音字符时,就对要指定的候选表音字符串的数量范围进行限制。因此,候选字符提取部可在大幅度限制所对应的表意字符的候选数量范围后进行提取,显示控制部可将在限制候选数量范围后提取的候选表意字符进行输出。
通过上述,能够提供一种可增大在用户每次输入表音字符时所显示的候选表意字符中含有用户所需表意字符的概率的字符转换装置。其结果,能够提供一种可简化用于获取所需表意字符的表音字符输入操作的字符转换装置。
另外,上述字符转换装置优选的是:上述候选顺序确定部确定显示顺序,使得上述候选字符串提取部所提取的候选表意字符串优先于上述候选字符提取部所提取的候选表意字符进行显示。
根据上述结构,候选顺序确定部确定候选字符/字符串的显示顺序,使得候选字符串提取部从字符串记录部中所提取的候选表意字符串优先于候选字符提取部从字符记录部中所提取的候选表意字符进行显示。
例如,在进行日文或中文的汉字输入时,在输入某一个汉字后,较之于和已输入汉字没有任何关联的汉字,构成以上述已输入汉字起首的熟语(表意字符串)的汉字成为上述已输入汉字的后续汉字(用户所需汉字)的可能性较高。所以,如果将其起首汉字为已确定输入的汉字的熟语作为候选熟语进行显示,那么,较之于对候选汉字(表意字符)进行显示,用户能够以更快更简便的操作实现所需汉字的输入。
另外,上述字符转换装置可以构成为:还包括学习控制部,该学习控制部将用户已选择的表意字符作为学习字符记录在学习词语记录部中;当上述候选字符提取部所提取的候选字符是上述学习词语记录部中记录的学习字符时,上述候选顺序确定部确定显示顺序,使得优先地显示上述候选字符。
或者,上述字符转换装置可以构成为:包括学习控制部,该学习控制部将用户已选择的表意字符串作为学习字符串记录在学习词语记录部中;当上述候选字符串提取部所提取的候选字符串是上述学习词语记录部中记录的学习字符串时,上述候选顺序确定部确定显示顺序,使得优先地显示上述候选字符串。
根据上述结构,学习控制部使学习词语记录部将字符转换装置已输入确定的(用户所需的)表意字符或表意字符串作为学习字符(串)进行记录。
在上述候选提取部从字符(串)记录部中提取候选字符(串)后,候选顺序确定部可将上述所提取的候选字符(串)中与上述学习词语记录部所记录的字符(串)一致者作为学习字符进行判断。候选字符(串)与学习字符一致,意味着过去曾经是用户所需的表意字符(串)。较之于非学习字符的候选字符(串),与学习字符一致的候选字符(串)再次成为用户所需的表意字符(串)的可能性较大。
根据上述,通过将与学习字符一致的候选字符(串)的显示顺序设定为高阶显示顺序,能够提供一种可由用户以更快更简便的操作来输入所需汉字的字符转换装置。
或者,上述字符转换装置可以构成为:还包括学习控制部,该学习控制部将用户所选择的表意字符与前接字符或前接字符串关联并作为成对学习字符记录在学习词语记录部中,该前接字符或前接字符串是在上述表意字符之前前接输入的字符或字符串;当上述候选字符提取部所提取的候选字符是与前接字符或前接字符串关联地记录在上述学习词语记录部中的成对学习字符时,上述候选顺序确定部确定显示顺序,使得优先显示上述候选字符。
或者,上述字符转换装置可以构成为:还包括学习控制部,该学习控制部将用户所选择的表意字符串与前接字符或前接字符串关联并作为成对学习字符串被记录在学习词语记录部中,该前接字符或前接字符串是在上述表意字符串之前前接输入的字符或字符串;当上述候选字符串提取部所提取的候选字符串是与前接字符或前接字符串关联地记录在上述学习词语记录部中的成对学习字符串时,上述候选顺序确定部确定显示顺序,使得优先地显示上述候选字符串。
根据上述结构,学习控制部在将字符转换装置中输入已确定的(用户所需的)表意字符或表意字符串作为学习字符(串)记录到学习词语记录部时,使该学习字符(串)与其前接输入完毕的字符(串)(以下,称之为“前接字符(串)”)关联并作为成对学习字符(串)进行记录。
由过去的输入履历可知:上述成对学习字符(串)曾经作为用户所需的字符(串)紧接在上述与其关联的前接字符(串)之后被连续地输入。所以,当输入上述前接字符(串)时,上述成对学习字符(串)很可能再次成为用户所需的字符(串)。
如果上述候选提取部所提取的候选字符(串)是成对学习字符(串),上述候选顺序确定部就将其显示顺序变更为高阶显示顺序。
根据上述,能够提供一种可由用户以更快更简便的操作(以更少的操作数)输入所需汉字的字符转换装置。
另外,上述字符转换装置优选的是:上述学习控制部生成组标识符并使该组标识符与各学习词语相关联地记录在上述学习词语记录部中,其中,该组标识符用于对作为学习词语的上述学习字符或学习字符串、或者,上述成对学习字符或成对学习字符串进行分类;上述组标识符是根据被预先分配给表意字符的规定长度的字符代码所生成的,该表意字符构成上述学习词语。
根据上述结构,学习控制部对学习词语记录部所记录的学习词语(学习字符或学习字符串;或者,成对学习字符或成对学习字符串)生成并分配用于将该学习词语分成多个组的组标识符。学习控制部利用被预先分配给各表意字符的、根据字符代码所求得的数值来生成上述组标识符,其中,上述各表意字符构成上述学习词语。
关于上述生成的组标识符,无论对什么样的学习词语,都分配固定长度的组标识符。例如,无论是由两个字符构成的熟语,还是由六个字符构成的熟语,都被分配相等长度的组标识符。
上述学习词语记录部所记录的学习词语的数量越多,数据量也就越大。如果上述学习词语为熟语,那么,其字符数越多,数据量也就越大。即,要从上述学习词语记录部中检索符合条件的学习词语以判断候选字符(串)是否为学习词语将花费大量的时间,从而导致降低字符输入的处理效率。
但是,如上所述,如果对各学习字符分配固定长度的组标识符,那么,无论学习词语由多少个字符构成,对输入字符(串)和学习词语是否一致或是否为同组内的字符(串)进行判断所需的时间都是相同的。通过上述,可防止检索时间随学习词语增加而成正比地增加,从而减少对处理效率造成的影响。
另外,上述字符转换装置可以构成为:还包括关联度记录部,该关联度记录部记录用户已选择的表意字符或表意字符串与前方字符或前方字符串之间的关联度状况,其中,该前方字符或前方字符串是在上述已选择的表意字符或表意字符串之前已确定输入的字符或字符串;上述候选顺序确定部确定显示顺序,使得优先显示上述候选字符(串)中与前方字符或前方字符串之间的关联度较高的候选字符(串)。
根据上述结构,候选顺序确定部根据与前方字符(串)之间的关联度状况来确定候选字符(串)的显示顺序。上述关联度状况是指,由上述字符输入确定部输入确定的表意字符或表意字符串与前方字符或前方字符串之间的关联性,该前方字符或前方字符串是在上述表意字符或表意字符串之前已确定输入的字符或字符串。
具体而言,以频繁输入熟语“上海交通大学”为例进行说明。在“交通”之后连续地输入其他熟语例如“规则”的可能性较高。在这种情况下,如果前方存在“上海”一词,候选顺序确定部在考虑“上海”和“大学”之间的关联性的基础上,将“大学”的显示顺序变更为高阶显示顺序。
根据上述,候选顺序确定部在确定候选表意字符(串)的显示顺序时,不仅考虑与前接字符(串)之间的连续性,更要考虑与前方字符(串)之间的关联性,能够按照可进一步反映用户需求的显示顺序对用户提示候选表意字符(串)。
其结果,用户能够以更简便的表音字符输入操作(以更少的输入操作数)实现所需表意字符的输入。
另外,上述字符转换装置优选的是:包括候选顺序确定要素设定部,该候选顺序确定要素设定部对用户所指定的条件进行设定,该用户指定条件是上述候选顺序确定部在确定候选显示顺序时要参照的规定条件;上述候选顺序确定部根据上述候选顺序确定要素设定部设定的条件来确定候选显示顺序。
根据上述结构,上述候选顺序确定部在确定候选显示顺序时,如果有多个要参照的规定条件,就由候选顺序确定要素设定部根据用户指示对根据什么条件确定显示顺序进行设定。
作为上述规定条件,可以举出若干示例。例如,可以考虑上述各种条件,即:(1)候选对象是字符(汉字)还是字符串(熟语);(2)候选对象是否为学习字符;(3)候选对象是否为成对学习字符;(4)曾经何时进行了学习;(5)一般使用的频度;(6)当前作为读音输入的表音字符长度是否与候选对象的表音字符长度一致(例如,以输入日文单词“技術”为例,“ぎじ(两个字符)”和“ぎ じゆつ(四个字符)”的表音字符长度不一致);(7)与前接字符串之间是否具有连续性;(8)与前方字符串之间是否具有关联性;(9)用户使用的频度等。
其中,如果可由用户任意设定在确定候选对象的显示顺序时所依据的条件(或者,所重视的条件),那么,由候选顺序确定部确定的候选对象的显示顺序就能够更准确地反映用户的需求。
其结果,用户能够以更简便的表音字符输入操作(以更少的输入操作数)实现所需表意字符的输入。
本发明的复印机的特征在于,包括:上述字符转换装置;第1输入部,具备与各表音字符对应的键,将用户触按的键所对应的表音字符提供给上述字符转换装置;第2输入部,将用户选择的候选对象输入上述字符转换装置;以及显示部,按照上述候选顺序确定部确定的显示顺序对上述候选字符提取部或上述候选字符串提取部所提取的候选对象进行显示,其中,上述第1输入部及第2输入部和上述显示部是彼此形成为一体的触屏或图形板。
由此,根据本发明的具备图形板的复印机,用户能够以更简便的输入操作实现所需表意字符的输入,其中,上述图形板包括形成为一体的第1输入部及第2输入部和显示部,上述第1输入部用于将用户选择的表音字符输入上述字符转换装置,上述第2输入部用于将用户选择的表意字符输入上述字符转换装置,上述显示部用于向用户提示作为候选对象的表意字符(串)。
上述复印机优选的是,还包括:手写字符输入部,用于输入由用户手写的表意字符;以及字符识别部,用于识别由上述手写字符输入部输入的表意字符并将该表意字符的信息提供给上述字符转换装置。
根据上述结构,能够实现这样一种复印机,即:即使在不了解与所需表意字符对应的表音字符(串)的情况下,也能够实现所需表意字符的输入。
本发明的字符输入方法是一种字符转换装置的字符输入方法,该字符转换装置将所输入的表音字符或表音字符串转换成所对应的表意字符从而实现用户选择的表意字符或表意字符串的输入,其特征在于,包括:第1步骤,在接受用户输入的表音字符后,从字符记录部中提取与该表音字符关联的表意字符作为候选表意字符,其中,该表音字符与包含该表音字符的表音字符串所对应的表意字符关联地记录在上述字符记录部中;第2步骤,按照规定条件确定在上述第1步骤中所提取的候选对象的显示顺序;以及第3步骤,进行数据输出使得按照在上述第2步骤中所确定的显示顺序对候选对象进行显示。
根据上述方法,在第1步骤中,提取与其中包含用户已输入的表音字符的表音字符串对应的候选表意字符;在第2步骤中,确定所提取的候选表意字符的显示顺序。其中,上述显示顺序例如根据上述规定条件进行确定即可。然后,在第3步骤中,按照所确定的显示顺序输出候选表意字符。
因此,当用户在上述候选表意字符中指定所需的表意字符时,其指定的表意字符的输入就被确定。
通过上述,能够提供一种可简化表音字符(拼音)输入操作的用于获取所需表意字符(汉字)的字符转换装置。
另外,可以由计算机实现上述字符转换装置和复印机。在这种情况下,使计算机作为上述各部进行动作从而由计算机实现上述字符转换装置或复印机的控制程序以及记录有该控制程序的计算机可读取记录介质也包括在本发明的范畴内。
[补充事项2]
本发明的字符转换装置将所输入的表音字符或表音字符串转换成所对应的表意字符并输入用户选择的表意字符或表意字符串,其特征在于,包括:字符记录部,在上述表音字符与表意字符之间建立关联并进行记录,其中,该表意字符与包含上述表音字符的表音字符串相对应;候选字符提取部,在接受用户输入的表音字符后,从上述字符记录部中提取与该表音字符关联的表意字符作为表意字符的候选对象;候选顺序确定部,确定上述候选字符提取部所提取的候选对象的显示顺序;以及显示控制部,进行数据输出,使得按照上述候选顺序确定部所确定的显示顺序对候选对象进行显示;曾经输入过的表意字符或表意字符串与在其前接字符或前接字符串的前方输入过的前方字符或前方字符串相对应,用于表示在上述前方字符或前方字符串的后方输入上述表意字符或表意字符串的可能性大小的关联度被存储在关联度记录部中;上述候选顺序确定部从上述关联度记录部中检出在上述候选对象前方输入的前方字符或前方字符串与各候选对象之间的关联度并确定显示顺序,使得优先显示关联度较高的候选对象。
或者,本发明的字符转换装置将所输入的表音字符或表音字符串转换成所对应的表意字符并输入用户选择的表意字符,其特征在于,包括:字符串记录部,在上述表意字符与包含该表意字符的表意字符串之间建立关联并进行记录;候选字符串提取部,在接受用户选择的表意字符后,从上述字符串记录部中提取与该表意字符关联的表意字符串作为表意字符串的候选对象;候选顺序确定部,确定上述候选字符串提取部所提取的候选对象的显示顺序;以及显示控制部,进行数据输出,使得按照上述候选顺序确定部所确定的显示顺序对候选对象进行显示;曾经输入过的表意字符或表意字符串与在其前接字符或前接字符串的前方输入过的前方字符或前方字符串相对应,用于表示在上述前方字符或前方字符串的后方输入上述表意字符或表意字符串的可能性大小的关联度被存储在关联度记录部中;上述候选顺序确定部从上述关联度记录部中检出在上述候选对象前方输入的前方字符或前方字符串与各候选对象之间的关联度并确定显示顺序,使得优先显示关联度较高的候选对象。
由此,用户能够以更简便的表音字符输入操作(以更少的输入操作数)实现所需表意字符的输入。
另外,优选的是,曾经输入过的表意字符或表意字符串和在其之前并与其连续地输入过的前接字符或前接字符串相对应,用于表示在上述前接字符或前接字符串之后并与其连续地输入上述表意字符或表意字符串的可能性大小的连续度被存储在连续度记录部中;上述候选顺序确定部确定显示顺序,使得优先显示与上述前方字符或前方字符串之间的关联度较高以及与上述前接字符或前接字符串之间的连续度较高的候选对象。
另外,上述字符转换装置优选的是:在每次接受由用户输入的表音字符后,候选字符提取部在已接受的表音字符串的末尾连接上述表音字符而形成别的表音字符串并提取与该表音字符串相对应的表意字符作为候选对象。
另外,上述字符转换装置优选的是:上述学习控制部生成组标识符并将其与各学习词语关联地记录在上述学习词语记录部中,该组标识符用于对作为上述学习词语记录部的记录对象即学习词语的上述学习字符或学习字符串、或者,上述成对学习字符或成对学习字符串进行分类;上述组标识符是根据被预先分配给表意字符的规定长度的字符代码所生成的,其中,上述表意字符构成上述学习词语。
另外,上述字符转换装置优选的是:包括候选顺序确定要素设定部,该候选顺序确定要素设定部在可用于计算评价值的多种要素中对用户指定的要素进行设定,该用户指定的要素是上述候选顺序确定部在确定候选对象的显示顺序时要参照的规定条件,上述评价值表示上述候选对象被用户选择的可能性大小的值;不同于上述关联度的要素与上述各候选对象对应地存储在要素记录部中;上述候选顺序确定部根据上述关联度以及由上述候选顺序确定要素设定部设定的被存储在上述要素记录部中的要素来确定候选对象的显示顺序。
本发明的字符输入方法是用于字符转换装置的字符输入的方法,将所输入的表音字符或表音字符串转换成所对应的表意字符并输入用户选择的表意字符或表意字符串,该字符转换装置具有候选字符提取部、候选顺序确定部和显示控制部,该字符输入方法包括:第1步骤,在接受用户输入的表音字符后,上述候选字符提取部从字符记录部中提取与该表音字符关联的表意字符作为表意字符的候选对象,其中,上述表音字符与包含该表音字符的表音字符串所对应的表意字符被关联地记录在上述字符记录部中;第2步骤,上述候选顺序确定部确定在上述第1步骤中所提取的候选对象的显示顺序;以及第3步骤,上述显示控制部进行数据输出,使得按照在上述第2步骤中所确定的显示顺序对候选对象进行显示;其中,上述第2步骤包括使得曾经输入过的表意字符或表意字符串与在其前接字符或前接字符串的前方输入过的前方字符或前方字符串相对应,并从存储有关联度的关联度记录部中检出在上述候选对象前方输入的前方字符或前方字符串与各候选对象之间的关联度,并确定显示顺序使得优先显示关联度较高的候选对象的步骤,该关联度表示在上述前方字符或前方字符串的后方输入上述表意字符或表意字符串的可能性大小。
通过上述,能够提供一种可简化用于获取所需表意字符(汉字)的表音字符(拼音)输入操作的字符转换装置。
本发明的字符输入方法是用于字符转换装置的字符输入的方法,将所输入的表音字符或表音字符串转换成所对应的表意字符并输入用户选择的表意字符或表意字符串,该字符转换装置具有候选字符提取部、候选顺序确定部和显示控制部,该字符输入方法包括:第1步骤,在接受用户选择的表意字符后,上述候选字符提取部从字符串记录部中提取与该表意字符关联的表意字符串作为表意字符串的候选对象,其中,上述表意字符与包含该表意字符的表意字符串被关联地记录在上述字符串记录部中;第2步骤,上述候选顺序确定部确定在上述第1步骤中所提取的候选对象的显示顺序;以及第3步骤,上述显示控制部进行数据输出使得按照在上述第2步骤中所确定的显示顺序对候选对象进行显示;其中,上述第2步骤包括使得曾经输入过的表意字符或表意字符串与在其前接字符或前接字符串的前方输入过的前方字符或前方字符串相对应,并从存储有关联度的关联度记录部中检出在上述候选对象前方输入的前方字符或前方字符串与各候选对象之间的关联度,并确定显示顺序使得优先显示关联度较高的候选对象的步骤,该关联度表示在上述前方字符或前方字符串的后方输入上述表意字符或表意字符串的可能性大小。
本发明并不限于上述各实施方式、实施例,可在权利要求范围内进行各种变更。即,通过组合在技术方案范围内适当变更的技术方法所获得的实施方式也属于本发明的技术范围。
工业可利用性
本发明可适用于对读音(表音字符)进行转换特别是将读音转换为汉字的各种装置。
权利要求书(按照条约第19条的修改)
1.一种字符转换装置,能够将所输入的由一个以上表音字符构成的输入字符串转换成转换字符并确定由该转换字符构成的单词,其特征在于,包括:
转换字符辞典,具有转换字符对应信息和转换字符索引,在上述转换字符对应信息中,用于识别转换字符的转换字符识别信息与用于表示该转换字符的表音的转换字符表音信息相对应,在上述转换字符索引中,输入的表音字符与表示上述转换字符识别信息在上述转换字符对应信息中的保存目的地的转换字符保存目的地信息相对应,该转换字符识别信息以该表音字符作为上述转换字符表音信息的起首表音字符;
单词辞典,具有单词对应信息和单词索引,在上述单词对应信息中,用于识别单词的单词识别信息与用于表示该单词的表音的单词表音信息相对应,在上述单词索引中,用于识别成为单词起首的起首转换字符的起首转换字符识别信息与用于表示单词在上述单词对应信息中的保存目的地的单词保存目的地信息相对应,该单词以上述起首转换字符识别信息所表示的起首转换字符作为起首字符;
起首转换字符获取部,根据所输入的上述输入字符串的起首表音字符并参照上述转换字符辞典,获取以该输入字符串的起首表音字符作为上述转换字符表音信息的起首字符的转换字符识别信息;以及
单词获取部,根据所获取的上述起首转换字符识别信息并参照上述单词辞典,获取以该起首转换字符识别信息所表示的转换字符为起首字符的单词。
2.根据权利要求1所述的字符转换装置,其特征在于,包括:
显示控制部,在显示部以可由用户选择的方式对上述起首转换字符获取部已获取的起首转换字符识别信息所表示的起首转换字符进行显示;以及
接受部,接受上述由用户选择的起首转换字符,
上述单词获取部根据上述所选择的起首转换字符的起首转换字符识别信息来实施获取单词的处理。
3.根据权利要求2所述的字符转换装置,其特征在于:
在上述转换字符对应信息中,上述转换字符识别信息还与该转换字符识别信息所表示的转换字符的显示辅助信息相对应;
上述显示控制部根据上述显示辅助信息对起首转换字符进行重新排列,并在显示部以可由用户选择的方式进行显示。
4.根据权利要求1至3中的任意一项所述的字符转换装置,其特征在于:
上述单词辞典的单词索引,对上述起首转换字符识别信息与单词的第二字符的起首表音字符、即第二字符起首表音字符的组合,按照成为单词的起首的每一个起首转换字符分配在上述单词对应信息中的保存目的地。
5.根据权利要求1至4中的任意一项所述的字符转换装置,其特征在于:
在上述转换字符对应信息中,上述转换字符识别信息还与该转换字符识别信息所表示的转换字符的获取辅助信息相对应,
上述起首转换字符获取部根据上述获取辅助信息来获取上述转换字符识别信息。
6.根据权利要求5所述的字符转换装置,其特征在于,上述获取辅助信息被分类为:
(1)转换字符识别信息所表示的转换字符相对于上述输入字符串无条件地成为获取对象的信息;
(2)当上述输入字符串的字符数为1时转换字符识别信息所表示的转换字符不能成为获取对象的信息;
(3)当上述输入字符串的字符数为2以下时转换字符识别信息所表示的转换字符不能成为获取对象的信息;以及
(4)当上述输入字符串的字符数为3以下时转换字符识别信息所表示的转换字符不能成为获取对象的信息。
7.根据权利要求1至6中的任意一项所述的字符转换装置,其特征在于:
在上述单词对应信息中,起首的转换字符相同的单词被分成一组。
8.根据权利要求7所述的字符转换装置,其特征在于:
在各上述组内,还按照单词的起首的表音字符的规定排列顺序对单词进行排列。
9.根据权利要求1至8中的任意一项所述的字符转换装置,其特征在于:
被用作中文转换装置,
上述转换字符是汉字,
在上述转换字符对应信息中,汉字的起首的表音字符相同且声调代码相同的汉字识别信息被分成一组,其中,该汉字识别信息是上述转换字符识别信息。
10.根据权利要求9所述的字符转换装置,其特征在于:
在上述转换字符对应信息中,上述汉字识别信息在各上述组内按照汉字的起首的表音字符的规定排列顺序进行排列。
11.根据权利要求9或10所述的字符转换装置,其特征在于:
在上述转换字符索引中,上述汉字的起首的表音字符成为规定排列顺序,
将表示各上述组在上述转换字符对应信息中的保存目的地的信息作为上述转换字符保存信息与上述汉字的起首表音字符建立对应。
12.根据权利要求9至11中的任意一项所述的字符转换装置,其特征在于:
被用作上述汉字是简体字并且上述表音以拼音进行表达的中文转换装置。
13.根据权利要求9至11中的任意一项所述的字符转换装置,其特征在于:
被用作上述汉字是繁体字并且上述表音以注音进行表达的中文转换装置。
14.一种字符转换装置的控制方法,其能够将所输入的由一个以上表音字符构成的输入字符串转换成转换字符并确定由该转换字符构成的单词,其特征在于,
使用转换字符辞典和单词辞典执行包括起首转换字符获取步骤和单词获取步骤的处理,其中,
上述转换字符辞典具有转换字符对应信息和转换字符索引,在上述转换字符对应信息中,用于识别转换字符的转换字符识别信息与用于表示该转换字符的表音的转换字符表音信息相对应,在上述转换字符索引中,输入的表音字符与表示上述转换字符识别信息在上述转换字符对应信息中的保存目的地的转换字符保存目的地信息相对应,该转换字符识别信息以该表音字符作为上述转换字符表音信息的起首表音字符;
上述单词辞典具有单词对应信息和单词索引,在上述单词对应信息中,用于识别单词的单词识别信息与用于表示该单词的表音的单词表音信息相对应,在上述单词索引中,用于识别成为单词起首的起首转换字符的起首转换字符识别信息与用于表示单词在上述单词对应信息中的保存目的地的单词保存目的地信息相对应,该单词以上述起首转换字符识别信息所表示的起首转换字符为起首字符;
在上述起首转换字符获取步骤中,根据所输入的上述输入字符串的起首的表音字符并参照上述转换字符辞典,获取以该输入字符串的起首的表音字符为上述转换字符表音信息的起首字符的转换字符识别信息;
在上述单词获取步骤中,根据所获取的上述起首转换字符识别信息并参照上述单词辞典,获取以该起首转换字符识别信息所表示的转换字符为起首字符的单词。
15.(修改后)一种字符转换程序,其特征在于:
用于使计算机作为权利要求1至13、17至22中的任意一项所述的字符转换装置的上述各部发挥作用。
16.一种计算机可读取的记录介质,其特征在于:
记录了权利要求15所述的控制程序。
17.(增加)根据权利要求1所述的字符转换装置,其特征在于:
上述转换字符识别信息与该转换字符识别信息所表示的转换字符的显示辅助信息相对应,
包括:顺序确定部,根据上述显示辅助信息来确定由起首转换字符识别信息表示的起首转换字符的显示顺序,其中,上述起首转换字符识别信息是上述起首转换字符获取部已获取的起首转换字符识别信息;以及显示控制部,按照上述顺序确定部所确定的显示顺序在显示部以可由用户选择的方式对上述起首转换字符进行显示。
18.(增加)根据权利要求17所述的字符转换装置,其特征在于:
包括学习控制部,其将用户已选择的上述起首转换字符作为学习字符记录在学习词语记录部中,
上述顺序确定部根据显示辅助信息来判断上述起首转换字符获取部已获取的起首转换字符是否为学习字符,并确定显示顺序使得作为学习字符的上述起首转换字符优先于其他起首转换字符进行显示,其中,上述显示辅助信息表示起首转换字符是否为上述学习词语记录部中记录的学习字符。
19.(增加)根据权利要求18所述的字符转换装置,其特征在于:
学习时间作为上述显示辅助信息与各起首转换字符相对应地存储在上述学习词语记录部中,其中,上述学习时间表示上述起首转换字符作为学习字符被上述学习控制部记录的时间,
上述顺序确定部确定显示顺序,使得按照上述学习时间由近至远的顺序对起首转换字符进行显示。
20.(增加)根据权利要求1所述的字符转换装置,其特征在于,
上述单词识别信息与该单词识别信息所表示的单词的显示辅助信息相对应,
包括:顺序确定部,根据上述显示辅助信息来确定上述单词获取部所获取的单词的显示顺序;以及显示控制部,按照上述顺序确定部所确定的显示顺序在显示部以可由用户选择的方式对上述单词进行显示。
21.(增加)根据权利要求20所述的字符转换装置,其特征在于,
包括学习控制部,其将用户已选择的上述单词作为学习单词记录在学习词语记录部中,
上述顺序确定部根据显示辅助信息来判断上述单词获取部已获取的单词是否为学习单词,并确定显示顺序使得作为学习单词的上述单词优先于其他单词进行显示,其中,上述显示辅助信息表示单词是否为上述学习词语记录部中记录的学习单词。
22.(增加)根据权利要求2 1所述的字符转换装置,其特征在于,
学习时间作为上述显示辅助信息与各单词相对应地存储在上述学习词语记录部中,其中,上述学习时间表示上述单词作为学习单词被上述学习控制部记录的时间,
上述顺序确定部确定显示顺序,使得按照上述学习时间由近至远的顺序对单词进行显示。

Claims (16)

1.一种字符转换装置,能够将所输入的由一个以上表音字符构成的输入字符串转换成转换字符并确定由该转换字符构成的单词,其特征在于,包括:
转换字符辞典,具有转换字符对应信息和转换字符索引,在上述转换字符对应信息中,用于识别转换字符的转换字符识别信息与用于表示该转换字符的表音的转换字符表音信息相对应,在上述转换字符索引中,输入的表音字符与表示上述转换字符识别信息在上述转换字符对应信息中的保存目的地的转换字符保存目的地信息相对应,该转换字符识别信息以该表音字符作为上述转换字符表音信息的起首表音字符;
单词辞典,具有单词对应信息和单词索引,在上述单词对应信息中,用于识别单词的单词识别信息与用于表示该单词的表音的单词表音信息相对应,在上述单词索引中,用于识别成为单词起首的起首转换字符的起首转换字符识别信息与用于表示单词在上述单词对应信息中的保存目的地的单词保存目的地信息相对应,该单词以上述起首转换字符识别信息所表示的起首转换字符作为起首字符;
起首转换字符获取部,根据所输入的上述输入字符串的起首表音字符并参照上述转换字符辞典,获取以该输入字符串的起首表音字符作为上述转换字符表音信息的起首字符的转换字符识别信息;以及
单词获取部,根据所获取的上述起首转换字符识别信息并参照上述单词辞典,获取以该起首转换字符识别信息所表示的转换字符为起首字符的单词。
2.根据权利要求1所述的字符转换装置,其特征在于,包括:
显示控制部,在显示部以可由用户选择的方式对上述起首转换字符获取部已获取的起首转换字符识别信息所表示的起首转换字符进行显示;以及
接受部,接受上述由用户选择的起首转换字符,
上述单词获取部根据上述所选择的起首转换字符的起首转换字符识别信息来实施获取单词的处理。
3.根据权利要求2所述的字符转换装置,其特征在于:
在上述转换字符对应信息中,上述转换字符识别信息还与该转换字符识别信息所表示的转换字符的显示辅助信息相对应;
上述显示控制部根据上述显示辅助信息对起首转换字符进行重新排列,并在显示部以可由用户选择的方式进行显示。
4.根据权利要求1至3中的任意一项所述的字符转换装置,其特征在于:
上述单词辞典的单词索引,对上述起首转换字符识别信息与单词的第二字符的起首表音字符、即第二字符起首表音字符的组合,按照成为单词的起首的每一个起首转换字符分配在上述单词对应信息中的保存目的地。
5.根据权利要求1至4中的任意一项所述的字符转换装置,其特征在于:
在上述转换字符对应信息中,上述转换字符识别信息还与该转换字符识别信息所表示的转换字符的获取辅助信息相对应,
上述起首转换字符获取部根据上述获取辅助信息来获取上述转换字符识别信息。
6.根据权利要求5所述的字符转换装置,其特征在于,上述获取辅助信息被分类为:
(1)转换字符识别信息所表示的转换字符相对于上述输入字符串无条件地成为获取对象的信息;
(2)当上述输入字符串的字符数为1时转换字符识别信息所表示的转换字符不能成为获取对象的信息;
(3)当上述输入字符串的字符数为2以下时转换字符识别信息所表示的转换字符不能成为获取对象的信息;以及(4)当上述输入字符串的字符数为3以下时转换字符识别信息所表示的转换字符不能成为获取对象的信息。
7.根据权利要求1至6中的任意一项所述的字符转换装置,其特征在于:
在上述单词对应信息中,起首的转换字符相同的单词被分成一组。
8.根据权利要求7所述的字符转换装置,其特征在于:
在各上述组内,还按照单词的起首的表音字符的规定排列顺序对单词进行排列。
9.根据权利要求1至8中的任意一项所述的字符转换装置,其特征在于:
被用作中文转换装置,
上述转换字符是汉字,
在上述转换字符对应信息中,汉字的起首的表音字符相同且声调代码相同的汉字识别信息被分成一组,其中,该汉字识别信息是上述转换字符识别信息。
10.根据权利要求9所述的字符转换装置,其特征在于:
在上述转换字符对应信息中,上述汉字识别信息在各上述组内按照汉字的起首的表音字符的规定排列顺序进行排列。
11.根据权利要求9或10所述的字符转换装置,其特征在于:
在上述转换字符索引中,上述汉字的起首的表音字符成为规定排列顺序,
将表示各上述组在上述转换字符对应信息中的保存目的地的信息作为上述转换字符保存信息与上述汉字的起首表音字符建立对应。
12.根据权利要求9至11中的任意一项所述的字符转换装置,其特征在于:
被用作上述汉字是简体字并且上述表音以拼音进行表达的中文转换装置。
13.根据权利要求9至11中的任意一项所述的字符转换装置,其特征在于:
被用作上述汉字是繁体字并且上述表音以注音进行表达的中文转换装置。
14.一种字符转换装置的控制方法,其能够将所输入的由一个以上表音字符构成的输入字符串转换成转换字符并确定由该转换字符构成的单词,其特征在于,
使用转换字符辞典和单词辞典执行包括起首转换字符获取步骤和单词获取步骤的处理,其中,
上述转换字符辞典具有转换字符对应信息和转换字符索引,在上述转换字符对应信息中,用于识别转换字符的转换字符识别信息与用于表示该转换字符的表音的转换字符表音信息相对应,在上述转换字符索引中,输入的表音字符与表示上述转换字符识别信息在上述转换字符对应信息中的保存目的地的转换字符保存目的地信息相对应,该转换字符识别信息以该表音字符作为上述转换字符表音信息的起首表音字符;
上述单词辞典具有单词对应信息和单词索引,在上述单词对应信息中,用于识别单词的单词识别信息与用于表示该单词的表音的单词表音信息相对应,在上述单词索引中,用于识别成为单词起首的起首转换字符的起首转换字符识别信息与用于表示单词在上述单词对应信息中的保存目的地的单词保存目的地信息相对应,该单词以上述起首转换字符识别信息所表示的起首转换字符为起首字符;
在上述起首转换字符获取步骤中,根据所输入的上述输入字符串的起首的表音字符并参照上述转换字符辞典,获取以该输入字符串的起首的表音字符为上述转换字符表音信息的起首字符的转换字符识别信息;
在上述单词获取步骤中,根据所获取的上述起首转换字符识别信息并参照上述单词辞典,获取以该起首转换字符识别信息所表示的转换字符为起首字符的单词。
15.一种字符转换程序,其特征在于:
用于使计算机作为权利要求1至13中的任意一项所述的字符转换装置的上述各部发挥作用。
16.一种计算机可读取的记录介质,其特征在于:
记录了权利要求15所述的控制程序。
CNA2007800376037A 2006-08-10 2007-07-18 字符转换装置和字符转换装置控制方法 Pending CN101553810A (zh)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
JP2006218970 2006-08-10
JP218970/2006 2006-08-10

Publications (1)

Publication Number Publication Date
CN101553810A true CN101553810A (zh) 2009-10-07

Family

ID=39032808

Family Applications (1)

Application Number Title Priority Date Filing Date
CNA2007800376037A Pending CN101553810A (zh) 2006-08-10 2007-07-18 字符转换装置和字符转换装置控制方法

Country Status (3)

Country Link
JP (1) JP4890551B2 (zh)
CN (1) CN101553810A (zh)
WO (1) WO2008018274A1 (zh)

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN105404677A (zh) * 2015-11-20 2016-03-16 四川神琥科技有限公司 一种基于树形结构的检索方法
CN105426490A (zh) * 2015-11-20 2016-03-23 四川神琥科技有限公司 一种基于树形结构的索引方法
CN106663020A (zh) * 2014-08-29 2017-05-10 日立公共***有限公司 迁移支持装置

Families Citing this family (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US9195645B2 (en) * 2012-07-30 2015-11-24 Microsoft Technology Licensing, Llc Generating string predictions using contexts
JP7446943B2 (ja) * 2020-08-18 2024-03-11 株式会社日立製作所 情報表現作成支援装置、情報表現作成支援方法およびコンピュータプログラム
JP2022041314A (ja) * 2020-08-31 2022-03-11 株式会社リコー 表示装置、入力方法、プログラム

Family Cites Families (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH0388662A (ja) * 1989-08-31 1991-04-15 Toshiba Seiki Kk フォーム接続装置
JP2502409B2 (ja) * 1990-12-26 1996-05-29 三菱電機株式会社 ピン音漢字入力方式
JPH0540946U (ja) * 1991-10-29 1993-06-01 カシオ計算機株式会社 ワードプロセツサ
JP4650920B2 (ja) * 2002-04-16 2011-03-16 富士通株式会社 情報処理装置及び情報処理プログラム
JP2006050160A (ja) * 2004-08-03 2006-02-16 Sharp Corp 中国語入力装置、中国語入力プログラム及び中国語入力記録媒体
JP2006155322A (ja) * 2004-11-30 2006-06-15 Nec Fielding Ltd 入力予測辞書システムおよび入力予測方法
JP4413868B2 (ja) * 2006-01-16 2010-02-10 シャープ株式会社 文字入力装置、該文字入力装置を備えた複写機、文字入力方法、制御プログラム、および、記録媒体

Cited By (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN106663020A (zh) * 2014-08-29 2017-05-10 日立公共***有限公司 迁移支持装置
CN106663020B (zh) * 2014-08-29 2020-05-01 日立社会信息服务有限公司 迁移支持装置
CN105404677A (zh) * 2015-11-20 2016-03-16 四川神琥科技有限公司 一种基于树形结构的检索方法
CN105426490A (zh) * 2015-11-20 2016-03-23 四川神琥科技有限公司 一种基于树形结构的索引方法
CN105404677B (zh) * 2015-11-20 2018-12-18 四川神琥科技有限公司 一种基于树形结构的检索方法
CN105426490B (zh) * 2015-11-20 2019-03-26 四川神琥科技有限公司 一种基于树形结构的索引方法

Also Published As

Publication number Publication date
JPWO2008018274A1 (ja) 2009-12-24
JP4890551B2 (ja) 2012-03-07
WO2008018274A1 (fr) 2008-02-14

Similar Documents

Publication Publication Date Title
US20210073467A1 (en) Method, System and Apparatus for Entering Text on a Computing Device
US10241673B2 (en) Alternative hypothesis error correction for gesture typing
US10073829B2 (en) System and method for inputting text into electronic devices
JP4413868B2 (ja) 文字入力装置、該文字入力装置を備えた複写機、文字入力方法、制御プログラム、および、記録媒体
US10191654B2 (en) System and method for inputting text into electronic devices
KR102078785B1 (ko) 세계어들을 위한 가상 키보드 입력
CN105009064B (zh) 使用语言和空间模型的触摸键盘
CN104123012B (zh) 使用替代评分的非字典字符串的姿态键盘输入
CN104808806A (zh) 根据不确定性信息实现汉字输入的方法和装置
WO2008145055A1 (fr) Procédé pour obtenir une information de mot de restriction et pour optimiser le système du procédé d&#39;entrée et de sortie
CN102915122B (zh) 基于语言模型的智能移动平台拼音输入法
CN101553810A (zh) 字符转换装置和字符转换装置控制方法
CN100462901C (zh) Gb拼音输入法
CN101520693A (zh) 一种批量信息快速输入的方法及***
CN101667099B (zh) 一种连笔键盘文字输入的方法和设备
CN101135936A (zh) 快速键入设备和方法
CN104641367B (zh) 用于格式化电子字符序列的格式化模块、***和方法
CN111782060B (zh) 对象显示方法、装置和电子设备
AU2013270614A1 (en) Method system and apparatus for entering text on a computing device
WO2018228101A1 (zh) 基于汉语含义的汉语编码方法及***和介质设备
CN108228540A (zh) 利用笔迹手势编辑手写输入
AU2015221542A1 (en) Method system and apparatus for entering text on a computing device
JP2010198471A (ja) 辞書機能を備えた電子機器、文字列検索方法、およびプログラム

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
AD01 Patent right deemed abandoned

Effective date of abandoning: 20091007

C20 Patent right or utility model deemed to be abandoned or is abandoned