CN1934565A - 机器翻译***、机器翻译方法和程序 - Google Patents

机器翻译***、机器翻译方法和程序 Download PDF

Info

Publication number
CN1934565A
CN1934565A CNA2005800087536A CN200580008753A CN1934565A CN 1934565 A CN1934565 A CN 1934565A CN A2005800087536 A CNA2005800087536 A CN A2005800087536A CN 200580008753 A CN200580008753 A CN 200580008753A CN 1934565 A CN1934565 A CN 1934565A
Authority
CN
China
Prior art keywords
proper noun
user dictionary
respective symbols
machine translation
input
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CNA2005800087536A
Other languages
English (en)
Inventor
长田诚也
山端洁
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
NEC Corp
Original Assignee
NEC Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by NEC Corp filed Critical NEC Corp
Publication of CN1934565A publication Critical patent/CN1934565A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/40Processing or translation of natural language
    • G06F40/42Data-driven translation
    • G06F40/45Example-based machine translation; Alignment

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Health & Medical Sciences (AREA)
  • Artificial Intelligence (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Computational Linguistics (AREA)
  • General Health & Medical Sciences (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Machine Translation (AREA)

Abstract

在机器翻译和自动解释处理中,可以正确地翻译字典中未登记的专有名词。专有名词字典数据产生装置21根据预定规则,使用专有名词存储部分31中保存的目标语言的专有名词,产生专有名词用户字典数据。产生的专有名词用户字典数据被存储在专有名词用户字典存储部分32中。当输入翻译目标语句时,在任意要参考的时刻向输出设备4输出专有名词用户字典。机器翻译装置22除了使用机器翻译字典之外,还使用存储在专有名词用户字典存储部分32中的专有名词用户字典,来执行翻译。

Description

机器翻译***、机器翻译方法和程序
技术领域
本发明涉及一种机器翻译(自动解释)***、一种机器翻译(自动解释)方法和一种机器翻译(自动解释)程序,更具体地,涉及在处理专有名词方面先进的技术。
背景技术
作为机器解释/自动翻译***的应用示例,存在由日本专利未审No.2003-330916公开的一种地区专有名词字典接收***。根据该公开,地区专有名词字典接收***包括:便携式终端设备,具有位置检测功能以检测终端的当前地理位置;以及服务器,包括地区专有名词字典的数据库,在数据库中描述了包括与地区唯一名词相关联的发音信息的信息。根据该公开,便携式终端设备首先利用发送功能,向服务器发送通过位置检测功能而获得的位置信息。当从便携式终端设备接收到位置信息时,服务器执行位置信息和地区专有名词字典之间的匹配,以选择适用于该位置信息的地区专有名词字典,然后将这样被选择的字典数据下载到便携式终端设备。然后,便携式终端设备使用从服务器获得的字典数据,来输出地区专有名词。不仅可以在我国使用该地区专有名词字典接收***,而且可以在世界上我们所访问的国家使用该***,以获得其地区专有名词。
专利文献1:日本专利申请未审No.2003-330916,图1
发明内容
本发明要解决的问题
如上所述,尽管已知具有包含所需信息的大量字典的机器翻译/自动解释***变得越来越重要,但是包含在这些字典中的专有名词是在所考虑的语言中采用的地名、人名、特定项目的名称等,并且在多数情况下,翻译的词本身没有意义,或者翻译的词仅仅是音译或音标。当考虑到创建这些专有名词的字典所需的能量和存储空间时,对于成本、可行性等而言,预先创建对于世界每个国家和地区唯一的名词的字典是不实际的。
考虑到上述情况,来设计本发明,并且本发明的目的是提供一种机器翻译自动解释方法,能够翻译专有名词,不需要预先准备与专有名词相关联的字典,并且本发明还提供了实现该机器翻译自动解释方法的***、设备和程序,并且还提供了一种机器翻译自动解释方法,能够显著地减少用于处理专有名词的劳动和成本,还提供了用于实现该机器翻译自动解释方法的***、设备和程序。
解决问题的手段
根据提供用于解决问题的手段的本发明的第一观点,提供了一种机器翻译***,其中,存取包含以翻译目标语言描述的专有名词组的专有名词信息;对于上述存取的专有名词信息,以至少是除目标语言以外的语言自动地产生相应字符串,以创建专有名词用户字典,以向用户呈现该字典;接收输入,将翻译目标语句中包含的相应字符串翻译成目标语言的专有名词。更具体地,根据本发明的机器翻译***包括用于产生专有名词用户字典数据的装置,并且利用该装置,创建包含使用目标语言的专有名词来进行机器翻译所需的信息的专有名词用户字典。此外,更优选地,根据本发明的机器翻译***包括专有名词用户字典存储部分,用以在其中存储专有名词用户字典。通过采用这种配置,可以使用仅包含易于获得的目标语言的专有名词的数据,来创建并增强机器翻译的用户字典,从而翻译包含专有名词的语句。
本发明的优点
根据本发明,可以实现在专有名词翻译中优异的相应词翻译功能的翻译/解释处理,不需要预先准备与专有名词相关联的字典。更直接地,由于不需要预先创建至少针对专有名词的机器翻译字典,可以降低字典的创建和拥有成本。
附图说明
图1示出了根据本发明第一实施例的机器翻译***的配置的方框图。
图2用于解释根据本发明第一实施例的机器翻译***的操作的流程图。
图3用于解释本发明第一实施例的图。
图4用于解释根据本发明第一实施例的机器翻译***的操作的流程图。
图5用于解释本发明第二实施例的图。
图6示出了根据本发明第三实施例的机器翻译***的配置的方框图。
图7用于解释本发明第三实施例的图。
图8用于解释本发明第三实施例的另一个图。
图9示出了根据本发明第四实施例的机器翻译***的配置的方框图。
图10用于解释根据本发明第四实施例的机器翻译***的操作的流程图。
图11示出了根据本发明第五实施例的机器翻译***的配置的方框图。
图12示出了根据本发明第六实施例的机器翻译***的配置的方框图。
图13示出了根据本发明第七实施例的机器翻译***的配置的方框图。
参考数字的说明
1   输出设备
3   存储部分
4、41、42  输出设备
5   服务器设备
21  专有名词用户字典数据产生部分
22  机器翻译部分
23  位置指定部分
24  通信部分
25  成像部分
26  字符辨别部分
27  目标语言音频合成部分
28  原始语言音频辨别部分
29  自动解释部分
31  目标语言专有名词存储部分
32  专有名词用户字典存储部分
33  机器翻译字典存储部分
34  电子地图存储部分
51  通信部分
52  专有名词选择部分
53  地区专有名词数据库
具体实施方式
下面,将给出执行本发明的最佳模式的细节的描述。在优选实施例中根据本发明的机器翻译***被形成为信息处理***,包括:例如键盘的输入设备(图1的1)、机器翻译设备、存储部分(图1的3)以及包括显示设备和打印设备的输出设备(图1的4)。
存储部分(图1的3)包括目标语言专有名词存储部分(图1的31)、专有名词用户字典存储部分(图1的32)以及机器翻译字典存储部分(图1的33)。
对于一种语言(原始语言),目标语言专有名词存储部分(图1的31)在其中存储了要通过机器翻译处理将原始语言转换成的另一种语言(目标语言)的专有名词。此处,假设目标语言是英语,并且存储了例如“Aachen”和“Aaland”的专有名词。
专有名词用户字典存储部分(图1的32)在其中存储用于机器翻译的专有名词用户字典,该字典与存储在目标语言专有名词存储部分(图1的31)中的专有名词相对应。
机器翻译字典存储部分(图1的33)在其中存储在执行机器翻译时要使用的基础字典。
机器翻译设备包括:专有名词用户字典数据产生部分(图1的21),其中包括要由中央处理单元执行的程序(未示出);以及机器翻译部分(图1的22)。
专有名词用户字典数据产生部分(图1的21)以在机器翻译部分(图1的22)中使用的字典数据格式,产生存储在目标语言专有名词存储部分(图1的31)中的专有名词,用以将该数据存储在专有名词用户字典存储部分(图1的32)中。此外,数据产生部分(图1的21)向输出设备(图1的4)输出存储的专有名词用户字典。
机器翻译部分(图1的22)通过参考专有名词用户字典存储部分(图1的32)和机器翻译字典存储部分(图1的33)中的数据,将从输入设备输入的原始语言的语句翻译成目标语言,以将其提供给输出设备(图1的4)。
接下来,参考附图,给出如上配置的机器翻译***的操作细节的描述。首先,给出机器翻译***根据专有名词信息来输出专有名词用户字典、并且促使输出翻译目标语句的操作的描述。
首先,机器翻译设备的专有名词用户字典数据产生部分(图1的21)读入存储在目标语言专有名词存储部分(图1的31)中的专有名词(图2的步骤A1),自动地产生与该专有名词相对应的相应字符串(图2的步骤A2),并且将该字符串存储在专有名词用户字典存储部分(图1的32)中,所述字符串与专有名词相关联。例如,当原始语言是日语并且读入专有名词“Aachen”和“Aaland”时,专有名词用户字典数据产生部分(图1的21)根据预定规则,将各个词转换成音符,以产生相应的字符串,即原始语言中的“ah()chen”和“ahrando”。
在该联系中,原始语言(日语)的“Aachen”和“Aaland”通常表示德国的“ah-hen”(城市)和芬兰的“ohrando”(岛)。然而,在本发明中,不需要严格地音译这些词,这通过以后的解释来阐明。
机器翻译设备的专有名词用户字典数据产生部分(图1的21)向输出设备输出存储在目标语言专有名词存储部分(图1的31)中的专有名词和存储在专有名词用户字典存储部分(图1的32)中的相应字符串(图2的步骤A4)。
在该阶段中,显示机器翻译***的专有名词和相应字符串配对。用户通过参考显示的信息,输入包括与目标语言的专有名词相对应的字符串的语句。
机器翻译设备的机器翻译部分(图1的22)从机器翻译字典存储部分(图1的33)读入机器翻译字典(图4的步骤A5),然后从专有名词用户字典存储部分(图1的32)读取专有名词用户字典(图4的步骤A6)。
接下来,机器翻译设备的机器翻译部分(图1的22)读取从输入发备(图1的1)输入的原始语言的翻译目标语句(图4的步骤A7)。然后,机器翻译部分(图1的22)参考在步骤A5读取的机器翻译字典和在步骤A6读取的专有名词用户字典,并且根据预定方法,分析在步骤A7输入的翻译目标语句,以将该语句翻译成目标语言(图4的步骤A8),并且将其输出到输出设备(图1的4;图4的步骤A9)。
当原始语言是例如日语时,如果输入了翻译目标语句“ahchen niikitai”,则机器翻译***的机器翻译部分(图1的22)输出“I wantto go to Aachen”。
如上所述,根据本发明,至少对于专有名词,可以存取以目标语言描述的项目,并且可以读入该项目,从而执行机器翻译。因此,不需要预先创建用于机器翻译的字典信息,并且可以减小字典信息的存储容量。
实施例1
接下来,通过参考附图来给出第一实施例的细节的描述。图1的示出了根据本发明第一实施例的机器翻译***的配置的方框图。通过安装使个人计算机执行以下所述过程的程序,来配置根据本实施例的机器翻译***。
个人计算机包括键盘作为输入设备1、磁盘存储设备作为存储部分3以及显示器作为输出设备4。此外,个人计算机包括中央处理单元,该中央处理单元读入并执行预定程序,以作为专有名词用户字典数据产生部分21和机器翻译部分22。此外,磁盘存储设备分别在目标语言专有名词存储部分31、专有名词用户字典存储部分32和机器翻译字典存储部分33中存储了目标语言专有名词组、专有名词用户字典和机器翻译字典。
在本章节中,将在目标语言专有名词存储部分31已经存储了例如“KAXI”、“SOSDK”、“WEKIND”和“LIDRE”的专有名词作为目标语言的专有名词的假设下,给出描述。
专有名词用户字典数据产生部分21包括表格,用于根据组成每个名词的各个字符和字符之间的连接关系,将目标语言专有名词转换成原始语言的音符和语音字符。根据该表格,数据产生部分21根据目标语言的专有名词,产生原始语言的标注(相应字符串),并且将标注存储在专有名词用户字典存储部分32中。
在存储部分32中,将由数据产生部分21产生的原始语言的标注(相应字符串)与目标语言的标注以及机器翻译所需的字典信息存储在一起。
图2是用于解释本发明实施例的操作的流程图。参考图2,来描述如上所述配置的机器翻译***的操作;首先,当从用户接收到转换处理请求并且激活诸如选择专有名词信息之类的预定触发时,专有名词用户字典数据产生部分21从目标语言专有名词存储部分31读出目标语言的专有名词(步骤A1),参考转换表格以创建原始语言的标注(相应字符串)(步骤A2),并将这些标注存储在专有名词用户字典存储部分32中(步骤A3)。
例如,专有名词用户字典数据产生部分21按照“KA”→“ka”+“XI”→“si”,分解目标语言的专有名词“KAXI”,以产生音符,并且将相应字符串“kasi”存储在专有名词用户字典存储部分32中(参考图3)。此外,例如,数据产生部分21分解目标语言的专有名词“SOSDK”以产生音符如“SO”→“so”、“S”→“su”、“D”→“zu”、“K”→“ku”,并且将相应字符串“sosuzuku”存储在字典存储部分32中(参考图3)。
接下来,机器翻译***显示目标语言的专有名词以及原始语言的专有名词的标注(相应字符串)(步骤A4)。图3是示出了表示从目标语言的专有名词产生的内容的输入辅助窗口的图。参考图3,与目标语言的专有名词一起,显示原始语言的专有名词的标注(相应字符串)。用户通过参考窗口,从该窗口选择希望的专有名词,或者输入希望的相应字符串,以创建并输入翻译目标语句。
图4是用于解释在输入了翻译目标语句之后机器翻译***的操作的流程图。
当进行预定的翻译执行操作时,机器翻译部分22分别从机器翻译字典存储部分33和专有名词用户字典存储部分32读取机器翻译字典和专有名词用户字典(步骤A5、步骤A6),并且读取从输入设备1输入的原始语言的翻译目标语句(步骤A7)。机器翻译部分22执行针对输入的翻译目标语句的预定分析,并且使用机器翻译字典和专有名词用户字典,将以原始语言描述的语句转换成目标语言的文本(步骤A8)。最后,机器翻译部分22向显示器输出目标语言的文本,作为翻译结果(步骤A9)。
例如,假设用户查看显示了目标语言的专有名词和原始语言的标注的显示器(参考图3),从键盘输入“kono michiha sosuzuku nitsuujite imasuka”。机器翻译部分22读取存储在机器翻译字典存储部分33和专有名词用户字典存储部分32中的各个字典,将输入翻译成目标语言的文本“Does this way go to Sosdk?”,并将其输出到显示器。
从以上描述中可见,根据本发明,可以获得专有名词的良好翻译结果,而不需要预先准备专有名词字典。此外,根据本发明,预先将现有的专有名词信息转换成语音字符和音符,然后将其呈现给用户以接收用户输入,这使得可以识别目标语言的专有名词。因此,对于专有名词,可以产生正确的翻译结果,而不需要正确地输入目标语言的标注、原始语言的翻译词等。
实施例2
在本发明第一实施例的描述中,专有名词用户字典数据产生部分21包括表格,用于利用组成每个名词的字符和字符之间的相邻关系,将目标语言专有名词转换成原始语言的音符和语音字符。作为本发明的第二实施例,给出不使用表格的配置的描述。由于本发明第二实施例基本与上述第一实施例相同,所以仅给出与第一实施例不同的部分的描述。
根据本发明第二实施例的机器翻译***的专有名词用户字典数据产生部分21根据预定规则,产生能够唯一地标识每个专有名词的名称,与目标语言的专有名词的字符内容无关。
例如,针对从目标语言专有名词存储部分31读出的目标语言的一组专有名词,数据产生部分21产生标注(相应字符串)“Place name1”、“Place name 2”…“Place name n”。此外,数据产生部分21将名词和标注的配对存储在专有名词用户字典存储部分32中,并且在显示器上显示它们。
图5是表示输入辅助窗口的另一个图,该窗口指示出从目标语言的专有名词产生的并显示在窗口中的内容。假设用户查看呈现了以图5为例的子窗口的显示器、从键盘输入“kono michiha Place name 2ni tsuujite imasuka”的情况。机器翻译部分22参考存储在机器翻译字典存储部分33和专有名词用户字典存储部分32中的各个字典,将语句翻译成目标语言的文本“Does this way go to Sosdk”,然后将其输出到显示器。
从以上描述中空间,本发明不一定需要表格来产生专有名词用户字典数据,但是仅必须向用户显示目标语言的专有名词以识别它们。因此,当与上述第一实施例相比时,以更简单的过程实现了第二实施例,并且可以以较低成本构造具有较高处理速度的***。此外,当用户不熟悉语音字符和音符时,尽管阅读或输出是困难的,考虑到上述情况,可以产生专有名词的正确翻译结果。即,***为用户产生例如“place name n”、“Point n”和“Destination n”的标注,并且接收用户输入。
实施例3
给出作为上述本发明第一实施例的修改的第三实施例的描述。本发明的第三实施如图6所示构成,并且除了代替第一实施例的目标语言专有名词存储部分31、放置了电子地图存储部分34之外,基本与第一实施例相同。现在来解释新的部分。
本实施例的电子地图存储部分34在其中除了存储地图图像之外,还在其中存储地图信息,以在预定位置显示专有名词,例如地名、交通设施名称和街道名称。
对于电子地图存储部分34的地图信息中包含的每个专有名词,与第一实施例相同,专有名词用户字典数据产生部分21产生原始语言的标注(相应字符串)。此外,数据产生部分21将标注和专有名词的配对存储在专有名词用户字典存储部分32中,并且在电子地图上显示它们。
图7是示出了用于显示从地图信息中产生的电子地图和其中包含的专有名词的输入辅助窗口的图。假设用户查看呈现了以图7为例的子窗口的显示器、从键盘输入“sosuzuku ni ikitai”的情况。机器翻译部分22参考存储在机器翻译字典存储部分33和专有名词用户字典存储部分32中的各个字典,将输入翻译成目标语言的文本“I wantto go to Sosdk”,并且将其输出到显示器。
从以上描述可见,根据本实施例,可以有效地使用包括专有名词的地图作为翻译字典。例如,即使以特定语言(目标语言)指示出电子地图信息、电子线路地图和街道地图的地名、交通设施名称、街道名称等,并且用户不能够理解该语言的地名等,也可以如上所述地在地图上显示可以由用户输入的相应字符串,并因此可以接收到指示。这意味着对于不能够理解外语的用户,可以容易地修改以外语等产生字符部分的电子地图和地图的应用产品(例如地图信息***、GIS、汽车导航***等)。
此外,与上述第二实施例相同,专有名词用户字典数据产生部分21可以产生根据预定规则、利用名称可以唯一地标识每个地名信息(专有名词)的名称,与目标语言的专有名词的字符无关。
图8是表示显示从地图信息中产生的电子地图和其中包含的专有名词的输入辅助窗口的另一个图。假设用户查看呈现了以图8为例的子窗口的显示器、从键盘输入“Place name 2 ni ikitai”的情况。机器翻译部分22参考存储在机器翻译字典存储部分33和专有名词用户字典存储部分32中的各个字典,将语句翻译成目标语言的文本“Iwant to go to Sosdk”,然后将其输出到显示器。
接下来,给出根据本发明的机器翻译***通过网络来获得专有名词信息的第四实施例的描述。图9是示出了根据第四实施例的机器翻译***的配置的方框图。
参考图9,机器翻译***的存储部分3不包含目标语言专有名词存储部分31,但是机器翻译设备包含位置指定部分23和通信部分24。此外,包含通信部分51、专有名词选择部分52以及地区专有名词数据库53的服务器设备5通过网络与机器翻译***相连。
图10是用于解释机器翻译***和服务器设备5之间的操作的流程图。参考图1O,机器翻译***通过通信部分24来访问服务器设备5,使用位置指定部分23,例如计划旅行目的地和当前位置,来指定希望的位置(步骤B1),并且请求发送专有名词信息(步骤B2)。接收到该请求,则服务器设备5利用专有名词选择部分52,根据指定位置来选择专有名词信息(步骤B3),并且将该新信息发送到机器翻译***(步骤B4)。
接收到专有名词信息,则与上述各个实施例相同,机器翻译***通过专有名词用户字典数据产生部分21,产生专有名词用户字典数据(步骤B5),以将数据存储在专有名词用户字典中(步骤B6),并且将其显示在显示器上(步骤B7)。在该点之后,翻译用户输入的翻译目标语句的过程与上述每个实施例的过程相同。
从以上描述可见,本发明不仅可以采用使用机器翻译***所拥有的专有名词信息的配置,还可以采用下载专有名词信息并用于翻译的配置。例如,当根据本发明的机器翻译***被安装在具有GPS功能的便携式信息终端上时,可以获得与从GPS获得的当前位置相对应的专有名词信息,使得该信息被存储在专有名词用户字典中或使用该信息。在这种情况下,例如,根据需要,可以创建并使用包括世界各个地方的地名等的字典。此外,在这种情况下,不需要预先准备字典数据,这在日本专利申请公开No.2003-330916中描述了。
实施例5
接下来,给出第五实施例的描述,其中,在机器翻译***中从图像数据获取画面并且获得专有名词信息。根据本发明第五实施例的机器翻译***如图11所示配置,除了设置成像部分25和字符辨别部分26之外,基本与上述第一实施例相同。
成像部分25是诸如数字摄像机和扫描仪之类的图像输入装置,字符辨别部分26是一种装置,用于扫描图像以剪切图像中包含的字符串部分,并且将该部分与标准字符图样相比较,以按照需要考虑连接状态等,将其转换为文本数据。
下面给出根据本实施例的机器翻译***的操作的描述。当激活预定触发时,例如从用户接收到转换处理请求以及图像数据的翻译执行请求时,机器翻译***的专有名词用户字典数据产生部分21通过字符辨别部分26,从成像部分25获得的图像中获取字符串,按照与上述每个实施例相同的方式,产生专有名词用户字典数据。
从以上描述可见,根据本发明,可以拍摄包括专有名词的地图、书本等,以有效地将其使用作为翻译字典。例如,可以在专有名词用户字典中拍摄并包含以特定语言(目标语言)产生的观光导游图、线路地图、道路地图、其标题部分和索引部分、旅行指南、电话簿等,用以以后执行翻译处理。
第六实施例
接下来,给出根据本发明的机器翻译***的专有名词用户字典数据产生部分21的详细配置的第六实施例的描述。本发明的第六实施例如图12所示配置,并且除了代替第一实施例的专有名词用户字典数据产生部分21、放置目标语言音频合成部分27和原始语言音频辨别部分28之外,基本与第一实施例相同。
目标语言音频合成部分27是用于使用存储在目标语言专有名词存储部分31中的专有名词信息来产生音频输出的装置,原始语言音频辨别部分28是一种装置,用于将专有名词信息的音频输出与原始语言的标准音频图样相比较,按照需要考虑相邻字符的关系等,将该信息转换成文本数据,以将数据存储在专有名词用户字典存储部分32中。
下面给出根据本实施例的机器翻译***的操作的描述。当激活预定触发时,例如从用户接收到转换处理请求或图像数据的翻译执行请求时,机器翻译***的目标语言音频合成部分27读取存储在目标语言专有名词存储部分31中的专有名词信息,以产生音频输出。原始语言音频辨别部分28将专有名词信息的音频输出与原始语言的标准音频图样相比较,根据需要考虑相邻字符的关系等,将信息转换成文本数据,并且将数据存储在专有名词用户字典存储部分32中。
如上所述,根据目标语言和原始语言的组合,本发明可以通过使用现有音频合成部分和现有音频辨别部分,来配置专有名词用户字典数据产生部分21。
此外,在上述实施例中,以由目标语言音频合成部分27和原始语言音频辨别部分28的组合代替第一实施例的专有名词用户字典数据产生部分21的示例为例;然而,还可以由目标语言音频合成部分27和音频辨别部分28代替第二至第五实施例的数据产生部分21。
实施例7
接下来,给出对自动解释***应用本发明的第七实施例的描述。本实施例如图13所示配置,并且通过放置自动解释部分29以代替第一实施例的机器翻译部分22,来配置自动解释***。
此外,在本实施例中,连接作为输入设备1的麦克风,第一和第二输出设备41和42被设置作为输出设备,并且显示器和扬声器分别与之相连。
下面给出根据本实施例的自动解释***的操作的描述。尽管操作基本与第一实施例相同,代替在上述每个实施例中机器翻译部分22的翻译目标语句输入处理,来执行处理,其中,自动解释部分22执行来自麦克风的音频的音频辨别,以检测并翻译显示项(相应字符串),然后执行目标语言的音频合成,由扬声器输出音频合成的结果。
如上所述,本发明不仅适用于字符图像是原始对象的机器翻译,而且适用于主要通信语音和声音的自动解释。此外,还可以利用自动解释部分29来代替实施例2至6的机器翻译部分22。
已经给出了本发明适用的各个实施例的描述;然而,根据本发明的原理和效果,根据本发明的机器翻译/自动解释***和机器翻译/自动解释方法不仅对于狭义的机器翻译/自动解释有用,而且对于包含与其类似的转换处理的各种用户接口有用。因此,本发明不局限于狭义的机器翻译***及其程序,还适用于可以执行根据本发明的机器翻译方法和自动解释方法的各种终端、服务器和设备。

Claims (21)

1.一种机器翻译***,包括:
专有名词用户字典数据产生部分,用于从存储以一种语言描述的专有名词的专有名词存储部分读取专有名词,并且自动地产生与该专有名词相对应的相应字符串;
专有名词用户字典输出部分,用于输出包括以所述一种语言描述的专有名词和相应字符串的配对;以及
机器翻译部分,用于根据以所述一种语言描述的专有名词和相应字符串的配对,将输入到其中的语句结构中包括的相应字符串转换并从而翻译成以所述一种语言描述的专有名词。
2.一种机器翻译***,包括:
专有名词用户字典数据产生部分,用于从存储以一种语言描述的专有名词的专有名词存储部分读取专有名词,并且自动地产生与该专有名词相对应的相应字符串;
专有名词用户字典存储部分,用于在其中存储并保持包括专有名词和相应字符串的配对的专有名词用户字典数据;以及
专有名词用户字典输出部分,用于输出专有名词用户字典中包含的包括专有名词和相应字符串的配对;以及
机器翻译部分,用于根据专有名词用户字典,将输入到其中的语句结构中包括的相应字符串转换并从而翻译成以所述一种语言描述的专有名词。
3.根据权利要求1或2所述的机器翻译***,其中:
专有名词用户字典数据产生部分从包含专有名词的地图信息中读取专有名词,并且自动地产生与专有名词相对应的相应字符串;以及
专有名词用户字典输出部分输出地图,在地图中,相应字符串位于地图中包含的专有名词附近。
4.根据权利要求1至3之一所述的机器翻译***,还包括:
成像部分,用于产生图像;以及
字符辨别部分,用于辨别成像部分获得的图像数据中的专有名词字符串,其中
专有名词用户数据产生部分自动地产生与如上所述被辨别的专有名词字符串相对应的相应字符串。
5.根据权利要求1至4之一所述的机器翻译***,包括:代替专有名词用户字典数据产生部分的:
音频合成部分,用于从存储以任意原始语言描述的专有名词的专有名词存储部分读出专有名词,并且合成并输出与专有名称相对应的声音;以及
音频辨别部分,用于辨别如上所述被合成和输出的声音,并且自动地产生与专有名词相对应的相应字符串。
6.一种服务器设备,用于给根据权利要求1至5之一所述的机器翻译***提供专有名词信息,所述服务器设备包括:
地区专有名词信息存储部分,用于根据地区,在其中存储以任意一种语言描述的专有名词;以及
专有名词信息选择和发送部分,用于从机器翻译***接收位置信息,并且根据位置信息,选择性地发送专有名词信息。
7.一种服务器设备,包括:代替根据权利要求1至5之一所述的机器翻译***的机器翻译部分的自动解释部分,用于根据专有名词用户字典,将输入到其中的声音中包含的相应字符串转换并输出为所述一种语言的相应专有名词的声音。
8.一种使用机器翻译***来执行机器翻译的机器翻译方法,包括:
由机器翻译***的专有名词用户字典数据产生部分从用于存储以任意一种语言描述的专有名词的专有名词存储部分读出专有名词,并且自动地产生与专有名词相对应的相应字符串;
由机器翻译***的专有名词用户字典输出部分输出包括专有名词和相应字符串的配对,以引导包含相应字符串的翻译目标语句的输入;
由机器翻译***的输入部分接收翻译目标语句的输入;以及
由机器翻译***的机器翻译部分根据专有名词用户字典,将输入到其中的翻译目标语句中包括的相应字符串转换并从而翻译成以所述一种语言描述的专有名词。
9.一种使用机器翻译***的机器翻译方法,包括:
由机器翻译***的专有名词用户字典数据产生部分从存储以任意一种语言描述的专有名词的专有名词存储部分读出专有名词,并且自动地产生与该专有名词相对应的相应字符串;
由机器翻译***的专有名词用户字典数据产生部分利用在专有名词和相应字符串之间建立的关系,在专有名词用户字典存储部分中存储专有名词和相应字符串;
由机器翻译***的专有名词用户字典输出部分输出专有名词用户字典中包含的包括专有名词和相应字符串的配对,以引导包含相应字符串的翻译目标语句的输入;
由机器翻译***的输入部分接收翻译目标语句的输入;以及
由机器翻译***的机器翻译部分根据专有名词用户字典,将输入到其中的翻译目标语句中包括的相应字符串转换并从而翻译成以所述一种语言描述的专有名词。
10.根据权利要求8或9所述的机器翻译方法,其中:
专有名词用户字典数据产生部分从包含专有名词的地图信息中读出专有名词,并且自动地产生与专有名词相对应的相应字符串;以及
专有名词用户字典输出部分输出地图,在地图中,相应字符串位于地图中包含的专有名词附近,以引导包含相应字符串的翻译目标语句的输入。
11.根据权利要求8至10之一所述的机器翻译方法,还包括:
由机器翻译***的成像部分产生图像,图像中写有以任意一种原始语言描述的专有名词;以及
由机器翻译部分的字符辨别部分辨别如上所述产生的图像数据中的专有名词字符串,其中
机器翻译***的专有名词用户字典数据产生部分自动地产生与如上所述被辨别的专有名词字符串相对应的相应字符串。
12.根据权利要求8至11之一所述的机器翻译方法,其中代替机器翻译***的专有名词用户字典数据产生部分从存储以任意一种语言描述的专有名词的专有名词存储部分读出专有名词、并且自动地产生与该专有名词相对应的相应字符串的步骤,包括:
由机器翻译***的音频合成部分从存储以任意一种语言描述的专有名词的专有名词存储部分读出专有名词,并且合成并输出与专有名称相对应的声音;以及
由机器翻译***的音频辨别部分辨别如上所述被合成和输出的声音,并且自动地产生与专有名词相对应的相应字符串。
13.根据权利要求8至12之一所述的机器翻译方法,包括:
由机器翻译***向服务器设备发送位置信息,所述服务器设备包括用于在其中存储以任意一种语言描述的专有名词的地区专有名词信息存储部分,所述专有名词是根据地区分组的;以及
由服务器设备根据位置信息,选择性地发送专有名词信息。
14.一种自动解释方法,用于使包括自动解释部分的自动解释***实现根据权利要求8至13之一所述的机器翻译方法,其中:
自动解释***的输入部分接收口头翻译目标语句;以及
自动解释***的自动解释部分根据专有名词用户字典,将输入到其中的声音中包含的相应字符串转换为所述一种语言的相应专有名词的声音,并输出该声音。
15.一种程序,用于使组成进行机器翻译的机器翻译***的计算机执行以下步骤:
专有名词用户字典数据产生处理,用于从存储任意一种语言描述的专有名词的专有名词存储部分读出专有名词,并自动地产生与该专有名词相对应的相应字符串;
专有名词用户字典输出处理,用于输出专有名词用户字典中包含的包括专有名词和相应字符串的配对,以引导输入包含相应字符串的翻译目标语句;
翻译目标语句输入接收处理,用于接收翻译目标语句的输入;以及
机器翻译处理,用于根据专有名词用户字典,将输入到其中的翻译目标语句中包括的相应字符串转换从而翻译成以所述一种语言描述的专有名词。
16.一种程序,用于使组成进行机器翻译的机器翻译***的计算机执行以下步骤:
专有名词用户字典数据产生处理,用于从存储以任意一种语言描述的专有名词的专有名词存储部分读出专有名词,并且自动地产生与该专有名词相对应的相应字符串;
专有名词用户字典存储处理,用于在专有名词用户字典存储部分中存储彼此相关联的专有名词和相应字符串;
专有名词用户字典输出处理,用于输出专有名词用户字典中包含的包括专有名词和相应字符串的配对,以引导包含相应字符串的翻译目标语句的输入;
翻译目标语句输入接收处理,用于接收翻译目标语句的输入;以及
机器翻译处理,用于根据专有名词用户字典,将输入到其中的翻译目标语句中包括的相应字符串转换并从而翻译成以所述一种语言描述的专有名词。
17.根据权利要求15或16所述的计算机程序,该程序使计算机执行以下步骤:
作为专有名词用户字典数据产生处理的处理,用于从包含专有名词的地图信息中读出专有名词,并且自动地产生与专有名词相对应的相应字符串;以及
作为专有名词用户字典输出处理的处理,用于输出地图,在地图中,相应字符串位于地图中包含的专有名词附近,以引导包含相应字符串的翻译目标语句的输入。
18.根据权利要求15至17之一所述的计算机程序,该程序使计算机还执行以下步骤:
图像输入处理,用于输入图像,图像中写有以任意一种原始语言描述的专有名词;以及
字符辨别处理,用于辨别如上所述产生的图像数据中的专有名词字符串,其中
作为专有名词用户字典数据产生处理的处理自动地产生与如上所述被辨别的专有名词字符串相对应的相应字符串。
19.根据权利要求15至18之一所述的计算机程序,该程序使计算机还执行以下步骤:
音频合成处理,代替专有名词用户字典数据产生处理,用于从存储以任意一种语言描述的专有名词的专有名词存储部分读出专有名词,并且合成并输出与该专有名词相对应的声音;以及
音频辨别处理,用于辨别如上所述被合成和输出的声音,并且自动地产生与专有名词相对应的相应字符串。
20.根据权利要求15至19之一所述的计算机程序,包括:
用于向服务器设备发送位置信息的处理,所述服务器设备包括用于在其中存储以任意一种语言描述的专有名词的地区专有名词信息存储部分,所述专有名词是根据地区分组的;以及
用于根据来自服务器设备的位置信息,接收专有名词信息的处理。
21.根据权利要求15至20之一所述的计算机程序,该程序用于使组成进行自动解释的自动解释***的计算机执行以下步骤:
翻译目标语句输入接收处理,用于接收语音的翻译目标语句的输入,代替翻译目标语句输入接收处理和机器翻译处理;以及
自动解释处理,用于根据专有名词用户字典,将输入到其中的声音中包含的相应字符串转换为所述一种语言的相应字符串的声音,并输出该声音。
CNA2005800087536A 2004-03-18 2005-03-07 机器翻译***、机器翻译方法和程序 Pending CN1934565A (zh)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
JP2004079080 2004-03-18
JP079080/2004 2004-03-18

Publications (1)

Publication Number Publication Date
CN1934565A true CN1934565A (zh) 2007-03-21

Family

ID=34994437

Family Applications (1)

Application Number Title Priority Date Filing Date
CNA2005800087536A Pending CN1934565A (zh) 2004-03-18 2005-03-07 机器翻译***、机器翻译方法和程序

Country Status (4)

Country Link
US (1) US20080040096A1 (zh)
JP (1) JP4356745B2 (zh)
CN (1) CN1934565A (zh)
WO (1) WO2005091166A2 (zh)

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101751387B (zh) * 2008-12-19 2013-05-08 英特尔公司 用于位置辅助翻译的方法、装置和***
CN106716308A (zh) * 2014-06-17 2017-05-24 谷歌公司 用于输入地理位置名称的输入法编辑器
CN108536685A (zh) * 2017-03-06 2018-09-14 富士施乐株式会社 信息处理装置

Families Citing this family (15)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP5121252B2 (ja) * 2007-02-26 2013-01-16 株式会社東芝 原言語による音声を目的言語に翻訳する装置、方法およびプログラム
KR20090079575A (ko) * 2008-01-18 2009-07-22 (주)시터스 네비게이션 서비스 제공 시스템 및 장치와 서비스 제공방법
US9176952B2 (en) * 2008-09-25 2015-11-03 Microsoft Technology Licensing, Llc Computerized statistical machine translation with phrasal decoder
US20100082330A1 (en) * 2008-09-29 2010-04-01 Yahoo! Inc. Multi-lingual maps
JP5510009B2 (ja) * 2010-04-07 2014-06-04 日本電気株式会社 携帯端末装置、かな漢字変換用辞書の生成方法、かな漢字変換方法、及びプログラム
JP2012185741A (ja) * 2011-03-07 2012-09-27 Ricoh Co Ltd 画像形成装置、情報処理装置、画像処理システム、及びプログラム
JP5529092B2 (ja) * 2011-09-14 2014-06-25 株式会社ゼンリンデータコム 注記データ翻訳装置、注記データ翻訳方法および注記データ翻訳プログラム
US9141606B2 (en) 2012-03-29 2015-09-22 Lionbridge Technologies, Inc. Methods and systems for multi-engine machine translation
KR102214178B1 (ko) * 2013-12-13 2021-02-10 한국전자통신연구원 자동 통역 장치 및 방법
JP6312243B2 (ja) * 2014-03-28 2018-04-18 株式会社ゼンリンデータコム 翻訳装置、翻訳方法及び翻訳プログラム
US9817808B2 (en) * 2014-09-29 2017-11-14 International Business Machines Corporation Translation using related term pairs
CN107273106B (zh) * 2016-04-08 2021-07-06 北京三星通信技术研究有限公司 物体信息翻译、以及衍生信息获取方法和装置
KR102189125B1 (ko) * 2018-11-30 2020-12-10 주식회사 리얼타임테크 로그 수집 시스템 및 그 수집 방법
CN109861904B (zh) * 2019-02-19 2021-01-05 天津字节跳动科技有限公司 姓名标签显示方法和装置
KR102427934B1 (ko) * 2020-10-15 2022-08-02 한동대학교 산학협력단 신경망 기반의 고유명사 기호화를 이용한 번역 방법 및 그 시스템

Family Cites Families (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5225981A (en) * 1986-10-03 1993-07-06 Ricoh Company, Ltd. Language analyzer for morphemically and syntactically analyzing natural languages by using block analysis and composite morphemes
JPH077419B2 (ja) * 1989-06-30 1995-01-30 シャープ株式会社 機械翻訳装置における略称付き固有名詞処理方法
US5410475A (en) * 1993-04-19 1995-04-25 Mead Data Central, Inc. Short case name generating method and apparatus
JP3213197B2 (ja) * 1994-04-20 2001-10-02 キヤノン株式会社 画像処理装置およびその制御方法
US6490563B2 (en) * 1998-08-17 2002-12-03 Microsoft Corporation Proofreading with text to speech feedback
JP2002092265A (ja) * 2000-09-19 2002-03-29 Nec Corp 緊急情報送信方法、緊急情報送信システム、記録媒体、情報処理装置、及び移動端末
US8285537B2 (en) * 2003-01-31 2012-10-09 Comverse, Inc. Recognition of proper nouns using native-language pronunciation
US7359849B2 (en) * 2003-12-17 2008-04-15 Speechgear, Inc. Translation techniques for acronyms and ambiguities

Cited By (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101751387B (zh) * 2008-12-19 2013-05-08 英特尔公司 用于位置辅助翻译的方法、装置和***
US9323854B2 (en) 2008-12-19 2016-04-26 Intel Corporation Method, apparatus and system for location assisted translation
CN106716308A (zh) * 2014-06-17 2017-05-24 谷歌公司 用于输入地理位置名称的输入法编辑器
CN106716308B (zh) * 2014-06-17 2020-02-11 谷歌有限责任公司 用于输入地理位置名称的输入法编辑器
CN108536685A (zh) * 2017-03-06 2018-09-14 富士施乐株式会社 信息处理装置
CN108536685B (zh) * 2017-03-06 2023-08-22 富士胶片商业创新有限公司 信息处理装置

Also Published As

Publication number Publication date
JP4356745B2 (ja) 2009-11-04
US20080040096A1 (en) 2008-02-14
JPWO2005091166A1 (ja) 2008-02-07
WO2005091166A2 (ja) 2005-09-29

Similar Documents

Publication Publication Date Title
CN1934565A (zh) 机器翻译***、机器翻译方法和程序
CN1253820C (zh) 交叉语言信息检索设备和方法
CN1232226A (zh) 句子处理装置及其方法
CN101035125A (zh) 用于处理Web服务请求的方法和***
CN1841367A (zh) 用于通过在语言之间执行翻译来支持交流的交流支持设备和方法
CN101051323A (zh) 一种字符输入的方法、输入法***及词库更新的方法
CN1788266A (zh) 翻译***
CN1801139A (zh) 句子显示方法和信息处理***
CN1692404A (zh) 词汇重音预测
CN1573752A (zh) Url检索***、服务器及url检索方法
CN1423216A (zh) 交流支持装置以及方法
CN1924858A (zh) 一种获取新词的方法、装置以及一种输入法***
CN1892643A (zh) 通过执行语言间的翻译来支持交流的交流支持装置和方法
CN1071522A (zh) 汉语发音符号/汉字变换装置及方法
CN101055523A (zh) 将软件程序代码断言转换为硬件描述语言程序代码的方法
CN1910559A (zh) 检索数据的更新方法以及更新***
CN101076166A (zh) 具有显示按钮的装置及用于所述装置的显示方法和介质
CN1155907C (zh) 使用数字键的中文字输入方法及其装置
CN1744087A (zh) 搜索文档的文档处理装置及其控制方法
CN1316689A (zh) 汉字输入装置和方法
CN1929655A (zh) 一种可实现文本与语音转换的手机
CN1771494A (zh) 包括无分隔符的块的文本的自动分块
CN1702650A (zh) 用于将日文翻译成中文的设备和方法以及计算机程序产品
CN1254786C (zh) 在语音合成***中将提示音与文本语音合成输出的方法
CN1117156A (zh) 修改汉字转换结果的***

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
C12 Rejection of a patent application after its publication
RJ01 Rejection of invention patent application after publication