CN1415096A - 语言翻译*** - Google Patents

语言翻译*** Download PDF

Info

Publication number
CN1415096A
CN1415096A CN00817887A CN00817887A CN1415096A CN 1415096 A CN1415096 A CN 1415096A CN 00817887 A CN00817887 A CN 00817887A CN 00817887 A CN00817887 A CN 00817887A CN 1415096 A CN1415096 A CN 1415096A
Authority
CN
China
Prior art keywords
language
natural language
general purpose
general
expression
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN00817887A
Other languages
English (en)
Other versions
CN1271545C (zh
Inventor
内田裕士
朱美英
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Lian Heguo
United Nations
Original Assignee
Lian Heguo
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Lian Heguo filed Critical Lian Heguo
Publication of CN1415096A publication Critical patent/CN1415096A/zh
Application granted granted Critical
Publication of CN1271545C publication Critical patent/CN1271545C/zh
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/40Processing or translation of natural language
    • G06F40/55Rule-based translation
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/40Processing or translation of natural language
    • G06F40/58Use of machine translation, e.g. for multi-lingual retrieval, for server-side translation for client devices or for real-time translation

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Health & Medical Sciences (AREA)
  • Artificial Intelligence (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Computational Linguistics (AREA)
  • General Health & Medical Sciences (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Machine Translation (AREA)
  • Document Processing Apparatus (AREA)

Abstract

用户可以在各种语言之间通信的一种语言转换***。翻译单元(300)将构建自然语言表达的自然语言的组元翻译为对应于该组元并进入通用语言字典(210)的通用语言元素。翻译规则(220)被应用于经翻译的通用语言元素,由此根据该次序创建以二项式关系表达的通用语言的表达。反翻译部分(350)根据包括在所述翻译规则中的以二元关系表达的规则、参考所述翻译规则(220)将以所述二元关系表达的通用语言的表达解析为构建连接的通用语言元素。参考通用语言(210),将已解析的通用语言元素翻译为构建自然语言表达的组元,由此创建自然语言的表达。

Description

语言翻译***
                        技术领域
本发明涉及用于在翻译、解译(interpretation)等中的语言困难及用于信息交流和/或信息存储的技术。本发明更具体地涉及适于在计算机、网络等中执行的信息交流和信息存储的语言转换技术,并且能够应用于机器翻译、机器解译等方面。
                        背景技术
在今天的因特网时代,人们的活动已经遍布全球。在全球活动中,通信是最重要的。因而,语言上的差异是个重要的事。然而,目前并不存在完美的全球通用语言。即使被广泛使用的英语也不可能是全球通用语言。事实上,人们属于各种语言区,并且他们中的每个都希望通过使用他/她自己的语言通信。
当前,为了获得在不同语言之间的通信,需要在这些语言之间进行翻译。在某些情形中,必需在两种语言之间存在能够从两种语言中转换出的另一种语言。翻译一般地依靠人力。或者,已经为一些语言开发了翻译软件,并且也可以为其执行机器翻译。
事实上,传统翻译软件分析以一定语言撰写的句子的结构和意思。接着,根据其语法使用要翻译为的单词来重写所述句子的元素。由此,明显地难以达到完美的翻译。即使在两种非常类似的语言之间的翻译也不能达到100%。
不管他们所使用的语言,人们总是在诸如报告、学报(transaction)、文学以及娱乐等各种场合中在各种条件下创建用语言表达的信息。以语言书写的信息一般地以诸如印刷形式、数字数据形式等每个形式、以该信息原始撰写的语言来分别加以存储。可以将所述信息翻译成为不同的语言,并且也以翻译成的形式存储。由此,具有相同内容的信息可以不同的语言来存储。在网络时代不能认为这是有效率的。尤其是,当该内容改变时,不仅必需改变原始文件,而且所改变的部分必需以所翻译的文本加以翻译。因而,就文件管理而言这也不是有效的方法。
一般地,在许多情形中,不将以一种语言所原始撰写的信息翻译为不同的语言。尤其是很少将其翻译成许多语言。由此,在使用不同语言的人之间的信息交流自然地受到限制。
在此条件下需要开发能够容易和精确地在使用各种语言的人们之间以小的成本达成通信的一种***。另外,需要积累独立于特定语言的信息,并且根据需要将该信息转换成所期望的语言。
                          发明内容
本发明的目的是提供一种语言翻译***,由此能够以小的成本在各种语言之间容易和精确地实现通信。
为了实现所述目的,根据本发明的第一方面用于转换语言的一种***包括:转换规则部分,用于存储对应于至少一种自然语言的、被参考用于在自然语言的表达(representation)和通用语言的表达之间转换的重写规则;转换处理部分,用于通过参考存储在转换规则部分中的对应于自然语言的重写规则,将给定自然语言的表达转换为通用语言的表达;以及反转换处理部分,用于通过参考存储在所述经转换的规则部分中的对应于目标自然语言的重写规则将通用语言的表达转换为目标自然语言的表达。所述转换规则部分具有:作为对应自然语言的重写规则的通用语言字典,用于通过构建通用语言的通用语言元素来定义构建自然语言的自然语言元素,它对应于每个自然语言元素具有的信息;以及重写规则,用于规定在根据在自然语言中的句子结构安排的通用语言元素之间的连接关系,并且用于以包括两个通用单词(word)和指示它们具有一定关系的关系的二元关系来表达所述连接关系。所述转换处理部分执行用于参考对应自然语言的通用语言字典将构建自然语言表达的组元重写为其对应的在通用语言字典中的通用语言元素的处理、以及用于通过根据在通用语言元素中的次序应用对应于目标自然语言的重写规则来连接多个重写的通用语言元素的处理、以及用于根据在二元关系中的表达规则创建以二元关系表达的通用语言的表达。所述反转换处理部分执行用于根据包括在所述规则中的以二元关系表达的规则、参考对应目标自然语言的重写规则、将以所述二元关系表达的通用语言的表达解析为构建其连接的通用语言元素的处理;以及用于根据对应目标自然语言的通用语言字典将已解析的通用语言元素重写为构建自然语言表达的组元,以创建目标自然语言的表达的处理。
另外,根据本发明的第二方面的用于转换语言的一种***包括:转换规则部分,用于存储对应至少一种自然语言的、被参考用于在自然语言的表达和通用语言的表达之间转换的重写规则;以及反转换处理部分,用于通过参考存储在所述转换规则部分中的所述重写规则将给定通用语言的表达翻译为自然语言的表达。所述转换规则部分具有:作为对应自然语言的重写规则的通用语言字典,用于通过构建通用语言的通用语言元素来定义构建自然语言的自然语言元素,它对应于每个自然语言元素具有的信息;以及重写规则,用于规定在根据以自然语言中的句子结构安排的通用语言元素之间的连接关系,并且用于以包括两个通用单词和指示它们具有一定关系的关系的二元关系来表达所述连接关系。所述反转换处理部分执行用于根据包括在所述规则中的以二元关系表达的规则、参考对应于目标自然语言的重写规则、将以所述二元关系表达的通用语言的表达解析为构建其连接的通用语言元素的处理,以及用于参考对应于目标自然语言的通用语言将已解析的通用语言元素重写为构建自然语言表达的组元、以创建目标通用语言的表达的处理。
                        附图说明
图1是示出在本发明中使用的硬件***的结构的一例子的方框图;
图2是本实施例中使用的用于从自然语言的表达转换为通用语言的表达的***的功能结构的方框图;
图3是示意地示出在本发明中使用的通用语言字典的结构的例子的解释图;
图4是示意地示出在本发明中使用的重写规则的结构的例子的解释图;
图5是示出用于基于通用语言的表达创建自然语言的表达的语言转换***的一例子的方框图;
图6是示出能够执行翻译和反转换处理的一种***的结构的一例子的方框图;
图7是示出应用于其信息是跨越网络交流的情形的一种模型的例子的解释图。
                       具体实施方式
下面将参考附图描述本发明的实施例。将通过使用以英语作为自然语言的表达和基于此创建通用语言的表达的情形作为一例子来描述本发明。当然,有可能基于各种语言创建通用语言的表达。另外,有可能从通用语言转换为自然语言。
根据本发明,要用作创建表达的通用语言是一种能够基本上由计算机处理并且还用于经由网络通信的语言。由此,如果其能够由计算机处理,通用语言的符号可以是诸如数字就足够了。然而,它必需以人们可理解的方式来表达。例如,通用语言中的代码能够等同于特定自然语言中的符号。在本实施例中,使用了在通用语言中的符号是基于英语的例子。这是因为英语是广泛使用的语言并且被广泛用作计算机语言的符号。当然,通用语言的符号可以基于非英语语言。或者,它可以是其本身能够被人理解的人造语言中的符号。
图1将示出能够用于根据本发明构建语言翻译***的硬件***的结构的例子。该***能够用于通用语言的表达是从自然语言的表达中创建的(转换)、和自然语言的表达是从通用语言的表达中创建的(反翻译)两种情形中。由此,能够以相同的硬件***来构建用于执行转换和反转换的***。其中,反转换是将通用语言的表达转换为任何自然语言的表达,并且不限于还原回原本自然语言的表达。
图1示出能够用于根据本发明构建通用语言的表达***的硬件***的结构的例子。图1示出的是一般的计算机***。即,图1所示的硬件***具有:操作设备10、带有键盘21和鼠标22的输入设备20、带有显示设备31和打印机32的输出设备30,包括硬盘设备等的存储器设备40、以及用于连接网络的通信控制设备50。其中,输入设备20和输出设备30都是一般术语。因而,例如输出设备30不一定是带有显示设备31和打印机32的设备。
操作设备10具有中央处理单元(CPU)11、只读存储器(ROM)12和随机访问存储器(RAM)13。CPU11将应用软件程序装载到RAM13中,并且在存储器设备40中执行相同的安装,以执行不同类型的应用软件的处理。应用软件程序之一是用于执行创建在本实施例中使用的通用语言中的表达的处理的一种程序。该程序是由诸如CD-ROM(只读光盘存储器)和软磁盘的记录介质提供的。另外,该程序可以通过网络等从提供程序的服务器上下载来获得。在两种情形中,它都被转换成可执行形式并且存储在根据本买施例的存储器设备40中。
另外,根据本实施例,重写规则用于在自然语言和通用语言之间的转换。像上述程序,该重写规则可以记录在记录介质上的形式来提供。或者可以通过网络获得它们。接着,该重写规则被存储于存储器设备40中。该重写规则可以通过对应于自然语言来分别提供。这里,可以提供相同的重写规则,并且将其应用于其结构是类似的和/或许多单词是共同的两或三种语言上。
图2示出了在本实施例使用的用于将自然语言的表达转换为通用语言的表达的一种***的功能结构。如图2所示,该结构包括:转换准备处理部分100,用于准备通用语言表达所基于的自然语言表达的数据;转换规则部分200,用于存储要参考用于将自然语言的表达转换为通用语言的表达的重写规则,以兼容至少一种自然语言;转换处理部分300,用于通过参考存储在所述转换规则部分200中的重写规则,来执行将由所述转换准备处理部分100给定的自然语言的表达转换为通用语言的表达的转换处理;存储处理部分400,用于执行在存储器设备40中存储所创建的通用语言的表达的处理;以及输出处理部分500,用于执行在创建处理和创建处理之后的过程中输出表达的处理。
转换准备处理部分100执行用于采集转换处理部分300所参考的自然语言表达的数据的处理。该采集处理可以包括下列步骤,例如:它可以是用于接收代表自然语言表达的字符串数据的输入的处理,所述数据是经由键盘21输入的。另外,它可以是用于从存储器设备40中读取在存储器设备40中保持的代表以自然语言表达的字符串数据的处理。还有,它可以是用于采集经由通信控制设备50接收的字符串数据的处理。
转换规则部分200具有:通用语言字典210,用于对应于每个自然语言元素具有的信息块,以构建通用语言的通用语言元素来定义构建自然语言的自然语言元素;以及重写规则220,用于定义在根据自然语言的句子结构排列的通用语言元素之间的连接关系,并且用于以包括两种通用语言和指示它们具有特定关系的关系的二元关系来撰写连接关系。它们两个都存储在存储器设备40中。这里,所述通用语言字典210和所述重写规则220在本实施例中是分别处理的。然而,本发明不限于此。例如,所述通用语言字典210和所述重写规则220能够作为一个重写规则组合地处理而不进行区分。或者,能够进一步细分所述通用语言字典210和所述重写规则220中的每一个。
通用语言字典210包括以在通用语言中使用的对应自然语言组元的符号所撰写的通用语言元素的集合。作为通用语言元素,至少写定义由自然语言的对应组元指示的含义的信息和定义自然语言的对应组元的评价(evaluation)的信息之一。每个通用语言元素(element)提供有指示通用语言元素对应其自然语言的句子元素的句子元素符号。图3示意地示出了通用语言字典的结构的例子。在图3所示的例子中,当然仅示出部分的字典元素。在图3中所示的例子中的通用语言字典包括诸如‘a(“.@indef”),DET’以及‘man(“person”),N’等的描述。即,所述描述是采用X(“Y”),Z的形式。其中,自然语言的元素,即在本实施例中的英语元素被写为X。在上述例子中,‘a’和‘man’对应于此。
多数自然语言的元素是单词。当然,也可以写为非单词元素。例如,具有相同的拼写但有不同意思的元素被分别定义。另外,不规则动词的原形、过去式和过去分词被处理为独立的元素。
这里所描述的元素不限于独立的单词。例如,诸如词干和词尾(suffix)也可以被分别地加以处理。在此情形中,将它们添加到每个元素上作为指示其特性的信息。例如,指示时态的信息、或指示复数形式的信息等被添加于此。将规则动词的词干和词尾分开并且分别定义为独立的元素,图3所示的‘ask’和‘ed’对应于所述词干和词尾。还有,将‘ed’添加到名词的末端引起该名词作为形容词来使用。在此情形中,它被定义为具有不同于在动词末端词尾的特性的词尾。
对于Y,至少写定义通过自然语言的对应组元(component)而指示的含义的信息和定义自然语言的对应组元的评价的信息之一。
定义含义的信息对应于在上述例子中的‘person’。当然,定义含义的信息不限于名词,还可以是动词或形容词。
定义评价的信息对应于在上述例子中的‘.@indef’。即,它将名词的特性定义为不定冠词、并且能够是定义含义的信息。根据本发明,将它们称为属性符(attributer)。
指示诸如时态、意义、原因和事件的各种特性的信息能够被写为定义含义的信息。另外,取决于目标的条件,通过例如将它们用逗号等分开,能够将各种信息写在一起。例如,在图3中所示的英语单词‘question(问题)’是以二元关系定义的。即,它被写为问题(“question(icl>thing)”)。这定义将英语的‘question’写为通用语言的‘question’。还有,它定义通用语言的‘question’具有‘(icl>thing)’的特性。所述‘(icl>thing)’是与概念有关的符号,并且‘question’被定义为包括在‘thing(事情)’概念中。其中,‘thing’指示通用语言中的事情概念。
对于Y,通过例如使用逗号将它们分开,能够将定义含义的信息和定义评价的信息写在一起。
句子元素符号被写为Z。它对应上述例子中的‘DET’或‘N’。该句子元素符号对应于指示例如自然语言的名词的信息。例如,‘DET’是意思为确定符的符号,并且指示它是确定诸如冠词的目标名词的特性的句子元素。‘N’是指示它是意思是名词的句子元素的符号。‘VTSTM’和‘ENDING’是分别指示及物动词的词干和词尾元素的符号。
重写规则220规定根据如图4所示的由编号1至10指示的自然语言的句子结构排列的通用语言元素之间的连接关系。例如,在图4中的编号1中,示出一种关系:句子S具有主语部分NP、和动词部分VP,并且它们通过关系agt连接。在编号2中,示出一种关系:VP具有作为及物动词的VT和作为名词短语的NP,并且它们通过关系obj连接。稍后将描述所述关系。
在编号3中,示出一种关系:对应于名词短语的NP由DET来连接。在编号4中,示出一种关系:对应于及物动词的VT由VTSTM和ENDING来连接。
在编号5或以下的那些规则在规则规定上与编号1至4的规则不同。例如,在编号5中,示出一种关系:通过除去自然语言的元素,即‘DET(“.@indef”)’,DET用‘a(“.@indef”)’来连接。在编号6和其后的规则中同样是如此。
根据本发明,通用语言字典210和重写规则220是在当从自然语言的表达中创建通用语言的表达时使用的。相同的重写规则能够在从通用语言的表达中创建自然语言的表达时使用。由此,一旦创建了通用语言的表达,就能够容易地创建各种自然语言的表达。稍后将描述怎样通过利用通用语言字典210和重写规则220来创建通用语言的表达。
转换处理部分300执行通用语言元素重写处理310,用于参考通用语言字典,以将构建给定自然语言表达的组元重写为在通用语言字典中的对应通用语言元素。另外,该转换处理部分300执行二元关系创建处理320,用于通过根据排列利用重写规则来连接多个被重写的通用语言元素,和用于根据二元关系中的符号规则创建以二元关系表达的通用语言表达。该转换处理是通过执行主要在操作设备10中的程序来执行的。
存储处理部分400执行用于存储在存储器设备40中的操作设备10中所处理的结果的处理。该处理是通过操作设备10来执行的,并且存储器设备40响应于该处理,存储从所述操作设备中输出的数据。该数据可根据要求来读取。
输出处理部分500执行用于在显示设备31中显示输入数据、处理结果等的处理,和用于使得打印机打印它们的处理。所述显示和打印是以独立处理来执行的。
接着,将描述作为本发明特征的二元关系。在本发明中使用的二元关系是如下列等式来定义的:[等式1]<二元关系>∷=<关系>[“:”<复合通用单词ID>]
          “(“{<通用单词1>|”:“<复合通用单词ID1>}”,
          “{<通用单词2>|”:“<复合通用单词ID2>}”)”其中
∷=指示将......定义为......;
|指示逻辑和“或”;
[]指示能够根据需要被添加的可选元素;
{}指示替换的元素;
“”指示被包括在其中的字符和/或符号;以及
<xxx>是变量名。
通过利用上述等式,能够精确地获得各种表达。简单的例子包括:
and(quickly,easily),
and(Mary(icl>person),John(icl>person))。
前者指示“quickly”和“easily”的意思。后者指示“Mary”和“John”的意思。其中,符号()指示存在写在()内的关于该元素的约束。这些将结合在通用语言上的描述来描述。
复合通用单词是基于用于指示复合概念的二元关系的集合。复合通用单词ID是用于确认属于复合通用单词的集合的二元关系的确认符。通过指定该确认符,能够将该复合通用单词作为通用单词使用。这里,该复合通用单词ID是由例如字母表大写字母或两位数字来表达的。
偶尔地,对于通用单词,通过使用如稍后描述的等式6所示的通用单词ID,相同内容的表达也能够被参考。
二元关系是通用语言中的表达,即,句子块。所述二元关系是由两个通用单词和一种关系构成的。在通用语言中,所述二元关系是通过被称为关系(relation)的具有三个或更少的字符的符号来预定义和规定的。在通用单词之间的关系取决于该通用单词的特性而不同,并且使用了诸如agt、and、aoj、obj以及icl的对应关系。例如,这些关系预定义如下:关系:agt:引起事件(event)的事情(thing)and:两个概念之间的连接关系aoj:具有属性的事情bas:用作基础和/或比较度的事情cag:引发隐含事件的事情cao:具有隐含属性的事情cnt:等同的概念cob:隐含事件的目标con:以所聚焦事件或状态为条件的事件和/或状态coo:所聚焦事件或状态的并发事件或状态dur:事件发生或状态存在的时间段fmt:两个事情之间的范围frm:事情的起源gol:目标或与目标相关的事情的最终状态ins:执行事件的仪器man:执行一事件或状态的特性的方式met:执行一事件的装置mod:限制所聚焦目标的事情nam:事情的名称obj:直接受一事件影响的在焦点中的事情or:在两个概念之间的选择关系per:基准单位plc:事情发生的地方或状态存在的地方plf:事件开始的地方或状态变为真的地方plt:事件结束的地方或状态变为伪的地方pof:整个和部分关系pos:事情的处理器ptn:引发事件合并的非聚焦事情pur:事件或事情的存在的目的qua:事情或单位的数量rsn:事件或状态发生的原因scn:事件发生的场景seq:所聚焦事件或状态的在先事件或状态src:目标或与目标相关的事情的初始状态tim:事件发生或状态变为真的时间tmf:事件开始或状态变为真的时间tmt:事件结束或状态变为伪的时间to:事情的目的地via:事件的中间位置或状态
接着,将描述在本发明中使用的通用语言。通用语言将由以下等式来定义。该等式的符号规则与在等式1中符号规则是相同的。[等式2]
<通用单词>∷=<标题>[<约束列表>]
              [“:”<通用单词ID>][“.”<属性列表>]
<标题>是由字符串构成的,并且可以包括例如购买或预定。通用语言可以仅需要由计算机来处理。由此,不总是需要以人可读形式来表达它。然而,以人可读形式定义它会更方便。由此,在本实施例中,通用语言是基于如上所述的英语来定义的。即使用其它语言例如日语来定义它也将没有问题。
从定义等式的形式中显而易见,在最简单的形式中,通用语言能够仅由标题来构成。
一般地,在语言元素上存在各种约束。因而,在本实施例中,以()来指示一个或多个约束作为约束列表。能够将多个约束写在一起。在该情形中,它们用逗号分开。该约束列表定义如下:[等式3]
<约束列表>∷=“(“<约束>[“,”<约束>]...”)”其中...意指一个或多个对象(subject)出现。
列示在约束列表中约束被定义如下:[等式4]<约束>∷=<关系>{“>”|“<”}<通用单词>[<约束列表>]|<关系>{“>”|“<”}
 <通用单词>[<约束列表>][{“>”|“<”}<通用单词>[<约束列表>]]...
在该方式中,通用语言包括:非约束的基本通用单词、带有一些约束的受限通用单词、以及特定类型的受限通用单词。所述基本通用单词包括英语中的例如‘go(去)、take(取)、house(房屋)’。所述受限通用单词包括能够由上述定义表达的各种通用单词。例如,如下将示出其中‘state(状态)’具有四个不同约束的情形。
state(agt>person(人),obj>information(信息))
state(equ>nation(国家))
state(icl>situation(情形))
state(icl>government(政府))
特定受限通用单词的例子将表达如下:
ikebana(icl>activity(活动),obj>flowers(花))
samba(icl>dance(舞蹈))
确认所述特征的信息包括属性。属性是由以下等式定义的:[等式5]
<属性列表>∷=<属性符>[“.”<属性符>]...
通用语言中的属性包括:与说话人相关的诸如过去、现在和未来的时间;与他/她是否急切相关的说话人的观点;说话人的与共同话题相关的参考观点;说话人在说话人注意点上的关注;说话人对话题的兴趣有多强;以及说话人的意见。典型地,将它们定义如下:属性符@ability:           can(能够)@ability-past:      could(曾经能够)@ability-future:    will be able to(将能够)@affirmative:        affirmation(肯定)@apodosis-cond:      conditional apodosis(条件归结子句)@appodosis-real:     real apodosis(真归结子句)@apodosis-unreal:    unreal apodosis(非真归结子句)@begin just:         indicates that an event has just begun
                   (指示事件刚开始)@begin-soon:         indicates that an event is about to begin
                   (指示事件将要开始)@complete:           completion(完成)@conclusion:         conclusion(结论)@confirmation:       confirmation(确认)@custom:             custom(惯例)@def:                definite(限定的)@emphasis:           emphasis(强调)@end-just:           indicates that an event has just ended
                   (指示事件刚结束)@end-soon:           indicates that an event is about to end
                   (指示事件将要结束)@entry:              focus(聚焦)@exclamation:        admiration(称赞)@expectation:        expectation(期望)@future:             future(未来)@generic:            a generic term(一般术语)@grant:              grant(准予)@grant-not:          must not(不一定)@indef:              indefinite(非限定的)@imperative:         order(命令)@inevitably:         inevitably(不可避免地)@insistence:         insistence(坚持)@intention:          intention(意图)@interrogative:      question(有疑问的)@invitation:       invitation(邀请)@may:              permission(许可)@not:              denial(否定的)@obligation:       duty(责任)@obligation-not:   no duty(无责任)@ordinal:          ordinal number(顺序编号)@past:             past(过去的)@politeness:       politeness(礼貌)@possibility:      possible(可能)@present:          present(当前的)@probability:      probability(可能性)@progress:         in the middle ofan event(在事件中间)@qfocus:           focus of a question(问题的焦点)@repeat:           repetition(重复)@respect:          respect(尊重)@should:           nuturally(自然地)@state:            a state,which is reached after an end of an event
                 (在一事件结束之后达到的状态)@theme:             theme(主题)@topic:             topic(话题)@unexpectation:     unexpectation(不期望)@will:              will(意愿)
接着,通用单词ID被用于通过字母和数字等确认目标,以在当例如存在能够参考的表达、或当存在相同的表达时指定该目标。所述通用单词ID能够被定义如下:[等式6]
<通用单词ID>∷={<字母表大写字母>|<数字>}
                {<字母表小写字母>|<数字>}
除了字母表大写字母和小写字母以及数字之外,能够与所述字母和数字一起使用下列符号来指示应用于本实施例中的二元关系:[等式7]
“_”|“*”|“#”|“!”|“$”|“%”|“=”|“^”|“~”|“|”|“@”|“+”|“-”|“<”|“>”|“?”
接着,将描述根据本发明创建通用语言的表达的具体例子。在以下例子中,将描述其中表达(句子)是以对应英语表达(句子)‘the man asked aquestion(那个男人问了个问题)’的通用语言创建的情形。图3所示的通用语言字典和图4所示的重写规则被用于该创建。其中,图4中的重写规则是从右至左应用到通用语言的创建中的。即,它是以与在该重写规则中所描述的箭头(→)所指示的方向相反的方向来应用的。其中,从通用语言到自然语言的转换是以由箭头指示的方向来执行的。
操作设备10经由转换准备处理部分100采集要翻译的目标句子‘the manasked a question’到RAM13。在该例子中,它是经由键盘21输入的。接着,操作设备10的CPU11在通过通用语言字典210中搜索输入的该英语句子中的第一个单词。接着,检索‘(“.@def”),DET’。接着应用图4中的重写规则6以获得以下结果:[等式8]
DET(“.@def”)man asked a question
接着,CPU11通过通用语言字典210搜索在英语句子中的下一个单词‘man’。接着,检索‘man(“person”),N’。接着,应用在图4中的重写规则8以获得以下结果:[等式9]
DET(“.@def”)N(“person”)asked a question
接着CPU 11通过通用语言字典210搜索在英语句子中的下一个单词‘asked’。接着,检索‘ask(“ask(icl>do”),VTSTM’。接着,应用在图4中的重写规则9以获得以下结果:[等式10]
DET(“.@def”)N(“person”)VTSTM(“ask(icl>do)”)ed a question
接着,CPU11通过通用语言字典210搜索在上述英语句子中的单词‘asked’的结尾‘ed’。接着,检索‘ed(“.@past”),ENDING’。接着,应用在图4中的重写规则10以获得以下结果:[等式11]
DET(“@def”)N(“person”)VTSTM(“ask(icl>do)”)ENDING(“.@past”)a question
接着,CPU11通过通用语言字典210搜索在英语句子中的下一个单词‘a’。接着,检索‘a(“.@def”),DET’。接着,应用在图4中的重写规则5以获得以下结果:[等式12]DET(“.@def”)N(“person”)VTSTM(“ask(icl>do)”)ENDING(“.@past”)DET(“.@indef”)question
接着,CPU11通过通用语言字典210搜索在英语句子中的下一个单词‘question’。接着,检索‘question’。接着,应用在图4中的重写规则7以获得以下结果:[等式13]DET(“.@def”)N(“person”)VTSTM(“ask(icl>do)”)ENDING(“.@past”)DET(“.@indef”)N(“question(icl>thing)”)
接着,在确定在该英语句子中的‘question’后没有单词之后,CPU11停止字典搜索,并且在重写结果上执行进一步的重写处理。能够基于句号、问号、冒号等的出现来执行在该英语句子中再没有要搜索的单词的决定。
此后,CPU 11进一步通过应用重写规则1至4执行重写。
CPU 11从所述重写结果的开始读取句子元素符号,并且参考图4中所示的重写规则从该句子的开始确定邻近句子元素符号之间的关系。例如,在上述重写结果的情形中,句子元素符号的从开始的安排次序是‘DET、N、VTSTM、ENDING、DET、N’。接着,对‘DET’和‘N’应用重写规则3,以获得‘NP(“person.@def”)’。结果,获得以下结果:[等式14]NP(“person.@def”)VTSTM(“ask(icl>do)”)ENDING(“@past”)DET(“.@indef”)N(“question(icl>thing)”)
接着,CPU 11将重写规则4应用到‘VTSTM’和‘ENDING’以获得‘VT(“ask(icl>do).@past”)。结果,获得以下结果:[等式15]NP(“person.@def”)VT(“ask(icl>do).@past”)DET(“.@indef”)N(“question(icl>thing)”)
接着,CPU11将重写规则3应用到‘DET’和‘N’以获得‘NP(“question.@indef”)’。结果,获得以下结果:[等式16]NP(“person.@def”)VT(“ask(icl>do).@past”)NP(“question.@indef”)
接着,CPU11确定在结束时没有将要被重写的目标。接着,CPU11读取句子元素符号,并且参考图4中所示的重写规则从句子的开始确定邻近句子元素符号之间的关系。例如,在上述重写结果的情形中,句子元素符号的安排次序是‘NP’、‘VT’、和‘NP’。其中,在开始处不能够将该重写规则应用到‘NP’和‘VT’。由此,CPU 11首先应用重写规则2到‘VT’和‘NP’以获得下列结果:[等式17]
NP(“person.@def”)
VP(“ask(icl>do)(obj>question.@indef).@past”)
还有,CPU11读取包括在重写结果中的句子元素符号并且在其上应用规则1。接着,获得以下结果:[等式18]S(“ask.@entry(agt>person.@def,obj>question.@indef”)
由此,创建了通用语言的表达。该通用语言能够被解释如下:在通用语言中的单词‘ask’意指自然语言中的‘ask’,并且说话人基于属性符‘entry’的出现聚焦于‘ask’。通用单词‘ask’具有约束,并且该约束的内容意指引发事件的事情(agt),即‘ask’,是限定的(.@def),即‘person’,并且由该事件直接影响的事情是非限定的(.@indef),即‘question’。
从该组元中显而易见,通用语言中的这个表达不包括自然语言中的组元。由此,当从曾经获得的通用语言中创建自然语言时,如果存在对应于要被翻译的语言的重写规则,则从/到任意的语言的转换成为可能。
上述例子中使用的通用语言字典和重写规则仅是全体的一部分。例如,为通用语言字典准备大约一百万个单词。偶尔地,当本发明用于特定目的时,能够使用较小数量的单词。
接着,将参考图5描述基于通用语言的表达创建自然语言的表达的一种语言转换***。
合并图2所示的语言转换***以及图5所示的语言转换***,以便通过以自然语言-通用语言-自然语言的形式通信来避免语言上的不同。
图5所示的语言转换***包括:转换规则部分200,用于存储与至少一种自然语言兼容的、要被参考用于将自然语言的表达转换为通用语言的表达的重写规则;以及反转换处理部分350,用于通过参考存储在所述转换规则部分中的重写规则来执行从给定的通用语言的表达到自然语言的表达的转换处理。
所述转换规则部分200具有与图2所示的转换规则部分相同的结构。准备对应要输出的自然语言的重写规则。已经给出了关于转换规则部分200的描述,并且由此在此不加以重复。
所述反转换处理部分具有二元关系解析处理360,它根据包括在二元关系的表达规则中的规则、通过参考对应于目标自然语言的重写规则、将以二元关系撰写的通用语言表达解析为构建连接的通用语言元素。另外,反转换处理部分具有自然语言元素转换处理370,它通过参考对应于目标自然语言的通用语言字典将已解析的通用语言元素重写为构建自然语言表达的组元,以创建该目标自然语言的表达。所述反转换处理主要是通过执行在操作设备10中的程序来执行的。
存储处理部分400和输出处理部分500与上述的存储处理部分和输出处理部分是相同的。然而,存储处理部分400从存储器设备40中读取通用语言的表达,并且将其传送给反转换处理部分350。
接着,将描述根据本发明将通用语言的表达翻译为自然语言的表达的处理。
在该反翻译中,图3和图4中所示的重写规则被用于以二元关系表示的通用语言的表达。其中,图4所示的重写规则是从左至右依次应用到自然语言表达的创建中的。即,该规则是以在重写规则中所示的箭头指示的方向来应用的。
其中,将描述在接着的等式19中的、其中由二元关系表示的通用语言的表达被反翻译为自然语言的表达的一种情形。在以下所示的等式19中的表达与上述等式18中的表达相同。当然,所述反翻译能够在任意表达上执行。操作设备10的CPU 11搜索转换规则部分200中的重写规则220或通用语言字典210,并且由此检索对应的结果以前进到以下的处理。由此,将省略与搜索相关的描述。[等式19]S(“ask.@entry(agt>person.@de,obj>question.@indef”)
操作设备10的CPU 11通过应用规则1将在等式19中以二元关系表示的通用语言表达‘S’解析为‘NP’和‘VP’,以获得以下结果:[等式20]
NP(“person.@def”)
VP(“ask(icl>do)(obj>question.@indef).@past”)
接着,CPU11通过应用规则3将在所述结果中的NP(“person.@def”)解析为DET和N,以获得以下结果:[等式21]
DET(“.@def”)N(“person”)
VP(“ask(icl>do)(obj>question.@indef).@past”)
接着,CPU11通过应用规则5将在所述结果中的‘DET(“.@def”)’重写为‘The’,以获得以下结果:[等式22]
The N(“person”)VP(“ask(icl>do)(obj>question.@indef).@past”)
接着,CPU11通过应用规则8将‘N(“person”)’重写为‘man’,以获得以下结果:[等式23]
The man VP(“ask(icl>do)(obj>question.@indef).@past”)
接着,CPU11通过应用规则2将‘VP’重写为‘VT’和‘NP’,以获得以下结果:[等式24]
The man VT(“ask(icl>do).@past”)NP(“question.@indef”)
接着,CPU11通过应用规则4将‘VT’重写为‘VTSTM’和‘ENDING’,以获得以下结果:[等式25]
The man VTSTM(“ask(icl>do)”)ENDING(“.@past”)
NP(“question.@indef”)
接着,CPU11应用规则9并且接着应用规则10,以获得以下结果:[等式26]
The man asked NP(“question.@indef”)
接着,CPU11通过应用规则3将‘NP’解析为‘DET N’,以获得以下结果:[等式27]
The man asked DET(“.@def”)N(“question(icl>thing)”)
接着,CPU11应用规则5并且接着应用规则7,以获得以下结果:[等式28]
The man asked a question
由此,创建了作为一种自然语言的英语表达。同时,英语在本实施例中是作为一种自然语言使用的,但并不意图限于此。诸如日语,法语以及汉语的各种语言都可使用。
接着将通过使用能够执行转换处理和反转换处理两者的一种***的例子来描述本方面的另一实施例。
该实施例不同于图2和图5所示的实施例,并且包括能够执行如图6所示的转换和反转换的翻译/反转换处理部分390。所述转换和反转换处理部分390具有:通用语言元素转换处理310、二元关系创建处理320、二元关系解析处理360以及自然语言元素转换处理370。所述通用语言元素转换处理310、二元关系创建处理320、二元关系解析处理360以及自然语言元素转换处理370以如在上面已经描述的图2和5中所示的***中的对应单元一样的方式工作。由此,这里将省略重复的描述。
转换规则部分200具有与自然语言兼容的一个或多个重写规则。同时以上已经描述了该转换规则部分200。由此,这里将省略重复的描述。
其中,当所述转换规则部分200具有与例如英语兼容的重写规则时,在英语和通用语言之间的相互转换得以执行。另外,当存在与英语、德语、汉语以及日语兼容的相应种类的重写规则时,如果以这些种类语言中的任何一种语言输入具有相同内容的句子,则能够获得以相同通用语言表达的句子。接着,基于以相同通用语言表达的句子,获得分别以英语、德语、汉语以及日语表达的具有相同内容的句子。
图6示出了其中一种语言由相同的硬件***进行翻译和反翻译的一例子。然而,本发明不限于此。例如,能够将本发明应用于其中信息是跨越网络交流的情形中。图7示出了在该情形中的一种模式。
在图7所示的模式中,连接到网络N上的有:通用语言表达数据存储服务器S1,用于存储以通用语言表达的、跨越网络N发送的数据,并且用于根据请求将通用语言表达数据发送到网络;语言翻译服务器S2,用于将以自然语言表达的、跨越网络N发送的数据翻译为以通用语言表达的数据,并且用于发送到网络N;语言反翻译服务器S3,用于将以通用语言表达的、跨越网络N发送的数据翻译为以自然语言表达的数据,并且将其送到网络N;英语表达输出终端T1,用于将以作为一种自然语言的英语表达的数据输出到网络上;日语表达输出终端T2,将以作为另一种自然语言的日语表达的数据输出到网络上;以及通用语言表达输出终端T3。
其中,可以将图2所示的***用作终端S2。另外,可以将图5所示的***用作终端S3。尽管没有在图7的模型中示出,可以将在图6中所示的使用该***的服务器连接于此。
所述通用语言表达数据存储服务器S1存储以相同通用语言表示的数据,即使原本数据是以任何种类的自然语言撰写的。通过将以通用语言表达的数据作为原本,可以集中地执行版本管理等。而且,由于以多种语言表达的数据是以不重叠的方式存储的,数据服务器可以得到有效地利用。
在其它方面,直到使用了由于有了服务器S2和/或S3所以能够转换为通用语言的一种自然语言,才能够执行母语通信。另外,通过在国际合作下创建与各种自然语言兼容的重写规则,能够获得与各种语言兼容的语言转换服务器S2和语言反转换服务器S3。由此,甚至是使用不很经常得到翻译的语种的人们也能够以他们的母语接触原本是各种语言的信息。因而,有一个益处是能够流畅地执行国际交流。
由此,根据本发明,通过准备对应每个自然语言的重写规则,任何自然语言能够以通用语言来表达。还有,所述通用语言是以不受原本自然语言的元素和语法影响的形式撰写的。由此,当一种语言的信息被通信为其它语言时,通过利用通用语言的表达使得信息的国际通信和有效存储成为可能。能够容易地以像英语通信般低的成本将具有较少被转换信息的语言的内容通信给使用不同种类语言的许多人。
因为能够将本发明的通用语言翻译为自然语言,所以通过检查反转换表达能够容易地确定自然语言的原本表达是否经由通用语言的表达得以精确地通信。由此,通用语言的表达能够是精确的。而且,通用语言是通过使用二元关系清楚地撰写的,并且由此能够精确地执行从通用语言到自然语言的翻译。因而,当在国际上通信相同的信息时,使通用语言的表达作为正本是有益的。
虽然在以上例子中描述了自然语言,然而能够将本发明应用于严格说不是自然语言的语言的表达,例如诸如世界语(Esperanto)的人造语言或诸如计算机语言的机器语言。
根据本发明,有一个益处是以小的成本容易和精确地在各种语言之间通信。

Claims (13)

1.一种用于转换语言的***,包括:
转换规则部分,用于存储对应于至少一种自然语言的、被参考用于将自然语言的表达转换为通用语言的表达的重写规则;
转换处理部分,用于通过参考存储在所述转换规则部分中的、对应于自然语言的重写规则,将给定自然语言的表达翻译为通用语言的表达;以及
反转换处理部分,用于通过参考存储在所述转换规则部分中的、对应于目标自然语言的重写规则,将通用语言的表达转换为目标自然语言的表达,
其中,所述转换规则部分具有作为对应自然语言的重写规则的:
通用语言字典,用于通过构建通用语言的通用语言元素来定义构建自然语言的自然语言元素,它对应于每个自然语言元素具有的信息;以及
重写规则,用于规定在根据以自然语言的句子结构安排的通用语言元素之间的连接关系,并且用于以包括两个通用单词和指示它们具有一定关系的关系的二元关系来表达所述连接关系,
其中,所述转换处理部分执行用于参考对应于自然语言的通用语言字典将构建自然语言表达的组元重写为其对应的在通用语言字典中的通用语言元素的处理、以及用于通过根据在通用语言元素中的次序应用对应于目标自然语言的重写规则来连接多个重写的通用语言元素的处理、以及用于根据在二元关系中的表达规则创建以二元关系表示的通用语言的表达,以及
其中,所述反转换处理部分执行用于根据包括在所述规则中的以二元关系表示的规则、参考对应于目标自然语言的重写规则、将以所述二元关系表示的通用语言的表达解析为构建其连接的通用语言元素的处理;以及用于参照对应于目标自然语言的通用语言字典将已解析的通用语言元素重写为构建自然语言表达的组元、以创建目标自然语言的表达的处理。
2.根据权利要求1所述的***,其中:
所述转换规则部分存储对应多种语言的多种重写规则,
其中,所述转换处理部分通过使用对应于给定种类的自然语言的重写规则创建通用语言的表达,以及
其中,所述反转换部分通过使用在多种重写规则中对应于目标自然语言的一类重写规则从通用语言的表达中创建目标自然语言的表达。
3.根据权利要求1所述的***,还包括:
通信控制部分,用于执行用于接收跨越网络发送的自然语言的表达的处理;以及用于通过网络输出从通用语言的表达中转换来的自然语言的表达。
4.一种用于转换语言的***,包括:
转换规则部分,用于存储对应至少一种自然语言的、被参考用于在自然语言的表达和通用语言的表达之间转换的重写规则;以及
反转换处理部分,用于通过参考存储在所述转换规则部分中的所述重写规则将给定通用语言的表达转换为自然语言的表达,其中,所述转换规则部分具有作为对应自然语言的重写规则的:
通用语言字典,用于通过构建通用语言的通用语言元素来定义构建自然语言的自然语言元素,它对应于每个自然语言元素具有的信息;以及
重写规则,用于规定在根据以自然语言中的句子结构安排的通用语言元素之间的连接关系,并且用于以包括两个通用单词和指示它们具有一定关系的关系的二元关系来表达所述连接关系,
其中,所述反转换处理部分执行用于根据包括在所述规则中的以二元关系表达的规则、参考对应于目标自然语言的重写规则、将以所述二元关系表示的通用语言的表达解析为构建其连接的通用语言元素的处理;以及用于参考对应于目标自然语言的通用语言将已解析的通用语言元素重写为构建自然语言表达的组元以创建目标自然语言的表达的处理。
5.根据权利要求4所述的***,还包括:
通信控制部分,用于接收通过网络发送的自然语言的表达;以及用于通过网络输出已转换的通用语言的表达。
6.根据权利要求1、2、3、4及5中任一权利要求所述的***,还包括:
存储处理部分,用于执行存储通用语言的表达的处理;以及
反转换指令部分,用于接收用于将所存储的通用语言的表达转换为用于输出的特定自然语言的指令,以使得所述存储处理部分执行用于读取所存储的通用语言的处理,以及用于指令所述反转换处理部分将所读取的通用语言的表达转换为目标自然语言的处理。
7.根据权利要求1、2、3、4及5中任一权利要求所述的***,
其中,所述通用语言字典包括:由在通用语言中使用的、为与自然语言中的组元兼容的符号所表示的通用语言元素的集合;以及将指示自然语言中的哪个对应句子元素对应于每个通用语言元素的句子元素符号添加到每个通用语言元素上;以及
其中,所述转换处理部分通过基于所述句子元素符号、根据通用语言元素的次序应用重写规则来连接多个重写的通用元素。
8.根据权利要求1、2、3、4及5中任一权利要求所述的***,
其中,所述通用语言字典包括:由在通用语言中使用的、为与自然语言中的组元兼容的符号所表达的通用语言元素的集合;以及将指示自然语言中的哪个对应句子元素对应于每个通用语言元素的句子元素符号添加到每个通用语言元素上;并且在其中表示识别由自然语言的对应组元表达的含义的信息和识别自然语言的对应组元相关的评价的信息中的至少一种信息;以及
其中,所述转换处理部分通过基于所述句子元素符号、根据通用语言元素的次序应用重写规则来连接多个重写的通用元素。
9.一种计算机可读程序,用于使得计算机执行用于通过参考事先给定的重写规则将给定自然语言的表达转换为通用语言的表达的处理;以及用于通过参考所述重写规则将通用语言的表达反转换为目标自然语言的表达的处理,
其中参考了作为对应自然语言的重写规则的:通用语言字典,用于通过构建通用语言的通用语言元素来定义构建自然语言的自然语言元素,它对应于每个自然语言元素具有的信息;以及重写规则,用于规定在根据以自然语言的句子结构安排的通用语言元素之间的连接关系,并且用于以包括两个通用单词和指示它们具有一定关系的关系的二元关系来表达所述连接关系,
其中,当执行所述转换处理时,使得计算机执行用于参考对应于自然语言的通用语言字典,将构建自然语言表达的组元重写为其对应的在通用语言字典中的通用语言元素的处理、以及用于通过根据在通用语言元素中的次序应用对应于目标自然语言的重写规则来连接多个重写的通用语言元素的处理、以及用于根据在二元关系中的表达规则创建以二元关系表示的通用语言的表达,以及
其中,当执行所述反转换处理时,使得计算机执行用于根据包括在所述规则中的以二元关系表达的规则、参考对应于目标自然语言的重写规则、将以所述二元关系表示的通用语言的表达解析为构建其连接的通用语言元素的处理;以及用于参考对应于目标自然语言的通用语言将已解析的通用语言元素重写为构建自然语言表达的组元,以创建目标自然语言的表达的处理。
10.一种计算机可读程序,用于使得计算机通过参考事先给定的重写规则去执行用于将给定通用语言的表达反转换为目标自然语言的表达的处理,
其中参考了作为重写规则的:通用语言字典,用于通过构建通用语言的通用语言元素来定义构建自然语言的自然语言元素,它对应于每个自然语言元素具有的信息;以及重写规则,用于规定在根据以自然语言的句子结构安排的通用语言元素之间的连接关系,并且用于以包括两个通用单词和指示它们具有一定关系的关系的二元关系来表示所述连接关系,
其中所述计算机被使得执行:
用于根据包括在所述规则中的以二元关系表达的规则、参考对应于目标自然语言的重写规则、将以所述二元关系表示的通用语言的表达解析为构建其连接的通用语言元素的处理;以及
用于参考对应于目标自然语言的通用语言将已解析的通用语言元素重写为构建自然语言表达的组元,以创建目标自然语言的表达的处理。
11.一种计算机可读记录介质,在其上记录了根据权利要求9或权利要求10的程序。
12.一种用于支持自然语言的通信的方法,以可从用于通过网络执行的通信的终端访问的方式提供:
语言转换服务器,用于执行用于将自然语言的表达翻译为通用语言的表达的处理;以及语言反转换服务器,用于执行用于将通用语言的表达反转换为自然语言的表达,
所述语言转换服务器具有:
转换规则部分,用于存储对应于被支持用于通信的多种自然语言的多种重写规则,所述重写规则被参考用于在自然语言的表达和通用语言的表达之间转换;
转换处理部分,用于通过参考存储在所述转换规则部分中的对应于自然语言的重写规则将自然语言的表达转换为通用语言的表达;以及
通信控制部分,用于接收通过网络发送的自然语言的表达;以及用于通过网络输出已翻译为通用语言的表达。
所述语言反转换服务器具有:
转换规则部分,用于存储对应于被支持用于通信的多种自然语言的多种重写规则,所述重写规则被参考用于在自然语言的表达和通用语言的表达之间转换;
反转换处理部分,用于通过参考存储在所述转换规则部分中的对应于目标自然语言的重写规则,将通用语言的表达转换为目标自然语言的表达;以及
通信控制部分,用于接收通过网络发送的通用语言的表达;以及用于通过网络输出已反转换为自然语言的表达,
其中,由语言转换服务器和语言反转换服务器两者所包括的转换规则部分具有作为对应于自然语言的重写规则的:
通用语言字典,用于通过构建通用语言的通用语言元素来定义构建自然语言的自然语言元素,它对应于每个自然语言元素具有的信息;以及
重写规则,用于规定在根据在自然语言的句子结构安排的通用语言元素之间的连接关系,并且用于以包括两个通用单词(word)和指示它们具有一定关系的关系的二元关系来表示所述连接关系,
所述方法包括步骤:当语言转换服务器接收到通过网络发送的自然语言的表达时,由转换处理部分执行:用于参考对应于自然语言的通用语言字典将构建所接收的自然语言表达的组元(component)重写为对应于在通用语言字典中的通用语言元素的处理;以及用于通过根据在通用语言元素中的次序应用对应于目标自然语言的重写规则来连接多个重写的通用语言元素的处理、以及用于根据在二元关系中的表达规则创建以二元关系表示的通用语言的表达;以及
当语言反转换服务器接收到通过网络发送的通用语言的表达时,由反转换处理部分执行:用于根据包括在所述规则中的以二元关系表达的规则、参考对应于目标自然语言的重写规则、将所接收的通用语言的表达解为构建其连接的通用语言元素的处理;以及用于参照对应于目标自然语言的通用语言字典将已解析的通用语言元素重写为构建自然语言表达的组元以创建目标自然语言的表达的处理。
13.根据权利要求12所述的方法,还提供通用语言表达数据存储服务器,用于存储以通用语言表示的数据,所述服务器通过网络连接到所述语言转换服务器和语言反转换服务器,
所述方法包括步骤:由所述通用语言表达数据存储服务器接收和存储由语言转换服务器转换的通用语言表示数据,和输出所存储的通用语言表达数据到语言反转换服务器上。
CNB008178879A 1999-11-17 2000-11-17 语言翻译*** Expired - Fee Related CN1271545C (zh)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
JP327526/99 1999-11-17
JP327526/1999 1999-11-17
JP32752699 1999-11-17

Publications (2)

Publication Number Publication Date
CN1415096A true CN1415096A (zh) 2003-04-30
CN1271545C CN1271545C (zh) 2006-08-23

Family

ID=18200098

Family Applications (1)

Application Number Title Priority Date Filing Date
CNB008178879A Expired - Fee Related CN1271545C (zh) 1999-11-17 2000-11-17 语言翻译***

Country Status (6)

Country Link
US (1) US7107206B1 (zh)
EP (1) EP1233347A4 (zh)
JP (1) JP4291532B2 (zh)
CN (1) CN1271545C (zh)
AU (1) AU1415201A (zh)
WO (1) WO2001039035A1 (zh)

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN105338161A (zh) * 2014-06-30 2016-02-17 展讯通信(上海)有限公司 一种语句信息匹配***及方法以及移动终端
CN105677635A (zh) * 2015-12-29 2016-06-15 聚熵信息技术(上海)有限公司 用于自然语言交互的方法、设备及***
CN110083806A (zh) * 2014-03-26 2019-08-02 微软技术许可有限责任公司 用于语言转换的时间转换语法

Families Citing this family (21)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US8812300B2 (en) 1998-03-25 2014-08-19 International Business Machines Corporation Identifying related names
US20050119875A1 (en) * 1998-03-25 2005-06-02 Shaefer Leonard Jr. Identifying related names
US6963871B1 (en) * 1998-03-25 2005-11-08 Language Analysis Systems, Inc. System and method for adaptive multi-cultural searching and matching of personal names
US8855998B2 (en) 1998-03-25 2014-10-07 International Business Machines Corporation Parsing culturally diverse names
US6424969B1 (en) * 1999-07-20 2002-07-23 Inmentia, Inc. System and method for organizing data
US6944619B2 (en) * 2001-04-12 2005-09-13 Primentia, Inc. System and method for organizing data
EP1353280B1 (en) * 2002-04-12 2006-06-14 Targit A/S A method of processing multi-lingual queries
US20040158561A1 (en) * 2003-02-04 2004-08-12 Gruenwald Bjorn J. System and method for translating languages using an intermediate content space
US8689125B2 (en) * 2003-10-23 2014-04-01 Google Inc. System and method for automatic information compatibility detection and pasting intervention
US7475390B2 (en) * 2004-01-12 2009-01-06 International Business Machines Corporation System and method for automatic natural language translation during information transfer
US7478336B2 (en) 2003-11-06 2009-01-13 International Business Machines Corporation Intermediate viewer for transferring information elements via a transfer buffer to a plurality of sets of destinations
US7340685B2 (en) 2004-01-12 2008-03-04 International Business Machines Corporation Automatic reference note generator
US20070005586A1 (en) * 2004-03-30 2007-01-04 Shaefer Leonard A Jr Parsing culturally diverse names
JP2007034813A (ja) * 2005-07-28 2007-02-08 National Institute Of Advanced Industrial & Technology 複数自然言語のソフトウェア説明書生成システム
US20080221868A1 (en) * 2005-09-05 2008-09-11 Melnick Einat H Digital universal language
US20080162109A1 (en) * 2006-12-28 2008-07-03 Motorola, Inc. Creating and managing a policy continuum
JP5100445B2 (ja) * 2008-02-28 2012-12-19 株式会社東芝 機械翻訳する装置および方法
US20090300126A1 (en) * 2008-05-30 2009-12-03 International Business Machines Corporation Message Handling
FR3050843B1 (fr) * 2016-04-29 2022-07-15 Thierry Grenot Procede et plateforme de communication homogene entre humains et objets connectes
US10929617B2 (en) * 2018-07-20 2021-02-23 International Business Machines Corporation Text analysis in unsupported languages using backtranslation
CN109636619B (zh) * 2018-12-07 2020-11-24 京东数字科技控股有限公司 量化平台的回测方法、装置、电子设备和可读介质

Family Cites Families (17)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS60238966A (ja) * 1984-05-14 1985-11-27 Fujitsu Ltd 仮名漢字逆変換処理方式
CN1013006B (zh) 1985-04-01 1991-06-26 株式会社日立制作所 自然语言智能指导的方法与装置
US4864503A (en) * 1987-02-05 1989-09-05 Toltran, Ltd. Method of using a created international language as an intermediate pathway in translation between two national languages
JP3114181B2 (ja) * 1990-03-27 2000-12-04 株式会社日立製作所 異言語交信用翻訳方法およびシステム
JPH0414175A (ja) 1990-05-07 1992-01-20 Ricoh Co Ltd 自然言語文解析装置
JP3176059B2 (ja) * 1990-11-15 2001-06-11 キヤノン株式会社 翻訳装置
US5175684A (en) * 1990-12-31 1992-12-29 Trans-Link International Corp. Automatic text translation and routing system
ES2101613B1 (es) 1993-02-02 1998-03-01 Uribe Echebarria Diaz De Mendi Metodo de traduccion automatica interlingual asistida por ordenador.
US5432948A (en) * 1993-04-26 1995-07-11 Taligent, Inc. Object-oriented rule-based text input transliteration system
US5587903A (en) * 1994-06-22 1996-12-24 Yale; Thomas W. Artificial intelligence language program
US5884247A (en) * 1996-10-31 1999-03-16 Dialect Corporation Method and apparatus for automated language translation
JP3467159B2 (ja) 1996-12-03 2003-11-17 ブラザー工業株式会社 多言語対応通信システム、サーバー装置及びサーバー装置の文書送信方法
US6092035A (en) * 1996-12-03 2000-07-18 Brothers Kogyo Kabushiki Kaisha Server device for multilingual transmission system
US6233546B1 (en) * 1998-11-19 2001-05-15 William E. Datig Method and system for machine translation using epistemic moments and stored dictionary entries
US6356866B1 (en) * 1998-10-07 2002-03-12 Microsoft Corporation Method for converting a phonetic character string into the text of an Asian language
US6275789B1 (en) * 1998-12-18 2001-08-14 Leo Moser Method and apparatus for performing full bidirectional translation between a source language and a linked alternative language
JP4377096B2 (ja) * 1999-11-17 2009-12-02 国際連合 普遍言語による表現を生成するシステム

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110083806A (zh) * 2014-03-26 2019-08-02 微软技术许可有限责任公司 用于语言转换的时间转换语法
CN110083806B (zh) * 2014-03-26 2023-07-04 微软技术许可有限责任公司 用于语言转换的时间转换语法
CN105338161A (zh) * 2014-06-30 2016-02-17 展讯通信(上海)有限公司 一种语句信息匹配***及方法以及移动终端
CN105677635A (zh) * 2015-12-29 2016-06-15 聚熵信息技术(上海)有限公司 用于自然语言交互的方法、设备及***

Also Published As

Publication number Publication date
US7107206B1 (en) 2006-09-12
AU1415201A (en) 2001-06-04
JP4291532B2 (ja) 2009-07-08
EP1233347A4 (en) 2006-05-17
EP1233347A1 (en) 2002-08-21
CN1271545C (zh) 2006-08-23
WO2001039035A1 (fr) 2001-05-31

Similar Documents

Publication Publication Date Title
CN1415096A (zh) 语言翻译***
CN1161701C (zh) 语言识别装置和语言识别方法
CN1841367A (zh) 用于通过在语言之间执行翻译来支持交流的交流支持设备和方法
CN1095137C (zh) 字典检索装置
CN1869976A (zh) 通过执行不同语言之间的翻译来支持交流的装置和方法
CN1280705C (zh) 打印控制***、信息处理装置、功能提供装置
CN1113305C (zh) 语言处理装置和方法
CN1029265C (zh) 图形属性双向转换描述文件
CN1471029A (zh) 自动检测文件中搭配错误的***和方法
CN1368693A (zh) 用于全球化软件的方法和设备
CN1615480A (zh) 网络设备间配置文件的翻译
CN1969272A (zh) 自动生成内容的导入
CN1117160A (zh) 产生未知字母之字模的方法与***
CN1517904A (zh) 墨水划分器及关联的应用编程接口
CN1542649A (zh) 自然语言生成***中用于句子实现中排序的成分结构的语言信息统计模型
CN1838148A (zh) 电子设备和记录介质
CN1873685A (zh) 图像处理设备、方法和存储有程序的存储介质
CN101065746A (zh) 文件自动丰富的方法和***
CN1490744A (zh) 检索确认句的方法和***
CN101055588A (zh) 获取限制词信息的方法、优化输出的方法和输入法***
CN1873692A (zh) 图像处理装置、方法以及存储程序的存储介质
CN1680973A (zh) 基于网络服务应用的光学字符识别***和方法
CN1838061A (zh) 打印装置,图像处理装置,以及相关控制方法
CN1313561A (zh) 信息结构化及应用产生的方法及其装置
CN1702650A (zh) 用于将日文翻译成中文的设备和方法以及计算机程序产品

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
C14 Grant of patent or utility model
GR01 Patent grant
CF01 Termination of patent right due to non-payment of annual fee
CF01 Termination of patent right due to non-payment of annual fee

Granted publication date: 20060823

Termination date: 20161117