CN1119760C - 自然语言处理装置及方法 - Google Patents

自然语言处理装置及方法 Download PDF

Info

Publication number
CN1119760C
CN1119760C CN99801490A CN99801490A CN1119760C CN 1119760 C CN1119760 C CN 1119760C CN 99801490 A CN99801490 A CN 99801490A CN 99801490 A CN99801490 A CN 99801490A CN 1119760 C CN1119760 C CN 1119760C
Authority
CN
China
Prior art keywords
natural language
processing
language
affirmation
input
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
CN99801490A
Other languages
English (en)
Other versions
CN1275223A (zh
Inventor
浅野康治
广江厚夫
岛川真人
加贺美彻也
小林惠理香
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Sony Corp
Original Assignee
Sony Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Sony Corp filed Critical Sony Corp
Publication of CN1275223A publication Critical patent/CN1275223A/zh
Application granted granted Critical
Publication of CN1119760C publication Critical patent/CN1119760C/zh
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/40Processing or translation of natural language
    • G06F40/42Data-driven translation
    • G06F40/47Machine-assisted translation, e.g. using translation memory
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/40Processing or translation of natural language
    • G06F40/58Use of machine translation, e.g. for multi-lingual retrieval, for server-side translation for client devices or for real-time translation

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Health & Medical Sciences (AREA)
  • Artificial Intelligence (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Computational Linguistics (AREA)
  • General Health & Medical Sciences (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Machine Translation (AREA)

Abstract

一种自然语言处理装置,包含:输入自然语言的输入部;变换自然语言表现的表现变换部;为确认表现变换部变换的句而进行显示的显示部;对经确认的句进行机器翻译的机器翻译部;对上述各部进行控制的控制部。该装置能提供减少用户确认操作的自然语言处理。

Description

自然语言处理装置及方法
技术领域
本发明涉及处理自然语言的自然语言处理装置及方法,具体而言,涉及在处理过程中简化用户所作选择和确认的自然语言处理装置及方法。
背景技术
已往,利用诸如自动翻译、语音识别、文件检索、文件处理等自然语言处理的***已得到实用化。
作为已往这种***的例子,图1示出了已有技术语音翻译装置的处理过程的主要流程。
在该语音翻译装置的处理过程中,步骤S101输入语音,步骤S102识别语音,在步骤S103由用户确认该语音识别的结果。若用户认可语音识别的结果,则在步骤S104机器翻译识别结果,如果不认可,则回到步骤S101再执行语音识别。
在步骤S105,用户对在步骤S104机器翻译的结果进行确认,需要时在步骤S106实施编辑,最后在步骤S107产生合成语音,并结束该处理过程。
这样,在步骤S101,用户首先自己发话向语音翻译装置输入语音。在步骤S102语音翻译装置对输入的语音进行识别,显示其结果。在语音识别处理中可能引起误识别,故经常进行所谓用户确认识别结果的处理。
作为步骤S103中确认识别结果的方法,常用在识别处理中显示多个得分高的上层候选句再请用户从它们中加以选择的方法。然而,若显示的句中未包含自身讲的语句时,则再次输入语音。如果经用户确认确定了用户输入语音的句,则在步骤S104将该句翻译成目的语言。
通常,翻译处理也会出现输出中包含其它错误结果的可能性,为了保证翻译准确度,在步骤S105要进行用户确认翻译结果的作业。因而,如果翻译结果不正确,则在步骤S106编辑成恰当的目的语言表述。
然后,在步骤S107根据翻译结果产生合成语音加以输出,并结束该语音识别处理过程。
但是,在使用已有技术自然语言处理的***中,不能说已备有适合用户的界面(接口)。例如,在上述结构的语音翻译装置中,存在下面2个问题。
第一个问题是处理的自然语言的多样性和处理准确度的问题。用现有的机器翻译要想对多样的输入句作高准确度翻译是非常困难的。一般的机器翻译存在作为原语言的输入句要处理的体裁越多,翻译的准确度就越低的问题。另外,对输入句的句型或词汇加以限制虽能提高翻译准确度,但是,强制输入带有这种限制会增加用户负担。而且,在输入句上存在意思或修饰关系等的多义性或状况依存性等情况下,其翻译结果一般有多个。
为了唯一地指定翻译结果,可在翻译装置侧自动选择或请用户选择恰当的候选句,但前者可能选择不同的候选句,而后者若用户不详细了解目的语言将难作选择。作为后者的应用,采用的方法是,将翻译结果再次翻译成原语言,向用户提示再翻译结果,让用户选择、确认,这种方法在再翻译过程中会产生错误。另外,采用展现句结构树等内部表现或翻译处理过程记录等来代替提示翻译结果的方法,用户必须知道查找方式。因此,用户进行选择和确认是困难的。
上述问题不仅表现在机器翻译处理上,而且可以说表现在借助自然语言应用诸如数据库检索、表现支持等自然语言处理的所有装置上。
第二个问题是用户确认作业的问题。如果从用户确认作业出发观察一下上述处理过程,则用户需要对语音识别结果、机器翻译结果进行2次确认作业,故确认次数多,麻烦。
这可以说是对利用自然语言处理的多个模块进行组合的***的一般情形。例如,考虑采用假名汉字变换输入日语并用机器翻译将其译为英语的情况下,用户用假名输入日语,确认变换后的汉字,首先生成正确假名汉字混合的日语。然后将其作为输入进行日英翻译,其结果再由用户确认。
而且,在机器翻译情况下,当用户不习惯于目的语言时,存在的问题是确认该翻译结果是极困难的。
本发明的揭示
本发明是鉴于上述情况进行的,其目的在于提供一种能保持处理准确度同时能减少确认作业的自然语言处理装置及方法。
本发明的自然语言处理装置,包含输入自然语言的输入手段、对上述输入手段输入的自然语言进行表现变换的变换手段、对上述变换手段表现变换后的自然语言进行确认的确认手段,以及对上述确认手段确认后的自然语言进行翻译处理并且翻译成其它自然语言的处理手段;输出上述处理手段处理过的其它自然语言的输出手段。
本发明的自然语言处理装置包含:输入自然语言的输入手段、对自然语言进行处理的至少一个处理手段、对自然语言处理结果进行确认的至少一个确认手段,以及输出处理后自然语言的输出手段,其中,采用的结果是按照第1处理手段及确认其结果的第1确认手段的顺序处理后的结果,在上述第1处理手段之前设置第2处理手段和第2确认手段,所述第2处理手段将输入上述输入手段的自然语言变换为可高准确度处理的形式,所述第2确认手段确认所述第2处理手段的结果,从而进行省略对第1处理手段结果进行确认的提前确认。
本发明的自然语言处理装置具有:输入自然语言的输入手段;用第2语言的表现及第3语言的表现将输入所述输入手段的第1语言变换为一对一对应于所述第2语言表现的变换手段;对所述变换手段变换的所述第3语言的表现进行确认的确认手段;根据所述确认手段确认的结果对输入所述输入手段的自然语言实施处理的处理手段;输出经所述处理手段处理的自然语言的输出手段。
本发明的自然语言处理方法包含输入自然语言的输入过程、对所述输入过程输入的自然语言进行表现变换的变换过程/对所述变换过程表现变换的自然语言进行确认的确认过程,以及对所述确认过程确认的自然语言实施翻译处理并且翻译成其它自然语言的处理过程;输出经所述自然语言处理过程处理的其它自然语言的输出过程。
本发明的自然语言处理方法包含:输入自然语言的输入过程;对自然语言进行处理的至少一个处理过程;对自然语言处理结果进行确认的至少一个确认过程;输出处理后自然语言的输出过程,其中,采用的结果是按照第1处理过程及确认其结果的第1确认过程的顺序处理后的结果,在上述第1处理过程之前设置第2处理过程和第2确认过程,所述第2处理过程将输入上述输入过程的自然语言变换为可高准确度处理的形式,所述第2确认过程确认所述第2处理过程的结果,从而进行省略对第1处理过程结果进行确认的提前确认。
本发明的自然语言处理装置具有:输入自然语言的输入过程;用第2语言的表现及第3语言的表现将在所述输入过程输入的第1语言变换为一对一对应于所述第2语言表现的变换过程;对所述变换过程变换的所述第3语言的表现进行确认的确认过程;根据所述确认过程确认的结果对在所述输入过程输入的自然语言实施处理的处理过程;输出经所述处理过程处理的自然语言的输出过程。
这样,在本发明中,不是将用户输入的句(除句外还包括短语和子句,以下也一样)直接用于自然语言处理,而在其间加有“表现变换处理”和“确认/选择等待”。另外,上述自然语言处理与表现变换处理同时进行,并对这样生成的“自然语言处理结果和表现变换处理结果对”进行确认/选择。也即,进行表现变换处理,将输入的句变换为能对后续的自然语言进行高准确度处理的句,使得接近用户的意图。表现变换处理可不在机器翻译处理前进行,而与机器翻译处理同时进行。
在“确认等待”和“机器翻译”之间,也可***“再变换处理”。该处理在“表现变换”内不改变文句的意思和微细差别,只是作部分语序等的改变。这样,供给用户的文句能够比较接近输入的文句,供给翻译处理的文句可为适合于处理的句。
表现翻译变换处理可不在机器翻译处理前进行,而与机器翻译处理同时进行。此时,每一翻译处理预先备有对应的表现变换处理,从而某句中用某个翻译处理时也用相应的表现变换处理。于是,生成翻译结果与表现变换处理的对。然后,进行“确认/选择”,提示该对或只提示表现变换结果。
本发明分成准确度可保证的处理和不能保证的处理,对于连续多个功能模块的处理也可将准确度不能保证部分的处理加以汇总处理,之后,用户进行确认作业,因而减少了用户的确认次数。也即,在上述处理过程中,在一次确定语音识别结果后,不进行机器翻译,而进行语音识别结果照原样保持多个可能性的机器翻译处理,用户仅对其结果进行确认。
附图的简单说明
图1为已有技术语音翻译装置处理过程的主要流程图;
图2为表示翻译装置主要结构的框图;
图3为表示一例模板的示意图;
图4为表示对译辞典的一例示意图;
图5为表示表现变换规则一例的示意图;
图6为对于“バ ツグを買いたいのですが、見せていただけないでしようか?”(想买个包,能让看看吗?)变换结果的说明图;
图7为表示翻译装置处理过程的流程图;
图8为翻译装置处理过程且为带有再变换处理的流程图;
图9为表示语音翻译装置主要结构的框图;
图10为表示语音翻译装置外观的立体图;
图11为表示语音翻译装置处理过程的流程图;
图12为语音翻译装置中处理例的说明图;
图13为表示对译模板例的示意图;
图14为表示输入和输出例的示意图;
图15为表示输入和输出例的示意图;
图16为表示附加注解的模板例的示意图;
图17为表示相对于输入“すいません”的输出例的示意图;
图18为表示相对于输入“~が、~”的输出例的示意图;
图19A为表示使用提前确认前的示意图;
图19B为表示使用提前确认后的示意图;
图20A为表示使用迟后确认前的示意图;
图20B为表示使用迟后确认后的示意图;
图21A为表示使用提前和迟后确认前的示意图;
图21B为表示使用提前确认后的示意图;
图21C为表示使用提前和迟后确认后的示意图;
图22A为表示语音翻译的示意图;
图22B为表示对图22A使用提前确认的示意图;
图22C为表示对图22B使用迟后确认的示意图;
图22D为表示对图22C使用迟后和综合确认的示意图。
实施发明用的最佳形态
下面参照附图说明本发明较佳结构例。
首先说明利用自然语言处理进行机器翻译的翻译装置,作为本发明第1实施例。
翻译装置如图2所示,包含:显示表现变换、机器翻译等结果的显示部1;接受输入的输入部2;对表现形式进行变换的表现变换部3;变换为其它语言的机器翻译部4;控制该翻译装置各部分的控制部5。
显示部1例如由液晶显器等构成,并根据控制部的指令显示表现变换、机器翻译等。
输入部2例如由多个按钮或触摸面板等构成。用户可用它们对显示部显示的信息进行选择或进行***动作的选择。输入部2也接受翻译对象句的输入。然后,输入部2将用户输入的结果传送给控制部5。
表现变换部3例如由CPU、ROM、RAM等构成,并通过控制部5接受用户输入输入部2的结果。然后,将从控制部5获取的输入结果变换为机器翻译部4要处理的形式。表现变换部3将变换结果传送给控制部5。
机器翻译部4,与表现变换部3一样也是例如由CPU、ROM、RAM等构成,并通过控制部5接受表现变换部3的变换结果。机器翻译部4将从控制部5接收到的变换结果翻译成其它语言,然后将翻译成其它语言的结果传送给控制部5。
控制部5,与表现变换部3及机器翻译部4一样,也是由如CPU、ROM、RAM等构成,并进行数据传送控制,例如将输入输入部2的数据传送给表现变换部3,将表现变换部3的变换结果传送给机器翻译部4。控制部5还利用控制信号对该翻译装置的各部分进行控制。
表现变换部3、机器翻译部4及控制部5,除了如上述那样独立构成外,也可由同一CPU、ROM、RAM构成的控制块内的功能块构成。
接着,说明该翻译装置中利用自然语言的机器翻译。
在该翻译装置中,对翻译方法、翻译前语言(原语言)或翻译后语言(目的语言)没有特别限制。但在下面的说明中,假定采用对译模板,采用替换模板上的语句生成翻译结果的方法作为翻译方法。而且,原语言取日语,目的语言取英语。
对译模板由日语部分和将其译为英语的英语部分构成。在图3所示的对译模板例中,分别有如下对应关系:“X please.”对应于“X《物》を下さい。”;“Iwant to go to X.”对应于“私はX《场所》に行さたい。”;“Would you showY X?”对应于“X《物》をY《人》に见せてください。”;“S1,but S2.”对应于“S1《句》しかしS2《句》”;“S1,and S2.”对应于“S1《句》そしてS2《句》”;“S1.So S2.”对应于“S1《句》だからS2《句》”;“Thank you.”对应于“すいません(=ありがとう)”;“I am sorry.”对应于“すいません(=谢る)”;“Excuse me.”对应于“すいません(=呼びかけ)”;“X go byY.”对应于“X《人》がY《乘り物を》を使う(=XがYに乘る)”;“X consumeY.”对应于“X《人》がYを使ぅ(=XがYを消费する)”。
在对译模板中,日语部分为日语的句、子句、短语、单词等。下面为简单起见,将它们统称为句。日语部分的一部分也可用变量表示,而且也可指定该变量应满足的属性。例如,在图3的1中的“X《物》を下さい”中,“X《物》”中的X是变量,这里可代入具有属性“物”的词。各词的属性记载在下文的对译辞典中。
对译模板的英语部分是日语部分的对应翻译。在日语部分包含变量情况下,英语部分的对应部分也包含变量。例如,图3的1中的日语部分“X《物》を下さい”中包含变量,则其英语部分“X please”的对应部分也包含变量。
对译辞典记载有日语的词、与该日语词对应的英语语词、和应满足的属性。作为对译语辞典的例子如图4所示,列举对应关系有,英语“I”及属性“人”对应于日语“私”;英语“apple”及属性“物”对应于日语“リンゴ”;英语“London”及属性“地方”对应于英语“ロンドン”。
下面,说明表现变换部3中的表现变换处理。
表现变换部3通过控制部5接受用户输入到输入部2的句。然后进行变换使得能对该句进行高准确度的变换。在本实施例中,表现变换部3将用户用日语输入的日语句进行变换,使日语与对译模板的日语部分匹配。
作为表现变换部3中的变换,除了1:1变换外,还可考虑m:1变换或1:n变换、或作为它们进一步组合的n:m变换等。
这里,1:1变换就是对一个输入文句变换结果为一个的变换。m:1变换就是对m个输入文句变换结果为一个的变换。1:n变换就是对一个输入文句、变换结果为n个的变换。
表现变换,一般可考虑融合、分割、***、删除、置换、顺序替换。
如上所述,表现变换规则以变换后请求用户选择、确认为前提,故候选对象为多个也没关系,也可作若干细微差别发生变化的变换。
下面,作为主要变换规则,说明句末用变换规则、复合句分解用规则、多义表达用规则、空缺要素补充规则,及顺序交换规则。
句末用变换规则,是在对于一个意图存在多个表现且主要表现在句末差别情况下使这些多个表现对应于单个表现的规则。
作为句末用变换规则,例如在用日语表达委托的情况下,将“してください”、“してもらえませんか”、“していただけないでしようか”、“してはほしいのですが”等多个表现置换为“してください”单一表现。这就是上述用m:1变换的例子。
如果按照图5的变换规则,则句末用变换规则有如下各对应关系,“~て下さい”对应于“~てもらえませんか”;“~て下さい”对应于“~ていただけないでしようか”;“~たい”对应于“~たいのです”;“~たい”对应于“~たいのですが”。
复合句分解用规则,因接续助词或接续词产生多义性,故这种情况下生成多个置换成单义接续词的交替部分。复合句分解规则是用上述1:n变换进行分割的例子。作为多义的复合句,如“~が、~”可顺向连接也可反向连接。
若用图5变换规则,则复合句用变换规则有如下各对应关系,“~。しかし、~”对应于“~が《接续词》~”;“~。そして、~”对应于“~が《接续词》~”;“~。だから、~”对应于“~が《接续词》~”;“~。だから~”对应于“~て~”;“~。そして~”对应于“~て~”;“~。しかし~”对应于“~て~”。
多义表达用规则,对多义表达生成多个置换为单义表达的候选对象。这是用1:n变换进行置换的例子。多义表达如“すいません”,当向人表达感谢时、打招呼时或表示歉意时都可使用。
按照图5的变换规则,作为多义表达用规则有下面各对应关系,“すいません(=ありがとう)”对应于“すいません”;“すいません(=謝る)”对应于“すいまん”;“すいまん(=呼びかけ)”对应于“すいまん”;“Xを使う(=Xに乘る)”对应于“Xを使う”;“Xを使ぅ(=Xを消費する)”对应于“Xを使う”。
空缺要素补充规则是一种作英翻译时处理中将空缺要素用于输入句的情况下进行该要素补充的规则。例如是翻译“これを見せてください”时补充“私に”的规则。补充词的缺省例如记载在对译模板中。这就是进行***的例子。
按照图5的变换规则,作为空缺要素补充规则有下面各对应关系,“(これを)見せてください”对应于“見せてください”;“(あれを)見せてください”对应于“見せてください”;“(それを)見せてください”对应于“見せてください”。
顺序交换规则,是一种在不改变意思范围内替换语序用的规则。例如输入句为“それを私に下さい”、模板上为“XをYに下さい”的情况下,替换输入句中“それを”和“私に”,变换为“私にそれを下さい”,使能与模板匹配。这是进行顺序替换的例子。
按照图5的变换规则,顺序交换规则有下面各对应关系,“XがYを”对应于“YをXが”;“XがYに”对应于“YにXが”;“XがYにZを”对应于“XがZをYに”;“XがYにZを”对应于“YにXがZを”;“XがYにZを”对应于“YにZをXが”;“XがYにZを”对应于“ZをXがYに”;“XがYにZを”对应于“ZをYにXが”。
即使对所输入的句或词实施这些变换也不能与对译模板中日语部分匹配的语句,用某种适当的尺度进行最佳匹配,再请用户对该结果获得的N层候选对象进行选择,或显示“该输入不能处理”的消息。
一旦表现变换部3对所输入句的表现进行变换,其结果就提示给用户进行确认、选择。
也即,请用户确认表现变换部3的变换结果是否符合其意图。变换结果为多个的情况下,提示这些结果,请用户选择符合其意图的那个。
作为确认、选择的方法有:每当使用上述变换规则时进行的方法、全部使用后只进行一次的方法,以及某次使用时进行的方法等。
表现变换规则中如顺序交换规则,是在文句含义基本不变情况下进行的。这种规则是在用户进行确认、选择后使用的,可进行再变换。也即,在句的含义大致不变的情况下,可对确认、选择后的变换候选对象进行再次变换的再变换。
通过增加这样的再变换处理,可在确认、选择时用与输入句相同的语序进行,并将适合于处理的句提供给翻译处理。
下面,对表现变换部3中进行的表现变换处理进行举例说明。
作为这里处理的例子,列出图6所示输入“バツグを买いたいのですが、见せていただけないでしようか?”(想买个包,能让看看吗?)时的变换过程。在该例中,假定每使用一个规则就进行确认、选择,但在其它时间也可进行确认、选择。
首先,在步骤S1,从控制部5将“バツグを買いたいのですが、見せていただけないでしよぅか?”的输入句送入表现变换部3。
在步骤S2,表现变换部3用复合句分解用的“~が~”项目将输入句分解成2个句,再补上单义接续词。由于接续词可能是顺接、反接或原因,故补充3种接续词“しかし”、“そして”及“だから”。
这样一来,上述输入文句被变换成3种句“バツグを買いたいのです。しかし、見せていただけないでしようか?”、“バツグを買いたいのです。そして、見せていただけないでしようか?”及“バツグを買いたいのです。だから、見せていただけないでしよぅか?”。然后,这3种句显示在显示部1上。
用户从显示部1提示的这3种句选择第3个句“バツグを買いたいのです。だから、见せていただけないでしようか?”。
在步骤S3,表现变换部3对所选择的第3个句使用文末变换用规则,变换成简单并符合用户意图的表现。通过使用文末变换用规则,“~たいのです”变为“~たい”;“~ていただけないでしようか?”变为“~で下さい”。也即,上述第3个句变换为“バツグを買いたい。だから、見せてください”。
在步骤S4,表现变换部3对该句使用空缺要素补充规则,补充英译时空缺的要素。使用图5所示变换规则,对“バツグを買いたい”补充“私は”,对“見せてください”补充“それを”和“私に”。
在步骤S5,表现变换部3将输入句变换为最后的“(私は)バツグを買いたい。だから、(それを)(私に)見せてください。”。该句由于与对译模板中日语部分匹配,故能获得比最初输入句准确度高的翻译。
上述例中,在翻译的原语言内进行表现变换,故用户能方便进行确认、选择。
此外,考虑从日语翻译成德语的情况,用机器作自动翻译时,通常英德翻译的准确度比日德翻译的高。因而,在用户除了日语外还熟悉英语的情况下,也可以实现这样的***结构,即先从日语翻译成英语进行表现变换,在用户确认该结果后再翻译成德语。
下面,参照图7所示流程说明翻译装置中机器翻译的处理过程。
在第一步骤S11,进行输入等待,等待用户对输入部2输入句子。一旦句子输入到输入部2,所输入的句通过控制部5送入表现变换部3。
在步骤S12,表现部3在原语言内变换输入的句。在接着的步骤S13,将步骤S12中变换过的句显示在显示部1上,等待用户确认、选择。
在步骤S14,用机器翻译部4对步骤S13中确认,选择的文句进行翻译处理。在步骤S14将翻译结果显示在显示部1上,并结束该处理过程。
这样一来,用户输入的句不是直接经受自然语言处理,即上述例情况下,不是直接经受机器翻译处理,而且其间增添“表现变换处理”和“确认、选择等待”。
表现变换处理将输入文句变换为接近用户意图的句,同时变换成能高准确度执行后续自然语言处理的文句。该处理以表现变换后请用户确认、选择为前提,故变换准确度末必高就可以了,且变换结果生成多个也没关系。
在上述处理过程中,如图8所示,在步骤S12的原语言内变换处理后续的步骤S13的确认、选择等待的下面,还可进行步骤S21的再变换处理。其它过程与图7所示的处理过程相同,故附加同一标号。
这样一来,在“确认、选择等待”与“机器翻译”之间也可***“再变换处理”。这种处理在“表现变换”内不改变句的含义或细微差别,例如只是进行替换部分语序的变换。于是,提示给用户的能够是比较接近输入句的句子,且送给翻译处理的能够是适合于处理的句。
下面,说明利用自然语言处理进行语音翻译的语音翻译装置作为本发明第2实施例。
首先,说明语音翻译装置的构成。为了简单起见,在语音翻译装置中与上述翻译装置相同部分附加同一标号。
如图9所示,语音翻译装置包含:显示各种信息的显示部1;接受输入的输入部2;变换句表现的表现变换部3;翻译句的机器翻译部4;进行语音识别处理的语音识别部7;生成合成语音的语音合成部8;对该语音翻译装置各部分进行控制的控制部5。
显示部1例如用液晶显示器等构成,并根据控制部5的指令显示各种信息。
输入部2例如用多个按钮或触摸面板等构成,用户利用它对显示在显示部1的信息进行选择,或对与***动作有关的菜单进行选择,并将用户产生的输入结果传送给控制部5。
语音识别部7例如用拾音器、AD变换器、运算部、存储部等构成,用拾音器输入用户发出的语音,对输入的语音进行AD变换,变成数字信号,进行识别处理。也即,语音识别部7识别用户发音的内容,并将对应于发音内容的识别结果输出给控制部。
语音合成部8例如用运算部、存储部、DA变换部、扬声器等构成,从控制部5接受经机器翻译部3翻译过的句,生成合成语音,从扬声器输出。
图10示出语音合成装置外观的一例,在大致平坦的正方体形的壳体20的前面,具有构成显示部1的大致矩形的液晶显示器21、构成输入部2的各种按钮22、将语音输入语音识别部7的拾音器24,以及输出语音合成部8的合成语音的扬声器25。
下面,参照图11所示流程说明语音合成装置中的处理过程。
语音翻译装置中的处理过程将语音输入的日语作为原语言,翻译成英语作为目的语言,并输出英语的合成语音。
在第一步骤S31中,用户以语音输入日语,在接着的步骤S32,语音识别部7进行识别处理。
在步骤S33,将语音识别部7来的语音识别结果用表现变换部3变换为日语的其它表现。然后在步骤S34将变换结果显示在显示器1,用户进行确认、选择。此时,显示器1显示的并不是语音识别结果本身,而是显示表示相同意思内容、意图的其它句。
该处理就是相当于上述翻译装置中原语言内变换的处理。其不同点在于,在翻译装置中对一个输入句实施处理,与此相反,在该语音翻译装置中对作为语音识别结果获得的多个候选句实施变换处理。
在步骤S35,由于步骤S34中用户产生的确认、选择的结果选择再输入时,作为“YES”(是)返回步骤S1。不选择再输入时,作为“NO”(否)进入步骤S36。
在步骤S36,将用户确认的句作为对象,在机器翻译部4中进行机器翻译变换,并输出英语句。此时,用户选择再输入,则再次进行语音输入。最后,在步骤S37,语音合成部8以机器翻译部4输出的英语翻译结果为基础进行语音合成,输出英语合成语音。然后结束该处理。
在本实施例中,机器翻译限定在能确保处理语体的翻译准确度的范围内。于是,将语音识别结果得到的各种语体输入变换为上述范围内语体产生的表现。然后用户确认其内容,虽然与用户输入的句不同,但可确认其意思内容、意图相同。因而,能确保将其作为输入。
此外,根据本实施例,可维持高准确度的语音翻译结果,同时用户可只作一次确认。
下面,参照图12说明语音翻译装置中处理的具体例。
首先,在语音翻译装置中,用户输入“大英博物館に行きたいのですが。”的语音。语音识别部7对该输入进行语音识别处理,并以例如识别得分高的多个候选句的形态输出,作为识别结果。具体而言,对于诸如假名等的输入,输出3个候选句“大英博物館に行きたいのですが。”、“大英博物館に行つてみたい。”及“大英博物館に行つたのですが。”。
下面,表现变换部3对所获得的语音识别结果进行表现变换处理。在此例情况下,由于“大英博物館に行きたいのですが。”与“大英博物館に行つてみたい。”含义非常接近,故变换成1个表现“大英博物館に行きたい。”。然后“大英博物館に行つたのですが。”变换成“大英博物館に行つた。”。这两个句显示在显示部1的液晶显示器上。
用户从所显示的句中选择接近自身语音含义内容、意图的句“大英博物館に行きたい。”。然后,机器翻译部4机器翻译所选择的句,生成英文“I want to goto the British museum.”,语音合成部8对其进行语音合成,输出英语语音。
在此实施例中,也可以进一步增加应用得分的处理。
即,语音识别处理中,在一般利用嵌入马尔可夫模型进行识别处理的过程,对识别结果的选句评分,并对该值进行比较,从而输出最有可能的候选句作为1个或多个识别结果。此外,图5所示的表现变换规则,以语料库数据(corpus data)为基础,利用对规则使用次数作统计等技术,就能给出各规则使用频度的得分。
因此,当产生表现变换结果时,对这两个得分分别进行适当加权并加以累计,就能使用它们。
在此实施例,组合语音识别与机器翻译的语音翻译装置中,推迟语音识别中的确认,与表现变换处理的变换结果的确认合并,减少了确认次数。但本发明并不限定于这种组合。
例如,在组合假名汉字变换与自然语言信息检索的情况下,也可取这样的结构,即不确认对假名输入的汉字变换的结果,将其推迟,并进行表现变换,从若干个汉字变换候选对象中直接提取关键字,并将该结果提示给用户供确认、选择。此外,作为后续处理也可采用表现支援等。
下面,说明本发明第3实施例。
该实施例虽采用上述翻译装置,但表现变换部3只进行句末表现置换、简化等简单处理,机器翻译部4除了进行从原语言变换为目的语言外,还在原语言内变换为其它表现。
本实施例虽不依赖翻译方法,但在下面的说明中采用对译模板的方式加以说明。且原语言为日语,而目的语言为英语。
图13示出对译模板的例子。对译模板具有原语言的日语部分和将其翻译成目的语言英语的目的语言部分,此外还具有记载变换为原语言其它表现的所谓“原语言内的变换”的部分。
在图13的对译模板中,作为多义变换有如下各对应关系,“Thank you.”及“すいません(=ありがとう)”对应于“すいません”;“I’m sorry.”及“すいません(=謝る)”对应于“すいません”;“Excuse me.”及“すいません(=呼びかけ)”对应于“すいません”;“X use Y.”及(言い换えなし)对应于“XがYを使ぅ”;“X go by Y.”及“XがYで行く”对应于“XがYそ使う”;“Xconsume Y.”及“XがYを消費する”对应于“XがYを使う”。
在图13的对译模板中,作为空缺要素补充有如下各对应关系,“X use Y.”及“私はXを使う。”对应于“Xを使ぅ”;“X go by Y.”及“私はXで行く。”对应于“Xを使う”;“X consume Y.”及“私はXを消費する”对应于“Xを使う”。
在图13所示的对译模板中,作为复合句展开有如下各对应关系,“S1,but S2.”及“S1、しかしS2”对应于“S1が、S2”;“S1,but S2.”及“S1、そしてS2”对应于“S1か、S2”;“S1,but S2.”及“S1。S2”对应于“S1か、S2”。
在图13的对译模板中,日语部分和英语部分与前述对译模板例的相同。
在该对译模板中,“原语言内的变换”部分是用日语表达的与英语部分一一对应的表现。所谓“一一对应的表现”就是,在日语部分为多义情况下通过变换或注释变为单义的表现;在日语部分存在空缺要素情况下对其加以补充的表现。
例如,在图13中,日语部分的“すいません”多义有3种,故其英译文也有3种,但是,在“原语言内的变换”部分中用日语预先写有分别对应的非多义性的表现。例如,在“I’m sorry.”预先写有“すいません(=謝る)”;在“Thank you.”预先写有“すいません(=ありがとう)”;在“Excuse me.”预先写有“すいません(=呼びかけ)”。
例如,对于日语部分的“Xを见せてください”的英译文必须补充相当于“谁に”的词,即补充空缺要素。如果补充“私に”,则英语部分变成取“Please showme X.”,则在“原语言内的变换”部分写成“Xを私に見せてください”,预先补充“私に”。
下面,就机器翻译、变换处理而言,一旦有用户输入,就在输入与对译模板的日语部分间取匹配。在匹配前可对输入进行句末表现等的变换,因而能减少模板数。作为句末表现的变换,可列举如将“~します”的输入变换为“~する”。
如果取得模板匹配,据此可作成英译文,与此同时,也可作成日语的变换。如图14所示,在输入为“これに見せてください”情况下,对图13的模板10取得匹配,据此作成英译文和变换。但是,这里假定是按照“これを彼に见せてあげてください”进行的。
然后,提示输入变换结果“これを私に見せてください”及英译文结果“Pleaseshow me this.”及其后的英译文和变换对,供用户确认。另外,也可以只提供变换结果。用户可查看变换部分,确认英译文是否正确。
通过查看该变换结果,用户可获知与自己意图不同的翻译,并丢弃该变换结果。
又,如图15所示,输入为“鐵道を使う”情况下,在图13的对译模板中有3种与输入匹配的模板。分别对这些生成英译文和变换。对它们进行提示,供用户选择最佳的变换、英译文。
具体而言,生成:变换结果“私は鐵道を使う”及英译文结果“I use thetrain.”;变换结果“私は鐵道で行く”及英译文结果“I go by train.”;变换结果“私は電車を消費する”及英译文结果“I consume the train.”。
用户根据变换结果可选择第2个变换结果“私は鐵道で行く”及英译文结果“I go by train.”。
在模板***下,设有含义属性的制约等,这样可减少匹配模板的数量,但由于制约不够,故存在多个模板的匹配。在本实施例中,即使在上述情况下,用户也能选择确认适合的翻译结果。
所谓“同时进行表现变换和机器翻译”的这种方法,由于表现变换用的数据和机器翻译用的数据处于同一位置,故具有即使数据量增加也容易兼容的优点。
此第3实施例也能通过对第1实施例作以下变形来实现。
第1实施例翻译装置的表现变换部3生成N个最佳候选对象,在该阶段不进行选择、确认,而是将它们传送给翻译部4,以此延期确认。于是,生成N个由翻译结果和表现变换结果对构成的候选对象。对这些候选对象进行选择、确认。
示出以下那样的变形例进一步说明“与表现变换同时进行的机器翻译”。
如果来看一看图13的变换、翻译用模板的“原语言内的变换”部分,就会发现有进行变换的部分和添加简单注释的部分。
如图16所示,若将它们分开并分别记载于不同的栏中,则不管是处理上或模板编制上都有优点。
也即,作为处理上的优点是,若能将“变换”与注释分开,则在不进行变换而是仅添加注释的情况下能容易地进行判别。仅添加注释的情况与要变换的情况相比,能以更简单的处理完成。
作为模板编制上的优点是,在仅添加注释的情况下,可减少描述所需要的工作。
有时会出现这种情况,即作业中有时没有想到进行适当的变换而只是添加注释。若预先将变换与注释分开,则在这种情况下可方便地先描述好注释,并在后来想到时描述变换。
作为表现上的优点是,由于将注释与变换结果分开,故有时分别生成注释和变换结果作为原语言内变换的结果。因此,能分别显示上述两者,提高了表现的自由度。
如图16所示,在将“变换”与注释分开加以描述的模板的例子中,虽然在“原语言内的变换”和“注释”栏中存在空栏,但这分别表示没有变换和不添加注释。
例如,若与图13相比,就“すいません”的变换而言,对于图13中“すいません(=謝る)”那样的变换,在图16中不进行,而是代替以添加注释“謝るときの表现”。
也即,对于图13中原语言“すいません”中作为多义用变换的“すいません(=謝る)”、“すいません(=ありがとう)”、“すいません(=呼びかけ)”分别对应于图16中作为注释的“謝るときの表现”、“感謝の表现”、“呼びかけの表现”,原语言内的变换为空白。
对于图13中原语言“XがYを使ぅ”、“Xを使ぅ”,与图16中原语言内变换相同,但注释为空白。
对于图13中作为原语言“S1が、S2”复合句展开的“S1。しかし S2”、“S1.そしてS2”、“S1。S2。”,图16中原语言内的变换相同,但是作为注释,分别对应于“逆説を表す”(否定表述)、“顺接を表す”(肯定表述)和“并列を表す”(并列表述)。
在原语言内处理时,分别生成“变换”和注释。因而,在显示变换结果、翻译结果阶段,两者都显示。
图17表示对输入的一例输出。输入为“すいません”,故与图16中模板的1、2、3匹配并加以输出。
也即,对于图16中的1,变成:变换为“すいません”;注释为“謝るときの表现”;英译文为“I’m sorry.”。图16中的2变成:变换为“すいません”;注释为“感謝の表现”;英译文为“Thank you.”。图16中的3变成:变换为“すいません”;注释为“呼びかけの表现”;英译文为“Excuse me.”。
图18表示对于输入的另一例输出。输入为“~が、~”,故与图16中模板的11、12、13匹配。这里,“~”表示某种适当的差别。
也即,对于图16的11变成:变换为“~。しかし~。”;注释为“逆说を表す”;英译文为“~,but~.”。对于图16的12变成:变换为“~。そして~。”;注释为“顺接を表す”;注释为“~,and~.”。对于图16的13变成:变换为“~。そして~。”;注释为“并列を表す”;注释为“~。~。”
这里,英译文中的“~”为表述上述差别“~”的英译文。
在图17和18中,用不同的项目显示“变换”和注释,但也可将它们显示成“变换(注释)”(例如,“すいません(謝るときの表现)”)。
下面,说明提前和迟后确认带来的确认次数的减少。
减少确认次数的技术中不限定应用于语音翻译装置,可用于具有多个“处理→结果确认”过程的任何自然语言处理***。
减少确认次数用的操作定义为下面的“提前确认”和“迟后确认”。
提前确认就是,在第1处理P1前增加第2处理P2和对第2处理P2的结果进行确认的第2确认C2,该第2处理P2将输入变换为能在第1处理P1中高准确度处理的形式,从而省略第1处理P1后的第1确认C1
迟后确认就是,将第1处理P1后的第1确认C1移到其后的第i处理Pi之后。或者,与后面的第j确认Cj合并,从而减少了确认次数。
这里的确认,就是当处理结果存在多个的情况下,也即存在多个选择条的情况下,用户从中选择适合的条。如果选择条都不合适,用户就选择“不正确”。
处理结果为1个的情况下,意味着用户确认它是否正确。下面,确认也采用同样的含义。
先说明“提前确认”。提前确认用于具有至少1组处理和确认的***。
例如,在图19A所示采用提前确认之前状态中,示出了第1处理P1和对应于它的第1确认C1
图19B示出采用后的状态,与上述相比,采用了提前确认,在第1处理P1之前增加了第2处理P2和对其结果进行确认的第2确认C2,代替并删除了对第1处理P1结果进行确认的第1确认C1。图中的空白框表示删除后的第1确认C1
第2处理P2将输入变换为能在第1处理P1中高准确度处理的形式,其处理内容取决于第1处理P1
例如,在提前确认“采用前”的***中,因输入包含多义性,故会出现处理后要确认(或处理准确度下降)的情况。此时,提前确认所需的第2处理P2进行将输入的多义性在数量上加以展开的处理。
例如,对于图5所示的“多义性表达规则”或“复合句分解规则”,第2处理P2进行将输入的多义性在数量上加以展开的处理。
利用这种提前确认,即使是用户难以确认结果的处理(如机器翻译),也能够在处理前确认,而不在处理后确认。
下面说明“迟后确认”。迟后确认用于具有至少两组处理和确认的***。
例如,在图20A所示提前确认采用前的状态中,示出前面的第1处理P1和第1确认C1,以及后面的第2处理P2和第2确认C2
图20B表示采用后的状态,采用了迟后确认,与上述相比,将确认前面第1处理P1结果的第1确认C1移到后面的第2处理P2之后,或与后面处理的第2确认C2合并进行一次确认。图中的空白框表示删除后的第1确认C1
在第1处理P1输出结果为多个的情况下,将这些结果全部传送给第2处理P2,在第2处理P2中对从第1处理P1送来的结果一个一个处理。然后,用户确认该结果。
下面,说明提前和迟后确认的组合。提前和迟后确认的组合用于具有2组以上处理和确认该处理结果的确认的***。
例如,在图21A的提前和迟后确认组合采用前状态中,示出第1处理P1、第1确认C1、第2处理P2和第2确认C2
如果对第2确认C2采用提前确认,则如图21B所示状态。也即在第2处理P2之前增加第3处理P3,作为“将输入变换为能在第2处理P2中高准确度处理的形式的处理”,还可接着增加对第3处理P3的结果进行确认的第3确认C3,进而删除第2确认C2。图中的空白框表示删除后的第2确认C2
接着,在图21B所示的对第2确认P2采用提前确认的状态中,如果对第1确认C1采用提前确认,则如图21C所示,第1确认C1与第3处理P3后的第3确认C3合并。这样一来,确认次数从2次减少到1次。图中的空白框表示移动后的第1确认C1的位置。
在该实施例中,也可以将它们置换为将2个处理合并为一个的处理,以便为“→第1处理P1→第3处理P3”那样连续处理。
某些第2处理P2的内容,用户确认处理结果有困难。这包括例如第2处理P2为翻译处理的情况。
即使对这样的***仅仅采用迟后并加以合并的确认,也会因确认仍然困难而使合并无意义。然而,按照本实施例如果将提前和迟后确认组合起来,则由于在第2处理P2之前进行确认,故能使确认变得容易,合并才有意义。
下面,说明将“提前”和“迟后”确认应用于语音翻译的具体例子。
已往的语音翻译***有作成图22A所示的形态。也即按照语音翻译R1、识别结果确认C4、机器翻译T1、翻译结果确认C5的顺序进行处理。
在图22A所示的已有技术的语音翻译***中,对“翻译结果确认C5”采用提前确认。也即,如图22B所示,在机器翻译处理T1之前增加表现变换处理T2和对其结果进行确认的变换结果确认C6作为“将输入变换为能在机器翻译中高准确度处理形式的处理”,代替并删除翻译结果确认C5
这里,若对照图21B,则表现变换T2相当于第2处理C2,变换结果确认C6相当于第3确认C3。图中的空白框表示删除后的翻译结果确认C5
在图22B所示对识别结果确认C4采用提前确认的状态中,如图22C所示,对“识别结果确认C4”采用迟后确认。也即,将“识别结果确认C4”移到“表现变换T2”之后,与“变换结果确认C6”合并,进行1次确认。这相当于实施例2的形态。
这里,后续于语音识别R1的空白框表示有经移动的识别结果确认C4的位置。
如图22D所示,对此进一步采用迟后确认,能同时进行表现变换和机器翻译。也即,对图22C中的“识别结果确认C4+变换结果确认C6”采用迟后确认,移到机器翻译处理T1后面。于是,由于连续进行“→表现变换T2→机器翻译T1→”这样2个处理,故能置换成将两者合在一起的处理(同时进行表现变换和机器翻译的处理)。
“表现变换T2+机器翻译T1”处理的输出包含着原语言的变换结果和目的语言的翻译结果。因此,用户确认处理结果与已有方法中确认翻译结果是不同的,是很容易进行的。
如上所述,上述实施例将输入的自然语言变换为另一表现,用户对其选择、确认后再施以处理。当具有多个自然语言处理和结果确认时,进一步进行提前、迟后确认,从而减少了用户的确认次数。也即,进行提前确认和迟后确认。前者在某个处理前,将输入变换为能在上述处理中高准确度处理的形式,增加其变换结果的确认,从而将省略对上述处理的确认;后者将某个处理后的确认与其后导入的对于确认提前所用处理进行的确认合并,从而减少了确认次数。
如上所述,本发明将输入变换成一个一个表现,提示给用户进行选择、确认。因此,能尽可能减少用户的确认操作,并能提供准确度高的自然语言处理。
按照本发明所提供的自然语言处理装置,能以尽可能少的确认操作、尽可能接近所希望输出的形态,获得保证准确度的输出结果。
在已往的翻译中,由于翻译语言的选择、确认实质上不可能,因此如果翻译单元的准确度不高,也即,如果不能输出唯一正确的解答,就不实用,但在本发明的翻译中,由于能适合翻译结果选择、确认,故即使翻译单元的准确度不那么高,也是实用的。

Claims (32)

1.一种自然语言处理装置,其特征在于,包含:
输入自然语言的输入手段;
对所述输入手段输入的自然语言进行表现变换的变换手段;
对所述变换手段表现变换后的自然语言进行确认的确认手段;
对所述确认手段确认后的自然语言实施翻译处理并且翻译成其它自然语言的处理手段;
将所述处理手段处理过的其它自然语言加以输出的输出手段。
2.如权利要求1所述的自然语言处理装置,其特征在于,所述变换手段在同一语言内将某个表现变换成至少另一表现。
3.如权利要求2所述的自然语言处理装置,其特征在于,所述处理手段用模板进行处理。
4.如权利要求1所述的自然语言处理装置,其特征在于,所述输入手段输入第1语言,所述处理手段将第1语言翻译成第2语言,所述输出手段输出经所述处理手段翻译过的第2语言。
5.如权利要求4所述的自然语言处理装置,其特征在于,所述变换手段将所述输入手段输入的所述第1语言变换为第1语言的另一表现。
6.如权利要求4所述的自然语言处理装置,其特征在于,所述变换手段将所述输入手段输入的所述第1语言变换为第3语言。
7.如权利要求1所述的自然语言处理装置,其特征在于,所述变换手段对所述输入手段输入的自然语言的表现而言,将多个表现变换成单一表现。
8.如权利要求1所述的自然语言处理装置,其特征在于,所述变换手段对所述输入手段输入的自然语言的表现而言,将多义表现变换成多个单义表现。
9.如权利要求1所述的自然语言处理装置,其特征在于,所述变换手段用融合、分割、删除、置换、顺序替换中的至少一种对所述输入手段输入的自然语言表现进行变换。
10.如权利要求1所述的自然语言处理装置,其特征在于,所述输入手段用语音输入自然语言。
11.如权利要求10所述的自然语言处理装置,其特征在于,所述确认手段对所述输入手段用语音输入的自然语言只确认一次。
12.如权利要求1所述的自然语言处理装置,其特征在于,所述输入手段用文字输入自然语言。
13.如权利要求12所述的自然语言处理装置,其特征在于,所述确认手段对所述输入手段用文字输入的自然语言只确认一次。
14.如权利要求1所述的自然语言处理装置,其特征在于,所述第1语言输入所述输入手段,所述变换手段将输入所述输入手段的第1语言变换成第2语言的第2表现,同时变换成与所述第2表现一对一对应的第1语言的第1表现,所述确认手段用所述第1表现进行确认。
15.如权利要求14所述的自然语言处理装置,其特征在于,所述处理手段根据所述变换手段的变换及所述确认手段的确认将所述第1语言翻译成第2语言,所述输出手段输出所述处理手段翻译后的所述第2语言。
16.一种自然语言处理装置,其特征在于,包含:
输入自然语言的输入手段;
对自然语言进行处理的至少一个处理手段;
对自然语言处理结果进行确认的至少一个确认手段;
输出处理后自然语言的输出手段;
在第1处理手段之前设置第2处理手段和第2确认手段,所述第2处理手段将输入所述输入手段的自然语言变换为可高准确度处理的形式,所述第2确认手段确认所述第2处理手段的结果,从而进行省略对第1处理手段结果进行确认的提前确认。
17.如权利要求16所述的自然语言处理装置,其特征在于,所述第1处理手段可以是机器翻译处理、假名汉字变换处理、自然语言的信息检索处理,或自然语言的表现变换处理。
18.如权利要求16所述的自然语言处理装置,其特征在于,所述第2处理手段可以是机器翻译处理、假名汉字变换处理、自然语言的信息检索处理,或自然语言的表现变换处理。
19.如权利要求16所述的自然语言处理装置,其特征在于,在所述第2处理手段之前设有第3处理手段和对其结果进行确认的第3确认手段,并将所述第3确认手段移到所述第2处理手段或其后的处理手段的后面,或与所述第2确认手段或其后的确认手段合并,从而进行迟后确认。
20.如权利要求19所述的自然语言处理装置,其特征在于,所述第2确认手段与所述第3确认手段合并的单元按数值给出处理结果,并提示所述数值。
21.如权利要求20所述的自然语言处理装置,其特征在于,所述第1处理手段进行机器翻译,所述第3处理手段进行语音识别。
22.如权利要求19所述的自然语言处理装置,具有对输入所述输入手段的自然语言进行语音识别的语音识别处理手段、对所述语音识别处理手段的识别结果进行确认的识别结果确认手段,对所述识别结果确认手段确认的结果实施机器翻译的机器翻译手段、以及对所述机器翻译手段的翻译结果进行确认的翻译结果确认手段,其特征在于,在所述机器翻译处理手段之前添加变换表现的表现变换手段和对该变换结果进行确认的表现变换确认手段,从而所述翻译结果确认手段进行提前确认,省略所述机器翻译处理手段后面的所述翻译结果确认手段。
23.如权利要求22所述的自然语言处理装置,其特征在于,进行所述识别结果确认手段与其后表现变换结果确认手段合并的所述识别结果确认手段迟后确认。
24.一种自然语言处理装置,其特征在于,具有:
输入自然语言的输入手段;
用第2语言的表现及第3语言的表现将输入所述输入手段的第1语言变换为一对一对应于所述第2语言表现的表现的变换手段;
对所述变换手段变换的所述第3语言的表现进行确认的确认手段;
根据所述确认手段确认的结果对输入所述输入手段的自然语言实施翻译处理并翻译成其它自然语言的处理手段;
输出经所述处理手段处理的其它自然语言的输出手段。
25.如权利要求24所述的自然语言处理装置,其特征在于,在所述变换手段中,所述第2语言是作为翻译的目的语言的语言,所述第3语言的表现通过对所述第1语言的表现进行变换后获得。
26.一种自然语言处理方法,其特征在于,包含:
输入自然语言的输入过程;
对所述输入过程输入的自然语言进行表现变换的变换过程;
对所述变换过程表现变换的自然语言进行确认的确认过程;
对所述确认过程确认的自然语言实施翻译处理并且翻译成其它自然语言的处理过程;
输出经所述自然语言处理过程处理的其它自然语言的输出过程。
27.如权利要求所述的自然语言处理方法,其特征在于,所述变换过程在同一语言内将某个表现变换成至少另一表现。
28.如权利要求26所述的自然语言处理方法,其特征在于,在所述输入过程输入第1语言,所述变换过程将在所述输入过程输入的第1语言变换成第2语言的第2表现,同时变换成与所述第2表现一对一对应的第1语言的第1表现,所述确认过程用所述第1表现进行确认。
29.如权利要求28所述的自然语言处理方法,其特征在于,所述处理过程根据所述变换过程的变换及所述确认过程的确认将所述第1语言翻译成第2语言,所述输出过程输出所述处理过程翻译后的所述第2语言。
30.一种自然语言处理方法,其特征在于,包含:
输入自然语言的输入过程;
对自然语言进行处理的至少一个处理过程;
对自然语言处理结果进行确认的至少一个确认过程;
输出处理后自然语言的输出过程;
在第1处理过程之前设置第2处理过程和第2确认过程,所述第2处理过程将在所述输入过程输入的自然语言变换为可高准确度处理的形式,所述第2确认过程确认第2处理过程的结果,从而进行省略对第1处理过程结果进行确认的确认提前确认。
31.如权利要求30所述的自然语言处理方法,其特征在于,在所述第2处理过程之前设有第3处理过程和对其结果进行确认的第3确认过程,并将所述第3确认过程移到所述第2处理过程或其后的处理过程的后面,或与后面的第2确认过程或其后的确认过程合并,从而进行迟后确认。
32.一种自然语言处理方法,其特征在于,具有:
输入自然语言的输入过程;
用第2语言的表现及第3语言的表现将在所述输入过程输入的第1语言变换为一对一对应于所述第2语言表现的表现的变换过程;
对所述变换过程变换的所述第3语言的表现进行确认的确认过程;
根据所述确认过程确认的结果对在所述输入过程输入的自然语言实施翻译处理并且翻译成其它自然语言的处理过程;
输出经所述处理过程处理的其它自然语言的输出过程。
CN99801490A 1998-08-31 1999-08-31 自然语言处理装置及方法 Expired - Fee Related CN1119760C (zh)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
JP246400/1998 1998-08-31
JP24640098 1998-08-31

Publications (2)

Publication Number Publication Date
CN1275223A CN1275223A (zh) 2000-11-29
CN1119760C true CN1119760C (zh) 2003-08-27

Family

ID=17147955

Family Applications (1)

Application Number Title Priority Date Filing Date
CN99801490A Expired - Fee Related CN1119760C (zh) 1998-08-31 1999-08-31 自然语言处理装置及方法

Country Status (4)

Country Link
US (1) US7912696B1 (zh)
KR (1) KR100681989B1 (zh)
CN (1) CN1119760C (zh)
WO (1) WO2000013102A1 (zh)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN1670733B (zh) * 2004-03-18 2011-07-13 微软公司 用自然语言命令呈递表格

Families Citing this family (16)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2002023389A1 (en) 2000-09-15 2002-03-21 Robert Fish Systems and methods for translating an item of information using a distal computer
WO2005038777A1 (en) * 2003-10-21 2005-04-28 Philips Intellectual Property & Standards Gmbh Intelligent speech recognition with user interfaces
JP4064413B2 (ja) 2005-06-27 2008-03-19 株式会社東芝 コミュニケーション支援装置、コミュニケーション支援方法およびコミュニケーション支援プログラム
JP4550708B2 (ja) * 2005-09-29 2010-09-22 株式会社東芝 音声翻訳装置及び音声翻訳方法
JP4256891B2 (ja) * 2006-10-27 2009-04-22 インターナショナル・ビジネス・マシーンズ・コーポレーション 機械翻訳の精度を向上させる技術
KR100904365B1 (ko) * 2007-06-11 2009-06-22 안문학 단어 변환 및 음성 출력 기능을 갖는 휴대폰 및 그 방법
CN101960451A (zh) * 2008-02-29 2011-01-26 夏普株式会社 信息处理装置、方法、以及程序
US8374881B2 (en) 2008-11-26 2013-02-12 At&T Intellectual Property I, L.P. System and method for enriching spoken language translation with dialog acts
AU2010249153B2 (en) * 2010-01-07 2015-08-20 D2L Corporation Systems and methods for guided instructional design in electronic learning systems
CN103902248B (zh) * 2013-09-06 2017-01-18 王柳 基于自然语言自动调度程序的智能微信银行***及自然语言对计算机***的智能调度方法
US9734142B2 (en) * 2015-09-22 2017-08-15 Facebook, Inc. Universal translation
JP6706810B2 (ja) * 2016-12-13 2020-06-10 パナソニックIpマネジメント株式会社 翻訳装置および翻訳方法
CN107679032A (zh) * 2017-09-04 2018-02-09 百度在线网络技术(北京)有限公司 语音转换纠错方法和装置
CN109166594A (zh) * 2018-07-24 2019-01-08 北京搜狗科技发展有限公司 一种数据处理方法、装置和用于数据处理的装置
KR20210037307A (ko) 2019-09-27 2021-04-06 삼성전자주식회사 전자 장치 및 전자 장치의 제어 방법
CN111339766A (zh) * 2020-02-19 2020-06-26 云南电网有限责任公司昆明供电局 一种操作票合规性检查方法及装置

Family Cites Families (18)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US4984177A (en) * 1988-02-05 1991-01-08 Advanced Products And Technologies, Inc. Voice language translator
JP2758952B2 (ja) * 1989-12-28 1998-05-28 富士通株式会社 日本語文書読取翻訳システムの修正時における表示方式
JP2814634B2 (ja) * 1989-12-29 1998-10-27 松下電器産業株式会社 機械翻訳装置
JPH03282776A (ja) 1990-03-30 1991-12-12 Nec Corp 文書処理方式
JPH04153878A (ja) 1990-10-18 1992-05-27 Fujitsu Ltd 機械翻訳装置における前編集支援処理装置
JP3176059B2 (ja) * 1990-11-15 2001-06-11 キヤノン株式会社 翻訳装置
JPH04205464A (ja) 1990-11-30 1992-07-27 Hitachi Ltd 自然言語文の意味解析問い合わせ方法
US5477451A (en) * 1991-07-25 1995-12-19 International Business Machines Corp. Method and system for natural language translation
JPH05197744A (ja) 1992-01-17 1993-08-06 Nippon Hoso Kyokai <Nhk> 外国語ワードプロセッサ
JPH0652219A (ja) 1992-08-03 1994-02-25 Hitachi Ltd 機械翻訳方法および例文検索方法
US5675815A (en) * 1992-11-09 1997-10-07 Ricoh Company, Ltd. Language conversion system and text creating system using such
KR0136425B1 (ko) * 1995-01-26 1998-05-15 조백제 의존문법을 후향 언어모델로 사용하는 한국어 연속음성 인식장치 및 방법과 그를 이용한 자동통역시스템
US5715466A (en) * 1995-02-14 1998-02-03 Compuserve Incorporated System for parallel foreign language communication over a computer network
JP3385146B2 (ja) * 1995-06-13 2003-03-10 シャープ株式会社 会話文翻訳装置
JPH0916602A (ja) * 1995-06-27 1997-01-17 Sony Corp 翻訳装置および翻訳方法
JPH09269945A (ja) 1996-03-29 1997-10-14 Toshiba Corp メディア変換方法およびメディア変換装置
US6085162A (en) * 1996-10-18 2000-07-04 Gedanken Corporation Translation system and method in which words are translated by a specialized dictionary and then a general dictionary
JP2000516749A (ja) * 1997-06-26 2000-12-12 コーニンクレッカ フィリップス エレクトロニクス エヌ ヴィ 語構成源テキストを語構成目標テキストに翻訳する機械構成の方法及び装置

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN1670733B (zh) * 2004-03-18 2011-07-13 微软公司 用自然语言命令呈递表格

Also Published As

Publication number Publication date
KR20010031659A (ko) 2001-04-16
CN1275223A (zh) 2000-11-29
KR100681989B1 (ko) 2007-02-15
WO2000013102A1 (fr) 2000-03-09
US7912696B1 (en) 2011-03-22

Similar Documents

Publication Publication Date Title
CN1119760C (zh) 自然语言处理装置及方法
CN1174332C (zh) 转换表达方式的方法和装置
CN1228762C (zh) 用于语音识别的方法、组件、设备及服务器
CN1143263C (zh) 识别有调语言的***和方法
CN1941077A (zh) 识别语音输入中的字符串的语音识别设备和方法
CN1238833C (zh) 语音识别装置以及语音识别方法
CN1113305C (zh) 语言处理装置和方法
CN1227613C (zh) 注释数据生成、音素或字搜索及添加的相应设备与方法
CN1725295A (zh) 语音处理装置、语音处理方法、程序、和记录介质
CN1474379A (zh) 语音识别/响应***、语音/识别响应程序及其记录介质
CN1409842A (zh) 模式匹配方法和装置
CN1219266C (zh) 一种实现多路对话的人-机汉语口语对话***的方法
CN1858786A (zh) 一种电子文档格式化批注***与方法
CN1311881A (zh) 语言变换规则产生装置、语言变换装置及程序记录媒体
CN1271545C (zh) 语言翻译***
CN1975857A (zh) 会话控制装置
CN1379882A (zh) 将二维数据转换为标准形式的方法
CN1653518A (zh) 语音识别设备
CN1519753A (zh) 程序、字符输入编辑方法、装置及记录媒体
CN101034498A (zh) 语言环境转换方法、***及装置
CN1271216A (zh) 语音声音通信***
CN1813285A (zh) 语音合成设备、语音合成方法和程序
CN1737802A (zh) 信息处理设备与方法、记录介质,以及程序
CN1445652A (zh) 对话***和对话控制装置
CN1120439C (zh) 机器翻译用中文生成装置

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
C14 Grant of patent or utility model
GR01 Patent grant
C17 Cessation of patent right
CF01 Termination of patent right due to non-payment of annual fee

Granted publication date: 20030827

Termination date: 20130831