JP2000353161A - 自然言語生成における文体制御方法及び装置 - Google Patents

自然言語生成における文体制御方法及び装置

Info

Publication number
JP2000353161A
JP2000353161A JP2000067839A JP2000067839A JP2000353161A JP 2000353161 A JP2000353161 A JP 2000353161A JP 2000067839 A JP2000067839 A JP 2000067839A JP 2000067839 A JP2000067839 A JP 2000067839A JP 2000353161 A JP2000353161 A JP 2000353161A
Authority
JP
Japan
Prior art keywords
language
parameter
style
source
stylistic
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2000067839A
Other languages
English (en)
Inventor
Keiko Horiguchi
恵子 堀口
M Franz Alexander
エム フランツ アレクサンダー
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Sony Electronics Inc
Original Assignee
Sony Electronics Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Sony Electronics Inc filed Critical Sony Electronics Inc
Publication of JP2000353161A publication Critical patent/JP2000353161A/ja
Pending legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L13/00Speech synthesis; Text to speech systems
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/20Natural language analysis
    • G06F40/253Grammatical analysis; Style critique
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/40Processing or translation of natural language
    • G06F40/58Use of machine translation, e.g. for multi-lingual retrieval, for server-side translation for client devices or for real-time translation
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/26Speech to text systems

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Computational Linguistics (AREA)
  • Health & Medical Sciences (AREA)
  • Theoretical Computer Science (AREA)
  • Artificial Intelligence (AREA)
  • General Health & Medical Sciences (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Human Computer Interaction (AREA)
  • Acoustics & Sound (AREA)
  • Multimedia (AREA)
  • Machine Translation (AREA)

Abstract

(57)【要約】 【課題】 少なくとも1つのソース言語からなる音声入
力が受信される、自然言語認識及び生成における文体制
御方法及び装置を提供する。 【解決手段】 音声入力は、自然な話し言葉での単語、
文、句により構成される。ソース表現がソース言語にて
認識される(304)。ソース表現に対して文体パラメ
ータが決定される(306)。文体パラメータは、ユー
ザにより設定された又は自然言語システムによりランダ
ムに選択されたソース表現から抽出してもよい。認識さ
れたソース表現は、ユーザによりユーザインターフェー
スを介して選択及び確認される。認識されたソース表現
は、ソース言語から目的言語に翻訳される(308)。
文体パラメータを用いて、翻訳された目的言語ソース表
現から音声出力が生成される(312)。文体パラメー
タは、形式、方言、性別、年齢バリエーションから選択
されたバリエーションにより構成される。

Description

【発明の詳細な説明】
【0001】
【発明の属する技術分野】本発明は、言語又は音声翻訳
システムに関する。特に、本発明は、話し言葉の言語翻
訳システムの自然言語生成における文体制御に関する。
【0002】
【従来の技術】話し言葉は、非常に効率的且つ便利なも
のであり、人間の優れた伝達モードである。確かに書き
言葉は非常に重要であり、何世代にも渡って引き継がれ
る知識の多くは、書き言葉で伝えられるが、話し言葉は
日常会話の好ましいモードである。したがって、話し言
葉は、一般的に、情報、意図、願望を伝達する最も自然
で、最も効率的で、最も明示的な方法である。しかし、
話す言葉が異なると、言語障壁が原因で効果的に通信を
行うことができないという大きな問題が生じる。現在の
世界では、海外旅行が容易に且つ頻繁に行われているた
め、これは大きな問題である。さらに、グローバル経済
により、あらゆる国籍のビジネスマンが、多国籍商取
引、効率的且つ正確な通信を必要とするフォーラムを行
うようになっている。その結果、1つの言語で入力され
る自然で流暢な話し言葉を受けて、他の言語での自然で
流暢な話し言葉を正確且つ略実時間で出力する機械支援
型個人間通信システムが必要となった。このシステムで
は、ユーザが特別な言語学的又は翻訳の知識を持つ必要
がない。さらに、ユーザが容易に持ち運べるように、機
械支援型個人間通信システムを携帯型にする必要があ
る。
【0003】一般的な言語翻訳システムは、自然言語処
理を用いて機能する。自然言語処理は、一般的に言語規
則に基づいて、文、すなわち大きいパターンを小さいサ
ブパターンに分解することにより認識しようとするもの
である。しかし、最近まで自然言語処理システムは、言
語翻訳の分野、特に話し言葉の言語翻訳の分野における
有用なアプリケーションをサポートするほど正確又は高
速ではなかった。
【0004】話し言葉でも書き言葉でも、構文解析(pa
rsing)、意味解釈(semantic interpretation)、文脈
解釈(contextual interpretation)に同じ基本技術を
用いることもあるが、システム設計に影響を与える大き
な違いがある。例えば、話し言葉の入力では、システム
は不確実性に対処しなければならない。書き言葉では、
システムは、どの語を処理するか正確にわかる。話し言
葉では、何が言われたか推測するのみである。また、話
し言葉は構造的に書き言葉とはかなり異なる。実際、完
全に理解可能な話し言葉の筆記録を、読んだときに理解
できないことがある。話し言葉は、一時に一句発生し、
文語体ではわからないイントネーション情報が多く含ま
れている。また、話し言葉には、話し手が言ったばかり
のことを訂正したり、言い直したりする修正部分が多
い。さらに、話し言葉の対話は、会話を維持する同意や
確認のやりとりが多いが、これは書き言葉にはないもの
である。
【0005】一般的な話し言葉の言語翻訳又は自然言語
処理システムの基本構造は、話し手が発生した音声を、
アナログ/デジタル変換器を用いてデジタル信号に変換
して処理する。そして、このデジタル信号は、様々な周
波数での音の強度や強度の時間的変化等、種々の特徴を
抽出して処理される。これらの特徴は、音声認識システ
ムの入力となるが、音声認識システムは、一般に隠れマ
ルコフモデル(HMM)技術を用いて、音声信号を生成
した可能性が最も高い一連の語を識別する。音声認識装
置は、最も可能性が高い一連の語を、自然言語処理シス
テムの入力として出力する。自然言語処理システムが発
声(utterance)を必要とする場合、語を音素シーケン
スに変換してイントネーションの音調曲線(contour)
を決定するモジュールに、文を送り、この情報を音声合
成システムに送る。音声合成システムは、話し言葉の出
力を生成する。
【0006】自然言語処理システムは、各語が何である
か、各語がどのように組み合わせられて文を形成してい
るか、各語は何を意味するか、語の意味が文の意味にど
のように寄与しているか等、言語の構造について多くの
知識を用いる。しかし、言語学的行動については、人間
を知的にするもの、すなわち一般的世間の知識及び推理
能力という他の面を考慮しなければ、完全に説明するこ
とはできない。例えば、質問に答えたり、会話に参加し
たりするのに使用される言語の構造についての知識を有
するだけでなく、一般世間について、そして特に会話の
背景について知る必要がある。
【0007】自然言語処理に適切な様々な知識として、
音声学及び音韻学的知識(phoneticand phonological k
nowledge)、形態論的知識(morphological kowledg
e)、統語論的知識(syntactic knowledge)、意味論的
知識(semantic knowledge)、語用論的知識(pragmati
c knowledge)がある。音声学及び音韻学的知識は、各
語がそれらを実現する音声とどのように関連しているか
に関するものである。形態論的知識は、各語が形態素
(morpheme)と呼ばれる基本単位からどのように構成さ
れるかに関するものである。統語論的知識は、正しい文
を形成するのに各語をどのように組み合わせるかに関す
るものであり、各語が文中でどのような構造的役割を果
たすか、また、どの句が他のどの句のサブ部分なのかを
判断する。意味論的知識は、各語がなにを意味するの
か、また、これらの意味が文中でどのように組み合わせ
られて文の意味を形成しているかに関するものである。
これは、文脈から独立した意味、すなわち、文が使用さ
れている文脈と無関係に文が有する意味の検討である。
語用論的知識は、各文が異なる状況でどのように使用さ
れるか、また、使用法が文の解釈にどのように影響する
かに関するものである。
【0008】
【発明が解決しようとする課題】しかし、一般的な自然
言語プロセッサは、限定した枠組みでしか動作しないの
で、成功しているものは限られている。自然言語プロセ
ッサは、入力文を受け取り、文中の語を辞書的に分離
し、統語論的に各語の種類を判断し、意味論的に各語を
解釈し、生成すべき応答の種類を語用論的に決定し、応
答を生成する。自然言語プロセッサは、多種の知識を用
い、知識を組織化された種類に分ける異なる知識構造
に、異なる種類の知識を記憶する。また、一般的な自然
言語プロセッサは、非常に複雑な能力も使用する。自然
言語プロセッサというものは入力文に対して妥当な応答
を2つの以上有していなければならないので、一般的な
自然言語プロセッサの知識及び能力は、複雑さの面にお
いては削減され、扱いやすく便利でなくてはならない。
【0009】自然言語処理に対する従来のアプローチ
は、多数の問題があることが確認されており、一般的な
音声翻訳システムは、多くの構成要素を含んでいるとい
う問題がある。話し言葉の言語翻訳システムに関して、
文体の変化は、人が言葉による通信で互いに伝達するメ
ッセージの重要な部分である。したがって、話し言葉の
言語翻訳システムが、通信支援手段として質が高い翻訳
を達成するため、入力モードを認識し、目的言語での適
切な文体又はモードに変換できることが重要である。文
体の変化が符号化される方法は、言語によって異なるの
で、質が高い出力を発生させるためには、このような特
徴の体系的な符号化方法を有することが重要である。
【0010】一方、自然言語インターフェース又は対話
システムの主な魅力は、人が機械と自然且つ柔軟に相互
作用を行う方法から得られる。システムがより強力且つ
複雑になるにつれて、ユーザは当然、話している相手で
ある「エージェント」からより多くの文字及び文体が得
られると考える。一般的な自然言語インターフェース又
は対話システムでは、名詞句を置き換えて出力にする能
力を有する「お決まりの」表現を使用する。規則に基づ
く生成の構成要素を使用するこれらのシステムにとって
重要なのは、一般に、必要な情報を全て有する文法的に
正しい構造を生成することであった。したがって、文体
が異なる種々の自然言語表現を生成することには注意が
払われなかった。
【0011】
【課題を解決するための手段】自然言語認識及び生成に
おける文体制御方法及び装置が提供される。少なくとも
1つのソース言語からなる音声入力が受信される。音声
入力は、自然な話し言葉での語、文、句により構成され
る。ソース表現はソース言語で認識される。ソース表現
について文体パラメータが決定される。文体パラメータ
は、ユーザにより設定されるソース表現から抽出される
か、自然言語システムによりランダムに選択される。認
識されたソース表現は、ユーザによりユーザインターフ
ェースを介して選択及び確認される。認識されたソース
表現は、ソース言語から目的言語に翻訳される。文体パ
ラメータを用いた翻訳済みの目的言語のソース表現か
ら、音声出力が生成される。文体パラメータは、形式、
方言、性別、年齢のバリエーションから選択されたバリ
エーションにより構成される。
【0012】本発明の上述の及び他の特徴、局面、利点
については、添付図面、以下に示す詳細な説明及び請求
の範囲により明らかになる。
【0013】
【発明の実施の形態】話し言葉の言語翻訳システムのた
めの方法及び装置が提供される。以下の説明では、本発
明を完全に理解できるように、多数の具体的な詳細事項
を用いて説明する。しかし、これらの具体的詳細事項が
なくても本発明を実施することができることは、当該分
野の技術者にとっては明らかであろう。また、本発明を
不必要に不明瞭にすることを避けるため、既知の構造及
び装置をブロック図で示す。なお、本明細書に記載する
方法及び装置の実施例では、一般的な音声翻訳システム
と比較して、音声翻訳の著しい改善が見られる。
【0014】話し言葉は、一般に、情報、意図、願望を
伝達する最も自然で、最も効率的で、最も明示的な方法
である。同時に、話す言葉が異なると、大きな言語障壁
が生じる。本発明の実施例のSTSでは、自然で流暢な
音声(過度に長い又は複雑な発声)による入力、ユーザ
が特別な言語学的又は翻訳の知識を有する必要がないこ
と、ユーザが時間のかかる又は困難な操作を行う必要が
ないこと等、多数の特徴を有する機械支援型個人間通信
システム(system for machine-aided interpersonal c
ommunication)が得られる。
【0015】図1は、本発明を適用した音声翻訳システ
ム(STS)のホストとなるコンピュータシステム10
0の具体的な構成を示すブロック図である。コンピュー
タシステム100は、以下に限定されるものではない
が、システムバス101を備え、システムバス101
は、少なくとも1つのプロセッサ102と、少なくとも
1つのデジタルシグナルプロセッサ108と、少なくと
も1つのメモリ104と、少なくとも1つの大容量記憶
デバイス107との間のデータ転送を可能にする。ま
た、システムバス101は、キーボード122と、ポイ
ンティングデバイス123と、音声信号入力デバイス1
25とが接続され、これらからの入力が供給される。な
お、これに限定されるものではない。システムバス10
1は、表示デバイス121と、ハードコピーデバイス1
24と、出力デバイス126とに出力を供給する。な
お。これに限定されるものではない。出力デバイス12
6は、オーディオスピーカにより構成される。なお、こ
れに限定されるものではない。
【0016】図2は、本発明を適用した音声翻訳システ
ムのホストとなるコンピュータシステムのメモリ200
の具体的な構成を示すブロック図である。入力デバイス
202は、デジタイザ及びバスインターフェース204
に音声信号を供給する。デジタイザ及びバスインターフ
ェース204のデジタイザは、更なる処理を行うため
に、音声信号をサンプリングしてデジタル音声信号に変
換する。デジタイザ及びバスインターフェース204
は、デジタル音声信号をシステムバス299を介してメ
モリ200の少なくとも1つの音声入力データメモリ部
206に記憶する。なお、これに限定されるものではな
い。デジタル音声信号は、メモリ200の各部200〜
260に記憶されたアルゴリズム及びデータを用いて、
少なくとも1つのプロセッサ208により処理される。
音声信号の処理に使用されるアルゴリズム及びデータ
は、以下に限定されるものではないが、少なくとも1つ
の音声認識モジュール220と、少なくとも1つの翻訳
モジュール230と、少なくとも1つの音声合成モジュ
ール240と、少なくとも1つの言語モデル250と、
少なくとも1つの音響モデル260とからなるメモリ2
00の各部220〜260に記憶されている。本発明を
適用した音声認識モジュール220は、音声認識器22
2と、仮説構造器224とを備える。なお、これに限定
されるものではない。本発明を適用した翻訳モジュール
230は、以下に限定されるものではないが、形態素解
析器232と、統語解析器234と、言語変換器236
と、統語生成器237と、形態生成器238とを備え
る。出力デバイス280は、受信した音声信号に応じて
翻訳された音声を出力する。
【0017】この実施例のSTSは、プロセッサをホス
トとする。なお。これに限定されるものではない。他の
実施例では、STSは、異なるプロセッサをホストとす
るハードウェア及びソフトウェアの構成要素を組み合わ
せて構成してもよい。また、他の実施例では、それぞれ
異なる音響モデル又は言語モデルからなる多数のモデル
装置が、多数の異なるプロセッサをホストとしてもよ
い。さらに他の実施例では、音声認識モジュール、翻訳
モジュール、モデルのホストとなる多数のプロセッサを
有する。さらに他の実施例では、多数の異なるモデル装
置が、単一のプロセッサをホストとしてもよい。
【0018】本発明は、ユーザが容易に持ち運べる携帯
型ユニットとして実現してもよい。このような実施例と
して、図1の構成要素と図2の構成要素とを有するラッ
プトップコンピュータがある。図2のメモリ200に示
す各モジュールは、ラップトップコンピュータのランダ
ムアクセスメモリ(RAM)に記憶されてもよく、ま
た、RAM及び読出専用メモリ(ROM)に多様に記憶
されてもよい。ROMは、取り外し可能カードであって
もよい。ラップトップコンピュータとしての実施例の中
には、本発明の方法に係る計算を行うために従来のプロ
セッサを使用するものもある。他のラップトップコンピ
ュータとしての実施例では、計算の幾つか又は全てを行
うのにデジタルシグナルプロセッサ(DSP)を使用す
る。
【0019】他の携帯型の実施例として、パーソナルデ
ータアシスタント(PDA)等の特殊な機能を有する小
型ユニットがある。例えば、PDAとしての実施例で
は、音声翻訳機能、音声メモ機能、音声電子メール機
能、音声カレンダ機能を有する。なお、これに限定され
るものではない。ラップトップコンピュータよりも小型
の実施例としては電話機がある。例えば、セルラ電話機
に音声翻訳機能を持たせるようにしてもい。本発明の実
施例の機器の大きさは、現在使用しているハードウェア
の規模によってのみ限定される。ペン型や腕時計型の実
施例も考えられる。
【0020】何れ実施例においても、図2に示すモジュ
ール及び必要なプロセッサは、ラップトップコンピュー
タ等の装置にあってもよく、あるいは他の部分にあって
もよく、例えば周波数変調(FM)方式、マイクロ波方
式、セルラ電話機方式、光変調方式等の既知の方法及び
ハードウェアを使用する機器から遠隔的にアクセスする
ことができる。例えば、本発明の構成要素は、電話呼出
又はビデオ会議呼出を用いてアクセスされる1つ以上の
リモートサーバにあってもよい。このような実施例にお
いては、ユーザは、本発明による翻訳を遠隔的に行う翻
訳サービスにダイヤルすることができる。セルラ電話機
やPDAとしての実施例のように幾つかの実施例では、
ユーザが、新たな単語、名称、表現やその翻訳を追加す
るために、種々の通信方法を用いて語彙を遠隔的に更新
することができる。幾つかの実施例では、翻訳をインタ
ーネットサーバにて遠隔的に行い、インターネット電話
方式を用いて伝送することができる。
【0021】図3は、本発明を適用した音声翻訳システ
ムの具体的な動作を説明するための図である。実施例の
STSは、同一の言語を話さない個人間の通信を容易に
するのに使用される音声から音声への翻訳を行うシステ
ムである。なお、これに限定されるものではない。ST
Sは、入力言語又はソース言語での話し言葉を受け付け
る。STSは、ソース言語での音声認識を行うと共に、
認識された表現をユーザが確認すること、あるいは、一
連の認識候補からユーザが選択することを任意に可能と
する。STSは、認識された表現をソース言語から目的
言語に翻訳する。目的言語で、STSは自動音声合成を
行う。
【0022】話し言葉の言語翻訳を行う際、ソース言語
入力302が供給されたときに動作が開始する。ステッ
プ304において、ソース言語音声認識が行われ、認識
ソース表現306が生成される。ステップ308におい
て、認識ソース表現306はソース言語から目的言語に
翻訳される。生成された目的言語表現310は、ステッ
プ312において、目的言語音声合成に用いられる。目
的言語音声合成により、ソース言語音声入力302を表
す目的言語音声出力314が生成される。
【0023】図4は、本発明を適用した音声翻訳システ
ムのソース言語音声認識304の具体的な動作を説明す
るための図である。ソース言語音声入力302が供給さ
れると動作が開始する。音声認識器402は、ソース言
語音声入力302を処理して、多数の仮説404を符号
化する中間データ構造を生成する。仮説構成モジュール
406は、符号化された多数の仮説404から少なくと
も1つの音声認識仮説408を生成する。ステップ41
0において、最良の仮説の構成及び選択が行われる。少
なくとも1つの認識ソース表現306が出力される。な
お、実施例はこれに限定されるものではない。
【0024】図5は、本発明を適用した音声翻訳システ
ムにおけるソース言語から目的言語への翻訳308の動
作を説明するための図である。認識ソース表現306が
供給されると動作が開始する。ステップ502におい
て、形態素解析が行われ、一連の解析された形態素50
4が生成される。ステップ506において、一連の解析
された形態素504に対して統語論的ソース言語解析が
行われる。統語論的ソース言語解析により、ソース言語
統語表現508が得られる。ステップ510において、
ソース言語から目的言語への変換が行われ、目的言語統
語表現512が生成される。目的言語統語表現512
は、ステップ514において、目的言語統語生成を行う
のに用いられる。生成された一連の目的言語形態素51
6は、ステップ518において、目的言語形態生成に用
いられる。少なくとも1つの目的言語表現310が出力
される。なお、実施例はこれに限定されるものではな
い。
【0025】実施例のSTSは、個々の単語や短い句に
加えて文全体を扱うことができる。したがって、一般の
音声認識装置ではエラーの可能性が高くなるが、各入力
表現は、非常に長くてもよい。このため、本発明の一実
施例のSTSでは、一般の音声翻訳装置とは異なり、入
力を辞書で調べることによる逐語訳は行わない。その代
わりに、実施例のSTSでは、入力を解析し、入力の意
味(例えば、質問、供述等)を検出又は決定し、その意
味を適切に目的言語に置き換える。
【0026】実施例のSTSは、語彙の中の単語を使用
して構成することができる多数の表現又は文を扱うため
に、広範囲にわたる語彙を使用する。このため、翻訳を
公式化する入力語と出力語の完全なテーブルを用いる翻
訳システムとは異なり、本発明の実施例のSTSは、動
的に翻訳を行う。さらに、このSTSは、自然な話し言
葉を処理、すなわち各人が頻繁に話す非文法的な話し言
葉を取り扱う。実施例のSTSは、雑音や話し手の違い
に起因した誤認を扱う際に役立つように、ユーザ構成及
び認識仮説部を有している。したがって、実施例のST
Sは、非常に高い翻訳精度を有しており、この精度が通
信支援手段としての有用性を大きく改善する。
【0027】本発明の実施例のSTSは、2種類の処理
を統合することにより音声翻訳を行う。第1の種類であ
る文法規則に基づく処理では、ある言語学的解析及び生
成プロセスを行う規則駆動型構成要素を使用する。第2
の種類の処理である類推処理又は用例に基づく(exampl
e-based)処理では、一連の規則を用いるのではなく、
データ駆動型アプローチを用いる。規則に基づく構成要
素は、ソース言語での統語論的及び形態素解析と、目的
言語での統語論的及び形態素解析を行う。用例に基づく
構成要素は、ソース言語から目的言語への変換を行う。
用例に基づく構成要素は、ソース言語と目的言語の対応
する表現の対を多数記憶している用例データベースを使
用する。形態素解析では、ソース言語の辞書とソース言
語の形態論的規則を使用する。さらに、統語論的ソース
言語解析では、ソース言語のコンピュータ解析文法規則
を使用する。また、ソースから目的言語への変換では、
少なくとも1つの用例データベースと、単語間の類似性
を説明する類義語辞典とを使用する。目的言語統語生成
では、目的言語の統語生成規則を使用する。さらに、目
的言語形態生成では、目的言語の辞書と目的言語の形態
生成規則とを使用する。
【0028】話し言葉の言語翻訳には、類推による翻訳
等、柔軟で確実なメカニズムが必要である。同時に、構
造的規則性を利用すると、翻訳がより高率的で正確にな
る。本発明で用いる新規な表面的な統語論的解析方法
は、広範囲の文法パターンを扱うのに十分効果的であ
り、話し言葉を処理するのにも十分に確実性がある。得
られる統語論的解析モジュールを、類推又は統計的変換
モジュールと組み合わせて、異なる専門分野の高品質の
翻訳を行うことができる。
【0029】話し言葉は、従来の規則に基づく方法によ
る解析に反する多くの特性を有している。話し言葉の発
声は、一般に短く複雑ではない統語構造からなるが、感
嘆詞や句切り等の断片や余計な語が含まれることが多
い。省略や不規則な語順(反転、左右の転置)も頻繁に
見受けられる。このため、従来の規則に基づく枠組みか
ら、用例に基づく翻訳のようなより柔軟なアプローチへ
の転換が検討されている。本発明の実施例の方法及び装
置では、話し言葉に対して詳細過ぎる又は特殊化され過
ぎて効率的且つ正確に行うことができないような解析は
行わず、できるだけ多くの言語学的規則性を利用するこ
とにより、用例に基づく翻訳の言語学的効率及び精度が
向上する。
【0030】一般的な翻訳システムでは、高品質の翻訳
を達成するためには、可能な入力についての全ての用例
データが必要である。本発明の実施例では、可能な入力
を全て徹底的に用例データベースに列挙することなく、
高品質の翻訳を行う十分な翻訳範囲を達成するために、
統語論的規則性を捕らえている。統語論的規則性を捕ら
えることにより、本発明の実施例における用例に基づく
翻訳は、4つの方法でサポートされる。なお、実施例は
これに限定されるものではない。
【0031】本発明の実施例における、翻訳知識のため
の統語論的解析及びデータ構造を与える方法は、多数の
ノードを有する少なくとも1つの構文木を用いて入力に
対して統語論的解析を行う。各ノードは、少なくとも1
つの生成規則を有している。さらに、少なくとも1つの
ノードは、少なくとも1レベルのネストされた生成規則
(nested production rule)を有している。統語論的解
析は、構文木を用いて、用例データベースからの少なく
とも1つのエントリに対して行われる。入力のうちの少
なくとも1つの言語学的構成要素が決定され、その言語
学的構成要素の語用タイプ(pragmatic type)及び統語
タイプ(syntactic type)が決定される。そして、入力
を識別した結果が出力される。
【0032】概念的には、実施例の構造解析は2つのス
テップからなる。なお、これに限定されるものではな
い。第1のステップでは、文脈とは無関係の文法を用い
た構文解析を行い、第2のステップでは、入力文につい
ての素性構造(feature structure)を生成する。これ
は、文脈とは無関係の文法規則に対する注釈を用いて行
われる。
【0033】本発明の実施例の素性構造における情報
は、形態素解析部の語彙レベルで発生される。文脈とは
無関係の文法規則での素性構造操作注釈は、この情報を
より高いレベルの構成要素にし、試験を適用して、表現
の統語的構造に応じて並び替える。このプロセスの間、
文のタイプ(sentence type)、語用論的機能(pragmat
ic function)、敬語(honorific)、文法上の法(moda
l)からなる情報に関する文脈とは無関係の構文木の構
造面は、簡単な素性値の対(feature-value pair)にま
とめられる。
【0034】本発明の実施例の統語論的解析は、5つの
重要な差異を有する辞書的機能の文法に基づいている。
なお、これに限定されるものではない。すなわち、構成
要素の文法的機能は回復せず、素性構造は再エントリせ
ず、弧名(arc name)は独自でなくてもよく、弧の順序
(arc order)が重要であり、素性構造は、グラフ(gra
ph)の統一ではなく、より効率的なグラフマッチング及
びコピー動作(graphmatcing and copy operation)を
用いて操作される。
【0035】図6は、本発明を適用した統語論的解析を
用いた用例主導型翻訳システム(example-based transl
ation system)の具体的な構成を示すブロック図であ
る。実施例の翻訳システムは、表面的統語解析器604
と、用例に基づく変換606と、目的表現生成器608
とを備える。なお、これに限定されるものではない。表
面的統語解析器604は、少なくとも1つのソース言語
辞書612と少なくとも1つのソース言語表面的統語論
的文法614にアクセスして、これらを使用する。な
お、これに限定されるものではない。用例に基づく変換
606は、少なくとも1つの二ヶ国語用例データベース
616にアクセスして、これを用いる。なお、これに限
定されるものではない。目的表現生成器608は、目的
言語生成文法618にアクセスして、これを用いる。な
お、これに限定されるものではない。表面的統語解析器
604は、ソース言語表現602が供給され、目的表現
生成器608は、目的言語表現610を出力する。な
お、これに限定されるものではない。
【0036】本発明の実施例の統語論的解析では、名詞
句、動詞句、前置詞句等の言語学的構成要素を認識する
ための表面的解析を行う。表面的解析を行う際には、構
成要素の順序に関する情報は、構成要素が入力において
現れるように保持される。また、表面の変動(surface
variation)が素性としてまとめられる。さらに、本発
明の実施例の統語論的解析では、前置詞句の連結等の統
語論的な曖昧表現を解明しようとはしない。また、統語
論的解析では、各構成要素の文法的機能(直接目的語、
間接目的語)や語幹的な役割(動作主、経験)を確認し
ようとはしない。本発明の実施例では、解析表現の形式
が、適応した素性構造表現の形式である。構成要素の順
序は、素性構造に現れる弧の順序により表される。
【0037】本発明の実施例により行われる表面的統語
論的解析のレベルは、特定の専門分野や状況によって変
わることがないので、非常に確実で一般的なものであ
る。本発明の実施例で行われる表面的統語論的解析は、
用例データに対しても入力列に対しても行われる。この
ように、専門分野とは無関係の一般的な言語学的知識と
専門分野に応じた知識との間に明確な分離を行うことが
できる。したがって、専門分野の変更は語彙及び用例デ
ータベースにしか影響しない。なお、実施例はこれに限
定されるものではない。
【0038】本発明の実施例の統語論的解析は、素性構
造表現を操作するためのメカニズムを有するパーサにお
いて実行される。説明したように、効率的に実行するた
め、本発明の実施例では、素性構造オペレータを有する
GLRパーサを使用する。さらに、表面的な統語論的解
析は、語彙の曖昧表現や他の部分的曖昧表現を解明して
用例データ処理の負担を低減する統計処理部と統合す
る。なお、実施例はこれに限定されるものではない。
【0039】自然な人間の話し言葉は、単語の繰り返
し、省略、不完全な文を含むことが多いので、完全で文
法的なものではない。このため、正確な話し言葉の言語
翻訳システムの翻訳方法は、翻訳作業が、誤って追加、
削除、置換した単語を有する入力を扱うことができるよ
うな、より柔軟で確実なものとなる必要がある。柔軟性
及び確実性を得るため、一般的な音声翻訳システムは、
多種多様の翻訳知識を用いるので、用例指導型システム
が、異なる程度の言語学的特異性を有する実例をどのよ
うに使用することができるかという、実例特異性の問題
が生じる。本発明の実施例では、この問題を解決する、
音声翻訳に対する規則ベース/類推のハイブリッドアプ
ローチを用いる。
【0040】本発明の規則ベース/類推ハイブリッドア
プローチは、例えば、組み合わせ、高速マッチング、最
適マッチング等の方法からなる。図7は、本発明の実施
例の翻訳部のマッチング変換アルゴリズムを示す。翻訳
部はソース素性構造702を受け取り、用例データベー
ス及び入力列に対して詳細な統語論的解析を行う。これ
により、言語学的情報の中でも特に表現又は文の語用タ
イプ704及び統語タイプ706を有する表面的な統語
論的表現が得られる。
【0041】そして、マッチング及び変換が行われる
が、入力と用例データベースとの適合性を迅速に確認す
る初期高速マッチング708が行われる。この初期高速
マッチング708では、時間もスペースも費やす詳細な
マッチングを、用例データベース内の各用例毎に行う必
要がない。詳細又は最適マッチング710は、統語論的
表現の部分の挿入、削除、結合(マッチング)712を
行う動作に関する最適化手続きとして行われる。これに
より、挿入や削除が可能なので、構造の全部分を説明す
る必要がない柔軟なマッチング方法が得られる。マッチ
ング及び変換は表面的な統語論的入力構造の部分に対し
て機能するので、このアプローチを用いて、多数の例を
確認し組合せて714、入力のマッチングを行ってもよ
い。ここで説明するマッチング及び変換方法は、特定の
程度の言語学的特異性を有する実例に依存しないという
点で一般的である。この方法は、翻訳が依存する多くの
文脈を含む特定例のみならず、非常に一般的な例につい
ても機能する。
【0042】本発明の実施例の類推による自動翻訳で
は、翻訳知識として記載されていることを表現する例の
二ヶ国語の対と、相当する意味がどのようにソース言語
及び目的言語で表現されるかについての情報を使用す
る。このアプローチは、本質的に確実性があるので、文
法外の現象を示すことが多い話し言葉に適している。ま
た、本発明では、実例の特異性の問題が解決できるなら
ば、より具体的な文脈を有する実例を加えることにより
翻訳精度が向上する。しかし、用例に基づく翻訳におけ
る最も難しい問題は、程度の異なる言語学的特異性を有
する例を組み合わせる必要に関してである。言語学的特
異性の大きい実例の対を適用する際、本発明の実施例で
は、いかなるレベルの言語学的特異性の情報も捕らえる
ことができる共通インデックスを有する表面的な統語論
的表現からなる実例の対を使用する。その結果、本発明
は、実例の特異性の問題を、最適マッチング、高速マッ
チング、実例の組合せという3つの副次的な問題に分割
することにより解決する。
【0043】最適マッチングという副次的問題は、入力
が与えられて用例データベースから最適マッチングを探
すことである。本発明の実施例では、ノード及び弧を有
するツリーからなる入力の表面的な統語論的表現の部分
の挿入、削除、マッチングを行う機能語に基づいたマッ
チング手続きを用いる。このマッチング手続きは、ツリ
ーの弧に対して繰り返し定義される全体的なマッチング
コストを最小にする動的プログラミングアルゴリズムを
用いて行われる。
【0044】3つの可能な動作(挿入、削除、結合)に
より、弧のレベルによって異なるコスト、弧のノード値
に関するコスト、各語の素性値及び類義語辞典に基づく
意味論上の類似性に基づくコストが発生する。弧<i1,
i2,...,im>を有する入力ノードIと弧<e1,e2,...,en>を
有する実例ノードEについて、マッチングコストC
(I,E)は以下のように定義される。
【0045】
【数1】
【0046】一般的な分野では、必要な用例データベー
スはかなり大きくなる。例えば、本発明の実施例では、
データベースは約10,000の実例対を有している。
したがって、各実例に対する入力の詳細なマッチングを
行うことは不可能であり、最適マッチング問題について
のサーチスペースを幾分か制限しなければならない。
【0047】本発明の実施例では、可能性が低い実例を
排除する初期高速マッチングを行うことによりサーチス
ペースを制限する。なお、実施例はこれに限定されるも
のではない。表面的な統語論的解析モジュールは、入力
の統語論的タイプ及び語用タイプを確認し、これらのタ
イプに応じてマッチングが制限される。また、マッチン
グする構成要素の統語論的主要語句に基づいて高速マッ
チングが行われる。これは、同等、あるいは、意味論的
な類似性を持つ類義語辞典に基づく基準に限定すること
ができる。
【0048】種々の入力を翻訳するため、本発明の実施
例では、入力の表面的な統語論的表現の部分に対してマ
ッチング及び変換を繰り返し行うことにより、変換プロ
セスにおいて多数の例(又は例の部分)を組み合わせ
る。各繰り返しのステップでは、詳細なマッチングを行
った後に、実例からの冗長情報に加えて、実例によりカ
バーされない入力における追加情報をも扱う。なお、実
施例はこれに限定されるものではない。
【0049】本発明は、任意の翻訳と共に仮説をユーザ
に提示し、ユーザに最良の仮説を選択させ、ユーザから
の選択を用いて仮説構成部の適応を行う、音声翻訳シス
テムにおける音声認識の1以上の仮説を構成する方法か
らなる。この方法を用いて、システムは、ユーザが言っ
たことのタイプを知り、仮説構成部のシステム性能を改
善する。その結果、ユーザが装置を使用すればするほ
ど、正しい仮説がユーザに提示されることが多くなる。
【0050】図8は、本発明の実施例の音声翻訳システ
ムの仮説選択部を示す。音声認識部802にて音声入力
801が受信されると動作が開始する。音声認識部80
2は、少なくとも1つの単語発音辞書822と少なくと
も1つの音響モデル824へのアクセス及び使用を行っ
て、仮説とされた単語とそれに対応する位置及び時間を
符号化する少なくとも1つのデータ構造804を生成す
る。データ構造情報804は、順序付けられた発声仮説
808のリストが生成される発声仮説構成806に使用
される。そして、ユーザが最良の発声仮説810を選択
するユーザ選択構成810が発生する。ユーザ選択構成
は、ユーザインターフェース898を介して達成され
る。ユーザ選択は、音声翻訳システム言語モデル828
への適用入力826として使用される。最良発声仮説8
12は、翻訳済みの音声出力899を生成する音声翻訳
システムの翻訳部814及び音声合成部816への入力
として使用される。
【0051】音声翻訳装置の問題点は、ユーザのアクセ
ント、異なるユーザの発音、異なるボリュームでの入力
音声、話している間のマイクの異なる位置、異なるタイ
プ及びレベルの背景ノイズの結果、音声入力の変化性が
多種多様であるということである。このため、音声認識
部は、ユーザが行った正確な発声のみを識別しようとは
しない。音声入力が誤っていたり非文法的であるとき
は、正確な発声の識別は不可能である。正確な発声を識
別しようとすることにより動作する従来のシステムで
は、識別を行うことが不可能なときに何も出力すること
ができないか誤った出力をしてしまう。この場合、ユー
ザは、なぜ入力がシステムによって処理されなかったの
かわからない。本発明はこれらの問題を克服する。実施
例の音声認識部は多数の可能性を識別し、ユーザは、こ
れらの可能性又は音声認識仮説から、正しい又は最良の
仮説を選択すればよい。
【0052】音声認識ステップと仮説構成ステップは別
々に行われる。なお、実施例はこれに限定されるもので
はない。第1のステップでは、ユーザ音声情報を認識し
て、音声信号における単語の仮説を提案する。第2のス
テップでは、仮説構成部がこの情報を取り入れ、音声入
力全体の認識仮説である順序付けられた全発声リストを
構成する。中間ステップとして、実施例のSTSが語の
グラフを構成してもよい。なお、これに限定されるもの
ではない。
【0053】実施例の発声仮説構成部は、言語について
の情報を用いて発声仮説を構成する。この情報は、発声
の確率を割り当てるのに使用される数学的モデルである
ため、言語モデルと呼ばれる。これら発声の確率は、発
声の部分、文節、その他の素性又は特徴の確率から得ら
れる。例えば、音声認識で使用する標準言語モデルは、
発生する単語のユニグラム確率P(word)、前の単語が発
生した場合に発生する単語のバイグラム確率P(wordi/wo
rdi-1)、前の2つの単語が発生した場合に発生する単語
のトライグラムP(wordi/wordi-2,wordi-1)等、いわゆる
nグラム確率を用いる。そして、これらの基本確率か
ら、1発声の全体的な確率が計算される。
【0054】言語モデルを作成する他の方法として、他
のタイプの基本確率を用いる方法がある。例えば、統語
論的解析を行ってもよく、基本確率が、解析で使用され
るある文法規則の確率を参照してもよい。あるいは、基
本確率が、形式P(動詞=wordi、主語=wordj、目的語
=wordk)に公式化されるように、「主語」、「動
詞」、「目的語」等の文法的機能を参照してもよい。ユ
ーザが言語モデルの適応を行うために行う確認/選択動
作は、使用される基本確率のタイプとは無関係に用いら
れてもよい。その結果、仮説構成部は、ユーザが行った
発声に適応して、ユーザが最も行いそうな発声を優遇す
る。これらの発声は発声仮説リストの上位に配置される
ようになり、音声翻訳装置を比較的使用しやすくなる。
【0055】図9は、本発明の実施例の音声翻訳システ
ムの言語モデル適応を示すフローチャートである。適応
を行う基本的な概念は、ユーザが選択した正しい又は最
良の発声仮説902をとり、言語モデルに従って解析9
04することである。例えば、nグラム言語モデルの場
合、解析は、仮説における個々の単語や単語のバイグラ
ム及びトライグラムを識別することになる。仮説におけ
る基本構成要素のリストが生成され906、基本単位に
ついての確率を上げることにより908、これら基本単
位にクレジットが割り当てられる。そして、言語モデル
における全ての基本確率が再び正規化され910、その
結果、他の全ての基本確率をやや下げることになる。
【0056】英語の形態論は比較的理解されている現象
であるが、形態論的問題のコンピュータ処理や、形態素
解析器を音声翻訳システムの他の構成部分と統合するこ
とは、意図した用途や全体的な効率を考慮しなければな
らない。形態素解析は、単語を形態素に解析し、語根形
式や文法カテゴリーを識別し、辞書的曖昧表現や語彙以
外の単語を検出するプロセスである。解析結果は、パー
サや他の自然言語処理モジュールへの入力として使用す
ることができる。本発明の実施例のSTSは、屈折的形
態論解析器(AIM)により構成される。本発明の実施
例のAIMでは、コンピュータ効率、辞書維持の容易
さ、意図した用途に対する正確な性能、他のツールや構
成要素との統合の容易さが得られる。
【0057】本発明の実施例のAIMは、語根を識別
し、入力語の残りの形態素を素性にまとめる。形態論に
は、屈折的と派生的の2つの種類がある。屈折的形態論
は、複数を示す「-s」や過去時制を示す「-ed」等、文
法的標識として機能する形態素を扱うものである。派生
的形態論は、「unemployment」における「-un」や「-me
nt」等、語幹の統語論的カテゴリーや意味論的内容を変
更する接頭辞や接尾辞を扱うものである。実施例のAI
Mは屈折的形態論を扱うが、屈折が異なっても一般に翻
訳の文脈に影響を与えないので、STSの翻訳知識ベー
スのエントリ数に加えてSTSのコンピュータ辞書のエ
ントリ数も低減される。
【0058】一般的な2レベル形態素解析器が一連の形
態論的規則を平行して適用するのに対し、実施例のAI
Mは、2レベル形態論の問題点である、低処理速度や表
記法の複雑さや、全ての有限状態のトランスデューサが
最後まで進む場合のみ正しい解析が可能となるという問
題を克服するシーケンシャルアプローチを用いる。AI
Mは、入力として単語列を受け取り、辞書的素性構造で
ある単語列、記号、数についての素性値の対を有する言
語学的データ構造の形式で、各単語の解析を行う。各単
語を解析すると、AIMは、エントリが辞書的素性構造
に似ている辞書を調べる。なお、これに限定されるもの
ではない。形態素解析器は、語根及び入力語の屈折を識
別すると、辞書から形態をとり、屈折に対する適切な素
性値の対を出力素性構造に挿入する。この出力形式によ
り、実施例のAIMは素性構造に対して動作する統語論
的パーサと統合することができると共に、他のSTS構
成要素が適切な素性(例えば、各語の語根)に迅速にア
クセスすることができる。
【0059】図10は、本発明の実施例の屈折的形態論
解析器(AIM)1000を示す。AIM1000は、
2つのメインモジュールと、トークナイザ1002と、
形態素解析器1004とを有する。なお、これに限定さ
れるものではない。
【0060】実施例のトークナイザ1002は、一連の
単語からなる入力列1050を取り入れ、完全な単語、
短縮した単語、数、記号、句読文字からなる個々のトー
クン1054に分解する。なお、これに限定されるもの
ではない。このプロセスでは、部分的な文脈や現在の文
字とそのすぐ隣の文字を調べ、小セットのトークナイゼ
ーション規則1052を使用する。実施例では、トーク
ナイザが、以下の位置にて対応する効果を有する休止を
行う。なお、これに限定されるものではない。 スペース文字(スペース、リターン、タブ、文末(EOS)); アポストロフィ+スペース文字("Doris" -> "Doris" ""); アポストロフィ+"s" ("Peter's" -> "Peter" "'s"); アポストロフィ+"re" ("they're" -> "they" "'re"); アポストロフィ+"d" ("Peter's" -> "Peter" "'d"); アポストロフィ+"ve" ("Peter've" -> "Peter" "'ve"); アポストロフィ+"ll" ("Peter'll" -> "Peter" "'ll"); ピリオド+EOS("Peter likes fish." -> "Peter" "likes" "fish" "."); クエスチョンマーク("Does Peter like fish?" -> "does" "Peter" "like" "fish" "?"); エクスクラメーションマーク("Fish!" -> "fish" "!"); カンマ(数字間のものは除く)("apples, oranges and bananas" -> "apples" "," "oranges" "and" "bananas"); ドル記号("$30" -> "$" "30"); パーセント記号("30%" -> "30" "%"); プラス記号("+80" -> "+" "80"); マイナス記号("-3" -> "-" "30"); セミコロン("fruits; apples, oranges and bananas" -> "fruits" ";" "apples" "," "oranges" "and" "bananas "); コロン(数字間のものは除く) 実施例の解析器1004は、トークナイザ1002から
の出力1054である一連のトークンを取り入れ、辞書
1058及び解析規則セット1056を調べて各語を解
析する。辞書1058は、素性構造の形式である語彙か
らなる。当該屈折型に関連する素性を挿入して、適切な
素性構造1060が単語に対して構成される。トークン
を解析することができる場合、新たに生成された形態論
的素性を有するトークンの素性構造が出力される。解析
器1004は、2つの以上の有効な単語解析がある場
合、多数素性構造を行う。解析器1004は、解析がで
きない場合、未知の単語についての特殊素性構造を行
う。さらに、一連のトークンの可能な分割を決定し、各
分割が有効であるか否かについて判断を行う。形態論的
規則を適用して、不要な分割を除外すると共に適切な形
態論的情報を対応する素性に割り当てる。
【0061】本発明の実施例のAIMの辞書形式では、
最小から大量の情報が符号化される3つの異なるタイプ
のエントリが得られる。辞書の各エントリは語彙素性構
造であり、ここでは、辞書のデータ構造がキーと語彙素
性構造とにより構成される要素を有する列である。不規
則な形式をAIMにおける別々のエントリとして処理す
ることにより、エントリ数や複雑さという点でそれほど
負担が増えるものではなく、組織、利用可能性、維持の
容易さが得られる。語根素性により全エントリをソート
することにより、辞書の組織及び維持がしやすくなり、
形態素解析を目的とした利用可能性が最大となる。さら
に、AIM辞書構造により、辞書エントリに新たな素性
を追加することが容易になる。また、形態生成器のデザ
イン実行や使用のために辞書形式を再利用してもよい。
【0062】本発明の実施例の特徴及び利点は、モジュ
ール方式、屈折型形態論の扱い、シーケンシャルな規則
の適用、素性値の対を有する素性構造からなる出力形
式、辞書形式の改善、処理速度の向上、メモリ要件の削
減、全体的な性能の向上である。モジュール方式に関し
て、AIMは翻訳システムのモジュール部なので、容易
に使用することができ、また、他のアプリケーションや
ツール(例えば、大規模なコーパスからの単語抽出)と
統合することができる。屈折型形態論の扱いに関して
は、本発明の実施例では、辞書エントリ数を低減し、翻
訳知識ベースにおけるエントリ数を低減している。本発
明の実施例のAIMは、変換知識ベースと辞書との直接
対応関係が保持されるので、維持が容易である。シーケ
ンシャルな規則の適用により、形態素解析は、高速で、
計算上複雑ではなく、常に解析を行うことができ、信頼
性のある正確な動作を行うことができ、規則セットの維
持が容易であるという利点が得られる。本発明の実施例
のAIMの出力形式により、素性構造に対しても動作す
る統語論パーサにAIMを統合することが容易になる。
さらに、適切な個々の素性(例えば、語根、文法カテゴ
リー)への迅速なアクセスが得られる。
【0063】説明したように、本発明の実施例は、自然
言語に関する効果的なパーサからなる。パーサは、ある
言語の文を入力として取り入れて、一般的にはシンタッ
クスツリーの形式で構造的解析を行うソフトウェアモジ
ュールである。自然言語処理、機械翻訳、情報検索にお
ける多くのアプリケーションでは、基本的な構成部分と
してパーサが必要である。本発明の実施例のパーサは、
音声から音声への翻訳に用いられ、柔軟な表現及び安全
な曖昧性パッキングメカニズムを導入することにより、
素性構造操作をGLR構文解析アルゴリズムに統合す
る。素性構造の統一は、新たな構文木ノードが生成され
たときに発生する。文の素性構造は、パックされたフォ
レストのルートノードに関連している。実施例の素性構
造の制約は、還元動作が実行されるときに行われる。な
お、実施例はこれに限定されるものではない。実施例の
パーサは、柔軟な素性構造表現や完全な操作が得られる
という点で、一般的なパーサと比較して有利である。さ
らに、このパーサでは、パースフォレストにおける素性
構造による安全な局部的曖昧パッキングが得られる。
【0064】図11は、本発明の実施例のパーサの実現
を示す。このパーサは、構文解析テーブル発生器110
2と、素性構造(F構造)動作コンパイラ1104と、
素性構造制約アプリケーションを有するGLR構文解析
エンジン1106とにより構成される。構文解析テーブ
ル発生器1102は、素性構造操作1152により束ね
られた又は注釈がなされた文法規則のセットからなる入
力を受信する。実施例の文法規則は、英語構文解析文法
規則及び日本語構文解析文法規則からなり、文法規則
は、文脈とは無関係の文法規則である。なお、これに限
定されるものではない。構文解析発生器は、文法規則を
取り入れ、パーサの動作を符号化するデータ構造を生成
する。データ構造は、還元動作、移動動作、受理動作、
失敗動作からなる動作セットの実行においてパーサを制
御する。なお、これに限定されるものではない。構文解
析発生器1102は、実施例においてファイルとして記
憶された構文解析テーブル1122からなる出力を供給
する。
【0065】素性構造動作コンパイラ1104は、素性
構造操作1152により束ねられた文法規則のセットか
らなる入力を受信する。素性構造動作コンパイラ110
4は、プログラミング言語におけるハイレベルインスト
ラクションからなる素性構造動作又は注釈を取り入れ、
それらをプログラミング言語ソースコードにて他の機能
にコンパイルする。素性構造動作コンパイラ1104
は、コンパイルされた素性構造機能1124についてC
言語ソースコードからなる出力を供給する。なお、これ
に限定されるものではない。素性構造機能1124は、
コンパイルされ、GLR構文解析エンジン1106にリ
ンクされる。GLR構文解析エンジン1106は、入力
文1150に対して動作し、構文木及び文の素性構造か
らなる出力1154を供給する。素性構造と構文解析エ
ンジンの統合は、本発明の実施例の拡大GLRアルゴリ
ズムの後に行う。
【0066】実施例の素性構造動作コンパイラ1104
は、素性構造文法を、Cコンパイラにより再度コンパイ
ルされてGLR構文解析エンジン1106のモジュール
にリンクされたCプログラムに変換する。素性構造動作
コンパイラ1104は、素性構造操作1152により束
ねられた文法規則のセットからなる入力を取り入れる。
素性構造動作コンパイラ1104は、素性構造操作を又
は動作を、Cプログラム等のプログラミング言語のイン
ストラクションに変換する。形式的変数は、パーサ動作
時間における適切なメモリ位置への参照を表す表現によ
り置き換えられる。
【0067】図12は、本発明の実施例の話し言葉の言
語翻訳システムにおける構文解析方法を示すフローチャ
ートである。ステップ1202において、動作が開始
し、少なくとも1つの入力文又は表現からなる少なくと
も1つの入力が受信される。ステップ1204におい
て、構文解析テーブルにアクセスして次の動作を調べ、
ここでは、パーサが構文解析テーブルにて次の動作を探
すことになる。なお、これに限定されるものではない。
パーサが入力を解析できない場合、次の動作は失敗動作
であり、ステップ1206に進んで解析を停止する。構
文解析動作中、パーサは移動動作及び還元動作を行って
もよい。なお、これに限定されるものではない。
【0068】ステップ1204において、次の動作が移
動動作であると決定した場合、ステップ1208に進
み、移動動作が行われる。移動動作では、入力列のうち
の次のアイテムをパーサのスタック又は中間データ構造
に移動する。実施例のスタック又は中間データ構造は、
維持される少なくとも1つのグラフ構造スタックからな
る。スタックは、少なくとも1つの構文解析状態を有
し、各入力語の少なくとも1つの表現が少なくとも1つ
のグラフ構造スタックに移動される。ステップ1210
において、新たな構文木ノードが生成される。ステップ
1212において、移動された入力アイテムの素性構造
又は語彙素性構造が、形態素解析器から得られ、新たな
構文木ノードに関連づけられる。ステップ1214で
は、新たなノードがスタック又は中間データ構造に配置
され、ステップ1204に進み、次の動作を構文解析テ
ーブルで調べる。
【0069】ステップ1204において、次の動作が還
元動作であると決定した場合、ステップ1220に進
み、還元動作が行われる。還元動作は、文法規則セット
からの少なくとも1つの文法規則の適用に対応するの
で、還元動作は、適用された文法規則に関連するコンパ
イルされた素性構造操作又は機能へのアクセスおよび適
用を行う。なお、実施例はこれに限定されるものではな
い。ステップ1222において、素性構造操作が実行さ
れる。ステップ1224において、操作が失敗か成功か
判断される。操作が失敗であった場合、規則の適用は失
敗であるので、ステップ1204に進み、次の動作を構
文解析テーブルで調べる。操作が成功であった場合、ス
テップ1210に進み、成功した素性構造操作から得ら
れる新たな素性構造を有する新たな構文木ノードが生成
される。
【0070】パーサが、入力全体の解析に成功し、少な
くとも1つのパックされた共通パースフォレストを生成
すると、次の動作は受理動作となり、ステップ1230
に進んで受理動作が行われる。ステップ1232におい
て、パーサにより生成された入力文の文脈とは無関係の
ツリー構造に対して再構築手続きが行われる。ステップ
1234では、入力の構造解析からなる出力素性構造が
供給される。実施例の構造解析は、複数の構文木と文の
素性構造とを用いる。なお、これに限定されるものでは
ない。
【0071】本発明の実施例の構文解析では、安全な局
部曖昧パッキングと、少なくとも1つの素性構造の反復
的再構築が行われる。反復的再構築ステップでは、素性
構造が再構築される各ノードをマークする。素性構造が
再構築される各ノードからなる少なくとも1つのログが
維持される。パックされた共通パースフォレストの少な
くとも1つの分岐パスを移動する際、ルートノードから
最も遠くにマークされたノードが配置される。最も遠く
にマークされたノードが配置されると、その素性構造が
再構築される。最も遠くにマークされたノードとルート
ノードとの間の分岐パスに沿った連続する各マークノー
ドの素性構造が再構築され、ルートノードの素性構造が
再構築される。
【0072】図13は、本発明の実施例の構文解析エン
ジン1306を示す。構文解析エンジン1306は、素
性構造動作1302と安全曖昧パッキング1304とか
らなる。なお、これに限定されるものではない。また、
構文解析エンジン1306は、スタック内の非決定論の
効率的な扱いを行う一般装置としてグラフ構造スタック
1310を有する。実施例では、パックされたフォレス
トにおける構文木ノードのデータ構造が拡大されて素性
構造に関連付けられる。なお、これに限定されるもので
はない。素性構造は、移動動作1306又は還元動作1
308のいずれにおいても生成することができる。な
お、実施例はこれに限定されるものではない。移動動作
1306が行われると、新たな移動された記号に対して
新たな構文木ノードが生成される。この構文木ノードの
素性構造は、素性構造辞書をコピーすることにより生成
される。還元動作1308が行われると、まず、還元動
作に関連した素性構造動作セットが行われる。素性構造
動作のうちのいずれも失敗を示さない場合、新たな構文
木ノードが生成され、得られる素性構造と関連づけられ
る。そうでない場合、現在の還元は失敗である。構文木
ノードがパックされたノードである場合、すなわち、局
部曖昧パッキングが発生した場合、パックされた曖昧表
現を表すのに離接的素性が使用される。
【0073】ルートノードがパックされたノードであ
り、ルートノード1354の素性構造が構文解析の最終
出力である一般的なGLRパーサでは、構文木の記憶を
保存するのに局部曖昧パッキングが使用される。しか
し、一般的なGLRパーサでは、別のパックノードに新
たな曖昧パッキングが発生すると、ルートノードの素性
構造が一般的には変化を反映せず、構文解析の最終出力
が不正確になってしまうという問題がある。
【0074】本発明の実施例の安全曖昧パッキング13
04では、構文解析中にはログ情報を保持し、構文解析
が終了すると必要に応じてノードの素性構造を再構築す
る。なお、これに限定されるものではない。ログ情報を
保持する際、構文木ノードの元のデータ構造が拡大さ
れ、構文木ノードの素性構造がどのように構成されたの
かを示すログ情報を組み込む。さらに、構文解析中には
更新されたノードリスト又はリンクリストが維持され、
更新された素性構造を有するノードが記憶される。更新
されたノードの確認は局部曖昧パッキングの際に行われ
る。更新されたノードの原型は、新たな変化を反映する
ように再構築されなければならない。その結果、構文木
において再構築の必要がある全てのノードがマークされ
る。再構築段階に入ると、構文木のルートにて再構築手
続きが開始され、マークされたノードを繰り返しサーチ
する。マークされたノードが見つかると、再構築され
る。ルートノードの素性構造は最後に再構築される。
【0075】本発明の実施例では、統語論的に異なる自
然言語表現をユーザのニーズや好みによって生成する。
自然言語生成部は、話し言葉の言語翻訳システムのみな
らず自然言語インターフェース及び話し言葉/書き言葉
対話システムの一部として使用することができる。「エ
ージェント」スタイルを設定するオプションを供給する
ことにより、本発明の実施例は、ユーザがシステムをカ
スタマイズ又は個人化してシステムの魅力を増大させる
ことを可能にする。また、システムは、エンターテイン
メント要素をより多く有することができるように、出力
文体をランダムに変更することができる。
【0076】本発明の実施例では、規則に基づく自然言
語生成部を文体パラメータと組み合わせている。文体の
変化のほとんどは、接続詞、述部、叙法、語彙選択を含
む文構造の比較的小さい部分に見られ、多くは、他の言
語学的現象と同様に組織的である。本発明は、文体パラ
メータを規則に基づく生成に組み込むことにより、これ
らの特徴を利用する。このように、メッセージの主要な
意味を符号化する多くの共通構造が、スペース効率良く
且つ時間効率良くなるように均一に扱われる。
【0077】文体が異なる自然言語表現を扱う際、本発
明の実施例では、文体パラメータをグローバルパラメー
タのうちの1つとして目的言語生成部に送る。文体パラ
メータは、ユーザにより設定された又はシステム自体に
よりランダムに選択された話し言葉の言語翻訳における
入力ソース言語から抽出することができる。なお、実施
例はこれに限定されるものではない。そして、規則ベー
スの適切な部分にてパラメータを調べ、目的表現を生成
する。この方法は、音声合成プログラムにおける同様の
パラメータ設定と組み合わせると、音声出力に最大の効
果を達成することができる。
【0078】システムが扱うことができる文体のバリエ
ーションとしては、例えば、形式(バトラーモード(あ
らたまった調子)、バディモード(くだけた調子)
等)、方言(標準日本語、大阪弁等)、性別や年齢(若
い女性、中年の男性等)がある。なお、実施例はこれに
限定されるものではない。例えば、バトラーモードの出
力が、「would you care to((あなたは)...なさ
りたいですか)」であり、それに対応するバディモード
の出力は、「wanna(...したい)」であり、対応す
るデフォルトモードの出力は、「do you want to(した
いですか)」である。さらに、バトラーモードの出力
が、「would you care to try our new car?(新車をお
試しになりたいですか)」であり、それに対応するバデ
ィモードの出力は、「wanna try our new car?(新車試
したい?)」であり、対応するデフォルトモードの出力
は、「do you want to try our new car?(新車を試し
たいですか)」である。また、他の例として、バトラー
モードの出力が、「would you beso kind as to hand m
e the salt?(どうか塩を取っていただけないでしょう
か)」であり、それに対応するバディモードの出力は、
「gimme the salt!(塩取って!)」であり、対応する
デフォルトモードの出力は、「can you hand me the sa
lt?(塩を取ってもらえませんか)」である。
【0079】図14は、自然言語認識及び生成における
文体制御を行う方法を示すフローチャートである。ステ
ップ1402において、少なくとも1つのソース言語か
らなる音声入力が受信される。音声入力は、自然な話し
言葉での単語、文、句により構成される。ステップ14
04において、ソース表現がソース言語で認識される。
ステップ1406において、ソース表現に対する文体パ
ラメータが決定される。文体パラメータは、ユーザによ
り設定された又は自然言語システムによりランダムに選
択されたソース表現から抽出してもよい。認識されたソ
ース表現は、ユーザによりユーザインターフェースを介
して選択及び確認される。ステップ1408において、
認識されたソース表現は、ソース言語から目的言語に翻
訳される。ステップ1410では、文体パラメータを用
いて、翻訳された目的言語ソース表現から音声出力が生
成される。文体パラメータは、形式、方言、性別、年齢
バリエーションから選択されたバリエーションにより構
成される。
【0080】このように、話し言葉の言語翻訳システム
の方法及び装置が供給される。本発明を具体的な実施例
を参照して説明したが、請求の範囲に記載した本発明の
趣旨を逸脱しない範囲で種々の変更を行ってもよいこと
は明らかである。したがって、明細書及び図面について
は、限定的ではなく例示的であると考えられる。
【図面の簡単な説明】
【図1】本発明の実施例の音声翻訳システム(STS)
のホストとなるコンピュータシステムを示す図である。
【図2】本発明の実施例の音声翻訳システムのホストと
なるコンピュータシステムメモリを示す図である。
【図3】本発明の実施例の音声翻訳システムのシステム
図である。
【図4】本発明の実施例の音声翻訳システムのソース言
語音声認識を示すフローチャートである。
【図5】本発明の実施例の音声翻訳システムにおけるソ
ース言語から目的言語への翻訳を示すフローチャートで
ある。
【図6】本発明の実施例の統語論的解析を用いる用例主
導型翻訳システムの構成を示すブロック図である。
【図7】本発明の実施例の翻訳部のマッチング及び変換
アルゴリズムを示す図である。
【図8】本発明の実施例の音声翻訳システムの仮説選択
部を示す図である。
【図9】本発明の実施例の音声翻訳システムの言語モデ
ル適応を示すフローチャートである。
【図10】本発明の実施例の屈折型形態論解析器(AI
M)を示す図である。
【図11】本発明の実施例のパーサの実現を示す図であ
る。
【図12】本発明の実施例の話し言葉の言語翻訳システ
ムにおける構文解析方法を示すフローチャートである。
【図13】本発明の実施例の構文解析エンジンを示す図
である。
【図14】自然言語認識及び生成における文体制御方法
を示すフローチャートである。
───────────────────────────────────────────────────── フロントページの続き (72)発明者 アレクサンダー エム フランツ アメリカ合衆国 カルフォルニア州 94306 パロ アルト キプリングストリ ート 2895

Claims (29)

    【特許請求の範囲】
  1. 【請求項1】 言語翻訳における文体制御を行う文体制
    御方法において、 少なくとも1つのソース言語からなる音声信号を受信し
    (302)、 少なくとも1つのソース言語の少なくとも1つのソース
    表現を認識し(304)、 少なくとも1つのソース表現の少なくとも1つの文体パ
    ラメータを決定し(306)、 認識された少なくとも1つのソース表現を、少なくとも
    1つのソース言語から少なくとも1つの目的言語に翻訳
    し(308)、 少なくとも1つの文体パラメータを用いて、翻訳された
    少なくとも1つの目的言語から少なくとも1つの音声出
    力を生成し(312)、 少なくとも1つの音声出力を供給する(314)ことを
    特徴とする文体制御方法。
  2. 【請求項2】 少なくとも1つの音声出力を生成する際
    に、少なくとも1つの文体パラメータを規則に基づく音
    声生成に組み込み、少なくとも1つの音声出力の規則に
    基づく生成中に少なくとも1つの文体パラメータが調べ
    られることを特徴とする請求項1記載の文体制御方法。
  3. 【請求項3】 少なくとも1つの文体パラメータを決定
    する際に、少なくとも1つのソース表現から少なくとも
    1つの文体パラメータを抽出することを特徴とする請求
    項1記載の文体制御方法。
  4. 【請求項4】 接続詞、述部、叙法、語彙選択からなる
    グループから選択された文構造の少なくとも一部分か
    ら、少なくとも1つの文体パラメータが抽出されること
    を特徴とする請求項3記載の文体制御方法。
  5. 【請求項5】 少なくとも1つの文体パラメータを決定
    する際に、ユーザにより設定された少なくとも1つの文
    体パラメータを決定することを特徴とする請求項1記載
    の文体制御方法。
  6. 【請求項6】 少なくとも1つの文体パラメータを決定
    する際に、少なくとも文体パラメータをランダムに選択
    することを特徴とする請求項1記載の文体制御方法。
  7. 【請求項7】 少なくとも1つの文体パラメータをグロ
    ーバルパラメータとしてさらに供給することを特徴とす
    る請求項1記載の文体制御方法。
  8. 【請求項8】 形式、方言、性別、年齢のバリエーショ
    ンからなるグループから、少なくとも1つの文体パラメ
    ータが選択されることを特徴とする請求項1記載の文体
    制御方法。
  9. 【請求項9】 少なくとも1つのプロセッサ(102)
    と、 少なくとも1つのプロセッサに接続され、少なくとも1
    つのソース言語からなる音声信号を受信することが可能
    な入力(202)と、 少なくとも1つのプロセッサが、 少なくとも1つのソース言語の少なくとも1つのソース
    表現を認識し(304)、 少なくとも1つのソース表現の少なくとも1つの文体パ
    ラメータを決定し(306)、 認識された少なくとも1つのソース表現を、少なくとも
    1つのソース言語から少なくとも1つの目的言語に翻訳
    し(308)、 少なくとも1つの文体パラメータを用いて、翻訳された
    少なくとも1つの目的言語から少なくとも1つの音声出
    力を生成する(314)ことにより、受信した音声信号
    を翻訳するように構成され、 少なくとも1つのプロセッサに接続され、少なくとも1
    つの音声出力を供給することが可能な出力(280)と
    を有することを特徴とする話し言葉の言語翻訳装置。
  10. 【請求項10】 少なくとも1つの音声出力を生成する
    際に、少なくとも1つの文体パラメータを規則に基づく
    音声生成に組み込み、少なくとも1つの音声出力の規則
    に基づく生成中に少なくとも1つの文体パラメータが調
    べられることを特徴とする請求項9記載の言語翻訳装
    置。
  11. 【請求項11】 少なくとも1つの文体パラメータを決
    定する際に、少なくとも1つのソース表現から少なくと
    も1つの文体パラメータを抽出することを特徴とする請
    求項9記載の言語翻訳装置。
  12. 【請求項12】 接続詞、述部、叙法、語彙選択からな
    るグループから選択された文構造の少なくとも一部分か
    ら、少なくとも1つの文体パラメータが抽出されること
    を特徴とする請求項11記載の言語翻訳装置。
  13. 【請求項13】 少なくとも1つの文体パラメータを決
    定する際に、ユーザにより設定された少なくとも1つの
    文体パラメータを決定することを特徴とする請求項9記
    載の言語翻訳装置。
  14. 【請求項14】 少なくとも1つの文体パラメータを決
    定する際に、少なくとも文体パラメータをランダムに選
    択することを特徴とする請求項9記載の言語翻訳装置。
  15. 【請求項15】 少なくとも1つのプロセッサが、少な
    くとも1つの文体パラメータをグローバルパラメータと
    してさらに供給することにより、受信した音声信号を翻
    訳するように構成されることを特徴とする請求項9記載
    の言語翻訳装置。
  16. 【請求項16】 形式、方言、性別、年齢のバリエーシ
    ョンからなるグループから、少なくとも1つの文体パラ
    メータが選択されることを特徴とする請求項9記載の言
    語翻訳装置。
  17. 【請求項17】 処理システムにおいて実行されると、 少なくとも1つのソース言語からなる音声信号を受信し
    (302)、 少なくとも1つのソース言語の少なくとも1つのソース
    表現を認識し、 少なくとも1つのソース表現の少なくとも1つの文体パ
    ラメータを決定し(306)、 認識された少なくとも1つのソース表現を、少なくとも
    1つのソース言語から少なくとも1つの目的言語に翻訳
    し(308)、 少なくとも1つの文体パラメータを用いて、翻訳された
    少なくとも1つの目的言語から少なくとも1つの音声出
    力を生成し(312)、 少なくとも1つの音声出力を供給する(314)話し言
    葉の言語翻訳方法をシステムに行わせる実行可能な命令
    を有するコンピュータにより読み出し可能な記録媒体。
  18. 【請求項18】 少なくとも1つの音声出力を生成する
    際に、少なくとも1つの文体パラメータを規則に基づく
    音声生成に組み込み、少なくとも1つの音声出力の規則
    に基づく生成中に少なくとも1つの文体パラメータが調
    べられることを特徴とする請求項17記載のコンピュー
    タにより読み出し可能な記録媒体。
  19. 【請求項19】 少なくとも1つの文体パラメータを決
    定する際に、少なくとも1つのソース表現から少なくと
    も1つの文体パラメータを抽出することを特徴とする請
    求項17記載のコンピュータにより読み出し可能な記録
    媒体。
  20. 【請求項20】 接続詞、述部、叙法、語彙選択からな
    るグループから選択された文構造の少なくとも一部分か
    ら、少なくとも1つの文体パラメータが抽出されること
    を特徴とする請求項19記載のコンピュータにより読み
    出し可能な記録記録媒体。
  21. 【請求項21】 少なくとも1つの文体パラメータを決
    定する際に、ユーザにより設定された少なくとも1つの
    文体パラメータを決定することを特徴とする請求項17
    記載のコンピュータにより読み出し可能な記録媒体。
  22. 【請求項22】 少なくとも1つの文体パラメータを決
    定する際に、少なくとも文体パラメータをランダムに選
    択することを特徴とする請求項17記載のコンピュータ
    により読み出し可能な記録媒体。
  23. 【請求項23】 上記方法が、少なくとも1つの文体パ
    ラメータをグローバルパラメータとしてさらに供給する
    ことを特徴とする請求項17記載のコンピュータにより
    読み出し可能な記録媒体。
  24. 【請求項24】 形式、方言、性別、年齢のバリエーシ
    ョンからなるグループから、少なくとも1つの文体パラ
    メータが選択されることを特徴とする請求項17記載の
    コンピュータにより読み出し可能な記録媒体。
  25. 【請求項25】 少なくとも1つのソース言語からなる
    音声信号を受信する(302)手段と、 少なくとも1つのソース言語の少なくとも1つのソース
    表現を認識する(304)手段と、 少なくとも1つのソース表現の少なくとも1つの文体パ
    ラメータを決定する(306)手段と、 認識された少なくとも1つのソース表現を、少なくとも
    1つのソース言語から少なくとも1つの目的言語に翻訳
    する(308)手段と、 少なくとも1つの文体パラメータを用いて、翻訳された
    少なくとも1つの目的言語から少なくとも1つの音声出
    力を生成する(312)手段と、 少なくとも1つの音声出力を供給する(314)手段と
    を有することを特徴とする言語翻訳システム。
  26. 【請求項26】 少なくとも1つの音声出力を生成する
    手段は、少なくとも1つの文体パラメータを規則に基づ
    く音声生成に組み込む手段を有し、少なくとも1つの音
    声出力の規則に基づく生成中に少なくとも1つの文体パ
    ラメータが調べられることを特徴とする請求項25記載
    の言語翻訳システム。
  27. 【請求項27】 少なくとも1つの文体パラメータを決
    定する手段は、少なくとも1つのソース表現から少なく
    とも1つの文体パラメータを抽出する手段を有し、接続
    詞、述部、叙法、語彙選択からなるグループから選択さ
    れた文構造の少なくとも一部分から、少なくとも1つの
    文体パラメータが抽出されることを特徴とする請求項2
    5記載の言語翻訳システム。
  28. 【請求項28】 少なくとも1つの文体パラメータを決
    定する手段は、ユーザにより設定された少なくとも1つ
    の文体パラメータを決定する手段を有することを特徴と
    する請求項25記載の言語翻訳システム。
  29. 【請求項29】 少なくとも1つの文体パラメータを決
    定する手段は、少なくとも文体パラメータをランダムに
    選択する手段を有することを特徴とする請求項25記載
    の言語翻訳システム。
JP2000067839A 1999-03-10 2000-03-10 自然言語生成における文体制御方法及び装置 Pending JP2000353161A (ja)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
US09/266,248 US6374224B1 (en) 1999-03-10 1999-03-10 Method and apparatus for style control in natural language generation
US09/266248 1999-03-10

Publications (1)

Publication Number Publication Date
JP2000353161A true JP2000353161A (ja) 2000-12-19

Family

ID=23013788

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2000067839A Pending JP2000353161A (ja) 1999-03-10 2000-03-10 自然言語生成における文体制御方法及び装置

Country Status (2)

Country Link
US (1) US6374224B1 (ja)
JP (1) JP2000353161A (ja)

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2003345604A (ja) * 2002-05-28 2003-12-05 Inst Of Physical & Chemical Res 言語コンピュータ、言語処理方法、ならびに、プログラム
KR100470736B1 (ko) * 2002-08-08 2005-03-10 인벤텍 코오포레이션 무작위 테스트, 새도우잉 및 즉시 번역 기능을 갖는 언어 듣기 말하기 훈련 시스템 및 방법
JP2011209731A (ja) * 2010-03-30 2011-10-20 Polycom Inc ビデオ会議に翻訳を追加するための方法及びシステム
CN109979432A (zh) * 2019-04-02 2019-07-05 科大讯飞股份有限公司 一种方言翻译方法及装置

Families Citing this family (53)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6556972B1 (en) * 2000-03-16 2003-04-29 International Business Machines Corporation Method and apparatus for time-synchronized translation and synthesis of natural-language speech
US7346488B2 (en) * 2000-07-10 2008-03-18 Fujitsu Limited Automatic translator and computer-readable storage medium having automatic translation program recorded thereon
KR100387918B1 (ko) * 2000-07-11 2003-06-18 이수성 통역기
US6598021B1 (en) * 2000-07-13 2003-07-22 Craig R. Shambaugh Method of modifying speech to provide a user selectable dialect
US8165867B1 (en) * 2000-09-15 2012-04-24 Fish Robert D Methods for translating a device command
JP4089148B2 (ja) * 2000-10-17 2008-05-28 株式会社日立製作所 通訳サービス方法および通訳サービス装置
EP1495413B1 (en) * 2002-04-02 2009-02-18 Verizon Business Global LLC Messaging response system
US8856236B2 (en) * 2002-04-02 2014-10-07 Verizon Patent And Licensing Inc. Messaging response system
US7917581B2 (en) * 2002-04-02 2011-03-29 Verizon Business Global Llc Call completion via instant communications client
JP2006508448A (ja) * 2002-11-28 2006-03-09 コーニンクレッカ フィリップス エレクトロニクス エヌ ヴィ ワードクラス情報を割り当てる方法
US8285537B2 (en) * 2003-01-31 2012-10-09 Comverse, Inc. Recognition of proper nouns using native-language pronunciation
US7062436B1 (en) * 2003-02-11 2006-06-13 Microsoft Corporation Word-specific acoustic models in a speech recognition system
US7423656B2 (en) * 2003-03-11 2008-09-09 National University Of Singapore Method and apparatus for generating morphing sequence
US7076422B2 (en) * 2003-03-13 2006-07-11 Microsoft Corporation Modelling and processing filled pauses and noises in speech recognition
US7124145B2 (en) 2003-03-27 2006-10-17 Millennium It (Usa) Inc. System and method for dynamic business logic rule integration
US7761858B2 (en) * 2004-04-23 2010-07-20 Microsoft Corporation Semantic programming language
US7689410B2 (en) * 2004-04-23 2010-03-30 Microsoft Corporation Lexical semantic structure
DE102004022963A1 (de) * 2004-05-10 2005-12-08 Ems-Chemie Ag Thermoplastische Polyamid-Formmassen
US8099441B2 (en) 2004-09-30 2012-01-17 Millennium It (Usa) Inc. System and method for configurable trading system
US8543408B2 (en) * 2005-01-25 2013-09-24 At&T Intellectual Property Ii, L.P. System, device, and method for rule-based configuration
US20060166642A1 (en) * 2005-01-25 2006-07-27 At&T Corp. System, device, & method for rule-based configuration
US8249873B2 (en) * 2005-08-12 2012-08-21 Avaya Inc. Tonal correction of speech
US20070050188A1 (en) * 2005-08-26 2007-03-01 Avaya Technology Corp. Tone contour transformation of speech
JP4816409B2 (ja) * 2006-01-10 2011-11-16 日産自動車株式会社 認識辞書システムおよびその更新方法
US20080003551A1 (en) * 2006-05-16 2008-01-03 University Of Southern California Teaching Language Through Interactive Translation
US8706471B2 (en) * 2006-05-18 2014-04-22 University Of Southern California Communication system using mixed translating while in multilingual communication
US8032355B2 (en) * 2006-05-22 2011-10-04 University Of Southern California Socially cognizant translation by detecting and transforming elements of politeness and respect
US8032356B2 (en) * 2006-05-25 2011-10-04 University Of Southern California Spoken translation system using meta information strings
US9070363B2 (en) * 2007-10-26 2015-06-30 Facebook, Inc. Speech translation with back-channeling cues
US8972268B2 (en) 2008-04-15 2015-03-03 Facebook, Inc. Enhanced speech-to-speech translation system and methods for adding a new word
US8204739B2 (en) * 2008-04-15 2012-06-19 Mobile Technologies, Llc System and methods for maintaining speech-to-speech translation in the field
US11222185B2 (en) 2006-10-26 2022-01-11 Meta Platforms, Inc. Lexicon development via shared translation database
US9779079B2 (en) * 2007-06-01 2017-10-03 Xerox Corporation Authoring system
US8812296B2 (en) * 2007-06-27 2014-08-19 Abbyy Infopoisk Llc Method and system for natural language dictionary generation
US7475344B1 (en) 2008-05-04 2009-01-06 International Business Machines Corporation Genders-usage assistant for composition of electronic documents, emails, or letters
WO2010062540A1 (en) * 2008-10-27 2010-06-03 Research Triangle Institute Method for customizing translation of a communication between languages, and associated system and computer program product
US8374881B2 (en) * 2008-11-26 2013-02-12 At&T Intellectual Property I, L.P. System and method for enriching spoken language translation with dialog acts
US10467348B2 (en) * 2010-10-31 2019-11-05 Speech Morphing Systems, Inc. Speech morphing communication system
US8874433B2 (en) * 2011-05-20 2014-10-28 Microsoft Corporation Syntax-based augmentation of statistical machine translation phrase tables
US8725496B2 (en) * 2011-07-26 2014-05-13 International Business Machines Corporation Customization of a natural language processing engine
US9824695B2 (en) * 2012-06-18 2017-11-21 International Business Machines Corporation Enhancing comprehension in voice communications
US9336193B2 (en) 2012-08-30 2016-05-10 Arria Data2Text Limited Method and apparatus for updating a previously generated text
JP5727980B2 (ja) * 2012-09-28 2015-06-03 株式会社東芝 表現変換装置、方法およびプログラム
US9575747B2 (en) * 2013-06-27 2017-02-21 Microsoft Technology Licensing, Llc Automatic configuration of a computer system based on process modeling of an implemented process
US9946711B2 (en) 2013-08-29 2018-04-17 Arria Data2Text Limited Text generation from correlated alerts
KR101747873B1 (ko) * 2013-09-12 2017-06-27 한국전자통신연구원 음성인식을 위한 언어모델 생성 장치 및 방법
US10811013B1 (en) * 2013-12-20 2020-10-20 Amazon Technologies, Inc. Intent-specific automatic speech recognition result generation
US20180107655A1 (en) * 2016-10-17 2018-04-19 Google Inc. Systems and methods for handling formality in translations of text
US10467347B1 (en) 2016-10-31 2019-11-05 Arria Data2Text Limited Method and apparatus for natural language document orchestrator
KR20200113105A (ko) 2019-03-22 2020-10-06 삼성전자주식회사 응답을 제공하는 전자 장치와 이의 동작 방법
US11270075B2 (en) 2019-10-31 2022-03-08 International Business Machines Corporation Generation of natural language expression variants
US11238100B2 (en) 2020-02-28 2022-02-01 International Business Machines Corporation Adapting conversational agent communications to different stylistic models
US11527237B1 (en) * 2020-09-18 2022-12-13 Amazon Technologies, Inc. User-system dialog expansion

Family Cites Families (55)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US4686332A (en) 1986-06-26 1987-08-11 International Business Machines Corporation Combined finger touch and stylus detection system for use on the viewing surface of a visual display device
JPS58145998A (ja) 1982-02-25 1983-08-31 ソニー株式会社 音声過渡点検出方法
AU586167B2 (en) 1984-05-25 1989-07-06 Sony Corporation Speech recognition method and apparatus thereof
US4974191A (en) 1987-07-31 1990-11-27 Syntellect Software Inc. Adaptive natural language computer interface system
US4882681A (en) 1987-09-02 1989-11-21 Brotz Gregory R Remote language translating device
US5560037A (en) 1987-12-28 1996-09-24 Xerox Corporation Compact hyphenation point data
US4984177A (en) 1988-02-05 1991-01-08 Advanced Products And Technologies, Inc. Voice language translator
GB8817705D0 (en) 1988-07-25 1988-09-01 British Telecomm Optical communications system
US5093899A (en) 1988-09-17 1992-03-03 Sony Corporation Neural network with normalized learning constant for high-speed stable learning
US5111398A (en) 1988-11-21 1992-05-05 Xerox Corporation Processing natural language text using autonomous punctuational structure
US4984178A (en) 1989-02-21 1991-01-08 Texas Instruments Incorporated Chart parser for stochastic unification grammar
JPH02297195A (ja) 1989-03-02 1990-12-07 Nec Corp 形態素解析方式
US5095432A (en) 1989-07-10 1992-03-10 Harris Corporation Data processing system implemented process and compiling technique for performing context-free parsing algorithm based on register vector grammar
US5418717A (en) 1990-08-27 1995-05-23 Su; Keh-Yih Multiple score language processing system
JPH04207341A (ja) 1990-11-30 1992-07-29 Sony Corp 無線電話装置
JPH0541894A (ja) 1991-01-12 1993-02-19 Sony Corp 電子機器の制御装置
US5477451A (en) 1991-07-25 1995-12-19 International Business Machines Corp. Method and system for natural language translation
JPH0535878A (ja) 1991-07-26 1993-02-12 Sony Corp ニユーラルネツトワーク
JPH0561496A (ja) 1991-08-30 1993-03-12 Sony Corp 音声認識装置
JPH05134694A (ja) 1991-11-15 1993-05-28 Sony Corp 音声認識装置
US5267345A (en) 1992-02-10 1993-11-30 International Business Machines Corporation Speech recognition apparatus which predicts word classes from context and words from word classes
JPH05249990A (ja) 1992-03-04 1993-09-28 Sony Corp パターンマッチング方法およびパターン認識装置
US5353376A (en) 1992-03-20 1994-10-04 Texas Instruments Incorporated System and method for improved speech acquisition for hands-free voice telecommunication in a noisy environment
ES2143509T3 (es) 1992-09-04 2000-05-16 Caterpillar Inc Sistema integrado de edicion y traduccion.
JP3252381B2 (ja) 1992-09-08 2002-02-04 ソニー株式会社 パターン認識装置
JPH06195373A (ja) 1992-12-24 1994-07-15 Sharp Corp 機械翻訳装置
US5920837A (en) 1992-11-13 1999-07-06 Dragon Systems, Inc. Word recognition system which stores two models for some words and allows selective deletion of one such model
EP0602296A1 (en) 1992-12-17 1994-06-22 International Business Machines Corporation Adaptive method for generating field dependant models for intelligent systems
ES2101613B1 (es) 1993-02-02 1998-03-01 Uribe Echebarria Diaz De Mendi Metodo de traduccion automatica interlingual asistida por ordenador.
SE9301596L (sv) 1993-05-10 1994-05-24 Televerket Anordning för att öka talförståelsen vid översätttning av tal från ett första språk till ett andra språk
EP0645757B1 (en) 1993-09-23 2000-04-05 Xerox Corporation Semantic co-occurrence filtering for speech recognition and signal transcription applications
US5510981A (en) 1993-10-28 1996-04-23 International Business Machines Corporation Language translation apparatus and method using context-based translation models
US5546538A (en) 1993-12-14 1996-08-13 Intel Corporation System for processing handwriting written by user of portable computer by server or processing by the computer when the computer no longer communicate with server
US5748841A (en) 1994-02-25 1998-05-05 Morin; Philippe Supervised contextual language acquisition system
US5659765A (en) 1994-03-15 1997-08-19 Toppan Printing Co., Ltd. Machine translation system
US5583965A (en) 1994-09-12 1996-12-10 Sony Corporation Methods and apparatus for training and operating voice recognition systems
US5995920A (en) 1994-12-22 1999-11-30 Caterpillar Inc. Computer-based method and system for monolingual document development
JP3741156B2 (ja) 1995-04-07 2006-02-01 ソニー株式会社 音声認識装置および音声認識方法並びに音声翻訳装置
JP3716870B2 (ja) * 1995-05-31 2005-11-16 ソニー株式会社 音声認識装置および音声認識方法
JPH0916602A (ja) 1995-06-27 1997-01-17 Sony Corp 翻訳装置および翻訳方法
JPH09128396A (ja) 1995-11-06 1997-05-16 Hitachi Ltd 対訳辞書作成方法
TW347503B (en) 1995-11-15 1998-12-11 Hitachi Ltd Character recognition translation system and voice recognition translation system
JPH09231225A (ja) * 1996-02-26 1997-09-05 Fuji Xerox Co Ltd 言語情報処理装置
US6161083A (en) 1996-05-02 2000-12-12 Sony Corporation Example-based translation method and system which calculates word similarity degrees, a priori probability, and transformation probability to determine the best example for translation
US5884083A (en) 1996-09-20 1999-03-16 Royce; Robert Computer system to compile non-incremental computer source code to execute within an incremental type computer system
US6085162A (en) 1996-10-18 2000-07-04 Gedanken Corporation Translation system and method in which words are translated by a specialized dictionary and then a general dictionary
US5884247A (en) 1996-10-31 1999-03-16 Dialect Corporation Method and apparatus for automated language translation
US5845245A (en) 1996-11-27 1998-12-01 Northern Telecom Limited Method and apparatus for reducing false rejection in a speech recognition system
US5884246A (en) 1996-12-04 1999-03-16 Transgate Intellectual Properties Ltd. System and method for transparent translation of electronically transmitted messages
US5822593A (en) 1996-12-06 1998-10-13 Xerox Corporation High-level loop fusion
DE19708183A1 (de) 1997-02-28 1998-09-03 Philips Patentverwaltung Verfahren zur Spracherkennung mit Sprachmodellanpassung
US5956668A (en) 1997-07-18 1999-09-21 At&T Corp. Method and apparatus for speech translation with unrecognized segments
US5960384A (en) 1997-09-03 1999-09-28 Brash; Douglas E. Method and device for parsing natural language sentences and other sequential symbolic expressions
US6151573A (en) 1997-09-17 2000-11-21 Texas Instruments Incorporated Source normalization training for HMM modeling of speech
US6092038A (en) 1998-02-05 2000-07-18 International Business Machines Corporation System and method for providing lossless compression of n-gram language models in a real-time decoder

Cited By (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2003345604A (ja) * 2002-05-28 2003-12-05 Inst Of Physical & Chemical Res 言語コンピュータ、言語処理方法、ならびに、プログラム
KR100470736B1 (ko) * 2002-08-08 2005-03-10 인벤텍 코오포레이션 무작위 테스트, 새도우잉 및 즉시 번역 기능을 갖는 언어 듣기 말하기 훈련 시스템 및 방법
JP2011209731A (ja) * 2010-03-30 2011-10-20 Polycom Inc ビデオ会議に翻訳を追加するための方法及びシステム
JP2014056241A (ja) * 2010-03-30 2014-03-27 Polycom Inc ビデオ会議に翻訳を追加するための方法及びシステム
CN109979432A (zh) * 2019-04-02 2019-07-05 科大讯飞股份有限公司 一种方言翻译方法及装置
CN109979432B (zh) * 2019-04-02 2021-10-08 科大讯飞股份有限公司 一种方言翻译方法及装置

Also Published As

Publication number Publication date
US6374224B1 (en) 2002-04-16

Similar Documents

Publication Publication Date Title
US6374224B1 (en) Method and apparatus for style control in natural language generation
US6442524B1 (en) Analyzing inflectional morphology in a spoken language translation system
US6278968B1 (en) Method and apparatus for adaptive speech recognition hypothesis construction and selection in a spoken language translation system
US6282507B1 (en) Method and apparatus for interactive source language expression recognition and alternative hypothesis presentation and selection
US6266642B1 (en) Method and portable apparatus for performing spoken language translation
US6223150B1 (en) Method and apparatus for parsing in a spoken language translation system
US6243669B1 (en) Method and apparatus for providing syntactic analysis and data structure for translation knowledge in example-based language translation
US6356865B1 (en) Method and apparatus for performing spoken language translation
Yeh Speech act identification using semantic dependency graphs with probabilistic context-free grammars
US8566076B2 (en) System and method for applying bridging models for robust and efficient speech to speech translation
EP1089193A2 (en) Translating apparatus and method, and recording medium used therewith
WO2010046782A2 (en) Hybrid machine translation
WO1999063456A1 (fr) Dispositif de preparation de regles de conversion du langage, dispositif de conversion du langage et support d&#39;enregistrement de programme
KR20080069077A (ko) 통계적 자동 번역 방식에 기반한 음성 자동 통역 시스템 및그에 적용되는 번역 처리 방법 및 그 훈련방법
Ablimit et al. A multilingual language processing tool for Uyghur, Kazak and Kirghiz
Liu et al. Use of statistical N-gram models in natural language generation for machine translation
Aliero et al. Systematic review on text normalization techniques and its approach to non-standard words
JP3441400B2 (ja) 言語変換規則作成装置、及びプログラム記録媒体
JP3009636B2 (ja) 音声言語解析装置
JP3825645B2 (ja) 表現変換方法及び表現変換装置
Shukla et al. A Framework of Translator from English Speech to Sanskrit Text
JPH11259089A (ja) 自然言語理解装置及び自然言語理解システム
JP2001117583A (ja) 音声認識装置および音声認識方法、並びに記録媒体
Tajalli et al. Developing an Informal-Formal Persian Corpus
Samir et al. Training and evaluation of TreeTagger on Amazigh corpus

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20070116

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20071127

A601 Written request for extension of time

Free format text: JAPANESE INTERMEDIATE CODE: A601

Effective date: 20080227

A602 Written permission of extension of time

Free format text: JAPANESE INTERMEDIATE CODE: A602

Effective date: 20080303

A601 Written request for extension of time

Free format text: JAPANESE INTERMEDIATE CODE: A601

Effective date: 20080327

A602 Written permission of extension of time

Free format text: JAPANESE INTERMEDIATE CODE: A602

Effective date: 20080401

A601 Written request for extension of time

Free format text: JAPANESE INTERMEDIATE CODE: A601

Effective date: 20080428

A602 Written permission of extension of time

Free format text: JAPANESE INTERMEDIATE CODE: A602

Effective date: 20080502

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20080527

RD02 Notification of acceptance of power of attorney

Free format text: JAPANESE INTERMEDIATE CODE: A7422

Effective date: 20080820

RD03 Notification of appointment of power of attorney

Free format text: JAPANESE INTERMEDIATE CODE: A7423

Effective date: 20080820

RD04 Notification of resignation of power of attorney

Free format text: JAPANESE INTERMEDIATE CODE: A7424

Effective date: 20080919

A02 Decision of refusal

Free format text: JAPANESE INTERMEDIATE CODE: A02

Effective date: 20090330