JP3059413B2 - 自然言語理解装置及び自然言語理解システム - Google Patents

自然言語理解装置及び自然言語理解システム

Info

Publication number
JP3059413B2
JP3059413B2 JP10065272A JP6527298A JP3059413B2 JP 3059413 B2 JP3059413 B2 JP 3059413B2 JP 10065272 A JP10065272 A JP 10065272A JP 6527298 A JP6527298 A JP 6527298A JP 3059413 B2 JP3059413 B2 JP 3059413B2
Authority
JP
Japan
Prior art keywords
sentence
utterance
natural
concept
argument
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
JP10065272A
Other languages
English (en)
Other versions
JPH11259089A (ja
Inventor
宏一 谷垣
浩和 政瀧
芳典 匂坂
Original Assignee
株式会社エイ・ティ・アール音声翻訳通信研究所
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 株式会社エイ・ティ・アール音声翻訳通信研究所 filed Critical 株式会社エイ・ティ・アール音声翻訳通信研究所
Priority to JP10065272A priority Critical patent/JP3059413B2/ja
Publication of JPH11259089A publication Critical patent/JPH11259089A/ja
Application granted granted Critical
Publication of JP3059413B2 publication Critical patent/JP3059413B2/ja
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Landscapes

  • Machine Translation (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Description

【発明の詳細な説明】
【0001】
【発明の属する技術分野】本発明は、入力される自然発
話文の内容を理解して、理解した結果を中間言語表現で
出力する自然言語理解装置、及び、音声認識装置、自然
言語翻訳装置、又はデータベース検索処理装置を備えた
自然言語理解システムに関する。
【0002】
【従来の技術】近年、隠れマルコフモデルを用いた音響
モデル、及びN−gramを用いた言語モデルを用いた
連続音声認識が盛んに研究されており、数万語彙の認識
でも、単語認識率が90%以上とかなり実用レベルに近
くなっている。しかしながら、音声認識技術を用いたア
プリケーションを考えた場合、読み上げた文章をそのま
ま出力するディクテーションシステムを除くと、旅客機
案内システム、電話番号案内システム、音声翻訳システ
ム等、音声認識結果を理解し、ユーザーに情報を提供す
るいわゆる「音声理解システム」の方が応用分野が広い
と考えられる(例えば、従来技術文献1「坂井信輔ほ
か,“音声入力を用いたパソコンネットワーク旅客機空
席案内システムの試作”,電子情報通信学会技術報告,
SP94−89,pp.29−36,1995年1月」
参照。)。
【0003】現在、音声理解システムのための言語理解
の技術は、発話の内容を構文で限定したものや文法理論
を用いたもの(例えば、従来技術文献2「S.Sene
ff,“TINA:A Natural Langua
ge System forSpoken Langu
age Applications”,Computa
tional Linguistics,Vol.1
8,No.1,1992年3月」参照。)が主流であ
る。発話内容を構文で限定する手法は、理解率は高いと
考えられるが、計算機が受理できる発話内容をユーザー
が事前に知っていなければならず、ユーザーへの負担が
大きく、使いやすいシステムとは言えない。
【0004】また、文法理論を用いた方法は、構文によ
る手法よりは、発話内容の自由度が高いが、文法的に正
しい文章でないと、理解できないという問題がある。し
かしながら、音声認識で広く使われているN−gram
言語モデルは、認識率の観点からは非常に有利とされて
いるが、直前の(N−1)単語から次の単語への接続を
確率で表現するという極めて単純なモデルであるため、
局所的な制約しか表現できず、文全体として必ずしも文
法的に正しい文章を出力するとは限らない。従って、認
識結果に誤りが含まれる場合、正しく言語理解を行うの
は困難であると考えられる。また、実際のシステムの使
用時には、ユーザーが文法的に正しい文章を発声すると
は限らず、自然発話を理解するのは困難である。
【0005】この問題を解決するため、認識結果文を言
語理解部が受理できる部分に分割する手法等(例えば、
従来技術文献3「Y.Wakita et al.,
“Correct parts extraction
from speech recognition
results using semantic di
stance calculation,and it
s application to speech t
ranslation”,ACL,1997年」参
照。)が提案されているが、分割を行うことにより、文
章の大局的な情報を得ることができないと考えられる。
【0006】また、従来技術文献4「遠藤充ほか,“音
声による文例検索システムの検討”,日本音響学会講演
論文集,2−Q−12,pp.163−164,199
7年3月」においては、キーワードによる方法が提案さ
れているが、キーワードのみでは文章の意味を正しく理
解することができず、また、ユーザーインターフェース
等でキーワードの間を補う必要がある。
【0007】この問題点を解決するために、本特許出願
人は、特願平9−303075号の特許出願において、
音声入力による指示により、データベースへアクセス
し、ユーザの要求する情報を表示する音声言語理解装置
(以下、従来例という。)を開示している。この従来例
の音声言語理解装置は、具体的には、「発声音声から音
声認識装置によって音声認識された音声認識結果の音声
文に基づいて、音声文の意味する検索条件の内容を理解
して、データベースを参照して応答する処理を実行する
ための音声言語理解装置であって、検索条件を含む文章
データと、それに対応しかつ少なくとも応答する処理の
内容及びデータの項目名を含む所定の中間言語データと
の対である学習データに基づいて、識別誤りが最小とな
るように、文章データをそれに対応する中間言語に変換
するための隠れマルコフモデル(以下、HMMとい
う。)を学習して得られたHMMを記憶する第1の記憶
装置と、複数の項目名に対応したデータを含むデータベ
ースを記憶する第2の記憶装置と、上記第1の記憶装置
に記憶されたHMMを用いて、上記音声認識されかつ検
索条件を含む音声認識結果の音声文を上記中間言語に変
換して生成する生成手段と、上記生成手段によって生成
された中間言語を、上記データベースに対応した所定の
データベース言語に変換した後、上記データベース言語
に含まれる検索条件に基づいて、上記第2の記憶装置に
記憶されたデータベースを検索して、上記検索条件を満
たすデータを獲得し、そのデータについて上記中間言語
に対応した応答する処理を実行する実行手段とを備え
た」ことを特徴としている。
【0008】
【発明が解決しようとする課題】しかしながら、従来例
では、複数のHMMが独立に意味項を推定するモデルで
あるため、個々のHMMの推定精度は悪い。そのため、
bi−gramによる制約を併用しているが、HMMの
推定確率が出力された後の処理であるため、全体の推定
精度を悪化させている。また、予め決められた2項間の
制約しか扱えないという問題点があった。さらには、H
MMにカテゴリ毎のMCE学習を用いることで個々のH
MMの推定精度の向上を図っているが、概念毎に分類す
ることが困難な概念には適用できないという問題点があ
った。
【0009】本発明の目的は以上の問題点を解決し、従
来例に比較して頑健にかつ正確に音声理解を行うことが
でき、しかも組み合わせ制約を有する組み合わせ概念を
高精度で検出することができる自然言語理解装置及び自
然言語理解システムを提供することにある。
【0010】
【課題を解決するための手段】本発明に係る請求項1記
載の自然言語理解装置は、自然発話文に含まれる発話行
為に依存する制約と、自然発話文に含まれる意味的な概
念の間での組み合わせに依存する制約とを記憶する第1
の記憶装置と、自然発話文の単語列のテキストデータか
らなる学習データに基づいて、上記第1の記憶装置に格
納された制約を参照して、自然発話文の特徴として単語
活用形と単語標準形と概念とを用いて、自然発話文に含
まれる意味的な複数の概念及び概念の組み合わせがそれ
ぞれ存在するか否かを決定するための第1の決定木と、
発話行為が存在するか否かを決定するための第2の決定
木とをそれぞれ、yes/no/未知の三分木の形式、
及びyes/noの二分木の形式で生成する生成手段
と、入力される自然発話文の単語列のテキストデータに
対して、上記生成手段によって生成された第1の決定木
を用いて概念又は概念の組み合わせが存在するか否かを
決定するとともに、上記生成手段によって生成された第
2の決定木を用いて発話行為が存在するか否かを決定し
て決定結果を出力する第1の決定手段と、発話行為と、
複数の概念及び概念の組み合わせとに対応する複数の引
数名を記憶する第2の記憶装置と、自然発話文における
部分文を解析するための部分文解析規則とそれから生成
される引数値とを記憶する第3の記憶装置と、上記第1
の決定手段から出力される発話行為、概念又は概念の組
み合わせに基づいて、上記第2の記憶装置に記憶された
引数名を列挙し、列挙した引数名に対応する上記第3の
記憶装置内の部分文解析規則を用いて構文解析して、使
用した部分文解析規則の対応する引数値を並べることに
より、上記入力される自然発話文に対応する引数値を中
間言語表現で出力する第2の決定手段とを備えたことを
特徴とする。
【0011】また、請求項2記載の自然言語理解システ
ムは、請求項1記載の自然言語理解装置と、自然発話の
発声音声を音声認識して、音声認識結果のテキストデー
タを上記自然言語理解装置に出力する音声認識手段とを
備えたことを特徴とする。
【0012】また、請求項3記載の自然言語理解システ
ムは、請求項1記載の自然言語理解装置と、上記第2の
決定手段から出力される上記入力される自然発話文に対
応する中間言語表現の引数値に基づいて、上記入力され
る自然発話文を別の言語に翻訳して翻訳結果を出力する
翻訳手段とを備えたことを特徴とする。
【0013】さらに、請求項4記載の自然言語理解シス
テムは、請求項2記載の自然言語理解システムにおい
て、上記第2の決定手段から出力される上記入力される
自然発話文に対応する中間言語表現の引数値に基づい
て、上記入力される自然発話文を別の言語に翻訳して翻
訳結果を出力する翻訳手段をさらに備えたことを特徴と
する。
【0014】また、請求項5記載の自然言語理解システ
ムは、請求項1記載の自然言語理解装置と、上記第2の
決定手段から出力される上記入力される自然発話文に対
応する中間言語表現の引数値に応答して、上記中間言語
表現に含まれる検索条件に基づいて、所定のデータベー
スを検索して、上記検索条件を満たすデータを獲得し、
そのデータを出力するとともに、そのデータに対応する
処理を実行する実行手段とを備えたことを特徴とする。
【0015】さらに、請求項6記載の自然言語理解シス
テムは、請求項2記載の自然言語理解システムにおい
て、上記第2の決定手段から出力される上記入力される
自然発話文に対応する中間言語表現の引数値に応答し
て、上記中間言語表現に含まれる検索条件に基づいて、
所定のデータベースを検索して、上記検索条件を満たす
データを獲得し、そのデータを出力するとともに、その
データに対応する処理を実行する実行手段をさらに備え
たことを特徴とする。
【0016】
【発明の実施の形態】以下、図面を参照して本発明に係
る実施形態について説明する。
【0017】図1は、本発明に係る一実施形態である自
然言語理解装置30を備えた自然言語理解システムの構
成を示すブロック図である。この実施形態の自然言語理
解システムは、大きく分けて、(a)音声認識装置10
と、(b)決定木生成処理部21と中間言語生成部22
とを備えた自然言語理解装置30と、(c)自然言語翻
訳部25と、を備え、特に、自然言語理解装置30を備
えたことを特徴とする。
【0018】音声認識装置10では、入力された発声音
声の波形データに対して特徴量計算を行った後、公知の
隠れマルコフ網による音響モデル、及び公知の可変長N
−gramによる言語モデルを用いて、単語グラフサー
チ法により解の探索を行い、認識結果を出力する。音声
認識装置10の認識結果は、自然言語理解装置30内の
中間言語生成部22の発話行為と組み合わせ概念決定部
23に入力される。発話行為と組み合わせ概念決定部2
3は、単語辞書メモリ32内の単語辞書と、発話行為と
組み合わせ概念メモリ33内の発話行為と組み合わせ概
念リストと、決定木メモリ34内の概念推定用決定木と
発話行為推定用決定木とを用いて、発話行為と組み合わ
せ概念を決定して、認識結果とともに引数決定部24に
出力する。これに応答して、引数決定部24は、入力さ
れたデータに基づいて、引数名メモリ35内の引数名と
引数値生成規則メモリ36内の部分文解析規則と引数値
とを参照して引数を決定して、その中間言語表現のデー
タを認識結果とともに自然言語翻訳部25に出力する。
これに応答して自然言語翻訳部25は、文テンプレート
メモリ37内の文テンプレートと、部分文生成規則メモ
リ38内の引数値解析規則と単語列とを参照して、例え
ば、英語から日本語への翻訳を行って、翻訳結果の単語
列をプリンタ26及びCRTディスプレイ27に出力す
る。
【0019】まず、中間言語生成部22で取り扱う中間
言語表現(意味タグ)について説明する。自然発話の意
味表現の中間言語表現として、C−STAR(Cons
ortium for Speech Transla
tion AdvancedResearchの略であ
る。)で定めている“ダイアログ・アクト(Dialo
gue Act)”(以下、DAともいう。)(例え
ば、従来技術文献5「B.Angelini et a
l.,“ Multilingual Person
to Person Communication a
t IRST”,Proc.of ICASSP,ミュ
ンヘン,ドイツ,1997年」参照。)を参照して、テ
キストデータであるコーパスにはDAをそのままタグと
して付与している。DAは、タスク依存のセットとして
定義されている。発話は、概ね文に相当する意味的なま
とまりである意味的な発話単位(Semantic D
ialogue Unit;以下、発話という。)に分
割され、各発話単位からタスク達成に直接関係する情報
だけがDAとして伝達される。各DAは[話者(spe
aker),発話行為(speech−act),概念
(コンセプト;concept),引数(アーギュメン
ト;argumennts)]の4項からなる組であ
る。あるDSUに対するDAの例を表1に示す。
【0020】
【表1】 ─────────────────────────────────── 発話(DSU) “The week of the twelfth we have both signals and doubles available. ─────────────────────────────────── 中間言語表現(DA) a:GIVE−INFORMATION+AVAILABILITY +ROOM(room−type=(single & double), time=(week,md12) ───────────────────────────────────
【0021】表1において、aはエージェント(age
nt)を表わす話者情報であり、GIVE−INFOR
MATION(情報提供)は発話行為、AVAILAB
ILITY(利用可能性)+ROOM(部屋)は概念、
括弧内は引数である。
【0022】概念は、いくつかの概念の組み合わせで、
発話(発話文)の焦点が当たっている命題内容を表現す
る。表1の発話には、他に、TEMPORAL(時間情
報)やFEATURES(特徴)+ROOM(部屋)と
いった概念が現れるが、焦点から最適なタグはAVAI
LABILITY+ROOMとなる。概念には、文脈を
必要とする情報を含まない。概念と発話行為の組み合わ
せ、及び、概念間の組み合わせは、定義により予め制約
されている。本実施形態で、定義されている概念は50
種類であり、これらを組み合わせた概念は777種類存
在する。組み合わせの制約は、主に文生成時の曖昧性排
除の観点から規定されたものである。
【0023】次いで、上述の決定木を用いた概念の推定
について説明する。本実施形態では、音声認識への意味
からの制約をねらい、まず発話の概念の推定だけを考え
る。ここでは、これを発話(発話文)の特徴に基づく分
類問題として扱い、決定木を用いた推定を行う。
【0024】分類クラスとしては、(1)組み合わせ概
念を1クラスとして一括分類する方法と、(2)概念を
独立に分類する方法と、が考えられる。識別精度の観点
からは(1)の方法が望ましいが、データ数が少ない貧
弱なスパースデータの問題が顕著となる。一方、(2)
の方法では、定義に矛盾する組み合わせが出力される恐
れがある。そこで、本実施形態では、(2)の分類にお
いて組み合わせの最適性を得られる方法を用いて。本実
施形態では、定義概念には明確な階層分けが規定されて
いなかったため、概念のグルーピングは行わず、各概念
の有無を1クラスとする分類を行う。概念間の排他・共
起関係は全て学習により獲得する。
【0025】概念の推定に有効な発話の特徴としては、
単語、統語構造(係り受け)、シソーラス(類語辞書)
等が考えられる。これらの情報を、発話の曖昧さに応じ
て適宜用いることが望ましい。ただし、音声認識結果へ
の適用を考慮すると、認識誤りや非文法的な表現が含ま
れる文に対して、全体をパーズ(音声認識)しなくては
得られない特徴を用いることは望ましくない。また、推
定対象である概念は、構文による焦点の移動等の問題は
予想されるものの、概ねキーワードに依存していると考
えられる。そこで、本実施形態では、発話の特徴とし
て、(a)単語活用形、及び(b)単語標準形を用い
た。本実施形態の手法では、これに(c)概念を併せた
3つを用いる。(c)の概念情報は、注目している概念
を除く全ての概念の有無であり、学習時にはコーパスで
付与されているタグから与えられる。例えば、表10に
おいて、識別番号0000の概念情報としては“res
ervation(予約)”と“temporal(時
間)”が与えられる。推定時の取得方法については、詳
細後述する。
【0026】次いで、概念推定用決定木の生成について
説明する。概念毎に、その概念の有無を推定するための
概念推定用決定木を生成する。学習は、全発話サンプル
集合Sをルートノードに属する初期集合とし、次式の相
互情報量I(S;f)が最大となる発話の特徴fhで分
割を繰り返すことにより行う。分割は、ノードが純粋な
クラスの集合になるまで、又は、しきい値以上のI
(S;fh)が得られなくなるまで行う。木は基本的に
yes/noの2分木であるが、特徴fhに概念を用い
る場合は、さらに未知アークの下に発話サンプル集合S
をそのまま保持する第3の子ノードとして加えておくこ
とで、その概念に依存しないパスも同時に生成してお
く。すなわち、概念推定用決定木は、yes/no/未
知の三分木の形式で表される一方、発話行為推定用決定
木は、yes/noの二分木の形式で表される。
【0027】
【数1】
【0028】ここで、Sはノードに属する発話サンプル
の集合、fは発話の特徴に関するテスト特徴(以下、単
に、テストともいう。)である。Ciは発話のクラスで
あり、ここでは、C1は注目している概念を含むクラ
ス、C0は注目している概念を含まないクラスである。
p(Ci)は発話サンプル集合SがクラスCiである確
率、p(Ci,fj)は発話サンプル集合Sに対するテス
トfの結果がfj(=yes/no)でかつクラスがCi
である結合確率、p(Ci|fj)はその条件付き確率で
ある。
【0029】図4は、図1の決定木生成処理部21によ
って生成された概念推定用決定木の一例を示す図であ
る。図4において、ノードの横にテストの内容を示す。
大文字のものは概念、<>で囲まれているものは単語標
準形、*で囲まれているものは詳細後述する前処理によ
り特別なシンボルに置き換えた単語をそれぞれ表わす。
また、リーフノード(黒丸)の下の値はノードに属する
発話サンプルが概念を含む確率p(C1)である。
【0030】次いで、発話行為と組み合わせ概念決定部
23で用いる推定アルゴリズムについて説明する。入力
発話に対して、その特徴に基づいて、概念毎に生成した
概念推定用決定木を並列にトレースして発話の概念を推
定する。各概念推定用決定木において到達したリーフノ
ードのp(C1)をその概念の推定確率とする。木は、
概念テストを行うノードのリンクにより、お互いの概念
推定確率を適宜参照し、共起/排他情報として利用する
(図4中の弧矢印で示す。)。参照先の木が推定を終え
ていない場合は、停止してその終了を待つ。概念推定用
決定木がお互いに依存し合いデッドロック(互いの推定
結果待ちの状態)に陥った場合は、以下の基準で1つだ
け選択した木のポインタを停止中のノードからその未知
子ノードへと移し、木全体のトレースを再開する。デッ
ドロック時に進める木は、全概念に対する識別の曖昧さ
を最小にするものを選択する。次式で定義するクラスエ
ントロピーの総和Eを最小にする木である。クラスエン
トロピーの総和Eは、その木のポインタを未知子ノード
へと移して全ての木のトレースを再開したとき、次にデ
ッドロックした時点で各木が到達するノードのクラスエ
ントロピーの総和Eを、全木に対して取ったものであ
る。この結果得られる各概念の確率ベクトルから概念へ
の復号化には、内積を用いた。
【0031】
【数2】
【0032】次いで、中間言語表現の例について説明す
る。表1に、自然言語文を当該中間言語表現で表現した
例を示す。
【0033】
【表2】 中間言語表現の例 ─────────────────────────────────── 例1.When are you reserving this for a:request−information+reservation +temporal(time=question) ─────────────────────────────────── 例2.I’ll be arriving February twelfth c:give−information+temporal +arrival(who=I,time=(february, md12)) ─────────────────────────────────── 例3.The week of the twelfth we have both singles and doubles available a:give−information+availability +room(room−type=(singledouble), time=(week,md12)) ─────────────────────────────────── 例4.The singles are a hundred and twenty dollars a night a:give−information+price +room(room−type=single, price=(currency=dollar, per−unit=night,quantity=120)) ─────────────────────────────────── 例5.And the doubles are a hundred and thirty four dollars a:give−information+price +room(room−type=double, price=(currency=dollar, quantity=134)) ─────────────────────────────────── 例6.Which would you prefer a:request−information+preference ─────────────────────────────────── 例7.A single would do c:accept+features +room(room−type=single) ─────────────────────────────────── 例8.Would you like to put this on a credit card? c:request−information +payment(method=credit−card) ───────────────────────────────────
【0034】上記表2において、例えば、例1の中間言
語表現は、「話者は“a”つまり『担当者』(“age
nt”の頭文字である。)であり、発話行為は“req
uest−information”つまり『情報要
求』であり、組合わせ概念は“reservation
+temporal”つまり『予約の時間』であり、引
数は“time=question”つまり『時間が質
問対象になっている』」ということを意味する。
【0035】次いで、発話行為の例について説明する。
本実施形態では、発話行為として、「受諾(accep
t)」、「承認(acknowledge)」、「肯定
(affirm)」、「陳謝(apologize)」
といった、23種類を定義して用いる。この中で、特に
「確認(verify)」と「確認要求(reques
t−verification)」の2つは他の発話行
為と組み合わせることで、「受諾の確認(verify
−accept)」等といった複合発話行為を構成する
ことができる。本実施形態では、複合発話行為は65種
類ある。本実施形態で用いる発話行為及び複合発話行為
の例を次の表に示す。
【0036】
【表3】 「発話行為」の例 ─────────────────────────────────── accept「受諾」 “I’ll take that”,“Soundsgood” ─────────────────────────────────── acknowledge「承認」 “Okay”,“Sure”,“yeah” ─────────────────────────────────── affirm「肯定」 “it Yes”,“Yes we do” ─────────────────────────────────── apologize「陳謝」 “Sorry”,“I’m sorry” ─────────────────────────────────── closing「会話終了」 “See you on September then”,“Bye” ─────────────────────────────────── give−information「情報提供」 “We have two singles available on the fourth” ─────────────────────────────────── greeting「挨拶」 “Hello”,“Good morning” ─────────────────────────────────── introduce−self「自己紹介」 “This is Bryan”, “Best western Pittsburgh” ─────────────────────────────────── introduce−topic「話題導入」 “I’d like to make a trip to Pittsburgh” ─────────────────────────────────── negate「否定」 “no” ─────────────────────────────────── offer「申し出」 “How may I help you?” ─────────────────────────────────── please−wait「待機要求」 “Just a minute”,“Let me see” ─────────────────────────────────── reject「拒否」 “No,we don’t” ─────────────────────────────────── request−action「要求動作」 “Could you reserve a room,please” ─────────────────────────────────── request−affirmation「肯定要求」 “Is that right?” ─────────────────────────────────── request−information「情報要求」 “Do you accept Visa?” ─────────────────────────────────── request−suggestion「提案要求」 “Which do you think would be better?” ─────────────────────────────────── request−verification「受諾要求」 “Is this correct?” ─────────────────────────────────── suggest「提案」 “I would recommend that” ─────────────────────────────────── thank「感謝」 “Thank you very much” ─────────────────────────────────── verify「受諾」 “You said this is forty dollars” ─────────────────────────────────── ………………………………………………………………… ───────────────────────────────────
【0037】次いで、概念の一例を表4に示す。どのよ
うな概念を定義するかは、システムが扱うタスクドメイ
ンに強く依存する。本実施形態では、旅行会話タスクを
扱うために、「空港(airport)」、「到着(a
rrival)」、「利用可能性(availabil
ity)」、「キャンセル(cancellatio
n)」等、50種類の概念を定義して用いる。
【0038】
【表4】 概念の一例 ─────────────────────────────────── airport,arrival,availability, cancellation,change,checkin, checkout,confirmation,currency, departure,destination,drop−off, event,exchange,expiration−date, fax−number,features,flight,guide, help,help−again,hotel,location, meeting,minimum−stay,name,numeral, origin,party,payment,person, pick−up,preference,price, price−difference,price−fluctuation, reservation,room,send,sight, spelling,stay,telephone−number, temporal,tour,transfer, transportation,trip,unavailability, ……………………………… ───────────────────────────────────
【0039】次いで、組み合わせ概念の例について説明
する。概念の組み合わせにより、文において焦点が当っ
ている話題を組み合わせ概念として表現する。例えば、
表2の例3の文“The week of the t
welfth we have both singl
es and doubles available”
において、文中には、「時間(temporal)」
や、「部屋の特徴(features+room)」と
いった話題も現れるが、文の焦点から最適な組み合わせ
概念は「部屋の利用可能性(availability
+room)」である。組み合わせ概念として使用可能
な概念の組み合わせを、(1)発話行為に依存する制約
と、(2)概念間での組み合わせ制約として定義し、発
話行為と組み合わせ概念メモリ33に格納する。なお、
本実施形態において、組み合わせ概念とは、1つずつの
概念と、複数の概念の組み合わせとを含めて組み合わせ
概念という。
【0040】この制約定義に基づいて作成した、発話行
為と組み合わせ概念メモリ33のデータ例を表5に示
す。ここで、(1)発話行為に依存する制約とは、具体
的には、例えば、「交通機関の利用可能性」についての
「情報提示」(give−information+a
vailability+transportatio
n)は許すが、「交通機関の利用可能性」についての
「拒否」(reject+availability+
transportation”は許さない、といった
ものである。また、(2)概念間での組み合わせ制約と
は、例えば、「団体客の特徴(features+pa
rty)」は許すが、「団体客の利用可能性(avai
lability+party)」や「団体客の予約
(reservation+party)」は許さな
い、といったものである。本実施形態では、組み合わせ
概念は777種類を定義し、これを用いる。
【0041】発話行為と組み合わせ概念メモリ33のデ
ータ例
【表5】 ─────────────────────────────────── 発話行為 + 組み合わせ概念 ─────────────────────────────────── give-information+availability+transportation +person +room +hotel +tour +flight +features +hotel +tour +flight +transportation +trip +room +party +reservation +expiration +features+transportation +trip +tour +flight +room payment change ………… ───────────────────────────────────
【0042】次いで、「引数」の例について説明する、
文の内容の詳細な特徴を引数で表現する。次の表に挙げ
た例1.及び例2.では、表層が異なる(具体的には、
同じ単語が“I”と“on”しか無い。)2文に対し
て、括弧で括られた引数のみが異なる中間言語表現が与
えられている。ここで、c:は話者aとは異なる話者c
を示す。
【0043】
【表6】 引数の一例 ─────────────────────────────────── 例1.I and two associates arrive on May fifth. c:give−information+temporal +arrival(who=I,with−whom= (associate,quantity=2), time=(may,md15)) ─────────────────────────────────── 例2.I’ll be arriving on February twelfth. c:give−information+temporal +arrival(who=I, time=(february,md12)) ───────────────────────────────────
【0044】本実施形態では、引数は、引数名と引数値
から構成される。表6の例1及び例2では、“wh
o”,“with−whom”,“time”,“qu
antity”が引数名であり、“I”,“(asso
ciate,quantity=2)”,“(may,
md15)”等が引数値である。使用可能な引数名は、
発話行為と組み合わせ概念に依存して定義し、引数名メ
モリ35に格納する。なお、例外については詳細後述す
る。このデータ例を表7に示す。
【0045】
【表7】 引数名メモリ35のデータ例 ─────────────────────────────────── 発話行為 + 組み合わせ概念 引数名 ─────────────────────────────────── give-information+availability+transportation time,frequency, location,price, for-whom, transportation-type, duration, carrier-name,via, destination,origin +room time,frequency, location,price, for-whom,hotel-name, hotel-type,room-type, contain,bed-type, room-location, room-number, room-name ───────────────────────────────────
【0046】表7のデータ例は、“give−info
rmation+availability+tran
sportation”「交通機関の利用可能性に関す
る情報提示」で使用可能な引数名、及び、“give−
information+availability+
room”「部屋の利用可能性に関する情報提示」で使
用可能な引数名の一覧を示すものである。それぞれに定
義された引数名を比べると、両者に共通して使用可能
な、“time(時間)”,“location(場
所)”といった引数名が存在する一方で、前者のみで使
える“transportation−type(交通
機関のタイプ)”,“carrier−name(運送
手段の名前)”、逆に、後者のみで使える“hotel
−type(ホテルのタイプ)”といったものも存在す
ることがわかる。
【0047】引数名それぞれに対して、割り当て可能な
引数値を定義する。引数値のデータ例を表8に示す。
【0048】
【表8】 引数値のデータ例 ─────────────────────────────────── 引数名 = 引数値 ─────────────────────────────────── with-whom = i,we,you,he,she,they,..., child,husband,wife,..., <equantity>,..., ... ─────────────────────────────────── time = 00:00,00:01,00:02,...,23:59, md1,md2,md3,...,md31, monday,tuesday,wednesday,..., night,afternoon,noon,soon,later,..., <estart-time>,<end-time>,..., ... ─────────────────────────────────── room-type = single,double,suite,bedroom,... ─────────────────────────────────── start-time = 00:00,00:01,00:02,...,23:59, md1,md2,md3,...,md31, monday,tuesday,wednesday,..., night,afternoon,noon,soon,later,..., ... quantity = 0,1,2,3,4,... question,couple,many,..., ... ───────────────────────────────────
【0049】引数値には、表8のデータ例に示すような
値を単独で用いる以外に、これら引数値を組み合わせて
用いることも可能である。引数値の組み合わせには、以
下の演算子を用いる。
【0050】
【表9】 引数値の演算子 ─────────────────────────────────── (1)“’”(列挙) 例:time=(february,md12)「2月12日」 ─────────────────────────────────── (2)“;”(分離) 例:time=(md12;md13)「12日か13日」 ─────────────────────────────────── (3)“&”(結合) 例:with−whom=(wife & child)「妻と子」 ───────────────────────────────────
【0051】また、一部の引数名にはその引数値とし
て、引数構造:引数名=引数値を用いることを許す(こ
れは、引数名定義の例外である。)。表9の例中の<q
uantity>や<start−time>,<en
d−time>が、これに相当する。引数構造を用いる
ことで、例えば、表6の例1中の with−whom=(associate,quan
tity=2) 「同伴者2名」といった表現や、 time=(start−time=10:00,en
d−time=12:00) 「10時から12時まで」といった表現を扱うことが可
能である。
【0052】次いで、決定木生成処理部21の処理につ
いて説明する。決定木生成処理部21は、学習データメ
モリ31内の学習データの情報に基づき、概念推定用決
定木と発話行為推定用決定木をそれぞれ生成する。ここ
で、学習データは、表10に示すように、各例文毎の識
別番号と、例文(例えば英語)と、それに対応する中間
言語表現とから構成される。
【0053】まず、概念推定用決定木の構成について説
明する。決定木はノードとアークから構成され、決定木
は基本的に二分木であるが、部分的に三分木となるノー
ドを含むことを特徴としている。全てのノードは事例集
合を保持する。また、リーフ以外のノードでは、この他
にテストを保持する。ここで、事例集合は、学習データ
メモリ31内の学習データの情報から生成される全事例
の部分集合である。この学習データのデータ例を表10
に示す。また、この学習データの情報から生成した、概
念“room(部屋)”を推定する決定木用の事例集合
のデータ例を表11に示す。
【0054】
【表10】 学習データメモリ31のデータ例 ─────────────────────────────────── 識別番号 文/中間言語表現 ─────────────────────────────────── 0000 When are you reserving this for a:request-information+reservation+temporal(time=question) ─────────────────────────────────── 0001 I'll be arriving February twelfth c:give-information+temporal+arrival (who=I,time=(february,md12)) ─────────────────────────────────── 0002 The week of the twelfth we have both singles and doubles available a:give-information+availability+room (room-type=(single & double),time=(week,md12)) ─────────────────────────────────── 0003 The singles are a hundred and twenty dollars a night a:give-information+price+room(room-type=single, price=(currency=dollar,per-unit=night,quantity=120)) ─────────────────────────────────── 0004 And the doubles are a hundred and thirty four dollars a:give-information+price+room(room-type=double, price=(currency=dollar,quantity=134)) ─────────────────────────────────── 0005 Which would you prefer a:request-information+preference ─────────────────────────────────── 0006 A single would do c:accept+features+room(room-type=single) ─────────────────────────────────── 0007 Would you like to put this on a credit card c:request-information+payment(method=credit-card) ───────────────────────────────────
【0055】
【表11】 “room(部屋)”の決定木用の事例集合のデータ例 ─────────────────────────────────── 事例 識別番号 文 クラス ─────────────────────────────────── 0000 When are you reserving this for C0 ─────────────────────────────────── 0001 I'll be arriving February twelfth C0 ─────────────────────────────────── 0002 The week of the twelfth we have both singles and doubles available C1 ─────────────────────────────────── 0003 The singles are a hundred and twenty dollars a night C1 ─────────────────────────────────── 0004 And the doubles are a hundred and thirty four dollars C1 ─────────────────────────────────── 0005 Which would you prefer C0 ─────────────────────────────────── 0006 A single would do C1 ─────────────────────────────────── 0007 Would you like to put this on a credit card C0 ───────────────────────────────────
【0056】ここで、事例とは、文とクラスの組であ
る。クラスとは、当該文の中間言語表現に、当該決定木
が推定対象とする概念を含むクラスC1、又は含まない
クラスC0のいずれかである。テストは、予め指定した
文の特徴から、上述の数1により定める相互情報量基準
により唯一つ選択する。文の特徴としては、(1)単語
活用形(すなわち、ある単語が文中に出現するかを示
す。)、(2)単語標準形(すなわち、ある単語標準形
を持つ単語が文中に出現するかを示す。)、(3)概念
(すなわち、ある概念が文の中間言語表現中に見られる
かを示す。)の3つを用いる。ただし、(3)の概念に
は、当該決定木が推定対象とする概念を含まない。
【0057】次いで、発話行為推定用決定木について説
明する。以下、概念推定用決定木との相違点のみを示
す。 (a)唯一つの発話行為推定用決定木で発話行為を決定
する。 (b)文の特徴には、(1)単語標準形(すなわち、あ
る単語標準形をもつ単語が文中に出現するかを示
す。)、(2)単語標準形の2連接(すなわち、ある単
語標準形をもつ単語の2連接が文中に出現するかを示
す。)の2つを用いる。 (c)事例のクラスとしては、65種類の複合発話行為
を設定する。 (d)ノードのテストを選択する基準には、概念推定用
決定木と同様に、相互情報量を用いる。 (e)生成する発話行為推定用決定木は、完全二分木で
ある。概念推定用決定木で生成した未知アークはここで
は生成しない。
【0058】次いで、中間言語生成部22の処理につい
て説明する。中間言語生成部22は、図1に示すよう
に、発話行為と組み合わせ概念決定部23と引数決定部
24とから構成され、音声認識装置10からの自然発話
の入力文に対応する中間言語表現を生成する。すなわ
ち、複合発話行為、組み合わせ概念、引数をそれぞれ決
定する。発話行為と組み合わせ概念決定部23におい
て、組み合わせ概念の決定においては、上述の推定アル
ゴリズムを用いる。また、発話行為の決定においては、
到達したリーフが保持する事例集合中から、最大数を占
める複合発話行為を推定結果として選択する。
【0059】引数決定部24は、発話行為と組み合わせ
概念決定部23からの決定された発話行為及び組み合わ
せ概念を含む入力文を、以下の手順で部分的に構文解析
することで、発話行為と組み合わせ概念を決定する。 <ステップSS1>入力される決定した発話行為と組み
合わせ概念を引数名メモリ35内の引数名と照らし合わ
せることで、使用可能な引数名を列挙する。 <ステップSS2>列挙した引数名それぞれについて、
対応する部分文解析規則を引数値生成規則メモリ36か
ら読み込む。 <ステップSS3>部分文解析規則を用いて、入力文中
の任意の連続した部分単語列を構文解析する。このとき
使った規則から生成される引数値を並べることで、当該
入力文に対応する引数値を生成する。例えば、入力文
“I’ll arriving on Monday
February1.”からは、連続した部分単語列
“on Monday February1”から引数
名“time”に対する引数値“(monday,fe
bruary,md1)”が生成される。
【0060】表12及び表13に、引数名“time
(時間)”の引数値生成規則の例を示す。引数値生成規
則は、部分文解析規則と生成される引数値から構成され
る。表12及び表13中、セミコロン“;”の左側が公
知のBNF(“BaccusNaur Form”の略
とも、“Baccus Normal Form”の略
とも言われる。)記法で記述した部分文解析規則であ
り、右側が当該規則から生成される引数値である。大文
字とアンダースコア“_”のみから構成されているもの
は非終端記号を表わす。バッククォート“‘”とシング
ルクォート“’”で囲まれているものは終端記号を表わ
す。アスタリスク“*”で囲まれたものは、非終端記号
の展開により生成される引数値である。
【0061】
【表12】 時間“time”の引数値生成規則メモリ36のデータ例(その1) ─────────────────────────────────── TIME_STR ::= TIME_STR1 ;*TIME_STR1* ─────────────────────────────────── TIME_STR1 ::= TIME_STR2 ;*TIME_STR2* − TIME_STR1 TIME_STR1 ;(*TIME_STR1*,*TIME_STR1*) − TIME_STR1 AND TIME_STR1 ;(*TIME_STR1*&*TIME_STR1*) − TIME_STR1 OR TIME_STR1 ;(*TIME_STR1*;*TIME_STR1*) ─────────────────────────────────── TIME_STR2 ::= TIME_STR3 ;*TIME_STR3* − START_STR TIME_STR3 ;*START_STR**TIME_STR1* − END_STR TIME_STR3 ;*END_STR**TIME_STR1* ─────────────────────────────────── START_STR ::= ‘from' ;start-time= − ‘starting' ;start-time= − ‘since' ;start-time= ─────────────────────────────────── END_STR ::= ‘to' ;end-time= − ‘till' ;end-time= − ‘until' ;end-time= − ‘uptotill' ;end-time= ─────────────────────────────────── TIME_STR3 ::= TIME_STR4 ;*TIME_STR4* − TIME_STR4‘and'TIME_STR4 ;*TIME_STR4*&*TIME_STR4* − TIME_STR4‘or'TIME_STR4 ;*TIME_STR4*;*TIME_STR4* − TIME_STR4 TIME_STR4 ;*TIME_STR4*,*TIME_STR4* ─────────────────────────────────── TIME_STR4 ::= YEAR ;*YEAR* − MONTH ;*MONTH* − DOM ;*DOM* − DOW ;*DOW* − HOUR_MIN ;*HOURMIN* − POT ;*POT* − REL ;*REL* ───────────────────────────────────
【0062】
【表13】 時間“time”の引数値生成規則メモリ36のデータ例(その2) ─────────────────────────────────── YEAR ::= YEAR1 ;*YEAR1* − ‘in'YEAR1 ;*YEAR1* − ‘of'YEAR1 ;*YEAR1* ─────────────────────────────────── YEAR1 ::= ‘1998' ;1998 − ‘1999' ;1999 ... ... ─────────────────────────────────── MONTH ::= MONTH1 ;*MONTH1* − ‘on'MONTH1 ;*MONTH1* − ‘of'MONTH1 ;*MONTH1* ─────────────────────────────────── MONTH1 ::= ‘January' ;january − ‘February' ;february ... ... ─────────────────────────────────── DOM ::= DOM1 ;*DOM1* − ‘in'DOM1 ;*DOM1* − ‘of'DOM1 ;*DOM1* ─────────────────────────────────── DOM1 ::= the‘first' ;md1 − the‘1st' ;md1 ... ... ─────────────────────────────────── ……… ───────────────────────────────────
【0063】次いで、自然言語翻訳部25の処理につい
て説明する。自然言語翻訳部25は、引数決定部24か
ら入力される中間言語表現から、以下の手順で翻訳文を
生成する。 <SS11>発話行為と組み合わせ概念に基づき、文テ
ンプレートメモリ37から対応する文テンプレートを取
り出す。 <SS12>部分生成規則メモリ38は、引数値解析規
則とそれに対応する単語列とから構成され、部分文生成
規則メモリ38から、中間言語表現中に与えられた引数
名に対応する部分文生成ルールを取り出す。<SS13
>引数値解析規則を使って引数値の構文解析を行う。こ
のとき使った規則により生成される単語列を並べること
で、当該引数に対応する部分文を生成する。 <SS14>部分文を文テンプレートに埋め込んで出力
文を生成する。ここで、文テンプレートメモリ37のデ
ータ例を表14及び表15に示す。また、部分文生成規
則メモリ38のデータ例を表16及び表17に示す。
【0064】
【表14】 文テンプレートメモリのデータ例(その1) ─────────────────────────────────── give−information+price+room ─────────────────────────────────── hotel−namehotel−typeroom−typecontain 付きの bed−type 付きのroom−location にある room−numberroom−name の 部屋の値段は price − です。 ───────────────────────────────────
【0065】
【表15】 文テンプレートメモリのデータ例(その2) ─────────────────────────────────── give−information+availability+room ─────────────────────────────────── locationtimefrequencypricefor−whom の名義で hotel−namehotel−typeroom−typecontain 付きの bed−type 付きのroom−location にある room−numberroom−name の 部屋が利用できます。 ───────────────────────────────────
【0066】
【表16】 時間“time”の部分文生成規則メモリ38のデータ例(その1) ─────────────────────────────────── TIME_VALUE ::= VAL ;*VAL* | VAL_SEQ_PAR ;*VAL_SEQ_PAR* ─────────────────────────────────── VAL_SEQ_PAR ::= ‘('VAL_SEQ‘)' ;*VAL_SEQ* | VAL_SEQ ;*VAL_SEQ* ─────────────────────────────────── VAL_SEQ ::= VAL_SEQ_PAR LOP VAL_SEQ_PAR ;*VAL_SEQ_PAR**LOP**VAL_SEQ_PAR* | VAL ;*VAL* ─────────────────────────────────── LOP ::= ‘&' ;と | ‘;' ;か | ‘,' ; ─────────────────────────────────── VAL ::= VAL_ARG ;*VAL_ARG* | VAL1 ;*VAL1*に ─────────────────────────────────── VAL_ARG ::= ‘start_time='TIME_VALUE ;*TIME_VALUE*から | ‘end_time='TIME_VALUE ;*TIME_VALUE*まで ─────────────────────────────────── VAL1 ::= YEAR ;*YEAR* | MONTH ;*MONTH* | DOM ;*DOM* | DOW ;*DOW* | POT ;*POT* | HOUR_MIN ;*HOUR_MIN* | ‘question' ;いつ ───────────────────────────────────
【0067】
【表17】 時間“time”の部分文生成規則メモリ38のデータ例(その2) ─────────────────────────────────── YEAR ::= ‘1998' ;1998年 | ‘1999' ;1999年 ... ... ─────────────────────────────────── MONTH ::= ‘january' ;1月 | ‘february' ;2月 ... ... ─────────────────────────────────── DOM ::= ‘md1' ;1日 | ‘md2' ;2日 ... ... ─────────────────────────────────── DOW ::= ‘sunday' ;日曜日 | ‘monday' ;月曜日 ... ... ─────────────────────────────────── POT ::= ‘night' ;夜 | ‘afternoon' ;午後 ... ... ─────────────────────────────────── HOUR_MIN ::= ‘00:00' ;0時 | ‘00:01' ;0時1分 ... ... ───────────────────────────────────
【0068】表16及び表17から明らかなように、部
分文生成規則メモリ38には、引数値解析規則と生成さ
れる単語列から構成される。表16及び表17におい
て、セミコロン“;”の左側が公知のBNF記法で記述
した引数値解析規則であり、右側が当該規則から生成さ
れる単語列である。大文字とアンダースコア“_”のみ
から構成されているものは非終端記号を表わす。また、
バッククォート“‘”とシングルクォート“’”で囲ま
れているものは終端記号を表わす。さらに、アスタリス
ク“*”で囲まれたものは、非終端記号の展開により生
成される単語列である。
【0069】例えば、自然言語翻訳部25の処理におい
て、中間言語表現“give−information
+availability+room(room−t
ype=single,time=(md12md1
3))”が与えられると、引数から部分文「シングル」
と「12日と13日に」が生成される。これを表14及
び表15の例の下段(表15)の文テンプレートに埋め
込むことで、出力文「12日と13日にシングルの部屋
が利用できます。」が生成される。
【0070】図5及び図6は、図1の決定木生成処理部
21によって実行される決定木生成処理を示すフローチ
ャートである。まず、図5のステップS1において、発
話行為と概念組み合わせメモリ33を参照して全ての概
念と複合発話行為を内部メモリに列挙する。次いで、ス
テップS2において決定木を生成していない概念又は複
合発話行為があるか否かが判断され、YESのときは処
理すべきデータが残ってきるので、ステップS3に進む
一方、NOのときは当該決定木生成処理を終了する。ス
テップS3において学習データメモリ31から全ての学
習データを読み込み、当該意味項目(概念又は複合発話
行為を含む。)に対応する事例を生成し、ステップS4
において全ての事例を事例集合として保持するノードを
生成し、当該意味項目決定木のルートノードとして登録
し、ルートノードを分割待ち行列(内部メモリに設定さ
れる)に入れる。そして、ステップS5において分割待
ち行列は空か否かが判断され、NOのときは処理すべき
データが残っているので、ステップS6に進む一方、Y
ESのときは当該意味項目の決定木の生成は完了したの
で、ステップS14に進み、生成した決定木を決定木メ
モリ34に格納して、ステップS2に戻る。
【0071】ステップS6において分割待ち行列から、
ノードNを1つ取り出し、ステップS7においてノード
Nの保持する事例集合Sは、単独クラスの集合か否かが
判断され、YESであればステップS5に戻る一方、N
OであればステップS8に進む。ステップS8において
ノードNの先祖ノードでテストとしてまだ選択されてい
ない全ての文の特徴fiに対して、特徴fiの有無によ
り、当該ノードが保持する事例集合Sの2分割を試み
る。このとき、最大の相互情報量(数1参照)を与える
文の特徴
【数3】 を見つける。
【0072】次いで、図6のステップS9において相互
情報量I(S;fi*)はしきい値以上か否かが判断さ
れ、YESのときはステップS10に進む一方、NOの
ときは図5のステップS5に戻る。ステップS10にお
いて特徴fiをノードNのテスト特徴として登録し、ス
テップS11においてノードNが保持する事例集合S
を、文の特徴fi*の有無に基づいて事例Syesと事例S
noに2分割する。そして、それぞれの部分集合を保持す
る新たな2つのノードを生成し、ノードNのそれぞれy
esアーク、noアークの下の子ノードとして登録し、
これら2ノードを分割待ち行列に入れる。さらに、ステ
ップS12において特徴fi*は概念か否かが判断さ
れ、YESのときはステップS13に進む一方、NOの
ときは図5のステップS5に戻る。ステップS13にお
いてノードNが保持する事例集合Sをそのまま保持する
新たなノードを生成し、ノードNの未知アークの下に3
つ目の子ノードとして登録した後、図5のステップS5
に戻る。
【0073】図5及び図6の決定木生成処理では、各概
念毎、及び、各複合発話行為毎に、予め定めるしきい値
以上の相互情報量を持つテスト特徴が何れのノードにも
見つからなくなるまで決定木を成長させ、この結果生成
した木を決定木メモリ34に格納する。
【0074】図7は、図1の発話行為と組み合わせ概念
決定部23によって実行される組み合わせ概念決定処理
を示すフローチャートである。まず、図7のステップS
21において、決定木メモリ34から、全ての概念決定
木を読み込み、ステップS22において各概念決定木の
ルートにノードポインタを設定する。そして、ステップ
S23において概念決定木のトレース処理を実行する。
ここで、概念のスコアがまだ推定されていない全ての決
定木のノードを降りる。次いで、ステップS24におい
て全ての概念のスコアが推定されたか否かが判断され、
NOのときはすべての概念のスコアが計算されていない
ので、ステップS25に進む一方、YESのときはすべ
ての概念のスコアが計算済みなので、ステップS28に
進む。ステップS25において停止中の概念推定用決定
木はデッドロック(=互いの推定結果待ち)しているか
否かが判断され、YESのときはデッドロックの処理を
行うためにステップS26に進む一方、NOのときはス
テップS23に戻る。ステップS26では、停止中の決
定木群から、別に定める基準により、木を1つ選択し、
ステップS27において選択した決定木のノードポイン
タを、現在ノードポインタが指すノードの未知子ノード
へと移した後、ステップS23に戻る。
【0075】ステップS24でYESのときは、ステッ
プS28において全ての概念のスコアを並べてベクトル
Vを生成する。発話行為と概念組み合わせメモリ33が
保持する全ての組み合わせ概念に対して、各概念を含む
/含まないに応じて1/0を割り当てたベクトル群を生
成し、その中でベクトルVとの内積が最大となるもの
を、推定された組み合わせ概念として引数決定部24に
出力する。なお、ステップS26における基準とは、次
のヒューリスティクスによる経験的基準である。まず、
停止中の何れかの決定木Tiのノードポインタを、一時
的に未知アークの下の子ノードへと移し、全決定木のト
レースをデッドロック状態になるまで仮想的に続ける。
この結果それぞれの決定木Tjが到達するノードのクラ
スエントロピーの総和
【数4】 ΣEj j∈tree を求める。ここで、
【数5】Ej=−(|Syes|/|S|)・log(|S
yes|/|S|)−(|Sno|/|S|)・log(|
no|/|S|) である。また、|S|,|Syes|,|Sno|はそれぞ
れ、決定木Tjが到達するノード(リーフでなくとも良
い。)における事例集合Sの中で当該概念を含む事例S
の事例数|S|、当該概念を含む事例Syesの事例数|
yes|、及び当該概念を含む事例Snoの事例数|Sno
|を表わす。以上を停止中の全ての決定木に対して試行
し、この結果、最小の総和エントロピー
【数6】 ΣEj j∈tree を与える決定木Ti*を選択する。
【0076】図8は、図7のサブルーチンである概念決
定木のトレース処理を示すフローチャートである。ま
ず、図8のステップS31においてノードポインタが指
すノードNはリーフか否かが判断され、NOのときはス
テップS32に進む一方、YESのときはステップS3
6に進む。次いで、ステップS32においてノードNの
テスト特徴はfは概念か否かが判断され、YESのとき
はステップS33に進む一方、NOのときはステップS
35に進む。さらに、ステップS33において特徴fで
テスト対象とする概念のスコアsは計算されているか否
かが判断され、YESのときはステップS34に進む一
方、NOのときは元のメインルーチンに戻る。ステップ
S34では、子ノード指示変更処理を実行した後、ステ
ップS31に戻り、また、ステップS35では、入力文
テスト処理を実行した後、ステップS31に戻る。ステ
ップS36において到達したリーフが保持する事例集合
Sの事例数|S|と、事例集合Sの中で当該概念を含む
事例Syesの事例数|Syes|とから、次式を用いて、
【数7】概念の尤度Pr=|Syes|/|S| を計算し、これを当該概念のスコアとして、元のメイン
ルーチンに戻る。
【0077】図9は、図8のサブルーチンである子ノー
ド指示変更処理を示すフローチャートである。まず、図
9のステップS41において0≦s<0.1であるか否
かが判断され、ステップS42において0.9<s≦
1.0であるか否かが判断され、ステップS43におい
て0.1≦s≦0.9であるか否かが判断される。ステ
ップS41でYESであれば、ステップS44において
ノードポインタをノードNのnoアークの下の子ノード
を指すように変更した後、元のメインルーチンに戻る。
また、ステップS42でYESであれば、ステップS4
5においてノードポインタをノードNのyesアークの
下の子ノードを指すように変更した後、元のメインルー
チンに戻る。さらに、ステップS43でYESであれ
ば、ステップS46においてノードポインタをノードN
の未知アークの下の子ノードを指すように変更した後、
元のメインルーチンに戻る。
【0078】図10は、図8のサブルーチンである入力
文テスト処理を示すフローチャートである。まず、図1
0のステップS51において入力文に対して特徴fをテ
ストする。ここで、テストとは、特徴fの示す単語が、
入力文に出現しているか、否か、を調べることを意味す
る。次いで、ステップS52においてテスト結果はye
sか否かが判断され、YESであれば、ステップS53
においてノードポインタをノードNのyesアークの下
の子ノードを指すように変更した後、元のメインルーチ
ンに戻る。一方、ステップS52でNOであれば、ステ
ップS54においてノードポインタをノードNのnoア
ークの下の子ノードを指すように変更した後、元のメイ
ンルーチンに戻る。
【0079】図11は、図1の引数決定部24によって
実行される引数決定処理を示すフローチャートである。
まず、図11のステップS61において発話行為と組み
合わせ概念決定部23によって決定された発話行為と組
み合わせ概念を、引数名メモリ36を参照して、使用可
能な引数名を内部メモリに列挙する。次いで、ステップ
S62において列挙した各引数名について、その引数名
の引数値に対応する部分文解析規則を引数値生成規則メ
モリ36から読み込む。さらに、ステップS63におい
て引数値生成規則メモリ36内の部分文解析規則を用い
て、入力文中の任意の連続した部分単語例を構文解析し
て、構文解析結果を自然言語翻訳部25に出力して、当
該引数決定処理を終了する。ここで、構文解析は、具体
的には、引数値生成規則メモリに格納される部分文解析
規則を用いて、公知のチャート法(例えば、従来技術文
献6「M.Kay,“Algorithm Schem
ata and Data Structures i
n SyntatcticProcessing”,T
echnical Report CSL−80−1
2,Xerox Parc,1980年10月」参
照。)等により、最上位の非終端記号から、部分文を構
成する終端記号列が生成される過程で適用された規則、
及び、その適用順序を調べることである。
【0080】図12は、図1の自然言語翻訳部25によ
って実行される自然言語翻訳処理を示すフローチャート
である。まず、図12のステップS71において決定さ
れた発話行為と概念の組み合わせに基づいて、文テンプ
レートメモリ37から対応する文テンプレートを取り出
す。次いで、ステップS72において部分文生成規則メ
モリ38から、中間言語表記中に与えられた引数名の単
語列に対応する引数値解析規則を取り出し、ステップS
73において部分文生成規則メモリ38内の引数解析規
則を用いて引数値の単語列の構文解析を行う。ここで、
構文解析は、具体的には、部分文生成規則メモリに格納
される引数値解析規則を用いて、公知のチャート法(例
えば、従来技術文献6参照。)等により、最上位の非終
端記号から、引数値を構成する終端記号列が生成される
過程で適用された規則、及び、その適用順序を調べるこ
とである。さらに、ステップS74において部分文を文
テンプレートに埋め込んで出力文を生成してプリンタ2
6及びCRTディスプレイ27に出力する。
【0081】図1において、決定木生成処理部21、中
間言語生成部22、及び自然言語翻訳部25は例えばデ
ジタル計算機で構成され、学習データメモリ31と、単
語辞書メモリ32と、発話行為と組み合わせ概念メモリ
33と、決定木メモリ34と、引数名メモリ35と、引
数値生成規則メモリ36と、文テンプレートメモリ37
と、部分文生成規則メモリ38とは例えばハードディス
クメモリなどの記憶装置で構成される。
【0082】以上の実施形態において、中間言語生成部
22の前段には、音声認識装置10を接続しているが、
本発明はこれに限らず、キーボードなどの入力手段を接
続して、自然発話のテキストデータを中間言語生成部2
2に入力するように構成してもよい。また、以上の実施
形態において、中間言語生成部22の後段には、自然言
語翻訳部25を接続しているが、本発明はこれに限ら
ず、データベースメモリを備えたコマンド実行処理部を
備えてもよい。コマンド実行処理部は、中間言語生成部
22から出力される検索条件を指示するコマンドを含む
中間言語表現に基づいて、例えば対話システムに用いる
データベースをアクセスして、上記検索条件を満たすデ
ータを検索して、検索結果を出力するとともに、検索結
果に対応した処理を実行する。ここで、検索結果に対応
した処理とは、例えば、音声合成の出力、プリンタへの
印字出力、CRTディスプレイへの表示などである。
【0083】図2に本実施形態で用いる連続音声認識装
置10のブロック図を示す。本実施形態の連続音声認識
装置10は、公知のワン−パス・ビタビ復号化法を用い
て、入力される発声音声文の音声信号の特徴パラメータ
に基づいて上記発声音声文の単語仮説を検出し尤度を計
算して出力する単語照合部4を備えた連続音声認識装置
において、単語照合部4からバッファメモリ5を介して
出力される、終了時刻が等しく開始時刻が異なる同一の
単語の単語仮説に対して、統計的言語モデル13を参照
して、当該単語の先頭音素環境毎に、発声開始時刻から
当該単語の終了時刻に至る計算された総尤度のうちの最
も高い尤度を有する1つの単語仮説で代表させるように
単語仮説の絞り込みを行う単語仮説絞込部6を備える。
【0084】ここで用いる統計的言語モデル13は、学
習用テキストデータに基づいて言語モデル生成部(図示
せず。)により生成されたものであって、統計的言語モ
デル13は、例えば特開平9−134192号公報にお
いて開示されたように、品詞クラス間のバイグラム(N
=2)を基本としたものであるが、単独で信頼できる単
語は品詞クラスより分離させ、単独のクラスとして取り
扱い、さらに、予測精度を向上させるため、頻出単語列
に関してはそれらの単語を結合して一つのクラスとして
取り扱い、長い単語連鎖の表現を可能にさせ、こうし
て、生成されたモデルは、品詞バイグラムと可変長単語
N−グラムとの特徴を併せ持つ統計的言語モデルとな
り、遷移確率の精度と信頼性とのバランスをとられたも
のである。
【0085】図2において、単語照合部4に接続され、
例えばハードディスクメモリに格納される音素HMM1
1は、各状態を含んで表され、各状態はそれぞれ以下の
情報を有する。 (a)状態番号 (b)受理可能なコンテキストクラス (c)先行状態、及び後続状態のリスト (d)出力確率密度分布のパラメータ (e)自己遷移確率及び後続状態への遷移確率 なお、本実施形態において用いる音素HMM11は、各
分布がどの話者に由来するかを特定する必要があるた
め、所定の話者混合HMMを変換して生成する。ここ
で、出力確率密度関数は34次元の対角共分散行列をも
つ混合ガウス分布である。また、単語照合部4に接続さ
れ、例えばハードディスクに格納される単語辞書12
は、音素HMM11の各単語毎にシンボルで表した読み
を示すシンボル列を格納する。
【0086】図2において、話者の発声音声はマイクロ
ホン1に入力されて音声信号に変換された後、特徴抽出
部2に入力される。特徴抽出部2は、入力された音声信
号をA/D変換した後、例えばLPC分析を実行し、対
数パワー、16次ケプストラム係数、Δ対数パワー及び
16次Δケプストラム係数を含む34次元の特徴パラメ
ータを抽出する。抽出された特徴パラメータの時系列は
バッファメモリ3を介して単語照合部4に入力される。
単語照合部4は、ワン−パス・ビタビ復号化法を用い
て、バッファメモリ3を介して入力される特徴パラメー
タのデータに基づいて、音素HMM11と単語辞書12
とを用いて単語仮説を検出し尤度を計算して出力する。
ここで、単語照合部4は、各時刻の各HMMの状態毎
に、単語内の尤度と発声開始からの尤度を計算する。尤
度は、単語の識別番号、単語の開始時刻、先行単語の違
い毎に個別にもつ。また、計算処理量の削減のために、
音素HMM11及び単語辞書12とに基づいて計算され
る総尤度のうちの低い尤度のグリッド仮説を削減する。
単語照合部4は、その結果の単語仮説と尤度の情報を発
声開始時刻からの時間情報(具体的には、例えばフレー
ム番号)とともにバッファメモリ5を介して単語仮説絞
込部6に出力する。
【0087】単語仮説絞込部6は、単語照合部4からバ
ッファメモリ5を介して出力される単語仮説に基づい
て、統計的言語モデル13を参照して、終了時刻が等し
く開始時刻が異なる同一の単語の単語仮説に対して、当
該単語の先頭音素環境毎に、発声開始時刻から当該単語
の終了時刻に至る計算された総尤度のうちの最も高い尤
度を有する1つの単語仮説で代表させるように単語仮説
の絞り込みを行った後、絞り込み後のすべての単語仮説
の単語列のうち、最大の総尤度を有する仮説の単語列を
認識結果として、バッファメモリ24を介して自然言語
理解装置30内の中間言語生成部22に出力し、上述の
自然言語理解装置30の処理が実行される。本実施形態
においては、好ましくは、処理すべき当該単語の先頭音
素環境とは、当該単語より先行する単語仮説の最終音素
と、当該単語の単語仮説の最初の2つの音素とを含む3
つの音素並びをいう。
【0088】例えば、図3に示すように、(i−1)番
目の単語Wi-1の次に、音素列a1,a2,…,anからな
るi番目の単語Wiがくるときに、単語Wi-1の単語仮説
として6つの仮説Wa,Wb,Wc,Wd,We,Wf
が存在している。ここで、前者3つの単語仮説Wa,W
b,Wcの最終音素は/x/であるとし、後者3つの単
語仮説Wd,We,Wfの最終音素は/y/であるとす
る。終了時刻teと先頭音素環境が等しい仮説(図3で
は先頭音素環境が“x/a1/a2”である上から3つの
単語仮説)のうち総尤度が最も高い仮説(例えば、図3
において1番上の仮説)以外を削除する。なお、上から
4番めの仮説は先頭音素環境が違うため、すなわち、先
行する単語仮説の最終音素がxではなくyであるので、
上から4番めの仮説を削除しない。すなわち、先行する
単語仮説の最終音素毎に1つのみ仮説を残す。図2の例
では、最終音素/x/に対して1つの仮説を残し、最終
音素/y/に対して1つの仮説を残す。
【0089】以上の実施形態においては、当該単語の先
頭音素環境とは、当該単語より先行する単語仮説の最終
音素と、当該単語の単語仮説の最初の2つの音素とを含
む3つの音素並びとして定義されているが、本発明はこ
れに限らず、先行する単語仮説の最終音素と、最終音素
と連続する先行する単語仮説の少なくとも1つの音素と
を含む先行単語仮説の音素列と、当該単語の単語仮説の
最初の音素を含む音素列とを含む音素並びとしてもよ
い。
【0090】図2において、特徴抽出部2と、単語照合
部4と、単語仮説絞込部6と、言語モデル生成部20と
は、例えば、デジタル電子計算機で構成され、バッファ
メモリ3,5は例えばハードデイスクメモリなどの記憶
装置で構成され、音素HMM11と単語辞書12と統計
的言語モデル13とは、例えばハードデイスクメモリな
どの記憶装置に記憶される。
【0091】以上実施形態においては、単語照合部4と
単語仮説絞込部6とを用いて音声認識を行っているが、
本発明はこれに限らず、例えば、音素HMM11を参照
する音素照合部と、例えばOne Pass DPアル
ゴリズムを用いて統計的言語モデル13を参照して単語
の音声認識を行う音声認識部とで構成してもよい。
【0092】
【実施例】本発明者は、自然言語理解装置30における
言語理解率を評価するために、以下の実験を行った。評
価実験に用いたデータは、C−STARのDAタグ付き
英語テキストコーパスである。タスクは旅行会話で、こ
れにはホテル予約、フライト予約、観光案内、旅行パッ
クの問い合わせ等が含まれる。実験では、前処理によ
り、ホテル名、人名等の固有名詞や曜日名、数字列等を
特別なシンボルで置き換えた。実験データの詳細を表1
8に示す。
【0093】
【表18】 実験データ ─────────────────────────────────── クローズド オープン 合計 ─────────────────────────────────── 発話サンプル数 1,491 499 1,996 概念 42 36 43 概念組み合せ 82 59 93 語彙(前処理後) 729(534) 509(365) 807(589) ───────────────────────────────────
【0094】ここで、クローズドテストとは、決定木を
生成する際に用いたものと同じデータセットを使って評
価を行う実験のことである。オープンテストとは、決定
木を生成する際には用いなかったデータセットを使って
評価を行う実験のことである。また、前処理とは、入力
文に対する決定木のトレース処理を行う前に、入力文に
対してなんらかの加工処理を行うことを意味する。
【0095】実験は、概念テストを用いることによる組
み合わせ制約の効果を確かめるため、(I)本実施形態
の手法(DTcpt)の他に、(II)発話の特徴のうち
の(a)単語活用形及び(b)単語標準形のみで概念を
独立に推定する決定木(DTncpt)を用いた手法、
及び、(III)発話の特徴の上記(a),(b)のみで
組み合わせを1クラスとして分類する決定木(DTal
l)を用いた手法の3手法を評価した。DTcpt及び
DTncptでは、概念を、クローズド概念42種類の
みで構成される定義組み合わせ695種類へ復号化して
おり、オープンテストでの組み合わせ推定精度は最良で
99.8である。一方、DTallでは、クローズドセ
ットにある82種類の組み合わせに直接分類するため、
11種類のオープン組み合わせは推定することができな
い。そのため、オープンテストでの組み合わせ推定精度
は最良で97.8である。概念タグ(組み合わせ概念)
の推定精度を表19に示す。オープンテストにおける本
実施形態の手法(DTcpt)の正解率は83.4であ
り、DTncpt、DTallと比較して高い推定精度
を得ることができた。また、このときの概念単独での誤
り傾向を表20に示す。本実施形態の手法で脱落誤りが
大きく減少しているのは(改善率21.7)、組み合わ
せにおける共起情報が有効に抽出・利用されたと結果と
推察される。しかしながら、挿入誤りに関しては効果は
認められる(改善率12.3)。
【0096】
【表19】 組み合わせ推定精度 ─────────────────────────────────── 正解率(%) DTall DTncpt DTcpt ─────────────────────────────────── オープン 77.4 81.4 83.4 クローズド 97.4 99.5 99.1 ───────────────────────────────────
【0097】
【表20】 誤り傾向(オープンテスト) ─────────────────────────────────── 誤り数 DTncpt DTcpt 改善率 ─────────────────────────────────── 挿入誤り 114 100 12.3% 脱落誤り 120 94 21.7% ───────────────────────────────────
【0098】以上説明したように、本実施形態によれ
ば、自然発話における組み合わせ制約を持つ概念の推定
において、互いの推定結果を動的に利用する決定木を用
いて自然言語理解装置30を構成したので、概念を独立
に推定する手法、組み合わせ概念を一括して推定する手
法と比較して、より高い推定精度を得ることができる。
従って、従来技術に比較して頑健にかつ正確に音声理解
を行うことができ、適切な中間言語表現を出力すること
ができる自然言語理解装置30及び、自然言語理解シス
テムを提供することができる。
【0099】
【発明の効果】以上詳述したように、本発明に係る請求
項1記載の自然言語理解装置によれば、自然発話文に含
まれる発話行為に依存する制約と、自然発話文に含まれ
る意味的な概念の間での組み合わせに依存する制約とを
記憶する第1の記憶装置と、自然発話文の単語列のテキ
ストデータからなる学習データに基づいて、上記第1の
記憶装置に格納された制約を参照して、自然発話文の特
徴として単語活用形と単語標準形と概念とを用いて、自
然発話文に含まれる意味的な複数の概念及び概念の組み
合わせがそれぞれ存在するか否かを決定するための第1
の決定木と、発話行為が存在するか否かを決定するため
の第2の決定木とをそれぞれ、yes/no/未知の三
分木の形式、及びyes/noの二分木の形式で生成す
る生成手段と、入力される自然発話文の単語列のテキス
トデータに対して、上記生成手段によって生成された第
1の決定木を用いて概念又は概念の組み合わせが存在す
るか否かを決定するとともに、上記生成手段によって生
成された第2の決定木を用いて発話行為が存在するか否
かを決定して決定結果を出力する第1の決定手段と、発
話行為と、複数の概念及び概念の組み合わせとに対応す
る複数の引数名を記憶する第2の記憶装置と、自然発話
文における部分文を解析するための部分文解析規則とそ
れから生成される引数値とを記憶する第3の記憶装置
と、上記第1の決定手段から出力される発話行為、概念
又は概念の組み合わせに基づいて、上記第2の記憶装置
に記憶された引数名を列挙し、列挙した引数名に対応す
る上記第3の記憶装置内の部分文解析規則を用いて構文
解析して、使用した部分文解析規則の対応する引数値を
並べることにより、上記入力される自然発話文に対応す
る引数値を中間言語表現で出力する第2の決定手段とを
備える。従って、自然発話における組み合わせ制約を持
つ概念の推定において、互いの推定結果を動的に利用す
る決定木を用いて自然言語理解装置を構成したので、概
念を独立に推定する手法、組み合わせ概念を一括して推
定する手法と比較して、より高い推定精度を得ることが
できる。それ故、従来技術に比較して頑健にかつ正確に
音声理解を行うことができ、適切な中間言語表現を出力
することができる自然言語理解装置を提供することがで
きる。
【0100】また、請求項2記載の自然言語理解システ
ムによれば、請求項1記載の自然言語理解装置と、自然
発話の発声音声を音声認識して、音声認識結果のテキス
トデータを上記自然言語理解装置に出力する音声認識手
段とを備える。従って、自然発話における組み合わせ制
約を持つ概念の推定において、互いの推定結果を動的に
利用する決定木を用いて自然言語理解装置を構成したの
で、概念を独立に推定する手法、組み合わせ概念を一括
して推定する手法と比較して、より高い推定精度を得る
ことができる。それ故、従来技術に比較して頑健にかつ
正確に音声理解を行うことができ、適切な中間言語表現
を出力することができる自然言語理解装置を提供するこ
とができる。また、自然発話の発声音声を音声認識し
て、その内容を高精度で理解できる。
【0101】また、請求項3記載の自然言語理解システ
ムによれば、請求項1記載の自然言語理解装置と、上記
第2の決定手段から出力される上記入力される自然発話
文に対応する中間言語表現の引数値に基づいて、上記入
力される自然発話文を別の言語に翻訳して翻訳結果を出
力する翻訳手段とを備える。従って、自然発話における
組み合わせ制約を持つ概念の推定において、互いの推定
結果を動的に利用する決定木を用いて自然言語理解装置
を構成したので、概念を独立に推定する手法、組み合わ
せ概念を一括して推定する手法と比較して、より高い推
定精度を得ることができる。それ故、従来技術に比較し
て頑健にかつ正確に音声理解を行うことができ、適切な
中間言語表現を出力することができる自然言語理解装置
を提供することができる。また、自然言語理解装置から
の中間言語表現に基づいて別の言語に高精度で翻訳でき
る。
【0102】さらに、請求項4記載の自然言語理解シス
テムによれば、請求項2記載の自然言語理解システムに
おいて、上記第2の決定手段から出力される上記入力さ
れる自然発話文に対応する中間言語表現の引数値に基づ
いて、上記入力される自然発話文を別の言語に翻訳して
翻訳結果を出力する翻訳手段をさらに備える。従って、
自然発話における組み合わせ制約を持つ概念の推定にお
いて、互いの推定結果を動的に利用する決定木を用いて
自然言語理解装置を構成したので、概念を独立に推定す
る手法、組み合わせ概念を一括して推定する手法と比較
して、より高い推定精度を得ることができる。それ故、
従来技術に比較して頑健にかつ正確に音声理解を行うこ
とができ、適切な中間言語表現を出力することができる
自然言語理解装置を提供することができる。また、自然
発話の発声音声を音声認識して、自然言語理解装置から
の中間言語表現に基づいて別の言語に高精度で翻訳でき
る。
【0103】また、請求項5記載の自然言語理解システ
ムによれば、請求項1記載の自然言語理解装置と、上記
第2の決定手段から出力される上記入力される自然発話
文に対応する中間言語表現の引数値に応答して、上記中
間言語表現に含まれる検索条件に基づいて、所定のデー
タベースを検索して、上記検索条件を満たすデータを獲
得し、そのデータを出力するとともに、そのデータに対
応する処理を実行する実行手段とを備える。従って、自
然発話における組み合わせ制約を持つ概念の推定におい
て、互いの推定結果を動的に利用する決定木を用いて自
然言語理解装置を構成したので、概念を独立に推定する
手法、組み合わせ概念を一括して推定する手法と比較し
て、より高い推定精度を得ることができる。それ故、従
来技術に比較して頑健にかつ正確に音声理解を行うこと
ができ、適切な中間言語表現を出力することができる自
然言語理解装置を提供することができる。また、自然言
語理解装置からの中間言語表現に基づいてデータベース
を高精度で検索して対応する処理を実行することができ
る。
【0104】さらに、請求項6記載の自然言語理解シス
テムによれば、請求項2記載の自然言語理解システムに
おいて、上記第2の決定手段から出力される上記入力さ
れる自然発話文に対応する中間言語表現の引数値に応答
して、上記中間言語表現に含まれる検索条件に基づい
て、所定のデータベースを検索して、上記検索条件を満
たすデータを獲得し、そのデータを出力するとともに、
そのデータに対応する処理を実行する実行手段をさらに
備える。従って、自然発話における組み合わせ制約を持
つ概念の推定において、互いの推定結果を動的に利用す
る決定木を用いて自然言語理解装置を構成したので、概
念を独立に推定する手法、組み合わせ概念を一括して推
定する手法と比較して、より高い推定精度を得ることが
できる。それ故、従来技術に比較して頑健にかつ正確に
音声理解を行うことができ、適切な中間言語表現を出力
することができる自然言語理解装置を提供することがで
きる。また、自然発話の発声音声を音声認識して、自然
言語理解装置からの中間言語表現に基づいてデータベー
スを高精度で検索して対応する処理を実行することがで
きる。
【図面の簡単な説明】
【図1】 本発明に係る一実施形態である自然言語理解
装置30を備えた自然言語理解システムの構成を示すブ
ロック図である。
【図2】 図1の音声認識装置10の構成を示すブロッ
ク図である。
【図3】 図2の音声認識装置における単語仮説絞込部
6の処理を示すタイミングチャートである。
【図4】 図1の決定木生成処理部21によって生成さ
れた概念推定用決定木の一例を示す図である。
【図5】 図1の決定木生成処理部21によって実行さ
れる決定木生成処理の第1の部分を示すフローチャート
である。
【図6】 図1の決定木生成処理部21によって実行さ
れる決定木生成処理の第2の部分を示すフローチャート
である。
【図7】 図1の発話行為と組み合わせ概念決定部23
によって実行される組み合わせ概念決定処理を示すフロ
ーチャートである。
【図8】 図7のサブルーチンである概念決定木のトレ
ース処理を示すフローチャートである。
【図9】 図8のサブルーチンである子ノード指示変更
処理を示すフローチャートである。
【図10】 図8のサブルーチンである入力文テスト処
理を示すフローチャートである。
【図11】 図1の引数決定部24によって実行される
引数決定処理を示すフローチャートである。
【図12】 図1の自然言語翻訳部25によって実行さ
れる自然言語翻訳処理を示すフローチャートである。
【符号の説明】
1…マイクロホン、 2…特徴抽出部、 3,5…バッファメモリ、 4…単語照合部、 6…単語仮説絞込部、 11…音素HMM、 12…単語辞書、 13…統計的言語モデル、 20…自然言語理解システム、 21…決定木生成処理部、 22…中間言語生成部、 23…発話行為と組み合わせ概念決定部、 24…引数決定部、 25…自然言語翻訳部、 26…プリンタ、 27…CRTディスプレイ、 30…自然言語理解装置、 31…学習データメモリ、 32…単語辞書メモリ、 33…発話行為と組み合わせ概念メモリ、 34…決定木メモリ、 35…引数名メモリ、 36…引数値生成規則メモリ、 37…文テンプレートメモリ、 38…部分文生成規則メモリ、 40…パーソナルコンピュータ、 41…CRTディスプレイ、 42…プリンタ。
───────────────────────────────────────────────────── フロントページの続き (72)発明者 匂坂 芳典 京都府相楽郡精華町大字乾谷小字三平谷 5番地 株式会社エイ・ティ・アール音 声翻訳通信研究所内 (56)参考文献 特開 平2−61769(JP,A) 特開 平8−329082(JP,A) 特開 平8−146990(JP,A) 特開 平9−305404(JP,A) Cardie C.,”A Case −Based Approach to Knowledge Acquisi tion for Domain−Sp ecific Sentence An alysis”,Proceeding s of the Eleventh National Conferenc e on Artificial In telligence,p.798−p. 803(1993) Kuhn R.,Mori R. D.,”The Applicatio n of Semantic Clas sification Trees t o Natural Language Understanding”,IE EE Transactions on Pattern Analysis and Machine Intell igence,Vol.17,No.5, p.449−p.460(1995) (58)調査した分野(Int.Cl.7,DB名) G10L 15/00 G06F 17/20 - 17/28 JICSTファイル(JOIS)

Claims (6)

    (57)【特許請求の範囲】
  1. 【請求項1】 自然発話文に含まれる発話行為に依存す
    る制約と、自然発話文に含まれる意味的な概念の間での
    組み合わせに依存する制約とを記憶する第1の記憶装置
    と、 自然発話文の単語列のテキストデータからなる学習デー
    タに基づいて、上記第1の記憶装置に格納された制約を
    参照して、自然発話文の特徴として単語活用形と単語標
    準形と概念とを用いて、自然発話文に含まれる意味的な
    複数の概念及び概念の組み合わせがそれぞれ存在するか
    否かを決定するための第1の決定木と、発話行為が存在
    するか否かを決定するための第2の決定木とをそれぞ
    れ、yes/no/未知の三分木の形式、及びyes/
    noの二分木の形式で生成する生成手段と、 入力される自然発話文の単語列のテキストデータに対し
    て、上記生成手段によって生成された第1の決定木を用
    いて概念又は概念の組み合わせが存在するか否かを決定
    するとともに、上記生成手段によって生成された第2の
    決定木を用いて発話行為が存在するか否かを決定して決
    定結果を出力する第1の決定手段と、 発話行為と、複数の概念及び概念の組み合わせとに対応
    する複数の引数名を記憶する第2の記憶装置と、 自然発話文における部分文を解析するための部分文解析
    規則とそれから生成される引数値とを記憶する第3の記
    憶装置と、 上記第1の決定手段から出力される発話行為、概念又は
    概念の組み合わせに基づいて、上記第2の記憶装置に記
    憶された引数名を列挙し、列挙した引数名に対応する上
    記第3の記憶装置内の部分文解析規則を用いて構文解析
    して、使用した部分文解析規則の対応する引数値を並べ
    ることにより、上記入力される自然発話文に対応する引
    数値を中間言語表現で出力する第2の決定手段とを備え
    たことを特徴とする自然言語理解装置。
  2. 【請求項2】 請求項1記載の自然言語理解装置と、 自然発話の発声音声を音声認識して、音声認識結果のテ
    キストデータを上記自然言語理解装置に出力する音声認
    識手段とを備えたことを特徴とする自然言語理解システ
    ム。
  3. 【請求項3】 請求項1記載の自然言語理解装置と、 上記第2の決定手段から出力される上記入力される自然
    発話文に対応する中間言語表現の引数値に基づいて、上
    記入力される自然発話文を別の言語に翻訳して翻訳結果
    を出力する翻訳手段とを備えたことを特徴とする自然言
    語理解システム。
  4. 【請求項4】 請求項2記載の自然言語理解システムに
    おいて、 上記第2の決定手段から出力される上記入力される自然
    発話文に対応する中間言語表現の引数値に基づいて、上
    記入力される自然発話文を別の言語に翻訳して翻訳結果
    を出力する翻訳手段をさらに備えたことを特徴とする自
    然言語理解システム。
  5. 【請求項5】 請求項1記載の自然言語理解装置と、 上記第2の決定手段から出力される上記入力される自然
    発話文に対応する中間言語表現の引数値に応答して、上
    記中間言語表現に含まれる検索条件に基づいて、所定の
    データベースを検索して、上記検索条件を満たすデータ
    を獲得し、そのデータを出力するとともに、そのデータ
    に対応する処理を実行する実行手段とを備えたことを特
    徴とする自然言語理解システム。
  6. 【請求項6】 請求項2記載の自然言語理解システムに
    おいて、 上記第2の決定手段から出力される上記入力される自然
    発話文に対応する中間言語表現の引数値に応答して、上
    記中間言語表現に含まれる検索条件に基づいて、所定の
    データベースを検索して、上記検索条件を満たすデータ
    を獲得し、そのデータを出力するとともに、そのデータ
    に対応する処理を実行する実行手段をさらに備えたこと
    を特徴とする自然言語理解システム。
JP10065272A 1998-03-16 1998-03-16 自然言語理解装置及び自然言語理解システム Expired - Fee Related JP3059413B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP10065272A JP3059413B2 (ja) 1998-03-16 1998-03-16 自然言語理解装置及び自然言語理解システム

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP10065272A JP3059413B2 (ja) 1998-03-16 1998-03-16 自然言語理解装置及び自然言語理解システム

Publications (2)

Publication Number Publication Date
JPH11259089A JPH11259089A (ja) 1999-09-24
JP3059413B2 true JP3059413B2 (ja) 2000-07-04

Family

ID=13282136

Family Applications (1)

Application Number Title Priority Date Filing Date
JP10065272A Expired - Fee Related JP3059413B2 (ja) 1998-03-16 1998-03-16 自然言語理解装置及び自然言語理解システム

Country Status (1)

Country Link
JP (1) JP3059413B2 (ja)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP3260996A1 (en) 2016-06-23 2017-12-27 Panasonic Intellectual Property Management Co., Ltd. Dialogue act estimation method, dialogue act estimation apparatus, and storage medium

Families Citing this family (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20020072914A1 (en) * 2000-12-08 2002-06-13 Hiyan Alshawi Method and apparatus for creation and user-customization of speech-enabled services
US7788096B2 (en) 2002-09-03 2010-08-31 Microsoft Corporation Method and apparatus for generating decision tree questions for speech processing
JP4267385B2 (ja) 2003-06-30 2009-05-27 インターナショナル・ビジネス・マシーンズ・コーポレーション 統計的言語モデル生成装置、音声認識装置、統計的言語モデル生成方法、音声認識方法、およびプログラム
US11354521B2 (en) 2018-03-07 2022-06-07 Google Llc Facilitating communications with automated assistants in multiple languages
AU2018412575B2 (en) 2018-03-07 2021-03-18 Google Llc Facilitating end-to-end communications with automated assistants in multiple languages

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
Cardie C.,"A Case−Based Approach to Knowledge Acquisition for Domain−Specific Sentence Analysis",Proceedings of the Eleventh National Conference on Artificial Intelligence,p.798−p.803(1993)
Kuhn R.,Mori R.D.,"The Application of Semantic Classification Trees to Natural Language Understanding",IEEE Transactions on Pattern Analysis and Machine Intelligence,Vol.17,No.5,p.449−p.460(1995)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP3260996A1 (en) 2016-06-23 2017-12-27 Panasonic Intellectual Property Management Co., Ltd. Dialogue act estimation method, dialogue act estimation apparatus, and storage medium

Also Published As

Publication number Publication date
JPH11259089A (ja) 1999-09-24

Similar Documents

Publication Publication Date Title
CN112712804B (zh) 语音识别方法、***、介质、计算机设备、终端及应用
US6067514A (en) Method for automatically punctuating a speech utterance in a continuous speech recognition system
Hori et al. Efficient WFST-based one-pass decoding with on-the-fly hypothesis rescoring in extremely large vocabulary continuous speech recognition
US8249881B2 (en) Multi-phoneme streamer and knowledge representation speech recognition system and method
US20040220809A1 (en) System with composite statistical and rules-based grammar model for speech recognition and natural language understanding
JPH08278794A (ja) 音声認識装置および音声認識方法並びに音声翻訳装置
JP2000353161A (ja) 自然言語生成における文体制御方法及び装置
EP1475779B1 (en) System with composite statistical and rules-based grammar model for speech recognition and natural language understanding
JP3059413B2 (ja) 自然言語理解装置及び自然言語理解システム
Schwartz et al. Hidden understanding models for statistical sentence understanding
JP3016779B1 (ja) 音声理解装置及び音声理解システム
JP3088364B2 (ja) 音声言語理解装置及び音声言語理解システム
JP2999768B1 (ja) 音声認識誤り訂正装置
Avram et al. Romanian speech recognition experiments from the robin project
Kuo et al. Syntactic features for Arabic speech recognition
JP3009636B2 (ja) 音声言語解析装置
JP3441400B2 (ja) 言語変換規則作成装置、及びプログラム記録媒体
Isotani et al. An automatic speech translation system on PDAs for travel conversation
Švec et al. Word-semantic lattices for spoken language understanding
JP2001013992A (ja) 音声理解装置
Geutner et al. Integrating different learning approaches into a multilingual spoken language translation system
Su et al. A corpus-based statistics-oriented two-way design for parameterized MT systems: Rationale, Architecture and Training issues
JP2779333B2 (ja) 言語解析装置
JP2001117583A (ja) 音声認識装置および音声認識方法、並びに記録媒体
Yokoyama et al. Detecting speech recognition errors using topic information and BERT

Legal Events

Date Code Title Description
FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20090421

Year of fee payment: 9

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20100421

Year of fee payment: 10

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20100421

Year of fee payment: 10

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20110421

Year of fee payment: 11

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20120421

Year of fee payment: 12

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20120421

Year of fee payment: 12

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20130421

Year of fee payment: 13

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20130421

Year of fee payment: 13

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20140421

Year of fee payment: 14

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

LAPS Cancellation because of no payment of annual fees