JP3059413B2

JP3059413B2 - 自然言語理解装置及び自然言語理解システム

Info

Publication number: JP3059413B2
Application number: JP10065272A
Authority: JP
Inventors: 宏一谷垣; 浩和政瀧; 芳典匂坂
Original assignee: 株式会社エイ・ティ・アール音声翻訳通信研究所
Priority date: 1998-03-16
Filing date: 1998-03-16
Publication date: 2000-07-04
Anticipated expiration: 2018-03-16
Also published as: JPH11259089A

Description

【発明の詳細な説明】

【０００１】

【発明の属する技術分野】本発明は、入力される自然発
話文の内容を理解して、理解した結果を中間言語表現で
出力する自然言語理解装置、及び、音声認識装置、自然
言語翻訳装置、又はデータベース検索処理装置を備えた
自然言語理解システムに関する。

【０００２】

【従来の技術】近年、隠れマルコフモデルを用いた音響
モデル、及びＮ−ｇｒａｍを用いた言語モデルを用いた
連続音声認識が盛んに研究されており、数万語彙の認識
でも、単語認識率が９０％以上とかなり実用レベルに近
くなっている。しかしながら、音声認識技術を用いたア
プリケーションを考えた場合、読み上げた文章をそのま
ま出力するディクテーションシステムを除くと、旅客機
案内システム、電話番号案内システム、音声翻訳システ
ム等、音声認識結果を理解し、ユーザーに情報を提供す
るいわゆる「音声理解システム」の方が応用分野が広い
と考えられる（例えば、従来技術文献１「坂井信輔ほ
か，“音声入力を用いたパソコンネットワーク旅客機空
席案内システムの試作”，電子情報通信学会技術報告，
ＳＰ９４−８９，ｐｐ．２９−３６，１９９５年１月」
参照。）。

【０００３】現在、音声理解システムのための言語理解
の技術は、発話の内容を構文で限定したものや文法理論
を用いたもの（例えば、従来技術文献２「Ｓ．Ｓｅｎｅ
ｆｆ，“ＴＩＮＡ：ＡＮａｔｕｒａｌＬａｎｇｕａ
ｇｅＳｙｓｔｅｍｆｏｒＳｐｏｋｅｎＬａｎｇｕ
ａｇｅＡｐｐｌｉｃａｔｉｏｎｓ”，Ｃｏｍｐｕｔａ
ｔｉｏｎａｌＬｉｎｇｕｉｓｔｉｃｓ，Ｖｏｌ．１
８，Ｎｏ．１，１９９２年３月」参照。）が主流であ
る。発話内容を構文で限定する手法は、理解率は高いと
考えられるが、計算機が受理できる発話内容をユーザー
が事前に知っていなければならず、ユーザーへの負担が
大きく、使いやすいシステムとは言えない。

【０００４】また、文法理論を用いた方法は、構文によ
る手法よりは、発話内容の自由度が高いが、文法的に正
しい文章でないと、理解できないという問題がある。し
かしながら、音声認識で広く使われているＮ−ｇｒａｍ
言語モデルは、認識率の観点からは非常に有利とされて
いるが、直前の（Ｎ−１）単語から次の単語への接続を
確率で表現するという極めて単純なモデルであるため、
局所的な制約しか表現できず、文全体として必ずしも文
法的に正しい文章を出力するとは限らない。従って、認
識結果に誤りが含まれる場合、正しく言語理解を行うの
は困難であると考えられる。また、実際のシステムの使
用時には、ユーザーが文法的に正しい文章を発声すると
は限らず、自然発話を理解するのは困難である。

【０００５】この問題を解決するため、認識結果文を言
語理解部が受理できる部分に分割する手法等（例えば、
従来技術文献３「Ｙ．Ｗａｋｉｔａｅｔａｌ．，
“Ｃｏｒｒｅｃｔｐａｒｔｓｅｘｔｒａｃｔｉｏｎ
ｆｒｏｍｓｐｅｅｃｈｒｅｃｏｇｎｉｔｉｏｎ
ｒｅｓｕｌｔｓｕｓｉｎｇｓｅｍａｎｔｉｃｄｉ
ｓｔａｎｃｅｃａｌｃｕｌａｔｉｏｎ，ａｎｄｉｔ
ｓａｐｐｌｉｃａｔｉｏｎｔｏｓｐｅｅｃｈｔ
ｒａｎｓｌａｔｉｏｎ”，ＡＣＬ，１９９７年」参
照。）が提案されているが、分割を行うことにより、文
章の大局的な情報を得ることができないと考えられる。

【０００６】また、従来技術文献４「遠藤充ほか，“音
声による文例検索システムの検討”，日本音響学会講演
論文集，２−Ｑ−１２，ｐｐ．１６３−１６４，１９９
７年３月」においては、キーワードによる方法が提案さ
れているが、キーワードのみでは文章の意味を正しく理
解することができず、また、ユーザーインターフェース
等でキーワードの間を補う必要がある。

【０００７】この問題点を解決するために、本特許出願
人は、特願平９−３０３０７５号の特許出願において、
音声入力による指示により、データベースへアクセス
し、ユーザの要求する情報を表示する音声言語理解装置
（以下、従来例という。）を開示している。この従来例
の音声言語理解装置は、具体的には、「発声音声から音
声認識装置によって音声認識された音声認識結果の音声
文に基づいて、音声文の意味する検索条件の内容を理解
して、データベースを参照して応答する処理を実行する
ための音声言語理解装置であって、検索条件を含む文章
データと、それに対応しかつ少なくとも応答する処理の
内容及びデータの項目名を含む所定の中間言語データと
の対である学習データに基づいて、識別誤りが最小とな
るように、文章データをそれに対応する中間言語に変換
するための隠れマルコフモデル（以下、ＨＭＭとい
う。）を学習して得られたＨＭＭを記憶する第１の記憶
装置と、複数の項目名に対応したデータを含むデータベ
ースを記憶する第２の記憶装置と、上記第１の記憶装置
に記憶されたＨＭＭを用いて、上記音声認識されかつ検
索条件を含む音声認識結果の音声文を上記中間言語に変
換して生成する生成手段と、上記生成手段によって生成
された中間言語を、上記データベースに対応した所定の
データベース言語に変換した後、上記データベース言語
に含まれる検索条件に基づいて、上記第２の記憶装置に
記憶されたデータベースを検索して、上記検索条件を満
たすデータを獲得し、そのデータについて上記中間言語
に対応した応答する処理を実行する実行手段とを備え
た」ことを特徴としている。

【０００８】

【発明が解決しようとする課題】しかしながら、従来例
では、複数のＨＭＭが独立に意味項を推定するモデルで
あるため、個々のＨＭＭの推定精度は悪い。そのため、
ｂｉ−ｇｒａｍによる制約を併用しているが、ＨＭＭの
推定確率が出力された後の処理であるため、全体の推定
精度を悪化させている。また、予め決められた２項間の
制約しか扱えないという問題点があった。さらには、Ｈ
ＭＭにカテゴリ毎のＭＣＥ学習を用いることで個々のＨ
ＭＭの推定精度の向上を図っているが、概念毎に分類す
ることが困難な概念には適用できないという問題点があ
った。

【０００９】本発明の目的は以上の問題点を解決し、従
来例に比較して頑健にかつ正確に音声理解を行うことが
でき、しかも組み合わせ制約を有する組み合わせ概念を
高精度で検出することができる自然言語理解装置及び自
然言語理解システムを提供することにある。

【００１０】

【課題を解決するための手段】本発明に係る請求項１記
載の自然言語理解装置は、自然発話文に含まれる発話行
為に依存する制約と、自然発話文に含まれる意味的な概
念の間での組み合わせに依存する制約とを記憶する第１
の記憶装置と、自然発話文の単語列のテキストデータか
らなる学習データに基づいて、上記第１の記憶装置に格
納された制約を参照して、自然発話文の特徴として単語
活用形と単語標準形と概念とを用いて、自然発話文に含
まれる意味的な複数の概念及び概念の組み合わせがそれ
ぞれ存在するか否かを決定するための第１の決定木と、
発話行為が存在するか否かを決定するための第２の決定
木とをそれぞれ、ｙｅｓ／ｎｏ／未知の三分木の形式、
及びｙｅｓ／ｎｏの二分木の形式で生成する生成手段
と、入力される自然発話文の単語列のテキストデータに
対して、上記生成手段によって生成された第１の決定木
を用いて概念又は概念の組み合わせが存在するか否かを
決定するとともに、上記生成手段によって生成された第
２の決定木を用いて発話行為が存在するか否かを決定し
て決定結果を出力する第１の決定手段と、発話行為と、
複数の概念及び概念の組み合わせとに対応する複数の引
数名を記憶する第２の記憶装置と、自然発話文における
部分文を解析するための部分文解析規則とそれから生成
される引数値とを記憶する第３の記憶装置と、上記第１
の決定手段から出力される発話行為、概念又は概念の組
み合わせに基づいて、上記第２の記憶装置に記憶された
引数名を列挙し、列挙した引数名に対応する上記第３の
記憶装置内の部分文解析規則を用いて構文解析して、使
用した部分文解析規則の対応する引数値を並べることに
より、上記入力される自然発話文に対応する引数値を中
間言語表現で出力する第２の決定手段とを備えたことを
特徴とする。

【００１１】また、請求項２記載の自然言語理解システ
ムは、請求項１記載の自然言語理解装置と、自然発話の
発声音声を音声認識して、音声認識結果のテキストデー
タを上記自然言語理解装置に出力する音声認識手段とを
備えたことを特徴とする。

【００１２】また、請求項３記載の自然言語理解システ
ムは、請求項１記載の自然言語理解装置と、上記第２の
決定手段から出力される上記入力される自然発話文に対
応する中間言語表現の引数値に基づいて、上記入力され
る自然発話文を別の言語に翻訳して翻訳結果を出力する
翻訳手段とを備えたことを特徴とする。

【００１３】さらに、請求項４記載の自然言語理解シス
テムは、請求項２記載の自然言語理解システムにおい
て、上記第２の決定手段から出力される上記入力される
自然発話文に対応する中間言語表現の引数値に基づい
て、上記入力される自然発話文を別の言語に翻訳して翻
訳結果を出力する翻訳手段をさらに備えたことを特徴と
する。

【００１４】また、請求項５記載の自然言語理解システ
ムは、請求項１記載の自然言語理解装置と、上記第２の
決定手段から出力される上記入力される自然発話文に対
応する中間言語表現の引数値に応答して、上記中間言語
表現に含まれる検索条件に基づいて、所定のデータベー
スを検索して、上記検索条件を満たすデータを獲得し、
そのデータを出力するとともに、そのデータに対応する
処理を実行する実行手段とを備えたことを特徴とする。

【００１５】さらに、請求項６記載の自然言語理解シス
テムは、請求項２記載の自然言語理解システムにおい
て、上記第２の決定手段から出力される上記入力される
自然発話文に対応する中間言語表現の引数値に応答し
て、上記中間言語表現に含まれる検索条件に基づいて、
所定のデータベースを検索して、上記検索条件を満たす
データを獲得し、そのデータを出力するとともに、その
データに対応する処理を実行する実行手段をさらに備え
たことを特徴とする。

【００１６】

【発明の実施の形態】以下、図面を参照して本発明に係
る実施形態について説明する。

【００１７】図１は、本発明に係る一実施形態である自
然言語理解装置３０を備えた自然言語理解システムの構
成を示すブロック図である。この実施形態の自然言語理
解システムは、大きく分けて、（ａ）音声認識装置１０
と、（ｂ）決定木生成処理部２１と中間言語生成部２２
とを備えた自然言語理解装置３０と、（ｃ）自然言語翻
訳部２５と、を備え、特に、自然言語理解装置３０を備
えたことを特徴とする。

【００１８】音声認識装置１０では、入力された発声音
声の波形データに対して特徴量計算を行った後、公知の
隠れマルコフ網による音響モデル、及び公知の可変長Ｎ
−ｇｒａｍによる言語モデルを用いて、単語グラフサー
チ法により解の探索を行い、認識結果を出力する。音声
認識装置１０の認識結果は、自然言語理解装置３０内の
中間言語生成部２２の発話行為と組み合わせ概念決定部
２３に入力される。発話行為と組み合わせ概念決定部２
３は、単語辞書メモリ３２内の単語辞書と、発話行為と
組み合わせ概念メモリ３３内の発話行為と組み合わせ概
念リストと、決定木メモリ３４内の概念推定用決定木と
発話行為推定用決定木とを用いて、発話行為と組み合わ
せ概念を決定して、認識結果とともに引数決定部２４に
出力する。これに応答して、引数決定部２４は、入力さ
れたデータに基づいて、引数名メモリ３５内の引数名と
引数値生成規則メモリ３６内の部分文解析規則と引数値
とを参照して引数を決定して、その中間言語表現のデー
タを認識結果とともに自然言語翻訳部２５に出力する。
これに応答して自然言語翻訳部２５は、文テンプレート
メモリ３７内の文テンプレートと、部分文生成規則メモ
リ３８内の引数値解析規則と単語列とを参照して、例え
ば、英語から日本語への翻訳を行って、翻訳結果の単語
列をプリンタ２６及びＣＲＴディスプレイ２７に出力す
る。

【００１９】まず、中間言語生成部２２で取り扱う中間
言語表現（意味タグ）について説明する。自然発話の意
味表現の中間言語表現として、Ｃ−ＳＴＡＲ（Ｃｏｎｓ
ｏｒｔｉｕｍｆｏｒＳｐｅｅｃｈＴｒａｎｓｌａ
ｔｉｏｎＡｄｖａｎｃｅｄＲｅｓｅａｒｃｈの略であ
る。）で定めている“ダイアログ・アクト（Ｄｉａｌｏ
ｇｕｅＡｃｔ）”（以下、ＤＡともいう。）（例え
ば、従来技術文献５「Ｂ．Ａｎｇｅｌｉｎｉｅｔａ
ｌ．，“ ＭｕｌｔｉｌｉｎｇｕａｌＰｅｒｓｏｎ
ｔｏＰｅｒｓｏｎＣｏｍｍｕｎｉｃａｔｉｏｎａ
ｔＩＲＳＴ”，Ｐｒｏｃ．ｏｆＩＣＡＳＳＰ，ミュ
ンヘン，ドイツ，１９９７年」参照。）を参照して、テ
キストデータであるコーパスにはＤＡをそのままタグと
して付与している。ＤＡは、タスク依存のセットとして
定義されている。発話は、概ね文に相当する意味的なま
とまりである意味的な発話単位（ＳｅｍａｎｔｉｃＤ
ｉａｌｏｇｕｅＵｎｉｔ；以下、発話という。）に分
割され、各発話単位からタスク達成に直接関係する情報
だけがＤＡとして伝達される。各ＤＡは［話者（ｓｐｅ
ａｋｅｒ），発話行為（ｓｐｅｅｃｈ−ａｃｔ），概念
（コンセプト；ｃｏｎｃｅｐｔ），引数（アーギュメン
ト；ａｒｇｕｍｅｎｎｔｓ）］の４項からなる組であ
る。あるＤＳＵに対するＤＡの例を表１に示す。

【００２０】

【表１】 ─────────────────────────────────── 発話（ＤＳＵ） “Ｔｈｅｗｅｅｋｏｆｔｈｅｔｗｅｌｆｔｈｗｅｈａｖｅｂｏｔｈｓｉｇｎａｌｓａｎｄｄｏｕｂｌｅｓａｖａｉｌａｂｌｅ． ─────────────────────────────────── 中間言語表現（ＤＡ）ａ：ＧＩＶＥ−ＩＮＦＯＲＭＡＴＩＯＮ＋ＡＶＡＩＬＡＢＩＬＩＴＹ＋ＲＯＯＭ（ｒｏｏｍ−ｔｙｐｅ＝（ｓｉｎｇｌｅ＆ｄｏｕｂｌｅ），ｔｉｍｅ＝（ｗｅｅｋ，ｍｄ１２） ───────────────────────────────────

【００２１】表１において、ａはエージェント（ａｇｅ
ｎｔ）を表わす話者情報であり、ＧＩＶＥ−ＩＮＦＯＲ
ＭＡＴＩＯＮ（情報提供）は発話行為、ＡＶＡＩＬＡＢ
ＩＬＩＴＹ（利用可能性）＋ＲＯＯＭ（部屋）は概念、
括弧内は引数である。

【００２２】概念は、いくつかの概念の組み合わせで、
発話（発話文）の焦点が当たっている命題内容を表現す
る。表１の発話には、他に、ＴＥＭＰＯＲＡＬ（時間情
報）やＦＥＡＴＵＲＥＳ（特徴）＋ＲＯＯＭ（部屋）と
いった概念が現れるが、焦点から最適なタグはＡＶＡＩ
ＬＡＢＩＬＩＴＹ＋ＲＯＯＭとなる。概念には、文脈を
必要とする情報を含まない。概念と発話行為の組み合わ
せ、及び、概念間の組み合わせは、定義により予め制約
されている。本実施形態で、定義されている概念は５０
種類であり、これらを組み合わせた概念は７７７種類存
在する。組み合わせの制約は、主に文生成時の曖昧性排
除の観点から規定されたものである。

【００２３】次いで、上述の決定木を用いた概念の推定
について説明する。本実施形態では、音声認識への意味
からの制約をねらい、まず発話の概念の推定だけを考え
る。ここでは、これを発話（発話文）の特徴に基づく分
類問題として扱い、決定木を用いた推定を行う。

【００２４】分類クラスとしては、（１）組み合わせ概
念を１クラスとして一括分類する方法と、（２）概念を
独立に分類する方法と、が考えられる。識別精度の観点
からは（１）の方法が望ましいが、データ数が少ない貧
弱なスパースデータの問題が顕著となる。一方、（２）
の方法では、定義に矛盾する組み合わせが出力される恐
れがある。そこで、本実施形態では、（２）の分類にお
いて組み合わせの最適性を得られる方法を用いて。本実
施形態では、定義概念には明確な階層分けが規定されて
いなかったため、概念のグルーピングは行わず、各概念
の有無を１クラスとする分類を行う。概念間の排他・共
起関係は全て学習により獲得する。

【００２５】概念の推定に有効な発話の特徴としては、
単語、統語構造（係り受け）、シソーラス（類語辞書）
等が考えられる。これらの情報を、発話の曖昧さに応じ
て適宜用いることが望ましい。ただし、音声認識結果へ
の適用を考慮すると、認識誤りや非文法的な表現が含ま
れる文に対して、全体をパーズ（音声認識）しなくては
得られない特徴を用いることは望ましくない。また、推
定対象である概念は、構文による焦点の移動等の問題は
予想されるものの、概ねキーワードに依存していると考
えられる。そこで、本実施形態では、発話の特徴とし
て、（ａ）単語活用形、及び（ｂ）単語標準形を用い
た。本実施形態の手法では、これに（ｃ）概念を併せた
３つを用いる。（ｃ）の概念情報は、注目している概念
を除く全ての概念の有無であり、学習時にはコーパスで
付与されているタグから与えられる。例えば、表１０に
おいて、識別番号００００の概念情報としては“ｒｅｓ
ｅｒｖａｔｉｏｎ（予約）”と“ｔｅｍｐｏｒａｌ（時
間）”が与えられる。推定時の取得方法については、詳
細後述する。

【００２６】次いで、概念推定用決定木の生成について
説明する。概念毎に、その概念の有無を推定するための
概念推定用決定木を生成する。学習は、全発話サンプル
集合Ｓをルートノードに属する初期集合とし、次式の相
互情報量Ｉ（Ｓ；ｆ）が最大となる発話の特徴ｆｈで分
割を繰り返すことにより行う。分割は、ノードが純粋な
クラスの集合になるまで、又は、しきい値以上のＩ
（Ｓ；ｆｈ）が得られなくなるまで行う。木は基本的に
ｙｅｓ／ｎｏの２分木であるが、特徴ｆｈに概念を用い
る場合は、さらに未知アークの下に発話サンプル集合Ｓ
をそのまま保持する第３の子ノードとして加えておくこ
とで、その概念に依存しないパスも同時に生成してお
く。すなわち、概念推定用決定木は、ｙｅｓ／ｎｏ／未
知の三分木の形式で表される一方、発話行為推定用決定
木は、ｙｅｓ／ｎｏの二分木の形式で表される。

【００２７】

【数１】

【００２８】ここで、Ｓはノードに属する発話サンプル
の集合、ｆは発話の特徴に関するテスト特徴（以下、単
に、テストともいう。）である。Ｃ_iは発話のクラスで
あり、ここでは、Ｃ₁は注目している概念を含むクラ
ス、Ｃ₀は注目している概念を含まないクラスである。
ｐ（Ｃ_i）は発話サンプル集合ＳがクラスＣｉである確
率、ｐ（Ｃ_i，ｆ_j）は発話サンプル集合Ｓに対するテス
トｆの結果がｆ_j（＝ｙｅｓ／ｎｏ）でかつクラスがＣ_i
である結合確率、ｐ（Ｃ_i｜ｆ_j）はその条件付き確率で
ある。

【００２９】図４は、図１の決定木生成処理部２１によ
って生成された概念推定用決定木の一例を示す図であ
る。図４において、ノードの横にテストの内容を示す。
大文字のものは概念、＜＞で囲まれているものは単語標
準形、＊で囲まれているものは詳細後述する前処理によ
り特別なシンボルに置き換えた単語をそれぞれ表わす。
また、リーフノード（黒丸）の下の値はノードに属する
発話サンプルが概念を含む確率ｐ（Ｃ₁）である。

【００３０】次いで、発話行為と組み合わせ概念決定部
２３で用いる推定アルゴリズムについて説明する。入力
発話に対して、その特徴に基づいて、概念毎に生成した
概念推定用決定木を並列にトレースして発話の概念を推
定する。各概念推定用決定木において到達したリーフノ
ードのｐ（Ｃ₁）をその概念の推定確率とする。木は、
概念テストを行うノードのリンクにより、お互いの概念
推定確率を適宜参照し、共起／排他情報として利用する
（図４中の弧矢印で示す。）。参照先の木が推定を終え
ていない場合は、停止してその終了を待つ。概念推定用
決定木がお互いに依存し合いデッドロック（互いの推定
結果待ちの状態）に陥った場合は、以下の基準で１つだ
け選択した木のポインタを停止中のノードからその未知
子ノードへと移し、木全体のトレースを再開する。デッ
ドロック時に進める木は、全概念に対する識別の曖昧さ
を最小にするものを選択する。次式で定義するクラスエ
ントロピーの総和Ｅを最小にする木である。クラスエン
トロピーの総和Ｅは、その木のポインタを未知子ノード
へと移して全ての木のトレースを再開したとき、次にデ
ッドロックした時点で各木が到達するノードのクラスエ
ントロピーの総和Ｅを、全木に対して取ったものであ
る。この結果得られる各概念の確率ベクトルから概念へ
の復号化には、内積を用いた。

【００３１】

【数２】

【００３２】次いで、中間言語表現の例について説明す
る。表１に、自然言語文を当該中間言語表現で表現した
例を示す。

【００３３】

【表２】中間言語表現の例 ─────────────────────────────────── 例１．Ｗｈｅｎａｒｅｙｏｕｒｅｓｅｒｖｉｎｇｔｈｉｓｆｏｒａ：ｒｅｑｕｅｓｔ−ｉｎｆｏｒｍａｔｉｏｎ＋ｒｅｓｅｒｖａｔｉｏｎ＋ｔｅｍｐｏｒａｌ（ｔｉｍｅ＝ｑｕｅｓｔｉｏｎ） ─────────────────────────────────── 例２．Ｉ’ｌｌｂｅａｒｒｉｖｉｎｇＦｅｂｒｕａｒｙｔｗｅｌｆｔｈｃ：ｇｉｖｅ−ｉｎｆｏｒｍａｔｉｏｎ＋ｔｅｍｐｏｒａｌ＋ａｒｒｉｖａｌ（ｗｈｏ＝Ｉ，ｔｉｍｅ＝（ｆｅｂｒｕａｒｙ，ｍｄ１２）） ─────────────────────────────────── 例３．Ｔｈｅｗｅｅｋｏｆｔｈｅｔｗｅｌｆｔｈｗｅｈａｖｅｂｏｔｈｓｉｎｇｌｅｓａｎｄｄｏｕｂｌｅｓａｖａｉｌａｂｌｅａ：ｇｉｖｅ−ｉｎｆｏｒｍａｔｉｏｎ＋ａｖａｉｌａｂｉｌｉｔｙ＋ｒｏｏｍ（ｒｏｏｍ−ｔｙｐｅ＝（ｓｉｎｇｌｅｄｏｕｂｌｅ），ｔｉｍｅ＝（ｗｅｅｋ，ｍｄ１２）） ─────────────────────────────────── 例４．Ｔｈｅｓｉｎｇｌｅｓａｒｅａｈｕｎｄｒｅｄａｎｄｔｗｅｎｔｙｄｏｌｌａｒｓａｎｉｇｈｔａ：ｇｉｖｅ−ｉｎｆｏｒｍａｔｉｏｎ＋ｐｒｉｃｅ＋ｒｏｏｍ（ｒｏｏｍ−ｔｙｐｅ＝ｓｉｎｇｌｅ，ｐｒｉｃｅ＝（ｃｕｒｒｅｎｃｙ＝ｄｏｌｌａｒ，ｐｅｒ−ｕｎｉｔ＝ｎｉｇｈｔ，ｑｕａｎｔｉｔｙ＝１２０）） ─────────────────────────────────── 例５．Ａｎｄｔｈｅｄｏｕｂｌｅｓａｒｅａｈｕｎｄｒｅｄａｎｄｔｈｉｒｔｙｆｏｕｒｄｏｌｌａｒｓａ：ｇｉｖｅ−ｉｎｆｏｒｍａｔｉｏｎ＋ｐｒｉｃｅ＋ｒｏｏｍ（ｒｏｏｍ−ｔｙｐｅ＝ｄｏｕｂｌｅ，ｐｒｉｃｅ＝（ｃｕｒｒｅｎｃｙ＝ｄｏｌｌａｒ，ｑｕａｎｔｉｔｙ＝１３４）） ─────────────────────────────────── 例６．Ｗｈｉｃｈｗｏｕｌｄｙｏｕｐｒｅｆｅｒａ：ｒｅｑｕｅｓｔ−ｉｎｆｏｒｍａｔｉｏｎ＋ｐｒｅｆｅｒｅｎｃｅ ─────────────────────────────────── 例７．Ａｓｉｎｇｌｅｗｏｕｌｄｄｏｃ：ａｃｃｅｐｔ＋ｆｅａｔｕｒｅｓ＋ｒｏｏｍ（ｒｏｏｍ−ｔｙｐｅ＝ｓｉｎｇｌｅ） ─────────────────────────────────── 例８．Ｗｏｕｌｄｙｏｕｌｉｋｅｔｏｐｕｔｔｈｉｓｏｎａｃｒｅｄｉｔｃａｒｄ？ｃ：ｒｅｑｕｅｓｔ−ｉｎｆｏｒｍａｔｉｏｎ＋ｐａｙｍｅｎｔ（ｍｅｔｈｏｄ＝ｃｒｅｄｉｔ−ｃａｒｄ） ───────────────────────────────────

【００３４】上記表２において、例えば、例１の中間言
語表現は、「話者は“ａ”つまり『担当者』（“ａｇｅ
ｎｔ”の頭文字である。）であり、発話行為は“ｒｅｑ
ｕｅｓｔ−ｉｎｆｏｒｍａｔｉｏｎ”つまり『情報要
求』であり、組合わせ概念は“ｒｅｓｅｒｖａｔｉｏｎ
＋ｔｅｍｐｏｒａｌ”つまり『予約の時間』であり、引
数は“ｔｉｍｅ＝ｑｕｅｓｔｉｏｎ”つまり『時間が質
問対象になっている』」ということを意味する。

【００３５】次いで、発話行為の例について説明する。
本実施形態では、発話行為として、「受諾（ａｃｃｅｐ
ｔ）」、「承認（ａｃｋｎｏｗｌｅｄｇｅ）」、「肯定
（ａｆｆｉｒｍ）」、「陳謝（ａｐｏｌｏｇｉｚｅ）」
といった、２３種類を定義して用いる。この中で、特に
「確認（ｖｅｒｉｆｙ）」と「確認要求（ｒｅｑｕｅｓ
ｔ−ｖｅｒｉｆｉｃａｔｉｏｎ）」の２つは他の発話行
為と組み合わせることで、「受諾の確認（ｖｅｒｉｆｙ
−ａｃｃｅｐｔ）」等といった複合発話行為を構成する
ことができる。本実施形態では、複合発話行為は６５種
類ある。本実施形態で用いる発話行為及び複合発話行為
の例を次の表に示す。

【００３６】

【表３】「発話行為」の例 ─────────────────────────────────── ａｃｃｅｐｔ「受諾」 “Ｉ’ｌｌｔａｋｅｔｈａｔ”，“Ｓｏｕｎｄｓｇｏｏｄ” ─────────────────────────────────── ａｃｋｎｏｗｌｅｄｇｅ「承認」 “Ｏｋａｙ”，“Ｓｕｒｅ”，“ｙｅａｈ” ─────────────────────────────────── ａｆｆｉｒｍ「肯定」 “ｉｔＹｅｓ”，“Ｙｅｓｗｅｄｏ” ─────────────────────────────────── ａｐｏｌｏｇｉｚｅ「陳謝」 “Ｓｏｒｒｙ”，“Ｉ’ｍｓｏｒｒｙ” ─────────────────────────────────── ｃｌｏｓｉｎｇ「会話終了」 “ＳｅｅｙｏｕｏｎＳｅｐｔｅｍｂｅｒｔｈｅｎ”，“Ｂｙｅ” ─────────────────────────────────── ｇｉｖｅ−ｉｎｆｏｒｍａｔｉｏｎ「情報提供」 “Ｗｅｈａｖｅｔｗｏｓｉｎｇｌｅｓａｖａｉｌａｂｌｅｏｎｔｈｅｆｏｕｒｔｈ” ─────────────────────────────────── ｇｒｅｅｔｉｎｇ「挨拶」 “Ｈｅｌｌｏ”，“Ｇｏｏｄｍｏｒｎｉｎｇ” ─────────────────────────────────── ｉｎｔｒｏｄｕｃｅ−ｓｅｌｆ「自己紹介」 “ＴｈｉｓｉｓＢｒｙａｎ”， “ＢｅｓｔｗｅｓｔｅｒｎＰｉｔｔｓｂｕｒｇｈ” ─────────────────────────────────── ｉｎｔｒｏｄｕｃｅ−ｔｏｐｉｃ「話題導入」 “Ｉ’ｄｌｉｋｅｔｏｍａｋｅａｔｒｉｐｔｏＰｉｔｔｓｂｕｒｇｈ” ─────────────────────────────────── ｎｅｇａｔｅ「否定」 “ｎｏ” ─────────────────────────────────── ｏｆｆｅｒ「申し出」 “ＨｏｗｍａｙＩｈｅｌｐｙｏｕ？” ─────────────────────────────────── ｐｌｅａｓｅ−ｗａｉｔ「待機要求」 “Ｊｕｓｔａｍｉｎｕｔｅ”，“Ｌｅｔｍｅｓｅｅ” ─────────────────────────────────── ｒｅｊｅｃｔ「拒否」 “Ｎｏ，ｗｅｄｏｎ’ｔ” ─────────────────────────────────── ｒｅｑｕｅｓｔ−ａｃｔｉｏｎ「要求動作」 “Ｃｏｕｌｄｙｏｕｒｅｓｅｒｖｅａｒｏｏｍ，ｐｌｅａｓｅ” ─────────────────────────────────── ｒｅｑｕｅｓｔ−ａｆｆｉｒｍａｔｉｏｎ「肯定要求」 “Ｉｓｔｈａｔｒｉｇｈｔ？” ─────────────────────────────────── ｒｅｑｕｅｓｔ−ｉｎｆｏｒｍａｔｉｏｎ「情報要求」 “ＤｏｙｏｕａｃｃｅｐｔＶｉｓａ？” ─────────────────────────────────── ｒｅｑｕｅｓｔ−ｓｕｇｇｅｓｔｉｏｎ「提案要求」 “Ｗｈｉｃｈｄｏｙｏｕｔｈｉｎｋｗｏｕｌｄｂｅｂｅｔｔｅｒ？” ─────────────────────────────────── ｒｅｑｕｅｓｔ−ｖｅｒｉｆｉｃａｔｉｏｎ「受諾要求」 “Ｉｓｔｈｉｓｃｏｒｒｅｃｔ？” ─────────────────────────────────── ｓｕｇｇｅｓｔ「提案」 “Ｉｗｏｕｌｄｒｅｃｏｍｍｅｎｄｔｈａｔ” ─────────────────────────────────── ｔｈａｎｋ「感謝」 “Ｔｈａｎｋｙｏｕｖｅｒｙｍｕｃｈ” ─────────────────────────────────── ｖｅｒｉｆｙ「受諾」 “Ｙｏｕｓａｉｄｔｈｉｓｉｓｆｏｒｔｙｄｏｌｌａｒｓ” ─────────────────────────────────── ………………………………………………………………… ───────────────────────────────────

【００３７】次いで、概念の一例を表４に示す。どのよ
うな概念を定義するかは、システムが扱うタスクドメイ
ンに強く依存する。本実施形態では、旅行会話タスクを
扱うために、「空港（ａｉｒｐｏｒｔ）」、「到着（ａ
ｒｒｉｖａｌ）」、「利用可能性（ａｖａｉｌａｂｉｌ
ｉｔｙ）」、「キャンセル（ｃａｎｃｅｌｌａｔｉｏ
ｎ）」等、５０種類の概念を定義して用いる。

【００３８】

【表４】概念の一例 ─────────────────────────────────── ａｉｒｐｏｒｔ，ａｒｒｉｖａｌ，ａｖａｉｌａｂｉｌｉｔｙ，ｃａｎｃｅｌｌａｔｉｏｎ，ｃｈａｎｇｅ，ｃｈｅｃｋｉｎ，ｃｈｅｃｋｏｕｔ，ｃｏｎｆｉｒｍａｔｉｏｎ，ｃｕｒｒｅｎｃｙ，ｄｅｐａｒｔｕｒｅ，ｄｅｓｔｉｎａｔｉｏｎ，ｄｒｏｐ−ｏｆｆ，ｅｖｅｎｔ，ｅｘｃｈａｎｇｅ，ｅｘｐｉｒａｔｉｏｎ−ｄａｔｅ，ｆａｘ−ｎｕｍｂｅｒ，ｆｅａｔｕｒｅｓ，ｆｌｉｇｈｔ，ｇｕｉｄｅ，ｈｅｌｐ，ｈｅｌｐ−ａｇａｉｎ，ｈｏｔｅｌ，ｌｏｃａｔｉｏｎ，ｍｅｅｔｉｎｇ，ｍｉｎｉｍｕｍ−ｓｔａｙ，ｎａｍｅ，ｎｕｍｅｒａｌ，ｏｒｉｇｉｎ，ｐａｒｔｙ，ｐａｙｍｅｎｔ，ｐｅｒｓｏｎ，ｐｉｃｋ−ｕｐ，ｐｒｅｆｅｒｅｎｃｅ，ｐｒｉｃｅ，ｐｒｉｃｅ−ｄｉｆｆｅｒｅｎｃｅ，ｐｒｉｃｅ−ｆｌｕｃｔｕａｔｉｏｎ，ｒｅｓｅｒｖａｔｉｏｎ，ｒｏｏｍ，ｓｅｎｄ，ｓｉｇｈｔ，ｓｐｅｌｌｉｎｇ，ｓｔａｙ，ｔｅｌｅｐｈｏｎｅ−ｎｕｍｂｅｒ，ｔｅｍｐｏｒａｌ，ｔｏｕｒ，ｔｒａｎｓｆｅｒ，ｔｒａｎｓｐｏｒｔａｔｉｏｎ，ｔｒｉｐ，ｕｎａｖａｉｌａｂｉｌｉｔｙ， ……………………………… ───────────────────────────────────

【００３９】次いで、組み合わせ概念の例について説明
する。概念の組み合わせにより、文において焦点が当っ
ている話題を組み合わせ概念として表現する。例えば、
表２の例３の文“Ｔｈｅｗｅｅｋｏｆｔｈｅｔ
ｗｅｌｆｔｈｗｅｈａｖｅｂｏｔｈｓｉｎｇｌ
ｅｓａｎｄｄｏｕｂｌｅｓａｖａｉｌａｂｌｅ”
において、文中には、「時間（ｔｅｍｐｏｒａｌ）」
や、「部屋の特徴（ｆｅａｔｕｒｅｓ＋ｒｏｏｍ）」と
いった話題も現れるが、文の焦点から最適な組み合わせ
概念は「部屋の利用可能性（ａｖａｉｌａｂｉｌｉｔｙ
＋ｒｏｏｍ）」である。組み合わせ概念として使用可能
な概念の組み合わせを、（１）発話行為に依存する制約
と、（２）概念間での組み合わせ制約として定義し、発
話行為と組み合わせ概念メモリ３３に格納する。なお、
本実施形態において、組み合わせ概念とは、１つずつの
概念と、複数の概念の組み合わせとを含めて組み合わせ
概念という。

【００４０】この制約定義に基づいて作成した、発話行
為と組み合わせ概念メモリ３３のデータ例を表５に示
す。ここで、（１）発話行為に依存する制約とは、具体
的には、例えば、「交通機関の利用可能性」についての
「情報提示」（ｇｉｖｅ−ｉｎｆｏｒｍａｔｉｏｎ＋ａ
ｖａｉｌａｂｉｌｉｔｙ＋ｔｒａｎｓｐｏｒｔａｔｉｏ
ｎ）は許すが、「交通機関の利用可能性」についての
「拒否」（ｒｅｊｅｃｔ＋ａｖａｉｌａｂｉｌｉｔｙ＋
ｔｒａｎｓｐｏｒｔａｔｉｏｎ”は許さない、といった
ものである。また、（２）概念間での組み合わせ制約と
は、例えば、「団体客の特徴（ｆｅａｔｕｒｅｓ＋ｐａ
ｒｔｙ）」は許すが、「団体客の利用可能性（ａｖａｉ
ｌａｂｉｌｉｔｙ＋ｐａｒｔｙ）」や「団体客の予約
（ｒｅｓｅｒｖａｔｉｏｎ＋ｐａｒｔｙ）」は許さな
い、といったものである。本実施形態では、組み合わせ
概念は７７７種類を定義し、これを用いる。

【００４１】発話行為と組み合わせ概念メモリ３３のデ
ータ例

【表５】 ─────────────────────────────────── 発話行為＋組み合わせ概念 ─────────────────────────────────── give-information＋availability＋transportation ＋person ＋room ＋hotel ＋tour ＋flight ＋features ＋hotel ＋tour ＋flight ＋transportation ＋trip ＋room ＋party ＋reservation ＋expiration ＋features＋transportation ＋trip ＋tour ＋flight ＋room payment change ………… ───────────────────────────────────

【００４２】次いで、「引数」の例について説明する、
文の内容の詳細な特徴を引数で表現する。次の表に挙げ
た例１．及び例２．では、表層が異なる（具体的には、
同じ単語が“Ｉ”と“ｏｎ”しか無い。）２文に対し
て、括弧で括られた引数のみが異なる中間言語表現が与
えられている。ここで、ｃ：は話者ａとは異なる話者ｃ
を示す。

【００４３】

【表６】引数の一例 ─────────────────────────────────── 例１．ＩａｎｄｔｗｏａｓｓｏｃｉａｔｅｓａｒｒｉｖｅｏｎＭａｙｆｉｆｔｈ．ｃ：ｇｉｖｅ−ｉｎｆｏｒｍａｔｉｏｎ＋ｔｅｍｐｏｒａｌ＋ａｒｒｉｖａｌ（ｗｈｏ＝Ｉ，ｗｉｔｈ−ｗｈｏｍ＝（ａｓｓｏｃｉａｔｅ，ｑｕａｎｔｉｔｙ＝２），ｔｉｍｅ＝（ｍａｙ，ｍｄ１５）） ─────────────────────────────────── 例２．Ｉ’ｌｌｂｅａｒｒｉｖｉｎｇｏｎＦｅｂｒｕａｒｙｔｗｅｌｆｔｈ．ｃ：ｇｉｖｅ−ｉｎｆｏｒｍａｔｉｏｎ＋ｔｅｍｐｏｒａｌ＋ａｒｒｉｖａｌ（ｗｈｏ＝Ｉ，ｔｉｍｅ＝（ｆｅｂｒｕａｒｙ，ｍｄ１２）） ───────────────────────────────────

【００４４】本実施形態では、引数は、引数名と引数値
から構成される。表６の例１及び例２では、“ｗｈ
ｏ”，“ｗｉｔｈ−ｗｈｏｍ”，“ｔｉｍｅ”，“ｑｕ
ａｎｔｉｔｙ”が引数名であり、“Ｉ”，“（ａｓｓｏ
ｃｉａｔｅ，ｑｕａｎｔｉｔｙ＝２）”，“（ｍａｙ，
ｍｄ１５）”等が引数値である。使用可能な引数名は、
発話行為と組み合わせ概念に依存して定義し、引数名メ
モリ３５に格納する。なお、例外については詳細後述す
る。このデータ例を表７に示す。

【００４５】

【表７】引数名メモリ３５のデータ例 ─────────────────────────────────── 発話行為＋組み合わせ概念引数名 ─────────────────────────────────── give-information＋availability＋transportation time,frequency, location,price, for-whom, transportation-type, duration, carrier-name,via, destination,origin ＋room time,frequency, location,price, for-whom,hotel-name, hotel-type,room-type, contain,bed-type, room-location, room-number, room-name ───────────────────────────────────

【００４６】表７のデータ例は、“ｇｉｖｅ−ｉｎｆｏ
ｒｍａｔｉｏｎ＋ａｖａｉｌａｂｉｌｉｔｙ＋ｔｒａｎ
ｓｐｏｒｔａｔｉｏｎ”「交通機関の利用可能性に関す
る情報提示」で使用可能な引数名、及び、“ｇｉｖｅ−
ｉｎｆｏｒｍａｔｉｏｎ＋ａｖａｉｌａｂｉｌｉｔｙ＋
ｒｏｏｍ”「部屋の利用可能性に関する情報提示」で使
用可能な引数名の一覧を示すものである。それぞれに定
義された引数名を比べると、両者に共通して使用可能
な、“ｔｉｍｅ（時間）”，“ｌｏｃａｔｉｏｎ（場
所）”といった引数名が存在する一方で、前者のみで使
える“ｔｒａｎｓｐｏｒｔａｔｉｏｎ−ｔｙｐｅ（交通
機関のタイプ）”，“ｃａｒｒｉｅｒ−ｎａｍｅ（運送
手段の名前）”、逆に、後者のみで使える“ｈｏｔｅｌ
−ｔｙｐｅ（ホテルのタイプ）”といったものも存在す
ることがわかる。

【００４７】引数名それぞれに対して、割り当て可能な
引数値を定義する。引数値のデータ例を表８に示す。

【００４８】

【表８】引数値のデータ例 ─────────────────────────────────── 引数名＝引数値 ─────────────────────────────────── with-whom ＝ i,we,you,he,she,they,..., child,husband,wife,..., ＜equantity＞,..., ... ─────────────────────────────────── time ＝ 00:00,00:01,00:02,...,23:59, md1,md2,md3,...,md31, monday,tuesday,wednesday,..., night,afternoon,noon,soon,later,..., ＜estart-time＞,＜end-time＞,..., ... ─────────────────────────────────── room-type ＝ single,double,suite,bedroom,... ─────────────────────────────────── start-time ＝ 00:00,00:01,00:02,...,23:59, md1,md2,md3,...,md31, monday,tuesday,wednesday,..., night,afternoon,noon,soon,later,..., ... quantity ＝ 0,1,2,3,4,... question,couple,many,..., ... ───────────────────────────────────

【００４９】引数値には、表８のデータ例に示すような
値を単独で用いる以外に、これら引数値を組み合わせて
用いることも可能である。引数値の組み合わせには、以
下の演算子を用いる。

【００５０】

【表９】引数値の演算子 ─────────────────────────────────── （１）“’”（列挙）例：ｔｉｍｅ＝（ｆｅｂｒｕａｒｙ，ｍｄ１２）「２月１２日」 ─────────────────────────────────── （２）“；”（分離）例：ｔｉｍｅ＝（ｍｄ１２；ｍｄ１３）「１２日か１３日」 ─────────────────────────────────── （３）“＆”（結合）例：ｗｉｔｈ−ｗｈｏｍ＝（ｗｉｆｅ＆ｃｈｉｌｄ）「妻と子」 ───────────────────────────────────

【００５１】また、一部の引数名にはその引数値とし
て、引数構造：引数名＝引数値を用いることを許す（こ
れは、引数名定義の例外である。）。表９の例中の＜ｑ
ｕａｎｔｉｔｙ＞や＜ｓｔａｒｔ−ｔｉｍｅ＞，＜ｅｎ
ｄ−ｔｉｍｅ＞が、これに相当する。引数構造を用いる
ことで、例えば、表６の例１中のｗｉｔｈ−ｗｈｏｍ＝（ａｓｓｏｃｉａｔｅ，ｑｕａｎ
ｔｉｔｙ＝２）「同伴者２名」といった表現や、ｔｉｍｅ＝（ｓｔａｒｔ−ｔｉｍｅ＝１０：００，ｅｎ
ｄ−ｔｉｍｅ＝１２：００）「１０時から１２時まで」といった表現を扱うことが可
能である。

【００５２】次いで、決定木生成処理部２１の処理につ
いて説明する。決定木生成処理部２１は、学習データメ
モリ３１内の学習データの情報に基づき、概念推定用決
定木と発話行為推定用決定木をそれぞれ生成する。ここ
で、学習データは、表１０に示すように、各例文毎の識
別番号と、例文（例えば英語）と、それに対応する中間
言語表現とから構成される。

【００５３】まず、概念推定用決定木の構成について説
明する。決定木はノードとアークから構成され、決定木
は基本的に二分木であるが、部分的に三分木となるノー
ドを含むことを特徴としている。全てのノードは事例集
合を保持する。また、リーフ以外のノードでは、この他
にテストを保持する。ここで、事例集合は、学習データ
メモリ３１内の学習データの情報から生成される全事例
の部分集合である。この学習データのデータ例を表１０
に示す。また、この学習データの情報から生成した、概
念“ｒｏｏｍ（部屋）”を推定する決定木用の事例集合
のデータ例を表１１に示す。

【００５４】

【表１０】学習データメモリ３１のデータ例 ─────────────────────────────────── 識別番号文／中間言語表現 ─────────────────────────────────── 0000 When are you reserving this for a:request-information+reservation+temporal(time=question) ─────────────────────────────────── 0001 I'll be arriving February twelfth c:give-information+temporal+arrival (who=I,time=(february,md12)) ─────────────────────────────────── 0002 The week of the twelfth we have both singles and doubles available a:give-information+availability+room (room-type=(single & double),time=(week,md12)) ─────────────────────────────────── 0003 The singles are a hundred and twenty dollars a night a:give-information+price+room(room-type=single, price=(currency=dollar,per-unit=night,quantity=120)) ─────────────────────────────────── 0004 And the doubles are a hundred and thirty four dollars a:give-information+price+room(room-type=double, price=(currency=dollar,quantity=134)) ─────────────────────────────────── 0005 Which would you prefer a:request-information+preference ─────────────────────────────────── 0006 A single would do c:accept+features+room(room-type=single) ─────────────────────────────────── 0007 Would you like to put this on a credit card c:request-information+payment(method=credit-card) ───────────────────────────────────

【００５５】

【表１１】 “ｒｏｏｍ（部屋）”の決定木用の事例集合のデータ例 ─────────────────────────────────── 事例識別番号文クラス ─────────────────────────────────── 0000 When are you reserving this for Ｃ₀ ─────────────────────────────────── 0001 I'll be arriving February twelfth Ｃ₀ ─────────────────────────────────── 0002 The week of the twelfth we have both singles and doubles available Ｃ₁ ─────────────────────────────────── 0003 The singles are a hundred and twenty dollars a night Ｃ₁ ─────────────────────────────────── 0004 And the doubles are a hundred and thirty four dollars Ｃ₁ ─────────────────────────────────── 0005 Which would you prefer Ｃ₀ ─────────────────────────────────── 0006 A single would do Ｃ₁ ─────────────────────────────────── 0007 Would you like to put this on a credit card Ｃ₀ ───────────────────────────────────

【００５６】ここで、事例とは、文とクラスの組であ
る。クラスとは、当該文の中間言語表現に、当該決定木
が推定対象とする概念を含むクラスＣ₁、又は含まない
クラスＣ₀のいずれかである。テストは、予め指定した
文の特徴から、上述の数１により定める相互情報量基準
により唯一つ選択する。文の特徴としては、（１）単語
活用形（すなわち、ある単語が文中に出現するかを示
す。）、（２）単語標準形（すなわち、ある単語標準形
を持つ単語が文中に出現するかを示す。）、（３）概念
（すなわち、ある概念が文の中間言語表現中に見られる
かを示す。）の３つを用いる。ただし、（３）の概念に
は、当該決定木が推定対象とする概念を含まない。

【００５７】次いで、発話行為推定用決定木について説
明する。以下、概念推定用決定木との相違点のみを示
す。（ａ）唯一つの発話行為推定用決定木で発話行為を決定
する。（ｂ）文の特徴には、（１）単語標準形（すなわち、あ
る単語標準形をもつ単語が文中に出現するかを示
す。）、（２）単語標準形の２連接（すなわち、ある単
語標準形をもつ単語の２連接が文中に出現するかを示
す。）の２つを用いる。（ｃ）事例のクラスとしては、６５種類の複合発話行為
を設定する。（ｄ）ノードのテストを選択する基準には、概念推定用
決定木と同様に、相互情報量を用いる。（ｅ）生成する発話行為推定用決定木は、完全二分木で
ある。概念推定用決定木で生成した未知アークはここで
は生成しない。

【００５８】次いで、中間言語生成部２２の処理につい
て説明する。中間言語生成部２２は、図１に示すよう
に、発話行為と組み合わせ概念決定部２３と引数決定部
２４とから構成され、音声認識装置１０からの自然発話
の入力文に対応する中間言語表現を生成する。すなわ
ち、複合発話行為、組み合わせ概念、引数をそれぞれ決
定する。発話行為と組み合わせ概念決定部２３におい
て、組み合わせ概念の決定においては、上述の推定アル
ゴリズムを用いる。また、発話行為の決定においては、
到達したリーフが保持する事例集合中から、最大数を占
める複合発話行為を推定結果として選択する。

【００５９】引数決定部２４は、発話行為と組み合わせ
概念決定部２３からの決定された発話行為及び組み合わ
せ概念を含む入力文を、以下の手順で部分的に構文解析
することで、発話行為と組み合わせ概念を決定する。＜ステップＳＳ１＞入力される決定した発話行為と組み
合わせ概念を引数名メモリ３５内の引数名と照らし合わ
せることで、使用可能な引数名を列挙する。＜ステップＳＳ２＞列挙した引数名それぞれについて、
対応する部分文解析規則を引数値生成規則メモリ３６か
ら読み込む。＜ステップＳＳ３＞部分文解析規則を用いて、入力文中
の任意の連続した部分単語列を構文解析する。このとき
使った規則から生成される引数値を並べることで、当該
入力文に対応する引数値を生成する。例えば、入力文
“Ｉ’ｌｌａｒｒｉｖｉｎｇｏｎＭｏｎｄａｙ
Ｆｅｂｒｕａｒｙ１．”からは、連続した部分単語列
“ｏｎＭｏｎｄａｙＦｅｂｒｕａｒｙ１”から引数
名“ｔｉｍｅ”に対する引数値“（ｍｏｎｄａｙ，ｆｅ
ｂｒｕａｒｙ，ｍｄ１）”が生成される。

【００６０】表１２及び表１３に、引数名“ｔｉｍｅ
（時間）”の引数値生成規則の例を示す。引数値生成規
則は、部分文解析規則と生成される引数値から構成され
る。表１２及び表１３中、セミコロン“；”の左側が公
知のＢＮＦ（“ＢａｃｃｕｓＮａｕｒＦｏｒｍ”の略
とも、“ＢａｃｃｕｓＮｏｒｍａｌＦｏｒｍ”の略
とも言われる。）記法で記述した部分文解析規則であ
り、右側が当該規則から生成される引数値である。大文
字とアンダースコア“＿”のみから構成されているもの
は非終端記号を表わす。バッククォート“‘”とシング
ルクォート“’”で囲まれているものは終端記号を表わ
す。アスタリスク“＊”で囲まれたものは、非終端記号
の展開により生成される引数値である。

【００６１】

【表１２】時間“ｔｉｍｅ”の引数値生成規則メモリ３６のデータ例（その１） ─────────────────────────────────── TIME_STR ::= TIME_STR1 ;*TIME_STR1* ─────────────────────────────────── TIME_STR1 ::= TIME_STR2 ;*TIME_STR2* − TIME_STR1 TIME_STR1 ;(*TIME_STR1*,*TIME_STR1*) − TIME_STR1 AND TIME_STR1 ;(*TIME_STR1*&*TIME_STR1*) − TIME_STR1 OR TIME_STR1 ;(*TIME_STR1*;*TIME_STR1*) ─────────────────────────────────── TIME_STR2 ::= TIME_STR3 ;*TIME_STR3* − START_STR TIME_STR3 ;*START_STR**TIME_STR1* − END_STR TIME_STR3 ;*END_STR**TIME_STR1* ─────────────────────────────────── START_STR ::= ‘from' ;start-time= − ‘starting' ;start-time= − ‘since' ;start-time= ─────────────────────────────────── END_STR ::= ‘to' ;end-time= − ‘till' ;end-time= − ‘until' ;end-time= − ‘uptotill' ;end-time= ─────────────────────────────────── TIME_STR3 ::= TIME_STR4 ;*TIME_STR4* − TIME_STR4‘and'TIME_STR4 ;*TIME_STR4*&*TIME_STR4* − TIME_STR4‘or'TIME_STR4 ;*TIME_STR4*;*TIME_STR4* − TIME_STR4 TIME_STR4 ;*TIME_STR4*,*TIME_STR4* ─────────────────────────────────── TIME_STR4 ::= YEAR ;*YEAR* − MONTH ;*MONTH* − DOM ;*DOM* − DOW ;*DOW* − HOUR_MIN ;*HOURMIN* − POT ;*POT* − REL ;*REL* ───────────────────────────────────

【００６２】

【表１３】時間“ｔｉｍｅ”の引数値生成規則メモリ３６のデータ例（その２） ─────────────────────────────────── YEAR ::= YEAR1 ;*YEAR1* − ‘in'YEAR1 ;*YEAR1* − ‘of'YEAR1 ;*YEAR1* ─────────────────────────────────── YEAR1 ::= ‘1998' ;1998 − ‘1999' ;1999 ... ... ─────────────────────────────────── MONTH ::= MONTH1 ;*MONTH1* − ‘on'MONTH1 ;*MONTH1* − ‘of'MONTH1 ;*MONTH1* ─────────────────────────────────── MONTH1 ::= ‘January' ;january − ‘February' ;february ... ... ─────────────────────────────────── DOM ::= DOM1 ;*DOM1* − ‘in'DOM1 ;*DOM1* − ‘of'DOM1 ;*DOM1* ─────────────────────────────────── DOM1 ::= the‘first' ;md1 − the‘1st' ;md1 ... ... ─────────────────────────────────── ……… ───────────────────────────────────

【００６３】次いで、自然言語翻訳部２５の処理につい
て説明する。自然言語翻訳部２５は、引数決定部２４か
ら入力される中間言語表現から、以下の手順で翻訳文を
生成する。＜ＳＳ１１＞発話行為と組み合わせ概念に基づき、文テ
ンプレートメモリ３７から対応する文テンプレートを取
り出す。＜ＳＳ１２＞部分生成規則メモリ３８は、引数値解析規
則とそれに対応する単語列とから構成され、部分文生成
規則メモリ３８から、中間言語表現中に与えられた引数
名に対応する部分文生成ルールを取り出す。＜ＳＳ１３
＞引数値解析規則を使って引数値の構文解析を行う。こ
のとき使った規則により生成される単語列を並べること
で、当該引数に対応する部分文を生成する。＜ＳＳ１４＞部分文を文テンプレートに埋め込んで出力
文を生成する。ここで、文テンプレートメモリ３７のデ
ータ例を表１４及び表１５に示す。また、部分文生成規
則メモリ３８のデータ例を表１６及び表１７に示す。

【００６４】

【表１４】文テンプレートメモリのデータ例（その１） ─────────────────────────────────── ｇｉｖｅ−ｉｎｆｏｒｍａｔｉｏｎ＋ｐｒｉｃｅ＋ｒｏｏｍ ─────────────────────────────────── ｈｏｔｅｌ−ｎａｍｅのｈｏｔｅｌ−ｔｙｐｅのｒｏｏｍ−ｔｙｐｅのｃｏｎｔａｉｎ付きのｂｅｄ−ｔｙｐｅ付きのｒｏｏｍ−ｌｏｃａｔｉｏｎにあるｒｏｏｍ−ｎｕｍｂｅｒのｒｏｏｍ−ｎａｍｅの部屋の値段はｐｒｉｃｅ − です。 ───────────────────────────────────

【００６５】

【表１５】文テンプレートメモリのデータ例（その２） ─────────────────────────────────── ｇｉｖｅ−ｉｎｆｏｒｍａｔｉｏｎ＋ａｖａｉｌａｂｉｌｉｔｙ＋ｒｏｏｍ ─────────────────────────────────── ｌｏｃａｔｉｏｎでｔｉｍｅ ─ ｆｒｅｑｕｅｎｃｙでｐｒｉｃｅでｆｏｒ−ｗｈｏｍの名義でｈｏｔｅｌ−ｎａｍｅのｈｏｔｅｌ−ｔｙｐｅのｒｏｏｍ−ｔｙｐｅのｃｏｎｔａｉｎ付きのｂｅｄ−ｔｙｐｅ付きのｒｏｏｍ−ｌｏｃａｔｉｏｎにあるｒｏｏｍ−ｎｕｍｂｅｒのｒｏｏｍ−ｎａｍｅの部屋が利用できます。 ───────────────────────────────────

【００６６】

【表１６】時間“ｔｉｍｅ”の部分文生成規則メモリ３８のデータ例（その１） ─────────────────────────────────── TIME_VALUE ::= VAL ;*VAL* ｜ VAL_SEQ_PAR ;*VAL_SEQ_PAR* ─────────────────────────────────── VAL_SEQ_PAR ::= ‘('VAL_SEQ‘)' ;*VAL_SEQ* ｜ VAL_SEQ ;*VAL_SEQ* ─────────────────────────────────── VAL_SEQ ::= VAL_SEQ_PAR LOP VAL_SEQ_PAR ;*VAL_SEQ_PAR**LOP**VAL_SEQ_PAR* ｜ VAL ;*VAL* ─────────────────────────────────── LOP ::= ‘&' ;と｜ ‘;' ;か｜ ‘,' ; ─────────────────────────────────── VAL ::= VAL_ARG ;*VAL_ARG* ｜ VAL1 ;*VAL1*に ─────────────────────────────────── VAL_ARG ::= ‘start_time='TIME_VALUE ;*TIME_VALUE*から｜ ‘end_time='TIME_VALUE ;*TIME_VALUE*まで ─────────────────────────────────── VAL1 ::= YEAR ;*YEAR* ｜ MONTH ;*MONTH* ｜ DOM ;*DOM* ｜ DOW ;*DOW* ｜ POT ;*POT* ｜ HOUR_MIN ;*HOUR_MIN* ｜ ‘question' ;いつ ───────────────────────────────────

【００６７】

【表１７】時間“ｔｉｍｅ”の部分文生成規則メモリ３８のデータ例（その２） ─────────────────────────────────── YEAR ::= ‘1998' ;１９９８年｜ ‘1999' ;１９９９年 ... ... ─────────────────────────────────── MONTH ::= ‘january' ;１月｜ ‘february' ;２月 ... ... ─────────────────────────────────── DOM ::= ‘md1' ;１日｜ ‘md2' ;２日 ... ... ─────────────────────────────────── DOW ::= ‘sunday' ;日曜日｜ ‘monday' ;月曜日 ... ... ─────────────────────────────────── POT ::= ‘night' ;夜｜ ‘afternoon' ;午後 ... ... ─────────────────────────────────── HOUR_MIN ::= ‘00:00' ;０時｜ ‘00:01' ;０時１分 ... ... ───────────────────────────────────

【００６８】表１６及び表１７から明らかなように、部
分文生成規則メモリ３８には、引数値解析規則と生成さ
れる単語列から構成される。表１６及び表１７におい
て、セミコロン“；”の左側が公知のＢＮＦ記法で記述
した引数値解析規則であり、右側が当該規則から生成さ
れる単語列である。大文字とアンダースコア“＿”のみ
から構成されているものは非終端記号を表わす。また、
バッククォート“‘”とシングルクォート“’”で囲ま
れているものは終端記号を表わす。さらに、アスタリス
ク“＊”で囲まれたものは、非終端記号の展開により生
成される単語列である。

【００６９】例えば、自然言語翻訳部２５の処理におい
て、中間言語表現“ｇｉｖｅ−ｉｎｆｏｒｍａｔｉｏｎ
＋ａｖａｉｌａｂｉｌｉｔｙ＋ｒｏｏｍ（ｒｏｏｍ−ｔ
ｙｐｅ＝ｓｉｎｇｌｅ，ｔｉｍｅ＝（ｍｄ１２ｍｄ１
３））”が与えられると、引数から部分文「シングル」
と「１２日と１３日に」が生成される。これを表１４及
び表１５の例の下段（表１５）の文テンプレートに埋め
込むことで、出力文「１２日と１３日にシングルの部屋
が利用できます。」が生成される。

【００７０】図５及び図６は、図１の決定木生成処理部
２１によって実行される決定木生成処理を示すフローチ
ャートである。まず、図５のステップＳ１において、発
話行為と概念組み合わせメモリ３３を参照して全ての概
念と複合発話行為を内部メモリに列挙する。次いで、ス
テップＳ２において決定木を生成していない概念又は複
合発話行為があるか否かが判断され、ＹＥＳのときは処
理すべきデータが残ってきるので、ステップＳ３に進む
一方、ＮＯのときは当該決定木生成処理を終了する。ス
テップＳ３において学習データメモリ３１から全ての学
習データを読み込み、当該意味項目（概念又は複合発話
行為を含む。）に対応する事例を生成し、ステップＳ４
において全ての事例を事例集合として保持するノードを
生成し、当該意味項目決定木のルートノードとして登録
し、ルートノードを分割待ち行列（内部メモリに設定さ
れる）に入れる。そして、ステップＳ５において分割待
ち行列は空か否かが判断され、ＮＯのときは処理すべき
データが残っているので、ステップＳ６に進む一方、Ｙ
ＥＳのときは当該意味項目の決定木の生成は完了したの
で、ステップＳ１４に進み、生成した決定木を決定木メ
モリ３４に格納して、ステップＳ２に戻る。

【００７１】ステップＳ６において分割待ち行列から、
ノードＮを１つ取り出し、ステップＳ７においてノード
Ｎの保持する事例集合Ｓは、単独クラスの集合か否かが
判断され、ＹＥＳであればステップＳ５に戻る一方、Ｎ
ＯであればステップＳ８に進む。ステップＳ８において
ノードＮの先祖ノードでテストとしてまだ選択されてい
ない全ての文の特徴ｆ_iに対して、特徴ｆ_iの有無によ
り、当該ノードが保持する事例集合Ｓの２分割を試み
る。このとき、最大の相互情報量（数１参照）を与える
文の特徴

【数３】を見つける。

【００７２】次いで、図６のステップＳ９において相互
情報量Ｉ（Ｓ；ｆ_i＊）はしきい値以上か否かが判断さ
れ、ＹＥＳのときはステップＳ１０に進む一方、ＮＯの
ときは図５のステップＳ５に戻る。ステップＳ１０にお
いて特徴ｆ_iをノードＮのテスト特徴として登録し、ス
テップＳ１１においてノードＮが保持する事例集合Ｓ
を、文の特徴ｆ_i＊の有無に基づいて事例Ｓ_yesと事例Ｓ
_noに２分割する。そして、それぞれの部分集合を保持す
る新たな２つのノードを生成し、ノードＮのそれぞれｙ
ｅｓアーク、ｎｏアークの下の子ノードとして登録し、
これら２ノードを分割待ち行列に入れる。さらに、ステ
ップＳ１２において特徴ｆ_i＊は概念か否かが判断さ
れ、ＹＥＳのときはステップＳ１３に進む一方、ＮＯの
ときは図５のステップＳ５に戻る。ステップＳ１３にお
いてノードＮが保持する事例集合Ｓをそのまま保持する
新たなノードを生成し、ノードＮの未知アークの下に３
つ目の子ノードとして登録した後、図５のステップＳ５
に戻る。

【００７３】図５及び図６の決定木生成処理では、各概
念毎、及び、各複合発話行為毎に、予め定めるしきい値
以上の相互情報量を持つテスト特徴が何れのノードにも
見つからなくなるまで決定木を成長させ、この結果生成
した木を決定木メモリ３４に格納する。

【００７４】図７は、図１の発話行為と組み合わせ概念
決定部２３によって実行される組み合わせ概念決定処理
を示すフローチャートである。まず、図７のステップＳ
２１において、決定木メモリ３４から、全ての概念決定
木を読み込み、ステップＳ２２において各概念決定木の
ルートにノードポインタを設定する。そして、ステップ
Ｓ２３において概念決定木のトレース処理を実行する。
ここで、概念のスコアがまだ推定されていない全ての決
定木のノードを降りる。次いで、ステップＳ２４におい
て全ての概念のスコアが推定されたか否かが判断され、
ＮＯのときはすべての概念のスコアが計算されていない
ので、ステップＳ２５に進む一方、ＹＥＳのときはすべ
ての概念のスコアが計算済みなので、ステップＳ２８に
進む。ステップＳ２５において停止中の概念推定用決定
木はデッドロック（＝互いの推定結果待ち）しているか
否かが判断され、ＹＥＳのときはデッドロックの処理を
行うためにステップＳ２６に進む一方、ＮＯのときはス
テップＳ２３に戻る。ステップＳ２６では、停止中の決
定木群から、別に定める基準により、木を１つ選択し、
ステップＳ２７において選択した決定木のノードポイン
タを、現在ノードポインタが指すノードの未知子ノード
へと移した後、ステップＳ２３に戻る。

【００７５】ステップＳ２４でＹＥＳのときは、ステッ
プＳ２８において全ての概念のスコアを並べてベクトル
Ｖを生成する。発話行為と概念組み合わせメモリ３３が
保持する全ての組み合わせ概念に対して、各概念を含む
／含まないに応じて１／０を割り当てたベクトル群を生
成し、その中でベクトルＶとの内積が最大となるもの
を、推定された組み合わせ概念として引数決定部２４に
出力する。なお、ステップＳ２６における基準とは、次
のヒューリスティクスによる経験的基準である。まず、
停止中の何れかの決定木Ｔ_iのノードポインタを、一時
的に未知アークの下の子ノードへと移し、全決定木のト
レースをデッドロック状態になるまで仮想的に続ける。
この結果それぞれの決定木Ｔ_jが到達するノードのクラ
スエントロピーの総和

【数４】 ΣＥ_j ｊ∈ｔｒｅｅを求める。ここで、

【数５】Ｅ_j＝−（｜Ｓ_yes｜／｜Ｓ｜）・ｌｏｇ（｜Ｓ
_yes｜／｜Ｓ｜）−（｜Ｓ_no｜／｜Ｓ｜）・ｌｏｇ（｜
Ｓ_no｜／｜Ｓ｜）である。また、｜Ｓ｜，｜Ｓ_yes｜，｜Ｓ_no｜はそれぞ
れ、決定木Ｔ_jが到達するノード（リーフでなくとも良
い。）における事例集合Ｓの中で当該概念を含む事例Ｓ
の事例数｜Ｓ｜、当該概念を含む事例Ｓ_yesの事例数｜
Ｓ_yes｜、及び当該概念を含む事例Ｓ_noの事例数｜Ｓ_no
｜を表わす。以上を停止中の全ての決定木に対して試行
し、この結果、最小の総和エントロピー

【数６】 ΣＥ_j ｊ∈ｔｒｅｅを与える決定木Ｔ_i＊を選択する。

【００７６】図８は、図７のサブルーチンである概念決
定木のトレース処理を示すフローチャートである。ま
ず、図８のステップＳ３１においてノードポインタが指
すノードＮはリーフか否かが判断され、ＮＯのときはス
テップＳ３２に進む一方、ＹＥＳのときはステップＳ３
６に進む。次いで、ステップＳ３２においてノードＮの
テスト特徴はｆは概念か否かが判断され、ＹＥＳのとき
はステップＳ３３に進む一方、ＮＯのときはステップＳ
３５に進む。さらに、ステップＳ３３において特徴ｆで
テスト対象とする概念のスコアｓは計算されているか否
かが判断され、ＹＥＳのときはステップＳ３４に進む一
方、ＮＯのときは元のメインルーチンに戻る。ステップ
Ｓ３４では、子ノード指示変更処理を実行した後、ステ
ップＳ３１に戻り、また、ステップＳ３５では、入力文
テスト処理を実行した後、ステップＳ３１に戻る。ステ
ップＳ３６において到達したリーフが保持する事例集合
Ｓの事例数｜Ｓ｜と、事例集合Ｓの中で当該概念を含む
事例Ｓ_yesの事例数｜Ｓ_yes｜とから、次式を用いて、

【数７】概念の尤度Ｐｒ＝｜Ｓ_yes｜／｜Ｓ｜を計算し、これを当該概念のスコアとして、元のメイン
ルーチンに戻る。

【００７７】図９は、図８のサブルーチンである子ノー
ド指示変更処理を示すフローチャートである。まず、図
９のステップＳ４１において０≦ｓ＜０．１であるか否
かが判断され、ステップＳ４２において０．９＜ｓ≦
１．０であるか否かが判断され、ステップＳ４３におい
て０．１≦ｓ≦０．９であるか否かが判断される。ステ
ップＳ４１でＹＥＳであれば、ステップＳ４４において
ノードポインタをノードＮのｎｏアークの下の子ノード
を指すように変更した後、元のメインルーチンに戻る。
また、ステップＳ４２でＹＥＳであれば、ステップＳ４
５においてノードポインタをノードＮのｙｅｓアークの
下の子ノードを指すように変更した後、元のメインルー
チンに戻る。さらに、ステップＳ４３でＹＥＳであれ
ば、ステップＳ４６においてノードポインタをノードＮ
の未知アークの下の子ノードを指すように変更した後、
元のメインルーチンに戻る。

【００７８】図１０は、図８のサブルーチンである入力
文テスト処理を示すフローチャートである。まず、図１
０のステップＳ５１において入力文に対して特徴ｆをテ
ストする。ここで、テストとは、特徴ｆの示す単語が、
入力文に出現しているか、否か、を調べることを意味す
る。次いで、ステップＳ５２においてテスト結果はｙｅ
ｓか否かが判断され、ＹＥＳであれば、ステップＳ５３
においてノードポインタをノードＮのｙｅｓアークの下
の子ノードを指すように変更した後、元のメインルーチ
ンに戻る。一方、ステップＳ５２でＮＯであれば、ステ
ップＳ５４においてノードポインタをノードＮのｎｏア
ークの下の子ノードを指すように変更した後、元のメイ
ンルーチンに戻る。

【００７９】図１１は、図１の引数決定部２４によって
実行される引数決定処理を示すフローチャートである。
まず、図１１のステップＳ６１において発話行為と組み
合わせ概念決定部２３によって決定された発話行為と組
み合わせ概念を、引数名メモリ３６を参照して、使用可
能な引数名を内部メモリに列挙する。次いで、ステップ
Ｓ６２において列挙した各引数名について、その引数名
の引数値に対応する部分文解析規則を引数値生成規則メ
モリ３６から読み込む。さらに、ステップＳ６３におい
て引数値生成規則メモリ３６内の部分文解析規則を用い
て、入力文中の任意の連続した部分単語例を構文解析し
て、構文解析結果を自然言語翻訳部２５に出力して、当
該引数決定処理を終了する。ここで、構文解析は、具体
的には、引数値生成規則メモリに格納される部分文解析
規則を用いて、公知のチャート法（例えば、従来技術文
献６「Ｍ．Ｋａｙ，“ＡｌｇｏｒｉｔｈｍＳｃｈｅｍ
ａｔａａｎｄＤａｔａＳｔｒｕｃｔｕｒｅｓｉ
ｎＳｙｎｔａｔｃｔｉｃＰｒｏｃｅｓｓｉｎｇ”，Ｔ
ｅｃｈｎｉｃａｌＲｅｐｏｒｔＣＳＬ−８０−１
２，ＸｅｒｏｘＰａｒｃ，１９８０年１０月」参
照。）等により、最上位の非終端記号から、部分文を構
成する終端記号列が生成される過程で適用された規則、
及び、その適用順序を調べることである。

【００８０】図１２は、図１の自然言語翻訳部２５によ
って実行される自然言語翻訳処理を示すフローチャート
である。まず、図１２のステップＳ７１において決定さ
れた発話行為と概念の組み合わせに基づいて、文テンプ
レートメモリ３７から対応する文テンプレートを取り出
す。次いで、ステップＳ７２において部分文生成規則メ
モリ３８から、中間言語表記中に与えられた引数名の単
語列に対応する引数値解析規則を取り出し、ステップＳ
７３において部分文生成規則メモリ３８内の引数解析規
則を用いて引数値の単語列の構文解析を行う。ここで、
構文解析は、具体的には、部分文生成規則メモリに格納
される引数値解析規則を用いて、公知のチャート法（例
えば、従来技術文献６参照。）等により、最上位の非終
端記号から、引数値を構成する終端記号列が生成される
過程で適用された規則、及び、その適用順序を調べるこ
とである。さらに、ステップＳ７４において部分文を文
テンプレートに埋め込んで出力文を生成してプリンタ２
６及びＣＲＴディスプレイ２７に出力する。

【００８１】図１において、決定木生成処理部２１、中
間言語生成部２２、及び自然言語翻訳部２５は例えばデ
ジタル計算機で構成され、学習データメモリ３１と、単
語辞書メモリ３２と、発話行為と組み合わせ概念メモリ
３３と、決定木メモリ３４と、引数名メモリ３５と、引
数値生成規則メモリ３６と、文テンプレートメモリ３７
と、部分文生成規則メモリ３８とは例えばハードディス
クメモリなどの記憶装置で構成される。

【００８２】以上の実施形態において、中間言語生成部
２２の前段には、音声認識装置１０を接続しているが、
本発明はこれに限らず、キーボードなどの入力手段を接
続して、自然発話のテキストデータを中間言語生成部２
２に入力するように構成してもよい。また、以上の実施
形態において、中間言語生成部２２の後段には、自然言
語翻訳部２５を接続しているが、本発明はこれに限ら
ず、データベースメモリを備えたコマンド実行処理部を
備えてもよい。コマンド実行処理部は、中間言語生成部
２２から出力される検索条件を指示するコマンドを含む
中間言語表現に基づいて、例えば対話システムに用いる
データベースをアクセスして、上記検索条件を満たすデ
ータを検索して、検索結果を出力するとともに、検索結
果に対応した処理を実行する。ここで、検索結果に対応
した処理とは、例えば、音声合成の出力、プリンタへの
印字出力、ＣＲＴディスプレイへの表示などである。

【００８３】図２に本実施形態で用いる連続音声認識装
置１０のブロック図を示す。本実施形態の連続音声認識
装置１０は、公知のワン−パス・ビタビ復号化法を用い
て、入力される発声音声文の音声信号の特徴パラメータ
に基づいて上記発声音声文の単語仮説を検出し尤度を計
算して出力する単語照合部４を備えた連続音声認識装置
において、単語照合部４からバッファメモリ５を介して
出力される、終了時刻が等しく開始時刻が異なる同一の
単語の単語仮説に対して、統計的言語モデル１３を参照
して、当該単語の先頭音素環境毎に、発声開始時刻から
当該単語の終了時刻に至る計算された総尤度のうちの最
も高い尤度を有する１つの単語仮説で代表させるように
単語仮説の絞り込みを行う単語仮説絞込部６を備える。

【００８４】ここで用いる統計的言語モデル１３は、学
習用テキストデータに基づいて言語モデル生成部（図示
せず。）により生成されたものであって、統計的言語モ
デル１３は、例えば特開平９−１３４１９２号公報にお
いて開示されたように、品詞クラス間のバイグラム（Ｎ
＝２）を基本としたものであるが、単独で信頼できる単
語は品詞クラスより分離させ、単独のクラスとして取り
扱い、さらに、予測精度を向上させるため、頻出単語列
に関してはそれらの単語を結合して一つのクラスとして
取り扱い、長い単語連鎖の表現を可能にさせ、こうし
て、生成されたモデルは、品詞バイグラムと可変長単語
Ｎ−グラムとの特徴を併せ持つ統計的言語モデルとな
り、遷移確率の精度と信頼性とのバランスをとられたも
のである。

【００８５】図２において、単語照合部４に接続され、
例えばハードディスクメモリに格納される音素ＨＭＭ１
１は、各状態を含んで表され、各状態はそれぞれ以下の
情報を有する。（ａ）状態番号（ｂ）受理可能なコンテキストクラス（ｃ）先行状態、及び後続状態のリスト（ｄ）出力確率密度分布のパラメータ（ｅ）自己遷移確率及び後続状態への遷移確率なお、本実施形態において用いる音素ＨＭＭ１１は、各
分布がどの話者に由来するかを特定する必要があるた
め、所定の話者混合ＨＭＭを変換して生成する。ここ
で、出力確率密度関数は３４次元の対角共分散行列をも
つ混合ガウス分布である。また、単語照合部４に接続さ
れ、例えばハードディスクに格納される単語辞書１２
は、音素ＨＭＭ１１の各単語毎にシンボルで表した読み
を示すシンボル列を格納する。

【００８６】図２において、話者の発声音声はマイクロ
ホン１に入力されて音声信号に変換された後、特徴抽出
部２に入力される。特徴抽出部２は、入力された音声信
号をＡ／Ｄ変換した後、例えばＬＰＣ分析を実行し、対
数パワー、１６次ケプストラム係数、Δ対数パワー及び
１６次Δケプストラム係数を含む３４次元の特徴パラメ
ータを抽出する。抽出された特徴パラメータの時系列は
バッファメモリ３を介して単語照合部４に入力される。
単語照合部４は、ワン−パス・ビタビ復号化法を用い
て、バッファメモリ３を介して入力される特徴パラメー
タのデータに基づいて、音素ＨＭＭ１１と単語辞書１２
とを用いて単語仮説を検出し尤度を計算して出力する。
ここで、単語照合部４は、各時刻の各ＨＭＭの状態毎
に、単語内の尤度と発声開始からの尤度を計算する。尤
度は、単語の識別番号、単語の開始時刻、先行単語の違
い毎に個別にもつ。また、計算処理量の削減のために、
音素ＨＭＭ１１及び単語辞書１２とに基づいて計算され
る総尤度のうちの低い尤度のグリッド仮説を削減する。
単語照合部４は、その結果の単語仮説と尤度の情報を発
声開始時刻からの時間情報（具体的には、例えばフレー
ム番号）とともにバッファメモリ５を介して単語仮説絞
込部６に出力する。

【００８７】単語仮説絞込部６は、単語照合部４からバ
ッファメモリ５を介して出力される単語仮説に基づい
て、統計的言語モデル１３を参照して、終了時刻が等し
く開始時刻が異なる同一の単語の単語仮説に対して、当
該単語の先頭音素環境毎に、発声開始時刻から当該単語
の終了時刻に至る計算された総尤度のうちの最も高い尤
度を有する１つの単語仮説で代表させるように単語仮説
の絞り込みを行った後、絞り込み後のすべての単語仮説
の単語列のうち、最大の総尤度を有する仮説の単語列を
認識結果として、バッファメモリ２４を介して自然言語
理解装置３０内の中間言語生成部２２に出力し、上述の
自然言語理解装置３０の処理が実行される。本実施形態
においては、好ましくは、処理すべき当該単語の先頭音
素環境とは、当該単語より先行する単語仮説の最終音素
と、当該単語の単語仮説の最初の２つの音素とを含む３
つの音素並びをいう。

【００８８】例えば、図３に示すように、（ｉ−１）番
目の単語Ｗ_i-1の次に、音素列ａ₁，ａ₂，…，ａ_nからな
るｉ番目の単語Ｗ_iがくるときに、単語Ｗ_i-1の単語仮説
として６つの仮説Ｗａ，Ｗｂ，Ｗｃ，Ｗｄ，Ｗｅ，Ｗｆ
が存在している。ここで、前者３つの単語仮説Ｗａ，Ｗ
ｂ，Ｗｃの最終音素は／ｘ／であるとし、後者３つの単
語仮説Ｗｄ，Ｗｅ，Ｗｆの最終音素は／ｙ／であるとす
る。終了時刻ｔ_eと先頭音素環境が等しい仮説（図３で
は先頭音素環境が“ｘ／ａ₁／ａ₂”である上から３つの
単語仮説）のうち総尤度が最も高い仮説（例えば、図３
において１番上の仮説）以外を削除する。なお、上から
４番めの仮説は先頭音素環境が違うため、すなわち、先
行する単語仮説の最終音素がｘではなくｙであるので、
上から４番めの仮説を削除しない。すなわち、先行する
単語仮説の最終音素毎に１つのみ仮説を残す。図２の例
では、最終音素／ｘ／に対して１つの仮説を残し、最終
音素／ｙ／に対して１つの仮説を残す。

【００８９】以上の実施形態においては、当該単語の先
頭音素環境とは、当該単語より先行する単語仮説の最終
音素と、当該単語の単語仮説の最初の２つの音素とを含
む３つの音素並びとして定義されているが、本発明はこ
れに限らず、先行する単語仮説の最終音素と、最終音素
と連続する先行する単語仮説の少なくとも１つの音素と
を含む先行単語仮説の音素列と、当該単語の単語仮説の
最初の音素を含む音素列とを含む音素並びとしてもよ
い。

【００９０】図２において、特徴抽出部２と、単語照合
部４と、単語仮説絞込部６と、言語モデル生成部２０と
は、例えば、デジタル電子計算機で構成され、バッファ
メモリ３，５は例えばハードデイスクメモリなどの記憶
装置で構成され、音素ＨＭＭ１１と単語辞書１２と統計
的言語モデル１３とは、例えばハードデイスクメモリな
どの記憶装置に記憶される。

【００９１】以上実施形態においては、単語照合部４と
単語仮説絞込部６とを用いて音声認識を行っているが、
本発明はこれに限らず、例えば、音素ＨＭＭ１１を参照
する音素照合部と、例えばＯｎｅＰａｓｓＤＰアル
ゴリズムを用いて統計的言語モデル１３を参照して単語
の音声認識を行う音声認識部とで構成してもよい。

【００９２】

【実施例】本発明者は、自然言語理解装置３０における
言語理解率を評価するために、以下の実験を行った。評
価実験に用いたデータは、Ｃ−ＳＴＡＲのＤＡタグ付き
英語テキストコーパスである。タスクは旅行会話で、こ
れにはホテル予約、フライト予約、観光案内、旅行パッ
クの問い合わせ等が含まれる。実験では、前処理によ
り、ホテル名、人名等の固有名詞や曜日名、数字列等を
特別なシンボルで置き換えた。実験データの詳細を表１
８に示す。

【００９３】

【表１８】実験データ ─────────────────────────────────── クローズドオープン合計 ─────────────────────────────────── 発話サンプル数１，４９１４９９１，９９６概念４２３６４３概念組み合せ８２５９９３語彙（前処理後）７２９（５３４）５０９（３６５）８０７（５８９） ───────────────────────────────────

【００９４】ここで、クローズドテストとは、決定木を
生成する際に用いたものと同じデータセットを使って評
価を行う実験のことである。オープンテストとは、決定
木を生成する際には用いなかったデータセットを使って
評価を行う実験のことである。また、前処理とは、入力
文に対する決定木のトレース処理を行う前に、入力文に
対してなんらかの加工処理を行うことを意味する。

【００９５】実験は、概念テストを用いることによる組
み合わせ制約の効果を確かめるため、（Ｉ）本実施形態
の手法（ＤＴｃｐｔ）の他に、（II）発話の特徴のうち
の（ａ）単語活用形及び（ｂ）単語標準形のみで概念を
独立に推定する決定木（ＤＴｎｃｐｔ）を用いた手法、
及び、（III）発話の特徴の上記（ａ），（ｂ）のみで
組み合わせを１クラスとして分類する決定木（ＤＴａｌ
ｌ）を用いた手法の３手法を評価した。ＤＴｃｐｔ及び
ＤＴｎｃｐｔでは、概念を、クローズド概念４２種類の
みで構成される定義組み合わせ６９５種類へ復号化して
おり、オープンテストでの組み合わせ推定精度は最良で
９９．８である。一方、ＤＴａｌｌでは、クローズドセ
ットにある８２種類の組み合わせに直接分類するため、
１１種類のオープン組み合わせは推定することができな
い。そのため、オープンテストでの組み合わせ推定精度
は最良で９７．８である。概念タグ（組み合わせ概念）
の推定精度を表１９に示す。オープンテストにおける本
実施形態の手法（ＤＴｃｐｔ）の正解率は８３．４であ
り、ＤＴｎｃｐｔ、ＤＴａｌｌと比較して高い推定精度
を得ることができた。また、このときの概念単独での誤
り傾向を表２０に示す。本実施形態の手法で脱落誤りが
大きく減少しているのは（改善率２１．７）、組み合わ
せにおける共起情報が有効に抽出・利用されたと結果と
推察される。しかしながら、挿入誤りに関しては効果は
認められる（改善率１２．３）。

【００９６】

【表１９】組み合わせ推定精度 ─────────────────────────────────── 正解率（％）ＤＴａｌｌＤＴｎｃｐｔＤＴｃｐｔ ─────────────────────────────────── オープン７７．４８１．４８３．４クローズド９７．４９９．５９９．１ ───────────────────────────────────

【００９７】

【表２０】誤り傾向（オープンテスト） ─────────────────────────────────── 誤り数ＤＴｎｃｐｔＤＴｃｐｔ改善率 ─────────────────────────────────── 挿入誤り１１４１００１２．３％脱落誤り１２０９４２１．７％ ───────────────────────────────────

【００９８】以上説明したように、本実施形態によれ
ば、自然発話における組み合わせ制約を持つ概念の推定
において、互いの推定結果を動的に利用する決定木を用
いて自然言語理解装置３０を構成したので、概念を独立
に推定する手法、組み合わせ概念を一括して推定する手
法と比較して、より高い推定精度を得ることができる。
従って、従来技術に比較して頑健にかつ正確に音声理解
を行うことができ、適切な中間言語表現を出力すること
ができる自然言語理解装置３０及び、自然言語理解シス
テムを提供することができる。

【００９９】

【発明の効果】以上詳述したように、本発明に係る請求
項１記載の自然言語理解装置によれば、自然発話文に含
まれる発話行為に依存する制約と、自然発話文に含まれ
る意味的な概念の間での組み合わせに依存する制約とを
記憶する第１の記憶装置と、自然発話文の単語列のテキ
ストデータからなる学習データに基づいて、上記第１の
記憶装置に格納された制約を参照して、自然発話文の特
徴として単語活用形と単語標準形と概念とを用いて、自
然発話文に含まれる意味的な複数の概念及び概念の組み
合わせがそれぞれ存在するか否かを決定するための第１
の決定木と、発話行為が存在するか否かを決定するため
の第２の決定木とをそれぞれ、ｙｅｓ／ｎｏ／未知の三
分木の形式、及びｙｅｓ／ｎｏの二分木の形式で生成す
る生成手段と、入力される自然発話文の単語列のテキス
トデータに対して、上記生成手段によって生成された第
１の決定木を用いて概念又は概念の組み合わせが存在す
るか否かを決定するとともに、上記生成手段によって生
成された第２の決定木を用いて発話行為が存在するか否
かを決定して決定結果を出力する第１の決定手段と、発
話行為と、複数の概念及び概念の組み合わせとに対応す
る複数の引数名を記憶する第２の記憶装置と、自然発話
文における部分文を解析するための部分文解析規則とそ
れから生成される引数値とを記憶する第３の記憶装置
と、上記第１の決定手段から出力される発話行為、概念
又は概念の組み合わせに基づいて、上記第２の記憶装置
に記憶された引数名を列挙し、列挙した引数名に対応す
る上記第３の記憶装置内の部分文解析規則を用いて構文
解析して、使用した部分文解析規則の対応する引数値を
並べることにより、上記入力される自然発話文に対応す
る引数値を中間言語表現で出力する第２の決定手段とを
備える。従って、自然発話における組み合わせ制約を持
つ概念の推定において、互いの推定結果を動的に利用す
る決定木を用いて自然言語理解装置を構成したので、概
念を独立に推定する手法、組み合わせ概念を一括して推
定する手法と比較して、より高い推定精度を得ることが
できる。それ故、従来技術に比較して頑健にかつ正確に
音声理解を行うことができ、適切な中間言語表現を出力
することができる自然言語理解装置を提供することがで
きる。

【０１００】また、請求項２記載の自然言語理解システ
ムによれば、請求項１記載の自然言語理解装置と、自然
発話の発声音声を音声認識して、音声認識結果のテキス
トデータを上記自然言語理解装置に出力する音声認識手
段とを備える。従って、自然発話における組み合わせ制
約を持つ概念の推定において、互いの推定結果を動的に
利用する決定木を用いて自然言語理解装置を構成したの
で、概念を独立に推定する手法、組み合わせ概念を一括
して推定する手法と比較して、より高い推定精度を得る
ことができる。それ故、従来技術に比較して頑健にかつ
正確に音声理解を行うことができ、適切な中間言語表現
を出力することができる自然言語理解装置を提供するこ
とができる。また、自然発話の発声音声を音声認識し
て、その内容を高精度で理解できる。

【０１０１】また、請求項３記載の自然言語理解システ
ムによれば、請求項１記載の自然言語理解装置と、上記
第２の決定手段から出力される上記入力される自然発話
文に対応する中間言語表現の引数値に基づいて、上記入
力される自然発話文を別の言語に翻訳して翻訳結果を出
力する翻訳手段とを備える。従って、自然発話における
組み合わせ制約を持つ概念の推定において、互いの推定
結果を動的に利用する決定木を用いて自然言語理解装置
を構成したので、概念を独立に推定する手法、組み合わ
せ概念を一括して推定する手法と比較して、より高い推
定精度を得ることができる。それ故、従来技術に比較し
て頑健にかつ正確に音声理解を行うことができ、適切な
中間言語表現を出力することができる自然言語理解装置
を提供することができる。また、自然言語理解装置から
の中間言語表現に基づいて別の言語に高精度で翻訳でき
る。

【０１０２】さらに、請求項４記載の自然言語理解シス
テムによれば、請求項２記載の自然言語理解システムに
おいて、上記第２の決定手段から出力される上記入力さ
れる自然発話文に対応する中間言語表現の引数値に基づ
いて、上記入力される自然発話文を別の言語に翻訳して
翻訳結果を出力する翻訳手段をさらに備える。従って、
自然発話における組み合わせ制約を持つ概念の推定にお
いて、互いの推定結果を動的に利用する決定木を用いて
自然言語理解装置を構成したので、概念を独立に推定す
る手法、組み合わせ概念を一括して推定する手法と比較
して、より高い推定精度を得ることができる。それ故、
従来技術に比較して頑健にかつ正確に音声理解を行うこ
とができ、適切な中間言語表現を出力することができる
自然言語理解装置を提供することができる。また、自然
発話の発声音声を音声認識して、自然言語理解装置から
の中間言語表現に基づいて別の言語に高精度で翻訳でき
る。

【０１０３】また、請求項５記載の自然言語理解システ
ムによれば、請求項１記載の自然言語理解装置と、上記
第２の決定手段から出力される上記入力される自然発話
文に対応する中間言語表現の引数値に応答して、上記中
間言語表現に含まれる検索条件に基づいて、所定のデー
タベースを検索して、上記検索条件を満たすデータを獲
得し、そのデータを出力するとともに、そのデータに対
応する処理を実行する実行手段とを備える。従って、自
然発話における組み合わせ制約を持つ概念の推定におい
て、互いの推定結果を動的に利用する決定木を用いて自
然言語理解装置を構成したので、概念を独立に推定する
手法、組み合わせ概念を一括して推定する手法と比較し
て、より高い推定精度を得ることができる。それ故、従
来技術に比較して頑健にかつ正確に音声理解を行うこと
ができ、適切な中間言語表現を出力することができる自
然言語理解装置を提供することができる。また、自然言
語理解装置からの中間言語表現に基づいてデータベース
を高精度で検索して対応する処理を実行することができ
る。

【０１０４】さらに、請求項６記載の自然言語理解シス
テムによれば、請求項２記載の自然言語理解システムに
おいて、上記第２の決定手段から出力される上記入力さ
れる自然発話文に対応する中間言語表現の引数値に応答
して、上記中間言語表現に含まれる検索条件に基づい
て、所定のデータベースを検索して、上記検索条件を満
たすデータを獲得し、そのデータを出力するとともに、
そのデータに対応する処理を実行する実行手段をさらに
備える。従って、自然発話における組み合わせ制約を持
つ概念の推定において、互いの推定結果を動的に利用す
る決定木を用いて自然言語理解装置を構成したので、概
念を独立に推定する手法、組み合わせ概念を一括して推
定する手法と比較して、より高い推定精度を得ることが
できる。それ故、従来技術に比較して頑健にかつ正確に
音声理解を行うことができ、適切な中間言語表現を出力
することができる自然言語理解装置を提供することがで
きる。また、自然発話の発声音声を音声認識して、自然
言語理解装置からの中間言語表現に基づいてデータベー
スを高精度で検索して対応する処理を実行することがで
きる。

【図面の簡単な説明】

【図１】本発明に係る一実施形態である自然言語理解
装置３０を備えた自然言語理解システムの構成を示すブ
ロック図である。

【図２】図１の音声認識装置１０の構成を示すブロッ
ク図である。

【図３】図２の音声認識装置における単語仮説絞込部
６の処理を示すタイミングチャートである。

【図４】図１の決定木生成処理部２１によって生成さ
れた概念推定用決定木の一例を示す図である。

【図５】図１の決定木生成処理部２１によって実行さ
れる決定木生成処理の第１の部分を示すフローチャート
である。

【図６】図１の決定木生成処理部２１によって実行さ
れる決定木生成処理の第２の部分を示すフローチャート
である。

【図７】図１の発話行為と組み合わせ概念決定部２３
によって実行される組み合わせ概念決定処理を示すフロ
ーチャートである。

【図８】図７のサブルーチンである概念決定木のトレ
ース処理を示すフローチャートである。

【図９】図８のサブルーチンである子ノード指示変更
処理を示すフローチャートである。

【図１０】図８のサブルーチンである入力文テスト処
理を示すフローチャートである。

【図１１】図１の引数決定部２４によって実行される
引数決定処理を示すフローチャートである。

【図１２】図１の自然言語翻訳部２５によって実行さ
れる自然言語翻訳処理を示すフローチャートである。

【符号の説明】

１…マイクロホン、２…特徴抽出部、３，５…バッファメモリ、４…単語照合部、６…単語仮説絞込部、１１…音素ＨＭＭ、１２…単語辞書、１３…統計的言語モデル、２０…自然言語理解システム、２１…決定木生成処理部、２２…中間言語生成部、２３…発話行為と組み合わせ概念決定部、２４…引数決定部、２５…自然言語翻訳部、２６…プリンタ、２７…ＣＲＴディスプレイ、３０…自然言語理解装置、３１…学習データメモリ、３２…単語辞書メモリ、３３…発話行為と組み合わせ概念メモリ、３４…決定木メモリ、３５…引数名メモリ、３６…引数値生成規則メモリ、３７…文テンプレートメモリ、３８…部分文生成規則メモリ、４０…パーソナルコンピュータ、４１…ＣＲＴディスプレイ、４２…プリンタ。

───────────────────────────────────────────────────── フロントページの続き (72)発明者匂坂芳典京都府相楽郡精華町大字乾谷小字三平谷５番地株式会社エイ・ティ・アール音声翻訳通信研究所内 (56)参考文献特開平２−61769（ＪＰ，Ａ) 特開平８−329082（ＪＰ，Ａ) 特開平８−146990（ＪＰ，Ａ) 特開平９−305404（ＪＰ，Ａ) ＣａｒｄｉｅＣ．，”ＡＣａｓｅ −ＢａｓｅｄＡｐｐｒｏａｃｈｔｏＫｎｏｗｌｅｄｇｅＡｃｑｕｉｓｉｔｉｏｎｆｏｒＤｏｍａｉｎ−ＳｐｅｃｉｆｉｃＳｅｎｔｅｎｃｅＡｎａｌｙｓｉｓ”，ＰｒｏｃｅｅｄｉｎｇｓｏｆｔｈｅＥｌｅｖｅｎｔｈＮａｔｉｏｎａｌＣｏｎｆｅｒｅｎｃｅｏｎＡｒｔｉｆｉｃｉａｌＩｎｔｅｌｌｉｇｅｎｃｅ，ｐ．798−ｐ. 803（1993) ＫｕｈｎＲ．，ＭｏｒｉＲ. Ｄ．，”ＴｈｅＡｐｐｌｉｃａｔｉｏｎｏｆＳｅｍａｎｔｉｃＣｌａｓｓｉｆｉｃａｔｉｏｎＴｒｅｅｓｔｏＮａｔｕｒａｌＬａｎｇｕａｇｅＵｎｄｅｒｓｔａｎｄｉｎｇ”，ＩＥＥＥＴｒａｎｓａｃｔｉｏｎｓｏｎＰａｔｔｅｒｎＡｎａｌｙｓｉｓａｎｄＭａｃｈｉｎｅＩｎｔｅｌｌｉｇｅｎｃｅ，Ｖｏｌ．17，Ｎｏ．５, ｐ．449−ｐ．460（1995) (58)調査した分野(Int.Cl.⁷，ＤＢ名) G10L 15/00 G06F 17/20 - 17/28 ＪＩＣＳＴファイル（ＪＯＩＳ)

Claims

(57)【特許請求の範囲】

【請求項１】自然発話文に含まれる発話行為に依存す
る制約と、自然発話文に含まれる意味的な概念の間での
組み合わせに依存する制約とを記憶する第１の記憶装置
と、自然発話文の単語列のテキストデータからなる学習デー
タに基づいて、上記第１の記憶装置に格納された制約を
参照して、自然発話文の特徴として単語活用形と単語標
準形と概念とを用いて、自然発話文に含まれる意味的な
複数の概念及び概念の組み合わせがそれぞれ存在するか
否かを決定するための第１の決定木と、発話行為が存在
するか否かを決定するための第２の決定木とをそれぞ
れ、ｙｅｓ／ｎｏ／未知の三分木の形式、及びｙｅｓ／
ｎｏの二分木の形式で生成する生成手段と、入力される自然発話文の単語列のテキストデータに対し
て、上記生成手段によって生成された第１の決定木を用
いて概念又は概念の組み合わせが存在するか否かを決定
するとともに、上記生成手段によって生成された第２の
決定木を用いて発話行為が存在するか否かを決定して決
定結果を出力する第１の決定手段と、発話行為と、複数の概念及び概念の組み合わせとに対応
する複数の引数名を記憶する第２の記憶装置と、自然発話文における部分文を解析するための部分文解析
規則とそれから生成される引数値とを記憶する第３の記
憶装置と、上記第１の決定手段から出力される発話行為、概念又は
概念の組み合わせに基づいて、上記第２の記憶装置に記
憶された引数名を列挙し、列挙した引数名に対応する上
記第３の記憶装置内の部分文解析規則を用いて構文解析
して、使用した部分文解析規則の対応する引数値を並べ
ることにより、上記入力される自然発話文に対応する引
数値を中間言語表現で出力する第２の決定手段とを備え
たことを特徴とする自然言語理解装置。
【請求項２】請求項１記載の自然言語理解装置と、自然発話の発声音声を音声認識して、音声認識結果のテ
キストデータを上記自然言語理解装置に出力する音声認
識手段とを備えたことを特徴とする自然言語理解システ
ム。
【請求項３】請求項１記載の自然言語理解装置と、上記第２の決定手段から出力される上記入力される自然
発話文に対応する中間言語表現の引数値に基づいて、上
記入力される自然発話文を別の言語に翻訳して翻訳結果
を出力する翻訳手段とを備えたことを特徴とする自然言
語理解システム。
【請求項４】請求項２記載の自然言語理解システムに
おいて、上記第２の決定手段から出力される上記入力される自然
発話文に対応する中間言語表現の引数値に基づいて、上
記入力される自然発話文を別の言語に翻訳して翻訳結果
を出力する翻訳手段をさらに備えたことを特徴とする自
然言語理解システム。
【請求項５】請求項１記載の自然言語理解装置と、上記第２の決定手段から出力される上記入力される自然
発話文に対応する中間言語表現の引数値に応答して、上
記中間言語表現に含まれる検索条件に基づいて、所定の
データベースを検索して、上記検索条件を満たすデータ
を獲得し、そのデータを出力するとともに、そのデータ
に対応する処理を実行する実行手段とを備えたことを特
徴とする自然言語理解システム。
【請求項６】請求項２記載の自然言語理解システムに
おいて、上記第２の決定手段から出力される上記入力される自然
発話文に対応する中間言語表現の引数値に応答して、上
記中間言語表現に含まれる検索条件に基づいて、所定の
データベースを検索して、上記検索条件を満たすデータ
を獲得し、そのデータを出力するとともに、そのデータ
に対応する処理を実行する実行手段をさらに備えたこと
を特徴とする自然言語理解システム。