JP4724377B2

JP4724377B2 - 自然言語理解（ＮＬＵ）システムにおける規則ベース文法に関するスロットおよび前終端記号（ｐｒｅｔｅｒｍｉｎａｌ）に関する統計モデル

Info

Publication number: JP4724377B2
Application number: JP2004130332A
Authority: JP
Inventors: イェイワン; アセロアレハンドロ
Original assignee: Microsoft Corp
Current assignee: Microsoft Corp
Priority date: 2003-05-01
Filing date: 2004-04-26
Publication date: 2011-07-13
Anticipated expiration: 2024-04-26
Also published as: KR101120858B1; US20040220809A1; DE602004030635D1; ATE492876T1; EP1475778A1; CN1542736B; US7603267B2; CN1542736A; EP1475778B1; JP2005115328A; US20040220797A1; KR20040094645A

Description

本発明は、文法のオーサリングに関する。より具体的には、本発明は、規則ベース文法および統計モデルを使用するＮＬＵシステムの使用およびオーサリングに関する。

音声使用可能アプリケーションおよびサービスの開発を容易にするために、現在、意味ベースの堅固な理解システムが開発中である。こうしたシステムは、会話や研究のシステムで幅広く使用されている。ただし、従来の開発者が会話システムを実施する際に使用するのには、特に実用的なものではない。こうした実施は、ドメイン（ｄｏｍａｉｎ）固有の文法を手作業で開発することに、かなりの部分で依拠している。このタスクはかなり時間のかかる、エラーが生じやすいものであり、ドメインについてのかなりの専門知識を必要とする。

音声使用可能アプリケーションおよびサービスの開発を進めるために、例証ベース文法のオーサリングツールが導入されている。このツールは、ＳＧＳｔｕｄｉｏとして知られている（例えば、非特許文献１および２参照）。このツールは、多くの異なる従来の情報源を利用することによって、文法の開発をきわめて容易にするものである。また、言語知識の少ない一般の開発者でも、音声言語理解に関する意味文法を構築できるようにするものである。このシステムは、相対的に高品質の意味文法を、少ないデータで半自動的に生成するのを容易にする。さらにこのツールは、文法の開発に関連する作業を大幅に軽減するだけでなく、異なるドメインにおける理解の正確さも向上させる。

Y. Wang and A. Acero, GRAMMAR LEARNING FOR SPOKEN LANGUAGE UNDERSTANDING, IEEE Workshop on Automatic Speech Recognition and Understanding, Madonna D. Campiglio Italy, 2001 Y. Wang and A. Acero, EVALUATION OF SPOKEN LANGUAGE GRAMMAR LEARINIG IN ATIS DOMAIN, Proceedings of ICASSP, Orlando, FL 2002

しかしながら、ＮＬＵシステムにおける完全に規則ベースの文法は、依然として堅固さに欠け、もろさが見られる場合がある。

ＮＬＵシステムは、スキーマ内の規則ベース文法に関するスロットおよび前終端記号に関する統計モデルを含む。トレーニングシステムも提供される。

本発明は、自然言語理解（ＮＬＵ）システムに対処するものである。より具体的には、本発明は、規則ベース文法および統計モデルを含むＮＬＵシステムに対処するものである。トレーニングシステムも提供される。ただし、本発明について詳細に論じる前に、本発明を使用可能な環境の一例について論じる。

図１は、本発明を実施することのできる好適なコンピューティングシステム環境の一例を示す図である。コンピューティングシステム環境１００は、好適なコンピューティング環境の一例に過ぎず、本発明の使用または機能の範囲に関して、どんな制限をも示唆することを意図するものではない。さらに、コンピューティング環境１００は、例示的オペレーティング環境１００に示された構成要素のいずれか１つまたは組合せに関する、どんな依存関係または要件としても解釈されるべきではない。

本発明は、多数の他の汎用または特定用途向けコンピューティングシステム環境または構成でも、動作可能である。本発明と共に使用するのに好適な、よく知られたコンピューティングシステム、環境、および／または構成の例には、パーソナルコンピュータ、サーバコンピュータ、ハンドヘルドまたはラップトップデバイス、マルチプロセッサシステム、マイクロプロセッサベースシステム、セットトップボックス、プログラム可能大衆消費電子製品、ネットワークＰＣ、ミニコンピュータ、メインフレームコンピュータ、上記システムまたはデバイスのいずれかを含む分散コンピューティング環境などが含まれるが、これらに限定されるものではない。

本発明は、コンピュータによって実行される、プログラムモジュールなどのコンピュータ実行可能命令の一般的なコンテキストで説明することができる。一般に、プログラムモジュールには、特定のタスクを実行するか、または特定の抽象データ型を実施する、ルーチン、プログラム、オブジェクト、構成要素、データ構造などが含まれる。本発明は、通信ネットワークを介してリンクされたリモート処理デバイスによってタスクが実行される、分散コンピューティング環境でも実施可能である。分散コンピューティング環境では、プログラムモジュールは、メモリ記憶デバイスを含む、ローカルおよびリモートの両方のコンピュータ記憶媒体内に位置することができる。

図１を参照すると、本発明を実施するための例示的システムには、コンピュータ１１０の形態の汎用コンピューティングデバイスが含まれる。コンピュータ１１０の構成要素には、処理ユニット１２０、システムメモリ１３０、および、システムメモリを含む様々なシステム構成要素を処理ユニット１２０に結合するシステムバス１２１が含まれるが、これらに限定されるものではない。システムバス１２１は、様々なバスアーキテクチャのいずれかを使用する、メモリバスまたはメモリコントローラ、周辺バス、およびローカルバスを含む、いくつかのタイプのバス構造のうちのいずれかであってよい。例を挙げると、こうしたアーキテクチャには、ＩＳＡ（ＩｎｄｕｓｔｒｙＳｔａｎｄａｒｄＡｒｃｈｉｔｅｃｔｕｒｅ）バス、ＭＣＡ（ＭｉｃｒｏＣｈａｎｎｅｌＡｒｃｈｉｔｅｃｔｕｒｅ）バス、ＥＩＳＡ（ＥｎｈａｎｃｅｄＩＳＡ）バス、ＶＥＳＡ（ＶｉｄｅｏＥｌｅｃｔｒｏｎｉｃｓＳｔａｎｄａｒｄｓＡｓｓｏｃｉａｔｉｏｎ）ローカルバス、およびメザニンバスとしても知られるＰＣＩ（ＰｅｒｉｐｈｅｒａｌＣｏｍｐｏｎｅｎｔＩｎｔｅｒｃｏｎｎｅｃｔ）バスが含まれるが、これらに限定されるものではない。

コンピュータ１１０は、一般的には様々なコンピュータ読取り可能媒体を含む。コンピュータ読取り可能媒体は、コンピュータ１１０がアクセス可能な任意の使用可能媒体であってよく、揮発性および不揮発性、着脱可能および着脱不可の、両方の媒体を含む。例を挙げると、コンピュータ読取り可能媒体はコンピュータ記憶媒体および通信媒体を含むことができるが、これらに限定されるものではない。コンピュータ記憶媒体には、コンピュータ読取り可能命令、データ構造、プログラムモジュール、または他のデータなどの情報を記憶するための任意の方法または技術で実施される、揮発性および不揮発性、着脱可能および着脱不可の、両方の媒体が含まれる。コンピュータ記憶媒体には、ＲＡＭ、ＲＯＭ、ＥＥＰＲＯＭ、フラッシュメモリまたは他のメモリ技術、ＣＤ−ＲＯＭ、デジタル多用途ディスク（ＤＶＤ）または他の光ディスクストレージ、磁気カセット、磁気テープ、磁気ディスクストレージまたは他の磁気ストレージデバイス、あるいは、所望の情報を記憶するために使用可能でありコンピュータ１１０によってアクセス可能な任意の他の媒体が含まれるが、これらに限定されるものではない。通信媒体は、一般的には、搬送波または他の移送メカニズムなどの変調データ信号で、コンピュータ読取り可能命令、データ構造、プログラムモジュール、または他のデータを具体化するものであり、任意の情報送達媒体を含む。「変調データ信号」という用語は、信号の特徴のうちの１つまたは複数を、信号内の情報を符号化するような形で設定または変更した信号を意味する。例を挙げると、通信媒体には、有線ネットワークまたは直接有線接続などの有線媒体、ならびに音波、ＦＲ、赤外線、および他の無線媒体などの無線媒体が含まれるが、これらに限定されるものではない。上記のうちのいずれかの組合せも、コンピュータ読取り可能媒体の範囲に含まれるものとする。

システムメモリ１３０には、読取り専用メモリ（ＲＯＭ）１３１およびランダムアクセスメモリ（ＲＡＭ）１３２などの、揮発性および／または不揮発性メモリの形のコンピュータ記憶媒体が含まれる。起動時などにコンピュータ１１０内の要素間での情報の転送を助ける基本ルーチンを含む、ＢＩＯＳ（ｂａｓｉｃｉｎｐｕｔ／ｏｕｔｐｕｔｓｙｓｔｅｍ）１３３は、通常、ＲＯＭ１３１に格納される。ＲＡＭ１３２には、通常、即時にアクセス可能であり、かつ／または、現在、処理ユニット１２０によってその上で動作中である、データおよび／またはプログラムモジュールが含まれる。例を挙げると、図１には、オペレーティングシステム１３４、アプリケーションプログラム１３５、他のプログラムモジュール１３６、およびプログラムデータ１３７が示されているが、これらに限定されるものではない。

コンピュータ１１０は、他の着脱不可／着脱可能、揮発性／不揮発性のコンピュータ記憶媒体も含むことができる。例を挙げると、図１には、着脱不可の不揮発性磁気媒体からの読取りまたはこれへの書込みを行うハードディスクドライブ１４１、着脱可能の不揮発性磁気ディスク１５２からの読取りまたはこれへの書込みを行う磁気ディスクドライブ１５１、および、ＣＤ−ＲＯＭまたは他の光媒体などの着脱可能の不揮発性光ディスク１５６からの読取りまたはこれへの書込みを行う光ディスクドライブ１５５が示されている。例示的オペレーティング環境で使用可能な他の着脱可能／着脱不可、揮発性／不揮発性のコンピュータ記憶媒体には、磁気テープカセット、フラッシュメモリカード、デジタル多用途ディスク、デジタルビデオテープ、ソリッドステートＲＡＭ、ソリッドステートＲＯＭなどが含まれるが、これらに限定されるものではない。ハードディスクドライブ１４１は、通常、インターフェース１４０などの着脱不可のメモリインターフェースを介してシステムバス１２１に接続され、磁気ディスクドライブ１５１および光ディスクドライブ１５５は、通常、インターフェース１５０などの着脱可能のメモリインターフェースによってシステムバス１２１に接続される。

上述し、図１に示した、ドライブおよびそれらに関連付けられたコンピュータ記憶媒体は、コンピュータ読取り可能命令、データ構造、プログラムモジュール、および他のデータのストレージをコンピュータ１１０に提供する。たとえば図１では、ハードディスクドライブ１４１が、オペレーティングシステム１４４、アプリケーションプログラム１４５、他のプログラムモジュール１４６、およびプログラムデータ１４７を格納しているように示されている。これらの構成要素は、オペレーティングシステム１３４、アプリケーションプログラム１３５、他のプログラムモジュール１３６、およびプログラムデータ１３７と、同じであるかまたは異なってもよいことに留意されたい。オペレーティングシステム１４４、アプリケーションプログラム１４５、他のプログラムモジュール１４６、およびプログラムデータ１４７には、少なくとも、それらが異なるコピーであることを示すために、ここでは異なる番号が与えられている。

ユーザは、キーボード１６２、マイクロフォン１６３、およびマウス、トラックボール、またはタッチパッドなどのポインティングデバイス１６１を介して、コマンドおよび情報をコンピュータ１１０に入力することができる。他の入力デバイス（図示せず）には、ジョイスティック、ゲームパッド、衛星放送用パラボラアンテナ、スキャナなどが含まれる。これらおよび他のデバイスは、システムバスに結合されたユーザ入力インターフェース１６０を介して、処理ユニット１２０に接続されることが多いが、パラレルポート、ゲームポート、またはユニバーサルシリアルバス（ＵＳＢ）などの他のインターフェースおよびバス構造によって接続することもできる。モニタ１９１または他のタイプのディスプレイデバイスも、ビデオインターフェース１９０などのインターフェースを介して、システムバス１２１に接続される。コンピュータは、モニタに加えて、出力周辺インターフェース１９５を介して接続することのできる、スピーカ１９７およびプリンタ１９６などの他の周辺出力デバイスを含むこともできる。

コンピュータ１１０は、リモートコンピュータ１８０などの１つまたは複数のリモートコンピュータへの論理接続を使用する、ネットワーク化環境で動作可能である。リモートコンピュータ１８０は、パーソナルコンピュータ、ハンドヘルドデバイス、サーバ、ルータ、ネットワークＰＣ、ピアデバイス、または他の共通ネットワークノードであってよく、典型的には、コンピュータ１１０に関して上記で述べた要素の多くまたはすべてを含む。図１に示された論理接続には、ローカルエリアネットワーク（ＬＡＮ）１７１およびワイドエリアネットワーク（ＷＡＮ）１７３が含まれるが、他のネットワークを含むこともできる。こうしたネットワーキング環境は、オフィス、企業規模のコンピュータネットワーク、イントラネット、およびインターネットでよく見られる。

ＬＡＮネットワーキング環境で使用される場合、コンピュータ１１０は、ネットワークインターフェースまたはアダプタ１７０を介してＬＡＮ１７１に接続される。ＷＡＮネットワーキング環境で使用される場合、コンピュータ１１０は、通常、インターネットなどのＷＡＮ１７３を介して通信を確立するためのモデム１７２または他の手段を含む。モデムは内蔵型でも外付け型でもよく、ユーザ入力インターフェース１６０または他の適切なメカニズムを介して、システムバス１２１に接続することができる。ネットワーク化された環境では、コンピュータ１１０に関して示されたプログラムモジュールまたはその一部を、リモートメモリ記憶デバイスに格納することができる。例を挙げると、図１には、リモートアプリケーションプログラム１８５がリモートコンピュータ１８０上に常駐しているように示されているが、これに限定されるものではない。図示されたネットワーク接続は例示的なものであって、コンピュータ間の通信リンクを確立する他の手段も使用可能であることを理解されよう。

本発明は、図１に関して記載したようなコンピュータシステム上で実行可能であることに留意されたい。ただし本発明は、サーバ、メッセージ処理専用コンピュータ、または、本発明の様々な部分が分散コンピューティングシステムの様々な部分で実行される分散型システム上で実行可能である。

図２Ａは、本発明の一実施形態に従ったモデルオーサリングシステム２００を示すブロック図である。モデルオーサリングシステム２００には、モデルオーサリング構成要素２０２およびオプションのユーザインターフェース２０４が含まれる。図２Ａは、モデルオーサリング構成要素２０２が、スキーマ２０６、トレーニング例テキスト文字列および注釈（ｔｒａｉｎｉｎｇｅｘａｍｐｌｅｔｅｘｔｓｔｒｉｎｇｓａｎｄａｎｎｏｔａｔｉｏｎｓ）２０８のセット、オプションの文法ライブラリ２０９を入力として受け取り、規則ベース文法（文脈自由文法（ｃｏｎｔｅｘｔｆｒｅｅｇｒａｍｍａｒ）またはＣＦＧなど）２１０を出力することも示している。オプションの文法ライブラリ２０９は、アプリケーションデータベースから取得可能な、日付および時刻などのドメインに無関係の概念、ならびに都市名、航空会社などのドメインに依存した概念に関する定義を含む。

システム２００の詳細なオペレーションについては、以下でより詳細に述べる。ただし、簡潔に言えば、ユーザは、モデルオーサリング構成要素２０２に、スキーマ２０６およびトレーニング例テキスト文字列２０８を提供する。これは、オプションのユーザインターフェース２０４または何らかの他のユーザ入力メカニズム、あるいは、自動化手段を介して実行することができる。モデルオーサリング構成要素２０２は入力を受け取り、その入力に基づいて、規則ベース文法２１０を生成する。規則ベース文法の一例は、コンピュータが入力をテキストの意味表現にマッピングできるようにする、文脈自由文法（またはＣＦＧ）である。

スキーマ２０６は、例示的に言えば、モデル化されるドメインの意味記述である。スキーマの一例が図２Ｂに示されている。図２Ｂは、開発者がシステム２００に入力することのできる、かなり簡略化されたスキーマ２１２を示す。スキーマ２１２は、様々な都市へ出発し様々な都市から到着するフライト、ならびに様々な出発および到着時刻を有するフライトを示すための、ユーザからの入力に関する様々なテキスト文字列の意味を表すスキーマである。スキーマ２１２は、フライト表示コマンド（ＳｈｏｗＦｌｉｇｈｔ）がスロットとしてＦｌｉｇｈｔに関する意味クラスを含むことを示す。さらにスキーマ２１２は、Ｆｌｉｇｈｔに関する意味クラスが、出発時刻、到着時刻、出発都市、および到着都市に対応する４つのスロットを有することを示すように、さらに詳細に示す。

モデルオーサリング構成要素２０２は、スキーマ２１２から、図２Ｃに示された規則セットを生成することができる。規則１は、ＳｈｏｗＦｌｉｇｈｔ文が、コマンド部分ＳｈｏｗＦｌｉｇｈｔＣｍｄを常に有し、その後にプロパティ部分ＳｈｏｗＦｌｉｇｈｔＰｒｏｐｅｒｔｉｅｓが続くことを示す。

規則２は、ＳｈｏｗＦｌｉｇｈｔＰｒｏｐｅｒｔｉｅｓ部分の中に、１つまたは複数のプロパティを含むことができることを示す。たとえば、規則２は、ＳｈｏｗＦｌｉｇｈｔＰｒｏｐｅｒｔｉｅｓ部分が、少なくとも１つのＳｈｏｗＦｌｉｇｈｔＰｒｏｐｅｒｔｙを含み、その後にオプションのＳｈｏｗＦｌｉｇｈｔＰｒｏｐｅｒｔｉｅｓ部分を続けることができることを示す。このＳｈｏｗＦｌｉｇｈｔＰｒｏｐｅｒｔｉｅｓの再帰的定義は、その表現を簡略化し、１つまたは複数のプロパティを有することができるようにするものである。

規則３は、ＳｈｏｗＦｌｉｇｈｔＰｒｏｐｅｒｔｙ部分が、ＳｈｏｗＦｌｉｇｈｔＰｒｅＦｌｉｇｈｔ部分、Ｆｌｉｇｈｔ部分、およびＳｈｏｗＦｌｉｇｈｔＰｏｓｔＦｌｉｇｈｔ部分を含むことを示す。これは、スキーマ内のスロットＦｌｉｇｈｔが、プリアンブルおよびポストアンブルの両方を有することができることを示す。

規則４は、Ｆｌｉｇｈｔはスキーマ内のオブジェクトであり、ＳｈｏｗＦｌｉｇｈｔはコマンドであるため、スキーマ内のオブジェクトＦｌｉｇｈｔがコマンド部分を有さず、プロパティ部分（ＦｌｉｇｈｔＰｒｏｐｅｒｔｉｅｓ）のみを有することを示す。規則５は、ＦｌｉｇｈｔＰｒｏｐｅｒｔｉｅｓ部分が、少なくとも１つのＦｌｉｇｈｔＰｒｏｐｅｒｔｙと、その後に続くオプションのＦｌｉｇｈｔＰｒｏｐｅｒｔｉｅｓとを含むように、再度再帰的に定義されることを示す。

規則６から９は、図２Ｂに示されたスキーマ２１２の４つのスロットに対応する。規則６は、第１のプロパティが、プリアンブル（ＦｌｉｇｈｔＰｒｅＤｅｐａｒｔｕｒｅＣｉｔｙ）が前に付き、ポストアンブル（ＦｌｉｇｈｔＰｏｓｔＤｅｐａｒｔｕｒｅＣｉｔｙ）が後ろに付いた、出発都市スロットを有するように定義する。規則７は、同じ方法で到着都市を定義し、規則８および９は、同様の方法でそれぞれ出発時刻および到着時刻を定義する。

図２Ｃで識別されたすべての規則が、モデルオーサリング構成要素２０２によって、スキーマ２１２から自動的に生成可能であるということは事実であるが、依然として、どの特定の単語が特定の前終端記号（コマンド意味クラス用のコマンド、ならびにスロット用のプリアンブルおよびポストアンブル）に実際にマッピングされるかを示す書き換え規則（ｒｅｗｒｉｔｅｒｕｌｅ）はない。たとえば、「ｐｌｅａｓｅｓｈｏｗｍｅｔｈｅｆｌｉｇｈｔｓ．．．」の句がＳｈｏｗＦｌｉｇｈｔＣｍｄにマッピングされることを示す規則がない。同様に、具体的にどの単語を、たとえばＦｌｉｇｈｔＰｒｅＡｒｒｉｖａｌＣｉｔｙプリアンブルなどにマッピングするかを示す、書き換え規則がない。したがって、開発者は、モデルオーサリング構成要素２０２がこれらの書き換え規則も学習できるように、トレーニング例テキスト文字列および注釈２０８も入力する。

図２Ｄは、例テキスト文字列２１３「ＦｌｉｇｈｔｆｒｏｍＳｅａｔｔｌｅｔｏＢｏｓｔｏｎ」ならびに、テキスト文字列２１３に対応する意味注釈２１４の一例を示す図である。意味注釈２１４は開発者によって提供され、文字列２１３の意味論的意味を示すものである。たとえば意味注釈２１４は、入力テキスト文字列２１３が、それ自体がどちらも都市である２つのスロットを有するスロットＦｌｉｇｈｔを有するＳｈｏｗＦｌｉｇｈｔコマンドに対応することを示す。Ｆｌｉｇｈｔスロット内の２つのスロットは、スロットの名前によってのみ区別される。一方は「Ａｒｒｉｖａｌ」都市と呼ばれ、他方は「Ｄｅｐａｒｔｕｒｅ」都市と呼ばれる。意味注釈２１４は、単語「Ｂｏｓｔｏｎ」を「Ａｒｒｉｖａｌ」都市スロットにマッピングし、単語「Ｓｅａｔｔｌｅ」を「Ｄｅｐａｒｔｕｒｅ」都市スロットにもマッピングする。したがって、モデルオーサリング構成要素２０２は、注釈２１４に基づき、どのスロットが単語「Ｓｅａｔｔｌｅ」および「Ｂｏｓｔｏｎ」にマッピングされているかを知ることができる。

図２Ｃに示された注釈の付けられた例およびテンプレート文法規則から、モデルオーサリング構成要素２０２は、図２Ｅに示された解析ツリー２１６などの、規則ベース文法（またはＣＦＧ）解析ツリーを生成することができる。解析ツリー２１６の第１のレベル２１８（ＳｈｏｗＦｌｉｇｈｔがＳｈｏｗＦｌｉｇｈｔＣｍｄおよびそれに続くＳｈｏｗＦｌｉｇｈｔＰｒｏｐｅｒｔｉｅｓで形成されることを示す部分）は、図２Ｃの規則１から形成される。

第２のレベル２２０（ＳｈｏｗＦｌｉｇｈｔＰｒｏｐｅｒｔｉｅｓがＳｈｏｗＦｌｉｇｈｔＰｒｏｐｅｒｔｙで形成されることを示す部分）は、オプションのＳｈｏｗＦｌｉｇｈｔＰｒｏｐｅｒｔｉｅｓ部分が使用されない規則２から生成される。

次のレベル２２２（ＳｈｏｗＦｌｉｇｈｔＰｒｏｐｅｒｔｙが、ＳｈｏｗＦｌｉｇｈｔＰｒｅＦｌｉｇｈｔおよびそれに続くＦｌｉｇｈｔおよびそれに続くＳｈｏｗＦｌｉｇｈｔＰｏｓｔＦｌｉｇｈｔで形成されることを示す部分）は、図２Ｃの規則３から生成される。

次のレベル２２４（ＦｌｉｇｈｔオブジェクトがＦｌｉｇｈｔＰｒｏｐｅｒｔｉｅｓ部分で形成されることを示す）は、図２Ｃの規則４から生成される。

次のレベル２２６（ＦｌｉｇｈｔＰｒｏｐｅｒｔｉｅｓ部分がＦｌｉｇｈｔＰｒｏｐｅｒｔｙ部分およびそれに続くＦｌｉｇｈｔＰｒｏｐｅｒｔｉｅｓ部分で形成されることを示す部分）は、図２Ｃの規則５から生成される。

次のレベル２２８（ＦｌｉｇｈｔＰｒｏｐｅｒｔｙ部分が、ＦｌｉｇｈｔＰｒｅＤｅｐａｒｔｕｒｅＣｉｔｙおよびそれに続くＣｉｔｙスロットおよびそれに続くＦｌｉｇｈｔＰｏｓｔＤｅｐａｒｔｕｒｅＣｉｔｙポストアンブルで形成されることを示すレベル）は、規則６から生成され、次のレベル２３０（ＦｌｉｇｈｔＰｒｏｐｅｒｔｉｅｓが、ＦｌｉｇｈｔＰｒｅＡｒｒｉｖａｌＣｉｔｙプリアンブル、Ｃｉｔｙスロット、およびＦｌｉｇｈｔＰｏｓｔＡｒｒｉｖａｌＣｉｔｙポストアンブルで形成されることを示すレベル）は、規則７から生成される。

最後に、レベル２２８の下で単語「Ｓｅａｔｔｌｅ」がＣｉｔｙスロットにマッピングされ、レベル２３０の下で単語「Ｂｏｓｔｏｎ」がＣｉｔｙスロットにマッピングされることを示すレベルが、同様にユーザによって入力される意味注釈２１４から生成される。したがって、モデルオーサリング構成要素２０２は、入力文における単語「Ｓｅａｔｔｌｅ」および「Ｂｏｓｔｏｎ」から、ＣＦＧ解析ツリーおよび図２Ｃで生成された規則へのマッピング方法を習得することができる。都市規則は、注釈付きデータの代わりにライブラリ文法（これは次に、ドメイン特有のデータベースからデータを取得することによって構築可能である）からも取得可能であることに留意されたい。

ただし、入力文の中には、依然としてまだツリーにマッピングされていないいくつかの単語がある。これらの単語には、「Ｆｌｉｇｈｔ」、「ｆｒｏｍ」、および「ｔｏ」が含まれる。単語「Ｆｌｉｇｈｔ」および「ｆｒｏｍ」は「Ｓｅａｔｔｌｅ」の前に付けられるため、ＦｌｉｇｈｔＣｍｄ、ＳｈｏｗＦｌｉｇｈｔＰｒｅＦｌｉｇｈｔ、およびＦｌｉｇｈｔＰｒｅＤｅｐａｒｔｕｒｅＣｉｔｙを含む、解析ツリー２１６内の様々な前終端記号にマッピングすることができる。同様に、単語「ｔｏ」は、入力テキスト文字列２１３内の単語「Ｓｅａｔｔｌｅ」と「Ｂｏｓｔｏｎ」との間にあるため、単語「ｔｏ」を、ＦｌｉｇｈｔＰｏｓｔＤｅｐａｒｔｕｒｅＣｉｔｙまたはＦｌｉｇｈｔＰｒｅＡｒｒｉｖａｌＣｉｔｙのいずれかにマッピングすることができる。

単語「ｔｏ」は前置詞であることが知られているため、その後に来るものを変えなければならない。したがって、単語「ｔｏ」を、解析ツリー２１６内のＦｌｉｇｈｔＰｒｅＡｒｒｉｖａｌＣｉｔｙ前終端記号にマッピングすると決定することができる。

ただし、単語「Ｆｌｉｇｈｔ」および「ｆｒｏｍ」が解析ツリー２１６内のどこにあるべきかは、依然として知られていない。また、２つの単語の特定のセグメント化（ｓｅｇｍｅｎｔａｔｉｏｎ）も知られていない。たとえば、一代替形態では、単語「Ｆｌｉｇｈｔ」をＳｈｏｗＦｌｉｇｈｔＣｍｄにマッピング可能であるが、単語「ｆｒｏｍ」はＳｈｏｗＦｌｉｇｈｔＰｒｅＦｌｉｇｈｔにマップされる。その場合、前終端記号ＦｌｉｇｈｔＰｒｅＤｅｐａｒｔｕｒｅＣｉｔｙは空のセットにマッピングされる。

他の代替形態によれば、単語「Ｆｌｉｇｈｔ」および「ｆｒｏｍ」はどちらも「ＳｈｏｗＦｌｉｇｈｔＣｍｄ」にマッピングされ、他の前終端記号ＳｈｏｗＦｌｉｇｈｔＰｒｅＦｌｉｇｈｔおよびＦｌｉｇｈｔＰｒｅＤｅｐａｒｔｕｒｅＣｉｔｙはどちらも空のセットにマッピングされる。

さらに他の代替形態では、「Ｆｌｉｇｈｔ」はＳｈｏｗＦｌｉｇｈｔＣｍｄにマッピングされ、「ｆｒｏｍ」はＦｌｉｇｈｔＰｒｅＤｅｐａｒｔｕｒｅＣｉｔｙにマッピングされるが、残りの前終端記号ＳｈｏｗＦｌｉｇｈｔＰｒｅＦｌｉｇｈｔは空のセットにマッピングされる。

これは、開発者からの追加の情報がない場合にこれまで解決されなかった、セグメント化のあいまいさを表すものである。従来の一部のシステムでは、可能なセグメント化はそれぞれがユーザに表示され、ユーザはそれらセグメント化のうちの１つを選択できるだけであった。

ただし、その結果、いくつかの問題が生じた。第１に、このタイプのユーザとの対話は押し付けがましく、時間の無駄である。また、可能な前終端記号が他にもある場合、および、入力テキスト文字列内に位置合わせされていない単語が他にもある場合、ユーザに示されなければならない可能性の数は劇的に増える。ユーザが選択するためのこうした候補セグメント化をすべて効果的に表示することは、不可能ではないにしても、非常に困難である。さらに、ユーザが選択するためのセグメント化が適切に表示された場合であっても、ユーザはセグメント化でエラーをするか、または同様のテキスト文字列を矛盾してセグメント化することが多い。

一実施形態によれば、セグメント化選択のあいまい性を除去するために、期待値最大化（ｅｘｐｅｃｔａｔｉｏｎｍａｘｉｍｉｚａｔｉｏｎ）（ＥＭ）アルゴリズムが、モデル構成要素２０２のセグメント化あいまい性（ｓｅｇｍｅｎｔａｔｉｏｎａｍｂｉｇｕｉｔｙ）に適用される。ＥＭアルゴリズムは、通常、モデルが観測可能な隠し変数（ｈｉｄｄｅｎｖａｒｉａｂｌｅ）を含む場合に、最尤推定量（ｍａｘｉｍｕｍｌｉｋｅｌｉｈｏｏｄｅｓｔｉｍａｔｏｒ）でモデルパラメータを推定するためのアルゴリズムである。

図３Ａは、モデルオーサリング構成要素２０２をより詳細に示すブロック図である。図３Ａは、モデルオーサリング構成要素２０２が例示的にテンプレート文法生成器３００、セグメント化ＥＭアプリケーション構成要素３０２、およびプルーニング（ｐｒｕｎｉｎｇ）構成要素３０４を含むことを示す。テンプレート文法生成器３００は、スキーマ２０６と、スキーマ２０６内の意味クラスによって（適切なタイプ単一化を介して）参照されるオプションの文法ライブラリ２０９の任意の規則を受け取り、スキーマ２０６およびオプションの文法ライブラリ２０９から習得または収集することのできるすべての規則を含むテンプレート文法を生成する。その後、テンプレート文法は、トレーニング例（ｔｒａｉｎｉｎｇｅｘａｍｐｌｅ）（テキスト文字列およびそれらの注釈）と共に、ＥＭセグメント化構成要素によって入力として受け取られる。ＥＭセグメント化構成要素３０２は、テンプレート文法を使用して、トレーニング例中のセグメント化あいまい性を見つける。その後、構成要素３０２は、セグメント化あいまい性を除去する働きをする。そのあいまい性除去に基づいて、プルーニング構成要素３０４を使用して文法から書き換え規則をプルーニングし、規則ベース文法２１０を提供することができる。

ＥＭセグメント化構成要素３０２のオペレーションをさらに例示するために、図２Ｆおよび２Ｇに例示の表が示されている。図２Ｆは、例示セットを含む表である。その第１は、おそらく単語「ｆｒｏｍ」が、前終端記号ＳｈｏｗＦｌｉｇｈｔＣｍｄまたは前終端記号ＦｌｉｇｈｔＰｒｅＤｅｐａｒｔｕｒｅＣｉｔｙのいずれかにマッピング可能であることを示す。この例は、ＥＭセグメント化構成要素３０２が、「ｆｒｏｍＳｅａｔｔｌｅｔｏＢｏｓｔｏｎ」のような例文から成果を得ることができるものである。第２の例は、単語「Ｆｌｉｇｈｔｆｒｏｍ」が、前終端記号ＳｈｏｗＦｌｉｇｈｔＣｍｄおよびＦｌｉｇｈｔＰｒｅＤｅｐａｒｔｕｒｅＣｉｔｙにマッピング可能であることを示す。この例は、ＥＭセグメント化構成要素３０２が、「ＦｌｉｇｈｔｆｒｏｍＳｅａｔｔｌｅｔｏＢｏｓｔｏｎ」のような例文から成果を得ることができるものである。第３の例は、単語「Ｆｌｉｇｈｔｔｏ」が、前終端記号ＳｈｏｗＦｌｉｇｈｔＣｍｄおよびＦｌｉｇｈｔＰｒｅＡｒｒｉｖａｌＣｉｔｙにマッピング可能であることを示し、これも同様に、ＥＭセグメント化構成要素３０２が「ＦｌｉｇｈｔｔｏＢｏｓｔｏｎｏｎＴｕｅｓｄａｙ」のような例から成果を得ることができるものである。ただし、例のセグメント化はあいまいである。言い換えれば、第１の例にある単語「ｆｒｏｍ」が、前終端記号ＳｈｏｗＦｌｉｇｈｔＣｍｄまたは前終端記号ＦｌｉｇｈｔＰｒｅＤｅｐａｒｔｕｒｅＣｉｔｙにマッピングされるかどうかは、まだわからない。同様に、単語「Ｆｌｉｇｈｔｆｒｏｍ」を、前終端記号ＳｈｏｗＦｌｉｇｈｔＣｍｄとＦｌｉｇｈｔＰｒｅＤｅｐａｒｔｕｒｅＣｉｔｙとの間にマッピングする方法もまだわからない。さらに、単語「Ｆｌｉｇｈｔ」を、可能な前終端記号ＳｈｏｗＦｌｉｇｈｔＣｍｄとＦｌｉｇｈｔＰｒｅＡｒｒｉｖａｌＣｉｔｙとの間にマッピングする方法も、もちろんわからない。

図２Ｇは、ＥＭセグメント化構成要素３０２のオペレーションをさらに示す表である。図３Ｂは、ＥＭセグメント化構成要素３０２のオペレーションを示す流れ図であり、図２Ｆおよび２Ｇと共に説明する。

第１に、ＥＭセグメント化構成要素３０２はすべての可能なセグメント化を列挙する。これは、可能な書き換え規則とラベル表示された、図２Ｇの左の列に示されている。図２Ｇに示された書き換え規則では、前終端記号名を形成する単語の一部は略記されている。したがって、例を挙げると、書き換え規則ＳＦＣｍｄ→εは、ＳｈｏｗＦｌｉｇｈｔＣｍｄ（ＳＦＣｍｄと略記）前終端記号が空のセットにマッピングされる、セグメント化を示す。同様に、書き換え規則ＳＦＣｍｄ→ｆｒｏｍは、単語「ｆｒｏｍ」が前終端記号ＳｈｏｗＦｌｉｇｈｔＣｍｄにマッピングされる、セグメント化を示す。さらに、ＦＰＤＣｉｔｙ→εは、前終端記号ＦｌｉｇｈｔＰｒｅＤｅｐａｒｔｕｒｅＣｉｔｙ（ＦＰＤＣｉｔｙと略記）が空のセットにマッピングされるセグメント化を示し、ＦＰＡＣｉｔｙ→εは、前終端記号ＦｌｉｇｈｔＰｒｅＡｒｒｉｖａｌＣｉｔｙ（ＦＰＡＣｉｔｙと略記）が空のセットにマッピングされるセグメント化を示す。これらの例から、図２Ｇに示された表の書き換え規則部分の他の注記については改めて説明するまでもない。図２Ｆに示された例について、それぞれの可能なセグメント化が列挙されていると言えば十分であろう。

図２Ｆの第１の例から、１つのセグメント化は、単語「ｆｒｏｍ」がＳｈｏｗＦｌｉｇｈｔＣｍｄにマッピングされることを示し、他のセグメント化は、単語「ｆｒｏｍ」がＦｌｉｇｈｔＰｒｅＤｅｐａｒｔｕｒｅＣｉｔｙにマッピングされることを示す。

図２Ｆの第２の例は、いくつかの異なるセグメント化の代替例もサポートしている。たとえば、１つのセグメント化代替例によれば、単語「Ｆｌｉｇｈｔｆｒｏｍ」は、どちらも前終端記号ＳｈｏｗＦｌｉｇｈｔＣｍｄにマッピングされ、前終端記号ＦｌｉｇｈｔＰｒｅＤｅｐａｒｔｕｒｅＣｉｔｙはεにマッピングされる。他のセグメント化代替例では、単語「Ｆｌｉｇｈｔｆｒｏｍ」は、どちらも前終端記号ＦｌｉｇｈｔＰｒｅＤｅｐａｒｔｕｒｅＣｉｔｙにマッピングされ、前終端記号「ＳｈｏｗＦｌｉｇｈｔＣｍｄ」はεにマッピングされる。さらに他の代替例では、単語「Ｆｌｉｇｈｔ」と「ｆｒｏｍ」とは分けられ、その結果、「Ｆｌｉｇｈｔ」が前終端記号ＳｈｏｗＦｌｉｇｈｔＣｍｄにマッピングされ、単語「ｆｒｏｍ」は前終端記号ＦｌｉｇｈｔＰｒｅＤｅｐａｒｔｕｒｅＣｉｔｙにマッピングされる。これらのセグメント化は、それぞれ、図２Ｇに列挙された書き換え規則にも示されている。

第３の例は、第２の例と同様の方法でセグメント化することが可能であって、単語「Ｆｌｉｇｈｔｔｏ」が前終端記号ＳｈｏｗＦｌｉｇｈｔＣｍｄまたは前終端記号ＦｌｉｇｈｔＰｒｅＡｒｒｉｖａｌＣｉｔｙのいずれかにマッピング可能であり、他方の前終端記号はεにマッピングされるか、あるいは、単語「Ｆｌｉｇｈｔｔｏ」を前終端記号ＳｈｏｗＦｌｉｇｈｔＣｍｄとＦｌｉｇｈｔＰｒｅＡｒｒｉｖａｌＣｉｔｙとに分けることが可能である。また、これらのセグメント化も、図２Ｇに示された書き換え規則で表される。

すべての可能なセグメント化の列挙は、図３Ｂの流れ図のブロック３０６で示される。

セグメント化をサポートする書き換え規則がいったん列挙されると、それらにはそれぞれ確率が割り当てられる。始めは、図２Ｇに示されたすべてのセグメント化に同じ確率が割り当てられる。これは、図３Ｂのブロック３０８で示される。

次に、ＥＭセグメント化構成要素３０２は、図２Ｆに示された例の新しい予測カウントの可能なオカレンスに基づいて、列挙された書き換え規則に新しい予測カウントを割り当てる。これはブロック３１０で示される。たとえば、第１の例では、２つの可能なセグメント化があり、一方は単語「ｆｒｏｍ」をＳｈｏｗＦｌｉｇｈｔＣｍｄにマッピングし、前終端記号ＦｌｉｇｈｔＰｒｅＤｅｐａｒｔｕｒｅＣｉｔｙをεにマッピングするものであり、他方はＳｈｏｗＦｌｉｇｈｔＣｍｄをεにマッピングし、単語「ｆｒｏｍ」を前終端記号ＦｌｉｇｈｔＰｒｅＤｅｐａｒｔｕｒｅＣｉｔｙにマッピングするものである。最初の書き換え規則は、前終端記号ＳｈｏｗＦｌｉｇｈｔＣｍｄをε（空のセット）にマッピングすることを述べたものである。したがって、第１の例のセグメント化の半分は、図２Ｇの表に示された第１の書き換え規則をサポートしている。この第１の例から、第１の書き換え規則（ＳｈｏｗＦｌｉｇｈｔＣｍｄ→ε）に、２分の１のカウントが割り当てられる。

上述のように、第２の例は、３つの異なるセグメント化をサポートしており、そのうちの１つは「Ｆｌｉｇｈｔｆｒｏｍ」の両方の単語を前終端記号ＳｈｏｗＦｌｉｇｈｔＣｍｄに、前終端記号ＦｌｉｇｈｔＰｒｅＤｅｐａｒｔｕｒｅＣｉｔｙをεに割り当てるものであり、もう１つは単語「Ｆｌｉｇｈｔ」を前終端記号ＳｈｏｗＦｌｉｇｈｔＣｍｄに、単語「ｆｒｏｍ」を前終端記号ＦｌｉｇｈｔＰｒｅＤｅｐａｒｔｕｒｅＣｉｔｙにマッピングするものであり、最後は、前終端記号ＳｈｏｗＦｌｉｇｈｔＣｍｄをεに、「Ｆｌｉｇｈｔｆｒｏｍ」の両方の単語を前終端記号ＦｌｉｇｈｔＰｒｅＤｅｐａｒｔｕｒｅＣｉｔｙにマッピングするものである。これら３つのセグメント化のうち、１つは、第１の書き換え規則（ＳＦＣｍｄ→ε）をサポートしている。したがって、第２の例から、第１の書き換え規則には３分の１のカウントが割り当てられる。

同様に、第３の例は、３つの可能なセグメント化を有し、そのうちの１つは前終端記号ＳｈｏｗＦｌｉｇｈｔＣｍｄをεにマッピングする。したがって、第３の例から、図２Ｇに示された第１の書き換え規則には、再度、３分の１のカウントが割り当てられる。

この種の分析を使用すると、第２の書き換え規則（ＳＦＣｍｄ→ｆｒｏｍ）は第１の例によってのみサポートされている。したがって、第１の例には２つの可能なセグメント化があり、そのうちの１つは第２の書き換え規則をサポートしているため、第２の書き換え規則（ＳＦＣｍｄ→ｆｒｏｍ）には２分の１のカウントが割り当てられる。

第３の書き換え規則（ＳＦＣｍｄ→Ｆｌｉｇｈｔ）は、図２Ｆに示された第２および第３の例のそれぞれからのセグメント化のうちの１つによってサポートされる。したがって、それらの例はそれぞれ３つの可能なセグメント化を有するため、第３の書き換え規則（ＳＦＣｍｄ→Ｆｌｉｇｈｔ）には、各例から３分の１のカウントが割り当てられる。

ＥＭセグメント化構成要素３０２は、このように、図２Ｇに列挙されたそれぞれの書き換え規則にカウントを割り当て、それらのカウントが図２Ｇに示された表の第２列に示されている。カウントはすべて、共通の分母を有するように変換され、各前終端記号について確率が得られるように正規化される。言い換えれば、ＳｈｏｗＦｌｉｇｈｔＣｍｄ終端記号の全確率量は、合計すると１でなければならない。したがって、各書き換え規則に関連付けられた確率を得るために、その書き換え規則のカウントに正規化係数を掛ける。

たとえば、前終端記号ＳｈｏｗＦｌｉｇｈｔＣｍｄのカウント合計は３であることがわかる。したがって、第１の書き換え規則（ＳＦＣｍｄ→ε）の確率は７／１８である。同様に、第２の書き換え規則（ＳＦＣｍｄ→ｆｒｏｍ）の確率は３／１８、というようになる。ＥＭセグメント化構成要素３０２は、この確率を得るために、各書き換え規則および各前終端記号のカウントを処理する。

前終端記号ＦＰＤＣｉｔｙの場合、異なるすべての規則にわたるカウントの合計は２であるため、正規化係数は１／２である。最後の前終端記号ＦＰＡＣｉｔｙの場合、カウントは１である（３＊１／３＝１）ため、正規化係数は１である。したがって、ＥＭセグメント化構成要素３０２は、例によってサポートされている書き換え規則のオカレンスをより正確に反映するように、各書き換え規則に関連付けられた確率を１にリセットする。新しい確率を得るためにカウントを正規化することは、図３Ｂのブロック３１２で示される。

ＥＭセグメント化構成要素３０２は、カウントおよび確率が収束するまで、このプロセス（カウントを再度推定し、新しい確率を取得すること）を反復する。これはブロック３１４で示される。たとえば、第１の書き換え規則について新しいカウント

を取得するために、ＥＭセグメント化構成要素３０２は、第１に、非終端記号シーケンスがＳｈｏｗＦｌｉｇｈｔＣｍｄおよびＦＰＤＣｉｔｙであると想定し、単語「ｆｒｏｍ」を観察する合計尤度を求める数式１を以下のように実施する。

になる。

同様に、第２の書き換え規則（ＳＦＣｍｄ→ｆｒｏｍ）の新しいカウント

は、以下のように計算される。

このプロセスは、各例からカウント

を収集するために、それぞれの書き換え規則について続行される。その後、新しいカウントに正規化係数を掛け合わせ、新しい確率を取得する。図３Ｂに示されるように、構成要素３０２は、確率が収束するまでこのプロセスを反復し、新しいカウントおよび新しい確率を再度推定する。

反復が完了すると、ＥＭセグメント化構成要素３０２は、列挙されたそれぞれの書き換え規則に関連付けられた、新しいカウントおよび新しい確率を計算することになる。これは、本質的かつ自然に、非常に役立つものであるが、それぞれのセグメント化に対する確率を、トレーニング中に取得した異なるセグメント化に対応する規則に割り当てているので、望ましい最終結果ではない場合がある。たとえば、解析プログラムによっては、確率を利用できないものがある。また、解析を行う構成要素によっては、規則の数が多すぎて、解析プログラムの効率が悪くなる場合がある。

したがって、一実施形態によれば、構成要素３０２が、規則および関連する確率をプルーニング構成要素３０４に提供し、ここで規則をプルーニングすることができる。これは、図３Ｂのブロック３１６および３１８で示される。プルーニング構成要素３０４は、いくつかの異なる方法のうちの１つ（ブロック３２０で示されるように、プルーニングされたセグメント化に基づいて、最終規則を取得するために、列挙された規則を改定するなど）で、規則をプルーニングすることができる。たとえば、プルーニング構成要素３０４は、単に、所望のしきい値レベルより低い確率を有する規則だけをプルーニングすることができる。その後、構成要素３０４は、残りの規則を規則ベース文法２１０に導入する。

他の実施形態によれば、プルーニング構成要素３０４は、各例に対応する尤度の高い所定数のセグメント化を除いてすべて消去し、残りのセグメント化に従って、文法に書き換え規則を導入するだけである。たとえば、プルーニング構成要素３０４は、最も高い確率を有する１つを除き、各例に対応するすべてのセグメント化を消去することができる。したがって、例１の場合、単語「ｆｒｏｍ」を前終端記号ＦｌｉｇｈｔＰｒｅＤｅｐａｒｔｕｒｅＣｉｔｙにマッピングしたセグメント化が、単語「ｆｒｏｍ」を前終端記号ＳｈｏｗＦｌｉｇｈｔＣｍｄに割り当てたセグメント化よりも高い確率を有すると想定する。その場合、第２のセグメント化（「ｆｒｏｍ」をＳｈｏｗＦｌｉｇｈｔＣｍｄにマッピングしたもの）が消去される。このケースでは、選択されたセグメント化をサポートする２つの書き換え規則が文法に追加される。したがって、書き換え規則「ＳＦＣｍｄ→ε」および書き換え規則「ＦＰＤＣｉｔｙ→ｆｒｏｍ」の両方が、文法に追加される。

同様に、任意の例の最善のセグメント化がもはやサポートしなくなった規則を、図２Ｇに示された列挙規則から除去することができる。したがって、規則「ＳＦＣｍｄ→ｆｒｏｍ」は、消去された例１のセグメント化によってのみサポートされていたので、除去することができる。

ここで、この方法でのＥＭアルゴリズムの適用について、より正式な数学用語を使用して説明する。セグメント化あいまい性解決法を、各ブロックがシーケンスＮ＝ＮＴ_１、ＮＴ_２、．．．、ＮＴ_ｍの前終端記号と位置合わせするように、単語シーケンスｗ＝ｗ_１、ｗ_２、．．．、ｗ_ｎに関するｍブロック区画π＝α_１、α_２、．．．、α_ｍを見つける問題として、形式化することができる。ブロックは、ｗからの０またはそれ以上の単語を含むことができる。

π、Ｎ、およびｗの接合（ｊｏｉｎｔ）確率をモデル化すると、以下のようになる。

次に、Ｎおよびｗが与えられると、以下のように最尤セグメント化を得ることができる。

こうした区画は、ヴィテルビ検索（ｖｉｔｅｒｂｉｓｅａｒｃｈ）で見つけることができる。したがって、残る唯一の問題は、あらゆる前終端記号（または概念）ＮＴおよび単語シーケンスαに関するモデルパラメータＰ（ＮＴ→α）を推定することである。これは、トレーニングデータが、各前終端記号に対する単語シーケンスとペアになった前終端記号のリストである場合、最尤（ＭＬ）推定で実行することができる。ただし、オーサリングツールを介してユーザから取得されるトレーニング例は、例示的には、前終端記号シーケンスと終端記号シーケンスとのペアである。区画またはセグメント化は隠し変数であり、ツールにはわからない。

ＥＭアルゴリズムは、まず、モデルのパラメータＰ_φを設定し、その後、反復的にパラメータをＰ_φ´に修正し、その結果、観測の尤度Ｄが増加する。

こうしたＰ_φ´を見つけるために、数式６に補助関数Ｑを定義する。

これは、Ｌ（Ｄ｜Ｐ_φ´）−Ｌ（Ｄ｜Ｐ_φ）の下限、すなわち、２つのモデルパラメータ化の間のトレーニングデータの対数尤度差である。ＥＭアルゴリズムは、前終端記号に関するすべての可能な書き換え規則の確率の合計が１でなければならないという制約を条件として、新しいパラメータ化によるトレーニングサンプル尤度の増加を最大にするために、Ｑを最大化することによって、パラメータＰ_φ´を貪欲に（ｇｒｅｅｄｉｌｙ）リセットする。したがって、各規則ＮＴ→αについて、以下の数式を解くことによってその新しい確率が取得できる。

であるので、

したがって、確率は、以下のように、予測カウント掛ける正規化係数−１／λにリセットされるはずである。

予測カウントを計算するには、以下のことに留意されたい。

したがって、以下のようになる。

を、前終端記号シーケンスＮを単語シーケンスｗに書き換えるプロセスにおいて、サブシーケンスα＝ｗ_ｉ、．．．、ｗ_ｊを生成するために、Ｎ中のｋ番目の前終端記号に対して規則ＮＴ→αが使用されるイベントとし、

を、シーケンスＮ中の位置ｓからｔまでの前終端記号が、終端記号の単語ｗ_ｐ、．．．、ｗ_ｑ＝１をカバーする確率とする。すると、以下のようになる。

したがって、

を計算できる場合、数式９、１１、および１３を組み合わせて、予測されるカウントを取得し、モデルパラメータをリセットすることができる。実際、

は、数式１４に従って動的プログラミングで計算することが可能であり、この式で、εはｎｕｌｌ文字列である。

数式１１で、

が使用できることに留意されたい。

図４は、本発明の異なる態様に従った、モデルオーサリング構成要素３５０の他の実施形態を示す図である。規則ベース文法２１０は、依然として、所望のレベルよりも堅固さに欠け、よりもろい可能性がある。たとえば、以下の規則が生成されるトレーニング時に、以下の前終端記号をモデル化すると想定してみる。
FlightPreArrivalCity→to
ShowFlightCmd→Show me the flight
さらに、ランタイム時に、センテンス入力が「ＳｈｏｗｆｌｉｇｈｔｔｏＢｏｓｔｏｎ」であると想定してみる。「Ｓｈｏｗｆｌｉｇｈｔ」がＳｈｏｗＦｌｉｇｈｔＣｍｄであるとする規則はないため、入力されたセンテンスは理解されないことになる。

ＣＦＧは、高解像度理解（ｈｉｇｈｒｅｓｏｌｕｔｉｏｎｕｎｄｅｒｓｔａｎｄｉｎｇ）に対して良い働きをする。高解像度理解とは、センテンスを多数のスロットに分解する文法を表す。スロットの数が多いほど、文法が示す解像度理解も高くなる。ＣＦＧは、高解像度状況で適切に一般化される。

ただし、アプリケーションの多くは、充填されるスロットの数が多くない、低解像度理解を必要とする。こうしたアプリケーションの１つがコマンドおよび制御である。たとえば、コマンドおよび制御アプリケーションでは、認識しなければならないコマンドの一部に、「ＣｈａｎｇｅＰａｓｓｗｏｒｄ」、「ＣｈａｎｇｅＢａｃｋｇｒｏｕｎｄ」、および「ＣｈａｎｇｅＬｏｇｉｎＰｉｃｔｕｒｅ」が含まれる。これらのインスタンスでは、充填されるスロットはなく、センテンス全体をコマンドとして認識しなければならない。トレーニング時には、これは、以下のような規則で良い結果が得られる。
ChangeLoginPictureCmd→Please change my login icon
「ＣｈａｎｇｅＬｏｇｉｎＰｉｃｔｕｒｅ」はコマンドであるため、規則に対するプロパティ部分がない。したがって、文法学習者は、獲得した規則中のセンテンス全体を単に「覚える」だけである。ユーザが発行したコマンドを認識して呼び出すためには、コマンドがトレーニングデータ中のセンテンス全体と一致しなければならない。一般化はまったくない。

本発明の一実施形態は、テンプレート文法中の規則で（コマンド、プリアンブル、およびポストアンブルなどの）前終端記号をモデル化する代わりに、前終端記号をモデル化するために（ｎ−ｇｒａｍなどの）統計モデルが使用される。一実施形態では、テンプレート文法中の前終端記号に対応する列挙されたセグメント化について生成されたテキストが、ｎ−ｇｒａｍ（または他の統計モデル）に関するトレーニングデータとして使用される。したがって、上記の例では、ＥＭアルゴリズムの予測ステップで収集されたその予測されるカウントと共に、前終端記号に関して列挙されたセグメント化に対応するテキスト文字列を使用して、前終端記号についてｎ−ｇｒａｍをトレーニングする。したがって、テキスト「Ｓｈｏｗｍｅｔｈｅｆｌｉｇｈｔ」は、ＳｈｏｗＦｌｉｇｈｔＣｍｄ前終端記号をモデル化するためにｎ−ｇｒａｍをトレーニングする際の、トレーニングデータとして使用される。したがって、「Ｓｈｏｗｆｌｉｇｈｔ」の付いたセンテンスがＳｈｏｗＦｌｉｇｈｔＣｍｄとして認識される確率は、以下のように計算することができる。

数式１５
Pr(<s>showflight</s>|ShowFlightCmd)=
Pr(show|<s>; ShowFlightCmd)*
Pr(flight|show;ShowFlightCmd)*
Pr(</s>|flight; ShowFlightCmd)

規則は「ｓｈｏｗｆｌｉｇｈｔ」をＳｈｏｗＦｌｉｇｈｔＣｍｄとして識別しなかったが、上記の数式１５でのｎ−ｇｒａｍ確率はゼロにはならない。数式１５の第１の係数および第３の係数は、実際にトレーニングデータ内に存在するｂｉｇｒａｍに対応する（すなわち、［＜ｓ＞ｓｈｏｗ］および［ｆｌｉｇｈｔ＜ｓ／＞］）ので、非ゼロである。第２の係数は、トレーニングデータ内に示されるｂｉｇｒａｍに対応していないが、バックオフのような平滑化技法（以下で説明）により、これも非ゼロの確率を有し、以下のように表すことができる。

数式１６
Pr(flight|show;ShowFlightCmd)=
backoff_weight*Pr(flight|ShowFlightCmd)

バックオフ重みは、経験的に、ないしは望みどおりに設定可能であり、ｕｎｉｇｒａｍ確率Ｐｒ（ｆｌｉｇｈｔ｜ＳｈｏｗＦｌｉｇｈｔＣｍｄ）は、「ｆｌｉｇｈｔ」がトレーニングデータ中の単語であるため、非ゼロである。

Ｐｒ（ｓｈｏｗｆｌｉｇｈｔ＜／ｓ＞｜ＳｈｏｗＦｌｉｇｈｔＣｍｄ）＞０であるため、解析プログラムは、入力センテンスをＳｈｏｗＦｌｉｇｈｔ候補としてみなすことになる。入力センテンスの最終解釈は、他の解釈候補との比較に依存することになる。

図４は、前終端記号（コマンド、プリアンブル、およびポストアンブルなど）を識別するために、スロットをモデリングするための規則および統計モデル部分３２６（ｎ−ｇｒａｍなど）を含む、文法部分２１０（ＣＦＧなど）を含む複合モデル３５１をオーサリングする、モデルオーサリング構成要素３５０の他の実施形態を示す図である。したがって、ランタイム時に、入力センテンスは、前終端記号を識別する際には統計モデル部分３２６で評価され、スロットに充填する際には規則ベース文法部分２１０で評価される。

構成要素３５０は、部分的に、上述したＥＭアルゴリズム技法を使用して、複合モデル３５１をトレーニングする。たとえば、図５は、様々なサンプルセグメント化に従って、ＳｈｏｗＦｌｉｇｈｔＣｍｄに関するすべての列挙規則を示すと想定する。

図２Ａ〜３Ｂに関して上述したモデルの場合、ＥＭアルゴリズムのＥステップ中に、図５に示された列挙規則それぞれについて予測カウントが収集される。Ｍステップ中には、カウントが正規化される。ただし、複合モデル３５１の場合、アルゴリズムのＭステップ中にカウントを正規化する代わりに、列挙規則の右側にあるテキスト文字列およびそれら規則に対応した関連する予測カウントが、ＳｈｏｗＦｌｉｇｈｔＣｍｄ前終端記号用にｎ−ｇｒａｍをトレーニングおよび平滑化するためのトレーニングデータとして使用される。

言い換えれば、ｎ−ｇｒａｍをトレーニングする際に、単語シーケンスの各オカレンスについて、全カウントを追加する必要はない。代わりに、トレーニングセンテンスに関連付けられた規則に関する予測カウントに対応する分数データ（図３Ａに示されたＥＭセグメント化構成要素３０２によって生成される）が、単語シーケンスの各オカレンスについて追加される。

図２Ａ〜３Ｂに関してセグメント化のあいまい性除去について記載された実施形態との他の違いには、ＥＭアルゴリズムのＥステップが含まれる。それぞれの列挙規則に確率を関連付ける代わりに、規則の確率は、規則中のすべてのｎ−ｇｒａｍの積である。

たとえば、上述した規則ベース文法では、規則
ShowFlightCmd→Show me the flight
は、それに関連付けられた極小（ａｔｏｍｉｃ）確率を有する。ただし、複合モデル３５１では、規則に関する確率は以下のように計算することができる。

また、本発明の一実施形態によれば、前終端記号に関する統計モデルのトレーニングには、平滑化アルゴリズムの適用が含まれる。たとえば、前終端記号に関する統計モデルのトレーニングのためのトレーニングデータは、所与の前終端記号に関連付けられたセグメント化について列挙されたテキスト文字列のみを含むため、相対的に疎である可能性がある。これにより、統計モデルが相対的に大量の言語表現をカバーしないままとなり、したがって、統計モデルは相対的にもろくなる。そこで、モデル確率は、より低レベルのｎ−ｇｒａｍを使用し、一様分布で平滑化される。言い換えれば、統計モデルがｂｉ−ｇｒａｍを含む場合は、コンテキストに関係なく、モデル化された単語に確率を与えるｕｎｉｇｒａｍで平滑化される。さらに統計モデルは、語彙中の各単語に同じ確率を割り当てる、一様分布でも平滑化される。したがって、単語が語彙中にある場合、その単語は、統計モデルによって、ゼロ確率ではモデル化されないことになる。平滑化オペレーションでは、各モデルについての重みを見つけて、異なる順序のモデルを線形補間するために、削除された補間が使用される。

モデルオーサリング構成要素３５０は、本発明の異なる実施形態にしたがって、追加の統計モデル構成要素もトレーニングすることができる。これについては、図６に示されたブロック図で詳細に例示している。たとえば、そのブロック図では、統計モデル部分３２６は前終端記号に関する統計モデル構成要素３４０だけでなく、複数の他の統計モデルも含むように示されている。たとえば一実施形態では、統計モデル部分３２６は、タスクの前の確率をモデル化する統計モデル、およびスロット移行（ｔｒａｎｓｉｔｉｏｎ）に関する統計モデルを含む、構成要素であるコマンド前のモデル３４２およびスロット移行の関する統計モデル３４４を含むことができる。

たとえば、ランタイム入力センテンスが「Show flights to Boston arriving on Tuesday, 11:00 a.m.」であるとする。用語「ａｒｒｉｖｉｎｇｏｎ」は、「Ｔｕｅｓｄａｙ」が到着日に対応することを示すものとして分析される。ただし、「１１：００ａ．ｍ．」の前に、これが出発時刻であるか到着時刻であるかを示す単語がない。「ａｒｒｉｖａｌｄａｔｅ」スロットの後に「ａｒｒｉｖａｌｔｉｍｅ」スロットが続く確率は、「ｄｅｐａｒｔｕｒｅｄａｔｅ」スロットの後に「ｄｅｐａｒｔｕｒｅｔｉｍｅ」スロットが続く確率よりも高いことが多い。こうしたスロット移行がモデル化される場合、スロット移行モデルは、「１１：００ａ．ｍ．」が「ａｒｒｉｖａｌｔｉｍｅ」スロットと付き合わされることが好ましい。スロット移行をモデル化するために統計モデル（ｎ−ｇｒａｍモデルなど）をトレーニングすることは、ｎの順序が異なることを除いて、スロットの前の確率をモデル化するために統計モデル（ｎ−ｇｒａｍモデルなど）をトレーニングすることと同じであることにも留意されたい。スロットの前の確率の場合、ｕｎｉｇｒａｍモデルがトレーニングされ、２つのスロット間のスロット移行をモデル化するために、ｂｉｇｒａｍモデルがトレーニングされるなどが行われる。

さらに、一部のコマンドは、トレーニングデータ内で他のコマンドよりも頻繁に実行される。したがって、コマンドの前の確率がコマンドの前のモデル３４２でモデル化される。

次に、本発明の他の例に関して、より詳細に説明する。図７は、アポイントメントスケジューリングコマンドＮｅｗＡｐｐｔに関する意味を定義する、スキーマにおける意味クラスを示す、例示的な簡略化された例である。

図８は、意味クラスＮｅｗＡｐｐｔに関して自動的に生成可能なテンプレート規則を示す図であり、括弧内の記号はオプションである。図９は、注釈付きセンテンス「ＮｅｗｍｅｅｔｉｎｇｗｉｔｈＰｅｔｅｒａｔ５：００」の一実施形態を示す図である。図１０は、上述のように、セグメント化のあいまい性除去がいったん実行されると追加することのできる、２つの規則を示す図である。

ただし上述のように、完全に規則ベースの文法は、堅固さに欠け、もろさが見られる可能性がある。したがって、本発明の一態様では、テンプレート文法中のコマンド、プリアンブル、およびポストアンブルをそれぞれモデル化し、スロット移行をモデル化するために、ＣＦＧ規則をｎ−ｇｒａｍに置き換える。スロットｎ−ｇｒａｍは、プリアンブルおよびポストアンブルのないスロットの解釈を制約する。結果として生じるモデルは、統計モデル（またはＨＭＭ）およびＣＦＧの複合である。ＨＭＭは、テンプレート規則およびｎ−ｇｒａｍ前終端記号をモデル化し、ＣＦＧはライブラリ文法をモデル化する。

こうしたモデルの一例が、図１１に示されている。用語「Ａｔｔ」は「Ａｔｔｅｎｄｅｅ（出席者）」の略語であり、「ＳＴ」は「ＳｔａｒｔＴｉｍｅ（開始時刻）」の略語である。排出（ｅｍｉｓｓｉｏｎ）確率ｂは、前終端記号に依存するｎ−ｇｒａｍであり（図中では、ｕｎｉｇｒａｍとして示されているが、より高位の排出分布では結果的に高位ＨＭＭとなる）、移行確率ａは、スロット移行ｂｉｇｒａｍである。スロットノードからの排出はライブラリＣＦＧ非終端記号である。単語は、ＣＦＧモデルＰ_ＣＦＧに従って、それらから生成される。

図１１に示されたモデルでは、入力センテンスｓの意味は、以下を満たすヴィテルビの意味クラスｃおよび状態シーケンスσを見つけることによって取得することができる。

新しいモデルは、ＣＦＧモデルの制限を克服するものである。低解像度理解（タスク分類）の場合、プロパティ前終端記号はテンプレート文法に導入されない。したがって、すべてのトレーニングデータが、コマンド前終端記号に関するｎ−ｇｒａｍのトレーニングおよび平滑化に使用される。モデルは、数式１９によって表されるｎ−ｇｒａｍ分類子（ｃｌａｓｓｉｆｉｅｒ）にスケールダウンする。

ｎ−ｇｒａｍモデルは、正確な規則の突合せを必要としない。規則の適用可能度に関して二分決定（ｂｉｎａｒｙｄｅｃｉｓｉｏｎ）を行う代わりに、観察された単語シーケンスが状態（前終端記号）から生成される確率を比較して、最も可能性の高い解釈を見つける。したがって、モデルそれ自体が堅固であり、堅固な解析プログラムは不要である。

次に、図７〜１１に示された例に関して、トレーニングについてより詳細に説明する。モデルをトレーニングするために、ＥＭアルゴリズムは単語シーケンスを自動的にセグメント化し、各セグメントαと、対応するペアの前終端記号シーケンス中の対応する前終端記号ＮＴとを位置合わせする。ＥＭアルゴリズムは、ＮＴから単語文字列ａを生成するための確率を割り当て、初期の一様分布でそれをパラメータ化する、モデルＰ（ＮＴ→α）を構築する。その後、上述のように、パラメータ化を反復的に改良する。反復するたびに、前の反復でのモデルのパラメータ化に従って、規則ＮＴ→αに関する予測カウントを計算し（Ｅステップ）、その後、予測カウントを正規化することによって確率Ｐ（ＮＴ→α）を再度推定する（Ｍステップ）。前終端記号をｎ−ｇｒａｍでモデル化する新しいモデルをトレーニングするために、Ｅステップで収集された予測カウントを使用して、Ｍステップでｎ−ｇｒａｍをトレーニングおよび平滑化し、セグメント化に関する予測カウントを収集するためにＥＭアルゴリズムによってｎ−ｇｒａｍが使用される。その結果、図１２に示されるトレーニングアルゴリズムが生じる。

一実施形態では、図１２の最後の行に示されたしきい値（ｔｈｒｅｓｈｏｌｄ）が０．０１に設定される。もちろん、他のしきい値も使用可能である。

本発明の他のオプションの態様に留意することも価値がある。オプションの文法ライブラリ２０９（図２Ａ、４、および１３に図示）は、統計的に、トレーニングデータ（トレーニング例テキスト文字列および注釈２０８）に適合可能である。たとえば、文法ライブラリ２０９が、国内外の大都市および小都市の両方を含む、相対的に大きな都市のリストを含むと想定してみる。ただし、モデルがトレーニングされる特定のアプリケーションは、国内の都市のみに関係するものであり、ニューヨークやロサンゼルスなどの国内の大都市の方が、より小さな都市よりも関係する確率が高いとも想定してみる。モデルオーサリング構成要素２０２または３５０は、文法ライブラリ２０９を含むことのできる、確率文脈自由文法（ＰＣＦＧ）に関連付けられた確率を、注釈付きトレーニングデータ（トレーニング例テキスト文字列および注釈２０８）から学習する。たとえば、規則Ｃｉｔｙｎａｍｅ→ＮｅｗＹｏｒｋに関する確率が、規則Ｃｉｔｙｎａｍｅ→Ｔｏｋｙｏに関する確率よりも高いことを、学習することができる。これは、上述の他の確率が学習されるのと同じ方法で実行できる。

図１３は、スロットに関する規則ベース文法部分と、前終端記号に関する統計モデル部分との両方を使用する、ランタイムシステムを示す図である。システムは入力（自然言語入力文字列４００）を受け取り、文法部分およびｎ−ｇｒａｍ部分を使用して、出力４０２を出力する。

復号については、図１４に関してより詳細に説明する。図１４は、入力「ｎｅｗｍｅｅｔｉｎｇｗｉｔｈＰｅｔｅｒａｔｆｉｖｅ」に関する動的プログラミング復号器を表す、動的プログラミングトレリス構造を示す図である。

動的プログラミング復号器は、上記の数式１８で表されたヴィテルビパスを見つける。入力を受け取ると、復号器は最初に、ボトムアップ図表解析プログラムを使用して、何らかの入力範囲をカバーしているライブラリ文法非終端記号を見つける。この例では、「Ｐｅｔｅｒ」を＜Ｐｅｒｓｏｎ＞として、また「ｆｉｖｅ」を＜ｔｉｍｅ＞または＜ｎｕｍ＞のいずれかとして識別する。次に復号器は、第１列の意味クラスノード（この例では、意味クラスＮｅｗＡｐｐｔしか示していない）から始まり、トレリス全体を検索していく。各ノードで、同じ列の他のノードへ（異なる非終端記号への切り替え）、または同じ行の次のノードへ（非終端記号による入力単語の消費）の、移行が行われる。検索は、最も右の列に達するまで、左から右へと進められる。移行が行われると、開始ノードのスコアに適切な対数確率を追加することによって、スコアが取得される。次にこのスコアが、宛先ノードのそれと比較され、新しいスコアの方が高ければそれに置き換えられる。トレリスの下にあるのは、図表解析プログラムによって識別された非終端記号である。太線のパス４１０が、ヴィテルビ解釈を表す。上方の細線のパス４１２は、正しいタスクを識別するが、どちらのスロットでもない。下方の細線のパス４１４（ヴィテルビパス４１０の一部を共有する）は、出席者を識別するが、開始時間スロットではない。「ａｔｆｉｖｅ」を、出席者のポストアンブルとして扱う。図１４に示された最初の９つの移行のそれぞれについての対数確率を、ヴィテルビパス４１０に関して以下にリスト表示する。
1. log P(NewAppt) // 以前のクラス
2. log b(New | <s>; NewApptCmd) // 単語bigram
3. log b(meeting | new; NewApptCmd) // 単語bigram
4. log b(</s> | meeting; NewApptCmd) + // 単語bigram
log a( Attendee | <s>; NewAppt) // スロットbigram
5. log b(with | <s>; PreAttendee) // 単語bigram
6. log b(</s> | with; PreAttendee) // 単語bigram
7. log P_cfg(Peter | <Person>) // PCFG
8. 0
9. log b(</s> | <s>; PostAttendee) + // 単語bigram
log a( StartTime | Attendee; NewAppt) // スロットbigram
いずれの所望のプルーニングメカニズムも使用可能である。たとえば、１つのプルーニングメカニズムでは、トレリスの各列で、スコアが、同じ列の最大スコアよりも低いしきい値（５．０など）よりも小さい場合は、ノードの移行を行わないものとする。言い換えれば、同じ列内のノードに至る他のパスよりも１０^５倍少ない見込みの場合、パスは拡張されない。復号器は、プルーニング後の堅固な解析プログラムよりもかなり速く実行される。

したがって、本発明の様々な実施形態が、前終端記号に関する統計モデル部分を含むだけでなく、スロットに充填するための規則ベース文法部分も含むことが可能であることが理解されよう。本発明は、タスクの前の確率に関するモデル、およびスロット移行に関する統計モデルも含むことができる。最後に、本発明の一実施形態は、規則の生成で使用されたＥＭアルゴリズムのＥステップからの予測カウントを使用する、統計モデルのトレーニングを含む。

以上、特定の実施形態を参照しながら本発明について説明してきたが、当業者であれば、本発明の精神および範囲を逸脱することなく、形態および詳細における変更が可能であることを理解されよう。

本発明を使用可能な環境の一例を示すブロック図である。本発明の一実施形態に従ったモデルオーサリング構成要素の一実施形態を示すブロック図である。スキーマの例を示す図である。スキーマの例について生成された規則セットの例を示す図である。注釈付きセンテンスの例を示す図である。解析ツリーの例を示す図である。例の単語に関する可能な前終端記号を示す表である。カウントおよび確率に関連した書き換え規則を示す表である。文法オーサリング構成要素をより詳細に示すブロック図である。図３Ａに示された文法オーサリング構成要素のオペレーションを示す流れ図である。本発明の他の実施形態に従ったモデルオーサリング構成要素を示す図である。列挙されたセグメント化の例を示す図である。本発明の一実施形態に従った統計モデルをより詳細に示す図である。簡略化されたスキーマの例を示す図である。図７のスキーマから生成された規則セットの例を示す図である。注釈付きセンテンスの例を示す図である。生成された規則を示す図である。複合モデルを示す状態図である。トレーニング技術を記述する擬似コードを示す図である。本発明に従って生成されたモデルを使用するための、ランタイムシステムを示すブロック図である。復号器トレリスの例を示す図である。

符号の説明

２００モデルオーサリングシステム
２０２モデルオーサリング構成要素
２０４ユーザインターフェース
２０６スキーマ
２０８トレーニング例テキスト文字列および注釈
２０９文法ライブラリ
２１０規則ベース文法

Claims

自然言語理解（ＮＬＵ）システムにおいて、スキーマから導出されたスロットおよび前終端記号に音声による自然言語入力をマッピングする際に使用するための構成要素を生成するように構成されたオーサリング構成要素であって、前記オーサリング構成要素は、
コンピュータのプロセッサを用いて実施されるモデルトレーナを備え、
前記モデルトレーナは、タスクが完了することを示すスキーマを得て、前記スキーマは、自然言語入力の一部で充填されるように構成されている、複数のスロットと複数の前終端記号とを含み、前記前終端記号は１つ以上の前記スロットに関連付けられたプリアンブルとポストアンブルの少なくとも１つを含み、
前記モデルトレーナは、トレーニングデータに基づいて規則ベース文法をトレーニングし、前記スキーマから導出された前記スロットに前記自然言語入力からの用語をマッピングし、前記自然言語入力からの用語を前記スキーマから導出された前記前終端記号にマッピングするように、複数の統計モデルをトレーニングするように構成され、前記モデルトレーナは複数の異なる前終端記号のそれぞれに対応する統計モデルをトレーニングするように構成され、前記モデルトレーナは前記トレーニングデータを受け取り、前記スロットおよび前終端記号を前記トレーニングデータに関連付ける、前記トレーニングデータのセグメント化を列挙し、前記モデルトレーナは、前記スキーマから導出された前終端記号のそれぞれに対する統計モデルを、前終端記号のそれぞれに関連付けられた前記テキストを前記統計モデルの前記前終端記号に対するトレーニングデータとして用いてトレーニングするように構成されていることを特徴とするオーサリング構成要素。
前記モデルトレーナは、スロット間の移行をモデル化する統計スロット移行モデルをトレーニングするように構成されることを特徴とする請求項１に記載のオーサリング構成要素。
前記スキーマはタスクを示し、前記モデルトレーナは、タスクの前の確率をモデル化する統計タスクモデルをトレーニングするように構成されることを特徴とする請求項１に記載のオーサリング構成要素。
前記モデルトレーナは、列挙された各セグメント化に予測カウントを割り当てるように構成されることを特徴とする請求項１に記載のオーサリング構成要素。
前記モデルトレーナは、前終端記号を選択し、前記選択された前終端記号に対応するセグメント化に割り当てられた前記予測カウントを使用して、前記選択された前終端記号に関する前記統計モデルをトレーニングするように構成されることを特徴とする請求項４に記載のオーサリング構成要素。
前記モデルトレーナは、期待値最大化（ＥＭ）アルゴリズムの適用に基づいて生成されたそれぞれのセグメント化に予測カウントを割り当てるように構成されることを特徴とする請求項４に記載のオーサリング構成要素。
前記モデルトレーナによってアクセス可能な確率ライブラリ文法をさらに含むことを特徴とする請求項１に記載のオーサリング構成要素。
前記トレーニングデータは意味的な注釈が付けられたトレーニングデータであり、前記モデルトレーナは、前記意味的な注釈が付けられたトレーニングデータに基づいて、前記確率ライブラリ文法において確率を適応するように構成されることを特徴とする請求項７に記載のオーサリング構成要素。