JP4579585B2 - 音声認識文法作成装置、音声認識文法作成方法、プログラムおよび記憶媒体 - Google Patents

音声認識文法作成装置、音声認識文法作成方法、プログラムおよび記憶媒体 Download PDF

Info

Publication number
JP4579585B2
JP4579585B2 JP2004170290A JP2004170290A JP4579585B2 JP 4579585 B2 JP4579585 B2 JP 4579585B2 JP 2004170290 A JP2004170290 A JP 2004170290A JP 2004170290 A JP2004170290 A JP 2004170290A JP 4579585 B2 JP4579585 B2 JP 4579585B2
Authority
JP
Japan
Prior art keywords
name
rule
grammar
node
representing
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
JP2004170290A
Other languages
English (en)
Other versions
JP2005351980A (ja
Inventor
和恵 金子
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Canon Inc
Original Assignee
Canon Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Canon Inc filed Critical Canon Inc
Priority to JP2004170290A priority Critical patent/JP4579585B2/ja
Priority to US11/147,836 priority patent/US20050273329A1/en
Publication of JP2005351980A publication Critical patent/JP2005351980A/ja
Application granted granted Critical
Publication of JP4579585B2 publication Critical patent/JP4579585B2/ja
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/08Speech classification or search
    • G10L15/18Speech classification or search using natural language modelling
    • G10L15/183Speech classification or search using natural language modelling using context dependencies, e.g. language models
    • G10L15/19Grammatical context, e.g. disambiguation of the recognition hypotheses based on word sequence rules
    • G10L15/193Formal grammars, e.g. finite state automata, context free grammars or word networks

Landscapes

  • Engineering & Computer Science (AREA)
  • Artificial Intelligence (AREA)
  • Computational Linguistics (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Physics & Mathematics (AREA)
  • Acoustics & Sound (AREA)
  • Multimedia (AREA)
  • User Interface Of Digital Computer (AREA)
  • Machine Translation (AREA)

Description

本発明は、音声認識可能な語や文を記述して文法として作成する音声認識文法作成装置、音声認識文法作成方法、プログラムおよび記憶媒体に関する。
従来、音声認識装置においては、予め認識可能な内容を文法として記述する場合、文法を拡張BNF形式などで記述することが一般的に行われている。また、グラフィカルユーザインタフェースを用いて、記述する文法を表示、編集するツールがある。このようなツールとしては、例えば、ルール内の枝が並列にある部分を表形式で表示するものがある(例えば特許文献1を参照)。但し、このツールは、木構造やネットワークでの表示を行うものではない。また、このツールは、文法をルール単位で表示、編集するものであって、複数のルールを同一画面上で編集することができず、ルールの分割や統合を行う場合の編集には、画面の切り替えなどが必要である。また、このツールは、文法としての整合性を重視しており、木構造やネットワーク構造上の、枝を展開する形での編集方法(幹から枝を伸ばしたり、縮めたりするもので、浮遊する枝を持つことはできない)であるため、編集の自由度が低い。
さらに、知識ベースの知識の記述を木構造で編集する方法がある(例えば特許文献2を参照)。この木構造の編集方法は、木のルートに接続していない枝を扱うことができないので、この方法を音声認識の文法に適用する場合、どのルールにも属していない単語やルール参照などは扱うことができないことになる。また、上記木構造の編集方法は、グラマを拡張BNFの記述方式で記述することができないので、編集結果の保存を拡張BNFの記述方式で行うことができない。
特開平08−044384号公報 特開平08−147167号公報
上述した方法を用いて、音声認識可能な語や文を記述して文法として作成する場合、ユーザは、ルールを作成している最中に、その一部分を別のルールとして定義し、また別のルールにマージするなどの操作を行うことがある。その場合、画面を切り替えて編集を行う必要があるので、操作が煩雑になり、見落としなどが発生する可能性がある。
また、ルールの整理中に、一時的にルールに属していないものを記述する必要が生じる場合がある。特に日本語のように、語の表記と発音が一つに決定されないものに対して、属するルールがまだ決定されていない状態でその語の表記と発音をあるルールから除外するために削除すると、属するルールが決定された段階で新たに表記と発音の対を入力しなおす必要があり、余分な手間が掛かる。
本発明の目的は、ルールの分割、修正などの編集作業を、ウィンドウを切り替えることなく、簡単に行うことができる音声認識文法作成装置、音声認識文法作成方法、プログラムおよび記憶媒体を提供することにある。
本発明は、上記目的を達成するため、ルール名と、参照先の語彙を表す単語または参照先のルール名を表すルール参照とが対応付けて記述された複数のルール定義を含むグラマを、グラフィカルユーザインタフェースを用いて、前記ルール名を表す名称が付与されたノードと、前記単語を表す名称が付与されたノードと、前記ルール参照を表す名称が付与されたノードとして表現し、編集する音声認識文法作成装置であって、同時に同一画面上に前記グラフィカルユーザインタフェースを用いて、前記グラマに含まれる複数の前記ルール定義に記述された各々のルール名を表す名称が付与されたノードと、各々の単語を表す名称が付与されたノードと、各々ルール参照を表す名称が付与されたノードとを表示させ、更に、前記グラマに基づいて所定の前記ノード間にリンクを表示させる表示制御手段と、ユーザが前記グラフィカルユーザインタフェースに対して行った操作に対応する情報を蓄積する蓄積手段と、前記蓄積手段に蓄積された前記画面上に表示された前記ノードの名称を変更する操作に対応する情報に基づいて、前記グラマに含まれる前記ルール名の名称を変更すると共に、前記グラマに含まれるルール参照であって、名称が変更されたルール名を参照先とする全てのルール参照の名称を変更後の前記ルール名と同じ名称に変更する変更手段とを有することを特徴とする音声認識文法作成装置を提供する。
本発明は、上記目的を達成するため、ルール名と、参照先の語彙を表す単語または参照先のルール名を表すルール参照とが対応付けて記述された複数のルール定義を含むグラマを、グラフィカルユーザインタフェースを用いて、前記ルール名を表す名称が付与されたノードと、前記単語を表す名称が付与されたノードと、前記ルール参照を表す名称が付与されたノードとして表現し、編集する、情報処理装置による音声認識文法作成方法であって、前記情報処理装置が、同時に同一画面上に前記グラフィカルユーザインタフェースを用いて、前記グラマに含まれる複数の前記ルール定義に記述された各々のルール名を表す名称が付与されたノードと、各々の単語を表す名称が付与されたノードと、各々ルール参照を表す名称が付与されたノードとを表示手段に表示させ、更に、前記グラマに基づいて所定の前記ノード間にリンクを前記表示手段に表示する工程と、ユーザが前記グラフィカルユーザインタフェースに対して行った操作に対応する情報を記憶手段に蓄積する工程と、前記記憶手段に蓄積された前記画面上に表示された前記ノードの名称を変更する操作に対応する情報に基づいて、前記グラマに含まれる前記ルール名の名称を変更すると共に、前記グラマに含まれるルール参照であって、名称が変更されたルール名を参照先とする全てのルール参照の名称を変更後の前記ルール名と同じ名称に変更する工程とを実施することを特徴とする音声認識文法作成方法を提供する。
本発明は、上記目的を達成するため、ルール名と、参照先の語彙を表す単語または参照先のルール名を表すルール参照とが対応付けて記述された複数のルール定義を含むグラマを、グラフィカルユーザインタフェースを用いて、前記ルール名を表す名称が付与されたノードと、前記単語を表す名称が付与されたノードと、前記ルール参照を表す名称が付与されたノードとして表現し、編集する音声認識文法作成方法をコンピュータにより実施可能にするためのプログラムであって、同時に同一画面上に前記グラフィカルユーザインタフェースを用いて、前記グラマに含まれる複数の前記ルール定義に記述された各々のルール名を表す名称が付与されたノードと、各々の単語を表す名称が付与されたノードと、各々ルール参照を表す名称が付与されたノードとを表示手段に表示させ、更に、前記グラマに基づいて所定の前記ノード間にリンクを前記表示手段に表示させるステップと、ユーザが前記グラフィカルユーザインタフェースに対して行った操作に対応する情報を記憶手段に蓄積するステップと、前記記憶手段に蓄積された前記画面上に表示された前記ノードの名称を変更する操作に対応する情報に基づいて、前記グラマに含まれる前記ルール名の名称を変更すると共に、前記グラマに含まれるルール参照であって、名称が変更されたルール名を参照先とする全てのルール参照の名称を変更後の前記ルール名と同じ名称に変更するステップとを前記コンピュータにより実行させることを特徴とするプログラムを提供する。
本発明は、上記目的を達成するため、上記プログラムをコンピュータにより読み取り可能に格納したことを特徴とする記憶媒体を提供する。
本発明によれば、ルールの分割、修正などの編集作業を、ウィンドウを切り替えることなく、簡単に行うことができる。
以下、本発明の実施の形態について図面を参照しながら説明する。
図1は本発明の一実施の形態に係る音声認識文法作成装置の構成を示すブロック図である。
音声認識文法作成装置は、図1に示すように、文字・操作入力部101、画像表示部102、画像編集管理部103、グラマ内部表現管理部104、テキストグラマ変換部105、およびファイル入出力部106を備える。
文字・操作入力部101は、キーボードやマウスなどからなる。画像表示部102は、編集中のグラマをグラフィカルに表示するための液晶表示装置などからなる。画像編集管理部103は、ユーザによる文字・操作入力部101を用いた編集操作を入力し、入力された編集操作に応じて編集中の画像データの編集、管理などを行う。グラマ内部表現管理部104は、グラフィカルに表示される文法を、グラマの内部表現に変換し、管理する。テキストグラマ変換部105は、グラマの内部表現からテキストグラマへの変換、またはその逆の変換を行う。ファイル入出力部106は、編集したグラフィカルに表示されている画像データやテキストグラマに変換されたグラマをファイルとして入出力する。
次に、ユーザが右辺のルール参照のノードを作成したときの処理について図2および図3を参照しながら説明する。図2はユーザが右辺のルール参照ノードを作成したときの処理の手順を示すフローチャート、図3は図2の処理に従って遷移する編集画面例を示す図である。
ここでは、最初に、画像表示部102に、図3(a)に示すような、ユーザがグラマを新規作成したときの状態の画面301が表示されているとする。この画面301上には、デフォルトのスタートルールとして、自動的に作成された四隅が丸い長方形のアイコンの「Start」が表示されている。そして、画面301上で、ユーザは、「Start」の右辺のノードを生成し、リンク付けすることにより、ルールを記述する。
上記画面301上では、図2に示すように、まず、右辺のルール参照が作成され、このルール参照に「駅名」というルール参照名が入力される(ステップS201)。このルール参照名が入力された状態は、図3(b)に示す画面302で表される。次いで、左辺のルール名ノードが登録されているか否かのチェックが行われる(ステップS202)。ここで、左辺のルール名ノードが登録されていないと判定された場合は、ルール名ノードが作成される(ステップS203)。この場合の状態は、図3(c)に示す画面303で表される。この画面303においては、四隅が丸い長方形のアイコンでルール名ノードとしての「駅名」ノードが左下に表示される。そして、本処理は終了する。
上記ステップS202において左辺のルール名ノードが登録されていると判定された場合は、本処理は終了する。
次に、既に登録されているルール名ノードのルール参照ノードの名称が変更された場合について図4を参照しながら説明する。図4(a)は既に登録されているルール名ノードのルール参照ノードが表示されている画面例を示す図、図4(b)はユーザにより3つ目のルール参照ノードの「駅名」を「空港」という名称に変更した場合の画面例を示す図、図4(c)は図4(b)の3つ目のルール参照ノードの名称の変更に伴い新たなルール名ノードが作成された画面例を示す図である。
例えば図4(a)に示す画面401の場合のように、3つ目のルール参照ノードとして「駅名」が作成された場合、そのルール参照ノードに対するルール名ノードの「駅名」は、既に登録されているので、3つ目のルール参照ノードの「駅名」に対しては、そのルール名ノードは作成されない。すなわち、同じ名称のルール名ノードは作成されない。
上記画面401に対して、図4(b)に示す画面402のように、3つ目のルール参照ノードの「駅名」がユーザにより「空港」という名称に変更される場合、「空港」というルール名ノードがないので、図4(c)に示す画面403のように、「空港」というルール名ノードが作成され、「駅名」のルール名ノードの下に追加される。
次に、ルール名ノードの名称(ルール名)を変更した場合の処理について図5および図6を参照しながら説明する。図5はルール名ノードの名称を変更した場合の処理の手順を示すフローチャート、図6(a)は「空港」というルール名ノードに対してその名称を「空港名」と変更した場合の画面例を示す図、図6(b)は図6(a)のルール名ノードの名称の変更に伴いルール参照ノードの名称が変更された画面例を示す図である。
ルール名ノードの名称が変更された場合、そのルールを参照している右辺のルール参照ノードの名称を一括して変換する処理が行われる。具体的には、図5に示すように、まず、ルール名ノードに対する名称(ルール名)変更が受け入れられる(ステップS501)。この場合は、例えば図6(a)に示す画面601のように、「空港」というルール名ノード上で、その名称が「空港名」に変更される場合である。
次いで、同一グラマ上のルールの右辺のノードが1つ取り出され(ステップS502)、右辺ノードの取出しが全ての左辺のノードに対して終了したか否かの判定が行われる(ステップS503)。ここで、右辺のノードの取出しが全ての左辺のノードに対して終了していない場合、取り出された右辺のノードに対して、その名称の参照先であるルール名ノードの名称(ルール名)が変更されたか否かの判定が行われる(ステップS504)。ここで、取り出された右辺のノードの名称の参照先であるルール名ノードの名称(ルール名)が変更されている場合、取り出された右辺のノードの名称が変更後のルール名ノードの名称(ルール名)に変更される(ステップS505)。例えば図6(a)の画面601のように「空港」というルール名ノードの名称が「空港名」に変更された場合、図6(b)に示す画面602のように、2つの「空港」というルール参照ノードの名称が「空港名」に自動的に修正される。そして、上記ステップS502へ戻る。
上記ステップS504において取り出された右辺のノードの名称の参照先であるルール名ノードの名称(ルール名)が変更されていないと判定された場合は、上記ステップS502へ戻る。また、上記ステップS503において右辺のノードの取出しが全ての左辺のノードに対して終了している場合、本処理は終了する。
次に、編集結果を保存する処理について図7〜図10を参照しながら説明する。図7は編集結果を保存する処理の手順を示すフローチャート、図8(a)は編集中のデータを内部表現により管理するテーブルの一例を示す図、図8(b)は単語の表記および読みを管理するテーブルの一例を示す図、図8(c)は編集結果をテキストグラマで保存した結果の一例を示す図、図9はテキストグラマで保存することができない編集中のデータの画面例を示す図、図10(a)はテキストグラマで保存することができる編集中のデータの画面例を示す図、図10(b)は図10(a)の編集中のデータをGUIデータで保存した結果の一例を示す図である。
編集結果を保存する場合、ユーザにより編集結果に対する保存形態が指定される。ここで、指定可能な保存形態としては、編集結果をテキストグラマデータに変換して保存する形態と、編集結果をGUI(Graphical User Interface)データとして保存する形態とがある。
ユーザにより保存形態が指定されると、図7に示すように、まず、指定された保存形態が編集結果をテキストグラマで保存する形態であるか否かの判定が行われる(ステップS701)。ここで、指定された保存形態がテキストグラマでの保存形態である場合、編集中の画像データに基づいて内部表現が作成される(ステップS702)。編集中のデータに関しては、ルール名や単語の発音、表記が内部表現として管理されるが、ルールの定義内容については管理されない。例えば図8(a)に示すテーブル801のように、ルール名は登録、管理されているが、ルールの定義内容は空欄とされている。単語に関しては、図8(b)に示すテーブル802のように、表記と読みが管理される。そして、編集結果をテキストグラマとして保存する際に、ルール定義内容は内部表現に変換されて再構成される。
次いで、内部表現への変換が成功したか否かの判定が行われる(ステップS703)。例えば図9に示す画面901のように、定義内容(右辺の枝)がないルール名ノードや、どこからも使用されていない単語ノードがある場合には、これらを正しいテキストグラマへ変換することができない。このように内部表現への変換が失敗した場合は、編集結果を保存することができない旨を示すエラーメッセージが画像表示部102に表示され(ステップS704)、本処理は終了する。
これに対し、上記ステップS703において内部表現への変換が成功したと判定された場合、編集結果がテキストグラマの文字列へ変換され(ステップS705)、テキストグラマデータがファイル入出力部106へ出力される(ステップS706)。そして、本処理は終了する。例えば図10(a)に示す画面1001上に表示されている編集中のデータの場合は、図8(c)に示すテーブル803のように、内部表現によるルール定義内容を作成することができる。
上記ステップS701において保存形態がテキストグラマでない、すなわち編集結果をGUI(Graphical User Interface)データとして保存する形態であるとされた場合は、編集中のデータがGUIデータとしてファイル入出力部106へ出力される(ステップS707)。そして、本処理は終了する。例えば図10(a)に示す画面1001上に表示されている編集中のデータをGUIデータとして保存する場合、編集中のデータに対する保存結果として図10(b)に示すような保存結果1002が得られる。GUIデータによる保存の場合、ファイルとしてはバイナリデータとなる。また、個々のグラフィック部品の位置情報は指定されて保存されるので、ユーザが指定した配置情報も保存することができる。また、この場合、内部表現への変換は行われないので、図9に示すような編集中のデータもGUIデータとして保存することが可能である。
次に、ファイル入出力部106から保存されている編集結果を入力する処理について図11および図12を参照しながら説明する。図11はファイル入出力部106から保存されている編集結果を入力する処理の手順を示すフローチャート、図12はテキストグラマで保存されている編集結果を自動整形して表示した画面例を示す図である。
ファイル入出力部106から保存された編集結果を入力する場合、図11に示すように、まず、ファイル入出力部106から入力される編集結果の保存形態がテキストグラマでの保存形態であるか否かの判定が行われる(ステップS1101)。入力される編集結果の保存形態がテキストグラマでの保存形態である場合、入力された編集結果が内部表現へ変換され(ステップS1102)、この変換が成功したか否かの判定が行われる(ステップS1103)。例えば編集結果にテキストグラマとしての不整合がある場合は、内部表現への変換を行うことができず、この変換は失敗することになる。このように、内部表現への変換が失敗した場合、その旨を示すエラーメッセージが画像表示部102に表示され(ステップS1104)、本処理は終了する。この場合、編集結果の入力は行われない。
上記ステップS1103において上記変換が成功したと判定された場合は、編集結果を示すデータはGUIデータへ変換され(ステップS1105)、そのGUIデータが画像表示部102に表示される(ステップS1106)。ここで、入力されるデータは、テキストグラマとしてのデータであるので、ノードの位置などの情報は、自動で整形される。例えば図12に示す画面1201のように、テキストグラマデータが自動整形されて画像表示部102に表示される。
上記ステップS1101において保存形態がテキストグラマでないと判定された場合は、編集結果がGUIデータとして入力されるので、ルール名や単語情報の内部表現への変換が行われる(ステップS1107)。次いで、保存されたデータからGUIデータの復元が行われ(ステップS1108)、そのGUIデータが画像表示部102に表示される(ステップS1106)。この場合、図10(a)の画面1001のように、ユーザが配置したノードの位置情報なども再現される。
次に、複数のノードやリンクをまとめて選択して複製し、複製されたものを貼り付ける処理について図13および図14を参照しながら説明する。図13は複数のノードやリンクをまとめて選択して複製し、複製されたものを貼り付ける処理の手順を示すフローチャート、図14は複数のノードやリンクをまとめて選択して複製し、複製されたものを貼り付ける際に、ルール名ノードの重複が発生する場合における貼り付け不可を回避するための方法を実現するための操作画面例を示す図である。
ユーザにより文字・操作入力部101を介して、まとめて選択されて複製された複数のノードやリンクを貼り付ける指示があると、図13に示すように、まず、複製されているノードを順に取り出すための順次取り出しが行われる(ステップS1301)。そして、複製されている全てのノードの取り出しが終了したか否かの判定が行われる(ステップS1302)。ここで、複製されている全てのノードの取り出しが終了した場合、複製されているノードやリンクの貼り付けが行われ(ステップS1306)、本処理は終了する。なお、複製されたノードやリンクが1つもない場合には、上記ステップS1306は自動的にスキップされて、本処理は終了する。
上記ステップS1302において複製されている全てのノードの取り出しが終了していないと判定された場合、取り出されたノードがルール定義ノードであるか否かの判定が行われる(ステップS1303)。ここで、取り出されたノードがルール定義ノードでない場合、上記ステップS1301からの処理が繰り返される。これに対し、取り出されたノードがルール定義ノードである場合、貼り付けるグラマ上で取り出されたルールが定義されているか否かの判定が行われる(ステップS1304)。ここで、上記ルールが定義されていない場合、上記ステップS1301からの処理が繰り返される。これに対し、取り出されたルールが定義されている場合、その時点で、貼り付け不可を示すエラーメッセージが画像表示部102に表示され、本処理は終了する。すなわち、ルール定義ノードを含むノードやリンクの貼り付けは、それを複製したグラマ上では不可となり、別のグラマ上での複製は可となる。
ルール定義ノードを含むノードやリンクの貼り付けが、それを複製したグラマ上では不可となる場合は、一旦、別のグラマウィンドウを作成し、ルール全体を複製し、その複製を別のグラマウィンドウに貼り付け、別のグラマウィンドウ上でルール名を変更して、変更したルールを、ルール定義を含む状態で再び元のグラマ上に貼り付けるという手順を踏めば、ルール定義ノードを含むノードやリンクの貼り付けを実現することができる。例えば図14に示すように、元のグラマウィンドウ1401に対して、別にグラマウィンドウ1402が作成される。次いで、グラマウィンドウ1401上の「空港名」のルールが、その右辺を含む状態で複製され、その複製が別のグラマウィンドウ1402上に貼り付けられる。そして、ルール名が変更され、変更されたルールは、ルール定義を含む状態で再び元のグラマ1401上に貼り付けられる。
以上より、本実施の形態によれば、ルールの分割、修正などの編集作業を、ウィンドウを切り替えることなく、簡単に行うことができる。
また、指定可能な保存形態として、編集結果をテキストグラマデータに変換して保存する形態と、編集結果をGUI(Graphical User Interface)データとして保存する形態とがあるので、拡張BNF形式などで記述することができない編集過程のデータも、保存可能となり、再利用することができる。
本実施の形態においては、ルール定義の左辺であるルール名ノードを右辺のノードと区別するために、ルール名ノードを、四隅が丸い矩形のアイコンで表示するが、枠線や背景の色を変えるなどの方法で、左辺と右辺のノードを区別するようにしてもよい。また、左辺と右辺との間に境界線を設けて、左辺のノードと右辺のノードとを区別するようにしてもよい。
また、本実施の形態においては、テキストグラマ形式への変換を1種類としているが、複数の種類のテキストグラマへの変換をサポートしてもよい。この場合、内部表現から、テキストグラマへの変換パスとして複数の変換パスを用意することになる。
また、本実施の形態においては、GUIへの保存形式の他にテキストグラマへの変換としているが、編集結果を、音声認識エンジンのサポートするグラマのバイナリ形式として出力するようにしてもよい。
また、本実施の形態においては、定義内容がないルールやルールの右辺のノードに使用されていない単語がある場合には、内部表現の作成に失敗するものとして、それらをテキストグラマに出力しないようにしているが、不十分なテキストグラマの状態でも、出力可能な部分を出力するようにしてもよい。
また、本発明の目的は、前述した実施形態の機能を実現するソフトウェアのプログラムコードを記録した記憶媒体(または記録媒体)を、システムあるいは装置に供給し、そのシステムあるいは装置のコンピュータ(またはCPUやMPU)が記憶媒体に格納されたプログラムコードを読み出し実行することによっても、達成されることはいうまでもない。この場合、記憶媒体から読み出されたプログラムコード自体が前述した実施形態の機能を実現することになり、そのプログラムコードを記憶した記憶媒体は本発明を構成することになる。
また、プログラムコードを供給するための記憶媒体としては、例えば、フロッピー(登録商標)ディスク、ハードディスク、光磁気ディスク、CD−ROM、CD−R、CD−RW、DVD−ROM、DVD−RAM、DVD−RW、DVD+RW、磁気テープ、不揮発性のメモリカード、ROM等を用いることができる。または、プログラムコードを、ネットワークを介してダウンロードしてもよい。
また、コンピュータが読み出したプログラムコードを実行することにより、前述した実施形態の機能が実現されるだけでなく、そのプログラムコードの指示に基づき、コンピュータ上で稼働しているオペレーティングシステム(OS)などが実際の処理の一部または全部を行い、その処理によって前述した実施形態の機能が実現される場合も含まれる。
さらに、記憶媒体から読み出されたプログラムコードが、コンピュータに挿入された機能拡張カードやコンピュータに接続された機能拡張ユニットに備わるメモリに書込まれた後、そのプログラムコードの指示に基づき、その機能拡張カードや機能拡張ユニットに備わるCPUなどが実際の処理の一部または全部を行い、その処理によって前述した実施形態の機能が実現される場合も含まれる。
本発明の一実施の形態に係る音声認識文法作成装置の構成を示すブロック図である。 ユーザが右辺のルール参照ノードを作成したときの処理の手順を示すフローチャートである。 図2の処理に従って遷移する編集画面例を示す図である。 (a)は既に登録されているルール名ノードのルール参照ノードが表示されている画面例を示す図、(b)はユーザにより3つ目のルール参照ノードの「駅名」を「空港」という名称に変更した場合の画面例を示す図、(c)は図4(b)の3つ目のルール参照ノードの名称の変更に伴い新たなルール名ノードが作成された画面例を示す図である。 ルール名ノードの名称を変更した場合の処理の手順を示すフローチャートである。 (a)は「空港」というルール名ノードに対してその名称を「空港名」と変更した場合の画面例を示す図、(b)は図6(a)のルール名ノードの名称の変更に伴いルール参照ノードの名称が変更された画面例を示す図である。 編集結果を保存する処理の手順を示すフローチャートである。 (a)は編集中のデータを内部表現により管理するテーブルの一例を示す図、(b)は単語の表記および読みを管理するテーブルの一例を示す図、(c)は編集結果をテキストグラマで保存した結果の一例を示す図である。 テキストグラマで保存することができない編集中のデータの画面例を示す図である。 (a)はテキストグラマで保存することができる編集中のデータの画面例を示す図、(b)は図10(a)の編集中のデータをGUIデータで保存した結果の一例を示す図である。 ファイル入出力部106から保存されている編集結果を入力する処理の手順を示すフローチャートである。 テキストグラマで保存されている編集結果を自動整形して表示した画面例を示す図である。 複数のノードやリンクをまとめて選択して複製し、複製されたものを貼り付ける処理の手順を示すフローチャートである。 複数のノードやリンクをまとめて選択して複製し、複製されたものを貼り付ける際に、ルール名ノードの重複が発生する場合における貼り付け不可を回避するための方法を実現するための操作画面例を示す図である。
符号の説明
101 文字・操作入力部
102 画像表示部
103 画像編集管理部
104 グラマ内部表現管理部
105 テキストグラマ変換部
106 ファイル入出力部

Claims (4)

  1. ルール名と、参照先の語彙を表す単語または参照先のルール名を表すルール参照とが対応付けて記述された複数のルール定義を含むグラマを、グラフィカルユーザインタフェースを用いて、前記ルール名を表す名称が付与されたノードと、前記単語を表す名称が付与されたノードと、前記ルール参照を表す名称が付与されたノードとして表現し、編集する音声認識文法作成装置であって、
    同時に同一画面上に前記グラフィカルユーザインタフェースを用いて、前記グラマに含まれる複数の前記ルール定義に記述された各々のルール名を表す名称が付与されたノードと、各々の単語を表す名称が付与されたノードと、各々ルール参照を表す名称が付与されたノードとを表示させ、更に、前記グラマに基づいて所定の前記ノード間にリンクを表示させる表示制御手段と、
    ユーザが前記グラフィカルユーザインタフェースに対して行った操作に対応する情報を蓄積する蓄積手段と、
    前記蓄積手段に蓄積された前記画面上に表示された前記ノードの名称を変更する操作に対応する情報に基づいて、前記グラマに含まれる前記ルール名の名称を変更すると共に、前記グラマに含まれるルール参照であって、名称が変更されたルール名を参照先とする全てのルール参照の名称を変更後の前記ルール名と同じ名称に変更する変更手段と
    を有することを特徴とする音声認識文法作成装置。
  2. ルール名と、参照先の語彙を表す単語または参照先のルール名を表すルール参照とが対応付けて記述された複数のルール定義を含むグラマを、グラフィカルユーザインタフェースを用いて、前記ルール名を表す名称が付与されたノードと、前記単語を表す名称が付与されたノードと、前記ルール参照を表す名称が付与されたノードとして表現し、編集する、情報処理装置による音声認識文法作成方法であって、
    前記情報処理装置が、
    同時に同一画面上に前記グラフィカルユーザインタフェースを用いて、前記グラマに含まれる複数の前記ルール定義に記述された各々のルール名を表す名称が付与されたノードと、各々の単語を表す名称が付与されたノードと、各々ルール参照を表す名称が付与されたノードとを表示手段に表示させ、更に、前記グラマに基づいて所定の前記ノード間にリンクを前記表示手段に表示する工程と、
    ユーザが前記グラフィカルユーザインタフェースに対して行った操作に対応する情報を記憶手段に蓄積する工程と、
    前記記憶手段に蓄積された前記画面上に表示された前記ノードの名称を変更する操作に対応する情報に基づいて、前記グラマに含まれる前記ルール名の名称を変更すると共に、前記グラマに含まれるルール参照であって、名称が変更されたルール名を参照先とする全てのルール参照の名称を変更後の前記ルール名と同じ名称に変更する工程と
    実施することを特徴とする音声認識文法作成方法。
  3. ルール名と、参照先の語彙を表す単語または参照先のルール名を表すルール参照とが対応付けて記述された複数のルール定義を含むグラマを、グラフィカルユーザインタフェースを用いて、前記ルール名を表す名称が付与されたノードと、前記単語を表す名称が付与されたノードと、前記ルール参照を表す名称が付与されたノードとして表現し、編集する音声認識文法作成方法をコンピュータにより実施可能にするためのプログラムであって、
    同時に同一画面上に前記グラフィカルユーザインタフェースを用いて、前記グラマに含まれる複数の前記ルール定義に記述された各々のルール名を表す名称が付与されたノードと、各々の単語を表す名称が付与されたノードと、各々ルール参照を表す名称が付与されたノードとを表示手段に表示させ、更に、前記グラマに基づいて所定の前記ノード間にリンクを前記表示手段に表示させるステップと、
    ユーザが前記グラフィカルユーザインタフェースに対して行った操作に対応する情報を記憶手段に蓄積するステップと、
    前記記憶手段に蓄積された前記画面上に表示された前記ノードの名称を変更する操作に対応する情報に基づいて、前記グラマに含まれる前記ルール名の名称を変更すると共に、前記グラマに含まれるルール参照であって、名称が変更されたルール名を参照先とする全てのルール参照の名称を変更後の前記ルール名と同じ名称に変更するステップと
    を前記コンピュータにより実行させることを特徴とするプログラム。
  4. 請求項3記載のプログラムをコンピュータにより読み取り可能に格納したことを特徴とする記憶媒体。
JP2004170290A 2004-06-08 2004-06-08 音声認識文法作成装置、音声認識文法作成方法、プログラムおよび記憶媒体 Expired - Fee Related JP4579585B2 (ja)

Priority Applications (2)

Application Number Priority Date Filing Date Title
JP2004170290A JP4579585B2 (ja) 2004-06-08 2004-06-08 音声認識文法作成装置、音声認識文法作成方法、プログラムおよび記憶媒体
US11/147,836 US20050273329A1 (en) 2004-06-08 2005-06-08 Speech recognition grammar creating apparatus, speech recognition grammar creating method, program for implementing the method, and storage medium storing the program

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2004170290A JP4579585B2 (ja) 2004-06-08 2004-06-08 音声認識文法作成装置、音声認識文法作成方法、プログラムおよび記憶媒体

Publications (2)

Publication Number Publication Date
JP2005351980A JP2005351980A (ja) 2005-12-22
JP4579585B2 true JP4579585B2 (ja) 2010-11-10

Family

ID=35450129

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2004170290A Expired - Fee Related JP4579585B2 (ja) 2004-06-08 2004-06-08 音声認識文法作成装置、音声認識文法作成方法、プログラムおよび記憶媒体

Country Status (2)

Country Link
US (1) US20050273329A1 (ja)
JP (1) JP4579585B2 (ja)

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP5464785B2 (ja) * 2006-12-05 2014-04-09 キヤノン株式会社 情報処理装置および情報処理方法

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH04253099A (ja) * 1991-01-30 1992-09-08 Nec Corp 連続音声認識方式
JPH04367073A (ja) * 1991-06-14 1992-12-18 Hitachi Ltd 機械翻訳システムにおける文法作成支援方法
JPH05265736A (ja) * 1992-03-19 1993-10-15 Mitsubishi Electric Corp レイアウト装置
JPH0844384A (ja) * 1994-07-26 1996-02-16 Nec Corp 連続単語音声認識装置
JP2003157095A (ja) * 2001-11-22 2003-05-30 Canon Inc 音声認識装置及びその方法、プログラム

Family Cites Families (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6434523B1 (en) * 1999-04-23 2002-08-13 Nuance Communications Creating and editing grammars for speech recognition graphically
US7191119B2 (en) * 2002-05-07 2007-03-13 International Business Machines Corporation Integrated development tool for building a natural language understanding application

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH04253099A (ja) * 1991-01-30 1992-09-08 Nec Corp 連続音声認識方式
JPH04367073A (ja) * 1991-06-14 1992-12-18 Hitachi Ltd 機械翻訳システムにおける文法作成支援方法
JPH05265736A (ja) * 1992-03-19 1993-10-15 Mitsubishi Electric Corp レイアウト装置
JPH0844384A (ja) * 1994-07-26 1996-02-16 Nec Corp 連続単語音声認識装置
JP2003157095A (ja) * 2001-11-22 2003-05-30 Canon Inc 音声認識装置及びその方法、プログラム

Also Published As

Publication number Publication date
US20050273329A1 (en) 2005-12-08
JP2005351980A (ja) 2005-12-22

Similar Documents

Publication Publication Date Title
US5459827A (en) Layout method for structured documents
JP5159713B2 (ja) システムの構成要素の設計アーキテクチャを自動設計する自動設計装置、自動設計方法及び自動設計プログラム
JP4940973B2 (ja) 論理構造認識処理プログラム、論理構造認識処理方法および論理構造認識処理装置
CN106294493A (zh) 实现文档格式转换的方法及装置
JP4566196B2 (ja) 文書処理方法および装置
CN106502680A (zh) 一种通过可视化界面进行图元扩展的方法
JP4579585B2 (ja) 音声認識文法作成装置、音声認識文法作成方法、プログラムおよび記憶媒体
JP4627530B2 (ja) 文書処理方法および装置
JP4579595B2 (ja) 音声認識文法作成装置、音声認識文法作成方法、プログラム、及び記憶媒体
JP5082971B2 (ja) 音声合成装置およびそれを用いた読み上げシステム。
CN105446967A (zh) 一种多模态评价报告的生成方法
JP2007079906A (ja) ソースコード生成装置
JP2008108266A (ja) 2レベル形態規則をコンパイルするための方法及びその装置
JP4719743B2 (ja) グラフ処理装置
JP2007025965A (ja) オブジェクト指向分析設計支援装置
CN111797056B (zh) 一种矢量化家谱书生成方法及***
JPS63109578A (ja) 論理図概要表示処理方式
JP2004348480A (ja) データ処理装置、データ処理方法、データ処理プログラム、およびデータ処理プログラムを記録したコンピュータ読取可能な記録媒体
CN115454414A (zh) 一种代码处理方法、装置及计算机可读存储介质
JP2010182031A (ja) ソフトウエア生成支援装置
Arangua et al. Reusable Procedural Building Parts.
CN103324789A (zh) 应用建模工具展现本体的方法和装置
JP2001005703A (ja) テキスト型ファイルの生成方法及びシステム
JP2003223182A (ja) 表音テキスト編集装置および編集方法ならびに記憶媒体、プログラム
KR101401947B1 (ko) 문서 저장 방법, 이를 실행하는 사용자 단말 및 이를 저장하는 기록 매체

Legal Events

Date Code Title Description
RD03 Notification of appointment of power of attorney

Free format text: JAPANESE INTERMEDIATE CODE: A7423

Effective date: 20060419

A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20070607

RD05 Notification of revocation of power of attorney

Free format text: JAPANESE INTERMEDIATE CODE: A7425

Effective date: 20070626

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20090612

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20090707

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20090903

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20100202

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20100217

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20100824

A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20100826

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20130903

Year of fee payment: 3

R150 Certificate of patent or registration of utility model

Free format text: JAPANESE INTERMEDIATE CODE: R150

LAPS Cancellation because of no payment of annual fees