JP2014126925A

JP2014126925A - 情報検索装置および情報検索方法

Info

Publication number: JP2014126925A
Application number: JP2012281329A
Authority: JP
Inventors: Takahiro Otsuka; 貴弘大塚; Keigo Kawashima; 啓吾川島; Tadashi Yamaura; 正山浦
Original assignee: Mitsubishi Electric Corp
Current assignee: Mitsubishi Electric Corp
Priority date: 2012-12-25
Filing date: 2012-12-25
Publication date: 2014-07-07

Abstract

【課題】ユーザの自由な入力音声に対して高精度に単語列の検索を行い、且つ入力音声を音声認識した結果に誤りが存在した場合にも高精度に単語列の検索を行う。
【解決手段】拡張ルール記憶部５に蓄積された編集パターンを参照し、言語解析部３が作成した形態素の種別および品詞に基づいて、当該複数の形態素の読みを編集して複数の検索対象を作成する拡張部４と、音声認識部１が入力音声を音声認識した音声認識結果と、拡張部４が作成した複数の検索対象との一致を検索し、検索した一致数に基づいた検索結果を出力する曖昧検索部６とを備える。
【選択図】図１

Description

この発明は、入力音声に対応する単語列を用いて情報を検索する情報検索装置および情報検索方法に関するものである。

ユーザの発話である入力音声に対応するテキスト中の単語列を検索する従来の技術では、入力音声を音声認識して得られた発音のシンボル列と、検索対象であるテキストを解析して得られる発音のシンボル列とのマッチングをとることによって、テキスト中の単語列を検索する。例えば、特許文献１に開示された検索装置では、入力音声の認識結果の発音を表す発音シンボルの並びである認識結果発音シンボル列と、入力音声に対応する単語列の検索の結果である検索結果単語列となり得る検索結果対象単語列の発音を表す発音シンボルの並びである検索結果対象発音シンボル列とのマッチングをとり、マッチングの度合の大きい順に検索結果対象単語列として出力している。

特開２０１１−１１８７７４号公報

しかしながら、上述した特許文献１に開示された技術では、入力音声の認識結果発音シンボル列と、テキストを解析して得られる検索結果対象発音シンボル列とのマッチングを行うため、テキストに出現しない発音のシンボル列を含んだ認識結果発音シンボル列の場合、検索結果対象発音シンボル列とのマッチングが行えず、所望の検索結果（マッチングの度合い、あるいは単語列を出力する順番）が得られないという課題があった。
ここで、テキストに出現しない発音のシンボル列を含んだ認識結果発音シンボル列とは、例えば言い淀みのある入力音声や音声認識技術の不完全さなどが原因で生じる予期せぬ入力音声の発音のシンボル列である。また、例えばテキストに含まれない言葉をユーザが発話して得られた入力音声の発音のシンボル列である。

この発明は、上記のような課題を解決するためになされたもので、ユーザの自由な入力音声に対して高精度に単語列の検索を行い、且つ入力音声を音声認識した結果に誤りが存在した場合にも高精度に単語列の検索を可能とする情報検索装置および情報検索方法を提供することを目的とする。

この発明に係る情報検索装置は、あらかじめ設定された単語列を種別毎に形態素解析し、各種別において読みと品詞で構成される形態素を作成する言語解析部と、形態素の種別および品詞を用いて設定された、形態素間の編集パターンを蓄積した拡張ルール記憶部と、拡張ルール記憶部に蓄積された編集パターンを参照し、言語解析部が作成した形態素の種別および品詞に基づいて、当該複数の形態素の読みを編集して複数の検索対象を作成する拡張部と、入力音声を音声認識した音声認識結果と、拡張部が作成した複数の検索対象との一致を検索し、検索した一致数に基づいた検索結果を出力する検索部とを備えるものである。

この発明によれば、音声認識結果と検索対象の一致数を高めることができ、適切なマッチングの度合を取得することができる。これにより入力音声に対して適切な単語列を検索し、出力することができる。

実施の形態１による情報検索装置の構成を示すブロック図である。実施の形態１による情報検索装置の記事データベースの構成を示す図である。実施の形態１による情報検索装置の拡張ルールの構成を示す図である。実施の形態１による情報検索装置の形態素の構成を示す図である。実施の形態１による情報検索装置の拡張検索対象の構成を示す図である。実施の形態１による情報検索装置の曖昧検索結果の構成を示す図である。実施の形態２による情報検索装置の拡張ルールの構成を示す図である。実施の形態１および実施の形態２による情報検索装置のその他の構成を示すブロック図である。

実施の形態１．
図１は、この発明の実施の形態１による情報検索装置の構成を示すブロック図である。
図１において、情報検索装置１０は音声認識部１、記事データベース部（データ蓄積部）２、言語解析部３、拡張部４、拡張ルール記憶部５および曖昧検索部（検索部）６で構成されている。
音声認識部１は、情報検索装置１０に入力された音声である入力音声１０１を解析して音声特徴を取得し、取得した特徴から推定された読みを認識結果１０２として出力する。

記事データベース部２は、複数の記事（あらかじめ設定された単語列）１０３を記憶するデータベースであり、図２に当該記事データベース部２に記憶された記事データベースの一例を示す。記事データベースは、記事番号２０１、属性Ａ２０２、属性Ｂ２０３および内容２０４で構成されている。記事番号２０１は、複数の記事１０３を識別するための識別番号であり。属性Ａ２０２、属性Ｂ２０３および内容２０４はそれぞれ記事の種別を示し、属性（Ａ，Ｂ）２０２，２０３は、記事１０３を分類する情報を単語で示したものであり、内容２０４は、記事の内容を示す文章である。図２において、例えば、記事番号２０１が「１」の記事は、属性Ａ２０２が「太陽放送」であり、属性Ｂ２０３が「ニュース」であり、内容２０４が「野球と政治情報をお伝えします。」であることを示している。
なお、図２では属性Ａおよび属性Ｂの２つの属性を例に示したが、設定する属性の数は２つに限定されるものではなく、適宜変更可能である。

言語解析部３は、記事データベース部２に記憶された記事１０３の属性と内容をそれぞれ形態素解析して得られた形態素１０４を出力する。拡張部４は、拡張ルール記憶部５に記憶された拡張ルール１０５に従い、形態素１０４の読みを編集し、拡張検索対象１０６を作成する。なお、拡張部４は、形態素１０４の読みを単純に連結して拡張検索対象１０６を作成してもよい。

拡張ルール記憶部５は、複数の拡張ルール１０５を記憶する記憶領域であり、図３に当該拡張ルール記憶部５に記憶された拡張ルール１０５の一例を示す。拡張ルール１０５は、ルール番号３０１とルールパターン３０２で構成される。ルール番号３０１は、複数の拡張ルール１０５を識別するための識別番号であり、ルールパターン３０２は、形態素１０４を編集するパターンを定義したものである。
図３では、９つの拡張ルール１０５を示しており、例えば、ルール番号３０１が「１」の拡張ルール１０５は、ルールパターン３０２が「属性Ａ＋”の”＋属性Ｂ」であることを示している。なお、ルールパターン３０２は、図３に示した以外にも適宜設定可能である。また、ルールパターン３０２の詳細については後述する。

曖昧検索部６は、音声認識部１から出力された認識結果１０２の読みと、拡張部４から出力された拡張検索対象１０６の読みを、それぞれ部分文字列に分解し、認識結果１０２の部分文字列が、拡張検索対象１０６の部分文字列の中に存在するか否かの判定を行い、存在すると判定された数の合計を一致数とし、一致数の大きい拡張検索対象１０６から順に記事番号を出力記事番号列１０７として出力する。

次に、各構成の詳細な動作について具体例を参照しながら説明を行う。なお以下では、記事データベース部２および拡張ルール記憶部５が、図２および図３で示した記事１０３および拡張ルール１０５を記憶している場合を例に説明を行う。
まず、音声認識部１は、入力音声１０１を解析して音声特徴を取得し、取得した音声特徴から推定された読みを認識結果１０２として曖昧検索部６に出力する。ここで、入力音声１０１は、ユーザの発話を録音することにより取得した信号である。また、音声特徴は、例えばケプストラムと呼ばれる音声の特徴を示すパラメータであり、音声特徴に対応する読みの推定には、例えばＨＭＭ（ＨｉｄｄｅｎＭａｒｋｏｖＭｏｄｅｌ)など公知の手法を用いる。

音声認識部１によって、ユーザの発話「野球のニュース」を録音することにより取得した入力音声１０１に対して、「はきゅうのにゅう」を認識結果１０２として出力した場合を例に説明する。この場合、ユーザの発話の言い淀みや、録音する環境における騒音の影響や、音声認識技術の不完全さなどから、期待する認識結果「やきゅうのにゅうす」が得られない。具体的には、「や」が「は」に置換され、「す」が脱落する誤りが生じている。

次に、言語解析部３は、記事データベース部２に蓄積された記事番号２０１が「１」から「４」の各記事１０３の属性Ａ２０２、属性Ｂ２０３および内容２０４をそれぞれ形態素解析し、得られた形態素１０４を拡張部４に出力する。形態素解析は公知である方法を用いて行い、記事１０３の属性Ａ２０２、属性Ｂ２０３および内容２０４をそれぞれ単語に分解し、分解した各単語の読みおよび品詞を与えるものである。図４に、言語解析部３が生成した形態素１０４の一例を示す。図４では、図２に示した記事データベースの記事番号２０１が「１」および「２」の記事１０３の属性Ａ２０２、属性Ｂ２０３および内容２０４に対して形態素解析を行って得られた形態素１０４を示している。

図４で示した形態素１０４の記事番号４０１、属性Ａ４０２、属性Ｂ４０３および内容４０４は、図２で示した記事１０３を構成する記事番号２０１、属性Ａ２０２、属性Ｂ２０３および内容２０４に対応している。
図４において、記事番号４０１が「１」の属性Ａ４０２は「太陽放送/たいよおほおそお/固有名詞」であり、「太陽放送」を形態素解析して得られた形態素を示しており、単語「太陽放送」、読み「たいよおほおそお」、品詞「固有名詞」が得られたことを示している。
また、記事番号４０１が「１」の内容４０４は「野球/やきゅう/一般名詞：ジャンル」などで構成され、図２の内容２０４で示した「野球と政治情報をお伝えします。」を形態素解析して得られた形態素を示している。例えば、単語「野球」、読み「やきゅう」、品詞「一般名詞：ジャンル」が得られたことを示している。

ここで、「一般名詞：ジャンル」は、単語「野球」の品詞が一般名詞であり、さらに、ユーザが発話して検索すると推定される種類であることを示すための付加情報「：ジャンル」を付加して表現されている。付加情報は、形態素解析に用いられる形態素の辞書の品詞にあらかじめ付与することができる。あるいは、形態素解析して得られた形態素を参照して、事前に決めた規則（例えば、「野球／やきゅう／一般名詞」であれば「：ジャンル」を付与する）に基づいて、付加情報を付与するように構成してもよい。

次に、拡張部４は、拡張ルール記憶部５に記憶された拡張ルール１０５に従い、言語解析部３から入力された形態素１０４の読みを編集し、拡張検索対象１０６を作成する。なお、形態素１０４の読みを単純に連結して拡張検索対象１０６を作成するように構成してもよい。図５に、拡張部４が作成した拡張検索対象１０６の一例を示す。
拡張検索対象１０６は、記事番号５０１と検索対象５０２で構成される。なお、図５に示した拡張検索対象１０６は、図３で示した拡張ルール１０５に従い、図４で示した形態素１０４の読みを編集して得られたものである。

図５で示した拡張検索対象１０６の記事番号５０１は、図４で示した形態素１０４を構成する記事番号４０１に対応している。
図５において、記事番号５０１が「１」の検索対象５０２は「たいよおほおそお」、「にゅうす」、「やきゅうとせえじじょおほおおおつたえします」、「たいようほおそおのにゅうす」、「やきゅうのにゅうす」、「・・・」であり、形態素１０４の読みに基づいて作成されている。なお、「・・・」は後続する文字を省略したことを示している。

例えば、記事番号５０１が「１」の検索対象５０２の「やきゅうとせえじじょおほおおおつたえします」は、形態素１０４の読み「やきゅう」、「と」、「せえじじょおほお」、「お」、「おつたえします」を単純に連結して作成した検索対象である。
また、記事番号５０１が「１」の検索対象５０２の「たいよおほおそおのにゅうす」は、図３に示した拡張ルール１０５のルール番号３０１が「１」のルールパターン３０２「属性Ａ＋”の”＋属性Ｂ」に従い、図４で示した形態素１０４の記号番号４０１が「１」の属性Ａ４０２「たいよおほおそお」と属性Ｂ４０３「にゅうす」とを、特定の文字列「の」を用いて連結して作成した検索対象である。

さらに、記事番号５０１が「２」の検索対象５０２の「ちゃんにゅうさまがしゅつえんのどらま」は、図３に示した拡張ルール１０５のルール番号３０１が「９」のルールパターン「人名＋”さまがしゅつえんの”＋属性Ｂ」に従い、図４で示した形態素１０４の記号番号４０１が「２」の人名「ちゃんにゅう」と属性Ｂ「どらま」とを「さまがしゅつえんの」を用いて連結して作成した検索対象である。

このように、拡張ルール記憶部５の拡張ルール１０５では、属性と品詞を用いて読みを指定し、また、ユーザが発話すると推定される特定の文字列とを用いて、形態素１０４を編集する方法を定義している。拡張部４は、当該拡張ルール１０５に従ってユーザが発話すると推定される拡張された検索対象を作成することができる。

次に、曖昧検索部６は、拡張部４から入力される拡張検索対象１０６の読みと、音声認識部１から入力される認識結果１０２の読みとを、それぞれ部分文字列に分解し、認識結果１０２の部分文字列が、拡張検索対象１０６の部分文字列に「ある」か「ない」かを検索し、「ある」と検索された数の合計を一致数として算出する。一致数が大きい拡張検索対象１０６から順に対応する記号番号５０１を、出力記事番号列１０７として出力する。

図６は、曖昧検索部６の曖昧検索結果を示す一例である。具体的には、誤りが存在する認識結果１０２に対する、拡張検索対象１０６の記事番号５０１が「１」および「２」の検索対象５０２の一致数の算出結果を示している。なお、図５で示した拡張検索対象１０６を例に説明を行う。
曖昧検索結果は、認識結果の部分文字（認識結果に誤りが存在する）６０１、記事番号「１」６０２、記事番号「２」６０３、一致数６０４および参考６０５で構成されている。

認識結果の部分文字６０１は、認識結果１０２の「はきゅうのにゅう」について、先頭から順に１文字のみ重複させて２文字の長さに分解した部分文字列「はきゅ」「きゅう」「うの」「のにゅ」「にゅう」を示している。なお、認識結果１０２の分解方法としては、先頭から順に２文字のみ重複させて３文字の長さに分解するなど、種々の方法を適用可能であり、上述の方法に限定されるものではない。

記事番号「１」６０２、記事番号「２」６０３は、認識結果の部分文字（以下、部分文字列と称する）６０１が検索対象５０２に存在するか否かの結果を「ある」、「なし」で示している。具体的に説明すると、部分文字列の「はきゅう」に対して記事番号「１」の「ない」は、記事番号「１」の検索対象５０２（図５参照）内に「はきゅう」の文字列が存在しないことを示している。一方、部分文字列の「きゅう」に対して記事番号「１」の「ある」は、記事番号「１」の検索対象５０２内に「きゅう」の文字列が存在する（「やきゅうとせえじ・・・」内の「きゅう」や、「やきゅうのにゅうす」内の「きゅう」）ことを示している。

一致数６０４は、記事番号「１」６０２および記事番号「２」６０３において、それぞれ「ある」と検索された結果数を示している。記事番号「１」６０２の一致数は「４」であり、記事番号「２」６０３の一致数は「３」である。この２つの一致数が得られた場合、出力記事番号列１０７は、記事番号「１」、記事番号「２」の順の番号列となる。

参考６０５は、拡張部４の効果を示すために、拡張検索処理が行われなかった場合の記事番号「１」に対する曖昧検索結果を示している。具体的には、図３に示した拡張ルール１０５を適用しなかった場合の検索対象５０２（図５参照）に対して、部分文字列６０１が存在するか否かの結果を示している。
拡張ルール１０５を適用しなかった場合の記事番号１の検索対象５０２は「たいよおほおそお」、「にゅうす」、「やきゅうとせえじじょおほおおおつたえします」であり、部分文字列６０１との一致数は「２」である。また、拡張検索処理が行われなかった場合の記事番号「２」に対する曖昧検索結果は、記事番号「２」６０３と同一の結果であり、一致数は「３」である。

仮に、拡張を行わなかった場合の記事番号「１」の一致数「２」は、記事番号２の一致数「３」よりも小さいため、出力記事番号１０７は、記事番号「２」、記事番号「１」の順の番号列となる。この場合、「野球のニュース」を発話したユーザの期待する記事番号「１」に対して、記事番号「２」が優先されることとなり、所望の検索結果が得られない。このように、拡張ルール１０５を適用することにより、発話したユーザの期待する検索結果を得る精度を高めることができる。

また、上述した例では、属性の形態素の読みと、内容の形態素の読みとを、特定の文字列（例えば”の”）を用いて連結する例を示したが、特定の文字を用いることなく、属性の形態素の読みと、内容の形態素の読みとを連結してもよい。例えば、図３に示した拡張ルール１０５のルール番号３０１が「４」のルールパターン３０２「ジャンル＋属性Ｂ」は、特定の文字を用いることなく、属性の形態素の読みと、内容の形態素の読みとを組み合わせた例である。

このルール番号３０１が「４」のルールパターン３０２を適用した場合、図４で示した記号番号４０１が「１」の属性Ｂ４０３の読み「にゅうす」と、内容４０４の読み「やきゅう」とが連結され、検索対象５０２として「やきゅうにゅうす」が得られる。認識結果１０２が「やきゅうにゅうす」（記事の単語列の順番が異なる）の時、ルール番号３０１が「４」のルールパターン３０２が与えられない場合と比較して、図６で示した記事番号「１」６０２の一致数６０４を大きい値とすることができる。

以上のように、この実施の形態１によれば、形態素を編集する方法を定義したルールパターンを記憶した拡張ルール記憶部５と、拡張ルール記憶部５に記憶されたルールパターンに従って、属性の形態素の読みと、内容の形態素の読みとを編集して拡張検索対象を作成する拡張部４と、認識結果の部分文字列が、拡張部４が作成した拡張検索対象内に存在するか否かの曖昧検索を行い、存在数が多い記事番号順の出力記事番号列を出力する曖昧検索部６とを備えるように構成したので、音声認識結果に誤りが含まれている、あるいは情報検索装置内にあらかじめ蓄積されていない言葉をユーザが発話した、あるいは情報検索装置内にあらかじめ蓄積された単語列の順番と異なる言葉をユーザが発話した場合であっても、音声認識結果の部分文字列が拡張検索対象に含まれる割合を高めることができ、曖昧検索において適切な一致数（マッチング度合）を得ることができる。これにより、適切な順序で記載された出力記事番号列を得ることができる。

また、この実施の形態１によれば、属性の形態素の読みと、内容の形態素の読みに加えて、特定の文字を組み合わせて拡張検索対象を作成し、認識結果の部分文字列が作成した拡張検索対象内に存在するか否かの曖昧検索を行うように構成したので、音声認識結果に誤りが含まれている、あるいは情報検索装置内にあらかじめ蓄積されていない言葉をユーザが発話した、あるいは情報検索装置内にあらかじめ蓄積された単語列の順番と異なる言葉をユーザが発話した場合であっても、音声認識結果の部分文字列が拡張検索対象に含まれる割合をより高めることができ、曖昧検索において適切な一致数（マッチング度合）を得ることができる。これにより、より適切な順序で記載された出力記事番号列を得ることができる。

実施の形態２．
上述した実施の形態１では、拡張ルール１０５を用いて、形態素１０４の属性読みと内容の読みとを組み合わせて拡張検索対象１０６を作成する構成を示したが、この実施の形態２では形態素１０４の属性と内容に含まれる特定の読みを異なる読みに置き換え、他の形態素の読みと組み合わせる構成を示す。
なお、実施の形態２による情報検索装置の構成要素は、実施の形態１の図１で示した情報検索装置１０と同一であるためブロック図の記載を省略する。また、各構成要素は、実施の形態１で使用した符号と同一の符号を付して説明を省略または簡略化する。

拡張ルール記憶部５は、図３に示した拡張ルール１０５に加えて、置換拡張ルール１０５´を記憶する。置換拡張ルール１０５´の一例を図７に示す。置換拡張ルール１０５´は、ルール番号７０１とルールパターン７０２で構成される。ルール番号７０１は、複数の置換拡張ルール１０５´を識別するための識別番号であり、ルールパターン７０２は、形態素１０４を編集する方法を定義したものである。図７では、２つの置換拡張ルール１０５´の例を示しており、例えば、ルール番号７０１が「１」の置換拡張ルール１０５´は、ルールパターン７０２が「属性Ａ［すいせえてれび→すいせえ］＋”の”＋属性Ｂ」であることを示している。

このルールパターン７０２では、属性Ａの読みが「すいせえてれび」の場合に、「すいせえ」に置き換えを行い、属性Ｂの読みとを、特定の文字列”の”を用いて連結することを定義している。このルールパターン７０２を適用することにより、拡張部４は図４で示した形態素１０４の記事番号４０１が「２」の属性Ａ４０２の読み「すいせえてれび」と、属性Ｂ４０３の読み「どらま」を編集し、拡張検索対象として「すいせえのどらま」を作成する。

この置換拡張ルール１０５´を適用することにより、ユーザの発話を音声認識した認識結果１０２が「すいせえのどらま」である場合に、記事番号「２」の一致数を大きい値とすることができ、認識結果１０２の部分文字列が拡張検索対象に含まれる割合を高めることができる。

なお、上述した例では、置換拡張ルール１０５´のルールパターンとして属性Ａの読みを置換する場合を例に示したが、図７に示すように属性Ｂの読みを置換するルールパターンを設定することも可能である。

以上のように、この実施の形態２によれば、形態素の属性および内容の特定の読みを異なる読みに置き換える置換拡張ルール１０５´を記憶した拡張ルール記憶部５と、置換した形態素の属性または内容の読みと、その他の形態素の読みとを連結して拡張検索対象を作成する拡張部４とを備えるように構成したので、音声認識結果に誤りが含まれている、あるいは情報検索装置内にあらかじめ蓄積されていない言葉をユーザが発話した、あるいは情報検索装置内にあらかじめ蓄積された単語列の順番と異なる言葉をユーザが発話した場合であっても、音声認識結果の部分文字列が拡張検索対象に含まれる割合をより高めることができ、曖昧検索において適切な一致数（マッチング度合）を得ることができる。これにより、より適切な順序で記載された出力記事番号列を得ることができる。

なお、上述した実施の形態１および実施の形態２では、情報検索装置１０が音声認識部１および記事データベース部２を備える構成を示したが、図８に示すように、例えばインターネットなどのネットワーク上など情報検索装置１０´の外部に音声認識手段１´および記事データベース提供手段２´を配置するように構成してもよい。さらに音声認識手段１´および記事データベース提供手段２´は、ネットワーク上に存在する音声認識サービスおよび記事データベース提供サービスを用いて実現し、情報検索装置１０´は当該サービスから認識結果および記事の情報のみを取得するように構成してもよい。

なお、本願発明はその発明の範囲内において、各実施の形態の自由な組み合わせ、あるいは各実施の形態の任意の構成要素の変形、もしくは各実施の形態において任意の構成要素の省略が可能である。

１音声認識部、１´ 音声認識手段、２記事データベース部、２´ 記事データベース提供手段、３言語解析部、４拡張部、５拡張ルール記憶部、６曖昧検索部、１０，１０´ 情報検索装置。

Claims

入力音声に対応した単語列を検索する情報検索装置において、
あらかじめ設定された単語列を種別毎に形態素解析し、各種別において読みと品詞で構成される形態素を作成する言語解析部と、
前記形態素の種別および品詞を用いて設定された、前記形態素間の編集パターンを蓄積した拡張ルール記憶部と、
前記拡張ルール記憶部に蓄積された編集パターンを参照し、前記言語解析部が作成した形態素の種別および品詞に基づいて、当該複数の形態素の読みを編集して複数の検索対象を作成する拡張部と、
前記入力音声を音声認識した音声認識結果と、前記拡張部が作成した複数の検索対象との一致を検索し、検索した一致数に基づいた検索結果を出力する検索部とを備えたことを特徴とする情報検索装置。
前記あらかじめ設定された単語列を前記種別毎に蓄積するデータ蓄積部と、
前記入力音声を音声認識する音声認識部とを備えたことを特徴とする請求項１記載の情報検索装置。
前記拡張ルール記憶部は、複数の前記形態素の読みを、特定の文字列を介して接続する編集パターンを蓄積することを特徴とする請求項１または請求項２記載の情報検索装置。
前記拡張ルール記憶部は、前記形態素の読みをあらかじめ設定された他の読みに置換した後、その他の形態素の読みと接続する編集パターンを蓄積することを特徴とする請求項１から請求項３のいずれか１項記載の情報検索装置。
あらかじめ設定された単語列を種別毎に形態素解析し、各種別において読みと品詞で構成された形態素を作成する言語解析部と、前記形態素の種別および品詞を用いて設定された前記形態素間の編集パターンを蓄積する拡張ルール記憶部とを備え、入力音声に対応した単語列を検索する情報検索方法において、
拡張部が、前記編集パターンを参照し、前記言語解析部が作成した形態素の種別および品詞に基づいて、当該複数の形態素の読みを編集した複数の検索対象を作成するステップと、
検索部が、前記入力音声を音声認識した音声認識結果と、前記拡張部が作成した複数の検索対象との一致を検索し、検索した一致数に基づいた検索結果を出力するステップとを備えたことを特徴とする情報検索方法。
音声認識部が、前記入力音声を音声認識するステップを備えたことを特徴とする請求項５記載の情報検索方法。
前記拡張ルール記憶部が、複数の前記形態素の読みを、特定の文字列を介して接続する編集パターンを蓄積することを特徴とする請求項５または請求項６記載の情報検索方法。
前記拡張ルール記憶部が、前記形態素の読みをあらかじめ設定された他の読みに置換した後、その他の形態素の読みと接続する編集パターンを蓄積することを特徴とする請求項５から請求項７のいずれか１項記載の情報検索方法。