JP2014126925A - 情報検索装置および情報検索方法 - Google Patents
情報検索装置および情報検索方法 Download PDFInfo
- Publication number
- JP2014126925A JP2014126925A JP2012281329A JP2012281329A JP2014126925A JP 2014126925 A JP2014126925 A JP 2014126925A JP 2012281329 A JP2012281329 A JP 2012281329A JP 2012281329 A JP2012281329 A JP 2012281329A JP 2014126925 A JP2014126925 A JP 2014126925A
- Authority
- JP
- Japan
- Prior art keywords
- search
- morpheme
- unit
- speech
- reading
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Images
Landscapes
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Abstract
【課題】ユーザの自由な入力音声に対して高精度に単語列の検索を行い、且つ入力音声を音声認識した結果に誤りが存在した場合にも高精度に単語列の検索を行う。
【解決手段】拡張ルール記憶部5に蓄積された編集パターンを参照し、言語解析部3が作成した形態素の種別および品詞に基づいて、当該複数の形態素の読みを編集して複数の検索対象を作成する拡張部4と、音声認識部1が入力音声を音声認識した音声認識結果と、拡張部4が作成した複数の検索対象との一致を検索し、検索した一致数に基づいた検索結果を出力する曖昧検索部6とを備える。
【選択図】図1
【解決手段】拡張ルール記憶部5に蓄積された編集パターンを参照し、言語解析部3が作成した形態素の種別および品詞に基づいて、当該複数の形態素の読みを編集して複数の検索対象を作成する拡張部4と、音声認識部1が入力音声を音声認識した音声認識結果と、拡張部4が作成した複数の検索対象との一致を検索し、検索した一致数に基づいた検索結果を出力する曖昧検索部6とを備える。
【選択図】図1
Description
この発明は、入力音声に対応する単語列を用いて情報を検索する情報検索装置および情報検索方法に関するものである。
ユーザの発話である入力音声に対応するテキスト中の単語列を検索する従来の技術では、入力音声を音声認識して得られた発音のシンボル列と、検索対象であるテキストを解析して得られる発音のシンボル列とのマッチングをとることによって、テキスト中の単語列を検索する。例えば、特許文献1に開示された検索装置では、入力音声の認識結果の発音を表す発音シンボルの並びである認識結果発音シンボル列と、入力音声に対応する単語列の検索の結果である検索結果単語列となり得る検索結果対象単語列の発音を表す発音シンボルの並びである検索結果対象発音シンボル列とのマッチングをとり、マッチングの度合の大きい順に検索結果対象単語列として出力している。
しかしながら、上述した特許文献1に開示された技術では、入力音声の認識結果発音シンボル列と、テキストを解析して得られる検索結果対象発音シンボル列とのマッチングを行うため、テキストに出現しない発音のシンボル列を含んだ認識結果発音シンボル列の場合、検索結果対象発音シンボル列とのマッチングが行えず、所望の検索結果(マッチングの度合い、あるいは単語列を出力する順番)が得られないという課題があった。
ここで、テキストに出現しない発音のシンボル列を含んだ認識結果発音シンボル列とは、例えば言い淀みのある入力音声や音声認識技術の不完全さなどが原因で生じる予期せぬ入力音声の発音のシンボル列である。また、例えばテキストに含まれない言葉をユーザが発話して得られた入力音声の発音のシンボル列である。
ここで、テキストに出現しない発音のシンボル列を含んだ認識結果発音シンボル列とは、例えば言い淀みのある入力音声や音声認識技術の不完全さなどが原因で生じる予期せぬ入力音声の発音のシンボル列である。また、例えばテキストに含まれない言葉をユーザが発話して得られた入力音声の発音のシンボル列である。
この発明は、上記のような課題を解決するためになされたもので、ユーザの自由な入力音声に対して高精度に単語列の検索を行い、且つ入力音声を音声認識した結果に誤りが存在した場合にも高精度に単語列の検索を可能とする情報検索装置および情報検索方法を提供することを目的とする。
この発明に係る情報検索装置は、あらかじめ設定された単語列を種別毎に形態素解析し、各種別において読みと品詞で構成される形態素を作成する言語解析部と、形態素の種別および品詞を用いて設定された、形態素間の編集パターンを蓄積した拡張ルール記憶部と、拡張ルール記憶部に蓄積された編集パターンを参照し、言語解析部が作成した形態素の種別および品詞に基づいて、当該複数の形態素の読みを編集して複数の検索対象を作成する拡張部と、入力音声を音声認識した音声認識結果と、拡張部が作成した複数の検索対象との一致を検索し、検索した一致数に基づいた検索結果を出力する検索部とを備えるものである。
この発明によれば、音声認識結果と検索対象の一致数を高めることができ、適切なマッチングの度合を取得することができる。これにより入力音声に対して適切な単語列を検索し、出力することができる。
実施の形態1.
図1は、この発明の実施の形態1による情報検索装置の構成を示すブロック図である。
図1において、情報検索装置10は音声認識部1、記事データベース部(データ蓄積部)2、言語解析部3、拡張部4、拡張ルール記憶部5および曖昧検索部(検索部)6で構成されている。
音声認識部1は、情報検索装置10に入力された音声である入力音声101を解析して音声特徴を取得し、取得した特徴から推定された読みを認識結果102として出力する。
図1は、この発明の実施の形態1による情報検索装置の構成を示すブロック図である。
図1において、情報検索装置10は音声認識部1、記事データベース部(データ蓄積部)2、言語解析部3、拡張部4、拡張ルール記憶部5および曖昧検索部(検索部)6で構成されている。
音声認識部1は、情報検索装置10に入力された音声である入力音声101を解析して音声特徴を取得し、取得した特徴から推定された読みを認識結果102として出力する。
記事データベース部2は、複数の記事(あらかじめ設定された単語列)103を記憶するデータベースであり、図2に当該記事データベース部2に記憶された記事データベースの一例を示す。記事データベースは、記事番号201、属性A202、属性B203および内容204で構成されている。記事番号201は、複数の記事103を識別するための識別番号であり。属性A202、属性B203および内容204はそれぞれ記事の種別を示し、属性(A,B)202,203は、記事103を分類する情報を単語で示したものであり、内容204は、記事の内容を示す文章である。図2において、例えば、記事番号201が「1」の記事は、属性A202が「太陽放送」であり、属性B203が「ニュース」であり、内容204が「野球と政治情報をお伝えします。」であることを示している。
なお、図2では属性Aおよび属性Bの2つの属性を例に示したが、設定する属性の数は2つに限定されるものではなく、適宜変更可能である。
なお、図2では属性Aおよび属性Bの2つの属性を例に示したが、設定する属性の数は2つに限定されるものではなく、適宜変更可能である。
言語解析部3は、記事データベース部2に記憶された記事103の属性と内容をそれぞれ形態素解析して得られた形態素104を出力する。拡張部4は、拡張ルール記憶部5に記憶された拡張ルール105に従い、形態素104の読みを編集し、拡張検索対象106を作成する。なお、拡張部4は、形態素104の読みを単純に連結して拡張検索対象106を作成してもよい。
拡張ルール記憶部5は、複数の拡張ルール105を記憶する記憶領域であり、図3に当該拡張ルール記憶部5に記憶された拡張ルール105の一例を示す。拡張ルール105は、ルール番号301とルールパターン302で構成される。ルール番号301は、複数の拡張ルール105を識別するための識別番号であり、ルールパターン302は、形態素104を編集するパターンを定義したものである。
図3では、9つの拡張ルール105を示しており、例えば、ルール番号301が「1」の拡張ルール105は、ルールパターン302が「属性A+”の”+属性B」であることを示している。なお、ルールパターン302は、図3に示した以外にも適宜設定可能である。また、ルールパターン302の詳細については後述する。
図3では、9つの拡張ルール105を示しており、例えば、ルール番号301が「1」の拡張ルール105は、ルールパターン302が「属性A+”の”+属性B」であることを示している。なお、ルールパターン302は、図3に示した以外にも適宜設定可能である。また、ルールパターン302の詳細については後述する。
曖昧検索部6は、音声認識部1から出力された認識結果102の読みと、拡張部4から出力された拡張検索対象106の読みを、それぞれ部分文字列に分解し、認識結果102の部分文字列が、拡張検索対象106の部分文字列の中に存在するか否かの判定を行い、存在すると判定された数の合計を一致数とし、一致数の大きい拡張検索対象106から順に記事番号を出力記事番号列107として出力する。
次に、各構成の詳細な動作について具体例を参照しながら説明を行う。なお以下では、記事データベース部2および拡張ルール記憶部5が、図2および図3で示した記事103および拡張ルール105を記憶している場合を例に説明を行う。
まず、音声認識部1は、入力音声101を解析して音声特徴を取得し、取得した音声特徴から推定された読みを認識結果102として曖昧検索部6に出力する。ここで、入力音声101は、ユーザの発話を録音することにより取得した信号である。また、音声特徴は、例えばケプストラムと呼ばれる音声の特徴を示すパラメータであり、音声特徴に対応する読みの推定には、例えばHMM(Hidden Markov Model)など公知の手法を用いる。
まず、音声認識部1は、入力音声101を解析して音声特徴を取得し、取得した音声特徴から推定された読みを認識結果102として曖昧検索部6に出力する。ここで、入力音声101は、ユーザの発話を録音することにより取得した信号である。また、音声特徴は、例えばケプストラムと呼ばれる音声の特徴を示すパラメータであり、音声特徴に対応する読みの推定には、例えばHMM(Hidden Markov Model)など公知の手法を用いる。
音声認識部1によって、ユーザの発話「野球のニュース」を録音することにより取得した入力音声101に対して、「はきゅうのにゅう」を認識結果102として出力した場合を例に説明する。この場合、ユーザの発話の言い淀みや、録音する環境における騒音の影響や、音声認識技術の不完全さなどから、期待する認識結果「やきゅうのにゅうす」が得られない。具体的には、「や」が「は」に置換され、「す」が脱落する誤りが生じている。
次に、言語解析部3は、記事データベース部2に蓄積された記事番号201が「1」から「4」の各記事103の属性A202、属性B203および内容204をそれぞれ形態素解析し、得られた形態素104を拡張部4に出力する。形態素解析は公知である方法を用いて行い、記事103の属性A202、属性B203および内容204をそれぞれ単語に分解し、分解した各単語の読みおよび品詞を与えるものである。図4に、言語解析部3が生成した形態素104の一例を示す。図4では、図2に示した記事データベースの記事番号201が「1」および「2」の記事103の属性A202、属性B203および内容204に対して形態素解析を行って得られた形態素104を示している。
図4で示した形態素104の記事番号401、属性A402、属性B403および内容404は、図2で示した記事103を構成する記事番号201、属性A202、属性B203および内容204に対応している。
図4において、記事番号401が「1」の属性A402は「太陽放送/たいよおほおそお/固有名詞」であり、「太陽放送」を形態素解析して得られた形態素を示しており、単語「太陽放送」、読み「たいよおほおそお」、品詞「固有名詞」が得られたことを示している。
また、記事番号401が「1」の内容404は「野球/やきゅう/一般名詞:ジャンル」などで構成され、図2の内容204で示した「野球と政治情報をお伝えします。」を形態素解析して得られた形態素を示している。例えば、単語「野球」、読み「やきゅう」、品詞「一般名詞:ジャンル」が得られたことを示している。
図4において、記事番号401が「1」の属性A402は「太陽放送/たいよおほおそお/固有名詞」であり、「太陽放送」を形態素解析して得られた形態素を示しており、単語「太陽放送」、読み「たいよおほおそお」、品詞「固有名詞」が得られたことを示している。
また、記事番号401が「1」の内容404は「野球/やきゅう/一般名詞:ジャンル」などで構成され、図2の内容204で示した「野球と政治情報をお伝えします。」を形態素解析して得られた形態素を示している。例えば、単語「野球」、読み「やきゅう」、品詞「一般名詞:ジャンル」が得られたことを示している。
ここで、「一般名詞:ジャンル」は、単語「野球」の品詞が一般名詞であり、さらに、ユーザが発話して検索すると推定される種類であることを示すための付加情報「:ジャンル」を付加して表現されている。付加情報は、形態素解析に用いられる形態素の辞書の品詞にあらかじめ付与することができる。あるいは、形態素解析して得られた形態素を参照して、事前に決めた規則(例えば、「野球/やきゅう/一般名詞」であれば「:ジャンル」を付与する)に基づいて、付加情報を付与するように構成してもよい。
次に、拡張部4は、拡張ルール記憶部5に記憶された拡張ルール105に従い、言語解析部3から入力された形態素104の読みを編集し、拡張検索対象106を作成する。なお、形態素104の読みを単純に連結して拡張検索対象106を作成するように構成してもよい。図5に、拡張部4が作成した拡張検索対象106の一例を示す。
拡張検索対象106は、記事番号501と検索対象502で構成される。なお、図5に示した拡張検索対象106は、図3で示した拡張ルール105に従い、図4で示した形態素104の読みを編集して得られたものである。
拡張検索対象106は、記事番号501と検索対象502で構成される。なお、図5に示した拡張検索対象106は、図3で示した拡張ルール105に従い、図4で示した形態素104の読みを編集して得られたものである。
図5で示した拡張検索対象106の記事番号501は、図4で示した形態素104を構成する記事番号401に対応している。
図5において、記事番号501が「1」の検索対象502は「たいよおほおそお」、「にゅうす」、「やきゅうとせえじじょおほおおおつたえします」、「たいようほおそおのにゅうす」、「やきゅうのにゅうす」、「・・・」であり、形態素104の読みに基づいて作成されている。なお、「・・・」は後続する文字を省略したことを示している。
図5において、記事番号501が「1」の検索対象502は「たいよおほおそお」、「にゅうす」、「やきゅうとせえじじょおほおおおつたえします」、「たいようほおそおのにゅうす」、「やきゅうのにゅうす」、「・・・」であり、形態素104の読みに基づいて作成されている。なお、「・・・」は後続する文字を省略したことを示している。
例えば、記事番号501が「1」の検索対象502の「やきゅうとせえじじょおほおおおつたえします」は、形態素104の読み「やきゅう」、「と」、「せえじじょおほお」、「お」、「おつたえします」を単純に連結して作成した検索対象である。
また、記事番号501が「1」の検索対象502の「たいよおほおそおのにゅうす」は、図3に示した拡張ルール105のルール番号301が「1」のルールパターン302「属性A+”の”+属性B」に従い、図4で示した形態素104の記号番号401が「1」の属性A402「たいよおほおそお」と属性B403「にゅうす」とを、特定の文字列「の」を用いて連結して作成した検索対象である。
また、記事番号501が「1」の検索対象502の「たいよおほおそおのにゅうす」は、図3に示した拡張ルール105のルール番号301が「1」のルールパターン302「属性A+”の”+属性B」に従い、図4で示した形態素104の記号番号401が「1」の属性A402「たいよおほおそお」と属性B403「にゅうす」とを、特定の文字列「の」を用いて連結して作成した検索対象である。
さらに、記事番号501が「2」の検索対象502の「ちゃんにゅうさまがしゅつえんのどらま」は、図3に示した拡張ルール105のルール番号301が「9」のルールパターン「人名+”さまがしゅつえんの”+属性B」に従い、図4で示した形態素104の記号番号401が「2」の人名「ちゃんにゅう」と属性B「どらま」とを「さまがしゅつえんの」を用いて連結して作成した検索対象である。
このように、拡張ルール記憶部5の拡張ルール105では、属性と品詞を用いて読みを指定し、また、ユーザが発話すると推定される特定の文字列とを用いて、形態素104を編集する方法を定義している。拡張部4は、当該拡張ルール105に従ってユーザが発話すると推定される拡張された検索対象を作成することができる。
次に、曖昧検索部6は、拡張部4から入力される拡張検索対象106の読みと、音声認識部1から入力される認識結果102の読みとを、それぞれ部分文字列に分解し、認識結果102の部分文字列が、拡張検索対象106の部分文字列に「ある」か「ない」かを検索し、「ある」と検索された数の合計を一致数として算出する。一致数が大きい拡張検索対象106から順に対応する記号番号501を、出力記事番号列107として出力する。
図6は、曖昧検索部6の曖昧検索結果を示す一例である。具体的には、誤りが存在する認識結果102に対する、拡張検索対象106の記事番号501が「1」および「2」の検索対象502の一致数の算出結果を示している。なお、図5で示した拡張検索対象106を例に説明を行う。
曖昧検索結果は、認識結果の部分文字(認識結果に誤りが存在する)601、記事番号「1」602、記事番号「2」603、一致数604および参考605で構成されている。
曖昧検索結果は、認識結果の部分文字(認識結果に誤りが存在する)601、記事番号「1」602、記事番号「2」603、一致数604および参考605で構成されている。
認識結果の部分文字601は、認識結果102の「はきゅうのにゅう」について、先頭から順に1文字のみ重複させて2文字の長さに分解した部分文字列「はきゅ」「きゅう」「うの」「のにゅ」「にゅう」を示している。なお、認識結果102の分解方法としては、先頭から順に2文字のみ重複させて3文字の長さに分解するなど、種々の方法を適用可能であり、上述の方法に限定されるものではない。
記事番号「1」602、記事番号「2」603は、認識結果の部分文字(以下、部分文字列と称する)601が検索対象502に存在するか否かの結果を「ある」、「なし」で示している。具体的に説明すると、部分文字列の「はきゅう」に対して記事番号「1」の「ない」は、記事番号「1」の検索対象502(図5参照)内に「はきゅう」の文字列が存在しないことを示している。一方、部分文字列の「きゅう」に対して記事番号「1」の「ある」は、記事番号「1」の検索対象502内に「きゅう」の文字列が存在する(「やきゅうとせえじ・・・」内の「きゅう」や、「やきゅうのにゅうす」内の「きゅう」)ことを示している。
一致数604は、記事番号「1」602および記事番号「2」603において、それぞれ「ある」と検索された結果数を示している。記事番号「1」602の一致数は「4」であり、記事番号「2」603の一致数は「3」である。この2つの一致数が得られた場合、出力記事番号列107は、記事番号「1」、記事番号「2」の順の番号列となる。
参考605は、拡張部4の効果を示すために、拡張検索処理が行われなかった場合の記事番号「1」に対する曖昧検索結果を示している。具体的には、図3に示した拡張ルール105を適用しなかった場合の検索対象502(図5参照)に対して、部分文字列601が存在するか否かの結果を示している。
拡張ルール105を適用しなかった場合の記事番号1の検索対象502は「たいよおほおそお」、「にゅうす」、「やきゅうとせえじじょおほおおおつたえします」であり、部分文字列601との一致数は「2」である。また、拡張検索処理が行われなかった場合の記事番号「2」に対する曖昧検索結果は、記事番号「2」603と同一の結果であり、一致数は「3」である。
拡張ルール105を適用しなかった場合の記事番号1の検索対象502は「たいよおほおそお」、「にゅうす」、「やきゅうとせえじじょおほおおおつたえします」であり、部分文字列601との一致数は「2」である。また、拡張検索処理が行われなかった場合の記事番号「2」に対する曖昧検索結果は、記事番号「2」603と同一の結果であり、一致数は「3」である。
仮に、拡張を行わなかった場合の記事番号「1」の一致数「2」は、記事番号2の一致数「3」よりも小さいため、出力記事番号107は、記事番号「2」、記事番号「1」の順の番号列となる。この場合、「野球のニュース」を発話したユーザの期待する記事番号「1」に対して、記事番号「2」が優先されることとなり、所望の検索結果が得られない。このように、拡張ルール105を適用することにより、発話したユーザの期待する検索結果を得る精度を高めることができる。
また、上述した例では、属性の形態素の読みと、内容の形態素の読みとを、特定の文字列(例えば”の”)を用いて連結する例を示したが、特定の文字を用いることなく、属性の形態素の読みと、内容の形態素の読みとを連結してもよい。例えば、図3に示した拡張ルール105のルール番号301が「4」のルールパターン302「ジャンル+属性B」は、特定の文字を用いることなく、属性の形態素の読みと、内容の形態素の読みとを組み合わせた例である。
このルール番号301が「4」のルールパターン302を適用した場合、図4で示した記号番号401が「1」の属性B403の読み「にゅうす」と、内容404の読み「やきゅう」とが連結され、検索対象502として「やきゅうにゅうす」が得られる。認識結果102が「やきゅうにゅうす」(記事の単語列の順番が異なる)の時、ルール番号301が「4」のルールパターン302が与えられない場合と比較して、図6で示した記事番号「1」602の一致数604を大きい値とすることができる。
以上のように、この実施の形態1によれば、形態素を編集する方法を定義したルールパターンを記憶した拡張ルール記憶部5と、拡張ルール記憶部5に記憶されたルールパターンに従って、属性の形態素の読みと、内容の形態素の読みとを編集して拡張検索対象を作成する拡張部4と、認識結果の部分文字列が、拡張部4が作成した拡張検索対象内に存在するか否かの曖昧検索を行い、存在数が多い記事番号順の出力記事番号列を出力する曖昧検索部6とを備えるように構成したので、音声認識結果に誤りが含まれている、あるいは情報検索装置内にあらかじめ蓄積されていない言葉をユーザが発話した、あるいは情報検索装置内にあらかじめ蓄積された単語列の順番と異なる言葉をユーザが発話した場合であっても、音声認識結果の部分文字列が拡張検索対象に含まれる割合を高めることができ、曖昧検索において適切な一致数(マッチング度合)を得ることができる。これにより、適切な順序で記載された出力記事番号列を得ることができる。
また、この実施の形態1によれば、属性の形態素の読みと、内容の形態素の読みに加えて、特定の文字を組み合わせて拡張検索対象を作成し、認識結果の部分文字列が作成した拡張検索対象内に存在するか否かの曖昧検索を行うように構成したので、音声認識結果に誤りが含まれている、あるいは情報検索装置内にあらかじめ蓄積されていない言葉をユーザが発話した、あるいは情報検索装置内にあらかじめ蓄積された単語列の順番と異なる言葉をユーザが発話した場合であっても、音声認識結果の部分文字列が拡張検索対象に含まれる割合をより高めることができ、曖昧検索において適切な一致数(マッチング度合)を得ることができる。これにより、より適切な順序で記載された出力記事番号列を得ることができる。
実施の形態2.
上述した実施の形態1では、拡張ルール105を用いて、形態素104の属性読みと内容の読みとを組み合わせて拡張検索対象106を作成する構成を示したが、この実施の形態2では形態素104の属性と内容に含まれる特定の読みを異なる読みに置き換え、他の形態素の読みと組み合わせる構成を示す。
なお、実施の形態2による情報検索装置の構成要素は、実施の形態1の図1で示した情報検索装置10と同一であるためブロック図の記載を省略する。また、各構成要素は、実施の形態1で使用した符号と同一の符号を付して説明を省略または簡略化する。
上述した実施の形態1では、拡張ルール105を用いて、形態素104の属性読みと内容の読みとを組み合わせて拡張検索対象106を作成する構成を示したが、この実施の形態2では形態素104の属性と内容に含まれる特定の読みを異なる読みに置き換え、他の形態素の読みと組み合わせる構成を示す。
なお、実施の形態2による情報検索装置の構成要素は、実施の形態1の図1で示した情報検索装置10と同一であるためブロック図の記載を省略する。また、各構成要素は、実施の形態1で使用した符号と同一の符号を付して説明を省略または簡略化する。
拡張ルール記憶部5は、図3に示した拡張ルール105に加えて、置換拡張ルール105´を記憶する。置換拡張ルール105´の一例を図7に示す。置換拡張ルール105´は、ルール番号701とルールパターン702で構成される。ルール番号701は、複数の置換拡張ルール105´を識別するための識別番号であり、ルールパターン702は、形態素104を編集する方法を定義したものである。図7では、2つの置換拡張ルール105´の例を示しており、例えば、ルール番号701が「1」の置換拡張ルール105´は、ルールパターン702が「属性A[すいせえてれび→すいせえ]+”の”+属性B」であることを示している。
このルールパターン702では、属性Aの読みが「すいせえてれび」の場合に、「すいせえ」に置き換えを行い、属性Bの読みとを、特定の文字列”の”を用いて連結することを定義している。このルールパターン702を適用することにより、拡張部4は図4で示した形態素104の記事番号401が「2」の属性A402の読み「すいせえてれび」と、属性B403の読み「どらま」を編集し、拡張検索対象として「すいせえのどらま」を作成する。
この置換拡張ルール105´を適用することにより、ユーザの発話を音声認識した認識結果102が「すいせえのどらま」である場合に、記事番号「2」の一致数を大きい値とすることができ、認識結果102の部分文字列が拡張検索対象に含まれる割合を高めることができる。
なお、上述した例では、置換拡張ルール105´のルールパターンとして属性Aの読みを置換する場合を例に示したが、図7に示すように属性Bの読みを置換するルールパターンを設定することも可能である。
以上のように、この実施の形態2によれば、形態素の属性および内容の特定の読みを異なる読みに置き換える置換拡張ルール105´を記憶した拡張ルール記憶部5と、置換した形態素の属性または内容の読みと、その他の形態素の読みとを連結して拡張検索対象を作成する拡張部4とを備えるように構成したので、音声認識結果に誤りが含まれている、あるいは情報検索装置内にあらかじめ蓄積されていない言葉をユーザが発話した、あるいは情報検索装置内にあらかじめ蓄積された単語列の順番と異なる言葉をユーザが発話した場合であっても、音声認識結果の部分文字列が拡張検索対象に含まれる割合をより高めることができ、曖昧検索において適切な一致数(マッチング度合)を得ることができる。これにより、より適切な順序で記載された出力記事番号列を得ることができる。
なお、上述した実施の形態1および実施の形態2では、情報検索装置10が音声認識部1および記事データベース部2を備える構成を示したが、図8に示すように、例えばインターネットなどのネットワーク上など情報検索装置10´の外部に音声認識手段1´および記事データベース提供手段2´を配置するように構成してもよい。さらに音声認識手段1´および記事データベース提供手段2´は、ネットワーク上に存在する音声認識サービスおよび記事データベース提供サービスを用いて実現し、情報検索装置10´は当該サービスから認識結果および記事の情報のみを取得するように構成してもよい。
なお、本願発明はその発明の範囲内において、各実施の形態の自由な組み合わせ、あるいは各実施の形態の任意の構成要素の変形、もしくは各実施の形態において任意の構成要素の省略が可能である。
1 音声認識部、1´ 音声認識手段、2 記事データベース部、2´ 記事データベース提供手段、3 言語解析部、4 拡張部、5 拡張ルール記憶部、6 曖昧検索部、10,10´ 情報検索装置。
Claims (8)
- 入力音声に対応した単語列を検索する情報検索装置において、
あらかじめ設定された単語列を種別毎に形態素解析し、各種別において読みと品詞で構成される形態素を作成する言語解析部と、
前記形態素の種別および品詞を用いて設定された、前記形態素間の編集パターンを蓄積した拡張ルール記憶部と、
前記拡張ルール記憶部に蓄積された編集パターンを参照し、前記言語解析部が作成した形態素の種別および品詞に基づいて、当該複数の形態素の読みを編集して複数の検索対象を作成する拡張部と、
前記入力音声を音声認識した音声認識結果と、前記拡張部が作成した複数の検索対象との一致を検索し、検索した一致数に基づいた検索結果を出力する検索部とを備えたことを特徴とする情報検索装置。 - 前記あらかじめ設定された単語列を前記種別毎に蓄積するデータ蓄積部と、
前記入力音声を音声認識する音声認識部とを備えたことを特徴とする請求項1記載の情報検索装置。 - 前記拡張ルール記憶部は、複数の前記形態素の読みを、特定の文字列を介して接続する編集パターンを蓄積することを特徴とする請求項1または請求項2記載の情報検索装置。
- 前記拡張ルール記憶部は、前記形態素の読みをあらかじめ設定された他の読みに置換した後、その他の形態素の読みと接続する編集パターンを蓄積することを特徴とする請求項1から請求項3のいずれか1項記載の情報検索装置。
- あらかじめ設定された単語列を種別毎に形態素解析し、各種別において読みと品詞で構成された形態素を作成する言語解析部と、前記形態素の種別および品詞を用いて設定された前記形態素間の編集パターンを蓄積する拡張ルール記憶部とを備え、入力音声に対応した単語列を検索する情報検索方法において、
拡張部が、前記編集パターンを参照し、前記言語解析部が作成した形態素の種別および品詞に基づいて、当該複数の形態素の読みを編集した複数の検索対象を作成するステップと、
検索部が、前記入力音声を音声認識した音声認識結果と、前記拡張部が作成した複数の検索対象との一致を検索し、検索した一致数に基づいた検索結果を出力するステップとを備えたことを特徴とする情報検索方法。 - 音声認識部が、前記入力音声を音声認識するステップを備えたことを特徴とする請求項5記載の情報検索方法。
- 前記拡張ルール記憶部が、複数の前記形態素の読みを、特定の文字列を介して接続する編集パターンを蓄積することを特徴とする請求項5または請求項6記載の情報検索方法。
- 前記拡張ルール記憶部が、前記形態素の読みをあらかじめ設定された他の読みに置換した後、その他の形態素の読みと接続する編集パターンを蓄積することを特徴とする請求項5から請求項7のいずれか1項記載の情報検索方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2012281329A JP2014126925A (ja) | 2012-12-25 | 2012-12-25 | 情報検索装置および情報検索方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2012281329A JP2014126925A (ja) | 2012-12-25 | 2012-12-25 | 情報検索装置および情報検索方法 |
Publications (1)
Publication Number | Publication Date |
---|---|
JP2014126925A true JP2014126925A (ja) | 2014-07-07 |
Family
ID=51406393
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2012281329A Pending JP2014126925A (ja) | 2012-12-25 | 2012-12-25 | 情報検索装置および情報検索方法 |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP2014126925A (ja) |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN111198936A (zh) * | 2018-11-20 | 2020-05-26 | 北京嘀嘀无限科技发展有限公司 | 一种语音搜索方法、装置、电子设备及存储介质 |
JP2020086364A (ja) * | 2018-11-30 | 2020-06-04 | 株式会社Nttぷらら | 情報提示システム、情報提示装置、情報提示方法及びコンピュータプログラム |
-
2012
- 2012-12-25 JP JP2012281329A patent/JP2014126925A/ja active Pending
Cited By (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN111198936A (zh) * | 2018-11-20 | 2020-05-26 | 北京嘀嘀无限科技发展有限公司 | 一种语音搜索方法、装置、电子设备及存储介质 |
CN111198936B (zh) * | 2018-11-20 | 2023-09-15 | 北京嘀嘀无限科技发展有限公司 | 一种语音搜索方法、装置、电子设备及存储介质 |
JP2020086364A (ja) * | 2018-11-30 | 2020-06-04 | 株式会社Nttぷらら | 情報提示システム、情報提示装置、情報提示方法及びコンピュータプログラム |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US10134388B1 (en) | Word generation for speech recognition | |
Can et al. | Lattice indexing for spoken term detection | |
US8954333B2 (en) | Apparatus, method, and computer program product for processing input speech | |
JP5440177B2 (ja) | 単語カテゴリ推定装置、単語カテゴリ推定方法、音声認識装置、音声認識方法、プログラム、および記録媒体 | |
US10019514B2 (en) | System and method for phonetic search over speech recordings | |
US20130158999A1 (en) | Voice recognition apparatus and navigation system | |
US20140067391A1 (en) | Method and System for Predicting Speech Recognition Performance Using Accuracy Scores | |
US20130289987A1 (en) | Negative Example (Anti-Word) Based Performance Improvement For Speech Recognition | |
JP6599219B2 (ja) | 読み付与装置、読み付与方法、およびプログラム | |
US10803858B2 (en) | Speech recognition apparatus, speech recognition method, and computer program product | |
CN111552777B (zh) | 一种音频识别方法、装置、电子设备及存储介质 | |
JP5524138B2 (ja) | 同義語辞書生成装置、その方法、及びプログラム | |
JP5073024B2 (ja) | 音声対話装置 | |
JP2010009446A (ja) | 音声ファイルの検索システム、方法及びプログラム | |
JP5590549B2 (ja) | 音声検索装置および音声検索方法 | |
JP2014126925A (ja) | 情報検索装置および情報検索方法 | |
JP5436307B2 (ja) | 類似文書検索装置 | |
KR20130126570A (ko) | 핵심어에서의 음소 오류 결과를 고려한 음향 모델 변별 학습을 위한 장치 및 이를 위한 방법이 기록된 컴퓨터 판독 가능한 기록매체 | |
JP2002278579A (ja) | 音声データ検索装置 | |
Suyanto et al. | Data augmentation methods for low-resource orthographic syllabification | |
KR20040018008A (ko) | 품사 태깅 장치 및 태깅 방법 | |
Saychum et al. | Efficient Thai Grapheme-to-Phoneme Conversion Using CRF-Based Joint Sequence Modeling. | |
JP2008165718A (ja) | 意図判定装置、意図判定方法、及びプログラム | |
Rashmi et al. | Text-to-Speech translation using Support Vector Machine, an approach to find a potential path for human-computer speech synthesizer | |
Kodali et al. | Bilingual speech recognition based on deep neural networks and directed acyclic word graphs |