JP2005084422A

JP2005084422A - 音声認識検索装置

Info

Publication number: JP2005084422A
Application number: JP2003317276A
Authority: JP
Inventors: Kazuyoshi Yamada; 一嘉山田; Hideo Miyauchi; 英夫宮内; Yoshinori Watanabe; 慶範渡辺
Original assignee: Denso Corp
Current assignee: Denso Corp
Priority date: 2003-09-09
Filing date: 2003-09-09
Publication date: 2005-03-31

Abstract

【課題】音声認識対象の全体をユーザが発声しなくとも音声認識による検索が可能な音声認識検索装置を提供すること。
【解決手段】車載オーディオ装置１は、データベース管理部３、音声認識辞書変換部５、音声認識辞書管理部７、音声入力部９、音声認識部１１、及び認識結果通知部１３を備えている。音声入力部９に楽曲名読み仮名における最初の文節が入力されると、その文節が音声認識対象となり、検索が実行される。
【選択図】図５

Description

本発明は、例えば、楽曲名を発声することでその楽曲を検索することができる車載オーディオ装置等の音声認識検索装置に関する。

従来より、楽曲名や歌手名等の音声認識対象を音声入力すると、その音声データに基づいて、楽曲を検索する楽曲検索システムが知られている（特許文献１参照）。
この楽曲検索システムでは、ユーザが入力した音声データから、楽曲名や歌手名を検索語として認識する。そして、この検索語を用いて楽曲検索データベースを検索し、検索語と一致する楽曲をヒットレコードとして見いだす。見いだされたヒットレコードの楽曲名や歌手名は対話型インターフェースによりユーザに提示される。
特開２００２−１８９４８３号公報

しかしながら、従来の楽曲検索システムにおいて、ユーザが楽曲名等の全てを記憶しておらず、楽曲名等の一部のみを発声した場合には、検索語も、楽曲名等の一部となる。
この場合は、検索語と、楽曲検索データベースに記憶されているデータとの一致率が低下し、検索を正しく行うことができないという問題があった。

本発明は以上の点に鑑みなされたものであり、音声認識対象の全体をユーザが発声しなくとも音声認識による検索が可能な音声認識検索装置を提供することを目的とする。

（１）請求項１の発明では、データベースに保持されている検索対象データが、２以上の区分データに区分されており、検索手段は、検索対象データにおける一部の区分データを音声認識対象とし、その音声認識対象と音声データとの符合に基づいて、検索対象データを検索することができる。

つまり、検索対象データの一部の区分データにのみ対応する音声データを入力した場合、検索対象データ全体を音声認識対象とすると、音声認識における一致率が低下し、正確な音声認識ができなくなってしまうが、本発明では、例えば、発音した音声データに対応する区分データを音声認識対象として、正確な音声認識を行うことができる。
（２）請求項２の発明では、検索対象データにおける区分は、文節の区切りに基づいて行われている。

そのため、ユーザが一部の文節のみに対応する音声データを発音した場合でも、その文節を音声認識対象として、検索を行うことができる。
・前記文節とは、て、に、を、は等の助詞により区切られる単位をいう。
（３）請求項３の発明では、検索対象データにおける区分は、特定の文字又は記号に基づいて行われている。

そのため、ユーザが、検索対象データのうち、特定の文字や記号により区切られた一部のみに対応する音声データを発音した場合でも、その一部を音声認識対象として、検索を行うことができる。

・前記特定の文字又は記号としては、例えば、「、」、「−」、「〜」等が挙げられる。
（４）請求項４の発明では、検索対象データにおける区分は、所定の文字数ごとに行われている。

そのため、ユーザが、検索対象データにおいて、所定の文字数ごとに区切られた区分の一部のみに対応する音声データを発音した場合でも、その一部を音声認識対象として、検索を行うことができる。
（５）請求項５の発明では、データベースが、検索対象データをツリー構造として登録した音声認識辞書を備えている。そのことにより、検索を迅速に行うことができる。
（６）請求項６の発明では、前記音声認識対象となる区分データは、前記音声データに対応する区分データである。

そのため、検索対象データのうちの、一部の区分データのみに対応する音声を入力した場合は、その一部の区分データを音声認識対象とし、検索を行う。このことにより、ユーザが検索対象データの全体に対応する音声を発音しなくとも、正確な音声認識を行い、検索を実行することができる。

また、ユーザが検索対象データ全体に対応する音声を入力した場合は、検索対象データ全体を音声認識対象とし、検索を行う。この場合は、音声認識対象が長くなるので、検索精度を向上させることができる。
（７）請求項７の発明では、検索対象データが楽曲名の読み仮名であるので、音声認識により楽曲名を検索することができる。
（８）請求項８の発明では、追加手段により、新たに追加された認識対象を特定の規則に基づいて区分けし、区分けした認識対象を前記音声認識辞書に追加することができ、また、抽出手段により、音声入力手段によって入力された音声と一致度の高い認識対象（区分けされた認識対象の一部、または区分けされる前の（全体の）認識対象）を抽出することができる。

そして、取得手段により、抽出手段にて抽出した認識対象（区分けされた認識対象の一部、または区分けされる前の（全体の）認識対象）に基づき、認識対象候補を取得することができる。

従って、本発明では、入力された音声が、区分けされた認識対象の一部にのみ対応する場合でも、区分けされる前の（全体の）認識対象に対応する場合でも、正確な音声認識を行うことができる。
（９）請求項９の発明では、手動又は自動で認識対象を区分けすることを特徴とする。手動で認識対象を区分けする場合は、区分けのための特別な手段を用いる必要がない。また、自動で認識対象を区分けする場合は、迅速且つ容易に区分けを行うことができる。
（１０）請求項１０の発明では、前記特定の規則とは、文節ごと、特定の文字又は記号ごと、所定の文字数ごと、主題と副題との何れか又はそれらの組み合わせに区分けすることであることを特徴とする。
（１１）請求項１１の発明では、認識対象は所定の文字数ごとに認識対象単位として区分けされており、抽出手段によって、音声入力手段にてり入力された音声と一致度の高い認識対象単位を音声認識辞書から抽出することができる。

そして、取得手段によって、抽出手段にて抽出した認識対象単位を含む認識対象を認識対象候補として取得することができる。
従って、本発明では、所定の文字数ごとに区分けされた認識対象単位の一部にのみ対応する場合でも、正確な音声認識を行うことができる。
（１２）請求項１２の発明では、追加手段により、記憶手段に記憶される音声認識辞書に新たな認識対象を追加することができ、また、追加手段によって追加された認識対象を所定の文字数ごとに区分けし、認識対象単位として記憶させることができる。
（１３）請求項１３の発明では、認識対象は、楽曲に関する名称情報であることを特徴とする。音声認識により、楽曲に関する名称情報を取得することができる。

以下に本発明の音声認識検索装置の形態の例（実施例）を説明する。以下の実施例１〜３では、音声認識検索装置として、曲名を検索語として楽曲を検索する車載オーディオ装置を例に挙げて説明する。

ａ）まず、本実施例１の車載オーディオ装置１の全体構成を図１を用いて説明する。
車載オーディオ装置１は、データベース管理部３、音声認識辞書変換部（追加手段）５、音声認識辞書管理部（記憶手段）７、音声入力部（音声データ入力手段、音声入力手段）９、音声認識部（検索手段、抽出手段、取得手段）１１、及び認識結果通知部１３を備えている。

データベース管理部３には、外部から、アルバム名、楽曲名、楽曲名の読み仮名、アーティスト名、アーティスト名の読み仮名等を含む楽曲データが入力される。この入力の手段としては、有線又は無線による通信、ＣＤ、ＤＶＤ等のメディアからの入力がある。データベース管理部３は、入力された楽曲データから、音声認識に必要な楽曲に関する名称情報、つまり、楽曲名の読み仮名（検索対象データ、認識対象）を抽出し、後述する音声認識辞書変換部５に処理を依頼する。

音声認識辞書変換部（追加手段）５は、データベース管理部３から処理を依頼された、新たに追加された楽曲名の読み仮名（認識対象）を、文節ごとに（特定の規則に基づいて）区分けし、区分けされた楽曲名の読み仮名を音声認識辞書に追加する。この音声認識辞書は、音声認識辞書管理部（記憶手段）７に記憶され、楽曲名の読み仮名のデータ列より音声認識を行うためのツリー構造を有するものである。

音声認識辞書管理部（記憶手段）７は、音声認識辞書を記憶しておき、後述する音声認識部１１に登録する。
音声入力部（音声データ入力手段、音声入力手段）９は、ユーザが音声入力した音声データを音声認識部１１に通知する。

音声認識部（検索手段、抽出手段、取得手段）１１は、音声入力部９から入力された音声データを用いて、音声認識辞書に対して検索を行い、音声認識率の高い楽曲名の候補（認識対象候補）を取得し、その音声認識率の高い楽曲名の候補を後述する認識結果通知部１３へ通知する。

認識結果通知部１３は、音声認識部１１から通知された認識対象候補を表示する。ユーザは、図示しない選択手段により、表示された候補の中から、所望の楽曲名を選択することができる。ユーザが選択した楽曲は、図示しない演奏部により、演奏することができる。

また、表示された候補の中に所望の楽曲がない場合は、再度の音声入力及び音声認識の実行を選択できる。
ｂ）次に、本実施例１の車載オーディオ装置１において、音声認識辞書変換部（追加手段）５により、音声認識辞書管理部（記憶手段）７に記憶された音声認識辞書に、新たな楽曲名の読み仮名（認識対象）を追加する処理について図２を用いて説明する。

ステップ１００では、データベース管理部３が外部から取り込んだ楽曲データから、楽曲名の読み仮名と、楽曲のＩＤ（アルバム名、楽曲名、アーティスト名、アーティスト名の読み仮名）を抽出する。

ステップ１１０では、音声認識辞書変換部５が、楽曲名の読み仮名をツリー構造化し、音声認識辞書に追加する。
この音声認識辞書のツリー構造を図３に示す。この図３では、「アイノ○○ニワガママニボクハキミダケヲキズツケナイ」という楽曲名の読み仮名が、ツリー構造としてを音声認識辞書に追加される。

また、音声認識辞書に追加される楽曲名の読み仮名は、音声認識辞書変換部５により、文節ごとに（特定の規則に従って）区分される。区分された個々の文節は、区分データに該当する。具体的には、「アイノ○○ニワガママニボクハキミダケヲキズツケナイ」という楽曲名の読み仮名では、「アイノ○○ニ」、「ワガママニ」、「ボクハ」、「キミダケヲ」、「キズツケナイ」という様に区分されている。この文節ごとの区分は、例えば、人的判断により（手動で）行うこともできるし、文節を認識することができるソフトウェアを用いて（自動で）行うこともできる。

また、音声認識辞書変換部５は、新たに入力した楽曲名の読み仮名だけではなく、元々音声認識辞書に記憶されている楽曲名の読み仮名を文節ごとに区分けすることもできる。
ステップ１２０では、音声認識辞書を音声認識部１１に登録する。

ｃ）次に、本実施例１の車載オーディオ装置１において、音声認識部（検索手段、抽出手段、取得手段）が実行する音声認識処理について図４及び図５のフローチャートを用いて説明する。尚、ここでは、「アイノ○○ニワガママニボクハキミダケヲキズツケナイ」という楽曲名を音声認識する場合を例に挙げて説明する。

ステップ２００では、ユーザが楽曲名を発声した音声が、音声入力部９に入力され、音声データとなる。その音声データは、音声認識部１１に送られる。
ステップ２１０では、音声認識部１１が、音声入力部９から入力された音声データと一致度の高い楽曲名の候補（音声認識対象候補）を取得し、後述する認識結果通知部１３へ通知する。

このステップ２１０における処理を、図５のフローチャートを用いて具体的に説明する。
ステップ３００では、このステップ３００を最初に実行する場合は、音声認識辞書に記録されている楽曲名の読み仮名における最初の文節と、音声データにおけるこの文節に対応する部分とで、音声認識の分析処理を行う。例えば、「アイノ○○ニワガママニボクハキミダケヲキズツケナイ」という楽曲の読み仮名については、その最初の文節である「アイノ○○ニ」と、音声データにおけるこの文節に対応する部分とで、音声認識の分析処理を行う。

また、後述するステップ３２０からこのステップ３００に進んだ場合は、前回のステップ３００にて音声認識の分析処理を行った文節の次の文節について、音声認識の分析処理を行う。尚、このステップ３００における音声認識の分析処理は、公知の方法を用いることができる。

ステップ３１０では、直前のステップ３００での音声認識における一致率が所定値以上であるか否かを判断する。ＹＥＳの場合はステップ３２０に進み、ＮＯの場合はステップ３４０に進む。

ステップ３２０では、次の文節に対応する音声入力があるか否かを判断する。例えば、直前のステップ３１０にて、「アイノ○○ニ」の文節の一致率を判断した場合は、次の文節である「ワガママニ」の文節に対応する音声入力があるが否かを判断する。

ＮＯの場合はステップ３３０に進み、ＹＥＳの場合はステップ３００に進む。
ステップ３３０では、最初の文節から、現文節（最後に実行したステップ３１０にて一致率を判断した文節）までを音声認識対象として音声認識辞書から抽出する。

例えば、「アイノ○○ニワガママニボクハキミダケヲキズツケナイ」という楽曲の読み仮名の場合、前記ステップ３００〜３２０にて、最初の文節である「アイノ○○ニ」のみについて、一致率が所定値以上と判断された場合は、この「アイノ○○ニ」の文節が音声認識対象として音声認識辞書から抽出される。

また、最初の文節と２番目の文節である「アイノ○○ニ」「ワガママニ」について、一致率が所定値以上と判断された場合は、この２文節が音声認識対象として抽出される。この後、図４のフローチャートに戻り、そのステップ２２０に進む。

一方、前記ステップ３１０にてＮＯと判断された場合はステップ３４０に進む。ステップ３４０では、最初の文節について前記ステップ３１０にてＮＯと判断された場合は、音声入力に対応する楽曲名がない旨を認識結果通知部１３に表示する。また、２番目以降の文節について前記ステップ３１０にてＮＯと判断された場合は、その前の文節までを音声認識対象として音声認識辞書から抽出する。

この後、図４のフローチャートに戻り、そのステップ２２０に進む。
尚、図５に示す処理は、「アイノ○○ニワガママニボクハキミダケヲキズツケナイ」という楽曲のみではなく、音声認識辞書に登録されている他の楽曲名の読み仮名についても同様に実行される。

ステップ２２０（図４）では、ステップ３３０またはステップ３４０（図５）において音声認識対象として抽出された文節を含む楽曲名が、認識対象候補として取得され、認識結果通知部１３に表示される。

例えば、前記ステップ３３０またはステップ３４０にて、「アイノ○○ニ」の文節が音声認識対象として抽出された場合は、「アイノ○○ニ」の文節を含む楽曲名である「アイノ○○ニワガママニボクハキミダケヲキズツケナイ」が、認識対象候補として取得され、認識結果通知部１３に表示される。また、「アイノ○○ニ」を含む他の楽曲があれば、その楽曲も認識対象候補として取得され、認識結果通知部１３に表示される。

また、最初の文節と２番目の文節である「アイノ○○ニ」「ワガママニ」がステップ３３０またはステップ３４０にて音声認識対象として抽出された場合は、「アイノ○○ニ」「ワガママニ」の文節を含む楽曲名である「アイノ○○ニワガママニボクハキミダケヲキズツケナイ」が、認識対象候補として取得され、認識結果通知部１３に表示される。また、「アイノ○○ニ」「ワガママニ」を含む他の楽曲があれば、その楽曲も認識対象候補として取得され、認識結果通知部１３に表示される。

また、「アイノ○○ニ」「ワガママニ」「ボクハ」「キミダケヲ」「キズツケナイ」、つまり、区分けする前の（全体の）認識対象が音声認識対象として抽出された場合は、その区分けする前の（全体の）認識対象を含む楽曲名である「アイノ○○ニワガママニボクハキミダケヲキズツケナイ」が、認識対象候補として取得され、認識結果通知部１３に表示される。

一方、前記ステップ３１０にて最初の文節についてＮＯと判断され、前記ステップ３４０（図５）にて音声認識の対象がないと判断された場合は、音声入力に対応する楽曲名がない旨が認識結果通知部１３に表示される。

ｄ）次に、本実施例１の車載オーディオ装置１の奏する効果を説明する。
(i)本発明の車載オーディオ装置１では、長い楽曲名の一部の文節のみ（例えば最初の文節、または最初から２番目までの文節）を発音すれば、その楽曲名を検索することができる。

つまり、「アイノ○○ニワガママニボクハキミダケヲキズツケナイ」というような長い楽曲名のうち、最初の文節である「アイノ○○ニ」のみを発音しても、その文節が音声認識対象となり（図５におけるステップ３００〜３３０）、その文節を含む楽曲が認識対象候補として取得され、認識結果通知部１３に表示される（図４におけるステップ２２０）。

従って、ユーザが楽曲名の全てを記憶していない場合でも、音声認識による検索が可能である。
(ii)本発明の車載オーディオ装置１では、音声認識の対象の長さは、楽曲名の読み仮名においてユーザが発音した文節の数に応じて定まる。つまり、ユーザが１つの文節のみを発音した場合は、その文節が音声認識対象となり、複数の文節を発音した場合は、それらの文節が音声認識対象となる。

従って、ユーザが発音した文節が多ければ、音声認識対象が長くなるので、認識対象候補が少数に絞られ、音声認識の精度が向上する。

本実施例２の車載オーディオ装置１の構成及び作用は基本的には前記実施例１と同様である。ただし、本実施例２では、楽曲名の読み仮名の区分方法（認識対象を区分けする特定の規則）において異なる。つまり、本実施例２では、楽曲名の読み仮名を文節ごとに区分けするのではなく、主題と副題とに区分して（特定の規則に基づいて区分けし）、音声認識辞書に登録している。

例えば、「ケッセンハ○○ヨウビ（バージョンオブザダイナマイツ）」という楽曲名の読み仮名は、音声認識辞書変換部（追加手段）５により、主題である「ケッセンハ○○ヨウビ」と、副題である「バージョンオブザダイナマイツ」とに区分されて、音声認識辞書に登録されている。

主題と副題との区切りは、楽曲データにおいて、主題と副題との間に、「、」、「−」、「〜」等の特定の文字又は記号が存在する場合は、それらの文字や記号に基づいて（自動で）区分けすることができる。また、音声認識辞書を作成する際に、人的判断によって（手動で）区分することもできる。

本実施例２の車載オーディオ装置１は、ユーザが主題である「ケッセンハ○○ヨウビ」のみを発音した場合は、図４及び図５と同様の処理により、音声認識辞書に登録されている「ケッセンハ○○ヨウビ（バージョンオブザダイナマイツ）」のうちの、「ケッセンハ○○ヨウビ」の部分が音声認識対象として音声認識辞書から抽出され、その部分を含む楽曲名が認識対象候補として取得され、認識結果通知部１３に表示される。

従って、ユーザが楽曲名の全てを記憶しておらず、主題のみを記憶している場合でも、音声認識による検索が可能である。
また、ユーザが主題と副題との両方を発音した場合は、それら全体が音声認識対象となる。この場合は、音声認識対象が長くなるので、認識対象候補が少数に絞られ、音声認識の精度を高くすることができる。

更に、本実施例２では、楽曲名の読み仮名を、特定の文字又は記号を基準として自動的に区分けすることができるので、音声認識辞書の作成が容易である。

本実施例３の車載オーディオ装置１の構成及び作用は基本的には前記実施例１と同様である。ただし、本実施例３では、音声認識辞書に新たな楽曲名の読み仮名（認識対象）を追加し、その楽曲名の読み仮名を区分けする方法において異なる。

つまり、本実施例３では、音声認識辞書変換部（認識対象を所定の文字数ごとに区分けし、認識対象単位として記憶させる手段、追加手段）５により、新たに追加される楽曲名の読み仮名を文節ごとに区分するのではなく、１０文字の部分（区分データ、認識対象単位）ごとに区分して、音声認識辞書に登録している。

例えば、「アイノ○○ニワガママニボクハキミダケヲキズツケナイ」という楽曲名の読み仮名では、「アイノ○○ニワガママ」「ニボクハキミダケヲキ」「ズツケナイ」というように、１０文字ごとに３つに区分されて、音声認識辞書に登録する。

楽曲名の読み仮名を１０文字ごとに区分けすることは、図６に示す処理により行うことが出来る。
ステップ４００では、読み仮名の残り文字数をカウントする。この残り文字数とは、ステップ４００を最初に実行する場合には、読み仮名の全ての文字数である。また、このステップ４００を実行するのが２回目以降である場合は、後述するステップ４２０にて設けた、最後の区切りよりも後の部分の文字数である。

ステップ４１０では、ステップ４００にてカウントした残り文字数が１０文字以上であるか否かを判断する。ＹＥＳの場合はステップ４２０に進み、ＮＯの場合は一旦本処理を終了する。

ステップ４２０では、読み仮名において、前の区切りから１０文字目のところに新たな区切りを設ける。
例えば、「アイノ○○ニワガママニボクハキミダケヲキズツケナイ」という読み仮名において、ステップ４２０の処理を最初に行う場合には、先頭から１０文字の部分である「アイノ○○ニワガママ」と、残りの部分である「ニボクハキミダケヲキズツケナイ」とに区分する。

また、ステップ４２０の処理を２回目に行う場合には、前回のステップ４２０の処理にて残りの部分とされた「ニボクハキミダケヲキズツケナイ」を、その先頭から１０文字の部分である「ニボクハキミダケヲキ」と、残りの部分である「ズツケナイ」とに区分する。

尚、音声認識辞書変換部５は、新たに入力した楽曲名の読み仮名だけではなく、元々音声認識辞書に記憶されている楽曲名の読み仮名を１０文字ごとに区分けすることもできる。

本実施例３の車載オーディオ装置１は、ユーザが最初の区分である「アイノ○○ニワガママ」のみを発音した場合は、音声認識辞書に登録されている「アイノ○○ニワガママニボクハキミダケヲキズツケナイ」のうちの、「アイノ○○ニワガママ」の部分が音声認識対象となる音声認識単位として音声認識辞書から抽出され、この音声認識単位を含む楽曲名の読み仮名が認識対象候補として取得される。

従って、ユーザが楽曲名の全てを記憶しておらず、最初の１０文字の区分のみを記憶している場合でも、音声認識による検索が可能である。
また、ユーザが読み仮名の全てを発音した場合は、それら全体が音声認識対象となる。この場合は、音声認識対象が長くなるので、認識対象候補が少数に絞られ、音声認識の精度を高くすることができる。

更に、本実施例３では、楽曲名の読み仮名を１０文字ごとに自動的に区切ればよいので、区分において人的判断が不要であり、音声認識辞書の作成が容易である。
尚、本発明は前記実施例になんら限定されるものではなく、本発明を逸脱しない範囲において種々の態様で実施しうることはいうまでもない。

例えば、本発明の音声認識検索装置は、図書館や書店等において、書籍や雑誌のタイトルの音声入力に基づいて、その書籍や雑誌を検索するシステムや、地図において住所や施設名の音声入力に基づいて、その住所や施設を検索するシステムに用いることができる。

また、前記実施例３における区分は、１０文字ごとの区分ではなく、他の文字数（例えば、５文字、１５文字等）ごとに区分してもよい。

実施例の車載オーディオ装置の構成を示すブロック図である。実施例における音声認識辞書の作成処理を示すフローチャートである。実施例における音声認識辞書の構造を示す説明図である。実施例における音声認識処理を示すフローチャートである。実施例における音声認識処理を示すフローチャートである。実施例において読み仮名を区分けする処理を示すフローチャートである。

符号の説明

１・・・車載オーディオ装置
３・・・データベース管理部
５・・・音声認識辞書変換部
７・・・音声認識辞書管理部
９・・・音声入力部
１１・・・音声認識部
１３・・・認識結果通知部

Claims

音声データを入力する音声データ入力手段と、
検索対象データを保持するデータベースと、
前記データベースにおいて、前記音声データに対応する検索対象データを検索する検索手段と、を備えた音声認識検索装置であって、
前記検索対象データは、２以上の区分データに区分されているとともに、
前記検索手段は、前記検索対象データにおける一部の区分データを音声認識対象とすることを特徴とする音声認識検索装置。
前記区分は、前記検索対象データの文節の区切りに基づいて行われることを特徴とする請求項１記載の音声認識検索装置。
前記区分は、前記検索対象データに含まれる特定の文字又は記号に基づいて行われることを特徴とする請求項１記載の音声認識検索装置。
前記区分は、所定の文字数ごとに行われることを特徴とする請求項１記載の音声認識検索装置。
前記データベースは、前記検索対象データをツリー構造とした音声認識辞書を備えることを特徴とする請求項１〜４のいずれかに記載の音声認識検索装置。
前記音声認識対象となる区分データは、前記音声データに対応する前記区分データであることを特徴とする請求項１〜５のいずれかに記載の音声認識検索装置。
前記検索対象データは楽曲名の読み仮名であることを特徴とする請求項１〜６のいずれかに記載の音声認識検索装置。
音声を入力する音声入力手段を有し、前記音声入力手段によって入力された音声と一致度の高い認識対象に基づき認識対象候補を音声認識辞書より取得する音声認識装置において、
新たに追加された認識対象を特定の規則に基づいて区分けし、区分けした認識対象を前記音声認識辞書に追加する追加手段と、
前記音声入力手段によって入力された音声と一致度の高い認識対象を前記区分けされた認識対象を追加した後の音声認識辞書より抽出する抽出手段と、
前記抽出手段により抽出した認識対象に基づき認識対象候補を取得する取得手段と
を具備することを特徴とする音声認識装置。
手動又は自動で認識対象を区分けすることを特徴とする請求項８に記載の音声認識装置。
前記特定の規則とは、文節ごと、特定の文字又は記号ごと、所定の文字数ごと、主題と副題との何れか又はそれらの組み合わせに区分けすることであることを特徴とする請求項８又は９に記載の音声認識装置。
音声を入力する音声入力手段と、前記音声入力手段によって入力された音声に対して音声認識を行う際に使用する認識対象を格納する音声認識辞書を記憶する記憶手段とを具備する音声認識装置において、
前記認識対象は所定の文字数ごとに認識対象単位として区分けされており、
前記音声入力手段により入力される音声と一致度の高い前記認識対象単位を前記音声認識辞書より抽出する抽出手段と、
前記抽出手段により抽出した認識対象単位を含む認識対象を認識対象候補として取得する取得手段と
を具備することを特徴とする音声認識装置。
前記記憶手段に記憶される音声認識辞書に新たな認識対象を追加する追加手段と、
前記追加手段によって追加された認識対象を所定の文字数ごとに区分けし、認識対象単位として記憶させる手段と
を有することを特徴とする請求項１１に記載の音声認識装置。
前記認識対象は、楽曲に関する名称情報であることを特徴とする請求項８乃至１２の何れか１つに記載の音声認識装置。