JPH11311991A - 音声認識辞書作成装置および方法、およびそのプログラムを記録した記録媒体 - Google Patents

音声認識辞書作成装置および方法、およびそのプログラムを記録した記録媒体

Info

Publication number
JPH11311991A
JPH11311991A JP10121368A JP12136898A JPH11311991A JP H11311991 A JPH11311991 A JP H11311991A JP 10121368 A JP10121368 A JP 10121368A JP 12136898 A JP12136898 A JP 12136898A JP H11311991 A JPH11311991 A JP H11311991A
Authority
JP
Japan
Prior art keywords
word
registered
dictionary
speech recognition
syllable
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP10121368A
Other languages
English (en)
Inventor
Yoshiki Kichise
美喜 吉瀬
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
NEC Corp
Original Assignee
NEC Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by NEC Corp filed Critical NEC Corp
Priority to JP10121368A priority Critical patent/JPH11311991A/ja
Publication of JPH11311991A publication Critical patent/JPH11311991A/ja
Pending legal-status Critical Current

Links

Abstract

(57)【要約】 【課題】 不特定話者を対象とした音節または音素単位
の音声認識装置において、認識対象語を文字列で登録を
行なう方式におこる、長音化する可能性のある音素を含
む認識対象語の認識率の低下を防ぐ。 【解決手段】 「ei」または、「ou」等の発声時に
長音化する可能性のある音素を含む認識対象単語に対し
ては、長音化した認識対象語に対応した認識辞書を自動
的に作成する。

Description

【発明の詳細な説明】
【0001】
【発明の属する技術分野】本発明は、不特定話者を対象
とした音素または音節を認識単位とした音声認識装置に
おいて、特に、文字列によって認識対象語を登録する辞
書を用いる場合の音声認識辞書作成装置および方法に関
する。
【0002】
【従来の技術】従来、不特定話者を対象とした音素また
は音節を認識単位とした音声認識装置では、認識対象語
を文字列を使ってユーザーが登録する方式を採用する場
合が多くみられる。図4に、従来の音声認識辞書を用い
る音声認識装置の構成を示す。この装置では、音声が入
力されると、特徴抽出部の音声検出処理により、背景雑
音の中から音声部分の切り出しが行われる。次に、同じ
く特徴抽出部の音声分析処理により、人間の聴覚機構に
対応して、音声認識に必要な音声のスペクトル形状を表
すパラメータが抽出され、認識のための音声パターンが
生成される。次の識別部では、照合処理により、先の音
声パターンと音声認識辞書の登録パターンとの照合を行
い、同じく識別部の判定処理により、先の照合結果から
最終的な認識出力を決定する。ここで用いられる音声認
識辞書は、照合方式に対応した形式のデータを各単語に
ついて作成し蓄積したもので、人為的に登録された単語
のパターンのみしか辞書に存在しない。
【0003】
【発明が解決しようとする課題】しかしながら、人間が
発声する音声は、ときとして登録された文字列とは異な
る場合が多い。たとえば、[ei][ou]といった単
語の長音化、すなわち「えー」、「おー」といった長音
化はよくみられる現象であるが、文字列によって認識対
象語を登録する方式の音声認識装置では、この長音化に
対応した辞書が作成されていなかった。
【0004】したがって、発声された音声に対応した単
語が登録されていないことがあり、ある特定の単語に対
して認識率の低下を招く原因となっていた。とくに音の
長音化は、個人差があるため、ある個人に対して特定の
単語を認識できないという現象の発生頻度が高くなる問
題があった。
【0005】本発明は、上記の点に鑑みてなされたもの
で、 文字列で表わされた単語から長音化する可能性の
ある音節の長音化をおこなった単語も登録単語として対
応する辞書を作成する手段を備えることで、特定の単語
の認識率低下の回避を可能にした音声認識辞書作成装置
および方法を提供するものである。
【0006】
【課題を解決するための手段】本発明の音声認識辞書作
成装置は、音声認識装置が使用する音素の標準パターン
を文字列により構成された認識対象となる単語から作成
する音声認識辞書作成装置であって、発声時に長音化す
る可能性のある音素を含む単語を前記認識対象となる単
語から検出し、該単語を長音化した単語を生成し、該長
音化した単語を含む辞書を作成する辞書作成処理部を備
える。
【0007】また、本発明の音声認識辞書作成装置は、
前記辞書作成処理部により作成された辞書を利用して、
認識出力を決定する音声認識装置をさらに備える。
【0008】また、本発明の音声認識辞書作成方法は、
音声認識対象の単語を、ひらがな表記の文字列で登録し
た登録単語ファイルから該登録単語のひらがな表記をロ
ーマ字表記に置き換え、前記登録単語のローマ字表記か
ら長音化する可能性のある音節を検出し、前記登録単語
において第2音節以降にくる長音化する可能性のある音
節を長音に置き換えた単語を生成する。
【0009】また、本発明の音声認識辞書作成装置は、
音声認識対象の単語を、ひらがな表記の文字列で登録し
た登録単語ファイルから該登録単語のひらがな表記をロ
ーマ字表記に置き換える手順と、前記登録単語のローマ
字表記をもとに長音化する可能性のある音節を検出する
手順と、前記登録単語において第2音節以降にくる長音
化する可能性のある音節を長音に置き換えた単語を生成
する手順とをコンピュータに実行させるためのプログラ
ムを記録したコンピュータ読み取り可能な記録媒体から
なる。
【0010】
【発明の実施の形態】以下、本発明の実施の形態を図面
を参照して説明する。
【0011】図1は、本発明の一実施形態の構成を示す
ブロック図である。認識対象語を登録するために使用さ
れる入力装置1と、入力装置1に接続される主制御部2
と、主制御部2に含まれる辞書作成処理部3と、主制御
部2に接続され、認識対象語を文字列として保存してい
る登録単語ファイル4と、主制御部2に接続され、登録
単語ファイル4をもとに辞書作成処理部3により作成さ
れる辞書ファイル5と、主制御部2に接続され、辞書フ
ァイル5を使用する音声認識装置6とから構成される。
【0012】なお、登録単語ファイル4および辞書ファ
イル5は、記憶装置もしくは記録装置上で実現される。
また、主制御部2は、専用のハードウェアにより構成さ
れるものであってもよく、あるいは主制御部2を構成す
るCPU(図示せず)によりプログラムが実行され、そ
の機能を実現するものであってもよい。
【0013】次に、このように構成された本実施形態の
音声認識辞書作成装置の動作について説明する。
【0014】まず、認識対象語をひらがな表記の文字列
として入力装置1より入力する。主制御部2はこの認識
対象語データを、一例として図3の登録ファイルフォー
マット例のように、ひらがな表記した登録単語ファイル
4に保存する。辞書作成処理部3は、登録単語ファイル
4のデータをもとに、認識対象語を所定の形式で辞書フ
ァイル5に組込むか、または新しい辞書ファイル5を作
成するように動作する。
【0015】ここで、辞書作成処理部3の処理を図面を
用いて詳細に説明する。なお、図2は辞書作成処理部3
の処理フローを示している。
【0016】辞書作成処理部3は、登録単語ファイル4
から、ひらがな表記で登録されている登録単語を読み出
し、ローマ字表記に変更する(ステップS1)。
【0017】次に、辞書作成処理部3は、登録単語のロ
ーマ字表記から長音化の可能性がある「ei」「ou」
等を検出する(ステップS2)。なお、ローマ字表記に
おける長音化の可能性のある部分を示すテーブルが別途
用意されており、このテーブルを参照することにより検
出処理は行われる。
【0018】この認識登録単語の第2音節以降にこれら
の音があった場合、話者によっては長音として発声され
る可能性があるので、長音に変更した単語を生成する
(ステップS3)。なお、この長音に変更した単語を生
成するルールが別途用意され、このルールに基づいて単
語の生成が行われる。
【0019】次に、登録単語を長音に変更した単語及び
変更前の登録単語を所定のフォーマットで記録した辞書
ファイル5を生成する(ステップS4)。なお、長音に
変更した単語と変更前の単語は、別々の辞書ファイル5
に記録されてもよい。
【0020】次に、具体例として、「経理(けいり)」
と「東京(とうきょう)」を登録する場合を例にとり詳
細に説明する。
【0021】認識対象語が「経理(けいり)」の場合、
ひらがな表記として「けいり」と表される。次にこれを
ローマ字表記に変換すると、「keiri」となる。こ
の中には、長音化する可能性がある「ei」が含まれて
いる。そこで、この部分を長音化し、すなわち「けー
り」とした単語も登録し、対応の辞書を作成する。
【0022】また、長音化する可能性がある「ou」を
含む「東京(とうきょう)」についても同様である。登
録単語ファイル4からひらがな表記の「とうきょう」を
読み出し、ローマ字表記の「toukyou」に置き換
える。次に、第2音節以降にくる「ou」を検出する。
「とうきょう」には、「ou」の部分が2個所存在する
が、これらのいずれに対しても長音化をはかる、すなわ
ち「とーきょう」「とうきょー」「とーきょー」といっ
た単語も含めて対応する辞書を作成する。以上のように
して、辞書作成処理部3により辞書ファイル5は生成さ
れる。
【0023】なお、本実施形態では、音声認識装置6に
対し独立した装置として説明したが、音声認識装置6を
含め生成した辞書ファイル5を利用して音声認識を行え
るようにしてもよい。なお音声認識装置6の動作は、従
来の技術で説明した通りであり、説明を省略する。
【0024】また、図1における辞書作成処理部3を実
現するためのプログラムをコンピュータ読み取り可能な
記録媒体に記録して、この記録媒体に記録されたプログ
ラムをコンピュータシステムに読み込ませ、実行するこ
とにより音声認識辞書作成を行ってもよい。なお、ここ
でいう「コンピュータシステム」とは、OSや周辺機器
等のハードウェアを含むものとする。また、「コンピュ
ータ読み取り可能な記録媒体」とは、フロッピーディス
ク、光磁気ディスク、ROM、CD−ROM等の可般媒
体、コンピュータシステムに内蔵されるハードディスク
等の記憶装置のことをいう。さらに「コンピュータ読み
取り可能な記録媒体」とは、インターネット等のネット
ワークや電話回線等の通信回線を介してプログラムを送
信する場合の通信線のように、短時間の間、動的にプロ
グラムを保持するもの、その場合のサーバやクライアン
トとなるコンピュータシステム内部の揮発性メモリのよ
うに、一定時間プログラムを保持しているものも含むも
のとする。また上記プログラムは、前述した機能の一部
を実現するためのものであっても良く、さらに前述した
機能をコンピュータシステムにすでに記録されているプ
ログラムとの組み合わせで実現できるものであっても良
い。
【0025】
【発明の効果】文字列で登録された認識対象の単語か
ら、長音化する可能性のある音節の長音化をおこなった
単語も辞書に登録する処理部を備えることで、特定の単
語の認識率の低下を回避することができる。
【図面の簡単な説明】
【図1】 本発明の一実施形態である音声認識辞書作成
装置の構成を示す図である。
【図2】 本発明の一実施形態である辞書作成処理の処
理フローを示す。
【図3】 本発明の一実施形態である登録ファイルフォ
ーマットを示す。
【図4】 従来の音声認識装置の構成を示す図である。
【符号の説明】
1 入力装置 2 主制御部 3 辞書作成処理部 4 登録単語ファイル 5 辞書ファイル 6 音声認識装置

Claims (4)

    【特許請求の範囲】
  1. 【請求項1】 音声認識装置が使用する音素の標準パタ
    ーンを文字列により構成された認識対象となる単語から
    作成する音声認識辞書作成装置であって、 発声時に長音化する可能性のある音素を含む単語を前記
    認識対象となる単語から検出し、該単語を長音化した単
    語を生成し、該長音化した単語を含む辞書を作成する辞
    書作成処理部を備えることを特徴とする音声認識辞書作
    成装置。
  2. 【請求項2】 前記音声認識辞書作成装置は、 前記辞書作成処理部により作成された辞書を利用して、 認識出力を決定する音声認識装置をさらに備えたことを
    特徴とする請求項1記載の音声認識辞書作成装置。
  3. 【請求項3】 音声認識対象の単語を、ひらがな表記の
    文字列で登録した登録単語ファイルから該登録単語のひ
    らがな表記をローマ字表記に置き換え、 前記登録単語のローマ字表記から長音化する可能性のあ
    る音節を検出し、 前記登録単語において第2音節以降にくる長音化する可
    能性のある音節を長音に置き換えた単語を生成すること
    を特徴とする音声認識辞書作成方法。
  4. 【請求項4】 音声認識対象の単語を、ひらがな表記の
    文字列で登録した登録単語ファイルから該登録単語のひ
    らがな表記をローマ字表記に置き換える手順と、 前記登録単語のローマ字表記をもとに長音化する可能性
    のある音節を検出する手順と、 前記登録単語において第2音節以降にくる長音化する可
    能性のある音節を長音に置き換えた単語を生成する手順
    とをコンピュータに実行させるためのプログラムを記録
    したコンピュータ読み取り可能な記録媒体。
JP10121368A 1998-04-30 1998-04-30 音声認識辞書作成装置および方法、およびそのプログラムを記録した記録媒体 Pending JPH11311991A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP10121368A JPH11311991A (ja) 1998-04-30 1998-04-30 音声認識辞書作成装置および方法、およびそのプログラムを記録した記録媒体

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP10121368A JPH11311991A (ja) 1998-04-30 1998-04-30 音声認識辞書作成装置および方法、およびそのプログラムを記録した記録媒体

Publications (1)

Publication Number Publication Date
JPH11311991A true JPH11311991A (ja) 1999-11-09

Family

ID=14809520

Family Applications (1)

Application Number Title Priority Date Filing Date
JP10121368A Pending JPH11311991A (ja) 1998-04-30 1998-04-30 音声認識辞書作成装置および方法、およびそのプログラムを記録した記録媒体

Country Status (1)

Country Link
JP (1) JPH11311991A (ja)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2001242887A (ja) * 2000-02-29 2001-09-07 Xanavi Informatics Corp 音声認識装置および音声認識ナビゲーション装置
JP2016011995A (ja) * 2014-06-27 2016-01-21 インターナショナル・ビジネス・マシーンズ・コーポレーションInternational Business Machines Corporation 発音辞書の拡張システム、拡張プログラム、拡張方法、該拡張方法により得られた拡張発音辞書を用いた音響モデルの学習方法、学習プログラム、および学習システム

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2001242887A (ja) * 2000-02-29 2001-09-07 Xanavi Informatics Corp 音声認識装置および音声認識ナビゲーション装置
JP4550207B2 (ja) * 2000-02-29 2010-09-22 クラリオン株式会社 音声認識装置および音声認識ナビゲーション装置
JP2016011995A (ja) * 2014-06-27 2016-01-21 インターナショナル・ビジネス・マシーンズ・コーポレーションInternational Business Machines Corporation 発音辞書の拡張システム、拡張プログラム、拡張方法、該拡張方法により得られた拡張発音辞書を用いた音響モデルの学習方法、学習プログラム、および学習システム

Similar Documents

Publication Publication Date Title
US6910012B2 (en) Method and system for speech recognition using phonetically similar word alternatives
US10027662B1 (en) Dynamic user authentication
US7013276B2 (en) Method of assessing degree of acoustic confusability, and system therefor
JP5255769B2 (ja) テキストフォーマッティング及びスピーチ認識のためのトピック特有のモデル
JP4570176B2 (ja) ユーザにオーディオ・フィードバックを与える拡張可能音声認識システム
US11024298B2 (en) Methods and apparatus for speech recognition using a garbage model
US20090112587A1 (en) System and method for generating a phrase pronunciation
CN112927683A (zh) 用于语音使能设备的动态唤醒词
WO2014183373A1 (en) Systems and methods for voice identification
JPWO2018043138A1 (ja) 情報処理装置および情報処理方法、並びにプログラム
US20050187767A1 (en) Dynamic N-best algorithm to reduce speech recognition errors
US20170270923A1 (en) Voice processing device and voice processing method
JP4354299B2 (ja) 事例検索プログラム、事例検索方法及び事例検索装置
JP7339116B2 (ja) 音声認証装置、音声認証システム、および音声認証方法
JP6810363B2 (ja) 情報処理装置、情報処理システム、および情報処理プログラム
US6772116B2 (en) Method of decoding telegraphic speech
JP6347939B2 (ja) 発話内重要語抽出装置とその装置を用いた発話内重要語抽出システムと、それらの方法とプログラム
JPH11311991A (ja) 音声認識辞書作成装置および方法、およびそのプログラムを記録した記録媒体
JP2003162524A (ja) 言語処理装置
JP2009025411A (ja) 音声認識装置およびプログラム
JP2006010739A (ja) 音声認識装置
JP3881155B2 (ja) 音声認識方法及び装置
US20230215419A1 (en) Method and apparatus for constructing domain-specific speech recognition model and end-to-end speech recognizer using the same
KR20240112028A (ko) 발음열 유사도를 이용한 음성 자동 학습 시스템 및 방법과 이를 위한 컴퓨터 프로그램
JP2004117771A (ja) 音声認識用辞書作成方法、音声認識方法、音声認識用辞書作成装置、音声認識装置、音声認識プログラム及び音声認識システム

Legal Events

Date Code Title Description
A02 Decision of refusal

Free format text: JAPANESE INTERMEDIATE CODE: A02

Effective date: 20001003