JPH09120296A - 音声認識装置および方法、辞書作成装置および方法、情報記憶媒体 - Google Patents

音声認識装置および方法、辞書作成装置および方法、情報記憶媒体

Info

Publication number
JPH09120296A
JPH09120296A JP8165447A JP16544796A JPH09120296A JP H09120296 A JPH09120296 A JP H09120296A JP 8165447 A JP8165447 A JP 8165447A JP 16544796 A JP16544796 A JP 16544796A JP H09120296 A JPH09120296 A JP H09120296A
Authority
JP
Japan
Prior art keywords
reading
dictionary
language
languages
word
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP8165447A
Other languages
English (en)
Other versions
JP3865149B2 (ja
Inventor
Masako Hirose
雅子 広瀬
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Ricoh Co Ltd
Original Assignee
Ricoh Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Ricoh Co Ltd filed Critical Ricoh Co Ltd
Priority to JP16544796A priority Critical patent/JP3865149B2/ja
Publication of JPH09120296A publication Critical patent/JPH09120296A/ja
Application granted granted Critical
Publication of JP3865149B2 publication Critical patent/JP3865149B2/ja
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Abstract

(57)【要約】 【課題】 音声認識を高速化させる。 【解決手段】 語表記対応辞書5に、認識候補の言語を
先頭部の読み毎に分類して予め格納しておく。100や
150の先頭部の読みは共に“ひゃく”などとなる。音
声入力手段3に音声が入力されると、その先頭部に先頭
部の読みが一致する言語を、音声認識手段4により語表
記対応辞書5から検出する。音声認識の処理対象となる
読みが先頭部に制限されているので、その個数が削減さ
れており、処理が高速に完了する。

Description

【発明の詳細な説明】
【0001】
【発明の属する技術分野】本発明は、音声を認識する音
声認識装置および方法と、音声認識装置の語表記対応辞
書に言語と読みとを格納する辞書作成装置および方法
と、コンピュータのプログラムが予め書き込まれた情報
記憶媒体に関する。
【0002】
【従来の技術】現在、音声を認識する音声認識装置の実
用化が要望されている。一般的な音声認識装置は、認識
候補の言語毎に読みが格納された辞書を有しており、音
声が入力されると辞書の読みを検索し、これが一致した
言語として音声を認識する。
【0003】
【発明が解決しようとする課題】上述のような音声認識
装置は、音声に一致する読みを辞書から検索することに
より、音声を言語として認識することができる。
【0004】しかし、認識する言語の個数は膨大である
ため、その読みを個々に検索していると処理が遅滞し、
連続的に入力される音声をリアルタイムに認識するよう
なことが困難となる。
【0005】このような課題を解決する手法の一つが、
「自由発声音声認識における意味を考慮した2段LRパ
ーザ」(南等、日本音響学会講演論文集、3-4-10,199
3.3)に開示されている。これは電話番号案内の問い合
わせタスクを想定しており、このような問い合わせは、
項目に意味が有り文体には意味が無いことに着目し、意
味を考慮することで認識候補の言語を減少させている。
より具体的には、LRテーブルを意味のレベルで分類し
て作成し、意味が同等の複数の言語を一つにまとめるな
どしている。
【0006】しかし、タスクを極度に限定すれば、上述
のようにして認識候補の言語を削減することができる
が、一般的なタスクの場合、意味が同等の言語が多数の
場合もあり、このような場合には認識候補の言語を有効
に削減することができない。
【0007】また、認識候補の言語を減少させる他の手
法が、「メニューに基づく音声自然言語入力システム」
(山本等、情報処理学会第47回全国大会、7M-2,1993.1
9)に開示されている。これは音声の入力単位を文節と
し、システムが高い確率で処理を実行できる範囲に入力
を制限して認識対象の言語を削減している。
【0008】しかし、人間の発声は文頭に比較して文末
が曖昧になる傾向があるため、上述のように入力単位を
音節とすると誤認識が発生しやすい。また、連続した数
詞などの発声では、“さんじゅう,さんじゅうに,さん
びゃく”のように、最初は同一で最後が相違することが
多いが、このような音声を上述した手法で認識すると、
認識率が低いまま処理に時間を要する。
【0009】このような場合、長時間の処理で一つの間
違った認識結果が出力されるよりは、正解が含まれる複
数の認識候補が短時間の処理で出力されるほうが望まし
い。つまり、結果として出力される認識候補が複数で
も、それに正解が含まれるならば、これを他の手法によ
り一つの正解に絞り込むことが可能であり、このような
場合には最初の処理が迅速であることが要求される。し
かし、このようなことは、上述した手法に考慮されてい
ない。
【0010】
【課題を解決するための手段】請求項1記載の発明の音
声認識装置は、認識対象の音声が入力される音声入力手
段と、認識候補の言語が先頭部の読み毎に予め格納され
た語表記対応辞書と、音声入力手段により入力された音
声の先頭部に先頭部の読みが一致する言語を語表記対応
辞書から検出する音声認識手段と、を有する。音声入力
手段に認識対象の音声が入力されると、音声認識手段
は、音声の先頭部に先頭部の読みが一致する言語を語表
記対応辞書から検出する。このとき、音声認識の処理対
象となる読みが先頭部に制限されており、その個数が削
減されているので、この処理動作は高速に実行される。
人間の発声は音声の先頭部で明瞭な傾向にあるので、誤
認識の発生率も低下する。認識結果が複数となる場合は
発生するが、これには高確率で正解が含まれるので、長
時間の処理で一つの間違った認識結果が出力されるもの
より実用的である。なお、ここで言う先頭部は、先頭か
ら一定の部分であるので、例えば、短い言語では、読み
の全体が読みの先頭部となることもある。
【0011】請求項2記載の発明の辞書作成装置は、各
種の言語が読みと共に予め格納された一般言語辞書と、
この一般言語辞書から取り出した言語を読みの先頭部毎
に語表記対応辞書に格納する読み生成手段と、を有す
る。読み生成手段は、一般言語辞書から取り出した言語
を読みの先頭部毎に語表記対応辞書に格納するので、先
頭が同一でも末尾が相違する複数の言語が一つの読みに
集約される。このような語表記対応辞書を利用して音声
認識装置が音声を認識する場合、この音声認識装置の処
理対象となる読みの個数が削減される。なお、ここで言
う一般言語辞書は、各種の言語が読みと共に予め格納さ
れた一般的な辞書であれば良く、例えば、既存の言語デ
ータベース等が利用できる。
【0012】請求項3記載の発明の辞書作成装置では、
言語の読みの表音単位が予め格納された表音単位辞書を
設け、読み生成手段は、言語の先頭から一定の表音単位
の部分を読みの先頭部として生成するので、簡易な処理
で読みの先頭部の長さが一定となり、音声認識装置の処
理対象となる読みに人間の発声の特徴が良好に反映され
る。
【0013】請求項4記載の発明の辞書作成装置では、
読み生成手段は、言語の先頭から一定の表記単位の部分
を読みの先頭部として生成するので、簡易な処理で読み
の先頭部の長さが一定となり、音声認識装置の処理対象
となる読みに人間の発声の特徴が良好に反映される。
【0014】請求項5記載の発明の辞書作成装置では、
言語の分類毎に読みの先頭部の長さが長さ設定辞書に予
め設定されており、読み生成手段は、生成する言語の読
みの先頭部の長さを分類毎に可変する。例えば、特定の
言語のみ読みの長さを延長すれば、音声認識装置の処理
全体の所要時間は増加させることなく、特定の音声の認
識精度が向上する。
【0015】請求項6記載の発明の辞書作成装置では、
数詞の各桁の読みが桁数毎に桁対応辞書に予め格納され
ており、読み生成手段は、複数桁の数詞を言語として先
頭部の読みを生成する場合、先頭部の所定桁の数詞の読
みを一般言語辞書から検出すると共に、先頭部の所定桁
の読みを桁対応辞書から検出して組み合わせる。一般言
語辞書が一般的なデータベースなどからなる場合、一桁
の数詞は格納されていても複数桁の数詞は格納されてい
ない可能性が高いが、このような場合でも複数桁の数詞
の読みが簡易な処理で生成される。
【0016】請求項7記載の発明の辞書作成装置では、
組み合わされる数詞により変化する各桁の読みが読み変
化辞書に予め格納されており、読み生成手段は、複数桁
の数詞を言語として読みを生成する場合に、読み変化辞
書を参照して対応する数詞の読みを修正する。単純な組
み合わせでは不自然な形態となる読みが、自然な形態に
修正される。
【0017】請求項8記載の発明の辞書作成装置では、
言語の分類が言語分類辞書に予め設定されており、読み
生成手段は、生成する読みに対応する言語を言語分類辞
書の設定に従って分類し、この分類された言語の個数が
予め設定された基準値を超過しなければ、読みを先頭部
に制限しない。例えば、音声認識の出現頻度が高い言語
の読みを先頭部に制限し、出現頻度が低い言語の読みを
先頭部に制限しないようにすれば、音声認識装置の処理
時間が短縮されると共に認識精度が向上する。
【0018】請求項9記載の発明の辞書作成装置では、
言語の分類が言語分類辞書に予め設定されており、読み
生成手段は、生成する読みに対応する言語を言語分類辞
書の設定に従って分類し、この分類における読みの個数
が予め設定された基準値を超過しないように、生成する
言語の読みの先頭部の長さを可変する。一つの分類の言
語が多数でも読みの個数は一定となり、一つの分類の言
語が少数の場合は読みが先頭部に制限されない。
【0019】請求項10記載の発明の辞書作成装置で
は、複数の言語の連続する条件が条件設定辞書に予め設
定されており、読み生成手段は、条件設定辞書を参照し
て複数の連続する言語の読みを生成し、末尾に位置する
言語のみ読みを先頭部に制限する。連続が予想される複
数の言語が予め組み合わされ、一つの言語と同様に取り
扱かわれる。
【0020】請求項11記載の発明の辞書作成装置で
は、読み生成手段は、複数の連続する言語の全体の読み
が予め設定された基準値を超過しないように、末尾に位
置する言語の読みの先頭部の長さを制限するので、組み
合わされる複数の言語の先頭の言語が長くとも全体の長
さは一定となる。
【0021】請求項12記載の発明の辞書作成装置で
は、条件設定辞書は、複数の言語の連続する条件と共
に、末尾に位置する言語の読みの長さが予め設定されて
おり、読み生成手段は、末尾に位置する言語の読みを設
定された長さに制限する。末尾の言語の読みの長さが分
類に従って可変されるので、先頭の言語が長いほど末尾
の言語を短くするようなことができる。
【0022】請求項13記載の発明の音声認識方法は、
認識候補の言語を先頭部の読み毎に語表記対応辞書に予
め格納しておき、認識対象の音声の先頭部に先頭部の読
みが一致する言語を前記語表記対応辞書から検出するよ
うにした。認識対象の音声が入力されると、これに先頭
部の読みが一致する言語が語表記対応辞書から検出され
る。このとき、音声認識の処理対象となる読みが先頭部
に制限されており、その個数が削減されているので、こ
の処理動作は高速に実行される。人間の発声は音声の先
頭部で明瞭な傾向にあるので、誤認識の発生率も低下す
る。認識結果が複数となる場合は発生するが、これには
高確率で正解が含まれるので、長時間の処理で一つの間
違った認識結果が出力されるものより実用的である。
【0023】請求項14記載の発明の辞書作成方法は、
各種の言語が読みと共に予め格納された一般言語辞書か
ら言語を取り出し、この取り出した言語を読みの先頭部
毎に語表記対応辞書に格納するようにした。一般言語辞
書から取り出された言語が読みの先頭部毎に語表記対応
辞書に格納されるので、先頭が同一でも末尾が相違する
複数の言語が一つの読みに集約される。このような語表
記対応辞書を利用して音声認識装置が音声を認識する場
合、この音声認識装置の処理対象となる読みの個数が削
減される。
【0024】請求項15記載の発明の情報記憶媒体は、
コンピュータが読取自在なソフトウェアが予め書き込ま
れた情報記憶媒体において、認識候補の言語が先頭部の
読み毎に予め格納された語表記対応辞書と、認識対象の
音声の先頭部に先頭部の読みが一致する言語を前記語表
記対応辞書から前記コンピュータに検出させるプログラ
ムと、が書き込まれている。この情報記憶媒体のソフト
ウェアをコンピュータに読み取らせて動作させれば、こ
のコンピュータは、音声の先頭部に先頭部の読みが一致
する言語を語表記対応辞書から検出する音声認識装置と
して機能する。このとき、音声認識の処理対象となる読
みが先頭部に制限されており、その個数が削減されてい
るので、この処理動作は高速に実行される。人間の発声
は音声の先頭部で明瞭な傾向にあるので、誤認識の発生
率も低下する。認識結果が複数となる場合は発生する
が、これには高確率で正解が含まれるので、長時間の処
理で一つの間違った認識結果が出力されるものより実用
的である。
【0025】請求項16記載の発明の情報記憶媒体は、
コンピュータが読み取って対応する動作を実行するプロ
グラムが予め書き込まれた情報記憶媒体において、各種
の言語が読みと共に予め格納された一般言語辞書から言
語を取り出すこと、この取り出した言語を読みの先頭部
毎に語表記対応辞書に格納すること、を前記コンピュー
タに実行させるプログラムが書き込まれている。この情
報記憶媒体のプログラムをコンピュータに読み取らせて
動作させれば、このコンピュータは、音声認識装置に利
用される語表記対応辞書を作成する辞書作成装置として
機能する。このとき、一般言語辞書から取り出された言
語が読みの先頭部毎に語表記対応辞書に格納されるの
で、先頭が同一でも末尾が相違する複数の言語が一つの
読みに集約される。このような語表記対応辞書を利用し
て音声認識装置が音声を認識する場合、この音声認識装
置の処理対象となる読みの個数が削減される。
【0026】
【発明の実施の形態】本発明の実施の第一の形態を図1
ないし図6に基づいて以下に説明する。まず、図1に示
すように、ここで例示する音声認識装置1と辞書作成装
置2とは、一体に形成されており、図2および図3に示
すように、そのハードウェアとしてデータ処理装置であ
るコンピュータシステム100を有している。このコン
ピュータシステム100は、コンピュータの主体として
CPU(Central Processing Unit)101を有してお
り、このCPU101には、バスライン102により、
ROM(Read Only Memory)103、RAM(Random Acce
ss Memory)104、HD(Hard Disk…図示せず)を内蔵
したHDD(HD Drive)105、FD(Floppy Disk)10
6が装填されるFDD(FD Drive)107、CD(Compact
Disk)−ROM108が装填されるCD−ROMドライ
ブ109、マウス110が接続されたキーボード11
1、ディスプレイ112、マイクロフォン113、通信
I/F(Interface)114、等が接続されている。
【0027】このコンピュータシステム100は、前記
CPU101に各種の処理動作を実行させるプログラム
等が予め設定されており、このプログラム等のソフトウ
ェアは、例えば、情報記憶媒体である前記RAM104
や前記HDD105のHD(図示せず)に予め書き込ま
れている。上述のようなコンピュータシステム100に
おいて、前記CPU101が前記RAM104等に格納
されたプログラムに従って各種の処理動作を実行するこ
とにより、本実施の形態の音声認識装置1と辞書作成装
置2とが実現されている。
【0028】本実施の形態の音声認識装置1は、図1に
示すように、音声入力手段である音声入力部3、音声認
識手段である音声認識部4、語表記対応辞書である語表
記対応表5、結果出力手段である結果出力部6、結果選
択手段である結果選択部7、を有しており、前記音声認
識部4に前記音声入力部3と前記語表記対応表5と前記
結果出力部6と前記結果選択部7とが接続されている。
本実施の形態の辞書作成装置2は、一般言語辞書である
単語辞書8と読み生成手段である読み生成部9とを有し
ており、この読み生成部9には、前記単語辞書8と前記
語表記対応表5とが接続されている。
【0029】前記音声入力部3は、ハードウェアとして
前記マイクロフォン113などを有しており、人間が発
声した音声を電気信号に変換する。前記語表記対応表5
と前記単語辞書8とは、前記RAM104等の情報記憶
媒体を有しており、ここでは認識候補の言語として数詞
が予め格納されている。前記単語辞書8は、例えば、音
声認識のタスクに対応した数詞の既存のデータベースな
どからなり、図4に示すように、認識候補となる各種の
数詞が読みと共に予め格納されている。
【0030】前記語表記対応表5には、図5に示すよう
に、認識候補の数詞が先頭部の読み毎に予め格納されて
いる。この数詞の先頭部の読みは、ここでは数詞の読み
の先頭から一定の表記単位の部分として生成されてお
り、具体的には、数詞の表記単位である文字の個数が三
個以下となるように制限されている。このため、数詞で
ある“115”の読みである“ひゃくじゅうご”などは
先頭部の“ひゃく”に短縮されているが、“100”の
“ひゃく”は“ひゃく”のままである。
【0031】前記音声認識部4は、前記CPU101な
どを有しており、前記音声入力部3が認識対象の音声が
入力されると、この音声の先頭部に先頭部の読みが一致
する数詞を語表記対応表5から検出する。この場合、上
述のように語表記対応表5に格納されている読みの先頭
部は三文字なので、入力された音声も先頭の三文字のみ
が処理対象となる。
【0032】前記結果出力部6は、前記ディスプレイ1
12などを有しており、前記音声認識部4の認識結果を
出力する。前記結果選択部7は、前記キーボード111
などを有しており、前記結果出力部6の出力結果が複数
の場合に、これをユーザの手動操作に対応して一つに選
定する。
【0033】前記読み生成部9は、前記CPU101な
どを有しており、単語辞書8から取り出した数詞を、読
みの先頭部毎に音声認識装置1の語表記対応表5に格納
する。前述のように語表記対応表5には数詞の読みが先
頭部の三文字毎に格納されるので、前記読み生成部9
は、前記単語辞書8から取り出した数詞の読みの先頭か
ら一定の表記単位である三文字の部分を先頭部として生
成する。
【0034】上述した音声認識装置1と辞書作成装置2
との各部は、必要により前記キーボード111や前記デ
ィスプレイ112や前記マイクロフォン113等のハー
ドウェアを利用して実現されるが、その主体は前記RA
M104等に書き込まれたソフトウェアに対応して前記
CPU101が動作することにより実現されている。
【0035】このように前記RAM104に書き込まれ
たソフトウェアは、前記CPU101が読取自在なソフ
トウェアからなる前記単語辞書8、この単語辞書8から
言語を取り出させて読みの先頭部毎に前記語表記対応表
5に格納させる前記CPU101の制御プログラム、前
記CPU101が読取自在なソフトウェアからなる前記
語表記対応表5、前記音声入力部3に認識対象の音声が
入力されると、その先頭部に先頭部の読みが一致する言
語を前記語表記対応表5から検出させる前記CPU10
1の制御プログラム、等からなる。
【0036】このような構成において、音声認識装置1
は、人間が発声する音声を認識する。より詳細には、図
6に示すように、人間が発声した音声が音声入力部3に
入力されると、音声認識部4は、この音声の先頭部の三
文字を抽出し、始点を先頭に固定したスポッティングに
より、読みが一致する数詞を語表記対応表5から検出す
る。このように検出された数詞は結果出力部6から出力
されるので、検出された数詞が複数の場合は結果選択部
7の手動操作により一つに選定される。
【0037】例えば、音声として“ひゃくじゅう”が入
力されると、読みが“ひゃく”の数詞である“100,
110,115”の三つが出力されるので、ユーザは所
望により“110”を選択することになる。
【0038】上述した音声認識装置1は、語表記対応表
5に三文字の読み毎に数詞が格納されているので、処理
対象となる読みの個数が削減されており、処理負担が軽
減されて所要時間が短縮されている。しかも、このよう
に読みの検索処理を三文字だけで実行するので、このこ
とでも処理負担が軽減されて所要時間が短縮されてい
る。
【0039】人間の発声は文頭に比較して文末が曖昧に
なる傾向があるが、上述した音声認識装置1は、音声の
先頭部のみを処理対象とするので、誤認識が発生しにく
い。この場合、上述のように認識結果が複数となること
が多発するが、この複数の認識候補には高確率で正解が
含まれており、短時間の処理で出力されるので、これを
一つに選定する第二の処理を実行しても全体の所要時間
は短く、長時間の処理で一つの間違った認識結果が出力
されるものより実用的である。
【0040】音声認識装置1の語表記対応表5は、上述
のように数詞が特殊な読み毎に格納されているが、これ
は辞書作成装置2により機械的に作成される。つまり、
単語辞書8には、図4に示すように、認識候補となる各
種の数詞が読みと共に予め格納されているので、読み生
成部9が、単語辞書8から取り出した数詞を、読みの先
頭部毎に音声認識装置1の語表記対応表5に格納する。
【0041】より具体的には、最初に単語辞書8から数
詞“100”が取り出された場合、その読みは“ひゃ
く”なので、この“ひゃく”が読みの先頭部として“1
00”が語表記対応表5に格納される。つぎに、数詞
“110”が取り出された場合、その読みは“ひゃくじ
ゅう”なので先頭部は“ひゃく”であり、この数詞“1
10”は上述した“100”と共に語表記対応表5の
“ひゃく”の読みの位置に格納される。
【0042】このため、語表記対応表5には、多数の数
詞が少数の読みに割り当てられて格納され、先頭が同一
でも末尾が相違して誤認識が発生しやすい複数の数詞が
一つの読みに集約される。このような音声認識装置1の
語表記対応表5が、辞書作成装置2により既存の単語辞
書8から機械的に作成されるので、この作業を人間が実
行する必要がない。このように数詞の読みを表記単位で
ある文字の個数により先頭部に制限するので、簡易な処
理で読みの先頭部の長さを一定に共通化することができ
る。
【0043】なお、本発明は上記した実施の形態に限定
されるものではなく、各種の変形を許容する。例えば、
ここでは音声認識装置1と辞書作成装置2とが一体であ
ることを例示したが、これを別体の装置とし、音声認識
装置1の開発時に辞書作成装置2を使用し、製品として
出荷される音声認識装置1には辞書作成装置2を搭載し
ないことも可能である。
【0044】また、本実施の形態では、RAM104等
にソフトウェアとして格納されているプログラムに従っ
てCPU101が動作することにより、音声認識装置1
や辞書作成装置2の各部が実現されることを例示した。
しかし、このような各部の各々を固有のハードウェアと
して製作することも可能であり、一部をソフトウェアと
してRAM104等に格納するとともに一部をハードウ
ェアとして製作することも可能である。また、所定のソ
フトウェアが格納されたRAM104等や各部のハード
ウェアを、例えば、ファームウェアとして製作すること
も可能である。
【0045】また、本実施の形態では、コンピュータシ
ステム100の起動時に、HDD105に格納されてい
るソフトウェアがRAM104に複写され、このように
RAM104に格納されたソフトウェアをCPU101
が読み取ることを想定したが、このようなソフトウェア
をHDD105に格納したままCPU101に利用させ
ることや、ROM103やRAM104に予め書き込ん
でおくことも可能である。
【0046】さらに、単体で取り扱える情報記憶媒体で
あるFD106やCD−ROM109にソフトウェアを
書き込んでおき、このFD106等からRAM104等
にソフトウェアをインストールすることも可能であり、
このようなインストールを実行することなくFD106
等に書き込まれたソフトウェアをCPU101が適宜読
み取ってデータ処理を実行することも可能である。
【0047】また、このような音声認識装置1や辞書作
成装置2の各部を実現するプログラムを、複数のソフト
ウェアの組み合わせにより実現することも可能であり、
その場合、単体の製品となる情報記憶媒体には必要最小
限のソフトウェアのみを格納しておけば良い。例えば、
オペレーティングシステムが実装されているコンピュー
タシステム100に、CD−ROM108等の情報記憶
媒体によりアプリケーションソフトを提供するような場
合、音声認識装置1や辞書作成装置2の各部を実現する
ソフトウェアは、アプリケーションソフトとオペレーテ
ィングシステムとの組み合わせで実現されるので、オペ
レーティングシステムに依存する部分のソフトウェアは
アプリケーションソフトの情報記憶媒体から省略するこ
とができる。
【0048】また、このように情報記憶媒体に書き込ん
だソフトウェアをコンピュータに供給する手法は、その
情報記憶媒体をコンピュータに直接に装填することに限
定されない。例えば、上述のようなソフトウェアをホス
トコンピュータの情報記憶媒体に書き込み、このホスト
コンピュータを通信ネットワークにより端末コンピュー
タに接続し、ホストコンピュータからデータ通信により
端末コンピュータにソフトウェアを供給することも可能
である。
【0049】この場合、端末コンピュータが自身の情報
記憶媒体にソフトウェアをダウンロードした状態でスタ
ンドアロンのデータ処理を実行することも可能である
が、ソフトウェアをダウンロードすることなくホストコ
ンピュータとのリアルタイムのデータ通信によりデータ
処理を実行することも可能である。この場合、ホストコ
ンピュータと端末コンピュータとを通信ネットワークに
より接続したシステム全体が、本発明の音声認識装置1
や辞書作成装置2に相当することになる。
【0050】つぎに、本発明の実施の第二の形態を図7
ないし図9に基づいて以下に説明する。なお、この実施
の第二の形態に関し、上述した第一の形態と同一の部分
は、同一の名称および符号を用いて詳細な説明は省略す
る。
【0051】まず、図7に示すように、ここで例示する
音声認識装置11と辞書作成装置12も一体に形成され
ており、この辞書作成装置12には、表音単位辞書であ
る音節表13が付加されている。この音節表13は、R
AMなどの記憶デバイスを有しており、図8に示すよう
に、数詞の読みの表音単位である音節が予め格納されて
いる。読み生成部9は、単語辞書8から取り出した数詞
を読みの先頭部毎に語表記対応表5に格納する際、前記
音節表13を参照して数詞の読みの先頭から二つの音節
の部分を先頭部として生成する。
【0052】このような構成において、本実施の形態の
音声認識装置11も、人間が発声する音声を認識する。
この時、音声認識部4は、この音声の先頭部の二音節を
抽出し、これに二音節の読みが一致する数詞を語表記対
応表5から検出する。この音声認識装置11は、音声を
認識する処理を表音単位である音節に従って実行するの
で、音声認識の処理動作に人間の発声の特徴を良好に反
映させることができる。
【0053】そして、辞書作成装置12も、上述のよう
な音声認識装置11の語表記対応表5を作成する。その
読み生成部9は、単語辞書8から取り出した数詞を読み
の先頭部毎に語表記対応表5に格納する際、音節表13
を参照して読みを二音節に制限する。このように数詞の
読みを表音単位である音節の個数により先頭部に制限す
るので、簡易な処理で読みの先頭部の長さを一定に共通
化することができる。
【0054】つぎに、本発明の実施の第三の形態を図1
0ないし図13に基づいて以下に説明する。なお、この
実施の第三の形態に関し、上述した第二の形態と同一の
部分は、同一の名称および符号を用いて詳細な説明は省
略する。
【0055】まず、図10に示すように、ここで例示す
る音声認識装置21と辞書作成装置22も一体に形成さ
れており、この辞書作成装置22には、言語分類辞書で
ある認識単語表23が付加されている。
【0056】この認識単語表23は、RAMなどの記憶
デバイスを有しており、図11に示すように、言語であ
る数詞の分類が“商品A,商品B”として設定され、こ
れらの分類毎に読みの先頭部の長さが“2,3”として
設定されている。ここでは商品Aがコピーマシンで商品
Bがファクシミリなどと想定しており、これに対応する
数詞は商品の型式番号を想定している。
【0057】そして、読み生成部9は、単語辞書8から
取り出した数詞を語表記対応表5に設定する場合に読み
を先頭部に制限する際、生成する読みの先頭部の長さを
前記認識単語表23の設定内容に対応して分類毎に可変
する。このため、図12に示すように、前記単語辞書8
に格納された数詞の各々にも“商品A,商品B”の分類
が設定されており、図13に示すように、商品Aの数詞
の読みは二音節からなるが、商品Bの数詞の読みは三音
節からなる。
【0058】このような構成において、本実施の形態の
音声認識装置21も、人間が発声する音声を認識する。
この時、音声認識部4は、この音声の先頭部の一音節ず
つ抽出し、これに読みが一致する数詞を語表記対応表5
から検出する。このため、商品Aに分類される数詞“ひ
ゃく”は二音節目で認識されるが、商品Bに分類される
数詞“にひゃく”は三音節目で認識される。
【0059】音声認識装置21は、認識する音声の読み
の長さが言語の分類に従って可変されるので、例えば、
特定の言語のみ読みの長さを延長して処理全体の所要時
間は増加させることなく特定の音声の認識精度を向上さ
せるようなことができ、音声認識の精度や速度を言語の
分類に従って調節することができる。
【0060】そして、辞書作成装置22は、上述のよう
な音声認識装置21の語表記対応表5を作成する。その
読み生成部9は、単語辞書8から取り出した数詞を読み
の先頭部毎に語表記対応表5に格納する際、認識単語表
23を参照して読みの長さを分類毎に可変する。このよ
うに数詞の読みの長さを分類毎に可変するので、上述の
ように音声認識の精度や速度が言語の分類に従って調節
された音声認識装置21の語表記対応表5を、簡易な処
理で作成することができる。
【0061】つぎに、本発明の実施の第四の形態を図1
4ないし図18に基づいて以下に説明する。なお、この
実施の第四の形態に関し、前述した第一の形態と同一の
部分は、同一の名称および符号を用いて詳細な説明は省
略する。
【0062】まず、図14に示すように、ここで例示す
る音声認識装置31と辞書作成装置32も一体に形成さ
れている。この辞書作成装置32には、認識単語辞書で
ある認識単語表33と桁対応辞書である桁対応表34と
が付加されている。
【0063】前記認識単語表33は、RAMなどの記憶
デバイスを有しており、図15に示すように、認識する
言語として桁数が複数の数詞が“400,410,…”
などと設定されているが、これらの数詞には読みは設定
されていない。一方、単語辞書8には、数詞が読みと共
に格納されているが、これは記憶内容が簡素化されてお
り、図16に示すように、一桁の数詞“4,5,…”な
どは格納されているが、複数桁の数詞は格納されていな
い。前記桁対応表34も、RAMなどの記憶デバイスを
有しており、図17に示すように、数詞の各桁の読みが
桁数毎に予め格納されている。
【0064】そして、読み生成部9は、前記認識単語表
33から取り出した複数桁の数詞を言語として読みを生
成する場合、言語の先頭から一定の表音単位の部分を読
みの先頭部として生成するため、ここでは複数桁の数詞
の読みを先頭の一桁の読みから生成する。数詞の先頭部
の一桁の数詞と桁数とを判断し、この数詞の読みを単語
辞書8から検出すると共に、桁数の読みを前記桁対応表
34から検出し、これらを組み合わせて語表記対応表5
に格納する。このため、音声認識装置1の語表記対応表
5は、先頭部の一桁のみに対応した読みで数詞が格納さ
れており、音声認識部4は、数詞の音声を先頭部の一桁
のみで認識する。
【0065】このような構成において、本実施の形態の
音声認識装置31も、人間が発声する音声を語表記対応
表5に格納された数詞として認識する。この語表記対応
表5には、数詞が先頭部の一桁のみに対応した読みで格
納されているので、音声認識部4は、数詞の音声を先頭
部の一桁のみで認識する。
【0066】辞書作成装置32は、上述のような音声認
識装置31の語表記対応表5を作成する。その読み生成
部9は、語表記対応表5に格納する複数桁の数詞を認識
単語表33から取り出し、この複数桁の数詞の先頭部の
一桁の数詞と桁数とを判断し、この数詞の読みを単語辞
書8から検出すると共に桁数の読みを桁対応表34から
検出して組み合わせる。例えば、複数桁の数詞として
“400”が取り出されると、先頭部の一桁は数詞が
“4”で桁数が“3”なので、この数詞の読み“よん”
と桁数の読み“ひゃく”とが組み合わされ、先頭部の読
みは“よんひゃく”となる。
【0067】前述のように商品の型式番号などを認識対
象の言語とする場合、このような数詞は桁数が多数であ
る場合が一般的である。しかし、単語辞書8が一般的な
データベースなどからなる場合、一桁の数詞は格納され
ていても複数桁の数詞は格納されていない可能性が高
い。このような場合でも、上述した辞書作成装置32は
複数桁の数詞の読みを簡易な処理で生成することがで
き、音声認識装置31は、複数桁の数詞を的確な読みと
共に語表記対応表5に獲得することができる。
【0068】しかも、上述のように辞書作成装置32
は、複数桁の数詞の先頭の一桁から読みを生成するの
で、簡易な処理で読みの長さを一定にすることができ、
この処理が言語の表音単位で実行されているので、音声
認識装置31の処理動作に人間の発声の特徴を良好に反
映させることができる。つまり、数字や漢字などの表意
文字は、一文字に複数の音節が設定されるが、その発声
は表意文字の表記単位で区切られることが一般的なの
で、これを読みに反映させれば認識精度を向上させるこ
とができる。
【0069】つぎに、本発明の実施の第五の形態を図1
9ないし図24に基づいて以下に説明する。なお、この
実施の第五の形態に関し、上述した第四の形態と同一の
部分は、同一の名称および符号を用いて詳細な説明は省
略する。
【0070】まず、図19に示すように、ここで例示す
る音声認識装置41と辞書作成装置42も一体に形成さ
れており、この辞書作成装置42には、読み変化辞書で
ある読み変化表43が付加されている。
【0071】この読み変化表43は、RAMなどの記憶
デバイスを有しており、図23に示すように、組み合わ
される数詞により変化する桁の読みが予め格納されてい
る。そして、読み生成部9は、認識単語表33から取り
出した複数桁の数詞を言語として読みを生成する場合、
その数詞の先頭部の一桁の数詞の読みを単語辞書8から
検出すると共に桁数の読みを前記桁対応表34から検出
して組み合わせるが、この場合に前記読み変化表43を
参照して対応する数詞の読みを修正する。
【0072】このような構成において、辞書作成装置4
2は音声認識装置41の語表記対応表5を作成する。そ
の読み生成部9は、複数桁の数詞の読みを先頭部の一桁
の数詞と桁数との読みの組み合わせで生成する場合に、
読み変化表43を参照して対応する数詞の読みは修正す
る。例えば、複数桁の数詞として“300”が取り出さ
れると、先頭部の一桁は数詞が“4”で桁数が“3”な
ので、この数詞の読み“さん”と桁数の読み“ひゃく”
とが単純に組み合わされると“さんひゃく”となるが、
これは自然な読みである“さんびゃく”に修正される。
【0073】上述した辞書作成装置42は、複数桁の数
詞の読みを簡易な処理で生成することができ、単純な組
み合わせでは不自然な形態となる読みは自然な形態に修
正することができ、音声認識装置41は、複数桁の数詞
を的確な読みと共に語表記対応表5に獲得することがで
きる。
【0074】つぎに、本発明の実施の第六の形態を図2
5ないし図27に基づいて以下に説明する。なお、この
実施の第六の形態に関し、前述した第三の形態と同一の
部分は、同一の名称および符号を用いて詳細な説明は省
略する。
【0075】図25に示すように、言語分類辞書となる
認識単語表23には、言語である数詞の分類が“商品
A,商品B”として設定されているが、ここでは読みの
先頭部の長さは設定されていない。そして、読み生成部
9は、前述のように単語辞書8から取り出した数詞を語
表記対応表5に設定する場合に、その読みを音節数など
により先頭部に制限する際、生成する読みに対応する言
語を前記認識単語表23の設定に従って分類し、この分
類された言語の個数が、予め設定された“5”などの基
準値を超過しなければ、その読みは先頭部に制限しな
い。このため、図26に示すように、前記単語辞書8に
格納された数詞の各々にも“商品A,商品B”の分類が
設定されており、図27に示すように、語表記対応表5
に設定された商品Aの数詞の読みは先頭部の二音節に制
限されているが、商品Bの数詞の読みは制限されていな
い。
【0076】このような構成において、音声認識装置の
語表記対応表5を辞書作成装置が作成するため、その読
み生成部9は、単語辞書8から取り出した数詞を読みの
先頭部毎に語表記対応表5に格納する。この時、生成す
る読みに対応する言語を認識単語表23の設定に従って
分類し、この分類された言語の個数が予め設定された基
準値を超過しなければ、その読みは先頭部に制限しな
い。
【0077】例えば、数詞として“100”が取り出さ
れると、この数詞の分類が認識単語表23から“商品
A”として検出され、この分類の数詞は七個であること
も検出される。これは基準値である五個より多数なの
で、“商品A”の分類の数詞は読みが先頭部の二音節に
制限されることになり、ここでは全部が“ひゃく”とし
て設定される。一方、数詞として“200”が取り出さ
れて分類が“商品B”として検出されると、この分類の
個数である二個は基準値である五個より少数なので、
“商品B”の分類の数詞は読みが先頭部に制限されな
い。
【0078】上述のように数詞が設定された音声認識装
置は、同一の分類が多数の言語は読みが先頭部に制限さ
れているので、出現頻度が高い言語は読みの先頭部で認
識されることになり、処理時間を短縮することができ
る。一方、同一の分類が少数の数詞は読みが先頭部に制
限されないので、出現頻度が低い言語は読みの全体で認
識されることになり、認識精度を向上させることができ
る。そして、本実施の形態の辞書作成装置は、上述のよ
うな言語を簡易な処理で語表記対応表5に設定すること
ができるので、高性能な音声認識装置を作成することが
できる。
【0079】つぎに、本発明の実施の第七の形態を図2
8ないし図30に基づいて以下に説明する。なお、この
実施の第七の形態に関し、上述した第六の形態と同一の
部分は、同一の名称および符号を用いて詳細な説明は省
略する。
【0080】図28に示すように、言語分類辞書となる
認識単語表23には、言語である数詞の分類が“商品
A,商品B”として設定されており、図29に示すよう
に、前記単語辞書8に格納された数詞の各々にも“商品
A,商品B”の分類が設定されている。読み生成部9
は、単語辞書8から取り出して語表記対応表5に設定す
る数詞の読みを先頭部に制限する際、生成する読みに対
応する言語を認識単語表23の設定に従って分類し、こ
の分類における読みの個数が、予め設定された“2”な
どの基準値を超過しないように、生成する言語の読みの
先頭部の長さを可変する。
【0081】より詳細には、最初に認識単語表23に従
って単語辞書8から一つの分類の全部の言語が取り出さ
れ、その読みが先頭から一文字ずつ増加される。この読
みの個数が基準値を超過すると、その直前の読みを採用
する。このため、図30に示すように、語表記対応表5
は、商品Aの数詞の読みは先頭部の二音節に制限されて
いるが、商品Bの数詞の読みは制限されていない。
【0082】このような構成において、音声認識装置の
語表記対応表5を辞書作成装置が作成するため、その読
み生成部9は、単語辞書8から取り出した数詞を読みの
先頭部毎に語表記対応表5に格納する。この時、生成す
る読みに対応する言語を認識単語表23の設定に従って
分類し、この分類された言語の読みの個数が基準値を超
過しないように、読みの長さを可変する。
【0083】例えば、“商品A”の分類の数詞として
“100,110,120,125,127,130,
170”が取り出されると、これらの読みは一文字では
“ひ”の一個なので、これは基準値である二個より少数
である。この読みの文字数を一つずつ増加させても、
“ひゃく”までは個数は一個で基準値より少数である。
しかし、読みの文字数を四つまで増加させると、読みは
“ひゃく”“ひゃくじ”“ひゃくに”“ひゃくさ”“ひ
ゃくな”の五個となり、これは基準値である二個を超過
している。そこで、この場合は読みの個数が基準値を超
過する直前の状態で採用され、“商品A”の分類の数詞
の読みは“ひゃく”の一個となる。
【0084】一方、“商品B”の分類の数詞として“2
00,220”が取り出された場合、これは個数が二個
で基準値と同数なので、読みの文字数を一つずつ増加さ
せても、その個数が基準値を超過することはない。この
ため、これらの読みは先頭部に制限されず、“にひゃ
く”“にひゃくにじゅう”が各々に設定される。
【0085】上述のように数詞が設定された音声認識装
置は、一つの分類に対して読みの個数が制限されている
ので、一つの分類の言語が多数でも読みの個数は一定と
なり、処理時間を短縮することができる。一方、一つの
分類の言語が少数の場合は、その読みは先頭部に制限さ
れないので、出現頻度が低い言語は読みの全体で認識さ
れることになり、認識精度を向上させることができる。
そして、本実施の形態の辞書作成装置は、上述のような
言語を簡易な処理で語表記対応表5に設定することがで
きるので、高性能な音声認識装置を作成することができ
る。
【0086】つぎに、本発明の実施の第八の形態を図3
1ないし図33に基づいて以下に説明する。なお、この
実施の第八の形態に関し、前述した第三の形態と同一の
部分は、同一の名称および符号を用いて詳細な説明は省
略する。
【0087】図31に示すように、条件設定辞書となる
認識単語表23には、複数の言語の連続する条件が設定
されている。この条件は、言語である商品の型式名称
“Aタイプ,Bタイプ”と、言語である商品の型式番号
の分類“商品A,商品B”とが、言語の連続を示す
“+”により個々に連結されており、“Aタイプ+商品
A,…”などと設定されている。図32に示すように、
単語辞書8は、数詞の各々に“商品A,商品B”の分類
と読みとが設定されているが、名称の言語“Aタイプ,
Bタイプ”の各々にも読みが設定されている。
【0088】読み生成部9は、単語辞書8から取り出し
て語表記対応表5に設定する数詞の読みを先頭部に制限
する際、前記認識単語表23を参照して複数の連続する
言語の読みを生成し、その末尾に位置する言語のみ読み
を先頭部に制限する。より詳細には、前記認識単語表2
3には“Aタイプ+商品A,…”なる条件が設定されて
いるので、これに整合する複数の連続する言語の読みは
“えーたいぷひゃく”などとなり、その末尾に位置する
数詞“ひゃく”のみ読みが音節数などにより先頭部に制
限される。このため、図33に示すように、語表記対応
表5は、“Aタイプ100”などのように連続する言語
が設定されているが、その読みは後部の数詞の読みが二
音節に制限されている。
【0089】このような構成において、音声認識装置の
語表記対応表5を辞書作成装置が作成するため、その読
み生成部9は、単語辞書8から取り出した数詞を読みの
先頭部毎に語表記対応表5に格納する。この時、読み生
成部9は、認識単語表23を参照して複数の言語の連続
する条件を認識し、この条件に従って複数の言語の連続
する読みを生成する。
【0090】例えば、“Aタイプ+商品A,…”なる条
件に整合する複数の連続する言語の読みは、“えーたい
ぷひゃく”“えーたいぷひゃくじゅう”“えーたいぷひ
ゃくにじゅう”の三つが生成される。しかし、その末尾
に位置する数詞“ひゃく,ひゃくじゅう,ひゃくにじゅ
う”の読みが先頭部の二音節に制限されるので、これら
の数詞の読みは何れも“ひゃく”となり、“Aタイプ”
の連続する言語の読みは“えーたいぷひゃく”の一つと
なる。
【0091】上述した“Aタイプ100”や“Bタイプ
200”などの連続する言語は、“商品型式+型式番
号”を想定しており、このような言語は特定の組み合わ
せで連続的に一息で発声されることが多い。そこで、本
実施の形態の音声認識装置では、上述のような複数の言
語を予め組み合わせて一つの言語として処理することに
より認識精度を向上させ、その末尾の言語のみ読みを先
頭部に制限することにより処理速度を向上させている。
そして、本実施の形態の辞書作成装置は、上述のような
言語を簡易な処理で語表記対応表5に設定することがで
きるので、高性能な音声認識装置を作成することができ
る。
【0092】つぎに、本発明の実施の第九の形態を図3
4ないし図36に基づいて以下に説明する。なお、この
実施の第九の形態に関し、上述した第八の形態と同一の
部分は、同一の名称および符号を用いて詳細な説明は省
略する。
【0093】図34に示すように、条件設定辞書となる
認識単語表23には、複数の言語の連続する条件が設定
されており、この条件は、言語である商品の型式名称の
分類“商品名A,商品名B”と、言語である商品の型式
番号の分類“商品A,商品B”とが、言語の連続を示す
“+”により個々に連結されている。図35に示すよう
に、単語辞書8には、型式名称の言語である“コピー,
ファクシミリ”の各々に“商品名A,商品名B”の分類
と読みとが設定されており、型式番号の数詞“100,
…”の各々に“商品A,商品B”の分類と読みとが設定
されている。
【0094】読み生成部9は、単語辞書8から取り出し
て語表記対応表5に設定する数詞の読みを先頭部に制限
する際、前記認識単語表23を参照して複数の連続する
言語の読みを生成し、その全体の読みが予め八文字など
と設定された基準値を超過しないように、末尾に位置す
る言語の読みの先頭部の長さを制限する。より詳細に
は、前記認識単語表23には“商品名A+商品A,…”
なる条件が設定されているので、これに整合する複数の
連続する言語の読みは“こぴーひゃく”などとなり、こ
の全体の読みが八文字を超過しないように、その末尾に
位置する数詞“ひゃく”の読みが先頭部に制限される。
このため、図36に示すように、語表記対応表5は、
“コピー100”の読みは“こぴーひゃく”のままであ
るが、“ファクシミリ100”の読みは八文字の“ふぁ
くしみりひゃ”として制限されている。
【0095】このような構成において、音声認識装置の
語表記対応表5を辞書作成装置が作成するため、その読
み生成部9は、単語辞書8から取り出した数詞を読みの
先頭部毎に語表記対応表5に格納する。この時、読み生
成部9は、認識単語表23を参照して複数の言語の連続
する条件を認識し、この条件に従って複数の言語の連続
する読みを生成する。
【0096】例えば、“商品名A+商品A”なる条件に
整合する複数の連続する言語の読みは、“こぴーひゃ
く”“こぴーさんびゃく”“こぴーさんびゃくにじゅ
う”の三つが生成される。しかし、その全体が八文字を
超過しないように末尾の数詞の読みが先頭部に制限され
るので、上述した複数の連続する言語の全体の読みは
“こぴーひゃく”“こぴーさんびゃく”の二つとなる。
【0097】本実施の形態の音声認識装置では、連続的
に発声される複数の言語を予め組み合わせて処理するこ
とにより認識精度を向上させ、その末尾の言語のみ読み
を先頭部に制限することにより処理速度を向上させてい
る。このとき、言語の読みが基準値を超過しないので、
先頭の言語が長くとも全体の長さは一定となり、処理速
度が安定して向上している。そして、本実施の形態の辞
書作成装置は、上述のような言語を簡易な処理で語表記
対応表5に設定することができるので、高性能な音声認
識装置を作成することができる。
【0098】つぎに、本発明の実施の第十の形態を図3
7ないし図39に基づいて以下に説明する。なお、この
実施の第十の形態に関し、上述した第九の形態と同一の
部分は、同一の名称および符号を用いて詳細な説明は省
略する。
【0099】図37に示すように、条件設定辞書となる
認識単語表23には、複数の言語の連続する条件が“商
品名A+商品A,…”などと設定されており、さらに、
この末尾の分類に読みの先頭部の長さが“2,…”など
として設定されている。図38に示すように、単語辞書
8には、型式名称の言語である“コピー,…”の各々に
“商品名A,…”の分類と読みとが設定されており、型
式番号の数詞“100,…”の各々に“商品A,…”の
分類と読みとが設定されている。
【0100】読み生成部9は、単語辞書8から取り出し
て語表記対応表5に設定する数詞の読みを先頭部に制限
する際、前記認識単語表23を参照して複数の連続する
言語の読みを生成し、その末尾に位置する言語の読みの
先頭部の長さを前記認識単語表23に設定された長さに
制限する。より詳細には、前記認識単語表23には“商
品名A+商品A”なる条件が設定されているので、これ
に整合する複数の連続する言語の読みは“こぴーにひゃ
く”などとなるが、その末尾の数詞の読みの長さは三文
字に設定されているので、この読みは“こぴーにひゃ”
に制限される。一方、“商品名B+商品B”なる条件で
は、末尾の数詞の読みの長さは一文字に設定されている
ので、“ふぁくしみりにひゃく”なる読みは“ふぁくし
みりに”に制限される。
【0101】このため、図39に示すように、語表記対
応表5は、“コピー100”の読みは“こぴーひゃく”
のままであるが、“コピー200”の読みは“こぴーに
ひゃ”として制限され、“ファクシミリ200”の読み
は“ふぁくしみりに”に制限されている。
【0102】このような構成において、音声認識装置の
語表記対応表5を辞書作成装置が作成するため、その読
み生成部9は、単語辞書8から取り出した数詞を読みの
先頭部毎に語表記対応表5に格納する。この時、読み生
成部9は、認識単語表23を参照して複数の言語の連続
する条件を認識し、この条件に従って複数の言語の連続
する読みを生成する。
【0103】例えば、“商品名A+商品A”なる条件に
整合する複数の連続する言語の読みは、“こぴーひゃ
く”“こぴーにひゃく”“こぴーにひゃくにじゅう”の
三つが生成される。しかし、その末尾の数詞は三文字を
超過しないように先頭部に制限されるので、上述した複
数の言語の全体の読みは“こぴーひゃく”“こぴーにひ
ゃ”の二つとなる。同様に、“商品名B+商品B”なる
条件に整合する複数の連続する言語の読みは、“ふぁく
しみりにひゃくじゅう”“ふぁくしみりにひゃくにじゅ
う”“ふぁくしみりごひゃくごじゅう”などの五つが生
成されるが、その末尾の数詞が先頭部の一文字に制限さ
れるので、上述した複数の言語の全体の読みは“ふぁく
しみりに”“ふぁくしみりご”の二つとなる。
【0104】本実施の形態の音声認識装置では、連続的
に発声される複数の言語を予め組み合わせて処理するこ
とにより認識精度を向上させ、その末尾の言語のみ読み
を先頭部に制限することにより処理速度を向上させてい
る。このとき、末尾の言語の読みの長さが分類に従って
可変されるので、先頭の言語が長いほど末尾の言語を短
くするようなことができ、処理速度が安定して向上して
いる。そして、本実施の形態の辞書作成装置は、上述の
ような言語を簡易な処理で語表記対応表5に設定するこ
とができるので、高性能な音声認識装置を作成すること
ができる。
【0105】
【発明の効果】請求項1記載の発明の音声認識装置は、
語表記対応辞書に認識候補の言語が先頭部の読み毎に予
め格納されており、音声入力手段に認識対象の音声が入
力されると、音声認識手段は、音声の先頭部に先頭部の
読みが一致する言語を語表記対応辞書から検出すること
により、音声認識の処理対象となる読みが先頭部に制限
されているので、その個数が削減されており、この音声
認識の処理を高速に実行することができ、人間の発声は
音声の先頭部のみ明瞭な傾向にあり、この先頭部のみを
処理対象とするので、誤認識の発生率を低下させること
ができ、認識結果が複数となる場合でも高確率で正解が
含まれるので、長時間の処理で一つの間違った認識結果
が出力されるものより高い実用性を得ることができる。
【0106】請求項2記載の発明の辞書作成装置は、一
般言語辞書に各種の言語が読みと共に予め格納されてお
り、読み生成手段は、一般言語辞書から取り出した言語
を読みの先頭部毎に語表記対応辞書に格納することによ
り、先頭が同一でも末尾が相違して誤認識が発生しやす
い複数の言語を一つの読みに集約することができ、多数
の言語に少数の読みを割り当てて認識処理の対象個数を
削減することができるので、音声認識装置の認識精度と
処理速度との向上に寄与することができ、このような言
語を既存のデータベースなどからなる一般言語辞書から
機械的に作成することができるので、この作業を人間が
実行する必要がない。
【0107】請求項3記載の発明の辞書作成装置では、
言語の読みの表音単位が予め格納された表音単位辞書を
設け、読み生成手段は、言語の先頭から一定の表音単位
の部分を読みの先頭部として生成することにより、簡易
な処理で読みの先頭部の長さを一定にすることができ、
この処理が言語の表音単位で実行されるので、音声認識
装置の処理動作に人間の発声の特徴を良好に反映させる
ことができる。
【0108】請求項4記載の発明の辞書作成装置では、
読み生成手段は、言語の先頭から一定の表記単位の部分
を読みの先頭部として生成することにより、簡易な処理
で読みの先頭部の長さを一定にすることができ、この処
理が言語の表記単位で実行されるので、音声認識装置の
処理動作に人間の発声の特徴を良好に反映させることが
できる。
【0109】請求項5記載の発明の辞書作成装置では、
言語の分類毎に読みの先頭部の長さが予め設定された長
さ設定辞書を設け、読み生成手段は、生成する言語の読
みの先頭部の長さを分類毎に可変することにより、例え
ば、特定の言語のみ読みの長さを延長し、音声認識装置
の処理全体の所要時間は増加させることなく特定の音声
の認識精度を向上させるようなことができ、音声認識の
精度や速度を言語の分類に従って調節することができ
る。
【0110】請求項6記載の発明の辞書作成装置では、
数詞の各桁の読みが桁数毎に予め格納された桁対応辞書
を設け、読み生成手段は、複数桁の数詞を言語として先
頭部の読みを生成する場合、先頭部の所定桁の数詞の読
みを一般言語辞書から検出すると共に先頭部の所定桁の
読みを桁対応辞書から検出して組み合わせることによ
り、一般言語辞書が一般的なデータベースなどからなる
場合、一桁の数詞は格納されていても複数桁の数詞は格
納されていない可能性が高いが、このような場合でも複
数桁の数詞の読みを簡易な処理で生成することができる
ので、音声認識装置に複数桁の数字を設定することがで
きる。
【0111】請求項7記載の発明の辞書作成装置では、
組み合わされる数詞により変化する各桁の読みが予め格
納された読み変化辞書を設け、読み生成手段は、複数桁
の数詞を言語として先頭部の読みを生成する場合に、読
み変化辞書を参照して対応する数詞の読みを修正するこ
とにより、単純な組み合わせでは不自然な形態となる読
みを自然な形態に修正することができるので、音声認識
装置に複数桁の数字を適切な読みと共に設定することが
できる。
【0112】請求項8記載の発明の辞書作成装置では、
言語の分類が予め設定された言語分類辞書を設け、読み
生成手段は、生成する読みに対応する言語を言語分類辞
書の設定に従って分類し、この分類された言語の個数が
予め設定された基準値を超過しなければ、読みを先頭部
に制限しないことにより、例えば、音声認識の出現頻度
が高い言語の読みを先頭部に制限し、出現頻度が低い言
語の読みを先頭部に制限しないようにして、音声認識装
置の処理時間を短縮すると共に認識精度を向上させるよ
うなことができる。
【0113】請求項9記載の発明の辞書作成装置では、
言語の分類が予め設定された言語分類辞書を設け、読み
生成手段は、生成する読みに対応する言語を言語分類辞
書の設定に従って分類し、この分類における読みの個数
が予め設定された基準値を超過しないように、生成する
言語の読みの先頭部の長さを可変することにより、一つ
の分類の言語が多数でも読みの個数は一定となるので、
音声認識装置の処理時間を短縮することができ、一つの
分類の言語が少数の場合は読みが先頭部に制限されない
ので、音声認識装置の認識精度を向上させることができ
る。
【0114】請求項10記載の発明の辞書作成装置で
は、複数の言語の連続する条件が予め設定された条件設
定辞書を設け、読み生成手段は、条件設定辞書を参照し
て複数の連続する言語の読みを生成し、その末尾に位置
する言語のみ読みを先頭部に制限することにより、連続
が予想される複数の言語を予め組み合わせることによ
り、音声認識装置の認識精度を向上させることができ、
その末尾の言語のみ読みを先頭部に制限することによ
り、音声認識装置の処理速度を向上させることができ
る。
【0115】請求項11記載の発明の辞書作成装置で
は、読み生成手段は、複数の連続する言語の全体の読み
が予め設定された基準値を超過しないように、末尾に位
置する言語の読みの先頭部の長さを制限することによ
り、組み合わされる複数の言語の先頭の言語が長くとも
全体の長さは一定となるので、音声認識装置の処理速度
を安定に向上させることができる。
【0116】請求項12記載の発明の辞書作成装置で
は、条件設定辞書は、複数の言語の連続する条件と共
に、末尾に位置する言語の読みの長さが予め設定されて
おり、読み生成手段は、末尾に位置する言語の読みを設
定された長さに制限することにより、末尾の言語の読み
の長さが分類に従って可変されるので、先頭の言語が長
いほど末尾の言語を短くするようなことができ、音声認
識装置の処理速度を安定に向上させることができる。
【0117】請求項13記載の発明の音声認識方法は、
認識候補の言語を先頭部の読み毎に語表記対応辞書に予
め格納しておき、認識対象の音声の先頭部に先頭部の読
みが一致する言語を語表記対応辞書から検出するように
したことにより、音声認識の処理対象となる読みが先頭
部に制限されているので、その個数が削減されており、
この音声認識の処理を高速に実行することができ、人間
の発声は音声の先頭部のみ明瞭な傾向にあり、この先頭
部のみを処理対象とするので、誤認識の発生率を低下さ
せることができ、認識結果が複数となる場合でも高確率
で正解が含まれるので、長時間の処理で一つの間違った
認識結果が出力されるものより高い実用性を得ることが
できる。
【0118】請求項14記載の発明の辞書作成方法は、
各種の言語が読みと共に予め格納された一般言語辞書か
ら言語を取り出し、この取り出した言語を読みの先頭部
毎に語表記対応辞書に格納するようにしたことにより、
先頭が同一でも末尾が相違して誤認識が発生しやすい複
数の言語を一つの読みに集約することができ、多数の言
語に少数の読みを割り当てて認識処理の対象個数を削減
することができるので、音声認識装置の認識精度と処理
速度との向上に寄与することができ、このような言語を
既存のデータベースなどからなる一般言語辞書から機械
的に作成することができるので、この作業を人間が実行
する必要がない。
【0119】請求項15記載の発明の情報記憶媒体は、
認識候補の言語が先頭部の読み毎に予め格納された語表
記対応辞書と、認識対象の音声の先頭部に先頭部の読み
が一致する言語を語表記対応辞書からコンピュータに検
出させるプログラムと、が書き込まれていることによ
り、この情報記憶媒体のソフトウェアをコンピュータに
読み取らせて動作させれば、このコンピュータは音声認
識装置として機能することができ、この音声認識装置
は、音声認識の処理対象となる読みが先頭部に制限され
ているので、その個数が削減されており、この音声認識
の処理を高速に実行することができ、人間の発声は音声
の先頭部のみ明瞭な傾向にあり、この先頭部のみを処理
対象とするので、誤認識の発生率を低下させることがで
き、認識結果が複数となる場合でも高確率で正解が含ま
れるので、長時間の処理で一つの間違った認識結果が出
力されるものより高い実用性を得ることができる。
【0120】請求項16記載の発明の情報記憶媒体は、
各種の言語が読みと共に予め格納された一般言語辞書か
ら言語を取り出すこと、この取り出した言語を読みの先
頭部毎に語表記対応辞書に格納すること、をコンピュー
タに実行させるプログラムが書き込まれていることによ
り、この情報記憶媒体のプログラムをコンピュータに読
み取らせて動作させれば、このコンピュータは、辞書作
成装置として機能することができ、この辞書作成装置
は、先頭が同一でも末尾が相違して誤認識が発生しやす
い複数の言語を一つの読みに集約することができ、多数
の言語に少数の読みを割り当てて認識処理の対象個数を
削減することができるので、音声認識装置の認識精度と
処理速度との向上に寄与することができ、このような言
語を既存のデータベースなどからなる一般言語辞書から
機械的に作成することができるので、この作業を人間が
実行する必要がない。
【図面の簡単な説明】
【図1】本発明の実施の第一の形態の音声認識装置と辞
書作成装置とを示す模式的なブロック図である。
【図2】音声認識装置と辞書作成装置とを実現したコン
ピュータシステムのハードウェアを示すブロック図であ
る。
【図3】コンピュータシステムの外観を示す斜視図であ
る。
【図4】一般言語辞書である単語辞書の記憶内容を示す
模式図である。
【図5】語表記対応辞書である語表記対応表の記憶内容
を示す模式図である。
【図6】音声認識装置による音声認識方法を示すフロー
チャートである。
【図7】本発明の実施の第二の形態の音声認識装置と辞
書作成装置とを示すブロック図である。
【図8】表音単位辞書である音節表の記憶内容を示す模
式図である。
【図9】語表記対応表の記憶内容を示す模式図である。
【図10】本発明の実施の第三の形態の音声認識装置と
辞書作成装置とを示すブロック図である。
【図11】長さ設定辞書である認識単語表の記憶内容を
示す模式図である。
【図12】単語辞書の記憶内容を示す模式図である。
【図13】語表記対応表の記憶内容を示す模式図であ
る。
【図14】本発明の実施の第四の形態の音声認識装置と
辞書作成装置とを示すブロック図である。
【図15】認識単語表の記憶内容を示す模式図である。
【図16】単語辞書の記憶内容を示す模式図である。
【図17】桁対応辞書である桁対応表の記憶内容を示す
模式図である。
【図18】語表記対応表の記憶内容を示す模式図であ
る。
【図19】本発明の実施の第五の形態の音声認識装置と
辞書作成装置とを示すブロック図である。
【図20】認識単語表の記憶内容を示す模式図である。
【図21】単語辞書の記憶内容を示す模式図である。
【図22】桁対応表の記憶内容を示す模式図である。
【図23】読み変化辞書である読み変化表の記憶内容を
示す模式図である。
【図24】語表記対応表の記憶内容を示す模式図であ
る。
【図25】本発明の実施の第六の形態の辞書作成装置の
言語分類辞書である認識単語表の記憶内容を示す模式図
である。
【図26】単語辞書の記憶内容を示す模式図である。
【図27】語表記対応表の記憶内容を示す模式図であ
る。
【図28】本発明の実施の第七の形態の辞書作成装置の
認識単語表の記憶内容を示す模式図である。
【図29】単語辞書の記憶内容を示す模式図である。
【図30】語表記対応表の記憶内容を示す模式図であ
る。
【図31】本発明の実施の第八の形態の辞書作成装置の
条件設定辞書である認識単語表の記憶内容を示す模式図
である。
【図32】単語辞書の記憶内容を示す模式図である。
【図33】語表記対応表の記憶内容を示す模式図であ
る。
【図34】本発明の実施の第九の形態の辞書作成装置の
認識単語表の記憶内容の記憶内容を示す模式図である。
【図35】単語辞書の記憶内容を示す模式図である。
【図36】語表記対応表の記憶内容を示す模式図であ
る。
【図37】本発明の実施の第十の形態の辞書作成装置の
認識単語表の記憶内容の記憶内容を示す模式図である。
【図38】単語辞書の記憶内容を示す模式図である。
【図39】語表記対応表の記憶内容を示す模式図であ
る。
【符号の説明】
1,11,21,31,41 音声認識装置 2,12,22,32,42 辞書作成装置 3 音声入力手段 4 音声認識手段 5 語表記対応辞書 8 一般言語辞書 9 読み生成手段 13 表音単位辞書 23 長さ設定辞書、言語分類辞書、条件設定辞書 34 桁対応辞書 43 読み変化辞書 101 コンピュータ 103〜106,108 情報記憶媒体
─────────────────────────────────────────────────────
【手続補正書】
【提出日】平成8年8月1日
【手続補正1】
【補正対象書類名】明細書
【補正対象項目名】0036
【補正方法】変更
【補正内容】
【0036】このような構成において、音声認識装置1
は、人間が発声する音声を認識する。より詳細には、図
6に示すように、人間が発声した音声が音声入力部3に
入力されると、音声認識部4は、この音声の先頭部の三
文字を抽出し、始点を先頭に固定したスポッティングに
より、音声の先頭部と語表記対応表5に格納された複数
の読みとを照合させてスコアを算出し、このスコアが最
高の読みを検出する。このように検出された数詞は結果
出力部6から出力されるので、検出された数詞が複数の
場合は結果選択部7の手動操作により一つに選定され
る。
【手続補正2】
【補正対象書類名】明細書
【補正対象項目名】0052
【補正方法】変更
【補正内容】
【0052】このような構成において、本実施の形態の
音声認識装置11も、人間が発声する音声を認識する。
この時、音声認識部4は、この音声の先頭部と語表記対
応表5に格納された複数の読みとを照合させてスコアを
算出し、このスコアが最高の読みを検出する。この音声
認識装置11は、音声を照合する単位を表音単位である
音節とするので、音声認識の処理動作に人間の発声の特
徴を良好に反映させることができる。
【手続補正3】
【補正対象書類名】明細書
【補正対象項目名】0058
【補正方法】変更
【補正内容】
【0058】このような構成において、本実施の形態の
音声認識装置21も、人間が発声する音声を認識する。
この時、音声認識部4は、この音声の先頭部と語表記対
応表5に格納された複数の読みとを照合させてスコアを
算出し、このスコアが最高の読みを検出する。このた
め、商品Aに分類される数詞“ひゃく”は二音節目で認
識されるが、商品Bに分類される数詞“にひゃく”は三
音節目で認識される。
【手続補正4】
【補正対象書類名】図面
【補正対象項目名】図6
【補正方法】変更
【補正内容】
【図6】

Claims (16)

    【特許請求の範囲】
  1. 【請求項1】 認識対象の音声が入力される音声入力手
    段と、認識候補の言語が先頭部の読み毎に予め格納され
    た語表記対応辞書と、前記音声入力手段により入力され
    た音声の先頭部に先頭部の読みが一致する言語を前記語
    表記対応辞書から検出する音声認識手段と、を有するこ
    とを特徴とする音声認識装置。
  2. 【請求項2】 各種の言語が読みと共に予め格納された
    一般言語辞書と、この一般言語辞書から取り出した言語
    を読みの先頭部毎に語表記対応辞書に格納する読み生成
    手段と、を有することを特徴とする辞書作成装置。
  3. 【請求項3】 言語の読みの表音単位が予め格納された
    表音単位辞書を設け、読み生成手段は、言語の先頭から
    一定の表音単位の部分を読みの先頭部として生成するこ
    とを特徴とする請求項2記載の辞書作成装置。
  4. 【請求項4】 読み生成手段は、言語の先頭から一定の
    表記単位の部分を読みの先頭部として生成することを特
    徴とする請求項2記載の辞書作成装置。
  5. 【請求項5】 言語の分類毎に読みの先頭部の長さが予
    め設定された長さ設定辞書を設け、読み生成手段は、生
    成する言語の読みの先頭部の長さを分類毎に可変するこ
    とを特徴とする請求項2記載の辞書作成装置。
  6. 【請求項6】 数詞の各桁の読みが桁数毎に予め格納さ
    れた桁対応辞書を設け、読み生成手段は、複数桁の数詞
    を言語として先頭部の読みを生成する場合、先頭部の所
    定桁の数詞の読みを一般言語辞書から検出すると共に先
    頭部の所定桁の読みを前記桁対応辞書から検出して組み
    合わせることを特徴とする請求項2記載の辞書作成装
    置。
  7. 【請求項7】 組み合わされる数詞により変化する各桁
    の読みが予め格納された読み変化辞書を設け、読み生成
    手段は、複数桁の数詞を言語として先頭部の読みを生成
    する場合に、前記読み変化辞書を参照して対応する数詞
    の読みを修正することを特徴とする請求項6記載の辞書
    作成装置。
  8. 【請求項8】 言語の分類が予め設定された言語分類辞
    書を設け、読み生成手段は、生成する読みに対応する言
    語を前記言語分類辞書の設定に従って分類し、この分類
    された言語の個数が予め設定された基準値を超過しなけ
    れば、読みを先頭部に制限しないことを特徴とする請求
    項2記載の辞書作成装置。
  9. 【請求項9】 言語の分類が予め設定された言語分類辞
    書を設け、読み生成手段は、生成する読みに対応する言
    語を前記言語分類辞書の設定に従って分類し、この分類
    における読みの個数が予め設定された基準値を超過しな
    いように、生成する言語の読みの先頭部の長さを可変す
    ることを特徴とする請求項2記載の辞書作成装置。
  10. 【請求項10】 複数の言語の連続する条件が予め設定
    された条件設定辞書を設け、読み生成手段は、前記条件
    設定辞書を参照して複数の連続する言語の読みを生成
    し、末尾に位置する言語のみ読みを先頭部に制限するこ
    とを特徴とする請求項2記載の辞書作成装置。
  11. 【請求項11】 読み生成手段は、複数の連続する言語
    の全体の読みが予め設定された基準値を超過しないよう
    に、末尾に位置する言語の読みの先頭部の長さを制限す
    ることを特徴とする請求項10記載の辞書作成装置。
  12. 【請求項12】 条件設定辞書は、複数の言語の連続す
    る条件と共に、末尾に位置する言語の読みの長さが予め
    設定されており、読み生成手段は、末尾に位置する言語
    の読みを設定された長さに制限することを特徴とする請
    求項10記載の辞書作成装置。
  13. 【請求項13】 認識候補の言語を先頭部の読み毎に語
    表記対応辞書に予め格納しておき、認識対象の音声の先
    頭部に先頭部の読みが一致する言語を前記語表記対応辞
    書から検出するようにしたことを特徴とする音声認識方
    法。
  14. 【請求項14】 各種の言語が読みと共に予め格納され
    た一般言語辞書から言語を取り出し、この取り出した言
    語を読みの先頭部毎に語表記対応辞書に格納するように
    したことを特徴とする辞書作成方法。
  15. 【請求項15】 コンピュータが読取自在なソフトウェ
    アが予め書き込まれた情報記憶媒体において、認識候補
    の言語が先頭部の読み毎に予め格納された語表記対応辞
    書と、認識対象の音声の先頭部に先頭部の読みが一致す
    る言語を前記語表記対応辞書から前記コンピュータに検
    出させるプログラムと、が書き込まれていることを特徴
    とする情報記憶媒体。
  16. 【請求項16】 コンピュータが読み取って対応する動
    作を実行するプログラムが予め書き込まれた情報記憶媒
    体において、各種の言語が読みと共に予め格納された一
    般言語辞書から言語を取り出すこと、この取り出した言
    語を読みの先頭部毎に語表記対応辞書に格納すること、
    を前記コンピュータに実行させるプログラムが書き込ま
    れていることを特徴とする情報記憶媒体。
JP16544796A 1995-08-22 1996-06-26 音声認識装置および方法、辞書作成装置および情報記憶媒体 Expired - Fee Related JP3865149B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP16544796A JP3865149B2 (ja) 1995-08-22 1996-06-26 音声認識装置および方法、辞書作成装置および情報記憶媒体

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
JP7-213101 1995-08-22
JP21310195 1995-08-22
JP16544796A JP3865149B2 (ja) 1995-08-22 1996-06-26 音声認識装置および方法、辞書作成装置および情報記憶媒体

Publications (2)

Publication Number Publication Date
JPH09120296A true JPH09120296A (ja) 1997-05-06
JP3865149B2 JP3865149B2 (ja) 2007-01-10

Family

ID=26490183

Family Applications (1)

Application Number Title Priority Date Filing Date
JP16544796A Expired - Fee Related JP3865149B2 (ja) 1995-08-22 1996-06-26 音声認識装置および方法、辞書作成装置および情報記憶媒体

Country Status (1)

Country Link
JP (1) JP3865149B2 (ja)

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2006093003A1 (ja) * 2005-02-28 2006-09-08 Pioneer Corporation 辞書データ生成装置及び電子機器
JP2010066493A (ja) * 2008-09-10 2010-03-25 Denso Corp コード認識装置および経路探索装置
JP2014066779A (ja) * 2012-09-25 2014-04-17 Seiko Epson Corp 音声認識装置及び方法、並びに、半導体集積回路装置

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2006093003A1 (ja) * 2005-02-28 2006-09-08 Pioneer Corporation 辞書データ生成装置及び電子機器
JP2010066493A (ja) * 2008-09-10 2010-03-25 Denso Corp コード認識装置および経路探索装置
JP4645708B2 (ja) * 2008-09-10 2011-03-09 株式会社デンソー コード認識装置および経路探索装置
JP2014066779A (ja) * 2012-09-25 2014-04-17 Seiko Epson Corp 音声認識装置及び方法、並びに、半導体集積回路装置

Also Published As

Publication number Publication date
JP3865149B2 (ja) 2007-01-10

Similar Documents

Publication Publication Date Title
JP4791984B2 (ja) 入力された音声を処理する装置、方法およびプログラム
JP2848458B2 (ja) 言語翻訳システム
US6490563B2 (en) Proofreading with text to speech feedback
JP5040909B2 (ja) 音声認識辞書作成支援システム、音声認識辞書作成支援方法及び音声認識辞書作成支援用プログラム
US6910012B2 (en) Method and system for speech recognition using phonetically similar word alternatives
EP2317507B1 (en) Corpus compilation for language model generation
US20020049590A1 (en) Speech data recording apparatus and method for speech recognition learning
TW201822190A (zh) 語音辨識系統及其方法、詞彙建立方法與電腦程式產品
JPH08263478A (ja) 中国語簡繁体字文書変換装置
JPH1055196A (ja) 音声認識装置および方法、情報記憶媒体
JP3865149B2 (ja) 音声認識装置および方法、辞書作成装置および情報記憶媒体
CN115019787A (zh) 一种交互式同音异义词消歧方法、***、电子设备和存储介质
JP2003162524A (ja) 言語処理装置
JP3378547B2 (ja) 音声認識方法及び装置
JP3758241B2 (ja) 音声情報検索装置
JP2007086404A (ja) 音声合成装置
KR20210020294A (ko) 단어 또는 문장 단위 음성 인식 방법 및 장치
JPH0962286A (ja) 音声合成装置および音声合成方法
JPH0634175B2 (ja) 文章読上げ装置
JPH06119144A (ja) 文書読み上げ装置
JP3121530B2 (ja) 音声認識装置
JPH08171396A (ja) 音声認識装置
JPH0627985A (ja) 音声認識方法
JP2001166790A (ja) 書き起こしテキスト自動生成装置、音声認識装置および記録媒体
JPS6243213B2 (ja)

Legal Events

Date Code Title Description
A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20040106

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20040113

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20040315

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20040908

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20041104

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20050705

RD01 Notification of change of attorney

Free format text: JAPANESE INTERMEDIATE CODE: A7421

Effective date: 20050620

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20050905

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20060404

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20060605

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20060808

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20060825

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20060926

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20060928

R150 Certificate of patent or registration of utility model

Free format text: JAPANESE INTERMEDIATE CODE: R150

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20101013

Year of fee payment: 4

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20111013

Year of fee payment: 5

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20121013

Year of fee payment: 6

LAPS Cancellation because of no payment of annual fees