JP3425165B2 - 連続文音声認識装置 - Google Patents

連続文音声認識装置

Info

Publication number
JP3425165B2
JP3425165B2 JP25276792A JP25276792A JP3425165B2 JP 3425165 B2 JP3425165 B2 JP 3425165B2 JP 25276792 A JP25276792 A JP 25276792A JP 25276792 A JP25276792 A JP 25276792A JP 3425165 B2 JP3425165 B2 JP 3425165B2
Authority
JP
Japan
Prior art keywords
phrase
relevance score
calculated
clause
continuous
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
JP25276792A
Other languages
English (en)
Other versions
JPH06102897A (ja
Inventor
英樹 小島
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Fujitsu Ltd
Original Assignee
Fujitsu Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Fujitsu Ltd filed Critical Fujitsu Ltd
Priority to JP25276792A priority Critical patent/JP3425165B2/ja
Publication of JPH06102897A publication Critical patent/JPH06102897A/ja
Application granted granted Critical
Publication of JP3425165B2 publication Critical patent/JP3425165B2/ja
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Landscapes

  • Machine Translation (AREA)
  • Document Processing Apparatus (AREA)

Description

【発明の詳細な説明】
【0001】
【産業上の利用分野】本発明は連続発声された文音声を
認識する連続文音声認識装置に関し、特に本発明は文節
間の係り受け関係、意味関係、関連度を用いて、より速
く、より正確に文の認識を行うことができる連続文音声
認識装置に関するものである。
【0002】
【従来の技術】従来、連続発声された文音声を認識する
文音声認識方式としては、文脈自由文法の文を、CYK
やEarleyといったパーザー(文を成分に分けて処
理する方式)とDP(ダイナミック・プログラミング、
以下DPという)照合を組み合わせて認識する方式が用
いられていた。
【0003】
【発明が解決しようとする課題】ところで、上記した従
来の方式は扱える文法が文脈自由文法に限られ、日本語
の係り受け関係や意味関係、文節間の関連度を表現する
には不適当であるという問題があった。すなわち、上記
した方式は、例えば英文のように文節の順序に意味を持
つ文音声を認識するには適しているが、日本語のよう
に、係り受け関係(助詞による文節の結合関係)、意味
関係、関連度等に多く依存する文音声を認識するには適
当でなかった。
【0004】本発明は上記した従来技術の問題点に鑑み
なされたものであって、係り受け関係や意味関係、文節
間の関連度を考慮しながら効率良く連続文音声を認識す
ることができる連続文音声認識装置を提供することを目
的とする。
【0005】
【課題を解決するための手段】図1は本発明の原理ブロ
ック図である。同図において、1は入力音声と文節テン
プレートを照合し、認識スコアを出力する照合部、2は
文節群フラグを参照して照合部1において次に照合すべ
き文節を選択する文節選択部、3は格支配文法テーブ
ル、4は次に選択する文節を指示する文節群フラグを格
納した文節群フラグ・テーブル、5は照合部1において
入力音声と照合する文節テンプレートを格納した文節テ
ンプレート格納部、6はビーム・サーチを行うためのビ
ーム・サーチ枝刈り部、7は関連度スコア算出部であ
る。
【0006】上記課題を解決するため、本発明の請求項
1の発明は、あらかじめ、文節をその格と意味により文
節群に分類して格支配文法テーブル3に格納しておき、
上記分類結果を参照して、文節の係り受け関係と意味関
係から文節群フラグ・テーブル4の入力音声の文節中に
現れる可能性のある文節群にフラグを立てる。
【0007】そして、フラグが立てられた文節群と入力
音声の文節とを照合部1において照合し、フラグが立て
られた文節群に含まれる文節が実際に入力音声の文節中
に現れるかを調べ、その結果に基づき文節を選択し、上
記照合手段が出力する認識スコアに基づき連続文音声を
認識する
【0008】本発明の請求項の発明は、請求項1の発
明において、フラグが立てられた文節と入力音声の文節
を上記照合手段により照合した結果、フラグが立てられ
た文節群に含まれる文節が実際に入力音声中の照合でき
た場合、照合した文節に該当する文節群フラグテーブル
のフラグをリセットするようにしたものである。本発明
の請求項の発明は、請求項1または請求項2の発明に
おいて、入力音声の文節と照合する文節候補をビーム・
サーチ枝刈り部6においてビーム・サーチ法により一定
数内に絞るようにしたものである。本発明の請求項
発明は、請求項1,2または請求項3の発明において、
関連度スコア算出部7において、文節間の関連度から関
連度スコアを算出し、算出された関連度スコアを入力音
声の照合結果に付加するようにしたものである
【0009】本発明の請求項5の発明は、請求項4の発
明において、文節間の関連度データとして、文節間の共
起関係データを用いるようにしたものである。本発明の
請求項6の発明は、請求項4の発明において、文節間の
関連度データとして、文節間の隣接関係データを用いる
ようにしたものである。本発明の請求項7の発明は、請
求項4の発明において、関連度データとして、2つの文
節間関連度データを用い、入力音声の文節と照合する
毎に、その前に照合した文節との関連度スコアを計算し
て記憶しておき、その回の関連度スコアは前回計算した
関連度スコアと、今回計算した関連度スコアとから算出
するようにしたものである。
【0010】本発明の請求項の発明は、請求項の発
明において、前回計算した関連度スコアと今回計算した
関連度スコアの和からその回の関連度スコアを算出する
ようにしたものである。本発明の請求項の発明は、請
求項の発明において、前回計算した関連度スコアと今
回計算した関連度スコアの積からその回の関連度スコア
を算出するようにしたものである。
【0011】本発明の請求項10の発明は、請求項
発明において、前回計算した関連度スコアと今回計算し
た関連度スコアの内、大きい方をその回の関連度スコア
とするようにしたものである。本発明の請求項11の発
明は、請求項の発明において、前回計算した関連度ス
コアと今回計算した関連度スコアの内、小さい方をその
回の関連度スコアとするようにしたものである。
【0012】本発明の請求項12の発明は、請求項
発明において、前回計算した関連度スコアと今回計算し
た関連度スコアの平均値からその回の関連度スコア求め
るようにしたものである。
【0013】
【作用】本発明の請求項1,2の発明においては、文節
をその格と意味により文節群に分類して格支配文法テー
ブル3に格納しておき、上記分類結果を参照して、文節
の係り受け関係と意味関係から入力音声の文節中に現れ
る可能性のある文節群にフラグを立て、フラグが立てら
れた文節群と入力音声の文節を照合し、その結果に基づ
き、文節を選択し、上記照合手段が出力する認識スコア
に基づき連続文音声を認識し、また、フラグが立てられ
た文節と入力音声の文節を上記照合手段により照合した
結果、フラグが立てられた文節群に含まれる文節が実際
に入力音声中の照合できた場合、照合した文節に該当す
る文節群フラグテーブルのフラグをリセットするように
したので、係り受け関係や意味関係を考慮して効率よく
連続文音声入力を認識することができ、連続文音声認識
の性能を向上させることができる。
【0014】本発明の請求項の発明においては、入力
音声の文節と照合する文節候補をビーム・サーチによ
り一定数内に絞るようにしたので、照合のための計算量
を減少させることができる。本発明の請求項ないし請
求項12の発明においては、文節間の関連度から関連度
スコアを算出し、算出された関連度スコアを入力音声の
照合結果に付加するようにしたので、より正確に連続文
音声入力を認識することができる。
【0015】
【実施例】図2は本発明の第1の実施例を示す図であ
り、同図において、11は入力音声と文節テンプレート
をダイナミック・プログラミングにより照合し、認識ス
コアを出力するDP照合部、12は文節群フラグを参照
してDP照合部11において次に照合すべき文節を選択
する文節選択部、13は格支配文法を格納した格支配文
法テーブル、14は次に選択する文節を指示する文節群
フラグを格納した文節群フラグ・テーブル、15はDP
照合部11において入力音声と照合する文節テンプレー
トを格納した文節テンプレート格納部である。
【0016】図3は格支配文法テーブル13の構成の一
例を示す図であり、同図に示すように格支配文法テーブ
ル13には、動詞、名詞句等の係り受け関係、すなわ
ち、動詞、名詞句等の文節と、その文節がきた場合には
次のどの文節がくるかという対応関係が格納されてい
る。例えば、「行く」という動詞に係る可能性のある文
節として「私が」、「太郎が」等の「(人)が」という
文節と、「学校へ」、「病院へ」といった「(場所)
へ」のような文節がありうることが記述されている。ま
た、例えば、名詞句の前に形容詞がくるといったことも
同様に記述されている。
【0017】なお、文の順序では「行く」という動詞は
一般に文の最後にくるが、日本語の場合には、前から後
ろへの係り受け関係により次に続く文節が決まってくる
ため、認識は後ろからやっていった方が文法の制限をよ
り明確に反映させることができる。したがって、認識時
には、文末の「行く」から認識していき、「行く」の次
に「場所へ」あるいは「人が」等がくることとなる。
【0018】図4(a)は文節群フラグ・テーブル14
の構成を示す図であり、文節群フラグ・テーブル14に
は同図に示すように、動詞、名詞句、形容詞等とそれら
の文節群フラグが格納され、これら文節群フラグは、格
支配文法テーブル13を参照した結果、照合された文節
の次にくると予測される文節に○が付与され、それ以外
の文節および照合済の文節には×が付与される。
【0019】図4(b)は文節群フラグ・テーブル14
の文節群フラグの変化の様子を示す図であり、同図は
「私が 学校へ 行く」という文音声を認識する場合の
文節群フラグの状態を示している。同図により、一例と
して上記のように「私が 学校へ 行く」という文音声
を認識する場合の文節群フラグの付与について説明す
る。 前述したように連続文を認識する場合には文音声の
末尾から認識が行われ、日本語文においては通常動詞が
文末にくるので文節群フラグ・テーブル14には最初、
動詞の全てに○が付与されている。ついで、動詞として
「行く」が認識されると文節群フラグ・テーブル14に
格納された動詞の文節群フラグに×が付与される。 格支配文法テーブル13を参照して動詞「行く」の
次にくる文節が予測され、その結果、「行く」の場合に
は「(場所)へ」、「(人)が」が関係ある文節として
見いだされるので、図4(イ)に示すように、「(場
所)へ」、「(人)が」に○が付与され、「(場所)
で」には×が付与される。 「行く」の次にくる文節を照合した結果、例えば、
「学校へ」という文節が認識された場合には、「(場
所)へ」という文節に×が付与される。これは、単文に
おいは、同種の格支配が2以上表れることはほとんどな
いというルールを利用している。
【0020】その結果、文節群フラグ・テーブル14の
文節群フラグの状態は図4(ロ)に示すように、
「(人)が」に○が付与されている状態となる。 「学校へ」の次の文節を照合した結果、次の文節が
「私が」であることが認識されると、文節群フラグ・テ
ーブル14の「(人)が」の文節のフラグに×が付与さ
れ、文節群フラグの状態は図4(ハ)に示す状態とな
る。
【0021】結果として、全ての文節群フラグに×がつ
くことになるので、この文の認識は終了したということ
となる。なお、上記例においては、全ての文節群フラグ
が×になり、認識を終了することができたが、文法の書
き方によってはいつまでたっても文の終わりが検出でき
ないこともあり得る。そのため、例えば、認識できる文
節の数を制限するなどにより、上記問題を回避すること
が可能である。
【0022】図5は文節選択部12における処理を示す
フローチャートであり、同図、図3および図4を用いて
図2に示す第1の実施例について説明する。文節選択部
12はまず、文節群フラグとDPの初期状態(照合結果
が入力されていない状態)をキューに入れる(図5のス
テップS1)。初期状態においては、文節群フラグは前
述したように動詞の文節に○が付与されている。
【0023】なお、DPの照合結果は文節の各部分まで
の照合結果からなる数字列であり、初期状態において
は、上記数字列に無限大の記号が記されている。つい
で、ステップS2において、キューが空か否が判別さ
れ、キューが空の場合には終了する。キューが空でない
場合(初期状態においては、キューにはステップS1に
おいて入力された文節群フラグとDPの初期状態が入力
されている)、ステップS3に行き、キューから文節群
フラグとDPの結果を取り出す。また、Iを初期状態で
あるI=1とする。
【0024】ステップS4において、Iの値が図2の文
節テンプレート格納部15に格納された文節テンプレー
ト登録文節数より大きいか否かが判別され、Iの値が文
節テンプレート登録文節数より大くなった場合には、そ
の文節について文節テンプレートとの照合が終了したも
のとしてステップS2に戻り、キューが空であるか否か
を判別し、空でない場合には、ステップS3に行く。
【0025】また、Iの値が文節テンプレート登録文節
数より小さい場合には、ステップS5に行き、Bに文節
テンプレートより取り出した第I番目の文節を入れる。
ついで、ステップS6に行き、文節テンプレートより取
り出した第I番目の文節について、文節群フラグ・テー
ブル14を参照してその文節に文節群フラグが立ってい
る(○が付されている)か否かを判別する。そして、文
節群フラグが立っていない場合にはステップS8に行
き、Iに1を加えてステップS4に戻る。
【0026】また、文節群フラグが立っている場合に
は、ステップS7に行き、図2のDP照合部11に、入
力された音声データと文節テンプレートより取り出した
I番目の文節Bとの照合を行わせるとともに、文節群フ
ラグ・テーブル14に格納された文節群フラグを更新す
る。すなわち、前記したように照合済の文節について、
文節群フラグを○から×にする。
【0027】上記処理が終わると、DP照合部11にお
ける照合結果と、更新された文節群フラグ・テーブルを
キューに入れる。ついで、ステップS8に行き、Iに1
を加算してステップS4に戻り、文節テンプレート格納
部15に格納された次の文節テンプレートについて、上
記と同様にDP照合と、文節群フラグ更新処理を行う。
【0028】以上のようにして、文節テンプレート格納
部15に格納された全ての文節テンプレートと入力音声
の照合が終わると、ステップS4からステップS2に戻
り、キューが空か否かを判断して、空でない場合には、
ステップS3に行く。ステップS3においては、キュー
から文節群フラグとDPの結果を取り出し、I=1とし
て、入力音声の次の文節について、キューから取り出し
た文節群フラグとDPの結果を基に上記と同様、DP照
合と文節群フラグの更新処理を行う。
【0029】以上のように、図5の処理においは、文節
テンプレート格納部15に格納された各テンプレートの
内、文節群フラグが付された文節のテンプレートと入力
音声の最初の文節(文末の文節)とをDP照合部11に
おいて、順次、照合するともに文節群フラグを更新し、
照合結果と更新された文節群フラグをキューに格納す
る。
【0030】ついで、次の入力音声の文節と、文節テン
プレート格納部15に格納された各テンプレートの内、
文節群フラグが付された文節のテンプレートとを上記と
同様に照合し、DP照合結果を、キューに格納された最
初の文節のDP照合結果を基にしてつなげていく。そし
て、DP照合結果と更新された文節群フラグを前記した
ように、キューに格納する。
【0031】以下同様に、入力音声の各文節と文節テン
プレートを順次照合していき、前記したように、文節群
フラグがすべて×状態になると、照合を終了する。そし
て、DP照合部11は連続文音声の各文節のDP照合結
果をつなげて得られた連続文音声に対する複数のDP照
合結果より認識スコア求めて出力し、この認識スコアの
最も高いものを入力音声の認識結果とする。
【0032】図6は本発明の第2の実施例を示す図であ
り、同図において、図2に示した第1の実施例と同一の
ものには同一の符号が付されており、本実施例において
は、第1の実施例のものに、ビームサーチ枝刈り部21
と関連度スコア処理部22と関連度データ格納部23付
加したものであり、その他の構成は第1の実施例と同一
である。
【0033】図7はビーム・サーチの概念を示す図であ
り、同図を参照して、本実施例におけるビーム・サーチ
について説明する。連続文音声認識は基本的には、前記
したように、入力音声の各文節のDP照合結果(これを
以下、DPプレーンという)をつなぐことにより実現す
ることができ、図7は、前記した「私が 学校へ 行
く」という文を例にして上記DPプレーンを図示したも
のである。
【0034】図7に示すように、連続文の認識を行う場
合には、最初に現れる文節(文末の文節)のDPプレー
ンを作成したのち(同図では、最初の現れる文節として
「行く」、「聞く」、「見る」のDPプレーンが例示さ
れている)、各文節について、その後に続き得る文節の
DPプレーンをつなげる(同図では、上記文末の文節に
続いて「学校へ」、「私が」のDPプレーンがつなげら
れている)ことにより、連続認識を行うことができる。
なお、前記したように認識は後ろからやっていった方が
文法の制限をより明確に反映させることができ、図7の
例においては、文末の「行く」等の動詞から照合してい
る。
【0035】ところで、図2に示した第1の実施例にお
いては、入力された音声の各文節と文節テンプレートと
の照合結果の全てについてDPプレーンを作成し、その
DPプレーンをつなげていくため、全ての可能性につい
てDPマッチングを行うこととなり、計算量が膨大なも
のとなる。そこで、各文節を照合した段階で、その照合
結果による枝刈りによりDPプレーンを伸ばす個数を一
定数に制限すれば、上記計算量を抑えることができる。
【0036】このような手法がビーム・サーチであり、
図7の例においては、DPプレーンを伸ばす個数を1に
制限した例を示している。すなわち、図2に示した第1
の実施例の場合には、「行く」、「聞く」、「見る」の
全てのDPプレーンに続けて、入力音声の次の文節のD
Pプレーンをつなげていくこととなるため、DPプレー
ンの分岐数が増え計算量が膨大なものとなるが、図7の
ように、「行く」、「聞く」、「見る」の内、最も認識
スコアの高い「行く」のみからDPプレーンを伸ばすこ
とにより、計算量を抑えることができる。
【0037】具体的には、図5のフローチャートにおい
て、キューにDP照合結果と文節群フラグを入れるとき
に、DP照合結果を図6のビーム・サーチ枝刈り部21
に送り、ビーム・サーチ枝刈り部21で文節候補の数を
ビーム幅内に絞り、文節選択部12のキューに送る。す
なわち、DP照合結果の内、ビーム・サーチ枝刈り部2
1において選定される認識スコアの高い1ないし複数の
文節を文節候補として(図7の例においては「行く」が
文節候補として選択されている)、文節選択部12のキ
ューに送る。
【0038】図8は関連度データ格納部23に格納され
た関連度データの一例を示す図であり、同図には、関連
度データとして、一つの文に二つの文節が同時に現れる
可能性を示す値(共起関係データという)が示されてい
る。同図の例においては、例えば「行く」という文節の
前に「今日」という文節が現れる確率は0.3であり、
また、「今日」という文節が2回現れる確率は0である
ことが示されている。
【0039】なお、関連度データとしては、上記例のほ
か、例えば、ある文節が他のある文節と隣合う可能性を
示したデータ等(隣接関係データという)を用いること
もできる。図6の関連スコア処理部は22は上記した関
連度データ格納部23に格納された関連度データを参照
して、関連度スコアを算出する手段であり、文節選択部
12により文節が選択された場合に、その文中の既に選
択された文節との関連度を算出し、DP照合部11にお
ける照合結果に関連度を加算するか、あるいは照合結果
と関連度との積を求めて認識スコアとして出力する。
【0040】関連度の算出方法としては、例えば、文節
選択部11が「行く」の前の文節として「学校へ」を選
択した場合、図8に示した関連度データから関連度は
0.8と求められる。次に、「学校へ」の前の文節とし
て「私は」が選ばれたときには、図8の関連度データか
ら「学校へ」と「私は」の関連度が0.4であり、この
値と上記した「行く」と「学校へ」の関連度0.8を加
えて、関連度1.2となる。
【0041】さらに、「私は」の次の文節として、「今
日」が選択された場合には、関連度は図8より0.2と
なるから、上記した関連度1.2にこの0.2を加えて
関連度は1.4となる。すなわち、図8に示した関連度
データの値を累積していくことにより、関連度が求めら
れる。上記例においては、関連度の和を算出して複数の
文節の関連度を求める例を示したが、関連度の算出方法
としては、その他種々の方法を採用することができ、例
えば、和のかわりに積を用いることもできる。この場合
には、上記例のように、「行く」と「学校へ」と「私
は」が選択された場合の関連度は0.8×0.4=0.
32となり、さらに、「今日」が選択された場合の関連
度は0.32×0.2=0.064となる。
【0042】また、関連度を求める手法としては、その
他、図8の関連度データから求めた関連度の最大値ma
xを求めたり(この場合、上記のように「行く」と「学
校へ」と「私は」が選択された場合の関連度は0.
8)、あるいは、最小値minを求めたり、さらに、各
関連度値の平均を求める等により、関連度を算出するこ
ともできる。
【0043】次に、図7、図8を参照して図6の第2の
実施例について説明する。図2の示した実施例と同様、
文節テンプレート格納部15に格納された各テンプレー
トの内、文節群フラグが付された文節のテンプレートと
入力音声の最初の文節(文末の文節)とをDP照合部1
1において照合するともに文節群フラグを更新する。こ
の照合結果はDP照合部11よりビームサーチ枝刈り部
21に送られ、ビームサーチ枝刈り部21はDP照合に
より得られた文節候補の数を、認識スコアにより、ビー
ム幅内の一定の数に絞る。
【0044】ビームサーチ枝刈り部21により絞られた
文節候補は文選択部12に送られ、キューに入れられ
る。ついで、次の入力音声の文節と、文節テンプレート
格納部15に格納された各テンプレートの内、文節群フ
ラグが付された文節のテンプレートとを上記と同様に照
合する。そして、そのDP照合結果をキューに入力され
ている前の文節の文節候補のDPプレーンにつなげてい
く。
【0045】以下同様に、入力音声の各文節と文節テン
プレートを順次照合していき、前記したように、文節群
フラグがすべて×状態になると、照合を終了する。ま
た、関連度スコア処理部22は文選択部12において文
節が選択されたとき、関連度データ格納部23に格納さ
れた関連度データを参照して、前記した手法により関連
度を算出し、DP照合部11の照合結果に関連度を加え
て(例えば、和を求めたり、積を求める)、認識スコア
として出力する。
【0046】図9は本発明の第3の実施例を示す図であ
り、同図において、図6に示した第2の実施例と同一の
ものには同一の符号が付されており、本実施例において
は、第2の実施例の関連度スコア処理部22を関連度ス
コア付加部24と関連度スコア計算部25から構成した
ものであり、その他の構成は図6の実施例と同一であ
る。
【0047】図9の実施例において、関連度スコア計算
部25は関連度データ格納部23に格納された関連度デ
ータを参照して、前記したように関連度データの和、積
等から関連度スコアを計算し、関連度スコア付加部24
に出力する。関連度スコア付加部24は関連度スコア計
算部25により求められた関連度スコアをDP照合部1
1が出力する認識スコアに付加して(例えば、前記した
ように、認識スコアに関連度スコアを加算、もしくは掛
けて)、認識スコアを出力する。
【0048】
【発明の効果】以上説明したことから明らかなように、
本発明においては、文節をその格と意味により文節群に
分類しておき、上記分類結果を参照して、文節の係り受
け関係と意味関係から入力音声の文節中に現れる可能性
のある文節群にフラグを立て、フラグが立てられた文節
群と入力音声の文節を照合し、フラグが立てられた文節
群に含まれる文節が実際に入力音声の文節中に現れるか
を調べ、その結果に基づき文節を選択し、上記照合手段
が出力する認識スコアに基づき連続文音声を認識する
うにしたので、係り受け関係や意味関係を考慮して効率
よく連続文音声入力を認識することができ、連続文音声
認識の性能を向上させることができる。
【0049】また、入力音声の文節と照合する文節候補
をビーム・サーチにより一定数内に絞るようにすること
により、照合のための計算量を減少させることができ
る。さらに、文節間の関連度から関連度スコアを算出
し、算出された関連度スコアを入力音声の照合結果に付
加することにより、より正確に連続文音声入力を認識す
ることができる。
【図面の簡単な説明】
【図1】本発明の原理ブロック図である。
【図2】本発明の第1の実施例を示す図である。
【図3】格支配文法テーブルの一例を示す図である。
【図4】文節群フラグ・テーブルの一例を示す図であ
る。
【図5】文節選択部における処理を示すフローチャート
である。
【図6】本発明の第2の実施例を示す図である。
【図7】ビーム・サーチの概念を示す図である。
【図8】関連度データの一例を示す図である。
【図9】本発明の第3の実施例を示す図である。
【符号の説明】
11 DP照合部 12 文節選択部 13 格支配文法テーブル 14 文節群フラグ・テーブル 15 文節テンプレート格納部 21 ビームサーチ枝刈り部 22 関連度スコア処理部 23 関連度データ 24 関連度スコア付加部 25 関連度スコア計算部
フロントページの続き (56)参考文献 特開 昭63−128467(JP,A) 特開 昭63−311398(JP,A) 特開 平3−180899(JP,A) 小島英樹 他,深層格を用いた係り受 け解析による日本語文音声の認識,日本 音響学会平成4年度秋季研究発表会講演 論文集,日本,1992年10月 5日,2− Q−9,p.189−190 小島英樹 他,連続音声認識技術,F UJITSU,日本,1998年 1月12 日,Vol.49 No.1,p.71−75 鈴木良弥,格構造を利用した日本語音 声認識,日本音響学会平成4年度春季講 演論文集,日本,1992年 3月,3−1 −7,p.83−84 (58)調査した分野(Int.Cl.7,DB名) G10L 15/12 G10L 15/18 G10L 15/28 JICSTファイル(JOIS)

Claims (12)

    (57)【特許請求の範囲】
  1. 【請求項1】 文節照合により連続文音声を認識する連
    続文音声認識装置であって、 文節をその格と意味により文節群に分類して格納した格
    支配文法テーブルと、 次に選択する文節を指示する文節群フラグを格納した文
    節群フラグ・テーブルと、 入力音声を照合し、認識スコアを出力する照合手段と、 上記文節フラグを参照して、上記照合手段において次に
    照合すべき文節を選択する文節選択手段とを備え、 上記文節選択手段は、上記格支配文法テーブルを参照し
    て、上記文節群フラグ・テーブルの入力音声の文節中に
    現れる文節群にフラグを立て、 フラグが立てられた文節と入力音声の文節を上記照合手
    段により照合し、フラグが立てられた文節群に含まれる
    文節が実際に入力音声の文節中に現れるかを調べ、その
    結果に基づき文節を選択し、 上記照合手段が出力する認識スコアに基づき連続文音声
    を認識することを特徴とする連続文音声認識装置。
  2. 【請求項2】 フラグが立てられた文節と入力音声の文
    節を上記照合手段により照合した結果、フラグが立てら
    れた文節群に含まれる文節が実際に入力音声中の照合で
    きた場合、照合した文節に該当する文節群フラグテーブ
    ルのフラグをリセットすることを特徴とする請求項1の
    連続文音声認識装置。
  3. 【請求項3】 前記照合手段はビームサーチ法により入
    力音声の文節と照合する文節候補を一定数内に絞ること
    を特徴とする請求項1または請求項2の連続文音声認識
    装置。
  4. 【請求項4】 文節間の関連度から関連度スコアを算出
    し、算出された関連度スコアを入力音声の照合結果に付
    加する関連度スコア算出手段を備えたことを特徴とする
    請求項1,2または請求項3の連続文音声認識装置。
  5. 【請求項5】 文節間の関連度データとして、文節間の
    共起関係データを用いて関連度スコアを算出することを
    特徴とする請求項4の連続文音声認識装置
  6. 【請求項6】 文節間の関連度データとして、文節間の
    隣接関係データを用いて関連度スコアを算出することを
    特徴とする請求項4の連続文音声認識装置
  7. 【請求項7】 関連度データとして、2つの文節間
    連度データを用い、入力音声の文節と照合する毎に、そ
    の前に照合した文節との関連度スコアを計算して記憶し
    ておき、 その回の関連度スコアは前回計算した関連度スコアと、
    今回計算した関連度スコアとから算出することを特徴と
    する請求項4の連続文音声認識装置。
  8. 【請求項8】 前回計算した関連度スコアと今回計算し
    た関連度スコアの和からその回の関連度スコアを算出す
    ることを特徴とする請求項7の連続文音声認識装置
  9. 【請求項9】 前回計算した関連度スコアと今回計算し
    た関連度スコアの積からその回の関連度スコアを算出す
    ることを特徴とする請求項7の連続文音声認識装置
  10. 【請求項10】 前回計算した関連度スコアと今回計算
    した関連度スコアの内、大きい方をその回の関連度スコ
    アとすることを特徴とする請求項7の連続文音声認識装
    置。
  11. 【請求項11】 前回計算した関連度スコアと今回計算
    した関連度スコアの内、小さい方をその回の関連度スコ
    アとすることを特徴とする請求項7の連続文音声認識装
    置。
  12. 【請求項12】 前回計算した関連度スコアと今回計算
    した関連度スコアの平均値からその回の関連度スコア求
    めることを特徴とする請求項7の連続文音声認識装置。
JP25276792A 1992-09-22 1992-09-22 連続文音声認識装置 Expired - Fee Related JP3425165B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP25276792A JP3425165B2 (ja) 1992-09-22 1992-09-22 連続文音声認識装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP25276792A JP3425165B2 (ja) 1992-09-22 1992-09-22 連続文音声認識装置

Publications (2)

Publication Number Publication Date
JPH06102897A JPH06102897A (ja) 1994-04-15
JP3425165B2 true JP3425165B2 (ja) 2003-07-07

Family

ID=17242016

Family Applications (1)

Application Number Title Priority Date Filing Date
JP25276792A Expired - Fee Related JP3425165B2 (ja) 1992-09-22 1992-09-22 連続文音声認識装置

Country Status (1)

Country Link
JP (1) JP3425165B2 (ja)

Families Citing this family (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2553998B2 (ja) * 1992-08-21 1996-11-13 大東植産株式会社 Ds緑化工法
JP3252815B2 (ja) 1998-12-04 2002-02-04 日本電気株式会社 連続音声認識装置及び方法
JP4773003B2 (ja) * 2001-08-20 2011-09-14 株式会社リコー 文書検索装置、文書検索方法、プログラム及びコンピュータに読み取り可能な記憶媒体
JP5243325B2 (ja) * 2009-03-30 2013-07-24 Kddi株式会社 音声認識に仮名漢字変換システムを用いた端末、方法及びプログラム
JP7178890B2 (ja) * 2018-12-11 2022-11-28 菱洋エレクトロ株式会社 音声認識システム、及び音声認識装置

Non-Patent Citations (3)

* Cited by examiner, † Cited by third party
Title
小島英樹 他,深層格を用いた係り受け解析による日本語文音声の認識,日本音響学会平成4年度秋季研究発表会講演論文集,日本,1992年10月 5日,2−Q−9,p.189−190
小島英樹 他,連続音声認識技術,FUJITSU,日本,1998年 1月12日,Vol.49 No.1,p.71−75
鈴木良弥,格構造を利用した日本語音声認識,日本音響学会平成4年度春季講演論文集,日本,1992年 3月,3−1−7,p.83−84

Also Published As

Publication number Publication date
JPH06102897A (ja) 1994-04-15

Similar Documents

Publication Publication Date Title
US6501833B2 (en) Method and apparatus for dynamic adaptation of a large vocabulary speech recognition system and for use of constraints from a database in a large vocabulary speech recognition system
Ortmanns et al. Language-model look-ahead for large vocabulary speech recognition
Bellegarda Latent semantic mapping: Principles and applications
US5634084A (en) Abbreviation and acronym/initialism expansion procedures for a text to speech reader
US6385579B1 (en) Methods and apparatus for forming compound words for use in a continuous speech recognition system
EP0527650B1 (en) Speech recognition apparatus
US6618726B1 (en) Voice activated web browser
Hori et al. A new approach to automatic speech summarization
US7401019B2 (en) Phonetic fragment search in speech data
US20030130835A1 (en) Named entity (NE) interface for multiple client application programs
TW201822190A (zh) 語音辨識系統及其方法、詞彙建立方法與電腦程式產品
Hori et al. A statistical approach to automatic speech summarization
Ostrogonac et al. Morphology-based vs unsupervised word clustering for training language models for Serbian
JP3425165B2 (ja) 連続文音声認識装置
US20060136195A1 (en) Text grouping for disambiguation in a speech application
JP3794597B2 (ja) 話題抽出方法及び話題抽出プログラム記録媒体
JP2965529B2 (ja) 音声認識装置
JP6843689B2 (ja) コンテキストに応じた対話シナリオを生成する装置、プログラム及び方法
CN111782779A (zh) 语音问答方法、***、移动终端及存储介质
JP2905686B2 (ja) 音声認識装置
Campbell et al. Discriminative Keyword Selection Using Support Vector Machines.
Staš et al. Language model adaptation for Slovak LVCSR
Hori et al. Automatic summarization of english broadcast news speech
JP2817406B2 (ja) 連続音声認識方式
JPH06342298A (ja) 音声認識方式

Legal Events

Date Code Title Description
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20030415

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20080502

Year of fee payment: 5

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20090502

Year of fee payment: 6

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20090502

Year of fee payment: 6

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20100502

Year of fee payment: 7

LAPS Cancellation because of no payment of annual fees