JPH04253099A - 連続音声認識方式 - Google Patents

連続音声認識方式

Info

Publication number
JPH04253099A
JPH04253099A JP3010234A JP1023491A JPH04253099A JP H04253099 A JPH04253099 A JP H04253099A JP 3010234 A JP3010234 A JP 3010234A JP 1023491 A JP1023491 A JP 1023491A JP H04253099 A JPH04253099 A JP H04253099A
Authority
JP
Japan
Prior art keywords
network
speech recognition
word
continuous speech
words
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP3010234A
Other languages
English (en)
Other versions
JP2817406B2 (ja
Inventor
Atsushi Noguchi
淳 野口
Akitoshi Okumura
明俊 奥村
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
NEC Corp
Original Assignee
NEC Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by NEC Corp filed Critical NEC Corp
Priority to JP3010234A priority Critical patent/JP2817406B2/ja
Publication of JPH04253099A publication Critical patent/JPH04253099A/ja
Application granted granted Critical
Publication of JP2817406B2 publication Critical patent/JP2817406B2/ja
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Landscapes

  • Machine Translation (AREA)
  • Document Processing Apparatus (AREA)

Abstract

(57)【要約】本公報は電子出願前の出願データであるた
め要約のデータは記録されません。

Description

【発明の詳細な説明】
【0001】
【産業上の利用分野】本発明は自動通訳システム,音声
質問応答(QA)システム等において連続的に発声した
音声を認識する連続音声認識方式に関するものである。
【0002】
【従来の技術】音声を用いたマンマシンインターフェー
スは、キーボードのような訓練が必要ないため使いやす
くまた自然であるので実用化が強く望まれている。また
音声も単語単位で発話されたものだけでなく、会話文の
ような連続音声を取り扱える方がより使いやすく自然な
ので望まれている。
【0003】このような、音声を用いたインターフェー
スを自動通訳システム,音声QAシステム等に使用する
場合は入力音声の一言一句を明らかにするのが主な目的
ではなく、入力音声の意味を取り出すこと、すなわち入
力音声の意味の理解が必要である。
【0004】なぜならば、質問応答システムではユーザ
ーの質問に対して適切に返答するために質問の意味を知
る必要があるし、自動通訳システムでは音声入力に用い
られた言語を英語等の他の言語に適切に変換するために
入力文の意味を明確にする必要があるからである。
【0005】入力音声の認識結果に対して改めて構文解
析,意味解析を行なうことなく、入力音声の自然言語と
しての意味を抽出する音声認識方式としては特願平2−
72889号記載の「連続音声認識方式」(以下文献1
と称す)がある。文献1では音声認識用のオートマトン
で受理される単語列中の単語と単語の意味的な関係を、
その単語列がオートマトンに受理されたときにそれぞれ
の単語が対応する状態遷移列どうしの意味関係としてあ
らかじめ記憶しておくことにより入力音声の音声認識結
果に対して構文解析,意味解析を改めて行なうことなく
入力音声の自然言語としての意味を抽出する音声認識方
式を提案している。
【0006】
【発明が解決しようとする課題】しかしながら文献1の
音声認識方式では、例えば、その認識された文の時制や
丁寧文,疑問文等の文の種類を中間表現中に表すことに
ついては考察されていなかった。
【0007】また、有限オートマトンを用いた方法と同
等の処理量で文脈自由文法を扱うことができる音声認識
方式として、1989年電子情報通信学会春季全国大会
「拡張遷移網を用いた連続音声認識の一方式」(以下文
献2と称す)(吉田和永、渡辺隆夫)がある。拡張遷移
網(以下ATNと記す)を用いた音声認識は、(1)サ
ブネットワークの呼び出しにより文脈自由文法が扱える
。 (2)レジスタとそのレジスタをテストする機構より履
歴を考慮した処理を行ない、語順自由,共起関係,係受
けを扱うことができる。 等の自然言語を記述するための高い能力を有している。
【0008】しかしながら、文献1の音声認識方法では
、文献2のように認識用ネットワークがサブネットを持
つ場合についての考察がなされていなかった。
【0009】また、例えば日本語による音声対話におい
て“(あなたは)学校にいくの?”“(わたしは)バー
シアのコンサートのチケットが欲しい。”のように良く
主語が省略されるので中間表現を作成する際に省略され
た要素を補わなくてはならないが、文献1の音声認識方
法ではその考察がなされていない。
【0010】本発明の目的は、このような欠点を克服し
て、音声認識の際により自然で多様な文を認識し、かつ
その意味表現を出力することができる連続音声認識方式
を提供することにある。
【0011】
【課題を解決するための手段】本発明による連続音声認
識方式は、連続音声認識対象の文法を表現する単語に関
するネットワークを記憶する第1の記憶手段と、単語の
標準パターンを前記ネットワークにしたがって結合して
連続音声を認識する連続音声認識手段と、前記ネットワ
ークにおけるある単語と他の単語の間の意味的な関係及
び各単語に対する素性情報を記憶する第2の記憶手段と
、前記連続音声認識手段から生じる認識結果及び前記第
2の記憶手段からその中間表現を出力する出力手段とを
備えることを特徴とする。
【0012】そして、前記連続音声認識手段はあらかじ
め定められた認識単位の標準パターンを前記ネットワー
ク及び各ネットワークから呼ばれるサブネットワークに
したがって結合して連続音声を認識し、前記第1の記憶
手段は連続音声認識対象の文法を表現するネットワーク
及び各ネットワークから呼ばれるサブネットワークを記
憶し、前記出力手段は前記連続音声認識手段から生じる
認識結果及び前記第2の記憶手段のある単語と他の単語
の間の意味的な関係及び前記ネットワーク及びサブネッ
トワーク内の各単語に対する素性情報からその中間表現
を出力することを特徴とする。
【0013】また、ある単語が認識された時に、他の単
語に付与する素性情報を記憶する前記第2の記憶手段と
、前記情報を前記中間表現に付与する付与手段とを備え
ることを特徴とする。
【0014】さらに、ある単語が認識された時に、その
単語に付与する素性情報を単語辞書記憶部から取り出し
、前記付与手段は前記情報を前記中間表現に付与するこ
とを特徴とする。
【0015】そして、前記単語辞書記憶部は連続音声認
識対象の文法を表現するネットワーク内に存在しないが
中間表現を作成するために必ず必要な単語を記憶し、前
記出力手段は前記情報をもとに中間表現を作成して出力
することを特徴とする。
【0016】また、前記単語辞書記憶部は連続音声認識
対象の文法を表現するネットワーク内のある特定の単語
が認識された際に補う単語を記憶し、前記出力手段は前
記情報をもとに中間表現を作成して出力することを特徴
とする。
【0017】さらに、前記単語辞書記憶部は連続音声認
識対象の文法を表現するネットワーク内のある特定の単
語が認識された際に削除すべき連続音声認識対象の文法
を表現するネットワーク中の特定の単語を記憶し、前記
出力手段は前記情報をもとに中間表現を作成して出力す
ることを特徴とする。
【0018】
【作用】次に、本発明の作用について説明する。
【0019】図3は本発明の一実施例における意味関係
記憶部の一例を示す図、図4は音声認識用ネットワーク
の第1の例を示す図、図5は図4におけるメインネット
ワーク用の意味関係記憶部の内容の一例を示す図、図6
は図4におけるサブネットワーク用の意味関係記憶部の
内容の一例を示す図、図7は音声認識用ネットワークの
第2の例を示す図、図8は図7におけるネットワークの
中間表現の例を示す図、図9は図7におけるネットワー
ク用の意味関係記憶部の内容の一例を示す図、図10は
音声認識用ネットワークの第3の例を示す図、図11は
図10におけるネットワーク用の意味関係記憶部の内容
の一例を示す図、図12は音声認識用ネットワークの第
4の例を示す図、図13は図12におけるネットワーク
の中間表現の例を示す図、図15は音声認識用ネットワ
ークの第5の例を示す図、図16は音声認識用ネットワ
ークの第6の例を示す図、図17は図16におけるネッ
トワークの中間表現の例を示す図である。
【0020】例えば今、図16のような音声認識用ネッ
トワークにおいて“私はあさってのバーシアのコンサー
トのチケットが欲しい”という音声が認識されたものと
する。ここで図16において“私は”,“切符”のよう
な各ノードに付してある番号をID番号と呼ぶ。この“
私はあさってのバーシアのコンサートのチケットが欲し
い”という文の中間表現は図17のようになる。図17
の“欲しい”,“あさって”のような各音声認識用ネッ
トワーク中の単語に対応する中間表現内の表記をCPと
呼ぶ。また“受益”、“対象”のように各単語間の関係
を表している表記をCASEと呼ぶ。図17で#文体,
#名詞意味素性のように各CPの横に付与されている情
報を素性情報と呼ぶ。#文体は文型を、#時制は時間を
、#動詞意味分類は動詞の意味分類を、#名詞意味素性
は名詞の意味素性を、#数量は単数・複数を、#ていね
いさは文が丁寧文であることを表す。またそれぞれの{
}内の文字・数字は各素性情報の値を示す。本発明では
、例えば図3において、ネットワークにおけるある単語
と他の単語の間の意味的な関係と、ネットワークにおけ
る各単語に対する素性情報を記憶することにより音声認
識の結果から図17のような中間表現を作成するように
している。この結果、認識された文の時制や丁寧文,疑
問文等の文の種類を中間表現中に表すこができるように
なる。
【0021】また、文献2のようにATNのような音声
認識用ネットワークを用いる場合について考える。今、
図4のようなメインネットワーク及びサブネットワーク
を用いて認識するとする。図4(a)のメインネットに
おいて例えば“sub日時”というところで図4(b)
で示したサブネットワークに跳んでいる。このとき請求
項2の発明では、例えば図4(a)のネットワークに対
して図5に示すテーブルを、図4(b),(c),(d
)のネットワークに対してそれぞれ図6(a),(b)
,(c)に示すテーブルを用意する。図5のテーブル中
のCPの欄でサブネットを指定することによりサブネッ
ト用のテーブルを参照する。この結果、例えばATNの
ようにメインネットワーク及びそこから呼ばれるサブネ
ットワークがあるようなネットワークを用いた音声認識
結果からも図17のような中間表現を作成することがで
きる。
【0022】また、図7のような音声認識ネットワーク
において例えば入力音声が“私はチケットを1枚欲しい
”であるときこの中間表現は図8(a)のようになり、
チケットは1枚なのでCP“チケット”の素性情報のう
ち#数量の値は単数をあらわすSINとなる。しかし、
もし入力音声が“私はチケットを2枚欲しい”であると
きこの中間表現は図8(b)のようになり、チケットは
2枚なのでCP“チケット”の素性情報のうち#数量の
値は複数をあらわすPLとなる。
【0023】このとき請求項3の発明では、“1枚”や
“2枚”のようなCPの情報がその親のCP“チケット
”の素性情報を決定するので、図9の“親付与情報”の
欄のようにその親のCPの素性情報に付与する情報を記
憶する。この結果、ある単語が認識されたときに他の単
語に素性情報を付与するような場合でも図7のようなネ
ットワークの中間表現を作成することができるようにな
る。
【0024】ところで、例えば図3の素性情報の欄の記
述のうち#名詞意味素性や#動詞意味分類の値は“私”
や“チケット”のような単語に固有な情報である。した
がって、請求項4の発明では、辞書中にそれぞれの素性
情報を記述しておきこの辞書を参照して#名詞意味素性
や#動詞意味分類のような情報を補う。この結果テーブ
ルの記述が簡素化し、テーブルの記憶容量も削減できる
ようになる。
【0025】また、例えば日本語の場合、文の主語が省
かれることが多い。図10のネットワークの認識結果の
一つである“あさってのバーシアのコンサートのチケッ
トが欲しい”という音声が入力されたものとする。この
中間表現は図17と同じにならなければならないがCP
“私”に相当する単語が認識結果に存在しない。このと
き請求項5の発明では、音声中では省略されているが中
間表現中に必要なCPを補わなければならないので、例
えば図11のようにID番号の欄がDであるものをディ
フォルトで補うものとする。この結果、音声認識結果に
は存在しないが中間表現作成に必ず必要な単語を補い、
図17のような中間表現が作成できるようになる。
【0026】また、例えば図12のような音声認識用ネ
ットワークがあるとする。今、入力文が例えば“私はバ
ーシアのチケットが欲しい”の場合について考える。こ
の場合意味的には“私はバーシアのコサートのチケット
が欲しい”といっており。“コンサート”という単語が
省略されている。このとき中間表現は図13(a)のよ
うになる。
【0027】また、入力文が例えば“私は夢の遊眠社の
チケットが欲しい”であるとする。この場合意味的には
“私は夢の遊眠社の演劇のチケットが欲しい”といって
おり、“演劇”という単語が省略されている。このとき
中間表現は図13(b)のようになる。このとき請求項
6の発明では、ある特定の単語が認識されたときにその
単語ごとに異なった意味を補うものとする。この結果、
ある特定の単語が認識された際に適切な単語を補い正し
い中間表現を作成することができるようになる。
【0028】また、図15のような音声認識用ネットワ
ークがある場合について考える。このネットワークは例
えば“私はバーシアのコンサートのチケットが欲しい”
という入力文も、“バーシアのコンサートのチケットが
欲しい”という“私は”という単語が省略された入力文
も受けつける。この中間表現はいずれも図13(a)の
ようになる。
【0029】このとき請求項5の発明を用いて“私”と
いうCPをディフォルトで補うと音声認識結果中に“私
は”が省略された場合は問題ないが、音声認識結果中に
“私は”が存在する場合に、“欲しい”と’私”の関係
が受益であることを示す木を2本持った誤った中間表現
を作成してしまう。
【0030】したがって請求項7の発明では、ある特定
の単語が認識された場合に中間表現の一部を削除して意
味表現作成するものとする。この結果、音声認識結果中
である単語が現われる場合と省略される場合の両方があ
る場合も正しい中間表現を作成することができるように
なる。
【0031】
【実施例】次に、本発明による連続音声認識方式の実施
例について図面を参照して説明する。
【0032】まず、請求項1の発明の一実施例について
説明する。図1は本発明の一実施例を示す構成図である
。図1において、音声入力部101は入力音声をデジタ
ル信号にして分析を行ない、特徴ベクトルの時系列を求
めて連続音声認識部104にその結果を出力する。ネッ
トワーク記憶部102は音声認識の際に認識対象となる
文または単語列を記憶する。ネットワーク中に付された
番号はネットワーク中の各単語を表すアークのID番号
である。図16は図1におけるネットワーク記憶部10
2に記憶される認識用ネットワークの一例を示すもので
ある。このようなネットワークを始端から終端までたど
ることができた時、入力音声はこのネットワークにて受
理されたとする。例えば図16の場合は“私はあすのバ
ーシアのライブの切符が欲しい”、“私はしあさっての
バンヘーレンのコンサートの切符がいい”などの入力音
声を受理することができる。単語標準パターン記憶部は
認識対象の単語の音声の標準パターンをあらかじめ記憶
しており、単語標準パターン記憶部103には、ネット
ワーク中の単語の標準パターンを記憶している。この標
準パターンは例えば音節のようなより小さな単位を連結
したものでも良い。
【0033】連続音声認識部104は上記のネットワー
クをたどることにより生成される単語列に従い単語標準
パターン記憶部103に記憶されている標準パターンを
連結し、音声入力部101から受けとった入力音声の特
徴ベクトルの時系列とのパターンマッチングを行なうこ
とにより入力音声と最も音響的類似性の高い単語列を選
択する。連続音声認識部104はこの単語列を表す各単
語のアークのIDの列を認識結果として中間表現生成部
106に出力する。中間表現生成部106に入力された
アークのID列と意味関係記憶部105の記憶内容より
中間表現を作成して出力する。
【0034】次に、中間表現生成部106の処理につい
て説明する。今、入力音声が“私はあさってのバーシア
のコンサートのチケットが欲しい”であるとする。この
とき図16に示したアークのID番号より音声認識結果
として“1,3,5,6,10,11,13,15,1
6,17”というアークIDの列が中間表現生成部10
6に渡される。中間表現生成部106では図3の情報と
アークのID列より中間表現を作成する。まずアークI
D番号の列の先頭の1に対して図3のテーブルを検索す
ると、ID番号1の欄の親ID番号が17,18,19
である。この中でアークのID列中にあるのは17番な
ので、中間表現の親は“欲しい”で、またCASEの欄
から“受益”の関係であることが分かる。また、素性情
報の欄から“#名詞意味素性,111”という素性がこ
の文の中間表現中の“私”のところに付与される。以上
のような処理を繰り返すことにより図17のような中間
表現が得られる。
【0035】次に請求項2の発明の一実施例について説
明する。請求項2の発明の一実施例は図1における意味
関係記憶部105中に音声認識用のネットワーク及び各
ネットワークから呼ばれるサブネットワーク中の単語の
意味情報,素性情報を記憶して中間表現を作成する。図
4(a)は音声認識に用いるメインネットワークで、図
4(b),図4(c),図4(d)がメインネットワー
クから呼ばれるサブネットワークである。例えば図4(
b)はサブネット“日時”でメインネット中のアークI
D番号2のところで呼ばれる。
【0036】今、入力文が“私はあさってのバーシアの
コンサートのチケットが欲しい”であるとする。すると
音声認識結果のアーク番号の列は図4(a)〜(d)に
よって“1,2(2),3,4(1),5,6,8,1
0,11,12(1)”となる。ここで例えば“4(1
)”とあるのは、メインネットの4番のアークからサブ
ネットの1番のアークが呼ばれるという意味である。こ
の場合図5のID番号4の行のサブの欄からアーチスト
名のサブネットが呼ばれていることが分かり、図6(b
)の内容からCPが“バーシア”で素性情報が#名詞意
味素性,111であることが分かる。また、図5のID
番号4の行で親ID番号に11,12とあり、認識結果
のID列中に“12(1)”があるので、図6(c)か
らCP“欲しい”を指し、CASEの欄から“バーシア
”と“欲しい”は所有の関係であることが分かる。以上
のような処理を繰り返すことにより図17のような中間
表現が得られる。この他の処理は請求項1の発明の一実
施例と全く同じである。この結果、ネットワーク及びネ
ットワークから呼ばれるサブネットワークを用いた音声
認識の結果から中間表現を作成することができる。
【0037】次に請求項3の発明の一実施例について説
明する。請求項3の発明の一実施例は図1における意味
関係記憶部105中に他の単語に付与する素性情報も記
憶しこの情報も用いて中間表現を作成する。
【0038】例えば、入力音声が“私はチケットを1枚
欲しい”であったとする。すると音声認識結果のアーク
のID列は図7において“1,2,4,5,8”となる
。このとき、アーク番号5のものは図9のID番号5の
行からCPが“1枚”であり、その親はアークID列中
に“2”があるため“チケット”であることが分かる。 また、親付与情報の欄から親CPとなる“チケット”に
素性情報“#NUMBER,{SIN}”を付与するこ
とが分かる。このような処理の結果、図8(a)のよう
な中間表現を作成することができる。この他の処理は請
求項1の発明の一実施例と全く同じである。
【0039】次に請求項4の発明の一実施例について説
明する。図2は本発明の他の実施例を示す構成図である
。本実施例では、素性情報を意味関係記憶部205から
だけでなく、単語辞書記憶部207の内容も用いて各単
語に付与することにより中間表現を作成する。例えば、
#名詞意味素性,#動詞意味分類等の素性情報は単語ご
とに常に同じであるので、意味関係記憶部205中に記
述しなくても単語辞書記憶部207の情報を用いること
で単語の素性情報として付与する。この他の処理は請求
項1の発明の一実施例と全く同じである。
【0040】次に請求項5の発明の一実施例について説
明する。
【0041】例えば図10のようなネットワークにおい
て入力文が“あさってのバーシアのコンサートのチケッ
トが欲しい”であるとする。するとアークID番号の列
は“2,4,5,9,10,12,14,15,16”
となる。また、意味関係記憶部の内容が図11に示した
ものであるとする。ここでID番号の値がDとなってい
る行は音声認識の結果に関わらず無条件で中間表現作成
に用いるとする。今“私”というCPがある行のID番
号の欄が“D”なので、この行の内容も中間表現作成に
使用する。その結果図17に示したような正しい中間表
現を作成することができる。この他の処理は請求項1の
発明の一実施例と全く同じである。
【0042】次に請求項6の発明の一実施例について説
明する。
【0043】例えば図12のようなネットワークにおい
て入力文が“私はバーシアのチケットが欲しい”である
とする。するとアークID番号の列は“1,2,4,5
,7,8”となる。また意味関係記憶部の内容が図14
に示したものであるとする。ここでオンノードという欄
は、この欄の中に記述した番号のアークが音声認識結果
にあるとき、この行の内容を中間表現作成に用いるとす
る。このときアークID番号列中に“2”があるので、
ID番号が“onl”である行の内容も中間表現作成に
使用し、その結果、図13(a)に示したような正しい
中間表現を作成することができる。この他の処理は請求
項1の発明の一実施例と全く同じである。
【0044】次に請求項7の発明の一実施例について説
明する。図18は図15におけるネットワーク用の意味
関係記憶部の内容の一例を示す図、図19は図15にお
けるネットワークの中間表現の例を示す図である。
【0045】例えば図15のようなネットワークにおい
て入力文が“私はバーシアのコンサートのチケットが欲
しい”であるとする。するとアークID番号の列は“1
,2,4,5,7,8,10,11”となる。また意味
関係記憶部が図18に示したものであるとする。ここで
オフノードという欄は、この欄の中に記述した番号のア
ークが音声認識結果にあるとき、たとえ同じ行内のID
番号が“D”となっていてもこの行の内容を中間表現作
成に用いないものとする。今、図18の1番上の行はI
D番号が“D”となっているがオフノードの欄に“1”
とあり、音声認識結果のアークID番号列中に“1”が
あるのでこの行の情報は使用しない。その結果、図19
のような中間表現が得られる。
【0046】また入力文が“バーシアのコンサートのチ
ケットが欲しい”であるとする。するとアークID番号
の列は図15において“2,4,5,7,8,10,1
1”となる。今、図18の1番上の行はID番号が“D
”となっているためこの行の内容も使用し、その結果、
図19のような中間表現が得られる。このように本実施
例では、ネットワーク内にて省略したりしなかったりす
る要素がある場合も正しく中間表現を作成することがで
きる。この他の処理は請求項1の発明の一実施例と全く
同じである。
【0047】
【発明の効果】以上述べたように本発明の連続音声認識
方式によれば、音声認識の際により自然で多様な文を認
識し、かつその意味表現を出力することができるという
効果が得られる。
【図面の簡単な説明】
【図1】本発明の一実施例を示す構成図である。
【図2】本発明の他の実施例を示す構成図である。
【図3】図1における意味関係記憶部の内容の一例を示
す図である。
【図4】音声認識用ネットワークの第1の例を示す図で
ある。
【図5】図4におけるメインネットワーク用の意味関係
記憶部の内容の一例を示す図である。
【図6】図4におけるサブネットワーク用の意味関係記
憶部の内容の一例を示す図である。
【図7】音声認識用ネットワークの第2の例を示す図で
ある。
【図8】図7におけるネットワークの中間表現の例を示
す図である。
【図9】図7におけるネットワーク用の意味関係記憶部
の内容の一例を示す図である。
【図10】音声認識用ネットワークの第3の例を示す図
である。
【図11】図10におけるネットワーク用の意味関係記
憶部の内容の一例を示す図である。
【図12】音声認識用ネットワークの第4の例示す図で
ある。
【図13】図12におけるネットワークの中間表現の例
を示す図である。
【図14】図12におけるネットワーク用の意味関係記
憶部の内容の一例を示す図である。
【図15】音声認識用ネットワークの第5の例を示す図
である。
【図16】音声認識用ネットワークの第6の例を示す図
である。
【図17】図16におけるネットワークの中間表現の例
を示す図である。
【図18】図15におけるネットワーク用の意味関係記
憶部の内容の一例を示す図である。
【図19】図15におけるネットワークの中間表現の例
を示す図である。
【符号の説明】
101,201    音声入力部 102,202    ネットワーク記憶部103,2
03    単語標準パターン記憶部104,204 
   連続音声認識部105,205    意味関係
記憶部106,206    中間表現生成部207 
   単語辞書記憶部

Claims (7)

    【特許請求の範囲】
  1. 【請求項1】  連続音声認識対象の文法を表現する単
    語に関するネットワークを記憶する第1の記憶手段と、
    単語の標準パターンを前記ネットワークにしたがって結
    合して連続音声を認識する連続音声認識手段と、前記ネ
    ットワークにおけるある単語と他の単語の間の意味的な
    関係及び各単語に対する素性情報を記憶する第2の記憶
    手段と、前記連続音声認識手段から生じる認識結果及び
    前記第2の記憶手段からその中間表現を出力する出力手
    段とを備えることを特徴とする連続音声認識方式。
  2. 【請求項2】  前記連続音声認識手段はあらかじめ定
    められた認識単位の標準パターンを前記ネットワーク及
    び各ネットワークから呼ばれるサブネットワークにした
    がって結合して連続音声を認識し、前記第1の記憶手段
    は連続音声認識対象の文法を表現するネットワーク及び
    各ネットワークから呼ばれるサブネットワークを記憶し
    、前記出力手段は前記連続音声認識手段から生じる認識
    結果及び前記第2の記憶手段のある単語と他の単語の間
    の意味的な関係及び前記ネットワーク及びサブネットワ
    ーク内の各単語に対する素性情報からその中間表現を出
    力することを特徴とする請求項1記載の連続音声認識方
    式。
  3. 【請求項3】  ある単語が認識された時に、他の単語
    に付与する素性情報を記憶する前記第2の記憶手段と、
    前記情報を前記中間表現に付与する付与手段とを備える
    ことを特徴とする請求項1または2記載の連続音声認識
    方式。
  4. 【請求項4】  ある単語が認識された時に、その単語
    に付与する素性情報を単語辞書記憶部から取り出し、前
    記付与手段は前記情報を前記中間表現に付与することを
    特徴とする請求項1または2もしくは3記載の連続音声
    認識方式。
  5. 【請求項5】  前記単語辞書記憶部は連続音声認識対
    象の文法を表現するネットワーク内に存在しないが中間
    表現を作成するために必ず必要な単語を記憶し、前記出
    力手段は前記情報をもとに中間表現を作成して出力する
    ことを特徴とする請求項1乃至4のいずれかに記載の連
    続音声認識方式。
  6. 【請求項6】  前記単語辞書記憶部は連続音声認識対
    象の文法を表現するネットワーク内のある特定の単語が
    認識された際に補う単語を記憶し、前記出力手段は前記
    情報をもとに中間表現を作成して出力することを特徴と
    する請求項1乃至5のいずれかに記載の連続音声認識方
    式。
  7. 【請求項7】  前記単語辞書記憶部は連続音声認識対
    象の文法を表現するネットワーク内のある特定の単語が
    認識された際に削除すべき連続音声認識対象の文法を表
    現するネットワーク中の特定の単語を記憶し、前記出力
    手段は前記情報をもとに中間表現を作成して出力するこ
    とを特徴とする請求項1乃至6のいずれかに記載の連続
    音声認識方式。
JP3010234A 1991-01-30 1991-01-30 連続音声認識方式 Expired - Fee Related JP2817406B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP3010234A JP2817406B2 (ja) 1991-01-30 1991-01-30 連続音声認識方式

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP3010234A JP2817406B2 (ja) 1991-01-30 1991-01-30 連続音声認識方式

Publications (2)

Publication Number Publication Date
JPH04253099A true JPH04253099A (ja) 1992-09-08
JP2817406B2 JP2817406B2 (ja) 1998-10-30

Family

ID=11744610

Family Applications (1)

Application Number Title Priority Date Filing Date
JP3010234A Expired - Fee Related JP2817406B2 (ja) 1991-01-30 1991-01-30 連続音声認識方式

Country Status (1)

Country Link
JP (1) JP2817406B2 (ja)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2005351980A (ja) * 2004-06-08 2005-12-22 Canon Inc 音声認識文法作成装置、音声認識文法作成方法、プログラムおよび記憶媒体

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2005351980A (ja) * 2004-06-08 2005-12-22 Canon Inc 音声認識文法作成装置、音声認識文法作成方法、プログラムおよび記憶媒体
JP4579585B2 (ja) * 2004-06-08 2010-11-10 キヤノン株式会社 音声認識文法作成装置、音声認識文法作成方法、プログラムおよび記憶媒体

Also Published As

Publication number Publication date
JP2817406B2 (ja) 1998-10-30

Similar Documents

Publication Publication Date Title
US6067514A (en) Method for automatically punctuating a speech utterance in a continuous speech recognition system
US5832428A (en) Search engine for phrase recognition based on prefix/body/suffix architecture
US6910012B2 (en) Method and system for speech recognition using phonetically similar word alternatives
US7072837B2 (en) Method for processing initially recognized speech in a speech recognition session
KR100996817B1 (ko) 문자 대 음성 변환을 위한 상호 정보 기준을 이용한 큰 그라포넴 단위의 생성
US6801897B2 (en) Method of providing concise forms of natural commands
US6067520A (en) System and method of recognizing continuous mandarin speech utilizing chinese hidden markou models
US7529657B2 (en) Configurable parameters for grammar authoring for speech recognition and natural language understanding
Souvignier et al. The thoughtful elephant: Strategies for spoken dialog systems
JP3481497B2 (ja) 綴り言葉に対する複数発音を生成し評価する判断ツリーを利用する方法及び装置
US5995931A (en) Method for modeling and recognizing speech including word liaisons
KR100726875B1 (ko) 구두 대화에서의 전형적인 실수에 대한 보완적인 언어모델을 갖는 음성 인식 디바이스
US7302381B2 (en) Specifying arbitrary words in rule-based grammars
KR100930714B1 (ko) 음성인식 장치 및 방법
US6772116B2 (en) Method of decoding telegraphic speech
JPH10247194A (ja) 自動通訳装置
KR102299269B1 (ko) 음성 및 스크립트를 정렬하여 음성 데이터베이스를 구축하는 방법 및 장치
JP2003162524A (ja) 言語処理装置
JP3059413B2 (ja) 自然言語理解装置及び自然言語理解システム
JPH04253099A (ja) 連続音声認識方式
JP2001013992A (ja) 音声理解装置
JPH08263499A (ja) 自動翻訳装置及び自動通訳装置
López-Cózar et al. Testing dialogue systems by means of automatic generation of conversations
KR20030010979A (ko) 의미어단위 모델을 이용한 연속음성인식방법 및 장치
JP2000330588A (ja) 音声対話処理方法、音声対話処理システムおよびプログラムを記憶した記憶媒体

Legal Events

Date Code Title Description
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 19980721

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20070821

Year of fee payment: 9

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20080821

Year of fee payment: 10

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20080821

Year of fee payment: 10

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20090821

Year of fee payment: 11

LAPS Cancellation because of no payment of annual fees