JPH1173419A - 電子文書の検索方法及び装置 - Google Patents

電子文書の検索方法及び装置

Info

Publication number
JPH1173419A
JPH1173419A JP9232004A JP23200497A JPH1173419A JP H1173419 A JPH1173419 A JP H1173419A JP 9232004 A JP9232004 A JP 9232004A JP 23200497 A JP23200497 A JP 23200497A JP H1173419 A JPH1173419 A JP H1173419A
Authority
JP
Japan
Prior art keywords
search
word
keyword
recognition
weight
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP9232004A
Other languages
English (en)
Inventor
Otoya Shirotsuka
音也 城塚
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
N T T DATA KK
NTT Data Group Corp
Original Assignee
N T T DATA KK
NTT Data Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by N T T DATA KK, NTT Data Corp filed Critical N T T DATA KK
Priority to JP9232004A priority Critical patent/JPH1173419A/ja
Publication of JPH1173419A publication Critical patent/JPH1173419A/ja
Pending legal-status Critical Current

Links

Landscapes

  • Machine Translation (AREA)
  • Document Processing Apparatus (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

(57)【要約】 【課題】 検索目的に適合する電子文書を音声入力によ
って高精度に検索することができる文書検索装置を提供
する。 【解決手段】 入力音声から認識した一つまたは複数の
キーワード候補に対して認識尤度と認識時刻とを付与す
る。重み情報付与部22は、この認識尤度と認識時刻か
らの経過時間とによってキーワード候補毎の検索重みを
算出する。同一のキーワード候補については、単語マー
ジ部24が検索重みをマージする。単語決定部25は、
最も検索重みが高いキーワード候補を検索キーワードと
して特定し、文書管理部30に出力する。文書管理部3
0は、この検索キーワードに基づいて電子文書毎の検索
重み付き単語重要度を算出し、最も検索重み付き単語重
要度が高くなる電子文書を電子文書DB40から索出す
る。

Description

【発明の詳細な説明】
【0001】
【発明の属する技術分野】本発明は、連続的に入力され
る音声や文字等の認識結果に基づいて電子文書を検索す
る方法及びこの方法の実施に適した文書検索装置に関す
る。
【0002】
【従来の技術】キーボードやペンを通じて入力されたキ
ーワードに関連した一つまたは複数の電子文書をディス
プレイ等に表示させる文書検索装置が知られている。こ
のような文書検索装置は、パーソナルコンピュータによ
るファイル検索装置や、インターネット上のWWW(Wo
rld Wide Web)のページ検索装置に応用されている。こ
の種の文書検索装置は、図10に示すように、検索対象
となる複数の電子文書を蓄積した電子文書データベース
(以下、電子文書DB)40と、操作者から検索に用い
るキーワード(以下、検索キーワード)の入力を受け付
けるキーワード入力部60と、この検索キーワードに基
づいて電子文書DB40から該当する電子文書を索出す
る文書管理部70とを備えて構成される。文書管理部7
0は、電子文書DB40に蓄積されている各電子文書の
インデックスファイルとして機能する検索情報テーブル
31と、外部からの新たな電子文書を電子文書DB40
に蓄積するための文書入力部33とを含んで構成されて
いる。
【0003】
【発明が解決しようとする課題】従来の文書検索装置2
では、キーボードやペンを使用して検索キーワードを入
力する必要があったため、ある手作業を行っている最中
に、補助的に電子文書の検索が必要となる場合は、本来
の作業が中断されてしまう。
【0004】この点を改善するため、音声認識技術を利
用してキーワード情報を入力することで、キーボード等
による入力作業を不要にする検索手法が提案されてい
る。この検索手法では、文音声、すなわち文法的に正し
い文を読み上げた音声、またはそれと同等の内容の音声
を認識して、その内容を言語的に解析し、解析結果を電
子文書DB40への問い合わせ用言語で表現された検索
式に変換して文書検索を行う。予め登録した単語と同一
の検索キーワードを連続的に入力された音声中から検出
する手法が採用される場合もある。
【0005】しかし、文音声を認識して検索キーワード
を特定することは、発声される可能性のある単語をすべ
て正確に認識することが必要となるため、実用性の点で
問題があった。また、文音声が連続的に入力された場合
は、音声中の単語が正しく認識されないまま検索キーワ
ードが特定されてしまう場合があり、検索精度を高める
ことができないという問題があった。
【0006】そこで、本発明の課題は、連続的に入力さ
れたキーワード情報から検索キーワードを正確に認識し
て電子文書の検索精度を高める改良された検索方法を提
供することにある。本発明の他の課題は、上記検索方法
の実施に適した文書検索装置を提供することにある。
【0007】
【課題を解決するための手段】上記課題を解決する本発
明の検索方法は、コンピュータ等の電子装置において下
記の処理過程を含むことを特徴とする。 (1)文音声等のキーワード情報から複数の単語を認識
する過程、(2)認識された個々の単語に、当該認識の
確からしさを表す認識尤度と認識時点からの経過時間と
に基づく検索重みを付加するとともに、同一単語が複数
認識された場合は単語同士の検索重みをマージする過
程、(3)前記検索重みが相対的に大きい単語を検索キ
ーワードとして特定する過程、(4)検索対象となる複
数の電子文書の各々について、前記特定した検索キーワ
ードの検索重みと当該検索キーワードがどれだけ重要な
単語かどうかを表す単語重要度とに基づいて検索重み付
き単語重要度を決定し、この検索重み付き単語重要度が
最も高い電子文書を特定する過程。
【0008】なお、前記検索重みは、前記認識尤度に比
例して大きくなり、前記経過時間が長くなるにつれて小
さくなるものである。
【0009】また、上記他の課題を解決する本発明の文
書検索装置は、検索対象となる電子文書を蓄積した電子
文書蓄積手段と、検索時に入力されるキーワード情報か
ら複数の単語を認識するとともに個々の単語に認識の確
からしさを表す認識尤度と認識時刻とを付加して出力す
る単語認識手段と、前記認識された複数の単語の少なく
とも一つを検索キーワードとして特定するキーワード特
定手段と、特定した検索キーワードを用いて前記電子文
書蓄積手段から該当する電子文書を索出する検索手段と
を備え、前記キーワード特定手段が、前記認識尤度と認
識時点からの経過時間の少なくとも一方に基づいて検索
目的に応じた検索重みを作成し、作成した検索重みが相
対的に高い単語を優先的に前記検索キーワードとするよ
うに構成されていることを特徴とする。
【0010】本発明の他の文書検索装置は、上述の電子
文書蓄積手段、単語認識手段、キーワード特定手段のほ
か、前記特定された検索キーワードの検索重みと当該検
索キーワードが各電子文書にとってどれだけ重要な単語
かどうかを表す単語重要度とを積算して検索重み付き単
語重要度を電子文書毎に算出し、算出した検索重み付き
単語重要度がより高い電子文書を前記電子文書蓄積手段
から索出する検索手段と、を備えて構成されていること
を特徴とする。
【0011】本発明の他の文書検索装置は、上記各文書
検索装置において、前記キーワード情報が、連続的に発
話された文音声であり、前記単語認識手段が前記文音声
の無音区間を区切りとして繰り返し音声認識を行うよう
に構成されていることを特徴とする。この場合、前記単
語認識手段は、予め前記電子文書に含まれる単語をリス
ト化しておき、各リスト化された単語を用いて音声認識
を行うように構成される。
【0012】
【発明の実施の形態】以下、本発明を連続音声入力型の
文書検索装置に適用した場合の実施の形態を詳細に説明
する。図1は、本発明の一実施形態に係る文書検索装置
の構成図である。この文書検索装置1は、連続して入力
される文音声の認識を行う単語認識部10と、単語認識
部10の出力結果に基づいて検索キーワードを特定する
キーワード特定部20と、検索キーワードに基づいて電
子文書の検索処理を行う文書管理部30と、検索対象と
なる大量の電子文書を蓄積した電子文書DB40と、検
索結果を利用者に提示する出力部50とを含んで構成さ
れる。なお、図10に示した従来型装置と同一機能の構
成要素については同一符号を付してある。
【0013】単語認識部10は、入力された音声中の無
音区間を検出して有声音区間を抽出する前処理部11、
予め検索対象となる文書群のそれぞれを代表する単語を
リスト化した単語リスト13、及び、前処理部11の出
力結果と単語リスト13とを用いて音声認識を行う音声
認識部12を備えて構成される。音声認識部12は、無
音区間を区切りに繰り返し音声認識を行うことにより、
先行入力された音声に続いて入力される音声(付加説
明、詳細化説明、訂正等の発声音)に対して継続的に単
語を認識して出力できるようになっている。
【0014】キーワード特定部20は、単語認識部10
から出力される処理結果を受けるパラメータ取得部2
1、処理結果に検索重みを付与する重み情報付与部2
2、重み情報付与部22において検索重みを付与された
単語を保存する単語保存部23、単語同士及びその検索
重みのマージを行う単語マージ部24、及び、各単語に
付与された検索重みを比較することにより一つまたは複
数の検索キーワードを特定する単語特定部25を備えて
構成される。
【0015】文書管理部30は、特定された検索キーワ
ードを受けて適当な電子文書を電子文書DB40から検
索するための検索情報テーブル31、索出する電子文書
を特定するための情報である検索重み付き単語重要度を
処理する重要度決定部32、及び、電子文書を入力する
文書入力部33を有し、図示しない検索エンジンによっ
て索出された電子文書を出力部50に出力する。
【0016】次に、図2〜図9を参照して各部の処理手
順を説明する。図2は、単語認識部10における処理手
順図である。ここでは、図4(a),(b)に示される
内容の文音声が、ポーズで区切られて連続的に入力され
たとする。単語認識部10では、まず、図4(a)の内
容の文音声が入力されると(ステップS101:Ye
s)、前処理部11において音声中の無音区間を検出し
(ステップS102)、有声音区間を抽出する(ステッ
プS103)。その後、抽出した有声音区間での音声の
特徴を抽出する(ステップS104)。音声認識部12
では、抽出した個々の音声特徴と単語リスト13とを照
合し、検索キーワードとして使用される可能性のある単
語(以下、キーワード候補)を認識するとともに、各キ
ーワード候補の認識尤度と認識時点からの経過時間を計
算する(ステップS105,S106)。
【0017】図5(a)は、図4(a)の内容の文音声
から認識されたキーワード候補とその認識尤度、経過時
間の例を示すものである。ここでは、文音声中に、「ス
ノーボード」、「スキー場」、「高速」、「中央道」の
単語が含有されているが、キーワード候補として正確に
認識されたのは「スノーボード」と「高速」のみであ
り、「スキー場」については脱落し、「出来高」につい
ては挿入誤りによって認識されている。また、「中央
道」が誤認識された結果、「中部地方」が得られてい
る。認識尤度は「スノーボード」については“0.9
6”、「出来高」については“0.64”、「高速」に
ついては“0.70”、「中部地方」については“0.
72”となっている。また、経過時間は、「スノーボー
ド」を基準としてそこからの時間が計算されている。
【0018】以上の処理を、図4(b)の内容の文音声
についても繰り返す(ステップS107:Yes)。その
結果、図5(b)のような認識結果が得られる。図5
(b)を参照すると、2回目に入力された文音声につい
ては、すべて正しく認識され、「諏訪インター」、「ス
ノーボード」というキーワード候補が得られている。な
お、こでの経過時間は、1回目の文音声に含まれる「ス
ノーボード」が基準となっている。
【0019】検索キーワード候補の認識が終了した場
合、単語認識部10は、各キーワード候補に、それぞれ
認識尤度と認識時刻とを付加してキーワード特定部20
に出力する(ステップS108)。
【0020】図3は、キーワード特定部20における処
理手順図である。キーワード特定部20では、単語認識
部10から出力された各キーワード候補の認識尤度と経
過時間とをパラメータ取得部21で取得して重み情報付
与部22に入力する(ステップS201)。
【0021】重み情報付与部22では、各検索キーワー
ドの検索重みを計算する(ステップS202)。すなわ
ち、各キーワード候補の認識尤度をLとすると、この認
識尤度Lに基づく検索重みSWを、予め検索目的に応じ
て決定された重み係数αと認識尤度Lとの乗算によって
計算する。また、各キーワード候補に付与された経過時
間をもとに、認識時点から現在までの時間経過が長いほ
ど検索重みが減少するような重み付けを行う。ここで
は、新たに認識されたキーワード候補のみならず、過去
に認識されたキーワード候補の検索重みに対しても再び
重み付けを行う。この場合の重み付けは、例えば、重み
付け前後の検索重みをそれぞれBW及びAW、時間をT
とすると、「AW=(β・BW)の−γT乗(β、γは
重み係数)」、あるいは「AW=β・BW/γT」等の
計算式によって求めることができる。
【0022】図6(a)は、最初の文音声から認識され
た各キーワード候補の検索重み、図6(b)は、2回目
に入力された文音声から認識された各キーワード候補の
検索重みを示す図である。また、図7は、過去に認識さ
れたキーワード候補の検索重みに対して再び重み付けが
なされた結果を示す図である。図7から明らかなよう
に、最初の文音声から認識された4つのキーワード候補
の検索重みは、2回目の文音声からキーワード候補が認
識されるまでに一定時間が経過しているので、それぞれ
図6(a)に示した検索重みよりも一律に小さくなって
いる。
【0023】単語マージ部24は、過去に認識されたキ
ーワード候補の中に、新たに認識したキーワード候補と
同一のものが存在するかどうかを調査し、存在する場合
は(ステップS203:Yes)、そのキーワード候補同
士をマージして検索重みの再計算を行う(ステップS2
04,S205)。すなわち、検索重みをさらに大きく
する。本例では、「スノーボード」が共通して認識され
たため、これをマージする。マージ後の検索重みは、例
えば、同一キーワード候補のそれぞれの検索重みの加算
値に所定の重み係数を乗算することによって求める。本
例の場合、最初に文音声から認識された「スノーボー
ド」の検索重みをW1、2回目の「スノーボード」の検
索重みをW2とすると、マージ後の検索重みMWは、
「δ(W1+W2)(但し、δは重み係数)」の計算式
より求めることができる。検索重みの再計算が終了した
場合、あるいはステップS203において同一キーワー
ド候補がなかった場合(ステップS203:No)は、検
索重みが付与された各キーワード候補を、単語保存部2
3で保存しておく(ステップS206)。
【0024】図8は、本例の場合に保存されるキーワー
ド候補及びその検索重みを示したものである。単語特定
部23は、この保存された各キーワード候補の検索重み
を評価し(ステップS207)、検索重みが相対的に大
きいキーワード候補を検索キーワードとして特定して文
書管理部30に出力する(ステップS208)。このよ
うにして特定された検索キーワードは、検索目的に最も
適合すると推定されるものである。
【0025】例えば、本例では、「スノーボード」が、
2回の音声入力時にいずれも認識されており、利用者が
特に関心を持っていることが推定される。この場合の検
索重みは、最初の値“0.92”から2回目には上記マ
ージ処理によって“1.57”に大きくなっている。一
方、単語認識部10が誤って認識した「出来高」、「中
部地方」は、最初の音声入力時には、それぞれ認識尤度
“0.62”、“0.72”であったが、2回目の音声
入力時には認識されなかったため、検索重みが、「出来
高」については“0.62”から“0.56”へ、「中
部地方」については“0.72”から“0.68”へと
低下したままとなっており、誤った単語認識がもたらす
検索結果への悪影響を軽減する働きをしている。このよ
うに、認識時点からの経過時間や複数回の認識結果等を
パラメータとすることで、検索重みが自動的に検索目的
に向けて学習されるようになり、キーワード候補をすべ
て正確に認識しなくとも、所要の検索目的を達成するこ
とが容易になる。
【0026】結局、本例では、図8に示されるように、
「スノーボード」の検索重みが“1.57”になってお
り、これが相対的に最も高い検索重みとなっているの
で、この「スノーボード」が検索キーワードとして文書
管理部30に出力される。
【0027】図4は文書管理部30における処理手順図
である。文書管理部30では、キーワード特定部20
で、検索キーワードとして特定された「スノーボード」
を取得し(ステップS301)、この「スノーボード」
に適合する電子文書を検索する。このとき、重要度決定
部32において、検索対象となる複数の電子文書の各々
について検索重み付き単語重要度を求める。
【0028】すなわち、検索情報テーブル31を通じて
電子文書DB40から最初の電子文書を取り出し(ステ
ップS302)、検索キーワードがその電子文書にとっ
てどの程度重要な単語かどうかを表す単語重要度を算出
する(ステッップS303)。この単語重要度は、電子
文書における単語の出現頻度等によって定めることがで
きる。その後、この単語重要度とキーワード特定部20
において付与された当該検索キーワードの検索重みとを
積算して、検索重み付き単語重要度を求める(ステッッ
プS304)。この検索重み付き単語重要度WWIは、
検索キーワードの単語重要度をWI、検索キーワードに
付与された検索重みをSWとすると、例えば「e(WI
・SW)」の計算式によって算出することができる。た
だし「e」は重み係数である。
【0029】この処理を検索対象となるすべての電子文
書について繰り返した後(ステッップS305)、各検
索重み付き単語重要度を評価する(ステッップS30
6)。そして、検索重み付き単語重要度が最も高い電子
文書を索出し、これを出力部50に出力する(ステッッ
プS307)。このように、検索重み付き単語重要度に
基づいて検索処理を行うようにすることで、目的達成度
の高い電子文書を容易に索出できるようになる。
【0030】以上の説明のとおり、本実施形態の文書検
索装置1は、大量の電子文書が蓄積された電子文書DB
40から、必要な電子文書を説明するために人間に対し
て話すように連続的に発声された文音声を認識して目的
の電子文書を自動的に索出するので、利用者は、検索に
有効な検索キーワードを考えてこれをキーボード等から
入力する必要がなくなり、他の作業を行いながらの検索
が可能になる。
【0031】また、入力された文音声の内容に応じて、
刻々と文書の検索及び検索結果の提示を行うので、検索
結果が期待外れであって、新たに検索をやり直す場合
に、必要な情報についての説明音声を引き続き入力する
だけで、過去の認識結果を反映した検索結果が得られる
ようになる。
【0032】さらに、人間同士の対話音声をこの文書検
索装置1の入力とし、対話内容に関係する電子文書が検
索されて相手側に自動的に提示するような利用形態も可
能になり、人間同士の対話の円滑化に効果を発揮するこ
とができる。このような利用形態は、対面や音声入出力
機器を使用したオンラインの相談業務における自動ヘル
プ出力等に応用することができる。
【0033】なお、本実施形態では、連続的に入力され
る文音声から複数のキーワード候補を認識する例を示し
たが、本発明は、文音声のみならず、通常の文字認識や
パターン認識によってキーワード候補を特定する場合に
も同様に適用できるものである。
【0034】
【発明の効果】以上の説明から明らかなように、本発明
によれば、最初のキーワード情報が正確に認識できなか
った場合であっても、後続の関係キーワード情報を補充
的に入力するだけで検索目的を達成する上で有効となる
検索キーワードが正確に特定されるので、電子文書の検
索作業が容易になる効果がある。
【0035】また、検索対象となる複数の電子文書の各
々について、検索重み付き単語重要度を評価し、評価結
果が最も高い文書を索出するようにしたので、電子文書
の検索精度が高まる効果がある。
【0036】また、本発明の文書検索装置は、連続的に
発話された文音声もキーワード情報として用いることが
できるので、応用場面を音声入出力機器を用いたサービ
スシステムや、通信手段を用いたネットワークサービス
にまで拡大することができるようになる。さらに、単語
リストを用いて、文音声の無音区間を区切りに繰り返し
音声認識が行われるので、検出誤りが抑制される効果も
ある。
【図面の簡単な説明】
【図1】本発明の一実施形態に係る音声入力型文書検索
装置の機能ブロック図。
【図2】本実施形態における単語認識部の処理手順説明
図。
【図3】本実施形態におけるキーワード特定部の処理手
順説明図。
【図4】本実施形態における文書管理部の処理手順図。
【図5】(a)は最初の入力音声の内容、(b)は2回
目の入力音声の内容を示す説明図。
【図6】(a)は最初の入力音声の認識結果、(b)は
2回目の入力音声の認識結果を示す図表。
【図7】2回目の認識結果に対する検索重みを算出する
際に再計算された最初の認識結果(過去のキーワード候
補)の検索重みを示す図表。
【図8】単語保存部に保存されるキーワード候補とその
検索重みを示す図表。
【図9】本実施形態における文書管理部の処理手順図。
【図10】従来の文書検索装置の機能ブロック図。
【符号の説明】
1 本実施形態による音声入力型文書検索装置 2 従来の文書検索装置 10 単語認識部 11 前処理部 12 音声認識部 13 単語リスト 20 キーワード特定部 21 パラメータ取得部 22 重み情報付与部 23 単語保存部 24 単語マージ部 25 単語決定部 30、70 文書管理部 31 検索情報テーブル 32 重要度決定部 33 文書入力部 40 電子文書データベース(DB) 50 出力部 60 キーワード入力部
───────────────────────────────────────────────────── フロントページの続き (51)Int.Cl.6 識別記号 FI G06F 15/40 370A 15/403 310Z

Claims (10)

    【特許請求の範囲】
  1. 【請求項1】 キーワード情報から複数の単語を認識す
    る過程と、 認識された個々の単語に、当該認識の確からしさを表す
    認識尤度と認識時点からの経過時間とに基づく検索重み
    を付加するとともに、同一単語が複数認識された場合は
    単語同士の検索重みをマージする過程と、 前記検索重みが相対的に大きい単語を検索キーワードと
    して特定する過程と、 検索対象となる複数の電子文書の各々について、前記特
    定した検索キーワードの検索重みと当該検索キーワード
    がどれだけ重要な単語かどうかを表す単語重要度とに基
    づいて検索重み付き単語重要度を決定し、この検索重み
    付き単語重要度が最も高い電子文書を特定する過程と、
    を含む電子文書の検索方法。
  2. 【請求項2】 前記検索重みは、前記認識尤度に比例し
    て大きくなることを特徴とする請求項1記載の検索方
    法。
  3. 【請求項3】 前記検索重みは、前記経過時間が長くな
    るにつれて小さくなることを特徴とする請求項1記載の
    検索方法。
  4. 【請求項4】 前記キーワード情報が利用者が連続的に
    発話した文音声であることを特徴とする請求項1、2ま
    たは3記載の検索方法。
  5. 【請求項5】 検索対象となる電子文書を蓄積した電子
    文書蓄積手段と、 検索時に入力されるキーワード情報から複数の単語を認
    識するとともに個々の単語に認識の確からしさを表す認
    識尤度と認識時刻とを付加して出力する単語認識手段
    と、 前記認識された複数の単語の少なくとも一つを検索キー
    ワードとして特定するキーワード特定手段と、 特定した検索キーワードを用いて前記電子文書蓄積手段
    から該当する電子文書を索出する検索手段とを備え、 前記キーワード特定手段が、前記認識尤度と認識時点か
    らの経過時間の少なくとも一方に基づいて検索目的に応
    じた検索重みを作成し、作成した検索重みが相対的に大
    きい単語を優先的に前記検索キーワードとするように構
    成されていることを特徴とする文書検索装置。
  6. 【請求項6】 前記キーワード特定手段は、前記単語認
    識手段から前記認識尤度及び認識時刻を単語毎に取得す
    るパラメータ取得部と、 前記取得した認識尤度と認識時点からの経過時間との少
    なくとも一方に基づいて各単語に検索重みを付与する重
    み情報付与部と、 前記検索重みが相対的に大きい所定数の単語を特定する
    単語特定部と、 前記検索重みが付与された単語を保存する単語保存部
    と、 新たなキーワード情報の入力に伴って認識された単語と
    同一の単語が前記単語保存部に存在するときに各単語に
    付与された検索重みの合算値に所定係数を乗じた値を当
    該単語の新たな検索重みとする単語マージ部と、 を具備することを特徴とする請求項5記載の文書検索装
    置。
  7. 【請求項7】 前記重み情報付与部は、新たに認識され
    た単語に検索重みを付与する際に、過去に認識された単
    語の検索重みに対して再び検索重みを再付与することを
    特徴とする請求項6記載の文書検索装置。
  8. 【請求項8】 検索対象となる電子文書を蓄積した電子
    文書蓄積手段と、 検索時に入力されるキーワード情報から複数の単語を認
    識するとともに個々の単語に認識の確からしさを表す認
    識尤度を付加して出力する単語認識手段と、 前記認識された複数の単語の少なくとも一つを検索キー
    ワードとして特定するキーワード特定手段と、 前記特定された検索キーワードの検索重みと当該検索キ
    ーワードが各電子文書にとってどれだけ重要な単語かど
    うかを表す単語重要度とを積算して検索重み付き単語重
    要度を電子文書毎に算出し、算出した検索重み付き単語
    重要度がより高い電子文書を前記電子文書蓄積手段から
    索出する検索手段と、 を備えた文書検索装置。
  9. 【請求項9】 前記キーワード情報が、連続的に発話さ
    れた文音声であり、前記単語認識手段が前記文音声の無
    音区間を区切りとして繰り返し音声認識を行うように構
    成されていることを特徴とする請求項5または8記載の
    文書検索装置。
  10. 【請求項10】 前記単語認識手段は、予め前記電子文
    書に含まれる単語をリスト化しておき、各リスト化され
    た単語を用いて音声認識を行うように構成されているこ
    とを特徴とする請求項9記載の文書検索装置。
JP9232004A 1997-08-28 1997-08-28 電子文書の検索方法及び装置 Pending JPH1173419A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP9232004A JPH1173419A (ja) 1997-08-28 1997-08-28 電子文書の検索方法及び装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP9232004A JPH1173419A (ja) 1997-08-28 1997-08-28 電子文書の検索方法及び装置

Publications (1)

Publication Number Publication Date
JPH1173419A true JPH1173419A (ja) 1999-03-16

Family

ID=16932444

Family Applications (1)

Application Number Title Priority Date Filing Date
JP9232004A Pending JPH1173419A (ja) 1997-08-28 1997-08-28 電子文書の検索方法及び装置

Country Status (1)

Country Link
JP (1) JPH1173419A (ja)

Cited By (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2002366166A (ja) * 2001-06-11 2002-12-20 Pioneer Electronic Corp コンテンツ提供システム及び方法、並びにそのためのコンピュータプログラム
JP2005234688A (ja) * 2004-02-17 2005-09-02 Ricoh Co Ltd 重要言語識別方法、重要言語識別プログラム、重要言語識別装置、文書検索装置およびキーワード抽出装置
WO2008015907A1 (fr) * 2006-08-03 2008-02-07 Nec Corporation Dispositif, procédé et programme d'exploration de texte
JP2009048394A (ja) * 2007-08-20 2009-03-05 Nippon Telegr & Teleph Corp <Ntt> 文書間距離演算装置、文書間距離演算方法、プログラムおよび記録媒体
CN102312262A (zh) * 2011-08-22 2012-01-11 吴江市精工铝字制造厂 铜铝合金的混合酸硬质阳极氧化法

Cited By (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2002366166A (ja) * 2001-06-11 2002-12-20 Pioneer Electronic Corp コンテンツ提供システム及び方法、並びにそのためのコンピュータプログラム
JP2005234688A (ja) * 2004-02-17 2005-09-02 Ricoh Co Ltd 重要言語識別方法、重要言語識別プログラム、重要言語識別装置、文書検索装置およびキーワード抽出装置
JP4574186B2 (ja) * 2004-02-17 2010-11-04 株式会社リコー 重要言語識別方法、重要言語識別プログラム、重要言語識別装置、文書検索装置およびキーワード抽出装置
WO2008015907A1 (fr) * 2006-08-03 2008-02-07 Nec Corporation Dispositif, procédé et programme d'exploration de texte
JP2009048394A (ja) * 2007-08-20 2009-03-05 Nippon Telegr & Teleph Corp <Ntt> 文書間距離演算装置、文書間距離演算方法、プログラムおよび記録媒体
CN102312262A (zh) * 2011-08-22 2012-01-11 吴江市精工铝字制造厂 铜铝合金的混合酸硬质阳极氧化法

Similar Documents

Publication Publication Date Title
EP1349145B1 (en) System and method for providing information using spoken dialogue interface
US8612212B2 (en) Method and system for automatically detecting morphemes in a task classification system using lattices
US9330660B2 (en) Grammar fragment acquisition using syntactic and semantic clustering
JP5167546B2 (ja) 文単位検索方法、文単位検索装置、コンピュータプログラム、記録媒体及び文書記憶装置
US6751595B2 (en) Multi-stage large vocabulary speech recognition system and method
KR100772660B1 (ko) 대화 관리 장치 및 그를 위한 대화 예제 기반의 대화모델링기법을 통한 대화 관리 방법
US6839667B2 (en) Method of speech recognition by presenting N-best word candidates
EP1617409B1 (en) Multimodal method to provide input to a computing device
US7792671B2 (en) Augmentation and calibration of output from non-deterministic text generators by modeling its characteristics in specific environments
US20020087311A1 (en) Computer-implemented dynamic language model generation method and system
US20030040901A1 (en) Method and apparatus for dynamic grammars and focused semantic parsing
US6763331B2 (en) Sentence recognition apparatus, sentence recognition method, program, and medium
WO2003050799A1 (en) Method and system for non-intrusive speaker verification using behavior models
US7809564B2 (en) Voice based keyword search algorithm
JPH1173419A (ja) 電子文書の検索方法及び装置
EP1470549A1 (en) Method and system for non-intrusive speaker verification using behavior models
JP2000259645A (ja) 音声処理装置及び音声データ検索装置
JP3420965B2 (ja) 対話型データベース検索方法、装置及び対話型データベース検索プログラムを記録した記録媒体
JP2001100787A (ja) 音声対話システム
JP2003263441A (ja) キーワード決定データベース作成方法、キーワード決定方法、装置、プログラム、および記録媒体
JP4220151B2 (ja) 音声対話装置
Khan et al. Robust Feature Extraction Techniques in Speech Recognition: A Comparative Analysis
JP2004053745A (ja) 言語モデル生成方法、その装置及びそのプログラム
Wang et al. Confidence measures for voice search applications.
KR20200072233A (ko) 문맥기반의 음성 언어 이해 방법