JPH08249343A - 音声情報取得装置及び音声情報取得方法 - Google Patents

音声情報取得装置及び音声情報取得方法

Info

Publication number
JPH08249343A
JPH08249343A JP7049656A JP4965695A JPH08249343A JP H08249343 A JPH08249343 A JP H08249343A JP 7049656 A JP7049656 A JP 7049656A JP 4965695 A JP4965695 A JP 4965695A JP H08249343 A JPH08249343 A JP H08249343A
Authority
JP
Japan
Prior art keywords
voice
data
audio
information
news
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP7049656A
Other languages
English (en)
Inventor
Shozo Abe
省三 阿部
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Toshiba Corp
Original Assignee
Toshiba Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Toshiba Corp filed Critical Toshiba Corp
Priority to JP7049656A priority Critical patent/JPH08249343A/ja
Publication of JPH08249343A publication Critical patent/JPH08249343A/ja
Pending legal-status Critical Current

Links

Landscapes

  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

(57)【要約】 【目的】外部のリアルタイム音声データ等から、その音
声データに特有の情報を抽出することで、情報検索等が
効率的に行えるようにする。 【構成】外部のリアルタイム放送等の音ソースから音声
信号を音声信号入力部1に取り込んでディジタル音声デ
ータに変換して音声ファイルとして音声データ記憶部3
に保存する。この保存した音声データから、ニュース放
送パターン記憶部5内のニュース特有の言い回しパター
ンをもとに、ニュース項目抽出部4にてニュース項目毎
の音声データを抽出してニュース項目記憶部6に保存す
る。この保存した各種ニュース項目データを音声データ
認識部7によりテキストデータに変換し、そこからキー
ワード出現頻度抽出部8にて対話的にキーワードを抽出
し、更にその出現頻度を求める。情報検索部10は、出
現頻度の高いキーワードを検索キーとして外部データベ
ースを検索する。

Description

【発明の詳細な説明】
【0001】
【産業上の利用分野】本発明は、ニュース番組などの外
部音声データ、或いは既存の音声ファイル(音声データ
ファイル)の音声データから、その音声データに特有の
情報を抽出して、情報検索等に利用するのに好適な音声
情報取得装置及び音声情報取得方法に関する。
【0002】
【従来の技術】近年、コンピュータを使った各種のシス
テムが、個人レベルで普及するようになった。特に、パ
ーソナルコンピュータでのマルチメディアシステムは、
個人レベルでの多くの用途を生み出している。
【0003】例えば、アミューズメント分野など、個人
向けのパーソナルコンピュータ用ソフトウェア市場の拡
大は目覚ましい。低価格のパーソナルコンピュータにお
いても、従来からのテキスト情報の他にグラフィックに
よるアニメーション、映像といったメディア、及び音声
データを取り扱うことが可能となってきた。
【0004】さて、音声データは、音声データ取り込み
ハードウェアの標準装備により、CD−ROM等に格納
されている既存の音声ファイル(例えば*.wav等に
代表される形式のディジタル音声データのファイル)や
マイクロホンから取り込むことが可能となっている。こ
れらの音声データは、そのままの形で各種のソフトウェ
アで利用されている。このように近年は、各種メディア
を使って、様々なアプリケーション・ソフトウェアが市
場に普及してきている。
【0005】
【発明が解決しようとする課題】しかしながら従来は、
例えば音声データには、CD−ROM等に格納されてい
る既存のスタティックな音声ファイルを利用するだけで
あった。また、リアルタイムに(内容が)変化する音声
データ(リアルタイム音声データ)については、そのま
まの形で入力することはできても、そのデータ内容に応
じて利用することは考えられておらず、仮に利用しよう
としたとしても、実現は困難である。
【0006】また、スタティックな音声ファイルについ
ても、その種類が膨大になってくると、例えばファイル
名だけで必要とする音声ファイルを検索することは負荷
が大きく、大変な作業となっていた。
【0007】本発明は上記事情を考慮してなされたもの
でその目的は、ニュース番組などの外部のリアルタイム
音声データ、或いは既存の音声ファイルの音声データか
ら、その音声データに特有の情報を抽出することで、情
報検索等が効率的に行える音声情報取得装置及び音声情
報取得方法を提供することにある。
【0008】本発明の他の目的は、定時ニュース番組情
報からニュース項目毎の音声データを抽出し、その抽出
したニュース項目毎の音声データをもとに情報検索に用
いるキーワードを取得することにより、現在話題になっ
ている情報等の検索が効率的に行える音声情報取得装置
及び音声情報取得方法を提供することにある。
【0009】本発明の更に他の目的は、既存の膨大な音
声ファイル等の個々のデータの属性を抽出してその属性
情報を該当する音声ファイルに付加しておくことによ
り、その音声ファイルがどういった内容のものか知る手
掛かりを与えることができ、またその属性情報をもとに
検索の対象とする音声ファイルの候補を絞り込むことが
できる音声情報取得装置及び音声情報取得方法を提供す
ることにある。
【0010】
【課題を解決するための手段及び作用】本発明の第1の
観点に係る音声情報取得装置は、外部のリアルタイム放
送等の音ソースから音声信号を取り込んでディジタル音
声データに変換する音声信号入力手段と、この音声信号
入力手段により取り込まれて変換されてファイル化され
た各種のディジタル音声データを記憶するための音声デ
ータ記憶手段と、定時ニュースの放送パターン情報を記
憶しておくニュース放送パターン記憶手段と、上記音声
データ記憶手段に記憶されている音声データから、上記
ニュース放送パターン記憶手段に記憶されている放送パ
ターン情報をもとに、ニュース項目毎の音声データをニ
ュース項目データとして抽出するニュース項目抽出手段
と、このニュース項目抽出手段により抽出されたニュー
ス項目データを記憶するためのニュース項目記憶手段
と、このニュース項目記憶手段に記憶されているニュー
ス項目データを音声認識してテキスト化する音声データ
認識手段と、この音声データ認識手段により認識された
ニュース項目データから対話的にキーワードを抽出し、
その抽出したキーワードの出現頻度を取得するキーワー
ド出現頻度抽出手段と、このキーワード出現頻度抽出手
段により抽出されたキーワード及びその出現頻度をもと
に検索キーワードを決定して情報検索を行う情報検索手
段とを備えたことを特徴とするものである。
【0011】上記第1の観点に係る音声情報取得装置に
おいては、音声信号入力手段により外部のリアルタイム
放送等の音ソースからの音声信号が取り込まれ、ディジ
タル音声データに変換される。この音声データは、ファ
イル化されて音声データ記憶手段に保存される。したが
って、音声信号入力手段にて音声信号を取り込む時間帯
を設定しておくことにより、1日の中で、決まった時刻
に短い時間長で放送される定時ニュース放送からの音声
信号を取り込んでファイル化して音声データ記憶手段に
保存しておくことが可能となる。
【0012】ニュース項目抽出手段は、このようなファ
イル化された定時ニュース情報からのリアルタイム音声
データを対象に、ニュース放送パターン記憶手段に登録
されている定時ニュース特有の言い回しのパターンにマ
ッチする音声パターン領域と所定時間以上の無音部を検
出することで、隣接する音声パターン領域間の(無音部
を除く)各音声領域を、それぞれニュース項目の1つの
塊領域として抽出する。この抽出された各塊領域の音声
データは、それぞれ独立のニュース項目の音声データ
(ニュース項目データ)としてファイル化されてニュー
ス項目記憶手段に保存される。
【0013】ニュース項目記憶手段に保存された各ニュ
ース項目に対応した音声データは、音声認識手段の音声
認識処理によりテキストデータに変換される。キーワー
ド出現頻度抽出手段は、このテキストデータからユーザ
との対話によりキーワードを抽出し、更にその抽出した
キーワードの出現頻度を取得する。
【0014】このように、ニュース番組で放送(発声)
される各キーワードの出現頻度が求められることから、
利用者は、現在世の中で話題となっている情報を例えば
表示出力或いは音声出力により知ることが可能となる。
【0015】また、出現頻度の高いキーワードを検索キ
ーとして用いて、例えば外部の大容量データベースを対
象とする情報検索を行うことで、即ちリアルタイム性の
あるニュース情報を利用した情報検索を行うことで、実
社会で話題となっている出来事に関連した情報、及びニ
ュース・ソースの異なるメディアの情報を取得すること
も可能となる。
【0016】本発明の第2の観点に係る音声情報取得装
置は、既存の各種音声ファイルのディジタル音声データ
を記憶するための音声データ記憶手段と、この音声デー
タ記憶手段に記憶されている各音声ファイルのディジタ
ル音声データの属性情報を抽出して当該音声ファイルに
付加する音声属性情報抽出手段と、上記音声データ記憶
手段に記憶されている各音声ファイルのうちの外部指定
の属性情報が付加されている音声ファイルを対象に情報
検索を行う情報検索手段とを備えたことを特徴とするも
のである。
【0017】上記第2の観点に係る音声情報取得装置に
おいては、既存の音声ファイルを対象にして、その音声
ファイルの音声データがどういった内容のものである
か、例えば「音声」音であるか「音楽」音であるか、
「音声」音の場合には男性の音声であるか女性の音声で
あるかといった、音声ファイルの音声データに関する属
性が、音声属性情報抽出手段により抽出される。
【0018】ここで、音声データの属性を抽出する手法
として、「音声」音であるか「音楽」音であるかについ
ては、「音声」音は「音楽」音に比較してレベルの変動
が激しいことが利用され、男性の音声であるか女性の音
声であるかについては、発話音声において男性音声は1
00Hz、女性音声は200Hz前後の周波数でほぼ一
定であることが利用される。この他、「音声」音が子供
の音声か大人の音声かといった属性を抽出することも可
能である。
【0019】このようにして抽出された属性の情報を対
応する音声ファイルに付加しておくことで、既存の膨大
な音声ファイルの個々のデータがどういった内容のもの
であるかを知るための手掛かりとなる。したがって、例
えば利用者が所望の属性情報を指定することで、大量の
音声ファイルの中から情報検索の対象とするファイルを
絞り込むことが可能となり、今後のマルチメディア利用
システムにおける操作性の向上を図ることができる。
【0020】以上に述べた第1の観点に係る音声情報取
得装置の構成と、第2の観点に係る音声情報取得装置の
構成とを組み合わせることで、リアルタイム性のあるニ
ュース情報を利用した情報検索を、利用者が指定した属
性を持つ音声ファイルだけを対象として行うことも可能
となり、必要とする情報が検索し易くなる。なお、音声
ファイルを対象とする情報検索では、対象となる音声フ
ァイルの音声データを音声認識してテキストデータに変
換し、そのテキストデータを対象にフルテキストサーチ
を行えばよい。
【0021】
【実施例】以下、本発明の実施例につき図面を参照して
説明する。図1は本発明の一実施例に係る音声情報取得
装置の全体構成を示すブロック構成図である。
【0022】図1において、1はリアルタイムに(内容
が)変化する外部の音声信号(リアルタイム音声信
号)、例えばラジオ放送、テレビジョン放送、或いはマ
イクロホンからの音声信号等を取り込んでディジタルの
音声データに変換する音声信号入力部、2はこの音声信
号入力部1による音声信号取り込みの時間帯(開始時刻
と取り込み時間からなる時間帯)を設定する時計機能付
きの時間帯設定部である。この時間帯設定部2により設
定される取り込み時間帯は、音声信号入力部1によるリ
アルタイム音声信号取り込みの対象を例えば公共の定時
ニュースとするならば、朝7時、正午、夜7時といった
決まった時刻から一定時間の幅の時間帯である。
【0023】音声信号入力部1は、時計機能付き時間帯
設定部2により設定された一定時間の期間(即ち時計機
能付き時間帯設定部2により設定された時間帯におい
て)、ラジオ放送またはテレビジョン放送からの音声信
号を取り込み、ディジタルの音声データに変換する。こ
の音声データ、例えば夜7時の公共の定時ニュースを対
象として、その開始時から一定時間の間に取り込まれて
ディジタル変換された音声データは、1つの独立した音
声ファイルとして音声データ記憶部3に保存される。
【0024】ここで音声信号入力部1は、音声データ記
憶部3の記憶領域の空き具合によって音声取り込み時の
サンプリング間隔を可変することで、必要ファイル容量
を可変にすることが可能なようになっている。勿論、サ
ンプリング間隔を大きくすることで一定時間内における
必要ファイル容量が少なくなると、音声データの音質は
劣化することになるが、音声データの用途に応じて使い
分ければよい。
【0025】音声データ記憶部3には、音声信号入力部
1により取り込まれたリアルタイム音声データ(からな
る音声ファイル)の他に、CD−ROM等の媒体から読
み込まれる既存のスタティックな各種音声ファイルのデ
ータ(ディジタル音声データ)が保存される。これらの
音声ファイルは、種々のソフトウェアで利用される音声
データである。また、音声データ記憶部3には更に、後
述する音声属性情報抽出部13により取り込まれた特別
の音声属性を持つ音声データのファイルも保存される。
【0026】音声信号入力部1により上記設定時間帯に
おいて取り込まれて音声データ記憶部3に格納されたリ
アルタイム音声データ(のファイル)は、ニュース項目
抽出部4の抽出対象となる。即ちニュース項目抽出部4
は、音声データ記憶部3に格納されているリアルタイム
音声データ(のファイル)から、予め定められているニ
ュース項目毎のデータ抽出を行う。この抽出のために、
図1の装置には、定時ニュース特有の言い回しのパター
ンが登録されているニュース放送パターン記憶部5が設
けられる。
【0027】ニュース項目抽出部4は、ニュース放送パ
ターン記憶部5に登録されている各種言い回しパターン
と音声データ記憶部3に格納されているリアルタイム音
声データ(のファイル)内の無音の時間帯とをチェック
することにより、ニュース項目毎のデータ抽出を行う。
【0028】このニュース項目抽出部4による抽出処理
を、図2を参照して説明する。まず、図2は、音声信号
入力部1によって取り込まれる夜7時の公共の定時ニュ
ースの音声波形を示し、音声波形の右横の「」で囲まれ
た文字列は、当該定時ニュースにおける言い回しパター
ンを示している。
【0029】ニュース放送パターン記憶部5には、公共
の定時ニュースでよく使用される言い回しパターンが複
数、辞書パターンとして登録されている。具体的には、
「7時のニュースです」、「まず、はじめに」、「次
に」、「スポーツ情報です」、「担当は桜井でした」と
いった音声パターンが登録されている。
【0030】ニュース項目抽出部4は、夜7時の公共の
定時ニュースから音声信号入力部1により取り込まれて
音声データ記憶部3に格納されている音声ファイルの中
から、ニュース放送パターン記憶部5に登録されている
上記音声パターンにマッチする音声パターン領域R1,
R2,R3,R4,R5を抽出する。なお、特定の音声
パターンにマッチする音声を抽出する技術は、従来から
各種知られているため、ここでは説明を省略する。
【0031】次にニュース項目抽出部4は、抽出した音
声パターン領域間の音声(音声データ)領域、具体的に
は「まず、はじめに」の音声パターンの領域R2と「次
に」の音声パターンの領域R3との間の音声(音声デー
タ)領域RF1、及び「スポーツ情報です」の音声パタ
ーンの領域R4と「担当は桜井でした」の音声パターン
の領域R5との間の音声(音声データ)領域RF2を、
それぞれニュース項目の1つの塊領域として抽出する。
【0032】なお、領域R2と領域R3との間には、領
域RF1に続く無音領域S1、即ちニュースとニュース
の間の比較的長い無音領域S1が存在するが、当該無音
領域S1(の音声データ)は捨てられる。即ち、RF1
+S1がニュース項目の1つの塊領域として抽出される
のではなく、上記のようにRF1が1つの塊領域として
抽出される。
【0033】以上に述べた塊領域を抽出する際には、前
処理として、対象となる音声データ(音声波形データ)
にスムージング処理を施し、音声波形の急峻な部分を滑
らかにすることが好ましい。塊領域は、スムージング処
理を施した音声データを所定のしきい値で2値化するこ
とで抽出される。
【0034】さて、ニュース項目抽出部4でニュース項
目毎に抽出された(外部からの)音声データ(ここで
は、定時ニュース中の「まず、はじめに」の音声パター
ンと「次に」の音声パターンとの間のニュース項目#1
の音声データ、及び「スポーツ情報です」の音声パター
ンと「担当は桜井でした」の音声パターンとの間のニュ
ース項目#2の音声データ)は、ニュース項目音声ファ
イル(ここでは、ファイルA及びB)のデータとして、
ニュース項目記憶部6に保存される。
【0035】ニュース項目記憶部6に保存されたニュー
ス項目音声ファイルデータは、音声データ認識部7によ
る音声認識処理の対象となる。即ち音声データ認識部7
は、ニュース項目記憶部6に保存されているニュース項
目音声ファイルデータに対する音声認識処理を行って、
(文字コード列からなる)テキストデータにメディア変
換する。このテキストデータは、元のニュース項目音声
ファイルとは別にニュース項目記憶部6に保存される。
【0036】音声データ認識部7によって変換されたニ
ュース項目音声ファイルデータのテキストデータは、キ
ーワード出現頻度抽出部8によるキーワード出現頻度の
抽出処理対象となる。即ちキーワード出現頻度抽出部8
は、ニュース項目音声ファイルデータのテキストデータ
をCRTディスプレイや液晶ディスプレイ等の表示部9
に表示してユーザと対話を行うことで、そのテキストデ
ータの中から、ユーザの指定したキーワードを抽出し、
そのキーワードの出現頻度を求める。本実施例におい
て、この処理は、例えばユーザが外部の大容量データベ
ースシステムからの情報抽出を必要とする場合に、当該
ユーザから図示せぬキーボード、マウス等を通して与え
られる指示に応じて行われるものである。
【0037】そこで、図1の装置には、情報検索部10
が設けられている。この情報検索部10は、ユーザから
情報抽出が指示されると、キーワード出現頻度抽出部8
により抽出されるキーワードを音声データ認識部7から
受け取って、例えば出現頻度の高いキーワード(例えば
出現頻度が第1位〜第3位の3つのキーワード)を検索
キーとして、外部の大容量データベース(図示せず)か
らの情報検索を行うことで、実社会で話題となっている
(ニュースに関連した)出来事の情報を得る。この情報
検索部10による情報検索結果は、表示部9に表示され
る。
【0038】なお、検索に用いるキーワードの数を、ユ
ーザにより指定させることも可能であり、またキーワー
ド出現頻度抽出部8により抽出されたキーワードを出現
頻度順に画面表示して、その中から検索に用いるキーワ
ードをユーザに選択指定させることも可能である。
【0039】また、図1の装置には、音声データ記憶部
3及びニュース項目記憶部6に蓄えられた音声ファイル
のデータ、更にはキーワード出現頻度抽出部8により抽
出されたキーワードを音声出力するために、音声出力部
11及びスピーカ12が設けられている。音声出力部1
1は、ユーザからの指示に応じて起動され、音声データ
記憶部3またはニュース項目記憶部6に蓄えられている
音声ファイルのデータ、或いはキーワード出現頻度抽出
部8により抽出されたキーワードをもとに、その音声信
号(音響信号)をスピーカ12に出力して、音声出力す
る。但し、ニュース項目記憶部6に蓄えられているテキ
ストデータ及びキーワード出現頻度抽出部8により抽出
されたキーワードデータを音声出力するには、当該デー
タを音声データに変換する処理が必要となる。
【0040】また、図1の装置には、音声データ記憶部
3に蓄えられている(既存の音声ファイルを含む)音声
ファイルのデータを対象としてその属性情報を抽出する
ための音声属性情報抽出部13及び当該属性情報を決定
する情報(一種の辞書データ)が登録されている音声環
境辞書部14が設けられている。ここで抽出される属性
情報の候補としては、対象となる音声データが音声であ
るか音楽であるか(音声/音楽の区別)、音声の場合に
は男性の音声であるか女性の音声であるか(男性音声/
女性音声の区別)、更には子供の音声であるか大人の音
声であるか(子供/大人の区別)等である。
【0041】即ち音声属性情報抽出部13は、音声デー
タ記憶部3に蓄えられている音声ファイルのデータを対
象にして、音声環境辞書部14の登録情報をもとに、そ
の音声データ(音声ファイル)の属性情報を抽出し、
「音声」音であるか「音楽」音であるかを区別し、「音
声」音の場合には、男性の音声であるか女性の音声であ
るか、更には子供の音声であるか大人の音声であるかを
区別する。ここで、例えば「音声/音楽」の区別は、発
話している音声(「音声」音)は、音楽(「音楽」音)
に比較してレベルの変動が激しいことを利用して行われ
る。また、男性音声/女性音声の区別は、発話音声にお
いて男性音声は100Hz、女性音声は200Hz前後
の周波数でほぼ一定であることを利用して行われる。
【0042】以上のようにして、既存の膨大な音声ファ
イルの個々のデータ、及び音声信号入力部1により取り
込まれ、ファイルとして蓄えられた外部の音声データを
対象に、「音声」音であるか或いは「音楽」音である
か、「音声」音であれば、男性の音声であるか女性の音
声であるか、更には、子供の音声であるか大人の音声で
あるかといった、音声データの属性情報が抽出される。
この抽出された属性情報を対応する音声ファイルに付加
しておくことで、膨大な音声ファイルの個々のデータ
が、どういった内容のものであるかを知るための手掛か
りの情報として用いることができる。例えば、膨大な音
声ファイルのうち、女性音声の音声ファイルだけを必要
とする音声ファイルとするなど、必要とするファイルの
候補を効率的に絞り込むことができる。これにより、今
後のマルチメディア利用システムにおける操作性の向上
を図ることが可能となる。
【0043】また、絞り込んだファイルの候補を、前記
した外部データベースと同様に情報検索部10による情
報検索の対象とすることもできる。この場合、対象とな
る各音声ファイルの音声データを音声データ記憶部3か
ら音声データ認識部7に読み込んで音声認識してテキス
トデータに変換し、そのテキストデータを例えばニュー
ス項目記憶部6に格納した後、当該ニュース項目記憶部
6内の該当するテキストデータを対象に情報検索部10
にてフルテキストサーチを行えばよい。
【0044】さて、音声属性情報抽出部13は、音声デ
ータ記憶部3に蓄えられている音声ファイルのデータ
(即ち一旦ファイルした音声データ)を対象として属性
情報を抽出する他に、音声信号入力部1により時々刻々
と入力されるリアルタイム音声データを当該音声信号入
力部1から直接に取り込んで、例えば一定時間の音声デ
ータを対象として属性情報を抽出するようにもなってい
る。これは、例えばラジオ放送またはテレビジョン放送
等からリアルタイムに取り込んだデータのうち、音楽音
データのみ或いは男性音のみを抽出して音声ファイルと
して音声データ記憶部3に格納するといった用途に適用
される。
【0045】一例として、ラジオ放送またはテレビジョ
ン放送等からのリアルタイム音信号を対象に、属性情報
として「音声/音楽」を区別する機能を使って、常時入
力されている音信号から「音楽」音を識別すると、音楽
音データとしてファイル化する場合について、図3を参
照して説明する。
【0046】まず図3(a)は、時計機能付き時間帯設
定部2によって設定される音データ取り込み開始時刻t
0 から時刻t1 までの時間幅の間に、音声信号入力部1
により取り込まれたリアルタイム音信号を示す。音声属
性情報抽出部13は、音データ取り込み開始時刻t0 か
ら連続して入力されるリアルタイム音信号(音声デー
タ)から、音声環境辞書部14の登録情報をもとに、
「音楽」音を識別するための属性情報抽出処理を開始す
る。
【0047】もし、時刻t0 から時刻t1 までの間の時
刻ts において、初めて「音楽」音であると判断できた
ならば、音声属性情報抽出部13は、その時刻t0 から
時刻ts までの経過時間Ts を保持し、この時間情報T
s をもとに、「音声」音のファイル化を開始する。
【0048】このファイル化処理の具体的な内容は次の
通りである。まず、本実施例では、音声信号入力部1に
より時刻t0 から連続して入力される音声データは、音
声属性情報抽出部13が有するシフトバッファ(図示せ
ず)に先入れ先出し(FIFO)方式で入力保持され
る。このシフトバッファは、音声データを例えば10秒
の時間長分だけ入力保持できるようになっている。
【0049】そこで音声属性情報抽出部13は、上記し
たように時刻t0 から時間Ts 経過後に初めて「音楽」
音であると判断した場合、シフトバッファから時間Ts
に相当する量の音声データが出力された時点から、後続
のシフトバッファの出力データをファイル化する処理を
開始する。
【0050】音声属性情報抽出部13は、時刻ts 以降
も入力されるリアルタイム音が「音楽」音であると判断
し続け、やがて図3(b)に示す時刻te で「音楽」音
でないと判断したものとする。この場合、音声属性情報
抽出部13は、この「音楽」音でないと判断した時点
(時刻te )を「音楽」音の終了時点とする。
【0051】そこで音声属性情報抽出部13は、時刻t
0 から時刻te までの経過時間Teを保持し、シフトバ
ッファから時間Te に相当する量の音声データが出力さ
れた時点で、シフトバッファの出力データのファイル化
処理を終了する。
【0052】また、音声属性情報抽出部13は、時刻t
e で「音楽」音の終了を判断すると、その時刻te を新
たなリアルタイム音信号の音データ取り込み開始時刻t
0 として、流れてくるであろう「音楽」音の識別チェッ
クを繰り返す。
【0053】このようにして、外部リアルタイム放送な
どの音ソースから、「音楽」音(所望の属性の音声デー
タ)だけを自動的に取り込んでファイル化することがで
きる。ファイル化されたデータは、その属性情報が付加
された状態で音声データ記憶部3に保存される。このフ
ァイル化されたデータ、即ち外部の音ソースから取り込
まれた「音楽」音は、ユーザからの指示により音声出力
部11に取り出されて、スピーカ12から再生出力され
る。
【0054】同様にして、外部リアルタイム放送などの
音ソースから、例えば「男性」音声だけ、「女性」音声
だけ、更には「子供」の音声だけというように、ユーザ
の指示する属性の音声だけを自動的に取り込んでファイ
ル化して音声データ記憶部3に保存することができる。
【0055】この場合、例えば定時ニュース番組から抽
出された「男性」音の属性のファイルの音声データだけ
を音声データ認識部7にて音声認識してテキスト化し、
そこからキーワード出現頻度抽出部8にてキーワードを
抽出して、そのキーワードの出現頻度を求めることによ
り、情報検索部10での情報検索に用いる検索キーを絞
ること、即ち検索対象を絞ることが可能となる。
【0056】なお、本発明は前記実施例に限定されるも
のではない。例えば、前記実施例では、音声信号入力部
1による外部音声信号取り込みの対象が定時のニュース
番組であるものとしているが、任意の番組でも構わな
い。また、情報ソースとして、ラジオ放送やテレビジョ
ン放送からの音声信号の他、VTR(ビデオテープレコ
ーダ)装置、CD(コンパクトディスク)装置等で扱わ
れる記録媒体、電話音声などからの音声データを使用す
ることも可能である。
【0057】
【発明の効果】以上詳述したように本発明によれば、定
時ニュース番組情報からニュースに特有の言い回しパタ
ーンを検出することでニュース項目毎の音声データを抽
出し、その抽出したニュース項目毎の音声データをテキ
スト化して、そこから情報検索に用いるキーワードを対
話的に抽出すると共に、そのキーワードの出現頻度を取
得する構成とすることにより、例えば出現頻度の高いリ
アルタイム性のあるキーワードを検索キーとして外部デ
ータベース等を対象とする情報検索を行うことができる
ため、現在話題になっている情報、更にはその情報に関
連した情報を効率的に入手することができる。
【0058】また、本発明によれば、既存の膨大な音声
ファイル等の個々のデータの属性を抽出してその属性情
報を該当する音声ファイルに付加しておくことにより、
その音声ファイルがどういった内容のものか知る手掛か
りを与えることができる。このため、音声ファイルに付
された属性情報をもとに、既存の膨大な音声ファイル等
の中から、検索の対象とする音声ファイルの候補を絞り
込むことができ、今後のマルチメディア利用システムに
おける操作性の向上を図ることができる。
【0059】このように、本発明によれば、ニュース番
組などの外部のリアルタイム音声データ、或いは既存の
音声ファイルの音声データから、その音声データに特有
の情報を抽出してその情報を利用することで、情報検索
等を効率的に行うことができる。
【図面の簡単な説明】
【図1】本発明の一実施例に係る音声情報取得装置の全
体構成を示すブロック構成図。
【図2】同実施例におけるニュース項目抽出部4の抽出
処理を説明するための図であり、定時ニュースでよく使
われる言い回しパターンを使って、定時ニュースに含ま
れるニュース項目を抽出する様子を示す。
【図3】同実施例における音声属性情報抽出部13の動
作を、音声信号入力部1により入力されるリアルタイム
音信号から「音楽」音を識別してファイル化する場合に
ついて説明するための図。
【符号の説明】
1…音声信号入力部、2…時計機能付き時間帯設定部
(入力時間帯設定手段)、3…音声データ記憶部、4…
ニュース項目抽出部、5…ニュース放送パターン記憶
部、6…ニュース項目記憶部、7…音声データ認識部、
8…キーワード出現頻度抽出部、9…表示部、10…情
報検索部、11…音声出力部、12…スピーカ、13…
音声属性情報抽出部、14…音声環境辞書部。

Claims (10)

    【特許請求の範囲】
  1. 【請求項1】 外部のリアルタイム放送等の音ソースか
    ら音声信号を取り込んでディジタル音声データに変換す
    る音声信号入力手段と、 この音声信号入力手段により取り込まれて変換されてフ
    ァイル化された各種のディジタル音声データを記憶する
    ための音声データ記憶手段と、 定時ニュースの放送パターン情報を記憶しておくニュー
    ス放送パターン記憶手段と、 前記音声データ記憶手段に記憶されているディジタル音
    声データから、前記ニュース放送パターン記憶手段に記
    憶されている前記放送パターン情報をもとに、ニュース
    項目毎の音声データをニュース項目データとして抽出す
    るニュース項目抽出手段と、 このニュース項目抽出手段により抽出されたニュース項
    目データを記憶するためのニュース項目記憶手段と、 このニュース項目記憶手段に記憶されているニュース項
    目データを音声認識してテキスト化する音声データ認識
    手段と、 この音声データ認識手段により認識されたニュース項目
    データから対話的にキーワードを抽出し、その抽出した
    キーワードの出現頻度を取得するキーワード出現頻度抽
    出手段と、 このキーワード出現頻度抽出手段により抽出されたキー
    ワード及びその出現頻度をもとに検索キーワードを決定
    して情報検索を行う情報検索手段とを具備することを特
    徴とする音声情報取得装置。
  2. 【請求項2】 既存の各種音声ファイルのディジタル音
    声データを記憶するための音声データ記憶手段と、 この音声データ記憶手段に記憶されている前記各音声フ
    ァイルのディジタル音声データの属性情報を抽出して当
    該音声ファイルに付加する音声属性情報抽出手段と、 前記音声記憶手段に記憶されている前記各音声ファイル
    のうちの外部指定の属性情報が付加されている音声ファ
    イルを対象に情報検索を行う情報検索手段とを具備する
    ことを特徴とする音声情報取得装置。
  3. 【請求項3】 外部のリアルタイム放送等の音ソースか
    ら音声信号を取り込んでディジタル音声データに変換す
    る音声信号入力手段と、 この音声信号入力手段により取り込まれて変換されてフ
    ァイル化された各種のディジタル音声データ及び既存の
    各種音声ファイルのディジタル音声データを記憶するた
    めの音声データ記憶手段と、 この音声データ記憶手段に記憶されているディジタル音
    声データのうち、少なくとも前記既存の音声ファイルの
    ディジタル音声データの属性情報を抽出して当該音声フ
    ァイルに付加する音声属性情報抽出手段と、 定時ニュースの放送パターン情報を記憶しておくニュー
    ス放送パターン記憶手段と、 前記音声データ記憶手段に記憶されている前記音声信号
    入力手段により取り込まれて変換された音声データか
    ら、前記ニュース放送パターン記憶手段に記憶されてい
    る前記放送パターン情報をもとに、ニュース項目毎の音
    声データをニュース項目データとして抽出するニュース
    項目抽出手段と、 このニュース項目抽出手段により抽出されたニュース項
    目データを記憶するためのニュース項目記憶手段と、 このニュース項目記憶手段に記憶されているニュース項
    目データを音声認識してテキスト化する音声データ認識
    手段と、 この音声データ認識手段により認識されたニュース項目
    データから対話的にキーワードを抽出し、その抽出した
    キーワードの出現頻度を取得するキーワード出現頻度抽
    出手段と、 このキーワード出現頻度抽出手段により抽出されたキー
    ワード及びその出現頻度をもとに検索キーワードを決定
    し、外部データベース、または前記音声記憶手段に記憶
    されている前記音声ファイルのうちの外部指定の属性情
    報が付加されている音声ファイルを対象に情報検索を行
    う情報検索手段とを具備することを特徴とする音声情報
    取得装置。
  4. 【請求項4】 前記情報検索手段は、外部から検索キー
    ワードが与えられた場合には、その検索キーを用いて、
    前記音声記憶手段に記憶されている前記音声ファイルの
    うちの外部指定の属性情報が付加されている音声ファイ
    ルを対象に情報検索を行うことを特徴とする請求項3記
    載の音声情報取得装置。
  5. 【請求項5】 前記音声属性情報抽出手段は、前記音声
    データから、少なくとも「音声」音であるか「音楽」音
    であるか、「音声」音の場合には男性の音声であるか女
    性の音声であるかを識別して、対応する属性情報を抽出
    することを特徴とする請求項2または請求項3記載の音
    声情報取得装置。
  6. 【請求項6】 前記音声属性情報抽出手段は、前記音声
    信号入力手段により取り込まれて変換されたディジタル
    音声データを当該入力手段から入力し、その入力音声デ
    ータから外部指定の属性を持つ音声データ部分を抽出し
    てファイル化し、その属性情報を付加して前記音声デー
    タ記憶手段に記憶することを特徴とする請求項3記載の
    音声情報取得装置。
  7. 【請求項7】 前記音声信号入力手段にて音声信号を取
    り込む時間帯を設定する入力時間帯設定手段を更に具備
    することを特徴とする請求項1または請求項3記載の音
    声情報取得装置。
  8. 【請求項8】 外部のリアルタイム放送等の音ソースか
    ら音声信号を取り込んでディジタル音声データに変換し
    てファイル化して保存しておき、 この保存しておいた音声データからニュース特有の言い
    回しパターンを検出することでニュース項目毎の音声デ
    ータを抽出してそれぞれファイル化して保存しておき、 この保存しておいたニュース項目毎の音声データを対象
    とする音声認識を行うことで、各音声データをテキスト
    データに変換し、 この各テキストデータから対話的にキーワードを抽出す
    ると共に、抽出したキーワードの出現頻度を求め、 この抽出したキーワード及びその出現頻度をもとに検索
    キーワードを決定して情報検索を行うことを特徴とする
    音声情報取得方法。
  9. 【請求項9】 既存の各種音声ファイルのディジタル音
    声データの属性情報を抽出して当該音声ファイルに付加
    しておき、 前記各音声ファイルのうちの外部指定の属性情報が付加
    されている音声ファイルを対象に情報検索を行うように
    したことを特徴とする音声情報取得方法。
  10. 【請求項10】 既存の各種音声ファイルのディジタル
    音声データの属性情報を抽出して当該音声ファイルに付
    加しておく一方、 外部のリアルタイム放送等の音ソースから音声信号を取
    り込んでディジタル音声データに変換してファイル化し
    て保存しておき、 この保存しておいた音声データからニュース特有の言い
    回しパターンを検出することでニュース項目毎の音声デ
    ータを抽出してそれぞれファイル化して保存しておき、 この保存しておいたニュース項目毎の音声データを対象
    とする音声認識を行うことで、各音声データをテキスト
    データに変換し、 この各テキストデータから対話的にキーワードを抽出す
    ると共に、抽出したキーワードの出現頻度を求め、 この抽出したキーワード及びその出現頻度をもとに検索
    キーワードを決定し、外部データベース、または前記音
    声ファイルのうちの外部指定の属性情報が付加されてい
    る音声ファイルを対象に情報検索を行うようにしたこと
    を特徴とする音声情報取得方法。
JP7049656A 1995-03-09 1995-03-09 音声情報取得装置及び音声情報取得方法 Pending JPH08249343A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP7049656A JPH08249343A (ja) 1995-03-09 1995-03-09 音声情報取得装置及び音声情報取得方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP7049656A JPH08249343A (ja) 1995-03-09 1995-03-09 音声情報取得装置及び音声情報取得方法

Publications (1)

Publication Number Publication Date
JPH08249343A true JPH08249343A (ja) 1996-09-27

Family

ID=12837237

Family Applications (1)

Application Number Title Priority Date Filing Date
JP7049656A Pending JPH08249343A (ja) 1995-03-09 1995-03-09 音声情報取得装置及び音声情報取得方法

Country Status (1)

Country Link
JP (1) JPH08249343A (ja)

Cited By (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2000124901A (ja) * 1998-10-12 2000-04-28 Fuji Xerox Co Ltd 電子会議システムおよび情報処理装置ならびに記録媒体
JP2002366166A (ja) * 2001-06-11 2002-12-20 Pioneer Electronic Corp コンテンツ提供システム及び方法、並びにそのためのコンピュータプログラム
JP2002544627A (ja) * 1999-05-19 2002-12-24 ディジマーク コーポレイション 音楽とその他のメディアにデジタル透かしを用いる方法およびシステム
JP2006319456A (ja) * 2005-05-10 2006-11-24 Ntt Communications Kk キーワード提供システム及びプログラム
US8019163B2 (en) 2005-03-30 2011-09-13 Kabushiki Kaisha Toshiba Information processing apparatus and method
WO2013176365A1 (en) * 2012-05-21 2013-11-28 Lg Electronics Inc. Method and electronic device for easily searching for voice record
WO2018124464A1 (ko) * 2016-12-26 2018-07-05 삼성전자 주식회사 전자 장치 및 전자 장치의 검색 서비스 제공 방법
JPWO2021117169A1 (ja) * 2019-12-11 2021-06-17

Cited By (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2000124901A (ja) * 1998-10-12 2000-04-28 Fuji Xerox Co Ltd 電子会議システムおよび情報処理装置ならびに記録媒体
JP2002544627A (ja) * 1999-05-19 2002-12-24 ディジマーク コーポレイション 音楽とその他のメディアにデジタル透かしを用いる方法およびシステム
JP2002366166A (ja) * 2001-06-11 2002-12-20 Pioneer Electronic Corp コンテンツ提供システム及び方法、並びにそのためのコンピュータプログラム
US8019163B2 (en) 2005-03-30 2011-09-13 Kabushiki Kaisha Toshiba Information processing apparatus and method
JP2006319456A (ja) * 2005-05-10 2006-11-24 Ntt Communications Kk キーワード提供システム及びプログラム
WO2013176365A1 (en) * 2012-05-21 2013-11-28 Lg Electronics Inc. Method and electronic device for easily searching for voice record
US9224397B2 (en) 2012-05-21 2015-12-29 Lg Electronics Inc. Method and electronic device for easily searching for voice record
WO2018124464A1 (ko) * 2016-12-26 2018-07-05 삼성전자 주식회사 전자 장치 및 전자 장치의 검색 서비스 제공 방법
JPWO2021117169A1 (ja) * 2019-12-11 2021-06-17

Similar Documents

Publication Publication Date Title
US10977299B2 (en) Systems and methods for consolidating recorded content
US6990443B1 (en) Method and apparatus for classifying signals method and apparatus for generating descriptors and method and apparatus for retrieving signals
EP1547060B1 (en) System and method for generating an audio thumbnail of an audio track
US6697564B1 (en) Method and system for video browsing and editing by employing audio
JP4127668B2 (ja) 情報処理装置、情報処理方法、およびプログラム
KR100676863B1 (ko) 음악 검색 서비스 제공 시스템 및 방법
KR101100191B1 (ko) 멀티미디어 재생장치와 이를 이용한 멀티미디어 자료검색방법
US20080046406A1 (en) Audio and video thumbnails
JP2007519987A (ja) 内部及び外部オーディオビジュアルデータの統合解析システム及び方法
JP4491700B2 (ja) 音響検索処理方法、音響情報検索装置、音響情報蓄積方法、音響情報蓄積装置および音響映像検索処理方法、音響映像情報検索装置、音響映像情報蓄積方法、音響映像情報蓄積装置
CN102959544A (zh) 用于同步媒体的方法和***
KR100999655B1 (ko) 디지털 비디오 레코더 시스템 및 그것의 운용방법
KR20120038000A (ko) 대화의 주제를 결정하고 관련 콘텐트를 획득 및 제시하는 방법 및 시스템
JP6280312B2 (ja) 議事録記録装置、議事録記録方法及びプログラム
JP4192703B2 (ja) コンテンツ処理装置、コンテンツ処理方法及びプログラム
CN107679196A (zh) 一种多媒体识别方法、电子设备及存储介质
JPH08249343A (ja) 音声情報取得装置及び音声情報取得方法
JP4513165B2 (ja) 番組記録方法及び番組記録装置及び番組記録再生装置及び番組記録再生方法
US20040249862A1 (en) Sync signal insertion/detection method and apparatus for synchronization between audio file and text
EP1531457B1 (en) Apparatus and method for segmentation of audio data into meta patterns
JPH11282857A (ja) 音声検索装置および記録媒体
US20050016364A1 (en) Information playback apparatus, information playback method, and computer readable medium therefor
KR20010037652A (ko) 오디오 색인화 장치 및 그 방법과 그를 이용한 오디오 검색 시스템 및 그 방법
KR100348901B1 (ko) 오디오/영상물의 음향적 장면분할방법
Clements et al. Phonetic searching of digital audio