JPH0668168A - 音響キーワードによる映像検索方法および装置 - Google Patents

音響キーワードによる映像検索方法および装置

Info

Publication number
JPH0668168A
JPH0668168A JP4217620A JP21762092A JPH0668168A JP H0668168 A JPH0668168 A JP H0668168A JP 4217620 A JP4217620 A JP 4217620A JP 21762092 A JP21762092 A JP 21762092A JP H0668168 A JPH0668168 A JP H0668168A
Authority
JP
Japan
Prior art keywords
video
audio
information
keyword
time series
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP4217620A
Other languages
English (en)
Inventor
Yoko Niikura
陽子 新倉
Hiroshi Hamada
洋 浜田
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Nippon Telegraph and Telephone Corp
Original Assignee
Nippon Telegraph and Telephone Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Nippon Telegraph and Telephone Corp filed Critical Nippon Telegraph and Telephone Corp
Priority to JP4217620A priority Critical patent/JPH0668168A/ja
Publication of JPH0668168A publication Critical patent/JPH0668168A/ja
Pending legal-status Critical Current

Links

Landscapes

  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
  • Television Signal Processing For Recording (AREA)

Abstract

(57)【要約】 【目的】 キーワードを検索キーとして必要とする映像
の検索をする音響声キーワードによる映像検索方法およ
び装置を提供する。 【構成】 映像情報とこの映像情報に対応する音響情報
とを有するデータベース2および3について音響情報を
特徴分析してこれを音響の特徴パラメータ時系列に変換
する音響情報分析部6を具備し、映像検索キーとなるべ
きキーワード音響を特徴分析してこれをキーワード音響
の特徴パラメータ時系列に変換するキーワード特徴分析
部8を具備し、データベース中の音響の特徴パラメータ
時系列と映像検索キーの特徴パラメータ時系列とを比較
することにより、音響情報に含まれる音響をキーワード
として映像情報を検索する音響キーワードによる映像検
索方法および装置。

Description

【発明の詳細な説明】
【0001】
【産業上の利用分野】この発明は、音響キーワードによ
る映像検索方法および装置に関し、特に、音響情報の内
の特に音声情報と映像情報とを有するデータベースにつ
いて、音声情報に含まれる単語をキーワードとして映像
情報を検索する音声キーワードによる映像検索方法およ
び装置に関する。
【0002】
【従来の技術】音響処理技術、映像処理技術その他の信
号処理技術が進歩したことにより、従来、データとして
数値・文字データのみを取り扱ってきたコンピュータ、
ワークステーションの如き計算機において、音声情報お
よび映像情報をもデータとして取り扱うマルチメディア
処理が可能となった(以下の説明は、音響の代表として
特に音声に着目して行われるものとする)。そして、デ
ータの圧縮技術の進歩および記憶装置の大容量化に伴っ
て、取り扱うデータ量も多量になった。多種類の、しか
も多量のデータを取り扱い、蓄積するようになると、必
要な情報の検索を迅速容易に実行することが要望される
に到る。
【0003】情報を検索する方法としては、一般に、情
報に予めインデックスを付与しておき、インデックス付
与された部分を取り出すという方法が採用される。文字
列を取り扱うテキストデータにおいては、文字列検索に
代表される様に、指定されたキーワードとデータとの間
のマッチングとることによって適合箇所にインデックス
を付与していくことができるので、検索も容易である。
しかし、映像情報の様に、連続的でかつ時間とともに内
容が変化する情報の場合は、一定の形状のものを見つけ
出してその映像部分にインデックスを付与することは大
変に困難である。例え、互いに異なる映像情報であって
も、情報を受け取る側にとって共通する意味内容或は関
連をもった情報である場合は、映像部分の共通性に着目
して検索を行う方法に依っては必要な映像を捜し出すこ
とができない。
【0004】映像の情報検索については、従来、以下の
如き方策が採用されてきた。 1、シーケンシャル・サーチ 連続情報である音声と映像とを同時に連続的に再生して
必要な映像を探し出す方法である。 2、タイム・コードとの間の対応を利用 先ず、最初に音声、映像の情報を始めから再生し、その
際タイム・コードを対応づけする。その後、タイム・コ
ードを手掛かりとして必要な映像を取り出す方法であ
る。
【0005】3、画像INDEX 連続的なデータである動画像から例えばカメラ位置の変
化点(シーンの切り替わり)、動画中に含まれる特定の
物体の変化に着目して動画をいくつかの区間に分割した
上で、その各区間における最も変化の少ない部分、最も
変化の大きい部分、或はその区間の最初の映像をその区
間の代表映像としてインデックスとし、これを手がかり
として必要な映像を取り出す方法である。
【0006】
【発明が解決しようとする課題】しかし、上述の方法に
は、次の如き問題がある。 1’シーケンシャル・サーチ 基本的に原データをそのまま再生することによる検索方
式でってインデックス付け或は記号化を行わないので、
大容量の情報検索においては時間がかかる。
【0007】2’タイム・コードとの間の対応を利用 本来、タイム・コードは音声、映像情報とは直接関係の
ない記号であるにもかかわらず、利用者は常に無意味な
記号であるタイム・コードとそれに対応する映像との間
の関係を意識しなくてはならない。 3’画像INDEX 映像の種類によってはシーンの切り替わりが少ないも
の、或は動きの変化が少ないものがあり、変化点をみつ
けにくいものがある。そのために、不必要に細かくイン
デックスがつけられたり、逆に粗すぎるインデックス付
けとなる問題がある。
【0008】この発明は、従来の映像検索方法および装
置の上述の通りの問題を解消するものであり、従来は困
難であった映像へのインデックス付与を可能とし、映像
検索を容易に実施することができる音声キーワードによ
る映像検索方法および装置を提供するものである。
【0009】
【課題を解決するための手段】映像情報とこの映像情報
に対応する音声情報とを有するデータベースについて音
声情報を特徴分析してこれを音声の特徴パラメータ時系
列に変換し、映像検索キーとなるべきキーワード音声を
特徴分析してこれをキーワード音声の特徴パラメータ時
系列に変換し、データベース中の音声の特徴パラメータ
時系列と映像検索キーの特徴パラメータ時系列とを比較
することにより、音声情報に含まれる単語をキーワード
として映像情報を検索する音声キーワードによる映像検
索方法を構成し、そして、映像情報とこの映像情報に対
応する音声情報とを有するデータベース2および3につ
いて音声情報を特徴分析してこれを音声の特徴パラメー
タ時系列に変換する音声情報分析部6を具備し、映像検
索キーとなるべきキーワード音声を特徴分析してこれを
キーワード音声の特徴パラメータ時系列に変換するキー
ワード特徴分析部8を具備し、データベース中の音声の
特徴パラメータ時系列と映像検索キーの特徴パラメータ
時系列とを比較することによりキーワードに相当する部
分を音声情報の中から抽出するキーワード区間抽出部1
0を具備し、抽出された区間に対応する映像情報のアド
レスを記憶するインデックス付与部12を具備し、付与
されたインデックスとその区間に対応する映像を表示す
る検索映像表示部14を具備し、検索結果の映像と音声
を同時に再生する音声・映像出力部15を具備し、音声
情報に含まれる単語をキーワードとして映像情報を検索
する音声キーワードによる映像検索装置、をも構成し
た。
【0010】
【実施例】音声情報と映像情報とを有するデータベース
について、音声情報に含まれる単語をキーワードとし、
映像情報にインデックスを付与して映像検索を実施す
る。音声情報は映像情報と同様に連続情報であり、しか
も時間と共に変化する情報ではあるが、通常の会話にお
いてはキーワードとなる単語が何度も出現する。従っ
て、音声情報の内に含まれるキーワードを利用して、そ
のキーワードが出現する部分の映像を取り出すことは可
能である。この方法によれば、映像情報としては異なる
内容の画面であっても音声情報内容に関連性がある場合
にも検索が可能となる。この発明は、音声情報と映像情
報とを有するデータベースにおいて、予め決められたキ
ーワードを検索するために、キーワードの音声を使用し
て音声情報中に存在するキーワードの発声を抽出し、抽
出されたキーワードをインデックスとすると共に、その
インデックスに対応する映像を表示装置に表示すること
により、音声により映像情報の検索をするものである。
【0011】この発明の実施例を先ず図1を参照して説
明する。図1は音声・映像情報を入力し、音声と映像と
の間の対応づけをし、そして音声情報の分析をする構成
を示すフロー図である。この発明は、音声・映像情報を
入力してこれら両者の対応づけを行うと共に、音声情報
の分析を実施してこれを音声特徴パラメータに変換する
過程、および映像検索を実施する過程の2つに大きく分
けられる。
【0012】音声映像入力部1は外部から音声情報およ
び映像情報を入力するものであり、これら入力された音
声情報および映像情報はそれぞれ音声データ記憶部2お
よび映像データ記憶部3に蓄積される。情報はマイクロ
ホンおよびカメラの如く音声情報と映像情報とが独立し
た2つの媒体を介して入力するのが一般的であるが、音
声情報と映像情報とが一緒に記録されているビデオテー
プレコーダの様な外部記憶媒体から入力することも可能
である。
【0013】音声情報は、コンピュータによる処理を可
能とするために、デジタル情報に変換して音声データ記
憶部2に記憶する。デジタル化する際のサンプリング周
波数は音声品質を考慮すると8KHz以上が望ましい。
以下の説明においては、音声サンプリング周波数は12
KHzであるものとする。音声データはサンプリング番
号を付与されて音声データ記憶部2に記憶されている。
【0014】これに対して、映像情報は入力した後でコ
ンピュータ処理を必要としない。しかし、後から検索を
する必要上、ランダムなアクセスが可能となる様に時間
情報に対応させて映像データ記憶部3に記憶される。具
体的方法としては、デジタル化してコンピュータ内に取
り込み、アドレスをインデックスとして蓄積しておく方
法、ビデオテープレコーデにタイムコードと共に蓄積し
ておく方法その他がある。以下、フレーム番号を検索の
際に利用する場合について説明する。
【0015】音声情報および映像情報の入力を考えると
き、音声情報は12KHzサンプリングの場合は8.3
マイクロ秒に1サンプリングであり、映像は通常は1秒
間に30画面で構成されている点に留意する。入力され
た音声情報と映像情報とは独立して記憶されているの
で、音声情報のキーワードを利用して映像にインデック
スを付与するには、両者の間の対応づけをする必要があ
る。対応をとるには計算式として記憶しておく方法、対
応テーブルを作成する方法その他の方法がある。以下、
対応テーブルを作成する場合を例として説明する。
【0016】音声・映像対応部4は音声と映像との間の
対応関係を示す音声映像対応テーブル5を作成する。こ
こで、音声データ記憶部2および映像データ記憶部3に
記憶されるデータが共に時刻を利用してアクセス可能で
あれば、この場合音声映像対応テーブルは不用である。
ここで、映像情報は1秒間に30フレーム(画面)によ
り構成され、フレーム番号をインデックスとしてアクセ
スすることができ、音声情報は音声サンプリングデータ
の番号(サンプリング番号)をインデックスとして記憶
している場合を例として説明する。この場合、映像情報
1フレームに対して、音声サンプリング数は400とな
る。
【0017】図2は映像フレーム番号と音声サンプリン
グ番号との間の対応を示す音声・映像対応テーブルの例
である。この例は各映像フレーム番号に対応する音声サ
ンプリング番号の始めの数値と終わりの数値とが音声・
映像対応テーブルに格納されている。音声情報分析部6
は音声データ記憶部2に記憶されている音声のディジタ
ルデータを後でキーワードと一致する部分を抽出するこ
とが可能な形態に分析変換する。変換する形態は、キー
ワードと一致する部分を検出するアルゴリズムに依存す
るが、スペクトル分析を行う方法が良く採用される。ス
ペクトル分析を行う場合、高速フーリエ変換およびLP
C分析の手法を使用することができる。また、スペクト
ル分析を行う際、予め定められたフレーム長のディジタ
ル音声データを予め定められたフレームシフト長だけず
らしながら繰り返し処理を行う。結果として、音声スペ
クトルの時系列が音声特徴パラメータ記憶部7に記憶さ
れる。
【0018】図3はこの発明によるキーワードに依り映
像を検索する構成を示すフロー図である。キーワード特
徴分析部8は検索のキーとなるべきキーワードの音声を
分析し、これを特徴パラメータ時系列に変換する。この
場合の分析方法は音声分析部6における音声情報の分析
法と同じものとする。キーワード特徴分析部8により分
析した結果はキーワード特徴パラメータ記憶部9に記憶
される。キーワードは音声情報の中に含まれる単語或は
会話その他の語であるが、キーワードの入力方法として
は2通りが考えられる。第1の方法はキーワードを入力
済みの音声情報から切り出して利用する方法であり、第
2の方法はまったく新たにキーワードを入力する方法で
ある。第1の方法である入力済みの音声から抽出してキ
ーワードとして利用する場合は、入力音声の該当部分を
指示するインタフェースを実現しておく必要がある。こ
れは例えば音声パワーの表示、スペクトルシーケンスの
図示により実施することができる。また、第2の方法の
新たに入力する場合は、キーワード区間を音声情報から
正確に抽出するには音声情報の話し手と同一人物の音声
を入力することが望ましい。
【0019】キーワード区間抽出部10は、データに含
まれる音声情報の特徴パラメータ7とキーワードの特徴
パラメータ9を比較することにより音声情報中のキーワ
ード区間を抽出する。ここにおいては、一般に音声認識
の応用技術であるワードスポッティング技術を利用する
ことができる。ワードスポッティングの手法としては種
々の手法が提案されているが、基本的にはキーワードの
特徴パラメータを逐次ずらしながら音声情報の内の一致
する区間を検索するものである。この場合、音声の時間
的な伸縮を補正するには、DPマッチング法その他の非
線形伸縮を可能とするマッチング法を採用するのが一般
的である。その他にも、音声特徴量をベクトル量子化し
ておいてHMM(隠れマルコフモデル:Hidden
Markov Model)により該当区間を検索する
ものその他、種々の音声認識、ワードスポッティング方
法の利用が可能である。
【0020】キーワード区間抽出部10において音声情
報とキーワードの対応が抽出された場合、一致した区間
の音声情報の開始点の音声サンプリング番号をキーワー
ド区間記憶部11に記憶する。音声情報とキーワードと
の間の比較は全ての音声情報について連続的に実行さ
れ、抽出されたキーワード区間全てに対する音声サンプ
リング番号がキーワード区間記憶部11に記憶される。
【0021】インデックス付与部12は、キーワード区
間記憶部11に記憶されている音声サンプリング番号に
よって音声・映像対応テーブル5を参照して映像情報の
フレーム番号を得る。このフレーム番号をインデックス
位置データ13として記憶する。図4はインデックス位
置データを記憶する例である。ここで、音声・映像テー
ブル5の参照例を図5により説明する。キーワード区間
記憶部11にはこの例の場合音声サンプリング番号10
25が記憶されているものとする。この音声サンプリン
グ番号1025は、音声・映像対応テーブル5上の映像
フレーム番号3のフレーム開始の音声サンプリング番号
801とフレーム終了の音声サンプリング番号1200
の間に位置する番号である。従って、音声サンプリング
番号1025は映像フレーム3に含まれていることがわ
かる。
【0022】この様にして、音声情報のキーワードが出
現する時の映像情報フレームを指定することができ、こ
のフレーム番号をインデックス位置データ13として記
憶する。図5の例はフレーム番号3がインデックス位置
データとして記憶されたものである。検索映像表示部1
4は、インデックス位置データ13に基づいて、検索結
果として代表画面を表示する。代表画面の選択方法に
は、キーワード音声に対応する映像の最初の画面を使用
する方法、キーワードとキーワードの区間を一つのセグ
メントと考えてそのセグメントの内から最も動きの少な
い映像部分を抽出してこれを代表画面とする方法、セグ
メントの内で最も変化の大きい部分を抽出してこれを代
表画面とする方法、キーワードを含む音声の一区間を一
つのブロックと考えてこのブロックの内から最も動きの
少ない部分を抽出してこれを代表画面とする方法、その
他様々の方法がある。これらの方法の内の何れを選択す
るかは、対象としている映像の種類に応じて決定され
る。例えば、スポーツの場合は最も変化が大きい部分、
風景の場合は最も変化の小さい部分、を選択すれば効果
的な検索結果の表示が可能となる。何れの方法を採用し
た場合も、インデックスが付与された映像フレームをも
とに1つの代表映像フレームを選択して画面上に表示す
る。キーワード音声に対応する映像の最初の画面を選択
する場合は、インデックス位置データ13の映像フレー
ム番号をそのまま利用して映像データ記憶部3から映像
を取り出す。キーワード間をセグメントとしてセグレン
ト中の最も動きの少ない映像部分を抽出する場合は、連
続するインデックス位置データ13の2つのフレーム番
号にはさまれる複数の映像フレームから映像の変化の差
分が小さいもの、或は場合によって大きいものを選び出
す。キーワードを含む音声の一区間を一つのブロックと
考えてその区間から代表画面を抽出する方法の場合は、
音声情報に再度注目して、キーワードを含む一続きの音
声部分を音声ブロックとみなしてその音声ブロックに対
応する複数の映像フレームから映像の変化の差分が小さ
いものを選び出す。
【0023】選択した代表画面の表示方法としては、デ
ィスプレイ全体に代表映像を1枚表示してオペレータの
キーボード操作で次々と代表映像を映し出す方法、ディ
スプレイ上に複数の代表映像を並べて表示する方法その
他の方法がある。何れにしても、検索映像表示部14は
インデックスが付与された複数の映像情報からオペレー
タの望む映像を選択できるように検索結果を表示する様
に構成される。
【0024】映像・音声出力部15は検索映像表示部1
4に表示された代表画面をもとに映像情報と音声情報を
同時に出力再生する。出力する情報は検索映像表示部1
4に表示された複数の代表映像から再生したい映像情報
をオペレータに選択させる方法、検索映像表示部14に
表示された映像情報をオペレータのキーボード操作をト
リガとして再生・中止を繰り返しお行うことですべての
代表映像を網羅的に再生する方法がある。映像・音声出
力部15は検索映像表示部14の代表画面を導き出した
インデックス位置データをもとに音声・映像対応テーブ
ルを参照して映像フレーム番号とそのフレームに対応す
る音声サンプリング番号とを得て、対象となる音声情報
と映像情報を音声データ記憶部2、映像データ記憶部3
からとりだして、両者を同時に出力再生する。図6は映
像情報としてはフレーム番号3、音声情報としては音声
・映像対応テーブルを参照してフレーム開始の音声サン
プリング番号801の値を得て、映像・音声出力部が再
生を行う例を示す。
【0025】一般に、映像情報と音声情報とを有するデ
ータベースにおける情報検索を考える場合、或る情報部
分を人間が記憶していてその情報を検索しようとするこ
とがある。この記憶には、映像情報である場合、音声情
報である場合、両者を共に記憶している場合の3通りが
ある。この発明は、これら3通りの内、音声による記憶
に基づいて映像情報を検索する場合に極めて有効なもの
である。
【0026】
【発明の効果】以上の通りであって、映像情報と音声情
報とを有するマルチメディアのデータベースから音声情
報の内に含まれるキーワードを検索キーとして必要とす
る映像の検索をすることができる。これにより連続的な
情報である映像情報を効率的に検索・アクセスすること
ができる。
【図面の簡単な説明】
【図1】音声・映像情報を入力し、音声と映像との間の
対応づけをし、そして音声情報の分析をする構成を示す
フロー図である。
【図2】映像フレーム番号と音声サンプリング番号との
間の対応を示す音声・映像対応テーブルである。
【図3】キーワードに依り映像を検索する構成を示すフ
ロー図である。
【図4】インデックス位置データのテーブルである。
【図5】インデックス付与の際の音声・映像対応テーブ
ル参照の例である。
【図6】映像・音声出力の際の音声・映像対応テーブル
参照の例である。
【符号の説明】
2 音声データ記憶部 3 映像データ記憶部 6 音声情報分析部 8 キーワード特徴分析部 10 キーワード区間抽出部 12 インデックス付与部 14 検索映像表示部 15 音声・映像出力部

Claims (2)

    【特許請求の範囲】
  1. 【請求項1】映像情報とこの映像情報に対応する音響情
    報とを有するデータベースについて音響情報を特徴分析
    してこれを音響の特徴パラメータ時系列に変換し、映像
    検索キーとなるべきキーワード音響を特徴分析してこれ
    をキーワード音響の特徴パラメータ時系列に変換し、デ
    ータベース中の音響の特徴パラメータ時系列と映像検索
    キーの特徴パラメータ時系列とを比較することにより、
    音響情報に含まれる音響をキーワードとして映像情報を
    検索することを特徴とする音響キーワードによる映像検
    索方法。
  2. 【請求項2】映像情報とこの映像情報に対応する音響情
    報とを有するデータベースについて音響情報を特徴分析
    してこれを音響の特徴パラメータ時系列に変換する音響
    情報分析部を具備し、映像検索キーとなるべきキーワー
    ド音響を特徴分析してこれをキーワード音響の特徴パラ
    メータ時系列に変換するキーワード特徴分析部を具備
    し、データベース中の音響の特徴パラメータ時系列と映
    像検索キーの特徴パラメータ時系列とを比較することに
    よりキーワードに相当する部分を音響情報の中から抽出
    するキーワード区間抽出部を具備し、抽出された区間に
    対応する映像情報のアドレスを記憶するインデックス付
    与部を具備し、付与されたインデックスとその区間に対
    応する映像を表示する検索映像表示部を具備し、検索結
    果の映像と音響を同時に再生する音響・映像出力部を具
    備し、音響情報に含まれる音響をキーワードとして映像
    情報を検索することを特徴とする音響キーワードによる
    映像検索装置。
JP4217620A 1992-08-17 1992-08-17 音響キーワードによる映像検索方法および装置 Pending JPH0668168A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP4217620A JPH0668168A (ja) 1992-08-17 1992-08-17 音響キーワードによる映像検索方法および装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP4217620A JPH0668168A (ja) 1992-08-17 1992-08-17 音響キーワードによる映像検索方法および装置

Publications (1)

Publication Number Publication Date
JPH0668168A true JPH0668168A (ja) 1994-03-11

Family

ID=16707151

Family Applications (1)

Application Number Title Priority Date Filing Date
JP4217620A Pending JPH0668168A (ja) 1992-08-17 1992-08-17 音響キーワードによる映像検索方法および装置

Country Status (1)

Country Link
JP (1) JPH0668168A (ja)

Cited By (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH07184160A (ja) * 1993-12-24 1995-07-21 Canon Inc 画像データ及び音声データを処理する装置
JPH096810A (ja) * 1995-06-21 1997-01-10 Matsushita Electric Ind Co Ltd シナリオ編集素材検索装置
WO2000036833A1 (fr) * 1998-12-17 2000-06-22 Matsushita Electric Industrial Co., Ltd. Procede et appareil permettant de retrouver vocalement des scenes video ou audio
JP2002084492A (ja) * 2000-09-08 2002-03-22 Just Syst Corp 編集処理装置、及び編集処理プログラムが記憶された記憶媒体
JP2002175304A (ja) * 1998-12-17 2002-06-21 Matsushita Electric Ind Co Ltd 映像検索装置及びその方法
US8006186B2 (en) 2000-12-22 2011-08-23 Muvee Technologies Pte. Ltd. System and method for media production
US8433575B2 (en) * 2002-12-24 2013-04-30 Ambx Uk Limited Augmenting an audio signal via extraction of musical features and obtaining of media fragments
JP2014078960A (ja) * 2013-11-21 2014-05-01 Olympus Imaging Corp 画像再生装置及び画像再生装置の再生方法

Cited By (11)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH07184160A (ja) * 1993-12-24 1995-07-21 Canon Inc 画像データ及び音声データを処理する装置
JPH096810A (ja) * 1995-06-21 1997-01-10 Matsushita Electric Ind Co Ltd シナリオ編集素材検索装置
WO2000036833A1 (fr) * 1998-12-17 2000-06-22 Matsushita Electric Industrial Co., Ltd. Procede et appareil permettant de retrouver vocalement des scenes video ou audio
EP1058453A1 (en) * 1998-12-17 2000-12-06 Matsushita Electric Industrial Co., Ltd. Method and apparatus for retrieving desired video and audio scene using voice recognition
EP1058453A4 (en) * 1998-12-17 2002-03-13 Matsushita Electric Ind Co Ltd METHOD AND APPARATUS FOR VOICE-FINDING VIDEO OR AUDIO SCENES
JP2002175304A (ja) * 1998-12-17 2002-06-21 Matsushita Electric Ind Co Ltd 映像検索装置及びその方法
US6611803B1 (en) 1998-12-17 2003-08-26 Matsushita Electric Industrial Co., Ltd. Method and apparatus for retrieving a video and audio scene using an index generated by speech recognition
JP2002084492A (ja) * 2000-09-08 2002-03-22 Just Syst Corp 編集処理装置、及び編集処理プログラムが記憶された記憶媒体
US8006186B2 (en) 2000-12-22 2011-08-23 Muvee Technologies Pte. Ltd. System and method for media production
US8433575B2 (en) * 2002-12-24 2013-04-30 Ambx Uk Limited Augmenting an audio signal via extraction of musical features and obtaining of media fragments
JP2014078960A (ja) * 2013-11-21 2014-05-01 Olympus Imaging Corp 画像再生装置及び画像再生装置の再生方法

Similar Documents

Publication Publication Date Title
JP4905103B2 (ja) 動画再生装置
US7792831B2 (en) Apparatus, system and method for extracting structure of song lyrics using repeated pattern thereof
JP4873018B2 (ja) データ処理装置、データ処理方法、及び、プログラム
US20090234854A1 (en) Search system and search method for speech database
WO2000036833A1 (fr) Procede et appareil permettant de retrouver vocalement des scenes video ou audio
JPH06110945A (ja) 音楽データベース作成装置及びその検索装置
JPH10320400A (ja) 映像の検索方法および装置
US20060074895A1 (en) Method and system for extracting and utilizing metadata to improve accuracy in speech to text conversions
CN110781328A (zh) 基于语音识别的视频生成方法、***、装置和存储介质
JP5296598B2 (ja) 音声情報抽出装置
EP1403852B1 (en) Voice activated music playback system
JPH0668168A (ja) 音響キーワードによる映像検索方法および装置
JP2004289530A (ja) 記録再生装置
JP3798991B2 (ja) 音声信号検索方法,音声信号検索装置,そのプログラムおよびそのプログラムの記録媒体
KR100392256B1 (ko) 내용기반 멀티채널 감시비디오 색인 및 검색장치와 방법
JP2003224791A (ja) 映像の検索方法および装置
JPH0630367A (ja) 映像検索方法および装置
JP2000341631A (ja) 映像検索方法及び装置並びに映像検索プログラムを記録した記録媒体
JP3021252B2 (ja) データ検索方法及びデータ検索装置
CN111339359A (zh) 一种基于九宫格的视频缩略图自动生成方法
JP4329603B2 (ja) 動画編集装置及び動画編集方法
JP2002304420A (ja) 視聴覚コンテンツ配信システム
KR100493635B1 (ko) 멀티미디어 데이터 검색 및 브라우징 시스템
KR102384263B1 (ko) 음성 인덱싱을 이용한 비디오 가공 방법 및 장치
JP2001265779A (ja) 音響検索方法