JP2002044610A - 信号検出方法、装置及びそのプログラム、記録媒体 - Google Patents

信号検出方法、装置及びそのプログラム、記録媒体

Info

Publication number
JP2002044610A
JP2002044610A JP2001123098A JP2001123098A JP2002044610A JP 2002044610 A JP2002044610 A JP 2002044610A JP 2001123098 A JP2001123098 A JP 2001123098A JP 2001123098 A JP2001123098 A JP 2001123098A JP 2002044610 A JP2002044610 A JP 2002044610A
Authority
JP
Japan
Prior art keywords
time
series signal
signal
input
feature
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP2001123098A
Other languages
English (en)
Other versions
JP3408800B2 (ja
Inventor
Takayuki Kurozumi
隆行 黒住
Kunio Kayano
邦夫 柏野
Hiroshi Murase
洋 村瀬
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Nippon Telegraph and Telephone Corp
Original Assignee
Nippon Telegraph and Telephone Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Nippon Telegraph and Telephone Corp filed Critical Nippon Telegraph and Telephone Corp
Priority to JP2001123098A priority Critical patent/JP3408800B2/ja
Publication of JP2002044610A publication Critical patent/JP2002044610A/ja
Application granted granted Critical
Publication of JP3408800B2 publication Critical patent/JP3408800B2/ja
Anticipated expiration legal-status Critical
Expired - Lifetime legal-status Critical Current

Links

Landscapes

  • Television Signal Processing For Recording (AREA)

Abstract

(57)【要約】 【課題】 より特徴変動に頑健な信号検出を行うことが
できるようにする。 【解決手段】 参照時系列信号から、参照特徴時系列信
号を導く参照特徴計算手段10と、入力時系列信号か
ら、入力特徴時系列信号を導く入力特徴計算手段11
と、参照特徴時系列信号を、参照符号時系列信号に変換
する参照特徴符号化手段14と、参照符号時系列信号に
対して変動を付加する変動付加手段13と、入力符号時
系列信号中に照合区間を設定し、該照合区間と前記参照
符号時系列信号と、それぞれについて作成したヒストグ
ラムに基づいて類似度を計算するヒストグラム照合手段
16とを有する。

Description

【発明の詳細な説明】
【0001】
【発明の属する技術分野】本発明は、時系列信号(また
は時系列データ)の中から、あらかじめ登録した信号
(またはデータ)と類似した信号の場所を探し出す信号
検出方法、信号検出装置及びそのプログラム、記録媒体
に関するものであり、例えば、映像信号検出に利用する
ことができる。すなわち、テレビ放送の映像信号の中か
ら特定のコマーシャルの放映された時間を検出して自動
記録を行ったり、特定の映像を参照信号としてテレビ放
送やインターネット上のコンテンツから同一の映像を含
むコンテンツを検索することを可能とする技術に関連す
る。さらに、本発明は、映像信号だけではなく、音響信
号など一般の信号の検出にも応用できる。
【0002】
【従来の技術】従来、この種の信号検出方法に関して
は、「高速信号探索方法、装置およびその記録媒体」
(特許第3065314号)のように、あらかじめ登録
した音響信号と類似した音響信号の場所を探し出す音響
信号検出方法が知られている。
【0003】
【発明が解決しようとする課題】しかし、上述した従来
の信号検出方法では、参照時系列信号、または入力時系
列信号のノイズによる特徴変動が少ないことが想定され
ており、従って、特徴変動が激しい場合、探索精度が低
下する可能性があるという問題があった。本発明は、こ
のような事情に鑑みてさなれたものであり、特徴変動を
考慮した信号検出処理を行うことにより、より特徴変動
に頑健な信号検出を行うことができる信号検出方法、装
置及びそのプログラム、記録媒体を提供することを目的
とする。
【0004】
【課題を解決するための手段】従って、本発明は、入力
時系列信号から、あらかじめ登録した、前記入力時系列
信号よりも短い参照時系列信号に類似した部分を探し出
す信号検出方法において、前記参照時系列信号から、特
徴ベクトルからなる参照特徴時系列信号を導く参照特徴
計算処理と、前記入力時系列信号から、特徴ベクトルか
らなる入力特徴時系列信号を導く入力特徴計算処理と、
前記参照特徴時系列信号を、分類を表す符号からなる参
照符号時系列信号に変換する参照特徴符号化処理と、前
記入力特徴時系列信号を、分類を表す符号からなる入力
符号時系列信号に変換する入力特徴符号化処理と、前記
参照時系列信号と、前記入力時系列信号と、前記参照特
徴時系列信号と、前記入力特徴時系列信号と、前記参照
符号時系列信号と、前記入力符号時系列信号のうち少な
くとも1つに対して変動を付加する変動付加処理と、前
記入力符号時系列信号中に照合区間を設定し、前記参照
符号時系列信号と、前記入力符号時系列信号中の該照合
区間それぞれについてヒストグラムを作成し、両ヒスト
グラムに基づいて前記入力符号時系列信号の照合区間と
前記参照符号時系列信号との類似度を計算するヒストグ
ラム照合処理とを有し、前記類似度と、あらかじめ設定
した目標とする類似度とを比較し、前記ヒストグラム照
合処理を前記入力符号時系列信号中の前記照合区間を変
えながら繰り返すことにより、前記参照時系列信号が、
前記入力時系列信号の当該箇所に存在するかどうかを決
定することを特徴とする信号検出方法を提供する。
【0005】これによれば、前述した特許第30653
14号開示の方法に比べて、新たに変動付加処理を設け
て特徴変動を考慮することにより、特徴の変動に対して
頑健な信号検出が可能となる。
【0006】前記変動付加処理において、以下の各形態
が可能である。 (1) 前記参照時系列信号、または前記入力時系列信
号に変動を付加する場合、1つの参照時系列信号、また
は入力時系列信号の各時間セクションの信号部分に対し
て多数の変動を付加した信号を生成する。 (2) 前記参照特徴時系列信号、または前記入力特徴
時系列信号に変動を付加する場合、1つの前記特徴ベク
トルに対して多数の変動を付加した特徴ベクトルを生成
する。 (3) 前記参照符号時系列信号、または前記入力符号
時系列信号に変動を付加する場合、1つの参照符号時系
列信号、または入力符号時系列信号を構成する各々の符
号に対して多数の変動を付加した信号を生成する。
【0007】前記変動付加処理において特徴の変動をさ
せるための変動量を前もって算出する学習処理を更に有
し、前記変動付加処理において、前記学習処理が算出し
た変動量に基づいて変動を付加しても良い。更に、前記
参照時系列信号が前記入力時系列信号の当該箇所に存在
するかどうかを決定した検出結果に基づいて、前記学習
処理において算出される変動量を補正しても良い。ま
た、前記変動付加処理は、乱数を利用して変動を付加し
ても良い。更に、前記変動付加処理において、特徴の変
動をさせるための変動量を正規分布により、平行移動量
と分散量をパラメータとしてモデル化し、前記平行移動
量と前記分散量の少なくとも一方を用いて、変動を付加
するようにしても良い。
【0008】本発明はまた、入力時系列信号から、あら
かじめ登録した、前記入力時系列信号よりも短い参照時
系列信号に類似した部分を探し出す信号検出装置におい
て、前記参照時系列信号から、特徴ベクトルからなる参
照特徴時系列信号を導く参照特徴計算手段と、前記入力
時系列信号から、特徴ベクトルからなる入力特徴時系列
信号を導く入力特徴計算手段と、前記参照特徴時系列信
号を、分類を表す符号からなる参照符号時系列信号に変
換する参照特徴符号化手段と、前記入力特徴時系列信号
を、分類を表す符号からなる入力符号時系列信号に変換
する入力特徴符号化手段と、前記参照時系列信号と、前
記入力時系列信号と、前記参照特徴時系列信号と、前記
入力特徴時系列信号と、前記参照符号時系列信号と、前
記入力符号時系列信号のうち少なくとも1つに対して変
動を付加する変動付加手段と、前記入力符号時系列信号
中に照合区間を設定し、前記参照符号時系列信号と、前
記入力符号時系列信号中の該照合区間それぞれについて
ヒストグラムを作成し、両ヒストグラムに基づいて前記
入力符号時系列信号の照合区間と前記参照符号時系列信
号との類似度を計算するヒストグラム照合手段とを有
し、前記ヒストグラム照合手段は、前記入力符号時系列
信号中の前記照合区間を変えながら各照合区間毎に前記
類似度を求め、該類似度とあらかじめ設定した目標とす
る類似度とを比較し、この比較動作を照合区間を変える
毎に繰り返すことにより、参照時系列信号が、入力時系
列信号の当該箇所に存在するかどうかを決定することを
特徴とする信号検出装置を提供する。
【0009】前記変動付加手段においても、上記(1)
〜(3)の各形態が可能である。また、前記ヒストグラ
ム照合手段が決定した検出結果を前記学習手段にフィー
ドバックし、前記学習手段は、前記検出結果に基づいて
前記変動量を補正するようにしても良い。前記変動付加
手段は、乱数を利用して変動を付加しても良い。また、
前記変動付加手段は、特徴の変動をさせるための変動量
を正規分布により、平行移動量と分散量をパラメータと
してモデル化し、前記平行移動量と前記分散量の少なく
とも一方を用いて、変動を付加しても良い。
【0010】一例として、前記入力時系列信号、前記参
照時系列信号は、それぞれ映像信号である。また、別例
として、前記入力時系列信号、前記参照時系列信号は、
それぞれ音響信号である。本発明はまた、上記信号検出
方法に対応する信号検出処理をコンピュータに実行させ
るためのプログラム、該プログラムを記録した、コンピ
ュータにより読み取り可能な記録媒体をそれぞれ提供す
る。
【0011】
【発明の実施の形態】以下、本発明の実施の形態を、図
面を参照して詳細に説明する。本発明の実施の形態に係
る、映像信号を対象とする信号検出装置の構成を図1に
示す。図1において、本実施形態に係る信号検出装置1
は、参照特徴計算手段10と、入力特徴計算手段11
と、学習手段12と、参照特徴変動付加手段13と、参
照特徴符号化手段14と、入力特徴符号化手段15と、
ヒストグラム照合手段16とを有し、参照時系列信号、
すなわち見本となる検索したい映像信号と、入力時系列
信号すなわち検索される映像信号とを入力とし、参照時
系列信号との類似度があらかじめ設定した値(これを探
索閾値という)θを越える入力時系列信号の箇所を出力
する。
【0012】参照特徴計算手段10は、入力端子100
から入力される参照時系列信号から、特徴ベクトルから
なる参照特徴時系列信号を導く参照特徴計算処理を行な
う機能を有する。また、入力特徴計算手段11は、入力
端子101から入力される入力時系列信号から、特徴ベ
クトルからなる入力特徴時系列信号を導く入力特徴計算
処理を行なう機能を有する。学習手段12は、特徴の変
動量を前もって算出する学習処理を行なう機能を有す
る。
【0013】参照特徴変動付加手段13は、前記特徴ベ
クトルからなる参照特徴時系列信号に対して、変動を付
加する変動付加処理を行なう機能を有する。参照特徴符
号化手段14は、前記参照特徴時系列信号を、分類を表
す符号からなる参照符号時系列信号に変換する参照特徴
符号化処理を行なう機能を有する。入力特徴符号化手段
15は、前記入力特徴時系列信号を、分類を表す符号か
らなる入力符号時系列信号に変換する入力特徴符号化処
理を行なう機能を有する。
【0014】ヒストグラム照合手段16は、前記入力符
号時系列信号中に照合区間を設定し、前記参照符号時系
列信号と、前記入力符号時系列信号中の該照合区間それ
ぞれについてヒストグラムを作成し、該ヒストグラムに
基づいて類似度を計算するヒストグラム照合処理を行な
う機能を有する。ヒストグラム照合手段16は、入力符
号時系列信号中の前記照合区間を変えながら各照合区間
毎に類似度を求め、該類似度と予め設定した目標とする
類似度とを比較し、この比較動作を、照合区間を変える
毎に繰り返すことにより、参照時系列信号が入力時系列
信号の当該箇所に存在するかどうかを決定する。上記各
手段の機能は、実際にはコンピュータにより実現され
る。
【0015】次に、上記構成からなる本実施の形態に係
る信号検出装置の動作を具体的に説明する。図6は、図
1に示す信号検出装置の動作を示すフローチャートであ
る。参照特徴計算手段10では、はじめに、入力端子1
00を介して与えられた参照時系列信号を読み込む(ス
テップS1)。次に、読み込んだ参照時系列信号に対し
て特徴抽出を行う(ステップS2)。本実施の形態で
は、特徴として縮小画像を用いる。例えば、テレビの放
送信号から15秒程度の映像信号を検索したい場合に、
特徴抽出の具体的な設定を次のようにすると、良い結果
が得られる。すなわち、1フレームの画像を横に4等分
割、縦に3等分割することにより、12個の領域を設
け、各領域内でR(赤)、G(緑)、B(青)、それぞ
れについて画素値を平均する。前記12個の領域におけ
るR、G、B、それぞれの平均画素値(画素値の合計÷
画素数)からなる36次元ベクトルを特徴ベクトルとす
る。この場合、前記特徴ベクトルは1フレーム毎に得ら
れる。
【0016】また、入力特徴計算手段11では、はじめ
に、入力端子101を介して入力時系列信号を読み込む
(ステップS11)。次に、読み込んだ入力時系列信号
に対して特徴抽出を行う(ステップS12)。特徴抽出
は、前記参照特徴計算手段10において行ったものと同
じ操作を行う。
【0017】学習手段12では、はじめに、参照時系列
信号や入力時系列信号とは別の十分長い映像信号を用意
する。次に、特徴変動の要因となる装置を介して、前記
映像信号を信号検出装置に取り込む。ここで、特徴変動
の要因となる装置とは、例えば、ダビングする装置やフ
レームを間引く装置などがこれに該当する。それとは別
に、前記映像信号をそのまま信号検出装置に取り込む。
【0018】次いで、学習手段12は、前記特徴変動の
要因となる装置を介した映像信号と、前記そのまま信号
検出装置に取り込んだ映像信号を1フレーム毎に対応付
け、映像対を作成する。前記映像対から、参照時系列信
号から入力時系列信号への変動の確率分布を得る。この
確率分布は、次のようにモデル化すると、良い結果が得
られる。すなわち、この確率分布は、正規分布によりモ
デル化したものを用いる。特徴ベクトルのベクトル空間
に複数の分割領域を設定し、該モデルのパラメータは該
分割領域毎の平行移動量と分散量とする。前記分割領域
は、前もって6時間分の映像信号から、公知の方法であ
るLGBアルゴリズムにより4096個の代表ベクトル
を求め、最も近い該代表ベクトルが同一である特徴ベク
トルのベクトル空間上の領域毎に分割された領域であ
る。
【0019】参照特徴変動付加手段13では、はじめ
に、参照特徴計算手段10により得られた参照特徴時系
列信号の特徴ベクトル毎に、図2示すように、前記平行
移動量と前記分散量をもつ正規分布に基づいた正規乱数
を発生させて、該正規乱数を参照特徴時系列信号に付加
する(ステップS3)。
【0020】参照特徴符号化手段14では、はじめに、
前記参照特徴変動付加手段13から得られた変動を付加
した参照特徴時系列信号を読み込む。前記変動を付加し
た参照特徴時系列信号のそれぞれの特徴ベクトルに対し
て前記代表ベクトルの中から最も近い代表ベクトルを計
算し、その代表ベクトルの番号を、分類を表す符号とす
る(ステップS4)。入力特徴符号化手段15では、は
じめに、前記入力特徴時系列信号を読み込む。前記参照
特徴符号化手段14と同様の処理を行い、分類を表す符
号を計算する(ステップS14)。
【0021】ヒストグラム照合手段16では、はじめ
に、参照特徴符号化手段14及び、入力特徴符号化手段
15から出力された、分類を表す符号を読み込む。次
に、ヒストグラム照合手段は、参照符号時系列信号につ
いてのヒストグラムを計算する(ステップS6)。すな
わち、ヒストグラムの横軸は分類を表す符号となり、縦
軸はその符号の頻度となる。続いて、入力符号時系列信
号に対して照合区間を設定する(ステップS15)。
【0022】まず、ヒストグラム照合手段16は、参照
特徴符号化手段14で与えられた参照符号時系列信号と
同じ長さの照合区間を設定する。次に、照合区間内の入
力符号時系列信号から、ヒストグラムを作成する(ステ
ップS16)。このヒストグラムは、上記参照符号時系
列信号で行ったものと同じ方法によって行う。続いて、
参照符号時系列信号と入力符号時系列信号の照合区間の
ヒストグラムの類似度を計算する(ステップS21)。
参照符号時系列信号のヒストグラムHRと入力符号時系
列信号の照合区間のヒストグラムHIとの類似度S
RIは、次のように定義される。
【数1】 ただし、Lはヒストグラムのビンの総数(本実施例では
4096)、Dはヒストグラムの総度数(一つの参照時
系列信号から導かれた特徴ベクトルの総数)であり、h
Rl,hIlは、それぞれHR,HIのl番目のビンに含まれ
る特徴ベクトルの数(度数)を表す。
【0023】ヒストグラム照合手段16は、求めた類似
度の値が予め設定した値を越えている場合は、参照時系
列信号が入力時系列信号中に存在したことを意味するの
で(ステップS22)、信号検出結果として、入力時系
列信号中の照合区間の現在位置を示す信号を出力子10
2より出力する(ステップS23)。この出力信号に基
づいて、自動映像記録や特定のコンテンツ検索等の、様
々な制御を行うことができる。また、マッチング結果と
しての「時刻−類似度」のリスト等をディスプレイ(図
示略)に表示しても良い。
【0024】次に、この発明を適用した装置の動作実験
例を示す。本発明の効果を確認するため、10分の映像
信号を入力時系列信号とし、無作為に選択した200個
の参照時系列信号(15秒間)について探索を行い、本
発明を適用しなかった場合と精度を比較した。入力時系
列信号は、あるテレビ放送の映像信号をそのまま装置に
取り込んだもの、ビデオデッキでダビングを2回してか
ら装置に取り込んだもの、ダビングを4回してから装置
に取り込んだものの合計3つ用意した。なお、参照時系
列信号については、上記入力時系列信号とは別にあるテ
レビ放送の映像信号をそのまま装置に取り込んだものを
使用した。
【0025】精度は、探索閾値の設定を調節して、適合
率と再現率が等しくなるときの値(即ち、適合率または
再現率)とした。ここで適合率とは、探索結果として出
力されたもののうち正しいものの割合をいい、再現率と
は、探索されるべきもののうち探索結果として出力され
たもの割合をいうものとする。本明細書でいう適合率や
再現率は、探索閾値の設定によって変化するが、本実験
では、探索閾値を次式によって定めた。
【数2】 ここで、mとνは、それぞれ、与えられた参照時系列信
号について入力時系列信号をサンプリングし、予備的に
類似度の計算を行って収集した類似度の平均と標準偏差
であり、tは経験的に与えられる係数である。ただし、
式(2)において、θが1を越えるときは、θ=1、θ
が0を下回るときはθ=0とした。本実験では、式
(2)におけるtの値を200回の処理繰り返し中一定
とし、その値を適合率と再現率がほぼ等しくなるように
調節した。
【0026】本実験の結果、上記精度は、図3に示すよ
うに、ダビング4回の場合、従来法で79.9%、本発
明による方法(提案法)で93.9%であった。このよ
うに、本発明による信号検出装置、信号検出方法によ
り、信号検出精度、すなわち信号探索精度が向上したこ
とを確認することができる。尚、本実施の形態では、参
照特徴変動付加手段13が、参照特徴計算手段10の出
力である参照特徴時系列信号に対して変動を付加するよ
うにしているが、本発明はこれに限らず、参照時系列信
号、入力時系列信号、参照特徴時系列信号、入力特徴時
系列信号、参照符号時系列信号、入力符号時系列信号の
うちの少なくとも1つに変動を与えるものであればよ
い。
【0027】参照時系列信号、または前記入力時系列信
号に変動を付加する場合、1つの参照時系列信号、また
は入力時系列信号の各時間セクションの信号部分に対し
て多数の変動を付加した信号を生成するようにしても良
い。また、参照特徴時系列信号、または入力特徴時系列
信号に変動を付加する場合、1つの前記特徴ベクトルに
対して多数の変動を付加した特徴ベクトルを生成するよ
うにしても良い。また、参照符号時系列信号、または入
力符号時系列信号に変動を付加する場合、1つの参照符
号時系列信号、または入力符号時系列信号を構成する各
々の符号に対して多数の変動を付加した信号を生成する
ようにしても良い。
【0028】また、上述した信号検出方法をコンピュー
タにより実行させるためのプログラムをコンピュータに
より読み取り可能な記録媒体に記録して、この記録媒体
に記録されたプログラムをコンピュータシステムに読み
込ませ、実行することにより信号検出機能を実現するよ
うにしてもよい。なお、ここでいう「コンピュータシス
テム」とは、OSや周辺機器等のハードウェアを含むも
のとする。また、「コンピュータシステム」は、WWW
システムを利用している場合であれば、ホームページ提
供環境(あるいは表示環境)を含むものとする。
【0029】また、「コンピュータ読み取り可能な記録
媒体」とは、フレキシブルディスク、光磁気ディスク、
ROM、CD−ROM等の可搬媒体、コンピュータシス
テムに内蔵されるハードディスク等の記憶装置のことを
いう。さらに「コンピュータ読み取り可能な記録媒体」
とは、インターネット等のネットワークや電話回線等の
通信回線を介してプログラムを送信する場合の通信線の
ように、短時間の間、動的にプログラムを保持するも
の、その場合のサーバやクライアントとなるコンピュー
タシステム内部の揮発性メモリのように、一定時間プロ
グラムを保持しているものも含むものとする。
【0030】また上記プログラムは、前述した機能の一
部を実現するためのものであっても良く、さらに前述し
た機能をコンピュータシステムにすでに記録されている
プログラムとの組み合わせで実現できるもの、いわゆる
差分ファイル(差分プログラム)であっても良い。
【0031】以上に説明したように、本発明の実施の形
態に係る信号検出装置によれば、長い入力時系列信号か
ら、あらかじめ登録した短い参照時系列信号に類似した
部分を探し出す場合に、特徴変動を付加する変動付加手
段を設けて特徴変動を考慮した信号検出処理を行うこと
により、ターゲットとなる位置の類似度を高めるととも
に、それ以外の場所での類似度を低めて、検出漏れや誤
検出を防ぐことによって、従来の信号検出装置に比較し
て、より特徴変動に頑健な信号検出を行うことができ
る。
【0032】また、図4に示すように、ヒストグラム照
合手段16から出力される信号検出結果を示す信号を学
習手段120に入力してフィードバックし、類似度等の
信号検出結果に基づいて、学習した特徴の変動量を補正
する(即ち、再学習する)ようにしても良い。
【0033】次に、音響信号の信号検出に本発明を適用
した実施形態を示す。近年、ノート型コンピュータやP
DA,携帯電話のような携帯端末を用いて情報検索を行
う機会が増えてきている。このような携帯端末も、文字
情報だけでなく、音や映像も扱えるようになり、今後、
携帯端末を用いた音や映像の検索の二一ズが増加すると
考えられる。
【0034】携帯端末を用いた音や映像の検索として、
発明者等は、実環境中で流れている音から携帯電話を通
して抽出された信号を探索キーとして音の探索を行なう
システムを検討している。このような探索が実現すれ
ば,街角で流れている楽曲を携帯電話に入力することに
より、その楽曲に関するアーティストやCD、コンサー
ト情報などを検索するといったような新しい情報検索が
可能となる。この場合の問題点として、膨大な音響信号
のデータから入力した目的信号を高速に探索しなければ
ならないという問題、実環境中の雑音によって特徴が変
形してしまっているという問題が挙げられる。本発明に
よる手法は、このような問題の解決に有効である。
【0035】図5は、本実施形態における信号検出装置
50の構成を示すブロック図である。一例として、9分
間のCDの音楽データを(長い)入力時系列信号、この
9分間のCDの音楽データを様々な端末を通して得られ
た信号から7.5秒を切り出したものを(短い)参照時
系列信号とする。この場合、参照時系列信号を出力する
端末側が特徴変動の要因となる装置にあたるので、図5
に示すように、学習手段52、入力特徴変動付加手段5
3を、入力時系列信号側に設ける。
【0036】即ち、学習手段52は、図1の学習手段1
2と同様に特徴の変動量を前もって学習により求める学
習処理を行なう機能を有するものであり、特徴変動の要
因となる端末を介した所定の学習用音響信号と、そのま
ま装置に取り込んだ該学習用音響信号とを用いて、入力
時系列信号から参照時系列信号への変動の確率分布を得
る。ここでは、特徴ベクトルとして帯域通過フィルタを
用いて得られた周波数スペクトルを用いる。入力特徴変
動付加手段53では、入力特徴計算手段11により得ら
れた入力特徴時系列信号の特徴ベクトル毎に、変動付加
処理を行なう。
【0037】このように、本発明による信号検出装置及
び方法は、変動付加手段を適正な位置に設けることによ
り、各種の信号に対して有効に適用することができる。
【0038】
【発明の効果】以上説明したように、本発明によれば、
長い入力時系列信号から、あらかじめ登録した、それよ
りも短い参照時系列信号に類似した部分を探し出す場合
に、特徴変動を考慮した信号検出処理を行うことによ
り、ターゲットとなる位置の類似度を高めるとともに、
それ以外の場所での類似度を低めて、検出漏れや誤検出
を防ぐことができる。これにより、従来の信号検出方法
に比べて、より特徴変動に頑健な信号検出を行なうこと
ができる。
【図面の簡単な説明】
【図1】 本発明の実施の形態に係る映像信号を対象と
する信号検出装置の構成を示すブロック図である。
【図2】 同信号検出装置の作用を説明する図である。
【図3】 本発明と従来法との信号探索精度の比較結果
を示すグラフである。
【図4】 図1の信号検出装置の変形例を示すブロック
図である。
【図5】 本発明の他の実施の形態に係る信号検出装置
の構成を示すブロック図である。
【図6】 図1に示す信号検出装置の動作を示すフロー
チャートである。
【符号の説明】
1、50 信号検出装置 10 参照特徴計算手段 11 入力特徴計算手段 12、52、120 学習手段 13 参照特徴変動付加手段(変動付加手
段) 14 参照特徴符号化手段 15 入力特徴符号化手段 16 ヒストグラム照合手段 53 入力特徴変動付加手段(変動付加手
段) 100、101 入力端子 102 出力端子
───────────────────────────────────────────────────── フロントページの続き (72)発明者 村瀬 洋 東京都千代田区大手町二丁目3番1号 日 本電信電話株式会社内 Fターム(参考) 5C053 FA15 FA30 HA29 LA11 5D015 GG01 KK01

Claims (22)

    【特許請求の範囲】
  1. 【請求項1】 入力時系列信号から、あらかじめ登録
    した、前記入力時系列信号よりも短い参照時系列信号に
    類似した部分を探し出す信号検出方法において、 前記参照時系列信号から、特徴ベクトルからなる参照特
    徴時系列信号を導く参照特徴計算処理と、 前記入力時系列信号から、特徴ベクトルからなる入力特
    徴時系列信号を導く入力特徴計算処理と、 前記参照特徴時系列信号を、分類を表す符号からなる参
    照符号時系列信号に変換する参照特徴符号化処理と、 前記入力特徴時系列信号を、分類を表す符号からなる入
    力符号時系列信号に変換する入力特徴符号化処理と、 前記参照時系列信号と、前記入力時系列信号と、前記参
    照特徴時系列信号と、前記入力特徴時系列信号と、前記
    参照符号時系列信号と、前記入力符号時系列信号のうち
    少なくとも1つに対して変動を付加する変動付加処理
    と、 前記入力符号時系列信号中に照合区間を設定し、前記参
    照符号時系列信号と、前記入力符号時系列信号中の該照
    合区間それぞれについてヒストグラムを作成し、両ヒス
    トグラムに基づいて前記入力符号時系列信号の照合区間
    と前記参照符号時系列信号との類似度を計算するヒスト
    グラム照合処理とを有し、 前記類似度と、あらかじめ設定した目標とする類似度と
    を比較し、前記ヒストグラム照合処理を前記入力符号時
    系列信号中の前記照合区間を変えながら繰り返すことに
    より、前記参照時系列信号が、前記入力時系列信号の当
    該箇所に存在するかどうかを決定することを特徴とする
    信号検出方法。
  2. 【請求項2】 前記変動付加処理において、前記参照
    時系列信号、または前記入力時系列信号に変動を付加す
    る場合、1つの参照時系列信号、または入力時系列信号
    の各時間セクションの信号部分に対して多数の変動を付
    加した信号を生成することを特徴とする請求項1に記載
    の信号検出方法。
  3. 【請求項3】 前記変動付加処理において、前記参照
    特徴時系列信号、または前記入力特徴時系列信号に変動
    を付加する場合、1つの前記特徴ベクトルに対して多数
    の変動を付加した特徴ベクトルを生成することを特徴と
    する請求項1に記載の信号検出方法。
  4. 【請求項4】 前記変動付加処理において、前記参照
    符号時系列信号、または前記入力符号時系列信号に変動
    を付加する場合、1つの参照符号時系列信号、または入
    力符号時系列信号を構成する各々の符号に対して多数の
    変動を付加した信号を生成することを特徴とする請求項
    1に記載の信号検出方法。
  5. 【請求項5】 前記変動付加処理において特徴の変動
    をさせるための変動量を前もって算出する学習処理を更
    に有し、 前記変動付加処理において、前記学習処理が算出した変
    動量に基づいて変動を付加することを特徴とする請求項
    1に記載の信号検出方法。
  6. 【請求項6】 前記参照時系列信号が前記入力時系列
    信号の当該箇所に存在するかどうかを決定した検出結果
    に基づいて、前記学習処理において算出される変動量を
    補正することを特徴とする請求項5に記載の信号検出方
    法。
  7. 【請求項7】 前記変動付加処理は、乱数を利用して
    変動を付加することを特徴とする請求項1に記載の信号
    検出方法。
  8. 【請求項8】 前記変動付加処理において、 特徴の変動をさせるための変動量を正規分布により、平
    行移動量と分散量をパラメータとしてモデル化し、 前記平行移動量と前記分散量の少なくとも一方を用い
    て、変動を付加することを特徴とする請求項5または7
    のいずれかに記載の信号検出方法。
  9. 【請求項9】 前記入力時系列信号、前記参照時系列
    信号は、それぞれ映像信号である請求項1に記載の信号
    検出方法。
  10. 【請求項10】 前記入力時系列信号、前記参照時系
    列信号は、それぞれ音響信号である請求項1に記載の信
    号検出方法。
  11. 【請求項11】 入力時系列信号から、あらかじめ登
    録した、前記入力時系列信号よりも短い参照時系列信号
    に類似した部分を探し出す信号検出装置において、 前記参照時系列信号から、特徴ベクトルからなる参照特
    徴時系列信号を導く参照特徴計算手段と、 前記入力時系列信号から、特徴ベクトルからなる入力特
    徴時系列信号を導く入力特徴計算手段と、 前記参照特徴時系列信号を、分類を表す符号からなる参
    照符号時系列信号に変換する参照特徴符号化手段と、 前記入力特徴時系列信号を、分類を表す符号からなる入
    力符号時系列信号に変換する入力特徴符号化手段と、 前記参照時系列信号と、前記入力時系列信号と、前記参
    照特徴時系列信号と、前記入力特徴時系列信号と、前記
    参照符号時系列信号と、前記入力符号時系列信号のうち
    少なくとも1つに対して変動を付加する変動付加手段
    と、 前記入力符号時系列信号中に照合区間を設定し、前記参
    照符号時系列信号と、前記入力符号時系列信号中の該照
    合区間それぞれについてヒストグラムを作成し、両ヒス
    トグラムに基づいて前記入力符号時系列信号の照合区間
    と前記参照符号時系列信号との類似度を計算するヒスト
    グラム照合手段とを有し、 前記ヒストグラム照合手段は、前記入力符号時系列信号
    中の前記照合区間を変えながら各照合区間毎に前記類似
    度を求め、該類似度とあらかじめ設定した目標とする類
    似度とを比較し、この比較動作を照合区間を変える毎に
    繰り返すことにより、参照時系列信号が、入力時系列信
    号の当該箇所に存在するかどうかを決定することを特徴
    とする信号検出装置。
  12. 【請求項12】 前記変動付加手段は、前記参照時系
    列信号、または前記入力時系列信号に変動を付加する場
    合、1つの参照時系列信号、または入力時系列信号の各
    時間セクションの信号部分に対して多数の変動を付加し
    た信号を生成することを特徴とする請求項11に記載の
    信号検出装置。
  13. 【請求項13】 前記変動付加手段は、前記参照特徴
    時系列信号、または前記入力特徴時系列信号に変動を付
    加する場合、1つの前記特徴ベクトルに対して多数の変
    動を付加した特徴ベクトルを生成することを特徴とする
    請求項11に記載の信号検出装置。
  14. 【請求項14】 前記変動付加手段は、前記参照符号
    時系列信号、または前記入力符号時系列信号に変動を付
    加する場合、1つの参照符号時系列信号、または入力符
    号時系列信号を構成する各々の符号に対して多数の変動
    を付加した信号を生成することを特徴とする請求項11
    に記載の信号検出装置。
  15. 【請求項15】 前記変動付加処理において特徴の変
    動をさせるための変動量を前もって算出する学習手段を
    更に有し、 前記変動付加手段は、前記学習手段が算出した変動量に
    基づいて変動を付加することを特徴とする請求項11に
    記載の信号検出装置。
  16. 【請求項16】 前記ヒストグラム照合手段が決定し
    た検出結果を前記学習手段にフィードバックし、 前記学習手段は、前記検出結果に基づいて前記変動量を
    補正することを特徴とする請求項15に記載の信号検出
    装置。
  17. 【請求項17】 前記変動付加手段は、乱数を利用し
    て変動を付加することを特徴とする請求項11に記載の
    信号検出装置。
  18. 【請求項18】 前記変動付加手段は、 特徴の変動をさせるための変動量を正規分布により、平
    行移動量と分散量をパラメータとしてモデル化し、 前記平行移動量と前記分散量の少なくとも一方を用い
    て、変動を付加することを特徴とする請求項15または
    17のいずれかに記載の信号検出装置。
  19. 【請求項19】 前記入力時系列信号、前記参照時系
    列信号は、それぞれ映像信号である請求項11に記載の
    信号検出装置。
  20. 【請求項20】 前記入力時系列信号、前記参照時系
    列信号は、それぞれ音響信号である請求項11に記載の
    信号検出装置。
  21. 【請求項21】 入力時系列信号から、あらかじめ登
    録した、前記入力時系列信号よりも短い参照時系列信号
    に類似した部分を探し出す信号検出処理をコンピュータ
    に実行させるためのプログラムであって、前記信号検出
    処理は、 前記参照時系列信号から、特徴ベクトルからなる参照特
    徴時系列信号を導く参照特徴計算処理と、 前記入力時系列信号から、特徴ベクトルからなる入力特
    徴時系列信号を導く入力特徴計算処理と、 前記参照特徴時系列信号を、分類を表す符号からなる参
    照符号時系列信号に変換する参照特徴符号化処理と、 前記入力特徴時系列信号を、分類を表す符号からなる入
    力符号時系列信号に変換する入力特徴符号化処理と、 前記参照時系列信号と、前記入力時系列信号と、前記参
    照特徴時系列信号と、前記入力特徴時系列信号と、前記
    参照符号時系列信号と、前記入力符号時系列信号のうち
    少なくとも1つに対して変動を付加する変動付加処理
    と、 前記入力符号時系列信号中に照合区間を設定し、前記参
    照符号時系列信号と、前記入力符号時系列信号中の該照
    合区間それぞれについてヒストグラムを作成し、両ヒス
    トグラムに基づいて前記入力符号時系列信号の照合区間
    と前記参照符号時系列信号との類似度を計算するヒスト
    グラム照合処理とを有し、 前記類似度と、あらかじめ設定した目標とする類似度と
    を比較し、前記ヒストグラム照合処理を前記入力符号時
    系列信号中の前記照合区間を変えながら繰り返すことに
    より、前記参照時系列信号が、前記入力時系列信号の当
    該箇所に存在するかどうかを決定することを特徴とする
    プログラム。
  22. 【請求項22】 請求項21に記載のプログラムを記
    録した、コンピュータにより読み取り可能な記録媒体。
JP2001123098A 2000-04-27 2001-04-20 信号検出方法、装置及びそのプログラム、記録媒体 Expired - Lifetime JP3408800B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2001123098A JP3408800B2 (ja) 2000-04-27 2001-04-20 信号検出方法、装置及びそのプログラム、記録媒体

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
JP2000-128381 2000-04-27
JP2000128381 2000-04-27
JP2001123098A JP3408800B2 (ja) 2000-04-27 2001-04-20 信号検出方法、装置及びそのプログラム、記録媒体

Publications (2)

Publication Number Publication Date
JP2002044610A true JP2002044610A (ja) 2002-02-08
JP3408800B2 JP3408800B2 (ja) 2003-05-19

Family

ID=26591015

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2001123098A Expired - Lifetime JP3408800B2 (ja) 2000-04-27 2001-04-20 信号検出方法、装置及びそのプログラム、記録媒体

Country Status (1)

Country Link
JP (1) JP3408800B2 (ja)

Cited By (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2010087125A1 (ja) * 2009-01-29 2010-08-05 日本電気株式会社 時間区間代表特徴ベクトル生成装置
US7860714B2 (en) 2004-07-01 2010-12-28 Nippon Telegraph And Telephone Corporation Detection system for segment including specific sound signal, method and program for the same
US7873521B2 (en) 2004-07-09 2011-01-18 Nippon Telegraph And Telephone Corporation Sound signal detection system, sound signal detection server, image signal search apparatus, image signal search method, image signal search program and medium, signal search apparatus, signal search method and signal search program and medium
US7979432B2 (en) 2006-09-28 2011-07-12 Kabushiki Kaisha Toshiba Apparatus, computer program product and system for processing information
JP2011221807A (ja) * 2010-04-09 2011-11-04 Sony Corp 画像処理装置および方法、並びにプログラム
JP2011221806A (ja) * 2010-04-09 2011-11-04 Sony Corp 画像処理装置および方法、並びにプログラム
JP2015031927A (ja) * 2013-08-06 2015-02-16 日本電信電話株式会社 共通信号含有区間有無判定装置、方法、及びプログラム

Cited By (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US7860714B2 (en) 2004-07-01 2010-12-28 Nippon Telegraph And Telephone Corporation Detection system for segment including specific sound signal, method and program for the same
US7873521B2 (en) 2004-07-09 2011-01-18 Nippon Telegraph And Telephone Corporation Sound signal detection system, sound signal detection server, image signal search apparatus, image signal search method, image signal search program and medium, signal search apparatus, signal search method and signal search program and medium
US7979432B2 (en) 2006-09-28 2011-07-12 Kabushiki Kaisha Toshiba Apparatus, computer program product and system for processing information
WO2010087125A1 (ja) * 2009-01-29 2010-08-05 日本電気株式会社 時間区間代表特徴ベクトル生成装置
JP4894956B2 (ja) * 2009-01-29 2012-03-14 日本電気株式会社 時間区間代表特徴ベクトル生成装置
US8175392B2 (en) 2009-01-29 2012-05-08 Nec Corporation Time segment representative feature vector generation device
JP2011221807A (ja) * 2010-04-09 2011-11-04 Sony Corp 画像処理装置および方法、並びにプログラム
JP2011221806A (ja) * 2010-04-09 2011-11-04 Sony Corp 画像処理装置および方法、並びにプログラム
JP2015031927A (ja) * 2013-08-06 2015-02-16 日本電信電話株式会社 共通信号含有区間有無判定装置、方法、及びプログラム

Also Published As

Publication number Publication date
JP3408800B2 (ja) 2003-05-19

Similar Documents

Publication Publication Date Title
US11361017B1 (en) Method to differentiate and classify fingerprints using fingerprint neighborhood analysis
CN109359636B (zh) 视频分类方法、装置及服务器
US8145656B2 (en) Matching of modified visual and audio media
US10296534B2 (en) Storing and searching fingerprints derived from media content based on a classification of the media content
KR20210134528A (ko) 비디오 처리 방법, 장치, 전자 기기, 저장 매체 및 컴퓨터 프로그램
EP1081960A1 (en) Signal processing method and video/voice processing device
US20070030391A1 (en) Apparatus, medium, and method segmenting video sequences based on topic
US20090116695A1 (en) System and method for processing digital media
CN110347866B (zh) 信息处理方法、装置、存储介质及电子设备
EP1161098B1 (en) Signal detection method and apparatus
WO2020135756A1 (zh) 视频段的提取方法、装置、设备及计算机可读存储介质
US20130191368A1 (en) System and method for using multimedia content as search queries
US11537636B2 (en) System and method for using multimedia content as search queries
JP2002044610A (ja) 信号検出方法、装置及びそのプログラム、記録媒体
JP4447602B2 (ja) 信号検出方法,信号検出システム,信号検出処理プログラム及びそのプログラムを記録した記録媒体
JP2000285242A (ja) 信号処理方法及び映像音声処理装置
CN116261009B (zh) 智能转化影视受众的视频检测方法、装置、设备及介质
CN1692373B (zh) 图像识别***图像识别方法
CN114140822A (zh) 行人重识别方法及装置
JP3537727B2 (ja) 信号検出方法、信号の検索方法及び認識方法並びに記録媒体
CN113010728A (zh) 一种歌曲推荐方法、***、智能设备及存储介质
JP2009049667A (ja) 情報処理装置、その処理方法およびプログラム
CN110674337A (zh) 一种音像图文识别***
WO2022264365A1 (ja) 映像処理装置、映像処理方法、及び、記録媒体
CN112019923B (zh) 视频剪切处理方法

Legal Events

Date Code Title Description
TRDD Decision of grant or rejection written
R151 Written notification of patent or utility model registration

Ref document number: 3408800

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R151

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20080314

Year of fee payment: 5

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20090314

Year of fee payment: 6

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20090314

Year of fee payment: 6

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20100314

Year of fee payment: 7

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20110314

Year of fee payment: 8

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20110314

Year of fee payment: 8

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20120314

Year of fee payment: 9

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20130314

Year of fee payment: 10

S531 Written request for registration of change of domicile

Free format text: JAPANESE INTERMEDIATE CODE: R313531

R350 Written notification of registration of transfer

Free format text: JAPANESE INTERMEDIATE CODE: R350

EXPY Cancellation because of completion of term