JP4620126B2 - 映像識別装置 - Google Patents
映像識別装置 Download PDFInfo
- Publication number
- JP4620126B2 JP4620126B2 JP2007542240A JP2007542240A JP4620126B2 JP 4620126 B2 JP4620126 B2 JP 4620126B2 JP 2007542240 A JP2007542240 A JP 2007542240A JP 2007542240 A JP2007542240 A JP 2007542240A JP 4620126 B2 JP4620126 B2 JP 4620126B2
- Authority
- JP
- Japan
- Prior art keywords
- cut point
- distance
- shot
- feature
- frame
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired - Fee Related
Links
Images
Classifications
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N21/00—Selective content distribution, e.g. interactive television or video on demand [VOD]
- H04N21/80—Generation or processing of content or additional data by content creator independently of the distribution process; Content per se
- H04N21/83—Generation or processing of protective or descriptive data associated with content; Content structuring
- H04N21/845—Structuring of content, e.g. decomposing content into time segments
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N5/00—Details of television systems
- H04N5/14—Picture signal circuitry for video frequency region
- H04N5/147—Scene change detection
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T7/00—Image analysis
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T7/00—Image analysis
- G06T7/20—Analysis of motion
- G06T7/254—Analysis of motion involving subtraction of images
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T2207/00—Indexing scheme for image analysis or image enhancement
- G06T2207/10—Image acquisition modality
- G06T2207/10016—Video; Image sequence
Landscapes
- Engineering & Computer Science (AREA)
- Multimedia (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- Theoretical Computer Science (AREA)
- Signal Processing (AREA)
- Television Signal Processing For Recording (AREA)
- Image Analysis (AREA)
Description
カット点の検出処理としては、例えば、以下の非特許文献1に開示されているように、隣接するフレームの輝度が、固定の閾値より大きくなると、そのフレームの変化点をカット点として検出する方法が存在する。
また、以下の非特許文献2に開示されているように、フレーム間の相違を評価関数を用いて評価し、フレーム間の相違量が、他の映像コンテンツを学習することによって設定された閾値より大きくなると、そのフレームの変化点をカット点として検出する方法が存在する。
また、他の映像コンテンツを学習することによって設定された閾値を用いる場合、学習対象のコンテンツによって学習結果が異なるため、入力される映像信号に適用するコンテンツを学習しなければ、カット点を正確に検出することができず、汎用的に使用することができない課題もあった。
実施の形態1.
図1はこの発明の実施の形態1による映像識別装置を示す構成図であり、図において、特徴量抽出部1は映像信号を入力すると、その映像信号から映像フレームの特徴を表している特徴量を抽出する処理を実施する。なお、特徴量抽出部1は特徴量抽出手段を構成している。
フレーム間距離算出部2は所定の評価関数を用いて、特徴量抽出部1により今回抽出された現在のフレームの特徴量と特徴量バッファ3に記憶されている直前のフレームの特徴量(特徴量抽出部1により前回抽出されたフレームの特徴量)とを比較し、それらの特徴量間の距離(非類似度)を算出する処理を実施する。以下、現在のフレームと直前のフレームとの特徴量間の距離を「フレーム間距離」と称する。
特徴量バッファ3は直前のフレームの特徴量を記憶し、フレーム間距離算出部2がフレーム間距離を算出すると、次回のフレーム間距離の算出に備えるため、現在記憶している直前のフレームの特徴量を、特徴量抽出部1により今回抽出された現在のフレームの特徴量に更新する。
なお、フレーム間距離算出部2及び特徴量バッファ3から距離算出手段が構成されている。
カット点判定用データバッファ5はカット点判定用データ算出部4により算出されたカット点判定用の閾値を記憶するメモリである。
なお、カット点判定用データ算出部4及びカット点判定用データバッファ5から閾値算出手段が構成されている。
カット点判定部6はフレーム間距離算出部2により算出されたフレーム間距離とカット点判定用データバッファ5に記憶されているカット点判定用の閾値を比較し、その比較結果からカット点を判別する処理を実施する。なお、カット点判定部6はカット点判別手段を構成している。
図3はこの発明の実施の形態1による映像識別装置の処理内容を示すフローチャートである。
特徴量抽出部1は、映像信号を入力すると、その映像信号からフレームの特徴を表している特徴量を抽出する(ステップST1)。
フレームの特徴を表している特徴量としては、例えば、過去のフレームとの差分のほか、色のヒストグラム、色の配置情報、テクスチャ情報、動き情報などが挙げられるが、いずれの特徴量を用いてもよく、また、複数の特徴量を用いてもよい。
そして、フレーム間距離算出部2は、所定の評価関数を用いて、現在のフレームの特徴量と直前のフレームの特徴量とを比較し、それらの特徴量間の距離(非類似度)であるフレーム間距離を算出する(ステップST2)。
なお、フレーム間距離算出部2は、フレーム間距離を算出すると、特徴量バッファ3の記憶内容を現在のフレームの特徴量に更新する。
カット点判定部6は、そのフレーム間距離がカット点判定用の閾値より大きい場合、カット点であると判定し、その旨を示す判定結果を出力する(ステップST4)。
一方、そのフレーム間距離がカット点判定用の閾値より大きくない場合、カット点ではないと判定し、その旨を示す判定結果を出力する(ステップST5)。
ここでは、カット点判定部6はカット点判定用の閾値を用いて、カット点を判別しているが、例えば、ショット時間などを考慮して、カット点を判別するようにしてもよい。
一方、カット点判定部6の判定結果がカット点ではない旨を示す場合、フレーム間距離算出部2により算出されたフレーム間距離の統計量を求めて、その統計量からカット点判定用の閾値を算出し、カット点判定用データバッファ5の記憶内容を当該閾値で更新する(ステップST7)。
具体的には、以下のようにして、カット点判定用の閾値を算出する。
ここでは、説明の便宜上、各ショットのn−1番目のフレームと、n番目のフレームの距離をDistnとする。
この距離Distnがある閾値よりも大きいとき、i番目のショットにおけるn番目のフレームは、実際には、(i+1)番目の最初のフレームであると考えられる。即ち、i番目のショットにおけるn番目のフレームは、カット点であると考えられる。ただし、i番目のショットの最初のフレームは0番目のフレームであるとする。また、上記の閾値は、適応的に変動するものとして、Thi_nとする。
カット点判定用データ算出部4は、距離の平均値avgi(Distn)と距離の分散値vari(Distn)を算出すると、距離の平均値avgi(Distn)と距離の分散値vari(Distn)を下記の式(1)に代入して、閾値Thi_nを算出する。
Thi_n=avgi(Distn)+α・vari(Distn) ・・・(1)
また、平均値avgi(Distn)及び分散値vari(Distn)は、i番目のショットにおける全てのフレームの平均値及び分散値ではなく、1番目からn−1番目までのフレームの平均値及び分散値である。
0番目のフレームは、平均値や分散値の算出に用いずに、1番目のフレームから平均値や分散値の算出に用いている理由は、0番目のフレームの距離Dist0が、前のショットの最後のフレームとのフレーム間距離を表しているからである。
また、n番目のフレームは、平均値や分散値の算出に用いずに、n−1番目までのフレームを平均値や分散値の算出に用いている理由は、入力されたフレームについて、即座にカット点であるか否かを判別することができるからである。
即ち、この実施の形態1によれば、ショット内に動きがある場合においても、その動きを統計的に分析することで、カット点とショット内の動きの変動を判別することができるため、適応的にカット点判定用の閾値を設定することが可能になり、その結果、従来の固定閾値を用いる場合と比べて、カット点の検出精度を高めることができるようになる。その理由は、以下の通りである。
一般に、現在のショットの次にショットが来るか否かを予測することは困難である。
似ているショットが続く場合、例えば、同一のスタジオ内において、カメラが切り替わる場合など、カット点であっても輝度値の変化が小さいことがある。
その一方で、同一のカットであっても、フラッシュや、人物の大きな動きなどがある場合、フレーム間の変化(輝度値の変化)が大きくなることがある。
図2は、このような場合の輝度値の変化を示す説明図である。
これに対して、この実施の形態1では、単なる輝度値の差以外に、特徴量を用いて汎用性を高めている。さらに、評価関数による評価結果である距離が大きい場合にカット点としているが、その閾値を適応的に設定することで、変化の大きなショットであれば、自動的に閾値が大きくなり、変化の小さなショットであれば、自動的に閾値が小さくなるため、カット点検出の大幅な精度向上と汎用性の向上が期待できる。
また、フレーム間距離を算出する際、必ずしも隣接したフレームではなく、2フレーム以上間隔を空けているフレーム間の距離を算出するようにして、算出処理の高速化を図るようにしてもよい。
このように、フレーム間隔をあけて距離の算出やカット点の検出を行う場合、時間的に圧縮された符号化映像におけるフレーム内符号化を用いたフレームを用いてもよい。
さらに、平均値及び分散値を計算する際、現在のフレームに近いフレームに対して重みを付けるなどの処理を実施して、ショット内における変動の様子の時間変化に対応するようにしてもよい。
図4はこの発明の実施の形態2による映像識別装置を示す構成図であり、図において、図1と同一符号は同一または相当部分を示すので説明を省略する。
重要ショット判別部7はカット点判定部6の判定結果がカット点である旨を示す場合、そのカット点より1つ前のカット点(1つ前のカット点は、カット点判定部6により前回判別されたカット点)を起点とするショットが重要ショットであるか否かを判別する処理を実施する。なお、重要ショット判別部7は重要ショット判別手段を構成している。
ショット開始点バッファ12はショット開始点の時刻を記憶しているメモリである。
重要ショット判定部13はショット長計算部11により算出されたショット長が予め設定された閾値より長い場合、カット点判定部6により判別されたカット点より1つ前のカット点を起点とするショットが重要ショット、1つ前のカット点を起点とするショットの次のショットが重要ショット、または、1つ前のカット点を起点とするショットと次のショットが重要ショットであると判定し、その判定結果を出力する処理を実施する。
カット点判定部6は、フレーム間距離算出部2がフレーム間距離を算出すると、上記実施の形態1と同様に、そのフレーム間距離とカット点判定用データバッファ5に記憶されているカット点判定用の閾値を比較する。
カット点判定部6は、そのフレーム間距離がカット点判定用の閾値より大きい場合、カット点であると判定し、その旨を示す判定結果を重要ショット判別部7に出力する。
一方、そのフレーム間距離がカット点判定用の閾値より大きくない場合、カット点ではないと判定し、その旨を示す判定結果を重要ショット判別部7に出力する。
即ち、重要ショット判別部7のショット長計算部11は、ショットのショット長はi番目のショットの開始時刻と(i+1)番目のショットの開始時刻の差で求めることができるので、カット点判定部6の判定結果がカット点である旨を示す場合、現在のフレームの時刻とショット開始点バッファ12に記憶されているショット開始点の時刻との時刻差を求め、その時刻差をショット長として重要ショット判定部13に出力する。
なお、ショット長計算部11は、ショット長を算出すると、ショット開始点バッファ12の記憶内容を現在のフレームの時刻に更新する。
そして、重要ショット判定部13は、そのショット長が予め設定された閾値より長い場合、カット点判定部6により判別されたカット点より1つ前のカット点を起点とするショットが重要ショットであると判定し、その判定結果を出力する。
ここでは、重要ショット判定部13が、カット点より1つ前のカット点を起点とするショットが重要ショットであると判定しているが、1つ前のカット点を起点とするショットの次のショットが重要ショットであると判定してもよいし、1つ前のカット点を起点とするショットと次のショットの双方が重要ショットであると判定してもよい。
この実施の形態2では、特に会話が主体のコンテンツである場合、重要なナレーションや、台詞部分におけるショット長が長いことに基づいている。また、カット点が分かっている場合、計算負荷が非常に小さいことが特徴であり、計算能力の低い機器においても、重要ショットの判定が可能になる。
Claims (2)
- 映像信号から映像フレームの特徴を表している特徴量を抽出する特徴量抽出手段と、
上記特徴量抽出手段により今回抽出されたフレームの特徴量と上記特徴量抽出手段により前回抽出されたフレームの特徴量から特徴量間の距離を算出する距離算出手段と、
上記距離算出手段により算出された特徴量間の距離を用いて、カット点判定用の閾値を算出する閾値算出手段と、
上記距離算出手段により算出された特徴量間の距離と上記閾値算出手段により算出された閾値を比較し、その比較結果からカット点を判別するカット点判別手段と
を備え、
上記カット点判別手段によりカット点であると判別された場合、上記閾値算出手段は、閾値を初期化し、
上記カット点判別手段によりカット点ではないと判別された場合、上記閾値算出手段は、カット点であると判別されてから今回カット点ではないと判別されるまでに上記距離算出手段で算出された特徴量間の距離の統計量を算出し、その統計量からカット点判定用の閾値を算出することを特徴とする映像識別装置。 - カット点判別手段によりカット点が判別された場合、そのカット点より1つ前のカット点を起点とするショットが重要ショットであるか否かを判別する重要ショット判別手段を設けたことを特徴とする請求項1記載の映像識別装置。
Applications Claiming Priority (3)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2005310157 | 2005-10-25 | ||
JP2005310157 | 2005-10-25 | ||
PCT/JP2006/312144 WO2007049378A1 (ja) | 2005-10-25 | 2006-06-16 | 映像識別装置 |
Publications (2)
Publication Number | Publication Date |
---|---|
JPWO2007049378A1 JPWO2007049378A1 (ja) | 2009-04-30 |
JP4620126B2 true JP4620126B2 (ja) | 2011-01-26 |
Family
ID=37967500
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2007542240A Expired - Fee Related JP4620126B2 (ja) | 2005-10-25 | 2006-06-16 | 映像識別装置 |
Country Status (5)
Country | Link |
---|---|
US (1) | US8014606B2 (ja) |
JP (1) | JP4620126B2 (ja) |
KR (1) | KR100963701B1 (ja) |
CN (1) | CN101292267B (ja) |
WO (1) | WO2007049378A1 (ja) |
Families Citing this family (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN102802088B (zh) * | 2012-08-29 | 2015-04-15 | 上海天跃科技股份有限公司 | 一种基于实时传输协议的数据传输方法 |
CN106303315B (zh) | 2015-05-30 | 2019-08-16 | 北京智谷睿拓技术服务有限公司 | 视频显示控制方法和装置、显示设备 |
CN106303499B (zh) * | 2015-05-30 | 2018-10-16 | 北京智谷睿拓技术服务有限公司 | 视频显示控制方法和装置、显示设备 |
CN106303498B (zh) * | 2015-05-30 | 2018-10-16 | 北京智谷睿拓技术服务有限公司 | 视频显示控制方法和装置、显示设备 |
CN113777616B (zh) * | 2021-07-27 | 2024-06-18 | 武汉市异方体科技有限公司 | 一种运动车辆测距方法 |
Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH08227462A (ja) * | 1995-02-21 | 1996-09-03 | Hitachi Ltd | 動画像の変化点検出方法及び装置 |
JP2000285242A (ja) * | 1999-01-29 | 2000-10-13 | Sony Corp | 信号処理方法及び映像音声処理装置 |
JP2002290959A (ja) * | 2001-03-23 | 2002-10-04 | Fujitsu General Ltd | 侵入者検出方法および装置 |
WO2005050986A1 (ja) * | 2003-11-19 | 2005-06-02 | National Institute Of Information And Communications Technology, Independent Administrative Agency | 映像内容の提示方法及び装置 |
Family Cites Families (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US5708767A (en) | 1995-02-03 | 1998-01-13 | The Trustees Of Princeton University | Method and apparatus for video browsing based on content and structure |
US6393054B1 (en) * | 1998-04-20 | 2002-05-21 | Hewlett-Packard Company | System and method for automatically detecting shot boundary and key frame from a compressed video data |
US6928233B1 (en) * | 1999-01-29 | 2005-08-09 | Sony Corporation | Signal processing method and video signal processor for detecting and analyzing a pattern reflecting the semantics of the content of a signal |
JP2003503972A (ja) * | 1999-07-06 | 2003-01-28 | コーニンクレッカ フィリップス エレクトロニクス エヌ ヴィ | ビデオシーケンスの構造の自動抽出方法 |
US7038736B2 (en) * | 2000-09-21 | 2006-05-02 | Canon Kabushiki Kaisha | Moving image processing apparatus and method, and computer readable memory |
JP4082664B2 (ja) | 2002-09-20 | 2008-04-30 | Kddi株式会社 | 映像検索装置 |
-
2006
- 2006-06-16 JP JP2007542240A patent/JP4620126B2/ja not_active Expired - Fee Related
- 2006-06-16 WO PCT/JP2006/312144 patent/WO2007049378A1/ja active Application Filing
- 2006-06-16 US US11/991,606 patent/US8014606B2/en not_active Expired - Fee Related
- 2006-06-16 CN CN200680039236XA patent/CN101292267B/zh not_active Expired - Fee Related
- 2006-06-16 KR KR1020087009779A patent/KR100963701B1/ko active IP Right Grant
Patent Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH08227462A (ja) * | 1995-02-21 | 1996-09-03 | Hitachi Ltd | 動画像の変化点検出方法及び装置 |
JP2000285242A (ja) * | 1999-01-29 | 2000-10-13 | Sony Corp | 信号処理方法及び映像音声処理装置 |
JP2002290959A (ja) * | 2001-03-23 | 2002-10-04 | Fujitsu General Ltd | 侵入者検出方法および装置 |
WO2005050986A1 (ja) * | 2003-11-19 | 2005-06-02 | National Institute Of Information And Communications Technology, Independent Administrative Agency | 映像内容の提示方法及び装置 |
Also Published As
Publication number | Publication date |
---|---|
WO2007049378A1 (ja) | 2007-05-03 |
CN101292267A (zh) | 2008-10-22 |
KR20080055941A (ko) | 2008-06-19 |
US20090116751A1 (en) | 2009-05-07 |
CN101292267B (zh) | 2012-08-22 |
KR100963701B1 (ko) | 2010-06-14 |
JPWO2007049378A1 (ja) | 2009-04-30 |
US8014606B2 (en) | 2011-09-06 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP4699476B2 (ja) | 映像要約装置 | |
US7551234B2 (en) | Method and apparatus for estimating shot boundaries in a digital video sequence | |
US8014566B2 (en) | Image processing apparatus | |
US8036263B2 (en) | Selecting key frames from video frames | |
EP1914994A1 (en) | Detection of gradual transitions in video sequences | |
US8947600B2 (en) | Methods, systems, and computer-readable media for detecting scene changes in a video | |
US20060078292A1 (en) | Apparatus and method for embedding content information in a video bit stream | |
JP2009147911A (ja) | 映像データ圧縮前処理方法およびこれを用いた映像データ圧縮方法と映像データ圧縮システム | |
JP4620126B2 (ja) | 映像識別装置 | |
US8363726B2 (en) | Electronic apparatus, motion vector detecting method, and program therefor | |
KR101281850B1 (ko) | 영상 디스크립터 생성 장치 | |
JP5096259B2 (ja) | 要約コンテンツ生成装置および要約コンテンツ生成プログラム | |
US20070061727A1 (en) | Adaptive key frame extraction from video data | |
US7643554B2 (en) | Image retrieving apparatus performing retrieval based on coding information utilized for feature frame extraction or feature values of frames | |
JPH10224741A (ja) | 動画像のカット点検出方法 | |
JP4225503B2 (ja) | 動画像のカット点検出装置 | |
JP4036321B2 (ja) | 映像の検索装置および検索プログラム | |
KR20100118811A (ko) | 감시 카메라 시스템의 관리를 위한 장면 전환 검출 방법과 장면 전환 검출 신뢰도 산출 방법 및 소프트웨어 | |
JP4924423B2 (ja) | 特徴量の予測誤差に基づいて動画像のカット点を検出する装置 | |
CN117812282A (zh) | 一种抽帧模型的评估方法、装置、设备及存储介质 | |
JP4261603B2 (ja) | 動画像のカット点検出装置 | |
KR20030017880A (ko) | 실시간 처리에 의한 디지털 비디오 데이터의 내용기반요약방법 | |
CN118055235A (zh) | 一种基于图像分析的视频智能压缩方法 | |
CN115776447A (zh) | 流媒体质量评估方法、装置、客户端和存储介质 | |
JPH09322172A (ja) | カット点検出方法および装置 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20100803 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20100922 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20101019 |
|
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20101027 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20131105 Year of fee payment: 3 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 4620126 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
LAPS | Cancellation because of no payment of annual fees |