JP2005243035A - アンカーショット決定方法及び決定装置 - Google Patents

アンカーショット決定方法及び決定装置 Download PDF

Info

Publication number
JP2005243035A
JP2005243035A JP2005053682A JP2005053682A JP2005243035A JP 2005243035 A JP2005243035 A JP 2005243035A JP 2005053682 A JP2005053682 A JP 2005053682A JP 2005053682 A JP2005053682 A JP 2005053682A JP 2005243035 A JP2005243035 A JP 2005243035A
Authority
JP
Japan
Prior art keywords
anchor
shot
face
shots
model
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2005053682A
Other languages
English (en)
Inventor
斗 善 ▲黄▼
Doosun Hwang
Sang-Kyun Kim
金 相 均
Chien Kin
智 淵 金
Young-Su Moon
永 秀 文
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Samsung Electronics Co Ltd
Original Assignee
Samsung Electronics Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Samsung Electronics Co Ltd filed Critical Samsung Electronics Co Ltd
Publication of JP2005243035A publication Critical patent/JP2005243035A/ja
Pending legal-status Critical Current

Links

Classifications

    • AHUMAN NECESSITIES
    • A47FURNITURE; DOMESTIC ARTICLES OR APPLIANCES; COFFEE MILLS; SPICE MILLS; SUCTION CLEANERS IN GENERAL
    • A47JKITCHEN EQUIPMENT; COFFEE MILLS; SPICE MILLS; APPARATUS FOR MAKING BEVERAGES
    • A47J37/00Baking; Roasting; Grilling; Frying
    • A47J37/06Roasters; Grills; Sandwich grills
    • A47J37/067Horizontally disposed broiling griddles
    • A47J37/0682Horizontally disposed broiling griddles gas-heated
    • GPHYSICS
    • G11INFORMATION STORAGE
    • G11BINFORMATION STORAGE BASED ON RELATIVE MOVEMENT BETWEEN RECORD CARRIER AND TRANSDUCER
    • G11B27/00Editing; Indexing; Addressing; Timing or synchronising; Monitoring; Measuring tape travel
    • G11B27/10Indexing; Addressing; Timing or synchronising; Measuring tape travel
    • G11B27/19Indexing; Addressing; Timing or synchronising; Measuring tape travel by using information detectable on the record carrier
    • G11B27/28Indexing; Addressing; Timing or synchronising; Measuring tape travel by using information detectable on the record carrier by using information signals recorded by the same method as the main recording
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/70Information retrieval; Database structures therefor; File system structures therefor of video data
    • G06F16/73Querying
    • G06F16/738Presentation of query results
    • G06F16/739Presentation of query results in form of a video summary, e.g. the video summary being a video sequence, a composite still image or having synthesized frames
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/70Information retrieval; Database structures therefor; File system structures therefor of video data
    • G06F16/78Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually
    • G06F16/783Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually using metadata automatically derived from the content
    • G06F16/7837Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually using metadata automatically derived from the content using objects detected or recognised in the video content
    • G06F16/784Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually using metadata automatically derived from the content using objects detected or recognised in the video content the detected or recognised objects being people
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/70Information retrieval; Database structures therefor; File system structures therefor of video data
    • G06F16/78Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually
    • G06F16/783Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually using metadata automatically derived from the content
    • G06F16/7847Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually using metadata automatically derived from the content using low-level visual features of the video content
    • G06F16/785Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually using metadata automatically derived from the content using low-level visual features of the video content using colour or luminescence
    • AHUMAN NECESSITIES
    • A47FURNITURE; DOMESTIC ARTICLES OR APPLIANCES; COFFEE MILLS; SPICE MILLS; SUCTION CLEANERS IN GENERAL
    • A47JKITCHEN EQUIPMENT; COFFEE MILLS; SPICE MILLS; APPARATUS FOR MAKING BEVERAGES
    • A47J36/00Parts, details or accessories of cooking-vessels
    • A47J36/02Selection of specific materials, e.g. heavy bottoms with copper inlay or with insulating inlay
    • A47J36/04Selection of specific materials, e.g. heavy bottoms with copper inlay or with insulating inlay the materials being non-metallic

Landscapes

  • Engineering & Computer Science (AREA)
  • Multimedia (AREA)
  • Theoretical Computer Science (AREA)
  • Library & Information Science (AREA)
  • General Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Databases & Information Systems (AREA)
  • General Physics & Mathematics (AREA)
  • Data Mining & Analysis (AREA)
  • Computational Linguistics (AREA)
  • Food Science & Technology (AREA)
  • Image Analysis (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
  • Television Signal Processing For Recording (AREA)
  • Image Processing (AREA)

Abstract

【課題】 アンカーショット決定方法及び決定装置を提供する。
【解決手段】 動画データの内容をインデックシング、要約及び検索するのに活用できるアンカーショット決定方法において、前記動画データから、複数の基本ショットを抽出する段階と、前記抽出された複数の基本ショットの中から、複数のアンカーモデル候補ショットを選択する段階と、前記複数のアンカーモデル候補ショット中から、少なくとも一つのアンカーモデルショットを決定する段階と、(4)前記少なくとも一つのアンカーモデルショットと前記複数の基本ショットとの間の類似度を求め、少なくとも一つのアンカーショットを確定する段階とを備えることを特徴とするアンカーショット決定方法である。
【選択図】 図1

Description

本発明は動画に係り、特に、ニュース動画または所定のプログラム動画でインデックス、要約及び検索に使われるアンカーを自動検出する方法に関する。
我々は、ラジオだけでなく、TVを通じて多くの情報が得られる。特に、放送されるニュースは、現代人にとっては不可欠な重要な情報源の役割を行う。しかし、現在のように忙しい社会では、定時にニュースを視聴できない場合が頻繁に発生する。一方、ニュースまたは放送プログラムを通じて得る情報は無限であるので、見逃したニュースを以後でも視聴するのを所望する視聴者がたくさんある。このために、放送局では、放送終了後のニュース及びプログラムを動画で製作して準備し、顧客の要請に応じてこれを動画でダウンロードできるようにサービスを提供している。
顧客は、前記動画のデータをダウンロードして再生装置を介して視聴できる。顧客が前記データ全体ではなく、視聴を所望する一部の内容のみを選択して視聴できるようにするためには、前記データと共にインデックス及び検索機能が付加的に提供されねばならない。
一般的に、ニュースは、色々な報道事実を順次伝達する。すなわち、アンカーが一つの報道事実について予告し、その後に参考資料を画面に見せながら、前記報道事実の詳しい内容をリポータが伝達することが普通である。したがって、報道される事実は、一般的にアンカーを基準に識別できる。
ニュース動画でアンカーが画面に現れたところをスナップショットしたことをアンカーショットというとすると、ニュース動画について易しくて速いインデックス及び検索を可能にするために前記アンカーショットを利用できる。このようなアンカーショットを得るために、従来は、テンプレートを利用する方法、クラスタリングを利用する方法及びマルチモーダルを利用する方法の3つの方法を主に使用してきた。
テンプレートを利用する方法は、非特許文献1及び2を参照すれば、詳細に分かる。この方法は、固定されたテンプレートを使用するため、多様なニュースにおいてアンカーを検出することが難しいという短所がある。
非特許文献3のテンプレートを利用する方法は、ニュース動画内でテンプレートを決定するため、多様な形式のニュースに適用することは可能であるが、テンプレートとして使用した第1アンカーショットの時間的な位置情報をある程度は知っていなければならないという短所がある。
クラスタリングを利用する方法の例として、非特許文献4があるが、グラフ理論を利用してアンカーショットを検出する。しかし、ニュース内で2回以上出るアンカーショットについてのみ検出でき、また、時間間隔をおいて現れるショットについて誤検出する短所がある。クラスタリングを利用する従来の方法(特許文献1、2及び3)は、アンカーショットのモデルをあらかじめ決定しておくため、モデルに適合しないニュース動画におけるアンカーショットを検出できない。そして、一般的に、クラスタリングを利用する方法は、時間がかかるという短所がある。
最後に、マルチモーダルを利用する方法(特許文献4)は、クローズドキャプション信号を内包するニュースビデオからマルチモーダルの特徴を抽出し、これに基づいてニュースビデオの主要区間を自動検出してニュースビデオを要約する。
従来の技術の短所を整理すれば、次の通りである。
第一に、顔の周辺の背景カラー情報のみを使用するため、一般的なニュースではない対談場面のようなショットで誤検出が発生する恐れがある(ショット誤検出の問題点)。
第二に、固定されたテンプレートを利用するため、ニュースの形式が変化すれば、アンカーショットを検出できない(多様な形式のニュースに適用不可)。
第三に、ニュース全体で1回のみ出るアンカーショットは検出できない(ショット未検出の問題点)。
第四に、全てのキーフレームについて、キーフレーム間の類似度を検査してクラスタリングを行うため、速度が遅くなる(速度上の問題点)。
KR2002−0075081 US20020146168 JP2003−32583 KR2002−0016318 M.Tekalp,"Video indexing through integration of syntactic and semantic features"(1996) Y.Nakajima,"Automatic anchor person detection from an MPEG coded TV program" A.Hanjalic,"Template−based detection of anchor person shot in news programs"(1998) Xinbo Gao,"A Graph−Theoretical Clustering based Anchor person Shot Detection for News Video Indexing"(2003)
本発明が解決しようとする技術的課題は、多様な形式の動画でアンカーショットの検出が可能であり、ショット検出速度が速く、1回のみ出るアンカーについてもショット検出を可能にするアンカーショット決定方法を提供することである。
本発明が解決しようとする他の技術的課題は、多様な形式の動画でアンカーショットの検出が可能であり、ショット検出速度が速く、1回のみ出るアンカーについてもショット検出を可能にするアンカーショット決定装置を提供することである。
本発明に係るアンカーショット決定方法は、動画データの内容をインデックシング、要約及び検索するのに活用できるアンカーショット決定方法において、(1)前記動画データから、複数の基本ショットを抽出する段階と、(2)前記抽出された複数の基本ショットの中から、複数のアンカーモデル候補ショットを選択する段階と、(3)前記複数のアンカーモデル候補ショット中から、少なくとも一つのアンカーモデルショットを決定する段階と、(4)前記少なくとも一つのアンカーモデルショットと前記複数の基本ショットとの間の類似度を求め、少なくとも一つのアンカーショットを確定する段階とを備えて構成される。
前記(1)段階は、一定の時間停止した画面が他の画面に転換される瞬間を利用して前記複数の基本ショットを抽出することが好ましい。
前記(2)段階は、アンカー顔検出情報、アンカー顔制約条件、ショットの長さ及び背景カラー情報などの類似度を利用して前記複数のアンカーモデル候補ショットを抽出することが好ましい。
前記アンカー顔制約条件は、顔のサイズ、顔の位置、横及び縦の比率、皮膚カラーの密度及び顔の動きであることが好ましい。
前記背景カラー情報は、顔を含む四角形を基準として得られるカラー情報であることが好ましい。
前記カラー情報は、顔を含む四角形を基準として得られる正規化及び量子化したカラーヒストグラムであることが好ましい。
前記四角形は、前記顔の画面内の位置によって区別され、前記顔が左側にある場合には、前記画面の顔及び上体を含む左側の領域が前記四角形であり、前記顔が右側にある場合には、前記画面の顔及び上体を含む右側の領域が前記四角形であり、前記顔が中央部にある場合には、前記画面の全体が前記四角形であることが好ましい。
前記四角形は、前記四角形を構成する複数の画素をグルーピングして複数のブロックに分割されることが好ましい。
前記(3)段階は、画面に位置するアンカーの顔及び上体の位置を利用して前記少なくとも一つのアンカーモデルショットを抽出することを特徴とし、前記アンカーモデルショットの数は、アンカーの性別、アンカーの顔及び上体の位置によって決定されることが好ましい。
前記(4)段階は、前記少なくとも一つのアンカーモデルショット及び前記複数の基本ショットに登場する前記アンカーの顔及び上体を含む四角形を取り出し、前記四角形を構成する画素をグルーピングして前記四角形を複数のブロックに分割し、比較されるショットを構成する前記ブロック間のカラー情報についての類似度を比較することが好ましい。
前記カラー情報は、顔及び上体のカラー情報を正規化及び量子化したカラーヒストグラムであることが好ましい。
前記(3)段階は、複数のアンカーモデル候補ショットの中から前記少なくとも一つのアンカーモデルショットを決定することが好ましい。
前記(3)段階は、前記アンカーモデルショットの数が、前記アンカーモデル候補ショットの中から、画面上に現れるアンカーの性別、顔及び上体の位置によって決定されることが好ましい。
本発明に係るアンカーショット決定装置は、動画データの内容をインデックシング、要約及び検索するのに活用でき、入力された動画データにおいてショットの境界を決定し、当該境界に基づいて前記動画データから複数のショットを所得するショット境界決定部と、前記ショット境界決定部において取得されたショットに含まれるアンカーの皮膚カラー部を抽出する皮膚カラー抽出部と、前記皮膚カラー部を示す情報を用いて、前記アンカーの顔領域を決定するアンカー顔決定部と、前記アンカーの背景カラー領域を決定して、バックグラウンドとアンカーとの区別を可能にする背景カラー領域決定部と、前記アンカー顔決定部において決定された前記アンカーの顔領域及び前記背景カラー領域決定部において決定された前記アンカーの背景カラー領域を利用して、前記ショット境界決定部において取得されたショットの中から、アンカーモデル候補ショットを決定するアンカーモデル候補ショット決定部と、前記ショット境界決定部において取得されたショットにおけるカラー類似度の比較により、前記アンカーの性別、数、そして報道ショットに関する情報を生成する客体カラー領域決定部と、前記客体カラー領域決定部において生成された情報に基づいて、前記ショット境界決定部において取得されたショットを、男子アンカーショットと、女子アンカーショットと、報道ショットとにグループ分けするショットグルーピング部と、前記男子アンカーショットのグループと、前記女子アンカーショットのグループについて、アンカーの位置に基づいて、アンカーモデルを生成するアンカーモデル生成部と、前記アンカーモデルにおいて、前記アンカーの顔と上半身とを含むブロックを決定するブロック決定部と、前記ブロックを用いて、前記男子アンカーショットのグループと、前記女子アンカーショットのグループとのそれぞれにおいて、少なくとも一つのアンカーショットを確定するアンカーショット確定部とから構成される。
本発明によるモデル生成を利用したアンカーショット決定方法及び決定装置は、あらかじめ決定されたモデルを使用するものではなく、適応的なアンカーモデルを生成させることによって、多様な形式の動画についてもアンカーショットを検出可能にして、生成したモデルと全体キーフレームとの間の類似度を比較することによって速度と性能とを向上させる長所があるので、家庭用AV保存機器、コンテンツ提供用著作道具及びニュース動画の内容に基づいたインデックシング、要約、検索などに活用できる。
本発明と本発明の動作上の利点及び本発明の実施によって達成される目的を十分に理解するためには、本発明の望ましい実施例を例示する添付図面及び図面に記載された内容を参照せねばならない。
以下、添付した図面を参照して本発明の望ましい実施例を説明することによって、本発明を詳細に説明する。各図面に提示された同じ参照符号は、同じ部材を表す。
図1は、本発明の一実施例によるアンカーショット決定方法の実施例を表すフローチャートである。
図1を参照すれば、前記アンカーショット決定方法は、基本ショット抽出段階(110)、アンカーモデル候補ショット選択段階(120)、アンカーモデルショット決定段階(130)及びアンカーショット確定段階(140)を含む。
基本ショット抽出段階(110)は、一定の時間同じ場面を示す画面が、他の場面を示す画面に転換される瞬間を区分の基準として、ニュースまたはプログラムの動画データから複数のショットを抽出し、これを基本ショットとする。したがって、ニュースについての動画の場合、前記複数の基本ショットには、アンカー、リポータ、事件が発生した場所、事件を要約した字幕及びその他のグラフなど、映像が転換される瞬間のデータであればいずれも含まれる。
アンカーモデル候補ショット選択段階(120)は、前記複数の基本ショットに第1基準を適用して、前記複数の基本ショットの中から複数のショットを選択し、これをアンカーモデル候補ショットとする。ここで、第1基準は、複数の基本ショットの間の、アンカー顔検出情報、アンカー顔制約条件、ショットの長さ、背景カラー情報などの類似度によって選択される。
アンカーモデルショット決定段階(130)は、前記複数のアンカーモデル候補ショットに第2基準を適用して、少なくとも一つのショットを決定し、これをアンカーモデルショットとする。ここで、第2基準は、画面に位置するアンカーの顔及び上体の位置であり、前記アンカーモデルショットの数は、アンカーの性別、アンカーの顔及び上体の位置によって決定される。
アンカーショット確定段階(140)は、前記少なくとも一つのアンカーモデルショット及び前記複数の基本ショットに登場する前記アンカーの顔及び上体を含む四角形を取り出し、前記四角形を構成する画素をグルーピングして複数のブロックに前記四角形を分割し、比較するショットを構成する前記ブロック間のカラー情報について密接な類似性のあるショットをアンカーショットと確定する。
以下で、アンカー検出方法を詳細に説明する。
第一に、アンカーモデル候補ショット選択段階について説明する。
まず、ショット単位で区分されたニュース動画の全ての基本ショットについて、ショットの長さ、アンカー顔制約条件、顔検出情報及び背景カラー情報を利用して、アンカーモデル候補ショットを選択する。
ショットの長さについての情報は、‘ニュースビデオでアンカーが現れるショットのうち少なくとも一つのショットは、10秒以上持続される’という仮定を利用して得る。
アンカーモデル候補ショットは、常にアンカーの顔が現れる場面であるので、顔検出情報として皮膚カラーを利用すれば、顔を容易に検出できる。皮膚カラーの値が所定の範囲内に存在すれば、皮膚カラーと判断することによって、これを達成できる。前記所定の範囲は、システム設計者によってセッティングされる。
前記検出された顔データのノイズを除去し、アンカー顔制約条件を適用すれば、概略で得られた前記検出された顔データ中でさらに正確な顔データを検出できる。アンカー顔制約条件は、顔四角形のサイズ、位置、変化度、皮膚カラーの密度を判断基準とする。
前記顔四角形とは、アンカーと判断された顔を含む四角形である。アンカーの顔は、画面全体を占めていないにも拘わらず、アンカーが現れる画面全体を基本ショットとすれば、前記アンカーが含まれたショットからアンカーショットを確定しようとするとき、判断が複雑になりうる。したがって、アンカーの顔を含む最小限の領域を四角形と定義してデータを収集し、これに基づいてアンカーショットを確定することが望ましい。
前記顔四角形の位置は、アンカーが画面で占める位置を意味する。アンカーが現れる画面を調べれば、アンカーは、画面の中央に位置するか、または画面の左側あるいは右側に位置することが一般的である。
前記変化度は、カメラがアンカーを撮影する角度によって、画面に現れるアンカーの顔間に存在する角度差を意味する。角度差が小さければ、同じアンカーショットと判断しようとするものである。
前記皮膚カラーの密度もアンカー顔制約条件の重要な判断基準となるが、皮膚カラーの密度が非常に低いものをアンカーショットと確定すれば、視聴者の立場で画面が鮮明に見られないことがある。したがって、皮膚カラーの密度はこの不鮮明なショットを除去するための基準となる。
基本ショットと候補ショットとの間の背景カラーの類似度を判断基準として、所定の閾値以上である場合、アンカーモデル候補ショットと決定する。類似度の測定手段としては、正規化したヒストグラムインターセクション方法を利用すれば良い。
図2は、本発明の一実施例によるアンカーショット決定方法に使われるアンカーモデル候補ショットのクラスタである。
図2を参照すれば、複数の基本ショットのうち前記第1基準に満足するショットを選択した結果、男子アンカー及び女子アンカーの姿が含まれたショットが選択されたことが分かる。
第二に、アンカーモデルショット決定段階について説明する。
前述した方法を介して選択された複数のアンカーモデル候補ショットから、さらにアンカーモデルショットを選択して決定する。前記決定のために、顔及び上体のカラーを利用して、類似したショット同士でクラスタリングする。
第1アンカー候補ショットでアンカーの顔を含む任意の四角形を除去した後、各ショットに対する上体四角形におけるY、Cb、Crそれぞれのカラー分布を調べる。一般に、ニュースでの男子アンカーはスーツ、女子アンカーは単色の衣装を着用する。したがって、前記のような方法で求めたアンカー客体のカラー情報は信頼できる。このように求めたアンカー客体のカラー情報を利用して、アンカーの上体カラーを抽出できる。抽出したアンカーモデル候補の顔領域に対して顔四角形を左右に拡大し、顔四角形の下側から映像の端部まで定めて上体候補四角形を作る。
それにより、上体の候補領域にあらかじめ調べたカラー情報を利用して候補四角形の上体領域からアンカーの上体部分を検出できる。そして、顔領域と上体領域とをOR演算することによって、アンカー客体を求めうる。前記アンカー客体は、それぞれのYCbCrカラーについてヒストグラムを構成する。しかし、得られるアンカー客体のサイズは、ニュース動画で少しずつ異なるため、客体のサイズで割って0〜1の値を有するように正規化する。
ヒストグラムは、256色のカラーであるとき、ショットが有している256個のカラーのうち、どんなカラーがいかなる程度の比重を占めているかを表すものである。ここでは、ショットの全体に対して前記ヒストグラムを求めるものではなく、所定の四角形を仮定し、前記四角形の内部に対して求めたヒストグラムを使用するが、これが本発明の特徴のうち一つである。
数式(1)は、クラスタリングの基準となるヒストグラムである。
ここで、iは、3色(Y、Cb及びCr)についての変数であるので、前記数式(1)は、前記3色(Y、Cb及びCr)についてヒストグラムが作られるということを意味する。ここで、関数の表示として“O(Object)”を使用する理由は、画面全体ではなく、特定の客体に対するヒストグラムであることを強調するためである。
前記アンカー客体のヒストグラムと同様に、YCbCrそれぞれのカラーヒストグラムを数式(2)に表す。
次いで、基準となるヒストグラムと候補となるヒストグラムとの間の類似度を測定してクラスタリングする。類似度検査のためには、既存の正規化したヒストグラムインターセクション方法を使用する。
類似度は、数式(3)を通じて求めうる。
ここで、ORは、テンプレートである第1アンカーモデル候補ショットの客体カラーヒストグラムであり、OCは、アンカーモデル候補ショットの客体カラーヒストグラムであり、nはブロックの数である。アンカーショットのアンカー客体カラーは、非常に類似しているため、所定の閾値以上の類似度値を有するショットを一つのクラスタとする。
このように、カラー類似度を利用してクラスタリングすれば、男子アンカーショット、女子アンカーショット及び報道ショットのグループに分けられる。アンカーのモデルを作るためには、多数のショットのあるクラスタの中からアンカーモデルグループを選択することが望ましい。
このように選択したクラスタのうち、それぞれの顔の位置情報を利用してアンカーモデルを作る。顔の位置は、左側、中央及び右側の3つの場合がある。ニュースでのアンカーが現れる場面を分析すると、アンカーの顔が左側に現れれば、右側には、ニュースの内容を知らせるニュースアイコンや記事の題目を表示する。アンカーの顔が右側に現れる場合、これと逆になる。したがって、アンカーが画面の右側または左側に現れる場合、残りの部分であるニュースアイコンや記事の題目を除去して比較する。中央にアンカーの顔が現れる場面では、ニュースアイコンや記事題目が表示されない。
図3は、本発明の一実施例によるアンカーショットの決定方法に使われるアンカーモデルショットである。
図3を参照すれば、図2に示されたアンカーモデル候補ショットの中から前記第2基準を満たすショットを選択した結果、3個のアンカーモデルショットが決定されたことが分かる。男子アンカーは、画面の左側にいる場合及び画面の中央にいる場合が前記アンカーモデルショットと決定され、女子アンカーは、画面の左側にいる場合のみが前記アンカーモデルショットと決定されたことが分かる。これは、図2に示されたアンカーモデル候補ショットの集まりに基づいて決定される。
第三に、アンカーショットを確定する段階を説明する。
生成されたアンカーモデルと前記基本ショットとの間の類似度測定を行って、類似度が所定の閾値以上であるショットについてアンカーショットと確定する。
前記類似度の比較のために、モデルと同じ位置の領域と同じサイズを有する四角形を複数個(例えば、24個)のブロックに分ける。
図4は、本発明が一実施例によるアンカーショット決定方法に使われるアンカーモデルショットをブロックに分ける方法を表す図である。
図4に、複数のブロックに分割されたアンカーモデルショット及び基本ショットを示す。前記アンカーモデルショットをブロックに分ける方法は、アンカーが左側にいる場合に、右側の字幕は考慮しない。すなわち、左側のアンカーのみを任意の複数のブロックに区分し、区分された複数のブロックデータをキーデータとして基本ショットと比較する。もちろん、比較される基本ショットも左側部分のみが考慮される。
ニュースのアンカーショットは、アンカーの位置がほぼ同じであるが、若干のカメラモーションとアンカーの動きとがあるため、位置情報を有しうるブロック単位のマッチング類似度を判断基準として利用してはじめて、信頼性のある結果が得られる。
任意のKブロックに対する平均値BKは、数式(4)のように表される。
ここで、RGBK(i)は、ブロックKに対するカラー値であり、Nは、一つのブロックにおける画素の数である。
アンカーモデルブロックKに対する平均値BKAとキーフレームブロックKに対する平均値BKSとの差Differを数式(5)のように表すことができる。
ここで、Gは、一つの画面に含まれた全体のブロック数である。前記差が所定の閾値以上であれば、アンカーショットと確定する。
図5は、本発明の他の一実施例による、アンカーショット決定装置を表すブロック図である。
図5を参照すれば、前記アンカーショット決定装置は、ショット境界決定部501、皮膚カラー抽出部502、アンカー顔決定部503、背景カラー領域決定部504、アンカーモデル候補ショット決定部505、客体カラー領域決定部506、ショットグルーピング部507、アンカーモデル生成部508、ブロック決定部509及びアンカーショット確定部510を備える。
ショット境界決定部501は、動画データを受信してショットを区分する境界を決定し、前記決定された境界に基づいて動画データから所定のショットを抽出する。
皮膚カラー抽出部502は、ショット境界決定部501から抽出されたショット中に含まれたアンカーの皮膚のカラー(皮膚カラー部)を抽出する。
アンカー顔決定部503は、皮膚カラー抽出部502から抽出された皮膚カラーの情報を利用してアンカーの顔を決定する。
背景カラー領域決定部504は、アンカー顔決定部503で決定されたアンカーの背景に対するカラー領域を決定して、アンカーを背景から識別することができるようにする。
アンカーモデル候補ショット決定部505は、アンカー顔決定部503で決定されたアンカー及び背景カラー領域決定部504で決定された背景カラーの情報を利用して、ショット境界決定部501から抽出されたショットのうち、アンカーモデル候補ショットを決定する。
客体カラー領域決定部506は、アンカーモデル候補ショット決定部505で決定されたショットのうち、アンカーに対するカラーの類似度を比較してアンカーの性別、アンカーの数及び報道ショットについての情報を決定する。
ショットグルーピング部507は、客体カラー領域決定部506で決定された情報を利用して、男子アンカーショット、女子アンカーショット及び報道ショットにグループ分けする。
アンカーモデル生成部508は、ショットグルーピング部507で生成された男子アンカーショットのグループ及び女子アンカーショットのグループで、アンカーの位置によって、アンカーモデルを生成する。言い換えれば、アンカーが画面の左側、中央または右側のどこにいるかによってアンカーモデルショットを生成する。
ブロック決定部509は、アンカーモデル生成部508で生成されたアンカーモデルショットのうち、アンカーの顔及び上体のみを一つの小さなブロックと定義する。それ以外の領域は、前記ブロックから除外される。
アンカーショット確定部510は、ブロック決定部509で決定されたブロックを利用して、アンカーモデル生成部508で生成された男子アンカーショットのうち少なくとも一つのアンカーショットを、女子アンカーショットのうち少なくとも一つのアンカーショットをそれぞれ確定する。
本発明によるアンカーショットの確定方法は、多様な形式のニュース動画からアンカーショットを検出可能にするために、ニュース動画に存在するアンカーの左側、右側及び中央のモデルを適応的に生成して利用する。誤検出の防止及び検出速度を速くするために、全体キーフレームと生成されたアンカーモデルとの間で同じ位置及びサイズについて類似性の程度を比較する。一回のみ出るアンカーに対してショットが検出されるようにするために、アンカーモデルと類似したキーフレームをアンカーショットと検出する。
前述した本発明によるモデル生成を利用したアンカー検出方法は、ニュースについての動画だけでなく、一般的な動画データとしてインデックス及び検索機能が付与されねばならない全ての動画データに適用できるということは、前述した説明から十分に類推されうる。
例えば、英語会話教習用に製作されたビデオには、一般的に、設定された状況によるダイアローグが複数個収録されている。これら複数のダイアローグは、一般的に、司会者があらかじめ出て、以後に展開される状況についてあらかじめ概略を説明した後に、展開されることが普通である。したがって、前記複数のダイアローグは、司会者が画面に現れるかどうかを基準として互いに分類できる。前記ビデオを動画に製作することによって、動画データは容易に得られる。
ニュースのアンカーに該当する人物が前記英語会話教習用の動画データの司会者であるということは、誰でも容易に考えられ、従って、本発明の内容をニュースの動画だけでなく、英語会話教習用の動画データにも適用できる。したがって、本発明に使われたアンカーは、ニュースの進行アナウンサーを指すことはもとより、動画データを分類するために使われる基準となるものは、いずれもアンカーと言える。
以上、図面及び明細書で最適の実施例が開示された。ここで、特定の用語が使われたが、これは、単に本発明を説明するための目的で使われたものであり、意味限定や特許請求の範囲に記載された本発明の範囲を制限するために使われたものではない。したがって、当業者ならば、これから多様な変形及び均等な他の実施例が可能であるということが分かる。したがって、本発明の真の技術的保護範囲は、特許請求の範囲の技術的思想によって決定されねばならない。
本発明は、ニュースまたは所定の動画を製作し、これをユーザに供給して使用するようにする分野に適用可能であり、特に、家庭用AV保存機器、コンテンツ提供用著作道具及びニュース動画の内容に基づいたインデックシング、要約、検索などに活用できる
本発明の一実施例によるアンカーショット決定方法の実施例を示すフローチャートである。 本発明の一実施例によるアンカーショット決定方法に使われるアンカーモデル候補ショットのクラスタである。 本発明の一実施例によるアンカーショット決定方法に使われるアンカーモデルショットを示す図面である。 本発明の一実施例によるアンカーショット決定方法に使われるアンカーモデルショットをブロックに分ける方法を表す図である。 本発明の他の一実施例による、アンカーショット決定装置を表すブロックダイヤグラムである。
符号の説明
110 基本ショット抽出段階
120 アンカーモデル候補ショット選択段階
130 アンカーモデルショット決定段階
140 アンカーショット確定段階
501 ショット境界決定部
502 皮膚カラー抽出部
503 アンカー顔決定部
504 背景カラー領域決定部
505 アンカーモデル候補ショット決定部
506 客体カラー領域決定部
507 ショットグルーピング部
508 アンカーモデル生成部
509 ブロック決定部
510 アンカーショット確定部

Claims (14)

  1. 動画データの内容をインデックシング、要約及び検索するのに活用できるアンカーショット決定方法において、
    (1)前記動画データから、複数の基本ショットを抽出する段階と、
    (2)前記抽出された複数の基本ショットの中から、前記アンカーショットを取得するために、複数のアンカーモデル候補ショットを選択する段階と、
    (3)前記複数のアンカーモデル候補ショット中から、少なくとも一つのアンカーモデルショットを決定する段階と、
    (4)前記少なくとも一つのアンカーモデルショットと前記複数の基本ショットとの間の類似度を求め、少なくとも一つのアンカーショットを確定する段階と
    を備えることを特徴とするアンカーショット決定方法。
  2. 前記(1)段階は、
    一定の時間停止した画面が他の画面に転換される瞬間を利用して前記複数の基本ショットを抽出することを特徴とする請求項1に記載のアンカーショット決定方法。
  3. 前記(2)段階は、
    アンカー顔検出情報、アンカー顔制約条件、ショットの長さ及び背景カラー情報の類似度を利用して前記複数のアンカーモデル候補ショットを抽出することを特徴とする請求項1に記載のアンカーショット決定方法。
  4. 前記アンカー顔制約条件は、
    顔のサイズ、顔の位置、横及び縦の比率、皮膚カラーの密度及び顔の動きであることを特徴とする請求項3に記載のアンカーショット決定方法。
  5. 前記背景カラー情報は、
    顔を含む四角形を基準として得られるカラー情報であることを特徴とする請求項3に記載のアンカーショット決定方法。
  6. 前記カラー情報は、
    顔を含む四角形を基準として得られる正規化及び量子化したカラーヒストグラムであることを特徴とする請求項5に記載のアンカーショット決定方法。
  7. 前記四角形は、
    前記顔の画面内の位置によって区別され、
    前記顔が左側にある場合には、前記画面の顔及び上体を含む左側の領域が前記四角形であり、
    前記顔が右側にある場合には、前記画面の顔及び上体を含む右側の領域が前記四角形であり、
    前記顔が中央部にある場合には、前記画面の全体が前記四角形であることを特徴とする請求項5または6に記載のアンカーショット決定方法。
  8. 前記四角形は、
    前記四角形を構成する複数の画素をグルーピングして複数のブロックに分割されることを特徴とする請求項7に記載のアンカーショット決定方法。
  9. 前記(3)段階は、
    画面に位置するアンカーの顔及び上体の位置を利用して前記少なくとも一つのアンカーモデルショットを抽出することを特徴とし、
    前記アンカーモデルショットの数は、アンカーの性別、アンカーの顔及び上体の位置によって決定されることを特徴とする請求項1に記載のアンカーショット決定方法。
  10. 前記(4)段階は、
    前記少なくとも一つのアンカーモデルショット及び前記複数の基本ショットに登場する前記アンカーの顔及び上体を含む四角形を取り出し、前記四角形を構成する画素をグルーピングして前記四角形を複数のブロックに分割し、
    比較されるショットを構成する前記ブロック間のカラー情報についての類似度を比較することを特徴とする請求項1に記載のアンカーショット決定方法。
  11. 前記カラー情報は、
    顔及び上体のカラー情報を正規化及び量子化したカラーヒストグラムであることを特徴とする請求項10に記載のアンカーショット決定方法。
  12. 前記(3)段階は、
    複数のアンカーモデル候補ショットの中から前記少なくとも一つのアンカーモデルショットを決定することを特徴とする請求項1に記載のアンカーショット決定方法。
  13. 前記(3)段階は、
    前記アンカーモデルショットの数が、前記アンカーモデル候補ショットの中から、画面上に現れるアンカーの性別、顔及び上体の位置によって決定されることを特徴とする請求項12に記載のアンカーショット決定方法。
  14. 動画データの内容をインデックシング、要約及び検索するのに活用できるアンカーショット決定装置において、
    入力された動画データにおいてショットの境界を決定し、当該境界に基づいて前記動画データから複数のショットを取得するショット境界決定部と、
    前記ショット境界決定部において取得されたショットに含まれるアンカーの皮膚カラー部を抽出する皮膚カラー抽出部と、
    前記皮膚カラー部を示す情報を用いて、前記アンカーの顔領域を決定するアンカー顔決定部と、
    前記アンカーの背景カラー領域を決定して、バックグラウンドとアンカーとの区別を可能にする背景カラー領域決定部と、
    前記アンカー顔決定部において決定された前記アンカーの顔領域及び前記背景カラー領域決定部において決定された前記アンカーの背景カラー領域を利用して、前記ショット境界決定部において取得されたショットの中から、アンカーモデル候補ショットを決定するアンカーモデル候補ショット決定部と、
    前記ショット境界決定部において取得されたショットにおけるカラー類似度の比較により、前記アンカーの性別、数、そして報道ショットに関する情報を生成する客体カラー領域決定部と、
    前記客体カラー領域決定部において生成された情報に基づいて、前記ショット境界決定部において取得されたショットを、男子アンカーショットと、女子アンカーショットと、報道ショットとにグループ分けするショットグルーピング部と、
    前記男子アンカーショットのグループと、前記女子アンカーショットのグループについて、アンカーの位置に基づいて、アンカーモデルを生成するアンカーモデル生成部と、
    前記アンカーモデルにおいて、前記アンカーの顔と上半身とを含むブロックを決定するブロック決定部と、
    前記ブロックを用いて、前記男子アンカーショットのグループと、前記女子アンカーショットのグループとのそれぞれにおいて、少なくとも一つのアンカーショットを確定するアンカーショット確定部と
    からなることを特徴とするアンカーショット決定装置。
JP2005053682A 2004-02-28 2005-02-28 アンカーショット決定方法及び決定装置 Pending JP2005243035A (ja)

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
KR1020040013778A KR100612842B1 (ko) 2004-02-28 2004-02-28 앵커 샷 결정방법 및 결정장치

Publications (1)

Publication Number Publication Date
JP2005243035A true JP2005243035A (ja) 2005-09-08

Family

ID=34747968

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2005053682A Pending JP2005243035A (ja) 2004-02-28 2005-02-28 アンカーショット決定方法及び決定装置

Country Status (5)

Country Link
US (1) US20050190965A1 (ja)
EP (1) EP1569240A1 (ja)
JP (1) JP2005243035A (ja)
KR (1) KR100612842B1 (ja)
CN (1) CN1662046A (ja)

Families Citing this family (15)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US7305128B2 (en) * 2005-05-27 2007-12-04 Mavs Lab, Inc. Anchor person detection for television news segmentation based on audiovisual features
KR100771244B1 (ko) * 2006-06-12 2007-10-29 삼성전자주식회사 동영상 데이터 처리 방법 및 장치
CN101114334B (zh) * 2006-07-25 2011-05-11 智辉研发股份有限公司 利用视觉特性检测新闻片段中播报员画面的方法
US7720281B2 (en) * 2006-07-31 2010-05-18 Mavs Lab, Inc. Visual characteristics-based news anchorperson segment detection method
JP2009048490A (ja) * 2007-08-21 2009-03-05 Toshiba Corp 類似ショット検出装置、プログラムおよび方法
CN103403762A (zh) * 2011-03-04 2013-11-20 株式会社尼康 图像处理装置及图像处理程序
US9031384B2 (en) * 2011-06-02 2015-05-12 Panasonic Intellectual Property Corporation Of America Region of interest identification device, region of interest identification method, region of interest identification program, and region of interest identification integrated circuit
JP5959923B2 (ja) * 2012-04-26 2016-08-02 キヤノン株式会社 検出装置、その制御方法、および制御プログラム、並びに撮像装置および表示装置
KR101492060B1 (ko) * 2013-08-20 2015-02-12 전자부품연구원 동영상의 일괄 컬러 변환 방법 및 그 기록매체
CN106412514B (zh) * 2016-10-14 2019-11-05 广州视睿电子科技有限公司 一种视频处理的方法和装置
CN107087211B (zh) * 2017-03-30 2020-12-11 北京奇艺世纪科技有限公司 一种主持人镜头检测方法及装置
CN107277557B (zh) * 2017-06-16 2019-12-03 深圳市茁壮网络股份有限公司 一种视频分割方法及***
KR102045347B1 (ko) * 2018-03-09 2019-11-15 에스케이브로드밴드주식회사 영상제작지원장치 및 그 동작 방법
US11727666B2 (en) * 2019-09-12 2023-08-15 Paul Clauson Automatic target scoring machine
CN117745974B (zh) * 2024-02-19 2024-05-10 潍坊幻视软件科技有限公司 一种动态生成圆角矩形网格的方法

Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20020146168A1 (en) * 2001-03-23 2002-10-10 Lg Electronics Inc. Anchor shot detection method for a news video browsing system

Family Cites Families (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR100438304B1 (ko) * 2002-05-24 2004-07-01 엘지전자 주식회사 실시간 진행형 뉴스 비디오 인덱싱 방법 및 시스템
US20050022252A1 (en) * 2002-06-04 2005-01-27 Tong Shen System for multimedia recognition, analysis, and indexing, using text, audio, and digital video
US7305128B2 (en) * 2005-05-27 2007-12-04 Mavs Lab, Inc. Anchor person detection for television news segmentation based on audiovisual features

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20020146168A1 (en) * 2001-03-23 2002-10-10 Lg Electronics Inc. Anchor shot detection method for a news video browsing system
JP2003032583A (ja) * 2001-03-23 2003-01-31 Lg Electronics Inc ニュースビデオブラウジングシステムでアンカーショットの自動検出方法

Also Published As

Publication number Publication date
KR20050087987A (ko) 2005-09-01
US20050190965A1 (en) 2005-09-01
KR100612842B1 (ko) 2006-08-18
EP1569240A1 (en) 2005-08-31
CN1662046A (zh) 2005-08-31

Similar Documents

Publication Publication Date Title
JP2005243035A (ja) アンカーショット決定方法及び決定装置
Cernekova et al. Information theory-based shot cut/fade detection and video summarization
US8316301B2 (en) Apparatus, medium, and method segmenting video sequences based on topic
US7184100B1 (en) Method of selecting key-frames from a video sequence
US8442384B2 (en) Method and apparatus for video digest generation
JP5420199B2 (ja) 映像解析装置、映像解析方法、ダイジェスト自動作成システム及びハイライト自動抽出システム
US6389168B2 (en) Object-based parsing and indexing of compressed video streams
US7327885B2 (en) Method for detecting short term unusual events in videos
JP4559935B2 (ja) 画像記憶装置及び方法
US20030061612A1 (en) Key frame-based video summary system
KR100438269B1 (ko) 뉴스 비디오 브라우징 시스템에서 앵커 샷 자동 검출 방법
KR100411342B1 (ko) 비디오 텍스트 합성 키프레임 생성방법
Truong et al. Scene extraction in motion pictures
JP2001022792A (ja) キーフレーム選択のための候補フレームを選択する方法
US10089532B2 (en) Method for output creation based on video content characteristics
CN103200463A (zh) 一种视频摘要生成方法和装置
JP2011019192A (ja) 画像表示装置
JP2007200249A (ja) 映像検索方法及び装置及びプログラム及びコンピュータ読み取り可能な記録媒体
US20070061727A1 (en) Adaptive key frame extraction from video data
KR101822443B1 (ko) 샷 경계 및 자막을 이용한 동영상 축약 방법 및 처리 장치
JP2009060413A (ja) 動画特徴抽出方法およびシステムならびに動画検索方法およびシステム
KR20050033075A (ko) 비디오 이미지들의 시퀀스에서 콘텐트 속성을 검출하는 유닛 및 방법
Bertini et al. Semantic adaptation of sport videos with user-centred performance analysis
Jindal et al. Efficient and language independent news story segmentation for telecast news videos
O'hare et al. A generic news story segmentation system and its evaluation

Legal Events

Date Code Title Description
RD04 Notification of resignation of power of attorney

Free format text: JAPANESE INTERMEDIATE CODE: A7424

Effective date: 20061114

RD02 Notification of acceptance of power of attorney

Free format text: JAPANESE INTERMEDIATE CODE: A7422

Effective date: 20061129

A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20080201

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20100727

A02 Decision of refusal

Free format text: JAPANESE INTERMEDIATE CODE: A02

Effective date: 20110412