JP6034702B2 - 画像処理装置及び画像処理プログラム - Google Patents
画像処理装置及び画像処理プログラム Download PDFInfo
- Publication number
- JP6034702B2 JP6034702B2 JP2013004775A JP2013004775A JP6034702B2 JP 6034702 B2 JP6034702 B2 JP 6034702B2 JP 2013004775 A JP2013004775 A JP 2013004775A JP 2013004775 A JP2013004775 A JP 2013004775A JP 6034702 B2 JP6034702 B2 JP 6034702B2
- Authority
- JP
- Japan
- Prior art keywords
- scene
- image
- block
- feature information
- histogram
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 238000012545 processing Methods 0.000 title claims description 34
- 238000005070 sampling Methods 0.000 claims description 15
- 239000000284 extract Substances 0.000 claims description 2
- 238000000034 method Methods 0.000 description 57
- 239000012634 fragment Substances 0.000 description 49
- 230000008569 process Effects 0.000 description 25
- 239000013598 vector Substances 0.000 description 14
- 238000010586 diagram Methods 0.000 description 13
- 238000000605 extraction Methods 0.000 description 11
- 238000002360 preparation method Methods 0.000 description 11
- 238000004364 calculation method Methods 0.000 description 10
- 238000003860 storage Methods 0.000 description 5
- 230000000007 visual effect Effects 0.000 description 5
- 230000006870 function Effects 0.000 description 4
- 238000004519 manufacturing process Methods 0.000 description 4
- PEDCQBHIVMGVHV-UHFFFAOYSA-N Glycerine Chemical compound OCC(O)CO PEDCQBHIVMGVHV-UHFFFAOYSA-N 0.000 description 3
- 230000011218 segmentation Effects 0.000 description 3
- 241000251468 Actinopterygii Species 0.000 description 2
- 238000013459 approach Methods 0.000 description 2
- 238000004891 communication Methods 0.000 description 2
- 230000000052 comparative effect Effects 0.000 description 2
- 230000000694 effects Effects 0.000 description 2
- 238000011156 evaluation Methods 0.000 description 2
- 238000012935 Averaging Methods 0.000 description 1
- 238000013473 artificial intelligence Methods 0.000 description 1
- 230000001364 causal effect Effects 0.000 description 1
- 238000007796 conventional method Methods 0.000 description 1
- 238000011161 development Methods 0.000 description 1
- 230000018109 developmental process Effects 0.000 description 1
- 238000005516 engineering process Methods 0.000 description 1
- 238000002474 experimental method Methods 0.000 description 1
- 230000006872 improvement Effects 0.000 description 1
- 230000007246 mechanism Effects 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 238000010606 normalization Methods 0.000 description 1
- 230000003287 optical effect Effects 0.000 description 1
- 238000005457 optimization Methods 0.000 description 1
- 238000011160 research Methods 0.000 description 1
- 239000004065 semiconductor Substances 0.000 description 1
- 230000008685 targeting Effects 0.000 description 1
Landscapes
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
- Television Signal Processing For Recording (AREA)
- Image Analysis (AREA)
Description
本発明は、映像に含まれる複数のフレーム画像を用いて、映像(例えば、シーン毎)に対する特徴情報を取得する。具体的には、各フレーム画像に対して1又は複数の異なる画像サイズ(以下、「多重スケール」という)を有する画像片ワードのヒストグラム(多重スケール画像片ワードヒストグラム、Histogram of Multi−scale Image Piece Word、以下、必要に応じて「H−MIPW」という)に基づく特徴情報を用いて各シーンの分類を行う。
図3は、画像処理装置の機能構成の一例を示す図である。図3の例に示す画像処理装置10は、大別すると、特徴抽出装置20と、シーン検索装置30とを有する。なお、本実施形態における画像処理装置10は、特徴抽出装置20及びシーン検索装置30のうちの何れかを有する構成であってもよい。
上述した画像片ワード生成手段23における多重スケール画像片ワード(MIPWord)を生成する手法について説明する。MIPWordは、例えば検索対象映像から無作為に選んだ準備用映像等を用いて生成する。図4は、多重スケール画像片ワードの生成処理の一例を示すフローチャートである。また、図5は、画像片ワードの生成の流れを示す図である。
次に、所定のシーン単位のH−MIPWの算出例について、図を用いて説明する。本実施形態では、多重スケール画像片ワード(MIPWord)に基づき、検索対象映像の各シーンのH−MIPWを算出する。
次に、シーン検索装置30における多重スケール画像片ワードヒストグラム(H−MIPW)を用いたシーン検索の一例について説明する。
次に、本実施形態における効果を明確にするため、一例として実際の番組映像を対象とした各シーンのH−MIPWの類似性に基づくシーン検索実験について説明し、「映像内容の類似したシーンを検索する」という観点でのH−MIPWの性能を検証する。
実験条件としては、使用映像の一例として自然関連の放送番組映像254本を用い、MIPWord生成用の準備用映像100本を用いる。また、検索対象映像も254本を用いる。シーンの区切りは、1シーンのショット数を固定とし、5ショット毎に1シーンとした。全シーン数は約7300であり、フレーム画像正規化サイズは320×180とし、ブロック分割スケールはNd=2、スケール1(16×16画素)、スケール2(8×8画素)とする。また、MIPWord数は、スケール1及びスケール2は共に750とする。
ここで、検索結果の精度を評価するための尺度(関連度)について説明する。関連度は、シーンの各ショットが正解映像内容と関連しているか、及びシーンがどれだけ正解映像内容を網羅しているか等の両面を考慮して定めることができるが、これに限定されるものではなく、例えば上述の何れかであってもよい。ここで、あるシーンと正解映像内容との関連度Rを、「R=(2RsRc/(Rs+Rc)) ・・・(1)」のように設定することができる。ここで、Rsは、「シーンにおける正解映像内容の何れかを含むショット比率」である。また、Rcは、「何れかのショットに含まれる正解映像内容の比率」を表す。
次に、H−MIPWを用いたシーン検索結果例について説明する。ここで、図12は、本実施形態における検索結果の一例を示す図である。図12(a)〜図12(c)は、検索結果例1〜3を示すものである。具体的には、図12(a)は、上述した図10に示すクエリーシーンQ1に対する検索結果上位20シーンを示している。また同様に、図12(b)がクエリーシーンQ3、図12(c)がクエリーシーンQ9に対するそれぞれの検索結果上位20シーンを示している。
次に、本実施形態の有効性を客観的に実証するため、関連手法との精度比較結果について説明する。まず、ブロック分割を多重スケールにすることの効果を検証するために、2つの手法を比較対象とする。図13は、比較手法の一例を示す図である。図13(a)は、比較手法1として、画像片(ブロック画像)でワードを生成することによる優位性を実証するために、従来の局所特徴を用いたBag of Visual Wordsによる手法を示している。代表的な局所特徴としては、輝度勾配ベースのSIFT(Scale Invariant Feature Transform)特徴、及びSURF(Speeded Up Robust Features)特徴、SIFT特徴をカラー画像用に拡張したColor−SIFT特徴等を用いることができる。この度の比較では、Color−SIFT特徴を比較対象とし、Visual Wordsのワード数は1000とする。
ここで、上述した画像処理装置10は、例えばCPU(Central Processing Unit)、RAM(Random Access Memory)等の揮発性の記憶装置、ROM(Read Only Memory)等の不揮発性の記憶装置、マウスやキーボード、ポインティングデバイス等の入力装置、画像やデータ等を表示する表示装置、並びに外部と通信するためのインタフェース装置を備えたコンピュータによって構成することができる。
20 特徴抽出装置
21 サンプリング取得手段
22 分割ブロック設定手段
23 画像片ワード生成手段(ブロック特徴情報生成手段)
24 シーン分割手段
25,31 ヒストグラム生成手段
30 シーン検索装置
32 検索手段
41 準備用映像集合
42 準備用フレーム画像集合
43 画像片ワード
44 検索対象映像
45 検索対象シーン
46,52 画像片ワードヒストグラム
51 要求シーン
53 検索結果
Claims (5)
- 映像に含まれる各シーンの特徴情報を抽出する画像処理装置において、
サンプル映像から所定のフレーム画像をサンプリングするサンプリング取得手段と、
前記サンプリング取得手段により得られる各フレーム画像に対して、1又は複数のスケール毎にそれぞれ分割し、分割したブロック毎の特徴情報を生成するブロック特徴情報生成手段と、
前記特徴情報を生成する対象映像からシーンを分割するシーン分割手段と、
前記シーン分割手段により分割されたシーン毎に、前記ブロック特徴情報生成手段により得られるブロックを用いて、ブロック毎の出現比率に基づくヒストグラムを生成するヒストグラム生成手段とを有することを特徴とする画像処理装置。 - 前記ヒストグラム生成手段は、ユーザからの検索要求シーンに対してブロック単位のヒストグラムを生成し、
生成された前記検索要求シーンを用いて、前記ヒストグラム生成手段で生成されたヒストグラムを参照し、対応するシーンを検索する検索手段とを有することを特徴とする請求項1に記載の画像処理装置。 - 前記ブロック特徴情報生成手段により生成される1又は複数のブロックの大きさ、種類、及び数のうち、少なくとも1つを設定する分割ブロック設定手段を有することを特徴とする請求項1又は2に記載の画像処理装置。
- 前記特徴情報は、色特徴又はテクスチャ特徴であることを特徴とする請求項1乃至3の何れか1項に記載の画像処理装置。
- 映像に含まれる各シーンの特徴情報を抽出する画像処理をコンピュータに実行させるための画像処理プログラムにおいて、
前記コンピュータを、
サンプル映像から所定のフレーム画像をサンプリングするサンプリング取得手段、
前記サンプリング取得手段により得られる各フレーム画像に対して、1又は複数のスケール毎にそれぞれ分割し、分割したブロック毎の特徴情報を生成するブロック特徴情報生成手段、
前記特徴情報を生成する対象映像からシーンを分割するシーン分割手段、及び、
前記シーン分割手段により分割されたシーン毎に、前記ブロック特徴情報生成手段により得られるブロックを用いて、ブロック毎の出現比率に基づくヒストグラムを生成するヒストグラム生成手段として機能させるための画像処理プログラム。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2013004775A JP6034702B2 (ja) | 2013-01-15 | 2013-01-15 | 画像処理装置及び画像処理プログラム |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2013004775A JP6034702B2 (ja) | 2013-01-15 | 2013-01-15 | 画像処理装置及び画像処理プログラム |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2014137637A JP2014137637A (ja) | 2014-07-28 |
JP6034702B2 true JP6034702B2 (ja) | 2016-11-30 |
Family
ID=51415117
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2013004775A Active JP6034702B2 (ja) | 2013-01-15 | 2013-01-15 | 画像処理装置及び画像処理プログラム |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP6034702B2 (ja) |
Families Citing this family (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP6557592B2 (ja) * | 2015-12-15 | 2019-08-07 | 日本放送協会 | 映像シーン分割装置及び映像シーン分割プログラム |
Family Cites Families (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP3175632B2 (ja) * | 1997-04-18 | 2001-06-11 | 松下電器産業株式会社 | シーンチェンジ検出方法およびシーンチェンジ検出装置 |
JP4177689B2 (ja) * | 2003-03-18 | 2008-11-05 | 日本放送協会 | 映像特徴情報生成装置 |
JP5204716B2 (ja) * | 2009-04-15 | 2013-06-05 | 日本放送協会 | 映像検索装置及び映像検索プログラム |
JP2011248671A (ja) * | 2010-05-27 | 2011-12-08 | Kddi Corp | 多数の参照用映像の中から検索キー用映像を用いて検索する映像検索装置、プログラム及び方法 |
-
2013
- 2013-01-15 JP JP2013004775A patent/JP6034702B2/ja active Active
Also Published As
Publication number | Publication date |
---|---|
JP2014137637A (ja) | 2014-07-28 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
Khosla et al. | Large-scale video summarization using web-image priors | |
JP5503046B2 (ja) | 形状に基づく画像検索 | |
JP4337064B2 (ja) | 情報処理装置、情報処理方法、およびプログラム | |
CN108881947B (zh) | 一种直播流的侵权检测方法及装置 | |
Priya et al. | Shot based keyframe extraction for ecological video indexing and retrieval | |
CN111209897B (zh) | 视频处理的方法、装置和存储介质 | |
CN107223242B (zh) | 用于在多个已存储图像中搜索相似图像的方法 | |
Wang et al. | Duplicate discovery on 2 billion internet images | |
CN103995864B (zh) | 一种图像检索方法和装置 | |
Dharani et al. | Content based image retrieval system using feature classification with modified KNN algorithm | |
CN103744903B (zh) | 一种基于草图的场景图像检索方法 | |
Blažek et al. | Video retrieval with feature signature sketches | |
JP6034702B2 (ja) | 画像処理装置及び画像処理プログラム | |
Chen et al. | Mobile visual search from dynamic image databases | |
JP2015130041A (ja) | 画像処理装置及び画像処理プログラム | |
JP6254771B2 (ja) | 画像処理装置及び画像処理プログラム | |
Tsai | Two strategies for bag-of-visual words feature extraction | |
JP2006350655A (ja) | Web画像検索結果分類提示方法及び装置及びプログラム及びプログラムを格納した記憶媒体 | |
Li et al. | Image content clustering and summarization for photo collections | |
Doulamis et al. | A 4D virtual/augmented reality viewer exploiting unstructured web-based image data | |
WO2015185479A1 (en) | Method of and system for determining and selecting media representing event diversity | |
Castelo-Fernández et al. | Automatic video summarization using the optimum-path forest unsupervised classifier | |
Mashhadani et al. | Identification and extraction of digital forensic evidence from multimedia data sources using multi-algorithmic fusion | |
Hatem et al. | Automatic content description and annotation of sport images using classification techniques | |
Kawai et al. | NHK STRL at TRECVID 2013: Semantic Indexing. |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20151201 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20160926 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20161004 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20161028 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 6034702 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |