JP5565737B2 - 映像イベント検出装置およびその動作方法 - Google Patents

映像イベント検出装置およびその動作方法 Download PDF

Info

Publication number
JP5565737B2
JP5565737B2 JP2012022970A JP2012022970A JP5565737B2 JP 5565737 B2 JP5565737 B2 JP 5565737B2 JP 2012022970 A JP2012022970 A JP 2012022970A JP 2012022970 A JP2012022970 A JP 2012022970A JP 5565737 B2 JP5565737 B2 JP 5565737B2
Authority
JP
Japan
Prior art keywords
image
frame image
line
reproduced
frame
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
JP2012022970A
Other languages
English (en)
Other versions
JP2013162344A (ja
Inventor
聡 嶌田
豪 東野
啓樹 靜谷
美徳 早川
大 三石
文子 今野
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Tohoku University NUC
Nippon Telegraph and Telephone Corp
Original Assignee
Tohoku University NUC
Nippon Telegraph and Telephone Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Tohoku University NUC, Nippon Telegraph and Telephone Corp filed Critical Tohoku University NUC
Priority to JP2012022970A priority Critical patent/JP5565737B2/ja
Publication of JP2013162344A publication Critical patent/JP2013162344A/ja
Application granted granted Critical
Publication of JP5565737B2 publication Critical patent/JP5565737B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Landscapes

  • Studio Devices (AREA)

Description

本発明は、映像ファイルに映った場所で線が書かれ始めるタイミングおよび/または線が消去されるタイミングを高い精度で検出する映像イベント検出装置およびその動作方法に関するものである。
講義の様子を撮影した映像において、黒板に書かれた文字や図形の変化量により、「板書する」という行動を検出する従来技術の文献としては、非特許文献1がある。
非特許文献1の方法は以下の通りである。
まず、映像から一定間隔でフレーム画像をサンプリングし,n−1番目のフレーム画像F(n−1)とn番目のフレーム画像F(n)の差分の2値化処理で、フレーム画像F(n)における講師の領域を求め、これを各フレーム画像で行い、それぞれ講師領域を検出する。
次に、フレーム画像F(n)から講師領域を消去した講師消去画像G(n)を求めるために、フレーム画像F(n)の講師領域以外の画素を講師消去画像G(n)に転写し、フレーム画像F(n)の講師領域に相当する、1つ前の講師消去画像G(n−1)の画素を講師消去画像G(n)に転写する。
次に、講師消去画像G(n)と講師消去画像G(n−1)の差分を2値化処理で文字差分画像を求める。つまり、フレーム画像F(n)とフレーム画像F(n−1)で変更のあった文字領域を検出する。
最後に、文字差分画像の文字画素数の変化量を求め、変化量から板書を行っているかを判別する。
篠木雄大,藤吉弘亘:高解像度映像からの視聴者の注目点を考慮した講義映像の自動生成,映像情報メディア学会誌, Vol.62, No.2, pp.240-246, 2008.
従来技術では、講義の映像で大きく変化する領域は講師領域であることから、フレーム画像間の差分で求めた動領域を講師領域として検出している。しかしながら、フレーム画像間の差分では動領域(講師領域)を概ねは検出できるが、正確に検出することは困難である。特に、講師の動きが少ない場合には、講師領域の検出は極めて困難である。また、講師領域を検出した後に講師消去画像を生成し、講師消去画像と1つ前の講師消去画像の差分により、講師消去画像で変化があった領域を求め、これを文字差分画像としているが、照明変動、文字のかすれなどのノイズの影響を受けやすい。これらの問題により文字画素数の変化量を正しく求められない場合があり、板書の開始時刻などの検出精度が低いことが問題である。
本発明は、上記の課題に鑑みてなされたものであり、その目的とするところは、映像ファイルに映った場所で線が書かれ始めるタイミングおよび/または線が消去されるタイミングを高い精度で検出する映像イベント検出装置およびその動作方法を提供することにある。
上記の課題を解決するために、第1の本発明は、映像ファイルに映った場所で線が書かれ始めるタイミングおよび/または線が消去されるタイミングを検出する映像イベント検出装置であって、前記映像ファイルから再生順にサンプリングされた各フレーム画像からサンプリングごとに線を消去し線消去画像を生成する線消去処理部と、前記各フレーム画像のサンプリングごとに、当該フレーム画像に映った場所の前景の領域を示す前景領域画像を生成する前景領域検出部と、前記各フレーム画像のサンプリングごとに、当該フレーム画像および当該フレーム画像から生成された線消去画像の差分画像を生成し、当該差分画像の、対応する前景領域画像により示される領域以外に該当する差分画像背景領域を含む画像である線画像を生成する線画像生成部と、前記各線画像が記憶される線画像記憶部とを備え、前記線画像生成部は、前記各フレーム画像について、当該フレーム画像より先に再生されるフレーム画像を用いて生成された線画像が前記線画像記憶部にある場合は、当該線画像を読み出し、当該線画像から、当該後に再生されるフレーム画像に対応する前景領域画像により示される領域に該当する線画像前景領域を抜き出し、当該後に再生されるフレーム画像に対応する線画像に当該線画像前景領域を含めるものであり、前記映像イベント検出装置は、さらに、前記各線画像内の線の量を示す線量を計算し、前記各フレーム画像の再生順での当該線量の変化に基づいて、前記映像ファイルに映った場所で線が書かれ始めるタイミングおよび/または線が消去されるタイミングを検出するイベント検出部を備えることを特徴とする映像イベント検出装置をもって解決手段とする。
例えば、第1の本発明において、前記イベント検出部は、順次に再生される複数のフレーム画像のそれぞれにつき、当該対象のフレーム画像の直前に再生されるフレーム画像がある場合には当該対象のフレーム画像に対応する線量から当該直前に再生されるフレーム画像に対応する線量を減じた線量増分を計算し、当該複数のフレーム画像で最も後に再生されるフレーム画像に対応する線量増分が予め設定されたしきい値より大きく且つ、当該最も後に再生されるフレーム画像以外のフレーム画像に対応する線量増分が当該しきい値以下であり且つ、当該最も先に再生されるフレーム画像の再生のタイミングと当該最も後に再生されるフレーム画像の再生のタイミングとの間の時間差が予め設定されたしきい値より大きいなら、当該最も後に再生されるフレーム画像の再生のタイミングを前記線が書かれ始めるタイミングとし、あるフレーム画像に対応する線量から当該フレーム画像の直後に再生されるフレーム画像に対応する線量を減じた線量減分が予め設定されたしきい値より大きいなら、当該直後に再生されるフレーム画像の再生のタイミングを前記線が消去されるタイミングとする。
例えば、第1の本発明において、前記イベント検出部は、前記各フレーム画像の再生順で前記線量を累積した累積線量を計算し、順次に再生される複数のフレーム画像に対応する累積線量の増加率が予め設定されたしきい値より大きく且つ、当該複数のフレーム画像で最も先に再生されるフレーム画像に対応する累積線量から当該フレーム画像の直前に再生されるフレーム画像に対応する累積線量を減じた累積線量増分が予め設定されたしきい値以下であり且つ、当該最も先に再生されるフレーム画像の直後に再生されるフレーム画像に対応する累積線量から当該最も先に再生されるフレーム画像に対応する累積線量を減じた累積線量増分が当該しきい値より大きいなら、当該最も先に再生されるフレーム画像の直後に再生されるフレーム画像の再生のタイミングを前記線が書かれ始めるタイミングとし、あるフレーム画像に対応する累積線量から当該フレーム画像の直後に再生されるフレーム画像に対応する累積線量を減じた累積線量減分が予め設定されたしきい値より大きいなら、当該直後に再生されるフレーム画像の再生のタイミングを前記線が消去されるタイミングとする。
第2の本発明は、映像ファイルに映った場所で線が書かれ始めるタイミングおよび/または線が消去されるタイミングを検出する映像イベント検出装置の動作方法であって、前記映像イベント検出装置の線消去処理部が、前記映像ファイルから再生順にサンプリングされた各フレーム画像からサンプリングごとに線を消去し線消去画像を生成し、前記映像イベント検出装置の前景領域検出部が、前記各フレーム画像のサンプリングごとに、当該フレーム画像に映った場所の前景の領域を示す前景領域画像を生成し、前記映像イベント検出装置の線画像生成部が、前記各フレーム画像のサンプリングごとに、当該フレーム画像および当該フレーム画像から生成された線消去画像の差分画像を生成し、当該差分画像の、対応する前景領域画像により示される領域以外に該当する差分画像背景領域を含む画像である線画像を生成し、当該線画像を前記映像イベント検出装置に設けられた線画像記憶部に記憶させ、前記線画像生成部は、前記各フレーム画像について、当該フレーム画像より先に再生されるフレーム画像を用いて生成された線画像が前記線画像記憶部にある場合は、当該線画像を読み出し、当該線画像から、当該後に再生されるフレーム画像に対応する前景領域画像により示される領域に該当する線画像前景領域を抜き出し、当該後に再生されるフレーム画像に対応する線画像に当該線画像前景領域を含め、前記映像イベント検出装置のイベント検出部が、前記各線画像内の線の量を示す線量を計算し、前記各フレーム画像の再生順での当該線量の変化に基づいて、前記映像ファイルに映った場所で線が書かれ始めるタイミングおよび/または線が消去されるタイミングを検出することを特徴とする映像イベント検出装置の動作方法をもって解決手段とする。
例えば、第2の本発明において、前記イベント検出部は、順次に再生される複数のフレーム画像のそれぞれにつき、当該対象のフレーム画像の直前に再生されるフレーム画像がある場合には当該対象のフレーム画像に対応する線量から当該直前に再生されるフレーム画像に対応する線量を減じた線量増分を計算し、当該複数のフレーム画像で最も後に再生されるフレーム画像に対応する線量増分が予め設定されたしきい値より大きく且つ、当該最も後に再生されるフレーム画像以外のフレーム画像に対応する線量増分が当該しきい値以下であり且つ、当該最も先に再生されるフレーム画像の再生のタイミングと当該最も後に再生されるフレーム画像の再生のタイミングとの間の時間差が予め設定されたしきい値より大きいなら、当該最も後に再生されるフレーム画像の再生のタイミングを前記線が書かれ始めるタイミングとし、あるフレーム画像に対応する線量から当該フレーム画像の直後に再生されるフレーム画像に対応する線量を減じた線量減分が予め設定されたしきい値より大きいなら、当該直後に再生されるフレーム画像の再生のタイミングを前記線が消去されるタイミングとする。
例えば、第2の本発明において、前記イベント検出部は、前記各フレーム画像の再生順で前記線量を累積した累積線量を計算し、順次に再生される複数のフレーム画像に対応する累積線量の増加率が予め設定されたしきい値より大きく且つ、当該複数のフレーム画像で最も先に再生されるフレーム画像に対応する累積線量から当該フレーム画像の直前に再生されるフレーム画像に対応する累積線量を減じた累積線量増分が予め設定されたしきい値以下であり且つ、当該最も先に再生されるフレーム画像の直後に再生されるフレーム画像に対応する累積線量から当該最も先に再生されるフレーム画像に対応する累積線量を減じた累積線量増分が当該しきい値より大きいなら、当該最も先に再生されるフレーム画像の直後に再生されるフレーム画像の再生のタイミングを前記線が書かれ始めるタイミングとし、あるフレーム画像に対応する累積線量から当該フレーム画像の直後に再生されるフレーム画像に対応する累積線量を減じた累積線量減分が予め設定されたしきい値より大きいなら、当該直後に再生されるフレーム画像の再生のタイミングを前記線が消去されるタイミングとする。
本発明によれば、映像ファイルに映った場所で線が書かれ始めるタイミングおよび/または線が消去されるタイミングを高い精度で検出することができる。
本実施の形態に係る映像イベント検出装置の構成を示す機能ブロック図である。 映像イベント検出装置の動作方法を示すフローチャートである。 図3(a)は、フレーム画像の一例であり、図3(b)は、線消去画像の一例である。 図4(a)は、2値化画像の一例であり、図4(b)は、線消去画像において黒板の位置を示した図である。 線画像の生成の様子の一例を示す図である。 イベント検出部16に関する実施例1の説明に用いるための図である。 イベント検出部16に関する実施例2の説明に用いるための図である。
以下、本発明の実施の形態について図面を参照して説明する。
図1は、本実施の形態に係る映像イベント検出装置の構成を示す機能ブロック図である。図2は、映像イベント検出装置の動作方法を示すフローチャートである。
図1において、映像イベント検出装置1は、映像ファイルに映った場所で線が書かれ始めるタイミングや線が消去されるタイミングを検出する装置である。場所は、例えば教室であり、線は、例えば講師により文字や図形として、チョークを使い黒板に書かれる。線は、例えば、黒板消しで消去される。
映像イベント検出装置1は、図示しない記憶装置などから映像ファイルを読み取る映像取得部11と、映像ファイルのフレーム画像から線を消去し線消去画像を生成する線消去処理部12と、フレーム画像に映った場所の前景の領域を示す前景領域画像を生成する前景領域検出部13と、フレーム画像、線消去画像および前景領域画像を使用して、線画像と称する画像を生成する線画像生成部14と、線画像を記憶する線画像記憶部15と、各線画像内の線の量を示す線量を計算し、各フレーム画像の再生順での線量の変化に基づいて、上記の線が書かれ始めるタイミングや線が消去されるタイミングを検出するイベント検出部16とを備える。イベント検出部16は、検出結果として、例えば、映像ファイルにインデクスを設定する。検出結果は、例えば、図示しない表示装置に表示するというように、別な方法で出力してもよい。
映像取得部11は、図示しない記憶装置などから映像ファイルを読み取り、映像ファイルから再生順にフレーム画像をサンプリングし、サンプリングした各フレーム画像を線消去処理部12、前景領域検出部13および線画像生成部14に出力する。どのフレーム画像をサンプリングするかを示すサンプリング速度は予め定められており、映像取得部11は、サンプリング速度に基づいてサンプリングを行う。
図2のステップ101で、映像取得部11は、n番目のフレーム画像のサンプリング、出力を行う。
図1に戻り、線消去処理部12は、フレーム画像の出力ごとに、つまり、サンプリングごとに、フレーム画像から線を消去し、つまり、消去後の画像(線消去画像という)を生成し、線消去画像を前景領域検出部13に出力する。
図2のステップ102で、線消去処理部12は、各フレーム画像の中で対象となっているn番目のフレーム画像に対応する線消去画像の生成、出力を行う。
線消去画像の生成(線の消去)は、例えば、モルフォロジーによる平滑化処理により実現できる。図3(a)は、フレーム画像の一例であり、教師が黒板に文字や図形などの線を書いている。このフレーム画像に最小値フィルタを施した後、最大値フィルタを実行すると、図3(b)に示す線消去画像となる。線消去画像は、文字などの線が消去されたものとなっている。図3は、明度の低い黒板上に明度の高い文字などが書かれた場合の結果であるが、文字などをホワイトボードに黒いペンで書いた場合には、最大値フィルタを施した後に最小値フィルタを実行すればよい。
図1に戻り、前景領域検出部13は、フレーム画像および線消去画像の出力ごとに、つまり、サンプリングごとに、フレーム画像に映った場所の前景の領域を示す前景領域画像を生成し、線消去画像および前景領域画像を線画像生成部14に出力する。
前景領域画像は、例えば、図4(a)に示すような、講師の輪郭などを示す2値化画像である。
ここでは、前景領域検出部13は、例えば、予め黒板の位置が分かっている場合は、当該位置を記憶しており、図4(b)に示すように、線消去画像の当該位置(符号a1の領域)の色を検出し、当該色に類似しない色の領域を前景の領域として検出し、当該領域を示す前景領域画像を生成する。また、黒板の色を予め記憶していてもよい。
黒板の色を示す情報(色情報)は、以下のように求め、記憶すればよい。例えば、黒板の複数箇所での色の頻度分布を求め、予め定められた値以上の頻度の色の分布を色情報とする。または、黒板の色の色空間での正規分布、または、混合正規分布を色情報とする。黒板の複数箇所での色に対しクラスタリングを行い、クラスタの中心の色を示す情報を色情報とする。
類似の有無は、記憶した黒板の色(色情報)と、対象の位置の色(色情報)との距離に基づいて判定すればよい。
なお、前景の面積より黒板の面積が大きいことが予想される場合には、黒板の領域を自動検出するか、黒板の領域を手動で設定し、その領域全体で頻出する色(または色の分布)を黒板の色(色の分布)としてもよい。
上記では、色情報に基づいて分離する方法を説明しているが、明度を含めたLab、HSVなどの色空間を用いてもよい。
図2のステップ103で、前景領域検出部13は、n番目のフレーム画像が最初にサンプリングされたフレーム画像であるか否かを判定し、そうであるなら(YES)、線消去画像の予め定められた位置の色(黒板の色)を検出し(ステップ104)、当該色に基づいて、前景領域画像を生成し、線消去画像とともに出力する(ステップ105)。一方、n番目のフレーム画像が最初にサンプリングされたフレーム画像でないなら(ステップ103:NO)、ステップ104で検出し、記憶しておいた色に基づいて、前景領域画像を生成し、前景領域画像とともに出力する(ステップ105)。
図1に戻り、線画像生成部14は、フレーム画像、線消去画像および前景領域画像の出力ごとに、つまり、フレーム画像のサンプリングごとに線画像を生成し、線画像を線画像記憶部15およびイベント検出部16に出力する。線画像記憶部15は、線画像を記憶する。
図5に示すように、具体的には、線画像生成部14は、まず、出力されたフレーム画像(図のフレーム画像F(n))およびフレーム画像F(n)から生成された線消去画像(出力された線消去画像:図の線消去画像M(n))の差分画像を生成する。
次に、線画像生成部14は、差分画像を2値化した2値化画像(図の2値化画像B(n))を生成する。
次に、線画像生成部14は、2値化画像B(n)から、出力された前景領域画像により示される領域以外に該当する領域(差分画像背景領域という)を抜き出す。
次に、線画像生成部14は、フレーム画像より先に再生されるフレーム画像がない、つまり、フレーム画像が最初にサンプリングされたフレーム画像であるなら、差分画像背景領域を含み、かつ、前景領域画像に該当する領域には文字等がない線画像(図の線画像C(n))を生成する。
次に、線画像生成部14は、線画像C(n)を線画像記憶部15に記憶させる。
一方、線画像生成部14は、フレーム画像より先に再生されるフレーム画像がある、つまり、フレーム画像が最初にサンプリングされたフレーム画像でないなら、1つ前にサンプリングされたフレーム画像、つまり先に再生されるフレーム画像を用いて生成された線画像(図の線画像C(n−1))を線画像記憶部15から読み出す。つまり、線画像記憶部15は、線画像生成部14からの要求に応じて、線画像C(n−1)を線画像生成部14に出力する。
次に、線画像生成部14は、線画像C(n−1)から、出力された前景領域画像(フレーム画像F(n)に対応する前景領域画像)により示される領域に該当する領域(線画像前景領域という)を抜き出す。
次に、線画像生成部14は、差分画像背景領域および線画像前景領域とからなる線画像(図の線画像C(n))を生成する。線画像C(n)は、線画像記憶部15に記憶され、次の線画像の生成において、線画像C(n−1)として用いられる。
さて、フレーム画像が最初にサンプリングされたフレーム画像である場合において、線画像は、2値化画像B(n)の一部である差分画像背景領域を含んでいる。
一方、フレーム画像が最初にサンプリングされたフレーム画像でない場合においては、差分画像背景領域および線画像前景領域とからなる画像が線画像である。線画像は、差分画像背景領域を含んでいる。
つまり、線画像生成部14は、各フレーム画像のサンプリングごとに、当該フレーム画像および当該フレーム画像から生成された線消去画像の差分画像を生成し、当該差分画像の、対応する前景領域画像により示される領域以外に該当する差分画像背景領域を含む画像である線画像を生成する。また、線画像生成部14は、特に、当該フレーム画像より先に再生されるフレーム画像を用いて生成された線画像が線画像記憶部15にある場合は、当該線画像を読み出し、当該線画像から、当該後に再生されるフレーム画像に対応する前景領域画像により示される領域に該当する線画像前景領域を抜き出し、当該後に再生されるフレーム画像に対応する線画像に当該線画像前景領域を含めるのである。
図2のステップ106で、線画像生成部14は、図5における差分画像および2値化画像B(n)を生成する。ステップ107で、線画像生成部14は、例えば、図5における線画像C(n)の生成、出力を行う。これらは、フレーム画像が最初にサンプリングされたフレーム画像でない場合の処理であり、そうでない場合については、図示省略する。
図1に戻り、イベント検出部16は、サンプリングごとに出力される各線画像内の線の量を示す線量を計算し、各フレーム画像の再生順での当該線量の変化に基づいて、映像ファイルに映った場所で線が書かれ始めるタイミングおよび線が消去されるタイミングを検出する。
つまり、イベント検出部16は、例えば、教室での授業が開始され、黒板に文字などが書かれ始めるタイミング、授業が終了し、黒板から文字などが消去されるタイミングを検出する。
なお、イベント検出部16は、一方のタイミングを検出するように構成してもよい。
図2のステップ108で、イベント検出部16は、上記のように、線画像の線量を計算する。ステップ109では、イベント検出部16は、各フレーム画像の再生順での線量の変化に基づいて、該当のフレーム画像の再生のタイミングは、線が書かれ始めるタイミングか否かを判定し、線が書かれ始めるタイミングならば(YES)、ステップ110で、その旨のインデクスを映像ファイルに設定する。線が書かれ始めるタイミングでなければ(NO)、ステップ111で、イベント検出部16は、該当のフレーム画像の再生のタイミングは、線が消去されるタイミングか否かを判定する。イベント検出部16は、線が消去されるタイミングならば(YES)、ステップ112で、その旨のインデクスを映像ファイルに設定する。ステップ112の処理が終了したなら、または、ステップ111で、該当のフレーム画像の再生のタイミングは、線が消去されるタイミングでないと判定されたなら(NO)、制御は、ステップ101に戻り、次のフレーム画像等について、同様の処理が行われる。なお、図2のフローチャートの処理は、最後にサンプリングされたフレーム画像等の処理が終わった際に終了する。
ここで、タイミングの検出についての一例を説明する。
つまり、イベント検出部16は、順次に再生される複数のフレーム画像のそれぞれ(対象のフレーム画像)につき、当該対象のフレーム画像の直前に再生されるフレーム画像がある場合には当該対象のフレーム画像に対応する線量から当該直前に再生されるフレーム画像に対応する線量を減じた線量増分を計算する。イベント検出部16は、当該複数のフレーム画像で最も後に再生されるフレーム画像に対応する線量増分が予め設定されたしきい値より大きく且つ、当該最も後に再生されるフレーム画像以外のフレーム画像に対応する線量増分が当該しきい値以下であり且つ、当該最も先に再生されるフレーム画像の再生のタイミングと当該最も後に再生されるフレーム画像の再生のタイミングとの間の時間差が予め設定されたしきい値より大きいなら、当該最も後に再生されるフレーム画像の再生のタイミングを、線が書かれ始めるタイミングとする。
また、イベント検出部16は、あるフレーム画像に対応する線量から当該フレーム画像の直後に再生されるフレーム画像に対応する線量を減じた線量減分が予め設定されたしきい値より大きいなら、当該直後に再生されるフレーム画像の再生のタイミングを線が消去されるタイミングとする。
線量は、例えば、線画像内の線の領域の画素数である。線量は、例えば、当該線量を求める線画像と、当該線画像に対応するフレーム画像の直前に再生されるフレーム画像に対応する線画像とでの変化があった画素の数である。変化の有無は、対象の画素の近傍にある画素を用いた類似度どうしを比較して判定される。
図6は、実施例1の説明に用いるための図である。
図6の棒グラフは、線量増分および線量減分をフレーム画像ごとに示すグラフである。線量減分は正の数であるが、便宜上、ここでは、負の方向のグラフとしている。
しきい値Th1は、線量増分について予め設定されたしきい値であり、しきい値Th2は、線量減分について予め設定されたしきい値である。
映像ファイルは、例えば、線が書かれ始めるタイミングまでの部分であるチャプタCH1と、線が書かれ始めてから消去されるまでの部分であるチャプタCH3と、線が消去されてからの部分であるチャプタCH3とからなる。しかし、映像ファイルは、チャプタCH2の開始のタイミング、つまり、前者のタイミングを示すインデクスID2を含んでいないこととする。また、映像は、チャプタCH3の開始のタイミング、つまり、後者のタイミングを示すインデクスID3を含んでいないこととする。
チャプタCH1の最初のフレーム画像(n=1)については、これより先に再生されるフレーム画像がないので、線量増分および線量減分は計算できず、グラフは表示されていない。
チャプタCH1においては、後続のフレーム画像(n=2)に対応する線量からフレーム画像(n=1)に対応する線量を減じた線量増分は、例えば、線が書かれ始める前であるから、しきい値Th1より小さい。同様に、各フレーム画像(n=3、4、5)についても、線量増分は、しきい値Th1以下である。
しかし、チャプタCH2の最初のフレーム画像(n=6)については、線が書かれ始めるので、線量増分は、例えば、しきい値Th1より大きくなる。
つまり、順次に再生される複数のフレーム画像(n=1、2、3、4、5、6)からフレーム画像(n=1)を除いた各フレーム画像につき、当該フレーム画像に対応する線量から当該フレーム画像の直前に再生されるフレーム画像に対応する線量を減じた線量増分が計算される。
また、フレーム画像(n=1、2、3、4、5、6)で最も後に再生されるフレーム画像(n=6)に対応する線量増分がしきい値Th1より大きい。
また、フレーム画像(n=2、3、4、5)に対応する線量増分はしきい値Th1以下である。
さらに、ここでは、フレーム画像(n=1)の再生のタイミングと最も後に再生されるフレーム画像(n=6)の再生のタイミングとの間の時間差が予め設定されたしきい値T1より大きいなら、イベント検出部16は、最も後に再生されるフレーム画像(n=6)の再生のタイミングを線を書かれ始めるタイミングとし、例えば、インデクスID2を映像ファイルに設定する。
さて、その後、フレーム画像(n=7、8、11、12)については、例えば、線量増分がしきい値Th1より大きくなるが、フレーム画像(n=7、8、12)については、直前のフレーム画像に対応する線量増分はしきい値Th1より大きいので、フレーム画像(n=7、8、12)の再生のタイミングは、線が書かれ始めるタイミングとならない。フレーム画像(n=11)については、直前のフレーム画像(n=9、10)に対応する線量増分はしきい値Th1以下であるものの、フレーム画像(n=9)の再生のタイミングとフレーム画像(n=11)の再生のタイミングとの間の時間差はしきい値T1以下である。よって、フレーム画像(n=11)の再生のタイミングは、線が書かれ始めるタイミングとはならない。
その後、チャプタCH3の最初のフレーム画像(n=15)については、線が消去されるので、線量減分は、例えば、しきい値Th2より大きくなる。よって、イベント検出部16は、フレーム画像(n=15)の再生のタイミングを線が消去されるタイミングとし、例えば、インデクスID3を映像ファイルに設定する。
次に、タイミングの検出についての別な一例を説明する。
イベント検出部16は、まず、各フレーム画像の再生順で線量を累積した累積線量を計算する。
また、イベント検出部16は、順次に再生される複数のフレーム画像に対応する累積線量の増加率が予め設定されたしきい値より大きく且つ、当該複数のフレーム画像で最も先に再生されるフレーム画像に対応する累積線量から当該フレーム画像の直前に再生されるフレーム画像に対応する累積線量を減じた累積線量増分が予め設定されたしきい値以下であり且つ、当該最も先に再生されるフレーム画像の直後に再生されるフレーム画像に対応する累積線量から当該最も先に再生されるフレーム画像に対応する累積線量を減じた累積線量増分が当該しきい値より大きいなら、当該最も先に再生されるフレーム画像の直後に再生されるフレーム画像の再生のタイミングを、線が書かれ始めるタイミングとする。
また、イベント検出部16は、あるフレーム画像に対応する累積線量から当該フレーム画像の直後に再生されるフレーム画像に対応する累積線量を減じた累積線量減分が予め設定されたしきい値より大きいなら当該直後に再生されるフレーム画像の再生のタイミングを、線が消去されるタイミングとする。
線量は、例えば、実施例1と同様に計算される。
図7は、実施例2の説明に用いるための図であり、この棒グラフは、累積線量をフレーム画像ごとに示すものである。
図7(a)に示すように、最初にサンプリングされたフレーム画像(n=1)については、例えば、線が書かれ始める前であるから、累積線量は0である。
フレーム画像(n=2)に対応する累積線量は、すなわち、フレーム画像(n=1)に対応する累積線量(0)に対し、フレーム画像(n=2)に対応する線量を加えたものある。例えば、累積線量増分(フレーム画像(n=2)についての累積線量からフレーム画像(n=1)についての累積線量(0)を減じたもの)は、線が書かれ始める前であるから、累積線量増分についてのしきい値Th3以下である。よって、フレーム画像(n=3、4、5)についても、同様に累積線量増分はしきい値Th3以下である。
また、直線711の傾きは、これらの累積線量の平均の増加率を示すものであり、予め設定された増加率についてのしきい値以下となっている。
よって、各フレーム画像の再生のタイミングは、線が書かれ始めるタイミングとはされない。
図7(b)に示すように、フレーム画像(n=6)については、例えば、線が書かれ始めた後であるから、累積線量は大きくなる。例えば、フレーム画像(n=6)についての累積線量増分は、しきい値Th3より大きくなる。
同様に、フレーム画像(n=7、8)についても、例えば、線が書かれ始めた後であるから、累積線量増分は、しきい値Th3より大きくなる。
また、直線712の傾きは、これらの累積線量の平均の増加率を示すものであり、前述の増加率についてのしきい値より大きくなっている。
また、前述のように、フレーム画像(n=5)についての累積線量増分はしきい値Th3以下であり、フレーム画像(n=6)についての累積線量増分はしきい値Th3より大きい。
よって、イベント検出部16は、フレーム画像(n=6)の再生のタイミングを、書かれ始めるタイミングとし、例えば、実施例1と同様にインデクスを映像ファイルに設定する。
図7(c)に示すように、その後、例えば、フレーム画像(n=15)については、線が消去されるので、累積線量減分(フレーム画像(n=14)に対応する累積線量からフレーム画像(n=15)に対応する累積線量を減じたもの)は、例えば、累積線量減分についてのしきい値Th4より大きくなる。よって、イベント検出部16は、フレーム画像(n=15)の再生のタイミングを線が消去されるタイミングとし、例えば、実施例1と同様にインデクスを映像ファイルに設定する。
以上説明したように、本実施の形態によれば、映像イベント検出装置1は、映像ファイルに映った場所で線が書かれ始めるタイミングおよび/または線が消去されるタイミングを検出する映像イベント検出装置であって、映像ファイルから再生順にサンプリングされた各フレーム画像からサンプリングごとに線を消去し線消去画像を生成する線消去処理部12と、各フレーム画像のサンプリングごとに、当該フレーム画像に映った場所の前景の領域を示す前景領域画像を生成する前景領域検出部13と、各フレーム画像のサンプリングごとに、当該フレーム画像および当該フレーム画像から生成された線消去画像の差分画像を生成し、当該差分画像の、対応する前景領域画像により示される領域以外に該当する差分画像背景領域を含む画像である線画像を生成する線画像生成部14と、各線画像が記憶される線画像記憶部15とを備え、線画像生成部14は、各フレーム画像について、当該フレーム画像より先に再生されるフレーム画像を用いて生成された線画像が線画像記憶部15にある場合は、当該線画像を読み出し、当該線画像から、当該後に再生されるフレーム画像に対応する前景領域画像により示される領域に該当する線画像前景領域を抜き出し、当該後に再生されるフレーム画像に対応する線画像に当該線画像前景領域を含めるものであり、映像イベント検出装置1は、さらに、各線画像内の線の量を示す線量を計算し、各フレーム画像の再生順での当該線量の変化に基づいて、映像ファイルに映った場所で線が書かれ始めるタイミングおよび/または線が消去されるタイミングを検出するイベント検出部16を備える。
例えば、イベント検出部16は、順次に再生される複数のフレーム画像のそれぞれにつき、当該対象のフレーム画像の直前に再生されるフレーム画像がある場合には当該対象のフレーム画像に対応する線量から当該直前に再生されるフレーム画像に対応する線量を減じた線量増分計算し、当該複数のフレーム画像で最も後に再生されるフレーム画像に対応する線量増分が予め設定されたしきい値より大きく且つ、当該最も後に再生されるフレーム画像以外のフレーム画像に対応する線量増分が当該しきい値以下であり且つ、当該最も先に再生されるフレーム画像の再生のタイミングと当該最も後に再生されるフレーム画像の再生のタイミングとの間の時間差が予め設定されたしきい値より大きいなら、当該最も後に再生されるフレーム画像の再生のタイミングを、線が書かれ始めるタイミングとし、あるフレーム画像に対応する線量から当該フレーム画像の直後に再生されるフレーム画像に対応する線量を減じた線量減分が予め設定されたしきい値より大きいなら、当該直後に再生されるフレーム画像の再生のタイミングを、線が消去されるタイミングとするので、映像ファイルに映った場所で線が書かれ始めるタイミングおよび/または線が消去されるタイミングを高い精度で検出することができる。
また、例えば、イベント検出部16は、各フレーム画像の再生順で線量を累積した累積線量を計算し、順次に再生される複数のフレーム画像に対応する累積線量の増加率が予め設定されたしきい値より大きく且つ、当該複数のフレーム画像で最も先に再生されるフレーム画像に対応する累積線量から当該フレーム画像の直前に再生されるフレーム画像に対応する累積線量を減じた累積線量増分が予め設定されたしきい値以下であり且つ、当該最も先に再生されるフレーム画像の直後に再生されるフレーム画像に対応する累積線量から当該最も先に再生されるフレーム画像に対応する累積線量を減じた累積線量増分が当該しきい値より大きいなら、当該最も先に再生されるフレーム画像の直後に再生されるフレーム画像の再生のタイミングを、線が書かれ始めるタイミングとし、あるフレーム画像に対応する累積線量から当該フレーム画像の直後に再生されるフレーム画像に対応する累積線量を減じた累積線量減分が予め設定されたしきい値より大きいなら、当該直後に再生されるフレーム画像の再生のタイミングを、線が消去されるタイミングとするので、映像ファイルに映った場所で線が書かれ始めるタイミングおよび/または線が消去されるタイミングを高い精度で検出することができる。
なお、映像イベント検出装置1としてコンピュータを機能させるためのコンピュータプログラムは、半導体メモリ、磁気ディスク、光ディスク、光磁気ディスク、磁気テープなどのコンピュータ読み取り可能な記録媒体に記録でき、また、インターネットなどの通信網を介して伝送させて、広く流通させることができる。
1 映像イベント検出装置
11 映像取得部
12 線消去処理部
13 前景領域検出部
14 線画像生成部
15 線画像記憶部
16 イベント検出部

Claims (7)

  1. 映像ファイルに映った場所で線が書かれ始めるタイミングおよび/または線が消去されるタイミングを検出する映像イベント検出装置であって、
    前記映像ファイルから再生順にサンプリングされた各フレーム画像からサンプリングごとに線を消去し線消去画像を生成する線消去処理部と、
    前記各フレーム画像のサンプリングごとに、当該フレーム画像に映った場所の前景の領域を示す前景領域画像を生成する前景領域検出部と、
    前記各フレーム画像のサンプリングごとに、当該フレーム画像および当該フレーム画像から生成された線消去画像の差分画像を生成し、当該差分画像の、対応する前景領域画像により示される領域以外に該当する差分画像背景領域を含む画像である線画像を生成する線画像生成部と、
    前記各線画像が記憶される線画像記憶部とを備え、
    前記線画像生成部は、
    前記各フレーム画像について、当該フレーム画像より先に再生されるフレーム画像を用いて生成された線画像が前記線画像記憶部にある場合は、当該線画像を読み出し、当該線画像から、当該後に再生されるフレーム画像に対応する前景領域画像により示される領域に該当する線画像前景領域を抜き出し、当該後に再生されるフレーム画像に対応する線画像に当該線画像前景領域を含めるものであり、
    前記映像イベント検出装置は、さらに、
    前記各線画像内の線の量を示す線量を計算し、前記各フレーム画像の再生順での当該線量の変化に基づいて、前記映像ファイルに映った場所で線が書かれ始めるタイミングおよび/または線が消去されるタイミングを検出するイベント検出部
    を備えることを特徴とする映像イベント検出装置。
  2. 前記イベント検出部は、
    順次に再生される複数のフレーム画像のそれぞれにつき、当該対象のフレーム画像の直前に再生されるフレーム画像がある場合には当該対象のフレーム画像に対応する線量から当該直前に再生されるフレーム画像に対応する線量を減じた線量増分を計算し、当該複数のフレーム画像で最も後に再生されるフレーム画像に対応する線量増分が予め設定されたしきい値より大きく且つ、当該最も後に再生されるフレーム画像以外のフレーム画像に対応する線量増分が当該しきい値以下であり且つ、当該最も先に再生されるフレーム画像の再生のタイミングと当該最も後に再生されるフレーム画像の再生のタイミングとの間の時間差が予め設定されたしきい値より大きいなら、当該最も後に再生されるフレーム画像の再生のタイミングを前記線が書かれ始めるタイミングとし、
    あるフレーム画像に対応する線量から当該フレーム画像の直後に再生されるフレーム画像に対応する線量を減じた線量減分が予め設定されたしきい値より大きいなら、当該直後に再生されるフレーム画像の再生のタイミングを前記線が消去されるタイミングとする
    ことを特徴とする請求項1記載の映像イベント検出装置。
  3. 前記イベント検出部は、
    前記各フレーム画像の再生順で前記線量を累積した累積線量を計算し、
    順次に再生される複数のフレーム画像に対応する累積線量の増加率が予め設定されたしきい値より大きく且つ、当該複数のフレーム画像で最も先に再生されるフレーム画像に対応する累積線量から当該フレーム画像の直前に再生されるフレーム画像に対応する累積線量を減じた累積線量増分が予め設定されたしきい値以下であり且つ、当該最も先に再生されるフレーム画像の直後に再生されるフレーム画像に対応する累積線量から当該最も先に再生されるフレーム画像に対応する累積線量を減じた累積線量増分が当該しきい値より大きいなら、当該最も先に再生されるフレーム画像の直後に再生されるフレーム画像の再生のタイミングを前記線が書かれ始めるタイミングとし、
    あるフレーム画像に対応する累積線量から当該フレーム画像の直後に再生されるフレーム画像に対応する累積線量を減じた累積線量減分が予め設定されたしきい値より大きいなら、当該直後に再生されるフレーム画像の再生のタイミングを前記線が消去されるタイミングとする
    ことを特徴とする請求項1記載の映像イベント検出装置。
  4. 映像ファイルに映った場所で線が書かれ始めるタイミングおよび/または線が消去されるタイミングを検出する映像イベント検出装置の動作方法であって、
    前記映像イベント検出装置の線消去処理部が、前記映像ファイルから再生順にサンプリングされた各フレーム画像からサンプリングごとに線を消去し線消去画像を生成し、
    前記映像イベント検出装置の前景領域検出部が、前記各フレーム画像のサンプリングごとに、当該フレーム画像に映った場所の前景の領域を示す前景領域画像を生成し、
    前記映像イベント検出装置の線画像生成部が、前記各フレーム画像のサンプリングごとに、当該フレーム画像および当該フレーム画像から生成された線消去画像の差分画像を生成し、当該差分画像の、対応する前景領域画像により示される領域以外に該当する差分画像背景領域を含む画像である線画像を生成し、当該線画像を前記映像イベント検出装置に設けられた線画像記憶部に記憶させ、
    前記線画像生成部は、前記各フレーム画像について、当該フレーム画像より先に再生されるフレーム画像を用いて生成された線画像が前記線画像記憶部にある場合は、当該線画像を読み出し、当該線画像から、当該後に再生されるフレーム画像に対応する前景領域画像により示される領域に該当する線画像前景領域を抜き出し、当該後に再生されるフレーム画像に対応する線画像に当該線画像前景領域を含め、
    前記映像イベント検出装置のイベント検出部が、前記各線画像内の線の量を示す線量を計算し、前記各フレーム画像の再生順での当該線量の変化に基づいて、前記映像ファイルに映った場所で線が書かれ始めるタイミングおよび/または線が消去されるタイミングを検出する
    ことを特徴とする映像イベント検出装置の動作方法。
  5. 前記イベント検出部は、
    順次に再生される複数のフレーム画像のそれぞれにつき、当該対象のフレーム画像の直前に再生されるフレーム画像がある場合には当該対象のフレーム画像に対応する線量から当該直前に再生されるフレーム画像に対応する線量を減じた線量増分を計算し、当該複数のフレーム画像で最も後に再生されるフレーム画像に対応する線量増分が予め設定されたしきい値より大きく且つ、当該最も後に再生されるフレーム画像以外のフレーム画像に対応する線量増分が当該しきい値以下であり且つ、当該最も先に再生されるフレーム画像の再生のタイミングと当該最も後に再生されるフレーム画像の再生のタイミングとの間の時間差が予め設定されたしきい値より大きいなら、当該最も後に再生されるフレーム画像の再生のタイミングを前記線が書かれ始めるタイミングとし、
    あるフレーム画像に対応する線量から当該フレーム画像の直後に再生されるフレーム画像に対応する線量を減じた線量減分が予め設定されたしきい値より大きいなら、当該直後に再生されるフレーム画像の再生のタイミングを前記線が消去されるタイミングとする
    ことを特徴とする請求項4記載の映像イベント検出装置の動作方法。
  6. 前記イベント検出部は、
    前記各フレーム画像の再生順で前記線量を累積した累積線量を計算し、
    順次に再生される複数のフレーム画像に対応する累積線量の増加率が予め設定されたしきい値より大きく且つ、当該複数のフレーム画像で最も先に再生されるフレーム画像に対応する累積線量から当該フレーム画像の直前に再生されるフレーム画像に対応する累積線量を減じた累積線量増分が予め設定されたしきい値以下であり且つ、当該最も先に再生されるフレーム画像の直後に再生されるフレーム画像に対応する累積線量から当該最も先に再生されるフレーム画像に対応する累積線量を減じた累積線量増分が当該しきい値より大きいなら、当該最も先に再生されるフレーム画像の直後に再生されるフレーム画像の再生のタイミングを前記線が書かれ始めるタイミングとし、
    あるフレーム画像に対応する累積線量から当該フレーム画像の直後に再生されるフレーム画像に対応する累積線量を減じた累積線量減分が予め設定されたしきい値より大きいなら、当該直後に再生されるフレーム画像の再生のタイミングを前記線が消去されるタイミングとする
    ことを特徴とする請求項4記載の映像イベント検出装置の動作方法。
  7. 請求項1ないし3のいずれかに記載の映像イベント検出装置としてコンピュータを機能させるためのコンピュータプログラム。
JP2012022970A 2012-02-06 2012-02-06 映像イベント検出装置およびその動作方法 Active JP5565737B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2012022970A JP5565737B2 (ja) 2012-02-06 2012-02-06 映像イベント検出装置およびその動作方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2012022970A JP5565737B2 (ja) 2012-02-06 2012-02-06 映像イベント検出装置およびその動作方法

Publications (2)

Publication Number Publication Date
JP2013162344A JP2013162344A (ja) 2013-08-19
JP5565737B2 true JP5565737B2 (ja) 2014-08-06

Family

ID=49174256

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2012022970A Active JP5565737B2 (ja) 2012-02-06 2012-02-06 映像イベント検出装置およびその動作方法

Country Status (1)

Country Link
JP (1) JP5565737B2 (ja)

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US10755744B2 (en) * 2014-06-06 2020-08-25 Fuji Xerox Co., Ltd. Systems and methods for direct video retouching for text, strokes and images

Family Cites Families (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2653386B2 (ja) * 1989-06-12 1997-09-17 三菱電機株式会社 図面処理装置
JP2006162692A (ja) * 2004-12-02 2006-06-22 Hosei Univ 講義コンテンツ自動作成システム
JP4830105B2 (ja) * 2005-12-14 2011-12-07 国立大学法人東京工業大学 画像処理装置、画像処理プログラム及び画像処理方法
JP5213627B2 (ja) * 2008-10-07 2013-06-19 キヤノン株式会社 画像処理装置及び画像処理方法
JP5633823B2 (ja) * 2012-02-06 2014-12-03 日本電信電話株式会社 チャプタ代表画像生成装置およびその動作方法

Also Published As

Publication number Publication date
JP2013162344A (ja) 2013-08-19

Similar Documents

Publication Publication Date Title
CN106919333B (zh) 电子书写板上书写内容的记录方法和装置
CN109348156B (zh) 课件录制和播放方法、装置、智能交互平板及存储介质
US20210360215A1 (en) Creating a combined video vignette
WO2019109643A1 (zh) 视频推荐方法、装置、计算机设备和存储介质
CN106686452B (zh) 一种动态图片的生成方法及装置
US8761582B2 (en) Video editing device and video editing system
US8515258B2 (en) Device and method for automatically recreating a content preserving and compression efficient lecture video
US20150050006A1 (en) Content-based video segmentation
CN110691259B (zh) 视频播放方法、***、装置、电子设备及存储介质
CN110505498B (zh) 视频的处理、播放方法、装置及计算机可读介质
WO2019090903A1 (zh) 一种视频处理方法、装置、终端设备和存储介质
US11410701B2 (en) Systems and methods for direct video retouching for text, strokes and images
JP7204786B2 (ja) 視覚的検索方法、装置、コンピュータ機器及び記憶媒体
CN107368248B (zh) 一种书写笔迹的回放方法及装置
JP5565737B2 (ja) 映像イベント検出装置およびその動作方法
US9471990B1 (en) Systems and methods for detection of burnt-in text in a video
US7995901B2 (en) Facilitating video clip identification from a video sequence
US20230037737A1 (en) Handwriting generation method and apparatus, storage medium, electronic device, and system
JP5633823B2 (ja) チャプタ代表画像生成装置およびその動作方法
WO2017041588A1 (zh) 擦除框的范围确定方法和***
JP7447908B2 (ja) 情報処理装置、情報処理方法、およびプログラム
CN109413350B (zh) 一种远程桌面录像关键帧创建方法和装置
JP2020042338A (ja) 選択方法、及び選択プログラム
WO2021230158A1 (ja) 画像処理装置、画像処理方法、及びプログラム
US20160012295A1 (en) Image processor, method and program

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20130925

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A821

Effective date: 20130925

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20140424

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20140603

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20140606

R150 Certificate of patent or registration of utility model

Ref document number: 5565737

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250