JP4564856B2 - 画像符号化装置及び撮像装置 - Google Patents

画像符号化装置及び撮像装置 Download PDF

Info

Publication number
JP4564856B2
JP4564856B2 JP2005026530A JP2005026530A JP4564856B2 JP 4564856 B2 JP4564856 B2 JP 4564856B2 JP 2005026530 A JP2005026530 A JP 2005026530A JP 2005026530 A JP2005026530 A JP 2005026530A JP 4564856 B2 JP4564856 B2 JP 4564856B2
Authority
JP
Japan
Prior art keywords
image
encoding
prediction mode
intra prediction
focus
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
JP2005026530A
Other languages
English (en)
Other versions
JP2006217158A5 (ja
JP2006217158A (ja
Inventor
純 牧野
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Canon Inc
Original Assignee
Canon Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Canon Inc filed Critical Canon Inc
Priority to JP2005026530A priority Critical patent/JP4564856B2/ja
Priority to US11/152,609 priority patent/US8369402B2/en
Priority to EP05253759A priority patent/EP1607909A1/en
Priority to EP06026149A priority patent/EP1770639B1/en
Publication of JP2006217158A publication Critical patent/JP2006217158A/ja
Publication of JP2006217158A5 publication Critical patent/JP2006217158A5/ja
Application granted granted Critical
Publication of JP4564856B2 publication Critical patent/JP4564856B2/ja
Priority to US13/732,134 priority patent/US8780985B2/en
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Landscapes

  • Compression Or Coding Systems Of Tv Signals (AREA)

Description

本発明は、画像符号化装置及び撮像装置に関し、特に、H.264符号化方式を採用した場合において、最適なイントラ予測モードを選択する為の技術に関する。
動画像を高能率符号化するための技術として、MotionJPEGやMPEG1,2といった符号化方式が確立されている。各メーカーはこれらの符号化方式を利用して動画像を保存可能としたディジタルカメラやディジタルビデオカメラといった撮像装置或いはDVDレコーダーなどを開発し、製品化しており、ユーザーはこれらの装置或いはパーソナルコンピュータやDVDプレーヤーなどを用いて簡単に動画像を視聴することが可能となっている。
ところで、ディジタル化された動画像は膨大なデータ量となる。そこで、上記したMPEG1,2などよりも更なる高圧縮が望める動画像の符号化方式が研究され続けてきて、近年ITU−T(国際電気通信連合 電気通信標準化部門)とISO(国際標準化機構)によりH.264/MPEG4 part10:AVCという符号化方式(以下、H.264と称す)が標準化された。
H.264は、MPEG1,2等の従来の符号化方式に比べ、その符号化又は復号化により多くの演算量が要求されるが、より高い符号化効率が実現されることが知られている。H.264の演算処理の構成については、例えば特許文献1に開示されている。
ところで、H.264には、フレーム内画素値を用いて同一フレーム内画素値を予測する“イントラ予測”という予測方式が存在する。このイントラ予測においては、複数のイントラ予測モードが存在し、これらを選択的に用いることが規定されている。このとき入力画像に適したイントラ予測モードが選択されることにより、高レベルな圧縮を施しても劣化が少ない符号化データが生成されることになる。
特開2004−56827号公報
前記したイントラ予測に関して、予測の精度を向上させるため、H.264では9種類のイントラ予測モードが用意されている。そして、複数のイントラ予測モードの中から最適な1つのイントラ予測モードを選択する方法としては、入力画像に対してすべてのイントラ予測モードを実行して試した結果に基づいて、最適な結果を得られるイントラ予測モードを選択する方法が一般的である。
図11を用いて、その背景を説明する。図11はフレームのイメージであり、外側の四角は画面全体を示しており、内側の5つの四角は、イントラ予測を行うブロックを示している。なお、ブロックは画面全体に渡って設定されるものであるが、説明の簡略化のため、代表的な5つのみを示してある。さらに図11は、各ブロックについて、演算の結果、最適となったイントラ予測モードが示す予測方向を矢印で示した例である。このように、同一の画面内であっても、位置によって被写体が異なるので、各ブロックに最適なイントラ予測モードはまちまちとなり、特定のモードに固定されるものではない。このような背景から、イントラ予測を行う場合には各ブロックに対し、すべてのイントラ予測モードについてその予測精度を求め、最適に予測できるモードを選択して、そのブロックの予測モードとしている。
しかしながら、複数のイントラ予測モードの中から最適な1つのイントラ予測モードを選択するために、上記した如きすべてのイントラ予測モードを計算してから選ぶ方法を用いた場合では、H.264符号化処理における演算量の増加につながり、ひいては符号化処理時間の超過や、消費電力の浪費につながっていた。
本発明は上記問題点を鑑みてなされたものであり、入力画像に対して最適なイントラ予測モードを、前記入力画像の撮影時の情報を用いることで容易に選択できるようにすることを目的とする。
また、本発明の他の目的は、H.264を用いた画像符号化装置における演算処理を軽減させて、効率的な符号化を実現することにある。
上記課題を解決するために、本発明の画像符号化装置は、複数の予測モードのうちいずれかを選び、選ばれた予測モードに従ってフレーム内の画素値を用いて同一フレーム内の符号化対象ブロックの画素値を予測して予測画像データを生成する画像符号化装置において、符号化すべき画像信号を入力する手段と、前記画像信号が生成されたときのカメラのズーム動作状態を示す撮影情報を取得する手段と、入力した前記画像信号の符号化において、フレーム内の画素値を用いて同一フレーム内の前記符号化対象ブロックの画素値を予測するときに、前記撮影情報がズーム動作中であることを示している場合には、前記符号化対象ブロックの位置に応じた予測モードを選択する手段とを備えることを特徴とする。
また、本発明の画像符号化装置は、複数の予測モードのうちいずれかを選び、選ばれた予測モードに従ってフレーム内の画素値を用いて同一フレーム内の符号化対象ブロックの画素値を予測して予測画像データを生成する画像符号化装置において、符号化すべき画像信号を入力する手段と、前記画像信号が生成されたときのカメラのフォーカス動作状態を示す撮影情報を取得する手段と、入力した前記画像信号の符号化において、フレーム内の画素値を用いて同一フレーム内の前記符号化対象ブロックの画素値を予測するときに、前記撮影情報がフォーカス合焦状態を示している場合と、フォーカス非合焦状態を示している場合とで、異なる処理によって予測モードを選択する手段とを備えることを特徴とする。
また本発明の撮像装置は、撮像して得られる画像信号を出力する撮像手段と、前記画像信号を圧縮符号化するための符号化手段であって、複数の予測モードのうちいずれかを選び、選ばれた予測モードに従ってフレーム内の画素値を用いて同一フレーム内の画素値を予測して予測画像データを生成する処理を行う符号化手段とを備えた撮像装置において、さらに前記撮像手段におけるズーム動作を制御する制御手段を備え、前記符号化手段は、フレーム内の画素値を用いて同一フレーム内の画素値を予測するときに、前記制御手段から出力された情報を用いて、ズーム中に撮影された画像に対しては当該画像を複数の領域に分割し、前記領域ごとに所定の予測モードを選択することを特徴とする。
また本発明の撮像装置は、撮像して得られる画像信号を出力する撮像手段と、前記画像信号を圧縮符号化するための符号化手段であって、複数の予測モードのうちいずれかを選び、選ばれた予測モードに従ってフレーム内の画素値を用いて同一フレーム内の画素値を予測して予測画像データを生成する処理を行う符号化手段とを備えた撮像装置において、さらに前記撮像手段におけるフォーカス動作を制御する制御手段を備え、前記符号化手段は、フレーム内の画素値を用いて同一フレーム内の画素値を予測するときに、前記制御手段から出力された情報を用いて、フォーカスが非合焦状態と判断されるときに撮影された画像に対しては所定の予測モードを選択することを特徴とする。
本発明によれば、すべてのイントラ予測モードを試すことなく、複数のイントラ予測モードの中から最適なイントラ予測モードを、撮影時の情報を利用することで容易に選択でき、さらに、H.264における符号化時の演算処理を軽減させることができる。
以下、図面を参照しながら本発明の好適な実施の形態を説明する。
<第1の実施形態>
図8は、本実施形態における画像符号化装置600の構成を表わしたブロック図である。画像符号化装置600は、減算器601、整数変換部602、量子化部603、エントロピー符号化部604、逆量子化部605、逆整数変換部606、加算器607、フレームメモリ608及び611、ループフィルタ610、インター予測部612、動き検出部613及びスイッチ614、イントラ予測部615から構成され、入力画像データを符号化処理して符号化データを出力する。
続いて、図8の画像符号化装置600の符号化プロセスについて説明する。
画像符号化装置600は、H.264符号化方式に従って符号化処理を行う。また、入力された画像データをブロックに分割し、そのブロック毎に処理を行う。
まず、減算器601は、画像符号化装置600に入力された画像データ(入力画像データ)から予測画像データを減算し、画像残差データを出力する。予測画像データの生成については後述する。
整数変換部602は、減算器601から出力された画像残差データを整数変換処理して、変換係数を出力する。そして、量子化部603は上記変換係数を所定の量子化パラメータを用いて量子化する。
エントロピー符号化部604は、量子化部603で量子化された変換係数を入力し、これをエントロピー符号化して、符号化データとして出力する。
一方、量子化部603で量子化された変換係数は、後続のブロックを符号化するための予測画像データの生成に使われる。逆量子化部605は、量子化部603で量子化された変換係数を逆量子化する。さらに、逆整数変換部606は逆量子化部605で逆量子化された変換係数を逆整数変換し、復号残差データとして出力する。加算器607は、復号残差データと予測画像データとを加算し、再構成画像データとして出力する。
再構成画像データはフレームメモリ608に保存されるとともに、ループフィルタ610を介して、フレームメモリ611に保存される。再構成画像データの中で、以降の予測で参照される可能性があるデータは、フレームメモリ608または611に暫くの期間、保存される。また、ループフィルタ610はブロックノイズを除去する為に用いられる。
イントラ予測部615は、フレームメモリ608に保存された再構成画像データを用いてフレーム内予測処理を行い、予測画像データを生成する。また、インター予測部612は、フレームメモリ611に保存された再構成画像データを用いて、動き検出部613によって検出された動きベクトル情報に基づいてフレーム間予測処理を行い、予測画像データを生成する。動き検出部613は入力画像データにおける動きベクトルを検出し、検出した動きベクトル情報をインター予測部612とエントロピー符号化部604へ出力する。
スイッチ614は、マクロブロック単位で、イントラ予測、インター予測のどちらを用いるか選択するための選択部である。イントラ予測部615からの出力とインター予測部612からの出力の一方を選択して、選択された予測画像データを減算器601、加算器607へ出力する。
ここで、上記イントラ予測部615で行うイントラ予測について、図9及び図10を用いて補足説明する。
イントラ予測では、同一画面内で、既に符号化された隣接画素の値を予測値として用いる。図9の様に符号化対象ブロックを4×4画素サイズ(aからpまでの画素)とした場合、その周辺にあるAからMまでの画素値を利用して予測が行われる。このとき、予測の方向を指定して、必要な画素値のみを予測に用いることになるが、予測の方向や内容が異なる9種類のイントラ予測モードが用意されているので、このうち最適な予測モードを選択することで予測を行う。
用意されている各イントラ予測モードの予測方向を図10に示す。例えば、Mode 0のVertical(垂直方向)予測モードの場合、隣接する垂直方向の画素(図9のA,B,C,Dの各画素に相当)の値を予測値として利用し、この画素値が垂直方向に連続していると予測する。これにより、図9のa,e,i,mの各画素については、Aの画素値が続くものと予測され、同様に、b,f,j,nの各画素については、Bの画素値が続くものと予測される。以下、同様である。そして、予測した結果として、各画素の差分値、即ち、a−A,e−A,i−A,m−A等を求めた後、整数変換や量子化が行われるのである。
上記したMode 0のVertical予測モード以外に、図10の如きMode 1〜8までのイントラ予測モードが用意されている。なお、Mode 2のDC予測モードとは、左及び上の画素値の平均値を用いた予測モードである。各イントラ予測モードの詳細については、H.264関連の規格書等に開示されているので、ここでの説明は省略する。H.264では、このようにイントラ予測モードが9通り用意されているので、符号化対象画素に最適な予測モードを選択することが可能となり、予測の精度を向上させ、残差データの値が僅かで済むようにしている。
また、イントラ予測部615における通常のイントラ予測モードの選択処理は、図12のフローチャートで示したような手順で行われる。図12において、対象となるブロックのイントラ予測が開始されると、予測モードを示すカウンタiを用意し、i=0をセットする(ステップS1201)。次にiの値で示される予測モードによりイントラ予測を行い(ステップS1202)、そのイントラ予測の精度を評価して、それまでに評価した他の予測モードと比べて最適であるものを選択する(ステップS1203)。次にiをインクリメントし(ステップS1204)、iが予測モードの最大値9を超えない範囲でS1202からの手順を繰り返す(ステップS1205)。結果的に、符号化対象ブロック毎に、全ての(9通りの)イントラ予測モードを計算することで、最適なイントラ予測モードを選択可能である。
また、イントラ予測部615は入力される制御信号に応じて、上記した通常の選択処理とは異なる手順で、イントラ予測モードの選択処理を実行可能であるが、この内容については後述する。以上が、画像符号化装置600及びイントラ予測部615の説明である。
次に、上記した画像符号化装置600を搭載した撮像装置100の構成を説明するとともに、撮像装置100の動作と絡めてイントラ予測部615の更なる動作を説明していく。
図1は、本実施形態における撮像装置100の構成を表わしたブロック図である。撮像装置100は、複数のレンズ群(ズームレンズ101a及び101b、フォーカスレンズ101cを含む)から構成される撮影レンズ部101、CCD又はCMOS等の撮像素子102、カメラ信号処理部103、符号化部104、カメラ制御部105、フォーカス(Focus)検出部106、フォーカスモータ(Mo)107、ズームモータ(Mo)108、動きセンサー109、各種機能の操作部110から構成され、撮影レンズ部101から入射した光学像を、画像信号に変換してからH.264符号化方式に従って圧縮符号化処理して、符号化データを出力する。なお、符号化部104は、上記した画像符号化装置600に相当する。撮像装置100は画像符号化装置600を画像のH.264エンコーダとして搭載している。
続いて、図1の撮像装置100の撮影プロセスについて説明する。
撮影動作を開始したならば、撮影レンズ部101から入射した光学像を撮像素子102で電気信号に変換する。このとき、フォーカスモータ(Mo)107によりフォーカスレンズ101cを動かして焦点調整を行え、ズームモータ(Mo)108によりズームレンズ101a及び101bを動かして、光学ズーム調整を行える。さらに、動きセンサー109で検出した動き情報に応じて、不図示の光学防振機構或いは電子防振機能を動作させて、動きに対する補正(手ぶれ補正)も行える。
撮像素子102から出力された電気信号は、画像信号として、カメラ信号処理部103において必要な輝度信号処理や色信号処理が行われる。さらに、カメラ信号処理部103から出力された画像データは、符号化部104において符号化処理が行われ、符号化データになって出力される。ここでの符号化処理については、図8を用いて既に説明したとおりである。なお、符号化データは不図示の記録手段によりディスク等の記録媒体に記録可能な形態となる。
各部の動作を制御するのはカメラ制御部105である。操作部110を介してユーザ指示があった場合は、その指示に従って各部の制御を行う。
また、オートフォーカス時は、フォーカス検出部106が撮像素子102から得られる信号を元にしてフォーカスの状態を検出し、フォーカス情報としてカメラ制御部105に伝達する。カメラ制御部105は、当該フォーカス情報に従って、フォーカスモータ(Mo)107に制御信号を送り、最適なフォーカス状態となるようなフォーカス制御を行う。また、マニュアルフォーカス時は、カメラ制御部105は、操作部110から入力される指示に従って、フォーカスモータ(Mo)107に制御信号を送り、所望のフォーカス状態となるようなフォーカス制御を行う。
また、カメラ制御部105は、操作部110から入力されるズーム指示に従って、ズームモータ(Mo)108に制御信号を送り、所望のズーム位置となるようなズーム制御を行う。
また、動きセンサー109は、加速度センサー等を利用したものであって、手ぶれ補正用の動き検出以外に、撮像装置100の移動検出が行え、具体的には、パンやチルト等の撮影動作を検出し、その情報をカメラ制御部10に伝達する。
ここで、動きセンサー109によってパン又はチルトが検出されたときの、カメラ制御部105の制御動作について説明する。
図2は撮影中にパンニング動作が行われたときの撮影画像の様子を表わしている。図2で示したような白矢印の方向に画面がパンニングされた場合、撮影画像は全体的に白矢印の方向(水平方向)に流れたものとなる。そのため、符号化部104で当該撮影画像に対してイントラ予測を行う場合、水平方向が最適な予測方向となると推測できる。このとき、図11の画像では画面上の各ブロックでばらばらであったイントラ予測の方向が、図2のように各ブロックがパンニングの方向に合った規則的な方向を示すようになるとも推測できるので、結果として、各ブロックで一様に、水平方向のイントラ予測(mode 1のHorizontal予測モード)を選択すれば、最適或いは最適に近いイントラ予測モードを効率的に選択できることになる。垂直方向のチルトについては、同様にmode 0のVertical予測モードを選択すればよい。また、パンやチルトが斜め方向に傾いているときには、その斜め成分を考慮して、いずれかの斜め方向の予測モードを選択すればよい。
このような思想に基づき、カメラ制御部105は、符号化部104(すなわち、画像符号化装置600)内のイントラ予測部615に対して、パンやチルトといった撮影動作に従ったイントラ予測モードを選択するための制御信号を送ることを特徴としている。また、イントラ予測部615は、受信した当該制御信号に応じて、上記した通常のイントラ予測モードの選択処理に変えて、パンやチルトの方向に従ってイントラ予測モードを一意に選択したり、あるいはパンやチルトの方向に従って9種類ある選択肢を2,3種類に絞り込んでから最適なイントラ予測モードを選択したりする。これにより、イントラ予測モードの選択の際、全てのイントラ予測モードを試してみるよりも、はるかに効率的に最適なイントラ予測モードの選択が行える。
図3は上記した如きパンやチルトの方向に応じたイントラ予測モードの選択処理を行うときの、イントラ予測部615の動作フローを図示したフローチャートである。
イントラ予測を行う画像に対して、動きセンサー109によってパン又はチルトが検出されたときは(ステップS301)、検出されたパン又はチルトの方向や速度に関する情報をカメラ制御部105より取得する(ステップS302)。動きセンサー109によってパン又はチルトが検出されないときは(ステップS301)、図12で示したような通常のイントラ予測モードの選択処理を行って、最適なイントラ予測モードを決定してからイントラ予測を行う(ステップS307)。
ステップS302で取得したパン又はチルトの方向や速度に関する情報に基づいて、パンやチルトの方向に概ね合致する予測方向を自動選択する(ステップS303)。ステップS303において、Vertical(垂直方向)が選択されたときは、mode 0のVertical予測モードでイントラ予測を行い(ステップS304)、Horizontal(水平方向)が選択されたときは、mode 1のHorizontal予測モードでイントラ予測を行い(ステップS305)、Down−Right(右斜め下方向)が選択されたときは、mode 4のDown−Right予測モードでイントラ予測を行う(ステップS306)。
なお、斜め方向の予測については、動きセンサー109の検出精度を高めることで、他の斜め方向の予測モード(mode 3,5,6,7,8)も選択できるようにすれば、より予測精度を高められる。
また、図3ではパンやチルトが行われた場合、その方向に従ってイントラ予測モードを一意に選択する構成としたが、パンやチルトの方向及び速度に従って、9種類ある予測モードを2,3種類に絞り込んだり、或いは明らかに予測方向が異なると判断する予測モードを除外したりして、選択肢を減らしてから、残った候補のうちから最適な予測モードを演算で求めるようにしてもよい。
このように本実施形態によれば、パンやチルトといった撮影時の情報をイントラ予測モードの選択時に利用することで、最適なイントラ予測モードを容易に選択できるとともに、符号化にかかる処理負荷も軽減できる。
<第2の実施形態>
次に、図4及び図5を用いて本発明の第2の実施形態について説明する。
本実施形態では、第1の実施形態で説明した撮像装置100がズーム動作するときの、カメラ制御部105の制御動作並びにイントラ予測部615の動作について説明する。
撮影中にズーム動作が行われた場合、ズーム・インもしくはズーム・アウトのいずれについても、ズーム中の撮影画像は画面の中心から放射状に流れた画像となる。そのため、符号化部104で当該撮影画像に対してイントラ予測を行う場合、符号化対象ブロックが画面の中心に対してどの方向に位置するかを考慮し、その方向に合った予測をすれば、予測効率が良いことになる。
このとき、図11の画像では画面上の各ブロックでばらばらであったイントラ予測の方向が、ズームによって図4の各ブロックのような予測方向を示すようになると推測できる。すなわち、画面の左上部のブロックでは、画面の中心に向かって斜め方向に画像が流れるので、mode 4のDown−Right予測モードが最適といえる。同様に、画面の右上部のブロックでは、mode 3のDown−Left予測モードが最適といえる。ここで、H.264のイントラ予測では、予測方向が隣接する左または上側のブロックの値に限られるため、画面の左下部のブロックでは、mode 3のDown−Left予測モードが最適といえる。同様に、画面の右下部のブロックでは、mode 4のDown−Right予測モードが最適といえる。
このような思想に基づき、カメラ制御部105は、符号化部104(すなわち、画像符号化装置600)内のイントラ予測部615に対して、ズーム動作に従ったイントラ予測モードを選択するための制御信号を送ることを特徴としている。また、イントラ予測部615は、受信した当該制御信号に応じて、上記した通常のイントラ予測モードの選択処理に変えて、ズーム中の画像に対しては、符号化対象ブロックの位置に応じてイントラ予測モードを一意に選択したり、あるいは9種類ある選択肢を2,3種類に絞り込んでから最適なイントラ予測モードを選択したりする。これにより、イントラ予測モードの選択の際、全てのイントラ予測モードを試してみるよりも、はるかに効率的に最適なイントラ予測モードの選択が行える。
図5は上記した如きズーム中の画像に対してイントラ予測モードの選択処理を行うときの、イントラ予測部615の動作フローを図示したフローチャートである。
イントラ予測を行う画像に対して、操作部110からのズーム指示に応じてズームレンズ101a及び101bを動かすといったズーム動作が行われたときは(ステップS501)、ズーム中を示す情報及びズーム速度に関する情報をカメラ制御部105より取得する(ステップS502)。ズーム動作が行われないとき(超低速ズーム時を含んでも良い)は(ステップS501)、図12で示したような通常のイントラ予測モードの選択処理を行って、最適なイントラ予測モードを決定してからイントラ予測を行う(ステップS506)。
ステップS502でズーム中を示す情報及びズーム速度に関する情報を取得したときは、符号化対象となるブロックが位置する画面上の領域を判別し、その領域に応じた予測方向を自動選択する(ステップS503)。すなわち、画面の左上領域又は右下領域のブロックならば、mode 4のDown−Right予測モードを、画面の右上領域及び左下領域のブロックならば、mode 3のDown−Left予測モードを選択する。また、中心付近領域(Center)のブロックならば、予測モードを定められないので、通常のイントラ予測モードの選択処理を行って、最適なイントラ予測モードを決定してからイントラ予測を行う(ステップS506)。ステップS503において、Down−Left予測モードが選択されたときは、mode 3のDown−Left予測モードでイントラ予測を行い(ステップS504)、Down−Right予測モードが選択されたときは、mode 4のDown−Right予測モードでイントラ予測を行う(ステップS505)。
なお、画面上の領域をより細分化して分類することにより、画面の中心からみて真上又は真下はmode 0のVertical予測モードを選択し、画面の中心からみて左側又は右側はmode 1のHorizontal予測モードを選択するようにするとより効果的である。さらに領域を細分化して、他の斜め方向の予測モード(mode 5,6,7,8)も選択できるようにすれば、より予測精度を高められる。
また、図5ではズームが行われた場合、符号化対象となるブロックの位置する領域に応じて、中心付近以外のときはイントラ予測モードを一意に選択する構成としたが、9種類ある予測モードを2,3種類に絞り込んだり、或いは明らかに予測方向が異なると判断する予測モードを除外したりして、選択肢を減らしてから、残った候補のうちから最適な予測モードを演算で求めるようにしてもよい。
このように本実施形態によれば、ズームといった撮影時の情報をイントラ予測モードの選択時に利用することで、最適なイントラ予測モードを容易に選択できるとともに、符号化にかかる処理負荷も軽減できる。
<第3の実施形態>
次に、図6及び図7を用いて本発明の第3の実施形態について説明する。
本実施形態では、第1の実施形態で説明した撮像装置100がフォーカス動作するときの、カメラ制御部105の制御動作並びにイントラ予測部615の動作について説明する。
撮影中にフォーカス動作が行われる場合、合焦していないときは、撮影画像の画面全体がボケた状態となる。そして、符号化部104でボケた撮影画像に対してイントラ予測を行う場合、特定の方向は無く、画素の平均値を利用するDC予測モードの予測効率が良いことになる。
このとき、図11の画像は合焦している状態であるので画面上の各ブロックでばらばらの方向を示していたイントラ予測の方向が、画像がボケ状態のときは画面全体にわたり図6のようにDC予測を示すようになると推測できる。
このような思想に基づき、カメラ制御部105は、符号化部104(すなわち、画像符号化装置600)内のイントラ予測部615に対して、フォーカス状態に従ったイントラ予測モードを選択するための制御信号を送ることを特徴としている。また、イントラ予測部615は、受信した当該制御信号に応じて、上記した通常のイントラ予測モードの選択処理に変えて、ボケた画像に対してはDCイントラ予測モードを一意に選択する。これにより、イントラ予測モードの選択の際、全てのイントラ予測モードを試してみるよりも、はるかに効率的に最適なイントラ予測モードの選択が行える。
図7は上記した如きボケた画像、特にフォーカス非合焦状態で撮影された画像に対してイントラ予測モードの選択処理を行うときの、イントラ予測部615の動作フローを図示したフローチャートである。
イントラ予測を行う画像に対して、フォーカスが合焦状態で撮影されたか、或いは非合焦状態で撮影されたかを示すフォーカス情報をカメラ制御部105より取得する(ステップS701)。フォーカス情報により、フォーカスが合焦していると判別したときは(ステップS702)、図12で示したような通常のイントラ予測モードの選択処理を行って、最適なイントラ予測モードを決定してからイントラ予測を行う(ステップS704)。
一方、フォーカス情報により、フォーカスが非合焦(ボケた画像)であると判別したときは(ステップS702)、DC予測モードを自動選択し、mode 2のDC予測モードでイントラ予測を行う(ステップS703)。
このように本実施形態によれば、フォーカスといった撮影時の情報をイントラ予測モードの選択時に利用することで、最適なイントラ予測モードを容易に選択できるとともに、符号化にかかる処理負荷も軽減できる。
なお、第1〜第3の実施形態で説明した本発明の実施例は、それぞれ単独で用いても良いが、各実施例を組み合わせて用いるよう構成しても良い。各実施例を組み合わせて用いることで、様々な撮影状態に対応して最適なイントラ予測モードを効率的に選択できるとともに、符号化にかかる処理負荷も軽減できる。
<その他の実施形態>
また、本発明の目的は、前述した実施形態の機能を実現するソフトウェアのプログラムコードを記録した記憶媒体を、システムあるいは装置に供給し、そのシステムあるいは装置のコンピュータ(またはCPUやMPU)が記憶媒体に格納されたプログラムコードを読み出し実行することによっても、達成されることは言うまでもない。この場合、記憶媒体から読み出されたプログラムコード自体が前述した実施形態の機能を実現することになり、そのプログラムコードを記憶した記憶媒体は本発明を構成することになる。また、コンピュータが読み出したプログラムコードを実行することにより、前述した実施形態の機能が実現されるだけでなく、そのプログラムコードの指示に基づき、コンピュータ上で稼働しているオペレーティングシステム(OS)などが実際の処理の一部または全部を行い、その処理によって前述した実施形態の機能が実現される場合も含まれることは言うまでもない。ここでプログラムコードを記憶する記憶媒体としては、例えば、フレキシブルディスク、ハードディスク、ROM、RAM、磁気テープ、不揮発性のメモリカード、CD−ROM、CD−R、DVD、ブルーレイディスク、光ディスク、光磁気ディスク、MOなどが考えられる。
さらに、記憶媒体から読み出されたプログラムコードが、コンピュータに挿入された機能拡張カードやコンピュータに接続された機能拡張ユニットに備わるメモリに書込まれた後、そのプログラムコードの指示に基づき、その機能拡張カードや機能拡張ユニットに備わるCPUなどが実際の処理の一部または全部を行い、その処理によって前述した実施形態の機能が実現される場合も含まれることは言うまでもない。
本発明を上記記憶媒体に適用する場合、その記憶媒体には、先に説明したフローチャート図に対応するプログラムコードが格納されることになる。
撮像装置100の構成を表わしたブロック図である。 パンニング中の画像に対するイントラ予測方向の例を示した図である。 パンやチルトの方向に応じたイントラ予測モードの選択処理を図示したフローチャートである。 ズーム中の画像に対するイントラ予測方向の例を示した図である。 ズームに応じたイントラ予測モードの選択処理を図示したフローチャートである。 ボケた画像に対するイントラ予測の例を示した図である。 フォーカスに応じたイントラ予測モードの選択処理を図示したフローチャートである。 画像符号化装置600の構成を表わしたブロック図である。 イントラ予測に用いる画素の説明図である。 イントラ予測における各予測モードの図である。 通常の画像におけるイントラ予測方向の例を示した図である。 通常のイントラ予測モードの選択処理を図示したフローチャートである。
符号の説明
101 撮影レンズ部
102 撮像素子
103 カメラ信号処理部
104 符号化部
105 カメラ制御部
106 フォーカス検出部
107 フォーカスモータ
108 ズームモータ
109 動きセンサー
110 操作部
601 減算器
602 整数変換部
603 量子化部
604 エントロピー符号化部
605 逆量子化部
606 逆整数変換部
607 加算器
608 フレームメモリ
610 ループフィルタ
611 フレームメモリ
612 インター予測部
613 動き検出部
614 スイッチ
615 イントラ予測部

Claims (7)

  1. 複数の予測モードのうちいずれかを選び、選ばれた予測モードに従ってフレーム内の画素値を用いて同一フレーム内の符号化対象ブロックの画素値を予測して予測画像データを生成する画像符号化装置において、
    符号化すべき画像信号を入力する手段と、
    前記画像信号が生成されたときのカメラのズーム動作状態を示す撮影情報を取得する手段と、
    入力した前記画像信号の符号化において、フレーム内の画素値を用いて同一フレーム内の前記符号化対象ブロックの画素値を予測するときに、前記撮影情報がズーム動作中であることを示している場合には、前記符号化対象ブロックの位置に応じた予測モードを選択する手段とを備えることを特徴とする画像符号化装置。
  2. 前記予測モードを選択する手段は、前記撮影情報がズーム動作中であることを示している場合には、前記画像信号によって表される画像を複数の領域に分割したときに、前記符号化対象ブロックが含まれる領域を判別し、前記領域ごとに所定の予測モードを選択することを特徴とする請求項1に記載の画像符号化装置。
  3. 前記予測モードを選択する手段は、前記領域ごとにそれぞれ同じ予測方向となる予測モードを選択することを特徴とする請求項に記載の画像符号化装置。
  4. 複数の予測モードのうちいずれかを選び、選ばれた予測モードに従ってフレーム内の画素値を用いて同一フレーム内の符号化対象ブロックの画素値を予測して予測画像データを生成する画像符号化装置において、
    符号化すべき画像信号を入力する手段と、
    前記画像信号が生成されたときのカメラのフォーカス動作状態を示す撮影情報を取得する手段と、
    入力した前記画像信号の符号化において、フレーム内の画素値を用いて同一フレーム内の前記符号化対象ブロックの画素値を予測するときに、前記撮影情報がフォーカス合焦状態を示している場合と、フォーカス非合焦状態を示している場合とで、異なる処理によって予測モードを選択する手段とを備えることを特徴とする画像符号化装置。
  5. 前記予測モードを選択する手段は、前記撮影情報がフォーカス非合焦状態を示している場合には、所定の予測モードを選択することを特徴とする請求項に記載の画像符号化装置。
  6. 撮像して得られる画像信号を出力する撮像手段と、
    前記画像信号を圧縮符号化するための符号化手段であって、複数の予測モードのうちいずれかを選び、選ばれた予測モードに従ってフレーム内の画素値を用いて同一フレーム内の画素値を予測して予測画像データを生成する処理を行う符号化手段とを備えた撮像装置において、
    さらに前記撮像手段におけるズーム動作を制御する制御手段を備え、前記符号化手段は、フレーム内の画素値を用いて同一フレーム内の画素値を予測するときに、前記制御手段から出力された情報を用いて、ズーム中に撮影された画像に対しては当該画像を複数の領域に分割し、前記領域ごとに所定の予測モードを選択することを特徴とする撮像装置。
  7. 撮像して得られる画像信号を出力する撮像手段と、
    前記画像信号を圧縮符号化するための符号化手段であって、複数の予測モードのうちいずれかを選び、選ばれた予測モードに従ってフレーム内の画素値を用いて同一フレーム内の画素値を予測して予測画像データを生成する処理を行う符号化手段とを備えた撮像装置において、
    さらに前記撮像手段におけるフォーカス動作を制御する制御手段を備え、前記符号化手段は、フレーム内の画素値を用いて同一フレーム内の画素値を予測するときに、前記制御手段から出力された情報を用いて、フォーカスが非合焦状態と判断されるときに撮影された画像に対しては所定の予測モードを選択することを特徴とする撮像装置。
JP2005026530A 2004-06-17 2005-02-02 画像符号化装置及び撮像装置 Expired - Fee Related JP4564856B2 (ja)

Priority Applications (5)

Application Number Priority Date Filing Date Title
JP2005026530A JP4564856B2 (ja) 2005-02-02 2005-02-02 画像符号化装置及び撮像装置
US11/152,609 US8369402B2 (en) 2004-06-17 2005-06-14 Apparatus and method for prediction modes selection based on image formation
EP05253759A EP1607909A1 (en) 2004-06-17 2005-06-16 Moving image coding apparatus
EP06026149A EP1770639B1 (en) 2004-06-17 2005-06-16 Moving image coding apparatus
US13/732,134 US8780985B2 (en) 2004-06-17 2012-12-31 Apparatus and method for prediction modes selection based on image direction information

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2005026530A JP4564856B2 (ja) 2005-02-02 2005-02-02 画像符号化装置及び撮像装置

Publications (3)

Publication Number Publication Date
JP2006217158A JP2006217158A (ja) 2006-08-17
JP2006217158A5 JP2006217158A5 (ja) 2008-01-31
JP4564856B2 true JP4564856B2 (ja) 2010-10-20

Family

ID=36980015

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2005026530A Expired - Fee Related JP4564856B2 (ja) 2004-06-17 2005-02-02 画像符号化装置及び撮像装置

Country Status (1)

Country Link
JP (1) JP4564856B2 (ja)

Families Citing this family (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP4707118B2 (ja) 2007-03-28 2011-06-22 株式会社Kddi研究所 動画像符号化装置および動画像復号装置のイントラ予測方式
JP2022028085A (ja) * 2018-11-29 2022-02-15 ソニーグループ株式会社 画像処理装置および方法

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2004304724A (ja) * 2003-04-01 2004-10-28 Sony Corp 画像処理装置とその方法、並びに符号化装置
JP2006186972A (ja) * 2004-12-03 2006-07-13 Matsushita Electric Ind Co Ltd イントラ予測装置

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2004304724A (ja) * 2003-04-01 2004-10-28 Sony Corp 画像処理装置とその方法、並びに符号化装置
JP2006186972A (ja) * 2004-12-03 2006-07-13 Matsushita Electric Ind Co Ltd イントラ予測装置

Also Published As

Publication number Publication date
JP2006217158A (ja) 2006-08-17

Similar Documents

Publication Publication Date Title
US8369402B2 (en) Apparatus and method for prediction modes selection based on image formation
JP4708819B2 (ja) 画像処理装置、方法、コンピュータプログラム及び記憶媒体
JP4817990B2 (ja) 撮像装置及びその制御方法及びプログラム及び記憶媒体
JP2008193458A (ja) カメラ画像圧縮処理装置及び圧縮処理方法
JP2010057166A (ja) 画像符号化装置、画像符号化方法、集積回路及びカメラ
US8036281B2 (en) Image coding apparatus and image coding method
JP4446288B2 (ja) 動画記録装置および動画記録処理プログラム
US20070253480A1 (en) Encoding method, encoding apparatus, and computer program
US8155185B2 (en) Image coding apparatus and method
JP3592025B2 (ja) 撮影画像記録装置
JP5943733B2 (ja) 画像符号化装置およびその制御方法ならびにプログラム
JP4564856B2 (ja) 画像符号化装置及び撮像装置
US20070127571A1 (en) Image processing apparatus and method
JP4585919B2 (ja) 画像符号化装置及び画像符号化方法
JP4795211B2 (ja) 画像符号化装置、画像符号化装置の制御方法、プログラム並びに記憶媒体
JP4574530B2 (ja) 画像符号化装置及び画像符号化方法
JP2004180345A (ja) 撮影画像記録装置
JP2009049513A (ja) 動画像符号化装置及び動画像符号化方法
JP6016484B2 (ja) 符号化装置
JP5943757B2 (ja) 画像符号化装置及びその方法
JP2013179572A (ja) 画像符号化装置および画像符号化方法
JP2006166255A (ja) 画像符号化装置、撮像装置、画像記録方法、画像記録装置、画像記録媒体及び画像再生装置
JP2012222460A (ja) 動画像符号化装置、動画像符号化方法及びプログラム
JP2019009605A (ja) 画像処理装置、画像処理方法およびプログラム
JP2013042216A (ja) 画像処理装置およびその制御方法

Legal Events

Date Code Title Description
A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20071210

A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20071210

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20091030

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20091110

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20091222

RD04 Notification of resignation of power of attorney

Free format text: JAPANESE INTERMEDIATE CODE: A7424

Effective date: 20100201

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20100323

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20100511

RD01 Notification of change of attorney

Free format text: JAPANESE INTERMEDIATE CODE: A7421

Effective date: 20100630

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20100727

A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20100802

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20130806

Year of fee payment: 3

R150 Certificate of patent or registration of utility model

Ref document number: 4564856

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

Free format text: JAPANESE INTERMEDIATE CODE: R150

LAPS Cancellation because of no payment of annual fees