JP4335779B2 - 符号化装置およびこれを用いた録画装置、並びに符号化方法および録画方法 - Google Patents

符号化装置およびこれを用いた録画装置、並びに符号化方法および録画方法 Download PDF

Info

Publication number
JP4335779B2
JP4335779B2 JP2004314874A JP2004314874A JP4335779B2 JP 4335779 B2 JP4335779 B2 JP 4335779B2 JP 2004314874 A JP2004314874 A JP 2004314874A JP 2004314874 A JP2004314874 A JP 2004314874A JP 4335779 B2 JP4335779 B2 JP 4335779B2
Authority
JP
Japan
Prior art keywords
encoding
image data
recording
generated information
learning
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
JP2004314874A
Other languages
English (en)
Other versions
JP2006129093A (ja
Inventor
竜志 大塚
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Fujitsu Semiconductor Ltd
Original Assignee
Fujitsu Semiconductor Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Fujitsu Semiconductor Ltd filed Critical Fujitsu Semiconductor Ltd
Priority to JP2004314874A priority Critical patent/JP4335779B2/ja
Priority to US11/044,023 priority patent/US7457360B2/en
Publication of JP2006129093A publication Critical patent/JP2006129093A/ja
Application granted granted Critical
Publication of JP4335779B2 publication Critical patent/JP4335779B2/ja
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/102Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
    • H04N19/124Quantisation
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/134Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or criterion affecting or controlling the adaptive coding
    • H04N19/146Data rate or code amount at the encoder output
    • H04N19/15Data rate or code amount at the encoder output by monitoring actual compressed data size at the memory before deciding storage at the transmission buffer
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/169Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding
    • H04N19/179Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being a scene or a shot
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/189Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the adaptation method, adaptation tool or adaptation type used for the adaptive coding
    • H04N19/192Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the adaptation method, adaptation tool or adaptation type used for the adaptive coding the adaptation method, adaptation tool or adaptation type being iterative or recursive
    • H04N19/194Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the adaptation method, adaptation tool or adaptation type used for the adaptive coding the adaptation method, adaptation tool or adaptation type being iterative or recursive involving only two passes
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/60Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using transform coding
    • H04N19/61Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using transform coding in combination with predictive coding

Landscapes

  • Engineering & Computer Science (AREA)
  • Multimedia (AREA)
  • Signal Processing (AREA)
  • Compression Or Coding Systems Of Tv Signals (AREA)
  • Compression, Expansion, Code Conversion, And Decoders (AREA)

Description

この発明は、符号化装置およびこれを用いた録画装置、並びに符号化方法および録画方法に関し、特にMPEG規格で動画像データをリアルタイムで符号化して圧縮する符号化技術に関する。
MPEG−2規格等の応用製品では、画像データの符号化をリアルタイムに行いながら、一定のビットレートに収める必要がある。予め画像データを符号化しておき、発生情報量の推移を見てから、本番の符号化を行う2パス方式の符号化処理では、ビットレートの割り当てを正確に行うことができる。しかし、この2パス方式は、ムービーカメラのようにリアルタイムに符号化を行う必要がある場合には、適さない。
一般に、リアルタイムに符号化を行う場合の符号化処理は、次のようにして行われる。まず、符号化開始時(録画開始時)に発生情報量をある程度予測して1番目のピクチャの符号化を行う。そして、その結果として発生した情報量に基づいて、2番目のピクチャの割り当て情報量を調整して符号化する。3番目のピクチャについては、1番目および2番目のピクチャの符号化により発生した情報量に基づいて、割り当て情報量を調整して符号化する。このように、常にそれまでに符号化したピクチャの発生情報量に基づいてフィードバック制御を行いながら、徐々に入力映像と発生情報量の関係を学習し、適切な情報量割り当てになるようにしている。
ところで、MPEG−2規格により符号化されたビットストリームのように、ビットレートに応じてデータ長が変わる主データを含むビットストリームのビットレートを変更する情報量変換回路として、ビットストリームから主データを切り出す手段と、切り出した主データを目標ビットレートに応じて変換して変換後の主データを出力する手段と、変換前の主データに代えて変換後の主データをビットストリームに戻す手段と、を有する回路が提案されている(例えば、特許文献1参照。)。この特許文献1の発明は、既にMPEG規格により符号化されたビットストリームを再符号化することにより圧縮率を高めるものであり、本発明とは異なる。
また、可変ビットレート符号化方法として、画像シーケンスを一定の量子化ステップサイズを用いて符号化し、このシーケンスの平均ビットレートが要求される特定のステップサイズの制約を満たしていないビット流を発生する分析工程と、予め定めた目標ビットレートに基づいてビット流を符号化するために用いられる量子化ステップサイズを予測する予測工程と、分析工程および予測工程を少なくとも1回繰り返してステップサイズの一層精密な評価を得る工程と、以前の全てのフレームについての累積的なビットレートを累積的な予測したビットレートと比較し、目標ビットレートが整合するようにステップサイズを調整する最終制御工程とを備える方法が提案されている(例えば、特許文献2参照。)。この特許文献2の発明は、分析工程と予測工程を何回か繰り返し行ってビットストリームを生成するものであり、本発明とは異なる。
特開平7−312756号公報 特表2001−501429号公報
従来のフィードバック制御を行いながら、徐々に入力映像と発生情報量の関係を学習する従来方法では、符号化の開始から安定状態になるまでに数〜数十ピクチャを必要とする。つまり、符号化を開始してしばらくの間は、発生情報量の割り当てに対する学習ができていない状態となる。そのため、録画開始から安定状態になるまでは、画質が悪かったり、必要とする画質に対して十分過ぎるビットレートを割り当ててしまい、無駄に情報量を費やすという問題点がある。また、録画開始時の最初のピクチャに対して、目標情報量に近い情報量を発生させるために、符号化パラメータをどのように設定すればよいかということについての解決手段はない。
そこで、本来の録画開始時点よりも早めにエンコードを開始して学習を行い、学習が済んで安定状態となった時点からビットストリームを記録媒体に記録する方法がある。しかし、この方法では、本番の録画開始前からエンコーダを動かしておく必要があるため、消費電力の無駄が多くなってしまう。そのため、例えばバッテリ駆動のムービーカメラ等のように、消費電力をできるだけ抑えたい場合には、適さない。
この発明は、上述した従来技術による問題点を解消するため、録画開始前に低消費電力で学習を行い、その学習結果に基づいて録画開始時に適切に符号化を行うことができる符号化装置およびこれを用いた録画装置、並びに符号化方法および録画方法を提供することを目的とする。
上述した課題を解決し、目的を達成するため、この符号化装置は、録画開始前から、入力された画像データに基づいて、実際の符号化を行わないで画像情報を取得する第1の学習と、実際の符号化を行って画像情報を取得する第2の学習とを行う機能を有するプリ符号化手段と、前記プリ符号化手段により得られて学習結果に基づいて決定された符号化パラメータを用いて録画対象の画像データを符号化する符号化手段とを備え、前記プリ符号化手段は、入力された画像データに基づいて現在の画像の明るさ、色合いおよび絵柄の複雑さを求める画像入力手段と、現在の画像データと過去の画像データに基づいて画像の動きベクトルを求める動き探索手段と、種々のシーンに対する符号化パラメータと発生情報量との関係を表すテーブル群を備え、前記プリ符号化手段は、前記デーブル群の中から、前記画像入力手段により得られた現在の画像の明るさ、色合いおよび絵柄の複雑さと、前記動き探索手段により得られた動きベクトルの組み合わせに近い第1のテーブルを選択し、その第1のテーブルを前記第1の学習結果とし、さらに、前記プリ符号化手段は、前記動き探索手段により得られた動きベクトルに基づいて過去の画像データから現在の画像データを予測し、その予測した現在の画像データと実際の現在の画像データとの差分を求める動き補償手段と、前記動き補償手段により得られた画像データの差分を符号化して発生情報量を求める発生情報量取得手段とを備え、前記プリ符号化手段は、前記動き補償手段から絵柄の乱雑さの値を読み出すとともに、前記第1のテーブルに基づいて一つ以上の符号化パラメータの値を選択し、その選択した符号化パラメータの値を用いて、前記動き補償手段により得られた画像データの差分を符号化して発生情報量を取得し、その取得した発生情報量に基づいて絵柄の乱雑さと発生情報量との関係を表す第2のテーブルを前記第2の学習結果とする。
また、この録画装置は、録画開始前から、入力された画像データに基づいて、実際の符号化を行わないで画像情報を取得する第1の学習と、実際の符号化を行って画像情報を取得する第2の学習を行う機能を有するプリ符号化手段と、前記プリ符号化手段により得られた学習結果に基づいて決定された符号化パラメータを用いて録画対象の画像データを符号化する符号化手段と、録画開始前に前記符号化手段により符号化された画像データを記録する記録手段とを備え、前記プリ符号化手段は、入力された画像データに基づいて現在の画像の明るさ、色合いおよび絵柄の複雑さを求める画像入力手段と、現在の画像データと過去の画像データに基づいて画像の動きベクトルを求める動き探索手段と、種々のシーンに対する符号化パラメータと発生情報量との関係を表すテーブル群を備え、前記プリ符号化手段は、前記テーブル群の中から、前記画像入力手段により得られた現在の画像の明るさ、色合いおよび絵柄の複雑さと、前記動き探索手段により得られた動きベクトルの組み合わせに近い第1のテーブルを選択し、その第1のテーブルを前記第1の学習結果とし、さらに、前記プリ符号化手段は、前記動き探索手段により得られた動きベクトルに基づいて過去の画像データから現在の画像データを予測し、その予測した現在の画像データと実際の現在の画像データとの差分を求める動き補償手段と、前記動き補償手段により得られた画像データの差分を符号化して発生情報量を求める発生情報量取得手段とを備え、前記プリ符号化手段は、前記動き補償手段から絵柄の乱雑さの値を読み出すとともに、前記第1のテーブルに基づいて一つ以上の符号化パラメータの値を選択し、その選択した符号化パラメータの値を用いて、前記動き補償手段により得られた画像データの差分を符号化して発生情報量を取得し、その取得した発生情報量に基づいて絵柄の乱雑さと発生情報量との関係を表す第2のテーブルを前記第2の学習結果とする。
また、この符号化方法は、録画開始前から、入力された画像データに基づいて現在の画像の明るさ、色合いおよび絵柄の複雑さを求めるとともに、現在の画像データと過去の画像データに基づいて画像の動きベクトルを求め、予め設けられた、種々のシーンに対する符号化パラメータと発生情報量との関係を表すテーブル群の中から、現在の画像の明るさ、色合いおよび絵柄の複雑さと、動きベクトルの組み合わせに近い第1のテーブルを選択し、その第1のテーブルを、実際の符号化を行わないで画像情報を取得する第1の学習結果とするプリ符号化工程と、前記プリ符号化工程により得られた前記第1の学習結果に基づいて決定された符号化パラメータを用いて録画対象の画像データを符号化する符号化工程とを含み、前記プリ符号化工程は、前記動きベクトルに基づいて過去の画像データから現在の画像データを予測し、その予測した現在の画像データと実際の現在の画像データとの差分を求め、絵柄の乱雑さの値を読み出すとともに、前記第1のテーブルに基づいて一つ以上の符号化パラメータの値を選択し、その選択した符号化パラメータの値を用いて、前記画像データの差分を符号化して発生情報量を取得し、その取得した発生情報量に基づいて絵柄の乱雑さと発生情報量との関係を表す第2のテーブルを、実際の符号化を行って画像情報を取得する第2の学習結果とする。
また、この録画方法は、録画開始前から、入力された画像データに基づいて現在の画像の明るさ、色合いおよび絵柄の複雑さを求めるとともに、現在の画像データと過去の画像データに基づいて画像の動きベクトルを求め、予め設けられた、種々のシーンに対する符号化パラメータと発生情報量との関係を表すテーブル群の中から、現在の画像の明るさ、色合いおよび絵柄の複雑さと、動きベクトルの組み合わせに近い第1のテーブルを選択し、その第1のテーブルを、実際の符号化を行わないで画像情報を取得する第1の学習結果とするプリ符号化工程と、前記プリ符号化工程により得られた学習結果に基づいて決定された符号化パラメータを用いて録画対象の画像データを符号化する符号化工程と、録画開始時に前記符号化工程で符号化された画像データを記録する記録工程とを含み、前記プリ符号化工程は、前記動きベクトルに基づいて過去の画像データから現在の画像データを予測し、その予測した現在の画像データと実際の現在の画像データとの差分を求め、絵柄の乱雑さの値を読み出すとともに、前記第1のテーブルに基づいて一つ以上の符号化パラメータの値を選択し、その選択した符号化パラメータの値を用いて、前記画像データの差分を符号化して発生情報量を取得し、その取得した発生情報量に基づいて絵柄の乱雑さと発生情報量との関係を表す第2のテーブルを、実際の符号化を行って画像情報を取得する第2の学習結果とする。
この発明によれば、画面全体の明るさと色合い、画面の細かい絵柄か平坦な絵柄か、動きの激しさや乱雑さ、およびある符号化パラメータ(例えば、量子化スケール)で符号化した場合に、どれ位の符号量になるかの相関、という限定的な情報に基づいて学習を行うので、録画開始前に低消費電力で学習を行い、その学習結果に基づいて録画開始時の符号化パラメータを適切に選択することができる。従って、録画開始時に適切な画質で符号化を行うことができる。また、必要とする画質に対して必要かつ十分なビットレートを割り当てることができるので、情報量が無駄に費やされるのを防ぐことができる。
本発明によれば、録画開始前に低消費電力で学習を行い、録画開始時に適切に符号化を行うことができる符号化装置およびこれを用いた録画装置、並びに符号化方法および録画方法が得られるという効果を奏する。
以下に添付図面を参照して、この発明にかかる符号化装置およびこれを用いた録画装置、並びに符号化方法および録画方法の好適な実施の形態を詳細に説明する。ここでは、本発明を、例えばMPEG−2規格により画像データを符号化して録画するムービーカメラに適用した例を説明する。
図1は、実施の形態にかかるムービーカメラの構成を示すブロック図である。図1に示すように、ムービーカメラ1は、レンズ部11、CCDやCMOS等の固体撮像素子よりなるイメージセンサ12、画像処理回路13、録画開始前のプリ符号化手段と録画時の符号化手段を兼ねる符号化装置2、記録手段を構成するテープやディスク等の記録装置14、ROMやEEPROM等の不揮発性メモリ19、および種々のシーンに対する符号化パラメータと発生情報量との関係を表す複数のテーブルよりなる発生情報量テーブル群10を備えている。
発生情報量テーブル群10は、予め不揮発性メモリ19に記憶されている。符号化装置2は、録画開始前のプリエンコードによる学習結果を記憶するRAM等の書き込み可能なメモリ(RAM)21を備えている。また、ムービーカメラ1は、ズームやフォーカス等の操作を行ったり、録画の開始/停止を操作するための各種操作ボタン15、手ぶれ補正を行うための情報を出力するジャイロセンサ16、ファインダ部17およびアラーム部18を備えている。
録画時には、レンズ部11より入力した光信号は、イメージセンサ12で光電変換されて電気信号となる。その電気信号は、画像処理回路13で処理される。画像処理回路13は、ズームやオートフォーカスや手ぶれ補正やオート露出等の種々の制御を行うための情報に基づいて画像処理を行う。画像処理された画像データDは、符号化装置2およびファインダ部17に送られる。符号化装置2は、画像データDを例えばMPEG−2規格に基づいて符号化し、ビットストリームを生成する。そのビットストリームは、記録装置14に記録される。
一方、使用者により録画ボタンが押される前、すなわち録画開始前には、符号化装置2は、画像処理回路13から出力された画像データDに基づいてプリエンコードによる学習を行う。プリエンコードによる学習は、例えばムービーカメラ1の電源がカメラモードで投入されたとき、あるいは電源が投入されたムービーカメラ1が再生モードからカメラモードに変更されたときに実行される。また、プリエンコードによる学習は、画像処理回路13からプリエンコード再実行トリガ信号S1が入力されたときに実行される。
プリエンコードによる学習内容の詳細については後述する。符号化装置2は、学習が終了すると、アラーム部18にプリエンコード完了信号S2を出力する。それによって、アラーム部18は、使用者に学習終了を知らせる音やファインダ部17内のメッセージ等のアラームを発する。なお、学習が終了する前に使用者が録画を開始しようとしたときにアラームが発せられる構成としてもよい。
次に、プリエンコード再実行トリガ信号S1の発生タイミングについて説明する。ムービーカメラ1の場合、使用者がムービーカメラ1の向きを変えたり、ズームインやズームアウト等の何らかの操作を行わない限り、入力画像が大きく変化することはあまりない。従って、ムービーカメラ1の電源がカメラモードで投入された時点、あるいはムービーカメラ1のモードがカメラモードに切り替わった時点から録画開始の直前に至るまで、継続してプリエンコードによる学習を行っている必要はない。
そこで、本実施の形態では、電源投入時またはモード切り替え時にプリエンコードを行って学習が完了した後は、入力画像が大きく変化した場合にプリエンコード再実行トリガ信号S1を発生して、プリエンコードによる学習を再び実行すればよい。入力画像が大きく変化しない状態では、プリエンコードによる学習を再実行する必要はない。
入力画像が大きく変化する場合として、例えば(1)使用者がズームやフォーカス等の操作を行ったことによって画面に変化が起こったことを検出した場合、(2)手ぶれ補正等の情報の変化からムービーカメラ1の向きが変わったことを検出した場合(手ぶれによる向きの変化を除く)、(3)オートフォーカスの情報の変化から被写体が動いたことを検出した場合、(4)オート露出の情報の変化から被写体の明るさが変化したことを検出した場合が挙げられる。画像処理回路13は、上述した(1)〜(4)の情報を処理しているので、これらの情報に基づいてプリエンコード再実行トリガ信号S1を生成し、発することができる。
また、使用者が意図的にプリエンコードによる学習を開始させることができるトリガを備えていてもよい。このようなトリガとして、例えば録画ボタンの半押し等を利用してもよい。この場合、使用者が録画ボタンを半押ししたときにプリエンコードによる学習を開始し、その学習が完了したときにそのことをアラーム部18により使用者に知らせる構成とすれば、使用者は、学習完了を確認してから録画を開始することができる。学習完了前に録画ボタンが押し込まれた場合、すなわち録画が開始された場合には、予め設定されている符号化パラメータの値(デフォルト値)で録画を開始すればよい。このデフォルト値は、例えば不揮発性メモリ19に格納されている。
図2は、符号化装置2の構成を示すブロック図である。図2に示すように、符号化装置2は、画像入力部24、メモリ25、動き探索部29、動き補償部30、直交変換部31、量子化部32、可変長符号化部33、逆量子化部34、逆直交変換部35、全体制御部36および前記メモリ21(以下、学習結果格納用メモリ21とする)を備えている。
メモリ25は、画像データDを一時的に記憶するRAM等のメモリであり、原画像記憶領域26、参照画像記憶領域27および再生画像記憶領域28を有する。画像入力部24、動き探索部29および動き補償部30は、それぞれプリ符号化手段の画像入力手段、動き探索手段および動き補償手段を構成する。また、直交変換部31、量子化部32および可変長符号化部33は、プリ符号化手段の発生情報量取得手段を構成する。
画像データDは、画像データ入力端子41を介して画像入力部24に入力される。可変長符号化部33で生成されたビットストリームは、ビットストリーム出力端子44から出力される。プリエンコード再実行トリガ信号S1は、プリエンコード再実行トリガ信号入力端子42を介して全体制御部36に入力される。全体制御部36は、発生情報量テーブル入力端子43を介して発生情報量テーブル群10を参照する。全体制御部36は、プリエンコード完了信号出力端子45からプリエンコード完了信号S2を出力する。
次に、プリエンコードによる学習内容について説明する。特に限定しないが、ここでは、学習によって符号化パラメータの一つである量子化スケールを調整する場合を例にして説明する。量子化スケールは、発生情報量の増減に大きな影響を及ぼすパラメータである。図3は、学習処理実行時のムービーカメラ1の主要部におけるデータの流れを説明するためのブロック図である。図4は、第一段階の学習処理を示すフローチャートである。
図5は、量子化スケールと平均発生情報量との関係を表すテーブル(以下、量子化スケール−平均発生情報量テーブルとする)の一例を示す図である。図6は、第二段階の学習処理を示すフローチャートである。図7は、アクティビティと平均発生情報量との関係を表すテーブル(以下、アクティビティ−平均発生情報量テーブルとする)の一例を示す図である。ここで、アクティビティとは、絵柄の乱雑さのことである。
図3および図4に示すように、第一段階の学習処理が開始されると、まず、画像入力部24は、画像処理回路13(図1参照)から送られてきた画像データDに対して単純な間引き処理を行う。また、画像入力部24は、画面全体の明るさと色合いの情報、および画面が細かい絵柄であるか平坦な絵柄であるかという情報を得る。画像入力部24は、電力を消費する各種フィルタ処理や、4:2:2を4:2:0にするフォーマット変換等を行わない。画像入力部24で処理された画像データは、原画像データD1としてメモリ25の原画像記憶領域26に書き込まれる。
ただし、時間フィルタ処理のうち、前フレームとの同一画素位置の差分累積を求める機能は、有効となっている。そして、画面に変化がほとんどない場合には、これ以降の処理の実行をスキップする構成となっている。これによって、消費電力の削減を図ることができる。また、画像入力部24は、入力された画像データDに対して、全画面ではなく、画面の一部、例えば画面の上、中、下、左、中および右のそれぞれ一部の領域51に限定して、画像データDの取り込みを行う。これによって、メモリ25に対するアクセス処理が削減される。
画像入力部24での処理が完了したら(ステップS1:Yes)、全体制御部36は、画像入力部24から現在の画像、すなわち原画像の明るさと色合い平均、絵柄の複雑さの平均値情報I1を読み出す(ステップS2)。次いで、動き探索部29は、原画像記憶領域26に記憶されている原画像のデータD2と、参照画像記憶領域27に記憶されている参照画像、すなわち前フレームの画像のデータD3とのパタンマッチングを行い、動きベクトルを求める。その際、画像入力部24で取り込まれた原画像の一部の領域51の中の1個または数個のマクロブロックと、それに対応する参照画像のマクロブロックとが、マクロブロックごとに比較される。
動き探索部29での処理が完了したら(ステップS3:Yes)、全体制御部36は、動き探索部29から動きベクトルの平均値と動きベクトルの絶対値の平均値の情報I2を読み出す(ステップS4)。動きベクトルの絶対値の平均値の大小は、動きの激しさの大小に対応している。また、動きベクトルの絶対値の平均値から動きベクトルの平均値を引いた値の大小は、動きの乱雑さの大小に対応している。
次いで、全体制御部36は、不揮発性メモリ19に記憶されている発生情報量テーブル群10を参照し、様々なシーンごとの分類データの中から、原画像の明るさ、色合いおよび絵柄の複雑さ、動きの激しさ、動きの乱雑さの値と近い組み合わせのものを選択する。そして、その選択したシーンについての量子化スケール−平均発生情報量テーブルを第一段階の学習結果として取得する(ステップS5)。以下の説明では、この第一段階の学習結果とした量子化スケール−平均発生情報量テーブルを第1のテーブルとする。
ここで、量子化スケール−平均発生情報量テーブルについて説明する。図5は、例えばシーン1〜4の4種類のシーンに対して、量子化スケールの値を変えた場合の平均発生情報量の変化をグラフ化して表したものである。図5に示すように、量子化スケールの値が同じでも、シーンによって発生情報量が異なる。このため、録画開始時の最初のシーンがどのようなシーンであるかわからない状態で、例えば、録画開始時に量子化スケールの値を10に設定して符号化する場合、目標情報量が1000であれば、図5のシーン3では、発生情報量がほぼ目標情報量と同じになる。
それに対して、シーン1やシーン2では、目標情報量に対して発生情報量が少なすぎるので、フィードバック制御により量子化スケールの値を小さくして、発生情報量を増やす必要がある。一方、シーン4では、目標情報量に対して発生情報量が多すぎるので、発生情報量を減らすため、量子化スケールの値を大きくする必要がある。このように、シーンによって量子化スケールの値と発生情報量との関係が一様でないため、一般に、録画開始時に最適な量子化スケールの値を完全に把握するのは困難である。
そこで、本実施の形態では、画面全体の明るさと色合い、画面が細かい絵柄であるか平坦な絵柄であるか、動きの激しさや乱雑さ等の情報を種々変えて組み合わせた複数のパターンに対して、予め種々の量子化スケールの値で符号化を行っておく。その結果得られた量子化スケールの値と発生情報量との関係を、図5に示すようなシーン1〜4の関係の形で経験的情報(発生情報量テーブル群10)として蓄積する。
そして、プリエンコードによる第一段階の学習の際に、入力画像を経験的情報(発生情報量テーブル群10)と照らし合わせることによって、入力画像がどの系列に近いかということをおおよそ推定する。ここまでの第一段階の学習が終了した時点で、発生情報量が十分に目標情報量に近くなるような量子化スケールの値を推定することができる。従って、学習時の消費電力をできるだけ少なくする必要がある場合には、第一段階の学習が終了した時点で、全体の学習を終了させる構成としてもよい。第一段階の学習だけでよい場合には、符号化装置2の画像入力部24と動き探索部29のみを動作させればよい。
学習時の消費電力に余裕がある場合、あるいは量子化スケールの値をより一層、高精度に推定する必要がある場合には、上述した第一段階の学習に続いて、次に説明する第二段階の学習を行う。図3および図6に示すように、第二段階の学習処理が開始されると、まず、全体制御部36は、第一段階の学習結果である第1のテーブルに基づいて、録画開始時の発生情報量が目標発生情報量となる可能性の高い量子化スケール(値)を選択する(ステップS11)。そして、符号化の対象となるマクロブロックをサンプル・マクロブロックの1つに設定する(ステップS12)。
動き補償部30は、動き探索部29から動きベクトル情報I3を得るとともに、原画像記憶領域26に記憶されている原画像のうちのサンプル・マクロブロックの画像データD4と、参照画像記憶領域27に記憶されている参照画像のうちの対応するマクロブロックの画像データD5を得る。そして、動き補償部30は、動きベクトル情報I3に基づいて、参照画像のマクロブロックの画像データD5から現在の対応するマクロブロックの画像データを予測し、この予測した画像(予測画像とする)のデータと原画像のサンプル・マクロブロックの画像データD4との差分を求める。
直交変換部31は、動き補償部30により求められた差分データD6に対して直交変換を行う。量子化部32は、直交変換後のデータD7に対して量子化を行う。これらの処理によって、視覚的に目立たない高周波領域のデータが削減される。可変長符号化部33は、ステップS11で選択した量子化スケールの値を用いて、実際に量子化後のデータD8を符号化する。ただし、ここでは、最終的なビットストリームのデータ量を確定するだけであり、実際のビットストリームは不要であるので、可変長符号化部33は、ビットストリームを出力しない。
また、逆量子化部34および逆直交変換部35は、動作しない。従って、動き補償部30による再生画像の生成は行われない。このように、符号化装置2(図2参照)の一部の機能ブロックのみを動作させることによって、第二段階の学習時の消費電力を削減することができる。全体制御部36は、動き補償部30からアクティビティの値I4を読み出すとともに、可変長符号化部33から発生情報量の値I5を読み出し(ステップS13)、その値I6を第二段階学習結果データ20の一部として学習結果格納用メモリ21に蓄積する。
続いて、可変長符号化部33は、ステップS11で選択した量子化スケールの値の1/2の値を求め、その求めた値を用いて、量子化後のデータD8を符号化する。全体制御部36は、可変長符号化部33から発生情報量の値I5を読み出し(ステップS14)、その値I6を第二段階学習結果データ20の一部として学習結果格納用メモリ21に蓄積する。同様にして、ステップS11で選択した量子化スケールの値の2倍の値を用いて、量子化後のデータD8を符号化し、そのときの発生情報量の値I6を読み出し(ステップS15)、第二段階学習結果データ20の一部として学習結果格納用メモリ21に蓄積する。
なお、学習の高精度化による画質向上と消費電力との間にはトレードオフの関係があるので、ステップS14およびステップS15の一方または両方を省略し、経験的な推定値を用いるようにしてもよい。また、より高い精度を必要とする場合には、ステップS11で選択した量子化スケールの値に対して、2倍と1/2倍以外にも細かく倍率を設定してもよい。
すべてのサンプル・マクロブロックについて上述したステップS13〜S15までの処理が終了するまで(ステップS16:No)、順次、符号化対象のマクロブロックを次のサンプル位置に設定し(ステップS18)、ステップS13〜S15の処理を繰り返す。そして、すべてのサンプル・マクロブロックについて処理が終了したら(ステップS16:Yes)、ステップS11で選択した量子化スケールの値、その1/2およびその2倍の各値についてのアクティビティ−平均発生情報量テーブルを第二段階の学習結果として取得し(ステップS17)、第二段階の学習を終了する。アクティビティ−平均発生情報量テーブルは、第2のテーブルに相当する。
ここで、アクティビティ−平均発生情報量テーブルについて説明する。図7は、あるシーンに対して、画面内の何箇所かのサンプル・マクロブロックについてアクティビティと平均発生情報量の変化をグラフ化して表したものである。このような学習結果を得ることによって、本番の各マクロブロックの符号化を行う際には、マクロブロックのアクティビティから、実際に符号化する前の段階で発生情報量を予測することが可能となる。
第一段階の学習結果に基づいて選択した量子化スケールの値では発生情報量と目標情報量との差が大きい場合には、量子化スケールの値をマクロブロック単位で微調整することによって、目標情報量への収束を速めることができる。また、フォーカスが合っている部分等、画面の特定の注目部分に対して特に画質を向上させることを目的として量子化スケールの値を調整する場合には、発生情報量がどの程度、増加するかということを予測することができるので、録画開始時の発生情報量を高精度に制御することが可能となる。
次に、プリエンコードによる学習を行うことによる電力削減効果について説明する。この電力削減効果は、全画面に対して、画像入力部24での画像取り込み範囲をどれ位に絞るかということと、その取り込まれた画像のうち、動き探索処理および符号化処理するマクロブロックをどれ位に限定するかということに依存する。
一例として、画面の上、中、下、左、中、右の9個のマクロブロックについて、動き探索範囲を左右±32画素で上下±16画素程度に限定した場合、プリエンコード時の対象画像は、おおよそ18432ピクセル(=(32×2×3)×(16×2×3)ピクセル)となる。これは、通常のテレビジョンの画面に相当するMP@MLの場合の345600ピクセル(=720×480ピクセル)の約5%となる。従って、消費電力もその程度の割合となる。
ただし、一部のマクロブロックに対して学習を行う場合には、全画面の全マクロブロックに対して学習を行う場合に比べて、学習精度が劣る可能性がある。従って、必要とする学習精度と求める電力削減とのバランスに基づいて、画像入力部24で取り込む画像の範囲と、動き探索処理および符号化処理するマクロブロックの数を設定すればよい。
次に、録画開始後の通常の符号化処理について説明する。図8は、録画開始後の符号化処理を説明するためのブロック図である。録画開始時には、上述したプリエンコードによる学習結果に基づいて、適当な量子化スケールを選択し、符号化を開始する。録画開始後、画像入力部24は、画像処理回路13(図1参照)から送られてきた画像データDに対して各種空間フィルタ処理、時間フィルタ処理および4:2:2を4:2:0にするフォーマット変換等を行う。画像入力部24で処理された画像データは、原画像データD9としてメモリ25の原画像記憶領域26に書き込まれる。
次いで、動き探索部29は、原画像記憶領域26に記憶されている原画像のデータD10と、参照画像記憶領域27に記憶されている参照画像のデータD11とのパタンマッチングを、マクロブロックごとに行い、動きベクトルを求める。動き補償部30は、動き探索部29から動きベクトル情報I7を得るとともに、原画像記憶領域26に記憶されている原画像のマクロブロックのデータD12と、参照画像記憶領域27に記憶されている参照画像の対応するマクロブロックのデータD13を得る。
そして、動き補償部30は、動きベクトル情報I7に基づいて、参照画像のマクロブロックの画像データD5から予測画像のマクロブロックのデータを生成し、その予測画像のマクロブロックのデータと原画像のマクロブロックのデータD12との差分を求める。この差分を求める処理をマクロブロックごとに行う。続いて、直交変換部31において、動き補償部30により求められた差分データD14に対して直交変換を行い、量子化部32において、直交変換後のデータD15に対して量子化を行うことによって、視覚的に目立たない高周波領域のデータを削減する。
高周波領域が削減されたデータD16は、可変長符号化部33において符号化され、ビットストリームに割り当てられる。この段階で、最終的なデータ量が確定する。また、逆量子化部34において、符号化前のデータD16の逆量子化処理を行い、逆直交変換部35において、逆量子化されたデータD17に対して逆直交変換を行う。そして、動き補償部30は、逆直交変換されたデータD18を用いて、再生画像のデータを生成する。生成された再生画像のデータD19は、メモリ25の再生画像記憶領域28に記憶される。この記憶された再生画像のデータD19は、次のフレームでの符号化処理において、参照画像として用いられる。
以上説明したように、実施の形態によれば、画面全体の明るさと色合い、画面が細かい絵柄か平坦な絵柄か、動きの激しさや乱雑さ、および符号化する際の量子化スケールの値と発生情報量との相関、という限定的な情報に基づいて学習を行うので、本番の符号化処理と同様に全画面でエンコードを行うことにより学習を実施する場合の消費電力と比べれば、はるかに少ない消費量で学習を行うことができる。また、符号化前のフレームメモリを多数有し、そこに多くの画像データを予め蓄積しておいて、学習が完了してから本番の符号化を開始する、という準2パス方式で符号化する場合には、多大な回路の増大を招くが、実施の形態によれば、回路の増大を招くことなく、学習を行うことができる。従って、安定して本番のエンコードを開始することができる。
以上において本発明は、上述した実施の形態に限定されるものではなく、種々変更可能である。例えば、プリエンコードによる学習によって量子化スケール以外の符号化パラメータ、あるいは量子化スケールとそれ以外の符号化パラメータとの組み合わせを調整するようにしてもよい。また、実施の形態では、ムービーカメラを例にして説明したが、本発明は、動画像の録画機能を有するデジタルカメラや、動画像の録画機能を有するカメラ付き携帯電話等にも適用可能である。さらに、本発明は、MPEG−2規格に基づいて動画像を符号化する場合に限定されるものではなく、その他の規格に基づいて動画像を符号化する場合にも適用可能である。
(付記1)録画開始前から、入力された画像データに基づいて学習を行うプリ符号化手段と、
前記プリ符号化手段により得られた学習結果に基づいて決定された符号化パラメータを用いて録画対象の画像データを符号化する符号化手段と、
を備えることを特徴とする符号化装置。
(付記2)前記プリ符号化手段は、入力された画像データに基づいて現在の画像の明るさ、色合いおよび絵柄の複雑さを求める画像入力手段と、現在の画像データと過去の画像データに基づいて画像の動きベクトルを求める動き探索手段と、種々のシーンに対する符号化パラメータと発生情報量との関係を表すテーブル群を備えており、
前記プリ符号化手段は、前記テーブル群の中から、前記画像入力手段により得られた現在の画像の明るさ、色合いおよび絵柄の複雑さと、前記動き探索手段により得られた動きベクトルの組み合わせに近い第1のテーブルを選択し、その第1のテーブルを学習結果とすることを特徴とする付記1に記載の符号化装置。
(付記3)前記プリ符号化手段は、前記動き探索手段により得られた動きベクトルに基づいて過去の画像データから現在の画像データを予測し、その予測した現在の画像データと実際の現在の画像データとの差分を求める動き補償手段と、前記動き補償手段により得られた画像データの差分を符号化して発生情報量を求める発生情報量取得手段を備えており、
前記プリ符号化手段は、前記動き補償手段から絵柄の乱雑さの値を読み出すとともに、前記第1のテーブルに基づいて一つ以上の符号化パラメータの値を選択し、その選択した符号化パラメータの値を用いて、前記動き補償手段により得られた画像データの差分を符号化して発生情報量を取得し、その取得した発生情報量に基づいて絵柄の乱雑さと発生情報量との関係を表す第2のテーブルを新たな学習結果とすることを特徴とする付記2に記載の符号化装置。
(付記4)録画開始前から、入力された画像データに基づいて学習を行うプリ符号化手段と、
前記プリ符号化手段により得られた学習結果に基づいて決定された符号化パラメータを用いて録画対象の画像データを符号化する符号化手段と、
録画開始時に前記符号化手段により符号化された画像データを記録する記録手段と、
を備えることを特徴とする録画装置。
(付記5)前記プリ符号化手段は、入力された画像データに基づいて現在の画像の明るさ、色合いおよび絵柄の複雑さを求める画像入力手段と、現在の画像データと過去の画像データに基づいて画像の動きベクトルを求める動き探索手段と、種々のシーンに対する符号化パラメータと発生情報量との関係を表すテーブル群を備えており、
前記プリ符号化手段は、前記テーブル群の中から、前記画像入力手段により得られた現在の画像の明るさ、色合いおよび絵柄の複雑さと、前記動き探索手段により得られた動きベクトルの組み合わせに近い第1のテーブルを選択し、その第1のテーブルを学習結果とすることを特徴とする付記4に記載の録画装置。
(付記6)前記プリ符号化手段は、前記動き探索手段により得られた動きベクトルに基づいて過去の画像データから現在の画像データを予測し、その予測した現在の画像データと実際の現在の画像データとの差分を求める動き補償手段と、前記動き補償手段により得られた画像データの差分を符号化して発生情報量を求める発生情報量取得手段を備えており、
前記プリ符号化手段は、前記動き補償手段から絵柄の乱雑さの値を読み出すとともに、前記第1のテーブルに基づいて一つ以上の符号化パラメータの値を選択し、その選択した符号化パラメータの値を用いて、前記動き補償手段により得られた画像データの差分を符号化して発生情報量を取得し、その取得した発生情報量に基づいて絵柄の乱雑さと発生情報量との関係を表す第2のテーブルを新たな学習結果とすることを特徴とする付記5に記載の録画装置。
(付記7)録画開始前から、入力された画像データに基づいて現在の画像の明るさ、色合いおよび絵柄の複雑さを求めるとともに、現在の画像データと過去の画像データに基づいて画像の動きベクトルを求め、予め設けられた、種々のシーンに対する符号化パラメータと発生情報量との関係を表すテーブル群の中から、現在の画像の明るさ、色合いおよび絵柄の複雑さと、動きベクトルの組み合わせに近い第1のテーブルを選択し、その第1のテーブルを学習結果とするプリ符号化工程と、
前記プリ符号化工程により得られた学習結果に基づいて決定された符号化パラメータを用いて録画対象の画像データを符号化する符号化工程と、
を含むことを特徴とする符号化方法。
(付記8)前記プリ符号化工程は、前記動きベクトルに基づいて過去の画像データから現在の画像データを予測し、その予測した現在の画像データと実際の現在の画像データとの差分を求め、絵柄の乱雑さの値を読み出すとともに、前記第1のテーブルに基づいて一つ以上の符号化パラメータの値を選択し、その選択した符号化パラメータの値を用いて、前記画像データの差分を符号化して発生情報量を取得し、その取得した発生情報量に基づいて絵柄の乱雑さと発生情報量との関係を表す第2のテーブルを新たな学習結果とすることを特徴とする付記7に記載の符号化方法。
(付記9)録画開始前から、入力された画像データに基づいて現在の画像の明るさ、色合いおよび絵柄の複雑さを求めるとともに、現在の画像データと過去の画像データに基づいて画像の動きベクトルを求め、予め設けられた、種々のシーンに対する符号化パラメータと発生情報量との関係を表すテーブル群の中から、現在の画像の明るさ、色合いおよび絵柄の複雑さと、動きベクトルの組み合わせに近い第1のテーブルを選択し、その第1のテーブルを学習結果とするプリ符号化工程と、
前記プリ符号化工程により得られた学習結果に基づいて決定された符号化パラメータを用いて録画対象の画像データを符号化する符号化工程と、
録画開始時に前記符号化工程で符号化された画像データを記録する記録工程と、
を含むことを特徴とする録画方法。
(付記10)前記プリ符号化工程は、前記動きベクトルに基づいて過去の画像データから現在の画像データを予測し、その予測した現在の画像データと実際の現在の画像データとの差分を求め、絵柄の乱雑さの値を読み出すとともに、前記第1のテーブルに基づいて一つ以上の符号化パラメータの値を選択し、その選択した符号化パラメータの値を用いて、前記画像データの差分を符号化して発生情報量を取得し、その取得した発生情報量に基づいて絵柄の乱雑さと発生情報量との関係を表す第2のテーブルを新たな学習結果とすることを特徴とする付記9に記載の録画方法。
(付記11)前記画像入力手段は、入力された画像データに対して間引き処理を行い、前記プリ符号化手段は、前記画像入力手段により間引きされた画像データを用いて録画開始前の学習を行うことを特徴とする付記1〜3のいずれか一つに記載の符号化装置。
(付記12)前記プリ符号化手段は、現在の画像データと過去の画像データの同一画素位置に変化がほとんどない場合に、継続して録画開始前の学習を停止することを特徴とする付記1〜3のいずれか一つに記載の符号化装置。
(付記13)前記プリ符号化手段は、録画開始前の一画面のうちの一部の領域の画像データに基づいて学習を行うことを特徴とする付記1〜3のいずれか一つに記載の符号化装置。
(付記14)前記画像入力手段は、入力された画像データに対して間引き処理を行い、前記プリ符号化手段は、前記画像入力手段により間引きされた画像データを用いて録画開始前の学習を行うことを特徴とする付記4〜6のいずれか一つに記載の録画装置。
(付記15)前記プリ符号化手段は、現在の画像データと過去の画像データの同一画素位置に変化がほとんどない場合に、継続して録画開始前の学習を停止することを特徴とする付記4〜6のいずれか一つに記載の録画装置。
(付記16)前記プリ符号化手段は、録画開始前の一画面のうちの一部の領域の画像データに基づいて学習を行うことを特徴とする付記4〜6のいずれか一つに記載の録画装置。
(付記17)前記プリ符号化工程では、入力された画像データに対して間引き処理を行い、その間引きされた画像データを用いて録画開始前の学習を行うことを特徴とする付記7または8に記載の符号化方法。
(付記18)前記プリ符号化工程では、現在の画像データと過去の画像データの同一画素位置に変化がほとんどない場合に、継続して録画開始前の学習を停止することを特徴とする付記7または8に記載の符号化方法。
(付記19)前記プリ符号化工程では、録画開始前の一画面のうちの一部の領域の画像データに基づいて学習を行うことを特徴とする付記7または8に記載の符号化方法。
(付記20)前記プリ符号化工程では、入力された画像データに対して間引き処理を行い、その間引きされた画像データを用いて録画開始前の学習を行うことを特徴とする付記9または10に記載の録画方法。
(付記21)前記プリ符号化工程では、現在の画像データと過去の画像データの同一画素位置に変化がほとんどない場合に、継続して録画開始前の学習を停止することを特徴とする付記9または10に記載の録画方法。
(付記22)前記プリ符号化工程では、録画開始前の一画面のうちの一部の領域の画像データに基づいて学習を行うことを特徴とする付記9または10に記載の録画方法。
以上のように、本発明にかかる符号化装置およびこれを用いた録画装置、並びに符号化方法および録画方法は、MPEG規格による画像データの圧縮技術に有用であり、特に、MPEG−2規格に基づいて画像データを圧縮して記録するムービーカメラ、動画像の録画機能を有するデジタルカメラおよび動画像の録画機能を有するカメラ付き携帯電話等に適している。
実施の形態にかかるムービーカメラの構成を示すブロック図である。 符号化装置の構成を示すブロック図である。 学習処理実行時のデータの流れを説明するためのブロック図である。 第一段階の学習処理を示すフローチャートである。 量子化スケール−平均発生情報量テーブルの一例を示す図である。 第二段階の学習処理を示すフローチャートである。 アクティビティ−平均発生情報量テーブルの一例を示す図である。 録画開始後の符号化処理を説明するためのブロック図である。
符号の説明
D 画像データ
2 符号化装置
14 記録装置
24 画像入力部
29 動き探索部
30 動き補償部
31 直交変換部
32 量子化部
33 可変長符号化部

Claims (4)

  1. 録画開始前から、入力された画像データに基づいて、実際の符号化を行わないで画像情報を取得する第1の学習と、実際の符号化を行って画像情報を取得する第2の学習とを行う機能を有するプリ符号化手段と、
    前記プリ符号化手段により得られて学習結果に基づいて決定された符号化パラメータを用いて録画対象の画像データを符号化する符号化手段とを備え、
    前記プリ符号化手段は、
    入力された画像データに基づいて現在の画像の明るさ、色合いおよび絵柄の複雑さを求める画像入力手段と、
    現在の画像データと過去の画像データに基づいて画像の動きベクトルを求める動き探索手段と、
    種々のシーンに対する符号化パラメータと発生情報量との関係を表すテーブル群を備え、
    前記プリ符号化手段は、前記デーブル群の中から、前記画像入力手段により得られた現在の画像の明るさ、色合いおよび絵柄の複雑さと、前記動き探索手段により得られた動きベクトルの組み合わせに近い第1のテーブルを選択し、その第1のテーブルを前記第1の学習結果とし、
    さらに、前記プリ符号化手段は、
    前記動き探索手段により得られた動きベクトルに基づいて過去の画像データから現在の画像データを予測し、その予測した現在の画像データと実際の現在の画像データとの差分を求める動き補償手段と、
    前記動き補償手段により得られた画像データの差分を符号化して発生情報量を求める発生情報量取得手段とを備え、
    前記プリ符号化手段は、前記動き補償手段から絵柄の乱雑さの値を読み出すとともに、前記第1のテーブルに基づいて一つ以上の符号化パラメータの値を選択し、その選択した符号化パラメータの値を用いて、前記動き補償手段により得られた画像データの差分を符号化して発生情報量を取得し、その取得した発生情報量に基づいて絵柄の乱雑さと発生情報量との関係を表す第2のテーブルを前記第2の学習結果とすることを特徴とする符号化装置。
  2. 録画開始前から、入力された画像データに基づいて、実際の符号化を行わないで画像情報を取得する第1の学習と、実際の符号化を行って画像情報を取得する第2の学習を行う機能を有するプリ符号化手段と、
    前記プリ符号化手段により得られた学習結果に基づいて決定された符号化パラメータを用いて録画対象の画像データを符号化する符号化手段と、
    録画開始前に前記符号化手段により符号化された画像データを記録する記録手段とを備え、
    前記プリ符号化手段は、
    入力された画像データに基づいて現在の画像の明るさ、色合いおよび絵柄の複雑さを求める画像入力手段と、
    現在の画像データと過去の画像データに基づいて画像の動きベクトルを求める動き探索手段と、
    種々のシーンに対する符号化パラメータと発生情報量との関係を表すテーブル群を備え、
    前記プリ符号化手段は、前記テーブル群の中から、前記画像入力手段により得られた現在の画像の明るさ、色合いおよび絵柄の複雑さと、前記動き探索手段により得られた動きベクトルの組み合わせに近い第1のテーブルを選択し、その第1のテーブルを前記第1の学習結果とし、
    さらに、前記プリ符号化手段は、
    前記動き探索手段により得られた動きベクトルに基づいて過去の画像データから現在の画像データを予測し、その予測した現在の画像データと実際の現在の画像データとの差分を求める動き補償手段と、
    前記動き補償手段により得られた画像データの差分を符号化して発生情報量を求める発生情報量取得手段とを備え、
    前記プリ符号化手段は、前記動き補償手段から絵柄の乱雑さの値を読み出すとともに、前記第1のテーブルに基づいて一つ以上の符号化パラメータの値を選択し、その選択した符号化パラメータの値を用いて、前記動き補償手段により得られた画像データの差分を符号化して発生情報量を取得し、その取得した発生情報量に基づいて絵柄の乱雑さと発生情報量との関係を表す第2のテーブルを前記第2の学習結果とすることを特徴とする録画装置。
  3. 録画開始前から、入力された画像データに基づいて現在の画像の明るさ、色合いおよび絵柄の複雑さを求めるとともに、現在の画像データと過去の画像データに基づいて画像の動きベクトルを求め、予め設けられた、種々のシーンに対する符号化パラメータと発生情報量との関係を表すテーブル群の中から、現在の画像の明るさ、色合いおよび絵柄の複雑さと、動きベクトルの組み合わせに近い第1のテーブルを選択し、その第1のテーブルを、実際の符号化を行わないで画像情報を取得する第1の学習結果とするプリ符号化工程と、
    前記プリ符号化工程により得られた前記第1の学習結果に基づいて決定された符号化パラメータを用いて録画対象の画像データを符号化する符号化工程とを含み、
    前記プリ符号化工程は、前記動きベクトルに基づいて過去の画像データから現在の画像データを予測し、その予測した現在の画像データと実際の現在の画像データとの差分を求め、絵柄の乱雑さの値を読み出すとともに、前記第1のテーブルに基づいて一つ以上の符号化パラメータの値を選択し、その選択した符号化パラメータの値を用いて、前記画像データの差分を符号化して発生情報量を取得し、その取得した発生情報量に基づいて絵柄の乱雑さと発生情報量との関係を表す第2のテーブルを、実際の符号化を行って画像情報を取得する第2の学習結果とすることを特徴とする符号化方法。
  4. 録画開始前から、入力された画像データに基づいて現在の画像の明るさ、色合いおよび絵柄の複雑さを求めるとともに、現在の画像データと過去の画像データに基づいて画像の動きベクトルを求め、予め設けられた、種々のシーンに対する符号化パラメータと発生情報量との関係を表すテーブル群の中から、現在の画像の明るさ、色合いおよび絵柄の複雑さと、動きベクトルの組み合わせに近い第1のテーブルを選択し、その第1のテーブルを、実際の符号化を行わないで画像情報を取得する第1の学習結果とするプリ符号化工程と、
    前記プリ符号化工程により得られた学習結果に基づいて決定された符号化パラメータを用いて録画対象の画像データを符号化する符号化工程と、
    録画開始時に前記符号化工程で符号化された画像データを記録する記録工程とを含み、
    前記プリ符号化工程は、前記動きベクトルに基づいて過去の画像データから現在の画像データを予測し、その予測した現在の画像データと実際の現在の画像データとの差分を求め、絵柄の乱雑さの値を読み出すとともに、前記第1のテーブルに基づいて一つ以上の符号化パラメータの値を選択し、その選択した符号化パラメータの値を用いて、前記画像データの差分を符号化して発生情報量を取得し、その取得した発生情報量に基づいて絵柄の乱雑さと発生情報量との関係を表す第2のテーブルを、実際の符号化を行って画像情報を取得する第2の学習結果とすることを特徴とする録画方法。
JP2004314874A 2004-10-28 2004-10-28 符号化装置およびこれを用いた録画装置、並びに符号化方法および録画方法 Expired - Fee Related JP4335779B2 (ja)

Priority Applications (2)

Application Number Priority Date Filing Date Title
JP2004314874A JP4335779B2 (ja) 2004-10-28 2004-10-28 符号化装置およびこれを用いた録画装置、並びに符号化方法および録画方法
US11/044,023 US7457360B2 (en) 2004-10-28 2005-01-28 Method and apparatus for encoding image data with pre-encoding scheme, and method and apparatus for recording video using the same

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2004314874A JP4335779B2 (ja) 2004-10-28 2004-10-28 符号化装置およびこれを用いた録画装置、並びに符号化方法および録画方法

Publications (2)

Publication Number Publication Date
JP2006129093A JP2006129093A (ja) 2006-05-18
JP4335779B2 true JP4335779B2 (ja) 2009-09-30

Family

ID=36261968

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2004314874A Expired - Fee Related JP4335779B2 (ja) 2004-10-28 2004-10-28 符号化装置およびこれを用いた録画装置、並びに符号化方法および録画方法

Country Status (2)

Country Link
US (1) US7457360B2 (ja)
JP (1) JP4335779B2 (ja)

Families Citing this family (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN1328910C (zh) * 2005-03-10 2007-07-25 北京中星微电子有限公司 一种应用硬件实现运动估计时的搜索窗数据读取方法
FR3024263B1 (fr) * 2014-07-24 2018-08-24 Jean-Claude Colin Procede pour choisir un algorithme de compression en fonction du type d'image
WO2017120763A1 (zh) * 2016-01-12 2017-07-20 张阳 运动参数的分析方法及***

Family Cites Families (29)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR950002458A (ko) * 1993-06-02 1995-01-04 이헌조 영상신호의 압축/신장 장치
JP3244399B2 (ja) 1994-03-25 2002-01-07 三洋電機株式会社 圧縮動画像符号信号の情報量変換回路、及び方法
JP3954656B2 (ja) * 1994-09-29 2007-08-08 ソニー株式会社 画像符号化装置及び方法
JP3707118B2 (ja) * 1995-04-28 2005-10-19 ソニー株式会社 画像符号化方法及び装置
KR100355375B1 (ko) * 1995-11-01 2002-12-26 삼성전자 주식회사 영상부호화장치에있어서양자화간격결정방법및회로
US5761398A (en) * 1995-12-26 1998-06-02 C-Cube Microsystems Inc. Three stage hierarchal motion vector determination
US6101276A (en) * 1996-06-21 2000-08-08 Compaq Computer Corporation Method and apparatus for performing two pass quality video compression through pipelining and buffer management
US6337879B1 (en) * 1996-08-14 2002-01-08 Sony Corporation Video data compression apparatus and method of same
JP3588970B2 (ja) * 1997-04-30 2004-11-17 ソニー株式会社 信号符号化方法、信号符号化装置、信号記録媒体及び信号伝送方法
CN1192632C (zh) 1997-07-29 2005-03-09 皇家菲利浦电子有限公司 可变比特率视频编码方法和相应的视频编码器
JP3829312B2 (ja) * 1997-08-28 2006-10-04 ソニー株式会社 画像記録装置および方法、並びに画像処理装置および方法
JP4231565B2 (ja) * 1997-12-19 2009-03-04 テキサス インスツルメンツ インコーポレイテツド 画像情報エンコーディングシステム
US6100940A (en) * 1998-01-21 2000-08-08 Sarnoff Corporation Apparatus and method for using side information to improve a coding system
CA2265089C (en) * 1998-03-10 2007-07-10 Sony Corporation Transcoding system using encoding history information
JP4123567B2 (ja) * 1998-04-30 2008-07-23 ソニー株式会社 画像信号処理装置及び方法
WO1999059344A1 (en) * 1998-05-12 1999-11-18 Sgs-Thomson Microelectronics Asia Pacific (Pte) Ltd. Conditional masking for video encoder
JP2000059774A (ja) * 1998-08-06 2000-02-25 Nippon Telegr & Teleph Corp <Ntt> 映像符号化制御装置
JP3915272B2 (ja) 1998-10-06 2007-05-16 株式会社ニコン 量子化方法,および量子化プログラムを記録した記録媒体
JP2001245303A (ja) * 2000-02-29 2001-09-07 Toshiba Corp 動画像符号化装置および動画像符号化方法
US7177358B2 (en) * 2000-06-27 2007-02-13 Mitsubishi Denki Kabushiki Kaisha Picture coding apparatus, and picture coding method
JP3825615B2 (ja) * 2000-08-11 2006-09-27 株式会社東芝 動画像符号化装置および動画像符号化方法およびプログラムを記録した媒体
JP2002152759A (ja) * 2000-11-10 2002-05-24 Sony Corp 画像情報変換装置および画像情報変換方法
US6845129B2 (en) * 2001-01-31 2005-01-18 Lucent Technologies Inc. Controlling a video-buffer-verifier buffer using an MPEG-like encoder
US6714594B2 (en) * 2001-05-14 2004-03-30 Koninklijke Philips Electronics N.V. Video content detection method and system leveraging data-compression constructs
US20030152151A1 (en) * 2002-02-14 2003-08-14 Chao-Ho Hsieh Rate control method for real-time video communication by using a dynamic rate table
JP3560958B2 (ja) * 2002-04-17 2004-09-02 三菱電機株式会社 動画符号化制御方法および装置
JP2004153704A (ja) * 2002-10-31 2004-05-27 Nippon Telegr & Teleph Corp <Ntt> コンテンツの作成・再生装置、作成・再生方法及びプログラム
EP1602242A2 (en) * 2003-03-03 2005-12-07 Koninklijke Philips Electronics N.V. Video encoding
US7095784B2 (en) * 2003-04-14 2006-08-22 Silicon Intergrated Systems Corp. Method and apparatus for moving picture compression rate control using bit allocation with initial quantization step size estimation at picture level

Also Published As

Publication number Publication date
JP2006129093A (ja) 2006-05-18
US20060093231A1 (en) 2006-05-04
US7457360B2 (en) 2008-11-25

Similar Documents

Publication Publication Date Title
JP4525561B2 (ja) 撮像装置、画像処理方法、並びにプログラム
US8780985B2 (en) Apparatus and method for prediction modes selection based on image direction information
JP3189861B2 (ja) 動画像符号化装置および方法
KR100893419B1 (ko) 촬상 장치 및 촬상 방법
KR20070088789A (ko) 디지털 카메라와, 그것에 이용 가능한 메모리 제어 장치,화상 처리 장치 및 화상 처리 방법
JP2010199656A (ja) 動画撮像装置
JP5153674B2 (ja) 動画像符号化装置及び動画像符号化方法
JP3783238B2 (ja) 撮像システム、画像処理装置、符号化装置、符号化方法及びランダムノイズを除去する方法
JP5141324B2 (ja) 撮像装置および撮像装置の制御方法、ならびに、信号処理装置および信号処理方法
JPWO2010050089A1 (ja) 動画像圧縮符号化における符号化処理方法及び符号化処理装置
JP4771986B2 (ja) 画像符号化装置およびそれを用いた撮像装置
JP5111315B2 (ja) 画像処理装置及び画像処理方法及びプログラム
JP4785460B2 (ja) 撮像装置及び撮像方法
JP4335779B2 (ja) 符号化装置およびこれを用いた録画装置、並びに符号化方法および録画方法
JP2018088652A (ja) 撮像装置、画像処理方法、及び、プログラム
JP2008141354A (ja) 画像符号化装置および撮像装置
JP2011015092A (ja) 撮像装置
JP2007214886A (ja) 画像処理装置
JP2005175974A (ja) 撮像装置
US20130057719A1 (en) Image pickup apparatus
JP2007228119A (ja) 撮像装置、画像処理方法、およびプログラム
JP4854580B2 (ja) 画像処理装置
JP2004180345A (ja) 撮影画像記録装置
JP2008227876A (ja) 撮像装置
JP2011023928A (ja) 撮像装置、画像処理装置および画像処理方法

Legal Events

Date Code Title Description
A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20080311

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20080318

A521 Written amendment

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20080519

A711 Notification of change in applicant

Free format text: JAPANESE INTERMEDIATE CODE: A712

Effective date: 20080730

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20090331

A521 Written amendment

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20090528

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20090623

A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20090625

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20120703

Year of fee payment: 3

R150 Certificate of patent or registration of utility model

Ref document number: 4335779

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

Free format text: JAPANESE INTERMEDIATE CODE: R150

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20120703

Year of fee payment: 3

S531 Written request for registration of change of domicile

Free format text: JAPANESE INTERMEDIATE CODE: R313531

S533 Written request for registration of change of name

Free format text: JAPANESE INTERMEDIATE CODE: R313533

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20120703

Year of fee payment: 3

R371 Transfer withdrawn

Free format text: JAPANESE INTERMEDIATE CODE: R371

S531 Written request for registration of change of domicile

Free format text: JAPANESE INTERMEDIATE CODE: R313531

S533 Written request for registration of change of name

Free format text: JAPANESE INTERMEDIATE CODE: R313533

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20120703

Year of fee payment: 3

R350 Written notification of registration of transfer

Free format text: JAPANESE INTERMEDIATE CODE: R350

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20120703

Year of fee payment: 3

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20130703

Year of fee payment: 4

S111 Request for change of ownership or part of ownership

Free format text: JAPANESE INTERMEDIATE CODE: R313111

R350 Written notification of registration of transfer

Free format text: JAPANESE INTERMEDIATE CODE: R350

LAPS Cancellation because of no payment of annual fees