JP2004147104A - Moving image coding device - Google Patents
Moving image coding device Download PDFInfo
- Publication number
- JP2004147104A JP2004147104A JP2002309979A JP2002309979A JP2004147104A JP 2004147104 A JP2004147104 A JP 2004147104A JP 2002309979 A JP2002309979 A JP 2002309979A JP 2002309979 A JP2002309979 A JP 2002309979A JP 2004147104 A JP2004147104 A JP 2004147104A
- Authority
- JP
- Japan
- Prior art keywords
- data stream
- frame rate
- moving image
- image data
- encoding
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Images
Landscapes
- Two-Way Televisions, Distribution Of Moving Picture Or The Like (AREA)
- Television Signal Processing For Recording (AREA)
- Studio Devices (AREA)
- Compression Or Coding Systems Of Tv Signals (AREA)
Abstract
Description
【0001】
【発明の属する技術分野】
本発明は、ネットワークを介してリアルタイム配信される動画像データストリームを生成する動画像符号化装置及び方法、並びに、当該動画像データストリームを送信する動画像送信装置に関する。
【0002】
【従来の技術】
近年、インターネット等のネットワークを利用して動画像データをリアルタイム配信するシステムが増えている。このようなリアルタイム配信システムでは、ネットワークの通信状態が時々刻々と変化することに対応するため、ネットワークの通信状態に応じて送信側で送出レートを適応的に変化させ、リアルタイム性を保障している(例えば、特許文献1参照。)。
【0003】
一般に、インターネット等のIPネットワークを利用して動画像データのリアルタイム配信を行う場合には、RFC1889/1890で標準化されているRTP(Real−Time Transport Protocol)及びRTCP(Rear−Time Transport Control Protocol)が適用される。RTPは、例えば動画像データ等の実時間データを送信装置側から受信装置側へ転送するためのデータ転送プロトコルである。RTCPは、RTPに従って転送されるデータに対する制御情報を転送するデータ転送プロトコルである。
【0004】
RTP及びRTCPを用いたリアルタイム配信を行った場合、ネットワーク上で損失されたRTPパケットの割合(パケット損失率)や受信装置側で受信したRTPパケットの遅延時間(ジッタ)等が、RTCPパケットに含められて受信装置側から送信装置側へ転送される。このため送信装置は、パケット損失率やジッタが大きくなればネットワークの転送効率が下がっていると判断し、データの送出レートを下げ、パケット損失率やジッタが小さくなればネットワークの転送効率が下がっていると判断し、データの送出レートを上げることができる。このようにRTP及びRTCPでは、ネットワークの状態に応じて送信側で送出レートを適応的に変化させ、データのリアルタイム性を保障しながら動画像データの配信をすることができる。
【0005】
【特許文献1】
特開平11−308271号公報
【特許文献2】
特開2002−199398号公報
【0006】
【発明が解決しようとする課題】
ところで、リアルタイム配信を行う場合の動画像データの符号化には、一般にMPEG(Moving Picture Coding Experts Group)−1,2,4等が用いられる。MPEG−1,2,4等の動画像符号化方式の場合、出力するデータストリームのビットレートの制御が、量子化処理時における量子化スケールを可変することで行われる。具体的には、MPEG1,2,4では、量子化スケールを大きくすることによって、出力するデータストリームのビットレートを低くし、量子化スケールを小さくすることによって、出力するデータストリームのビットレートを高くしている。
【0007】
従って、MPEG−1,2,4等の動画像符号化方式で生成されたデータストリームをネットワークを介してリアルタイム配信する場合、ネットワークの通信状態に応じて送信側で送出レートを適応的に変化させるには、符号化時における量子化スケールを制御すればよい。
【0008】
しかしながら、量子化スケールを大きくすると、それに伴いフレームの画質も劣化してしまい、映像の内容によっては最低限の画質を保障することができない場合もある。
【0009】
また、フレームレートを制御することによって画質を制御する動画像符号化装置も知られているが(例えば、特許文献2参照。)、このような動画像符号化装置では、符号化前の動画像の特徴を利用してフレームレートを制御しているので、ネットワークの状況に応じてフレームレートを制御してリアルタイム性を確保することはできない。
【0010】
本発明は、このような従来の実情に鑑みて提案されたものであり、出力する符号化データストリームのビットレートが変更されても最低限の画質を保障することが可能な、動画像符号化装置及び方法並びに動画像送信装置を提供することを目的とする。
【0011】
【課題を解決するための手段】
本発明にかかる動画像符号化装置は、時系列に並べられたフレームから構成される動画像データストリームが入力され、入力された動画像データストリームのフレームレートを制御するフレームレート制御手段と、上記動画像データストリームのフレームレートの設定値を算出するフレームレート算出手段と、上記フレームレート制御手段から出力された上記動画像データストリームを圧縮符号化し、圧縮符号化することにより生成された符号化データストリームを出力する符号化手段とを備え、上記符号化手段は、外部から設定された目標のビットレートに応じて上記符号化データストリームのビットレートを制御し、上記フレームレート算出手段は、上記符号化手段から出力される上記符号化データストリームの画質に基づきフレームレートの設定値を算出し、上記フレームレート制御手段は、動画像データストリームのフレームレートを上記フレームレート算出手段により算出された設定値に制御することを特徴とする。
【0012】
上記動画像符号化装置では、外部から設定された目標のビットレートに応じて上記符号化データストリームのビットレートを制御するとともに、動画像データストリームのフレームレートを符号化データストリームの画質に基づき算出されたフレームレートに変更する。
【0013】
本発明にかかる動画像符号化方法は、時系列に並べられたフレームから構成される動画像データストリームが入力され、入力された動画像データストリームを圧縮符号化することによって符号化データストリームを生成する画像符号化方法であって、設定された目標のビットレートに応じて出力する符号化データストリームのビットレートを制御しながら圧縮符号化を行うとともに、生成された上記符号化データストリームの画質を検出し、検出した画質に基づきフレームレートの設定値を算出し、上記動画像データストリームのフレームレートを制御することを特徴とする。
【0014】
上記動画像符号化方法では、外部から設定された目標のビットレートに応じて上記符号化データストリームのビットレートを制御するとともに、動画像データストリームのフレームレートを符号化データストリームの画質に基づき算出されたフレームレートに変更する。
【0015】
本発明に係る動画像送信装置は、時系列に並べられたフレームから構成される動画像データストリームが入力され、入力された動画像データストリームのフレームレートを制御するフレームレート制御手段と、上記動画像データストリームのフレームレートの設定値を算出するフレームレート算出手段と、上記フレームレート制御手段から出力された上記動画像データストリームを圧縮符号化し、圧縮符号化することにより生成された符号化データストリームを出力する符号化手段と、上記符号化手段により符号化された符号化データストリームをネットワークを介して受信装置に送信するとともに、当該受信装置との間で制御データの送受信を行う送受信手段とを備え、上記送受信手段は、受信装置から受信した制御データに基づきネットワークの状況を検出し、検出したネットワークの状況に基づき目標のビットレートを算出し、上記符号化手段は、上記送受信手段により算出された目標のビットレートに応じて上記符号化データストリームのビットレートを制御し、上記フレームレート算出手段は、上記符号化手段から出力される上記符号化データストリームの画質に基づきフレームレートの設定値を算出し、上記フレームレート制御手段は、動画像データストリームのフレームレートを上記フレームレート算出手段により算出された設定値に制御することを特徴とする。
【0016】
上記動画像送信装置では、ネットワークの状況に応じて決定された目標のビットレートに応じて符号化データストリームのビットレートを制御し、ビットレートが制御された当該符号化データストリームをネットワーク上に送信するとともに、動画像データストリームのフレームレートを符号化データストリームの画質に基づき算出されたフレームレートに変更する。
【0017】
【発明の実施の形態】
以下、本発明の実施の形態として、本発明が適用された動画像データのリアルタイム配信システムについて説明する。
【0018】
図1に、本発明の実施の形態の動画像データのリアルタイム配信システムの構成図を示す。
【0019】
本発明の実施の形態の動画像データのリアルタイム配信システム1は、図1に示すように、送信装置3と、受信装置4と、IPネットワーク5とから構成される。
【0020】
リアルタイム配信システム1では、例えばカメラ装置2等から出力された動画像データを、送信装置3がMPEG−4(ISO/IEC 14496−2)規格方式で圧縮符号化し、MPEG−4データストリームを生成する。送信装置3は、MPEG−4データストリームをRTPパケットに変換し、さらに、このRTPパケットをIPヘッダが付加されたUDPパケットに変換する。送信装置3によってIPパケットにパケット化された動画像データは、インターネットプロトコルが適用されたネットワークであるIPネットワーク5を介して、受信装置4に転送される。受信装置4は、送信装置3から転送されてきたIPパケットを受信して、そのIPパケットからMPEG−4データを抽出して、動画像データを復号する。
【0021】
さらに、リアルタイム配信システム1では、RTPパケットに対する制御情報がRTCPパケットにパケット化され、送信装置3と受信装置4との間でやり取りされる。RTCPパケットは、IPヘッダが付加されたTCPパケットにパケット化されて、IPネットワーク5上に配信される。
【0022】
受信装置4は、動画像データが含まれているRTPパケットのジッタやパケット損失率等を、IPネットワーク5の状況を示すパラメータとして、RTCPパケット内に含めて送信装置3に転送する。送信装置3は、受信装置4から受信したジッタやパケット損失率に基づき、現在のIPネットワーク5の通信状況を判断し、リアルタイム配信が保障されるように、MPEG−4データストリームのビットレートをコントロールしている。例えば、送信装置3は、ジッタやパケット損失率が大きくなりネットワーク5の通信状況が悪化したと判断する場合には、MPEG−4データストリームのビットレートを小さくして転送レートを下げ、ジッタやパケット損失率が小さくなりネットワーク5の通信状況が良好の場合には、MPEG−4データストリームのビットレートを大きくして転送レートを上げる、といったようにビットレートのコントロールをしている。
【0023】
このため、リアルタイム配信システム1では、IPネットワーク5の通信状況に変動があったとしても、例えばカメラ装置2等から出力される動画像データを、リアルタイムで受信装置4に転送することができる。
【0024】
つぎに、送信装置3の構成について、さらに詳細に説明をする。
【0025】
送信装置3は、カメラ装置2から送信された動画像データのフレームレートを変換するフレームレート変換部11と、フレームレート変換部11から出力された動画像データをMPEG−4方式で圧縮符号化する動画像符号化部12と、動画像符号化部12により生成されたMPEG−4データストリームをパケット化するとともにその他の制御情報をパケット化してIPネットワーク5を介して受信装置4に送信する送信部13と、受信装置4からIPネットワーク5を介して送信されてきたパケットを受信する受信部14と、動画像符号化部12により生成されるMPEG−4データストリームの目標ビットレートを算出する目標ビットレート算出部15と、フレームレート変換部11により生成される動画像データの目標フレームレートを算出するフレームレート算出部16とを備えている。
【0026】
フレームレート変換部11には、カメラ装置2からベースバンドの動画像データが入力される。カメラ装置2から出力されるベースバンドの動画像データは、図2Aに示すように、所定の画像サイズの矩形上のフレームが、所定の時間間隔で時系列に並べられたデータ構成となっている。なお、一秒間に含まれるフレームの枚数のことを、フレームレートという。フレームレート変換部11には、フレームレート算出部16から目標フレームレート(Xfps)が与えられる。フレームレート変換部11は、入力されたベースバンドの動画像データに対してフレームの間引き処理を行い、図2Bに示すように、X(fps)のベースバンドの動画像データを生成する。フレームレート変換部11により生成されたX(fps)のベースバンドの動画像データは、動画像符号化部12に供給される。また、フレームレート変換部11は、必要に応じて、MPEG−4の入力画像フォーマットに合致するように、出力するベースバンドの動画像データのフレームサイズの変換も行う。
【0027】
動画像符号化部12には、フレームレート変換部11から出力されたX(fps)のベースバンドの動画像データが入力される。動画像符号化部12は、入力されたベースバンドの動画像データをMPEG−4方式で圧縮符号化して、MPEG−4データストリームを生成する。動画像符号化部12により生成されたMPEG−4データストリームは、送信部13に供給される。また、動画像符号化部12は、目標ビットレート算出部15から目標ビットレート値b´(bit per second)が入力される。動画像符号化部12は、生成したMPEG−4データストリームのビットレートが、上記の目標ビットレート値b´となるように、量子化スケール(q_scale)を制御しながら、圧縮符号化処理を行っている。なお、動画像符号化部12の構成については詳細を後述する。
【0028】
送信部13には、動画像符号化部12から出力されたMPEG−4データストリームが入力される。送信部13は、入力されたMPEG−4データストリームをRTPパケットにパケット化し、さらに、このRTPパケットをIPヘッダが付加されたUDPパケットにパケット化する。また、送信部13は、RTPパケットの転送を制御するための制御情報をRTCPパケットにパケット化し、このRTCPパケットをIPヘッダが付加されたTCPパケットにパケット化する。送信部13は、このように生成したIPパケットを、IPネットワーク5を介して受信装置4へ送信する。
【0029】
受信部14には、受信装置4からIPネットワーク5を介して転送されてきたRTCPパケットを受信する。受信部14は、受信したRTCPパケット内に含まれている制御情報を抽出して、例えば図示しないコントローラ等に供給する。また、受信部14は、受信装置4から転送されてきたRTCPパケットに含まれているIPネットワーク5の通信状況を示す各種のパラメータを抽出して、例えば、ジッタやパケット損失率を抽出して、目標ビットレート算出部15に供給する。
【0030】
目標ビットレート算出部15には、受信部14からIPネットワーク5の通信状況を示す各種のパラメータが入力される。例えば、ジッタやパケット損失率が入力される。目標ビットレート算出部15は、入力された各種のパラメータに基づき現時点のIPネットワーク5の通信状況を推定し、動画像符号化部12により生成されるMPEG−4データストリームの現時点における最適なビットレートを算出する。つまり、目標ビットレート算出部15は、ネットワーク5の通信状況が悪化した場合には、MPEG−4データストリームのビットレートを小さくして転送レートを低くし、ネットワーク5の通信状況が良好となった場合には、MPEG−4データストリームのビットレートを大きくして転送レートを高くする、といったように目標ビットレートをコントロールし、リアルタイム配信を保障する動作を行う。
【0031】
例えば、目標ビットレート算出部15は、パケット損失率をr、現時点のMPEG−4データストリームのビットレートbとしたとき、目標ビットレートb´を以下の式(1)のように算出する。
b´=b×(1−r) …(1)
この式(1)は、受信装置5が受信できなかったパケットがある場合には、そのパケットの損失割合分だけビットレートを補正するということを意味している。なお、パケット損失率rが0の場合や、パケット損失率rがある一定値以下の場合には、転送できるデータレートに余裕があるとみなして、目標ビットレートb´を上昇させるようにしてもよい。
【0032】
なお、目標ビットレートの算出方法は、IPネットワーク5の通信状況に応じた最適なビットレートを算出することができれば、上記の式(1)で示す方法に限らずどのような方法であってもよい。
【0033】
フレームレート算出部16は、圧縮符号化を行うことによって生じる画質の劣化度を示すパラメータを、動画像符号化部12から取得する。ここでは、画質の劣化度を示すパラメータとして、例えば、量子化処理時に用いられる量子化スケール(q_scale)を、動画像符号化部12から取得する。フレームレート算出部16は、取得した画質の劣化度に基づき、フレームレート変換部11に与える目標フレームレート値(X)を算出する。
【0034】
具体的には、フレームレート算出部16は、圧縮符号化後の画質の劣化度が第1のしきい値以上、つまり、量子化スケールが第1のしきい値以上となる場合には、目標フレームレートを下げ、動画像符号化部12に供給する動画像データのフレームレートを下げる。このように画質の劣化度が第1のしきい値以上となる場合に、フレームレートを下げることによって、各フレームの画質が向上する。つまり、フレームレートを下げる前と下げた後とでビットレートが変わらないのであれば、1枚のフレームあたりに割り当てられるビット量が増加するため、フレームの画質が向上することとなる。また、フレームレート算出部16は、圧縮符号化後の画質の劣化度が第2のしきい値以下、つまり、量子化スケールが第2のしきい値以下となる場合には、目標フレームレートを上げ、動画像符号化部12に供給する動画像データのフレームレートを上げる。ここで、第2のしきい値は、第1のしきい値よりも小さい値である。このように画質の劣化度が第2のしきい値以下となる場合に、フレームレートを下げることによって、各フレームの画質は低下する。つまり、フレームレートを上げる前と上げた後とでビットレートが変わらないのであれば、1枚あたりに割り当てられるビットレート量が減少するため、フレームの画質が低下することとなる。しかしながら、第2のしきい値の設定を充分に小さい値とすることによって、ある一定以上の画質が確保することができる。従って、充分な画質を確保した状態でフレームレートを上げるので、画質の品質を保持しながら画像の連続性を向上させることができる。
【0035】
なお、フレームレート算出部16による目標フレームレートの具体的な算出処理については詳細を後述する。
【0036】
つぎに、動画像符号化部12について、図3を参照して詳細に説明をする。
【0037】
動画像符号化部12は、図3に示すように、入力バッファ21と、動き予測回路22と、第1の加算回路23と、離散コサイン変換(DCT)回路24と、量子化回路25と、逆量子化回路26と、逆離散コサイン変換(IDCT)回路27と、第2の加算回路28と、フレームメモリ29と、動き補償回路30と、可変長符号化回路31と、出力バッファ32と、レート制御回路33とを備えている。
【0038】
入力バッファ21には、フレームレート変換部11から入力されたX(fps)の空間領域の動画像データが入力され、この動画像データを一時的に保存する。
【0039】
動き予測回路22は、入力バッファ21に格納されている動画像データから時間方向の動き量を算出して、その動き量に基づき動きベクトルを生成する。動きベクトルは、16×16画素から構成されるマクロブロック毎に算出される。動き予測回路22により算出された動きベクトルは、動き補償回路30及び可変長符号化回路31に供給される。
【0040】
第1の加算回路23には、入力バッファ21から動画像データがフレーム単位で入力される。また、第1の加算回路23には、符号化対象となる画像データに対して、フレーム間の相関を利用した符号化処理を行う場合には、つまり、Pピクチャ又はBピクチャの符号化をする場合には、動き補償回路30から予測画像データも入力される。第1の加算回路23は、インターマクロブロックに対して処理を行う場合には、入力された画像データから予測画像データを減算する。第1の加算回路23は、イントラマクロブロックに対して処理を行う場合には、入力された画像データをそのまま出力する。
【0041】
DCT回路24は、第1の加算回路23から出力された画像データに対して離散コサイン変換を行い、周波数領域の画像データであるDCT係数データを生成する。DCT回路24は、生成したDCT係数データを量子化回路25に出力する。
【0042】
量子化回路25は、入力されたDCT係数データに対して、レート制御回路33から与えられる量子化スケールを用いて、量子化処理を行い、量子化データを出力する。
【0043】
逆量子化回路26には、量子化回路25から出力された量子化データのうち、参照画像データとなり得るフレームのデータ(Iピクチャ及びPピクチャのDCT係数データ)が入力される。逆量子化回路26は、入力された量子化データに対して、その量子化データを量子化した際に用いられた量子化スケールにより、逆量子化処理を行う。
【0044】
IDCT回路27は、逆量子化回路26から出力されたDCT係数データに対して、逆離散コサイン変換を行い、空間領域の画像データを生成する。
【0045】
第2の加算回路28には、IDCT回路27から出力された画像データが入力される。また、第2の加算回路28には、入力された画像データがPピクチャである場合には、その画像データの予測画像データが動き補償回路30から入力される。第2の加算回路28は、インターマクロブロックに対して処理を行う場合には、入力された画像データに対して予測画像データを加算する。第2の加算回路28は、イントラマクロブロックに対して処理を行う場合には、入力された画像データをそのまま出力する。第2の加算回路28は、出力した画像データを参照画像データとしてフレーム単位でフレームメモリ29に格納する。
【0046】
フレームメモリ29は、第2の加算回路28から出力される参照画像データを格納する。
【0047】
動き補償回路30は、フレームメモリ29に格納された参照画像データに対して動きベクトルを参照して動き補償を行い、予測画像データを生成する。予測画像データは、第1の加算回路23に供給される。予測画像データのうち、参照画像となる画像データ(Pピクチャの予測画像データ)は、第2の加算回路28にも供給される。
【0048】
可変長符号化回路31は、量子化回路25から出力された量子化データ、動き予測回路22から出力された動きベクトル、並びに、図示しないコントローラ等から供給される各種の制御データ等に対して可変長符号化又は固定長符号化を行い、MPEG−4の規格に準拠した符号化ストリーム(MPEG−4データストリーム)を生成する。可変長符号化回路31は、生成したMPEG−4データストリームを出力バッファ32に格納する。
【0049】
出力バッファ32は、MPEG−4データストリームを一時的に格納し、後段の送信部13からの読み出し命令に従い、必要量のデータずつ当該送信部13へ転送する。
【0050】
レート制御回路33には、目標ビットレート算出部15から目標ビットレート値b´が入力される。レート制御回路33は、出力バッファ32を参照して、現時点におけるMPEG−4データストリームのビットレート値bを求める。レート制御回路33は、目標ビットレート値b´と現在のビットレート値bとの差を検出し、出力されるMPEG−4データストリームのビットレートが、目標ビットレート値b´に一致するように、量子化スケール(q_scale)を可変制御する。つまり、レート制御回路33は、目標ビットレート値b´よりも現在のビットレート値bが大きければ、量子化スケールを小さくするように制御し、目標ビットレート値b´よりも現在のビットレート値bが小さければ、量子化スケールを大きくするように制御する。
【0051】
以上のように動画像符号化部12では、入力された動画像データをMPEG−4方式で圧縮符号化して、MPEG−4データストリームを生成することができる。さらに、この動画像符号化部12では、IPネットワーク5の通信状況に応じて変化する目標ビットレート値b´に追従させて、出力するMPEG−4データストリームのビットレートを変化させることができる。
【0052】
また、さらに、この動画像符号化部12では、レート制御回路33から出力される量子化スケール(q_scale)を、画質劣化度として、フレームレート算出部16へ供給している。
【0053】
つぎに、フレームレート算出部16によるフレームレートの具体的な算出処理について説明する。
【0054】
なお、ここでは、カメラ装置2から出力される動画像データのフレームレートが、30(fps)であるものとする。また、動画像符号化部12は、MPEG−4のシンプルプロファイル、レベル3に対応したエンコーダであるものとし、これに合わせてフレームレート変換部11から出力される動画像データの最大フレームレートは、15(fps)であるものとする。
【0055】
また、フレームレート算出部16は、図4に示すように、フレームレート変換部11に対して設定する目標フレームレートXの値の集合が記述されたテーブルを保持している。例えば、このテーブルには、15(fps)、10(fps)、7.5(fps)、5(fps)、3(fps)、2(fps)、1(fps)、0.5(fps)・・・といった目標フレームレートが記述されている。さらに、テーブル内の各目標フレームレートには、それぞれユニークなインデックスiが付けられている。インデックスiは、テーブル内の目標フレームレートを降順に並べたときに、“1”から1ずつインクリメントされていくように付けられている。例えば、本例であれば、15(fps)にはインデックス“1”が付けられ、10(fps)にはインデックス“2”が付けられ、7.5(fps)にはインデックス“3”が付けられている。また、上記テーブルに保持している目標フレームレートの集合は、カメラ装置2から出力される動画像データのフレームを2枚に1回抽出して新たな動画像データを生成した場合(15fps)、3枚に1回抽出した場合(10fps)、4枚に1回抽出した場合(7.5fps)といったように、元の動画像データのフレームから規則的に1枚のフレームを抽出することにより、変換後の動画像データを生成することが前提として作成されている。しかしながら、フレームレートの変換の方法は、どのような方法であってもよく、例えば、規則的にフレームを抽出するのではなく、特徴があるフレームを抽出するようにしてもよい。その場合、テーブルに保持するフレームレートの集合は、その抽出方法に特化した値となる。
【0056】
また、上記テーブルには、5枚に1回抽出した場合の目標フレームレート(6fps)が存在しないが、これは、6枚に1回抽出した場合の目標フレームレート(7.5fps)と近い値なので、メモリの効率利用を図るためや変化量を一定化させるためである。
【0057】
図5に、フレームレート算出部16によるフレームレートの算出フローを示し、この算出フローを参照してフレームレートの算出処理について説明する。
【0058】
まず、フレームレート算出部16は、インデックスiを適当な値に初期化する(ステップS1)。続いて、フレームレート算出部16は、インデックスiに対応した目標フレームレートXを、図4に示したテーブルを参照して取得し、取得した目標フレームレートをフレームレート変換部11に転送する。フレームレート変換部11は、転送されてきた目標フレームレートXを取得して内部に設定し、カメラ装置2から入力された動画像データのフレームレートを、転送されてきた目標フレームレートXに変換する。
【0059】
続いて、フレームレート算出部16は、1フレーム分の符号化処理が完了するまで処理を待機する(ステップS3)。続いて、フレームレート算出部16は、動画像符号化部12から量子化スケールを読み込む(ステップS4)。なお、量子化スケールは、マクロブロック毎に異なっている。そのため、動画像符号化部12から読み込む量子化スケールは、1フレーム内の平均の量子化スケールであることが望ましい。しかしながら、演算量を減少させるために、フレームの最初のマクロブロックの量子化スケールであるvop_quantを読み込むようにしてもよい。
【0060】
続いて、フレームレート算出部16は、読み込んだ量子化スケールと、第1のしきい値(Th1)との大小比較を行う(ステップS5)。第1のしきい値(Th1)は、画質の劣化度の上限の基準値を示す値である。つまり、量子化スケールが大きくなれば大きくなるほど画質は劣化するが、第1のしきい値は、これ以上の値の量子化スケール(q_scale)での量子化を制限し、画質の劣化度の上限を設定している。MPEG−4の場合、量子化スケールは、1から31までの値をとるが、第1のしきい値(Th1)は、例えば、“20”といった値に設定される。
【0061】
フレームレート算出部16は、読み込んだ量子化スケールが第1のしきい値(Th1)以上である場合には、つまり、一定の基準値以上、画質が劣化している場合には、インデックスiを1つインクリメントする(ステップS6)。すなわち、目標フレームレートを1ステップ分、減少させる。このように目標フレームレートを減少させると、もしビットレートに変更がなければ、1フレームに割り当てられるビット量が増加する。そのため、画質が向上することとなる。
【0062】
フレームレート算出部16は、第1のしきい値(Th1)よりも読み込んだ量子化スケール(q_scale)の方が小さい場合には、つまり、一定の基準値より、画質が劣化していない場合には、読み込んだ量子化スケールと、第2のしきい値(Th2)との大小比較を行う(ステップS7)。第2のしきい値(Th2)は、第1のしきい値(Th1)よりも、低い値に設定されている。第2のしきい値(Th2)は、画質の劣化度の下限の基準値を示す値である。つまり、充分に良い画質であると判断し、画質よりは画像の連続性を良くするための基準値である。MPEG−4の場合、量子化スケールは、1から31までの値をとるが、第2のしきい値(Th2)は、例えば、“10”といった値に設定される。
【0063】
フレームレート算出部16は、読み込んだ量子化スケールが第2のしきい値(Th2)以下である場合には、つまり、一定の基準値よりも画質が良好である場合には、インデックスiを1つデクリメントする(ステップS6)。すなわち、フレームレートを1ステップ分、増加させる。このようにフレームレートを増加させると、もしビットレートに変更がなければ、1フレームに割り当てられるビット量が減少する。そのため、画質が劣化することになるが、画像の連続性は向上する。
【0064】
ステップS6及びステップS7で、インデックスiを更新すると、続いて、フレームレート算出部16は、インデックスiに対応した目標フレームレート値Xを、図4に示したテーブルを参照して取得し、取得した目標フレームレート値Xをフレームレート変換部11に転送し、フレームレート変換部11に設定されているフレームレートを更新する(ステップS9)。フレームレート変換部11は、カメラ装置2から入力された動画像データのフレームレートを、転送されてきた目標フレームレート値Xに変換する。
【0065】
フレームレート算出部16は、ステップS7での判断の結果、第2のしきい値(Th2)よりも読み込んだ量子化スケール(q_scale)の方が大きい場合、並びに、ステップS9でのフレームレートの転送を終了すると、ステップS3に戻り、ステップS3から1フレーム毎に処理を繰り返して行う。
【0066】
以上のようなフレームレートの制御処理を行った場合の送信装置3の具体的な処理動作例を図6に示す。
【0067】
図6Aは、送信装置3に入力される動画像データを示している。図6Bは、目標ビットレート算出部15により設定される目標ビットレート値b´を示している。図6Cは、フレームレート算出部16が検出する量子化スケールを示している。図6Dは、フレームレート算出部16から出力される目標フレームレートXを示している。図6Eは、フレームレート変換部11によりフレームレートが変換された後の動画像データを示している。
【0068】
図6に示すように、例えば、ある任意の時刻t1までは、IPネットワーク5の通信状態が良好であり、ある任意の目標ビットレートb1でMPEG−4データストリームが生成されており、フレームレートは、15fpsであった。
【0069】
ここで、任意の時刻t1でIPネットワーク5の通信状態が悪化したと判断されたとする。すると、目標ビットレート算出部15は、目標ビットレートを低下させ、b2(b2<b1)とする。目標ビットレートが下げられたことにともない、時刻t1の直後に符号化されるフレームの量子化スケールは増加する。このとき、量子化スケールが、第1のしきい値Th1以上となると、フレームレート算出部16が、次のフレームからフレームレートの変更指示を行う。この結果、フレームレートが1ステップ分減少され、10fpsとされる。
【0070】
以上のように本発明の実施の形態の動画像データのリアルタイム配信システムでは、IPネットワーク5の状況に応じて決定された目標のビットレートに応じてMPEG−4データストリームのビットレートを制御し、ビットレートが制御されたMPEG−4データストリームをIPネットワーク5に送信している。
【0071】
それとともに、本発明の実施の形態の動画像データのリアルタイム配信システムでは、MPEG−4データストリームで符号化された動画像データの画質の劣化度に応じて、圧縮符号化する動画像データのフレームレートに変更している。具体的には、動画像符号化部12により生成されたMPEG−4データストリームの画質の劣化度が第1のしきい値(Th1)より大きくなった場合には、フレームレートの設定値を、現在の値よりも低い値に変更する。このことにより、IPネットワーク5の通信状態が悪化したとしても、一定以上画質を劣化させずに、動画像データをリアルタイム配信することができる。また、動画像符号化部12により生成されたMPEG−4データストリームの画質の劣化度が第2のしきい値(Th2)より小さくなった場合には、フレームレートの設定値を、現在の値よりも高いに変更する。このことにより、IPネットワーク5の通信状態が良好となり、充分な画質が得られる場合には、画像の連続性を向上させた動画像データのリアルタイム配信をすることができる。
【0072】
ところで、以上の例では、MPEG−4のデータストリームの画質の劣化度を判断するパラメータとして量子化スケールを検出していたが、画質の劣化度として、例えば、MPEG−4データストリームに符号化された後の動画像データのS/N比(シグナル/ノイズ比)を用いてもよい。
【0073】
つまり、符号化を行った後のフレームのS/N比が設定された第1のしきい値以下になれば、画質の劣化が基準を超えたと判断してフレームレートを下げ、逆に別に設定された第2のしきい値(第1のしきい値よりも高い値)以上になれば画質は十分良いと判断しフレームレートを上げる。ただし、S/N比と主観的な画質との関係は、入力される画像の特徴などにより必ずしも一致するとは限らないので、画像特徴を表すパラメータ、例えばアクティビティなどを用いてS/N比を補正するのが望ましい。すなわち、主観的に同じような画質劣化の画像であっても、アクティビティの低い(平坦な部分の多い)画像では、S/N比が高く、逆にアクティビティの高い(複雑な部分の多い)画像ではS/N比が低くなる傾向にある。従って、アクティビティの低い画像では得られたS/N比を低く、アクティビティの高い画像では得られたS/N比を高く補正するのが望ましい。
【0074】
また、画質の劣化度をS/N比により判断をする場合、例えば、図7に示すように、動画像符号化部12に、S/N比算出回路40を設ければよい。
【0075】
S/N比算出回路40は、次のようにS/N比を求める。
【0076】
まず、S/N比算出回路40は、入力バッファ21に格納されている入力画像の画素値(f(i,j))と、フレームメモリ29に格納されている符号化された後の復号画像の画素値(g(i,j))とに基づき、下記式(2)に示すように誤差dを求める。なお、iはフレーム内における水平方向の画素位置であり、jはフレーム内における垂直方向の画素位置である。
【0077】
【数1】
【0078】
続いて、S/N比算出回路40は、得られた誤差dから、S/N比は次の式(3)のように求められる。
【0079】
【数2】
【0080】
また、誤差dの算出方法は、式(2)で示すような2乗和の他に、次の式(4)に示すような絶対値和を用いることもできる。
【0081】
【数3】
【0082】
絶対値和を用いた場合、S/N比は、次の式(5)のように求められる。
【0083】
【数4】
【0084】
なお、誤差dからS/N比を算出するには、対数計算が必要になり、演算量が増加してしまう。誤差dに対してS/N比は単純減少する関数であるので、S/N比を出力するのではなく、誤差dを出力するようにしてもよい。
【0085】
【発明の効果】
本発明にかかる動画像符号化装置及び方法では、外部から設定された目標のビットレートに応じて符号化データストリームのビットレートを制御しながら符号化データストリームを出力するとともに、動画像データストリームのフレームレートを符号化データストリームの画質に基づき算出されたフレームレートに変更する。
【0086】
このことにより、本発明にかかる動画像符号化装置及び方法では、出力する符号化データストリームのビットレートが変更されても、最低限の画質を保障した動画像の符号化を行うことができる。
【0087】
本発明にかかる動画像送信装置では、ネットワークの状況に応じて決定された目標のビットレートに応じて符号化データストリームのビットレートを制御し、ビットレートが制御された当該符号化データストリームをネットワーク上に送信するとともに、動画像データストリームのフレームレートを符号化データストリームの画質に基づき算出されたフレームレートに変更する。
【0088】
このことにより、本発明にかかる動画像送信装置では、出力する符号化データストリームのビットレートが変更されても、最低限の画質を保障した動画像の符号化を行うことができる。
【図面の簡単な説明】
【図1】本発明の実施の形態の動画像データのリアルタイム配信システムの構成図である。
【図2】ベースバンドの動画像データのデータ構成、並びに、フレームレートが変換された後の動画像データのデータ構成を示す図である。
【図3】送信装置内の動画像符号化部のブロック図である。
【図4】目標フレームレートが記述されたテーブルを示す図である。
【図5】フレームレートを算出する処理の流れを示したフローチャートである。
【図6】フレームレートの制御処理を行った場合の送信装置の具体的な処理動作例を示す図である。
【図7】S/N比算出回路が設けられた動画像符号化部のブロック図である。
【符号の説明】
1 リアルタイム配信システム、2 カメラ装置、3 送信装置、4 受信装置、5 IPネットワーク、11 フレームレート変換部、12 動画像符号化部、13 送信部
14 受信部、15 ビットレート算出部、16 フレームレート算出部[0001]
TECHNICAL FIELD OF THE INVENTION
The present invention relates to a moving picture encoding apparatus and method for generating a moving picture data stream distributed in real time via a network, and a moving picture transmitting apparatus for transmitting the moving picture data stream.
[0002]
[Prior art]
In recent years, systems for real-time distribution of moving image data using a network such as the Internet have increased. In such a real-time distribution system, the transmission rate is adaptively changed on the transmission side in accordance with the network communication state in order to cope with the ever-changing network communication state, and real-time performance is guaranteed. (For example, refer to Patent Document 1).
[0003]
Generally, when real-time distribution of moving image data is performed using an IP network such as the Internet, RTP (Real-Time Transport Protocol) and RTCP (Real-Time Transport Control Protocol) standardized by RFC1889 / 1890 are used. Applied. RTP is a data transfer protocol for transferring real-time data such as moving image data from the transmitting device to the receiving device. RTCP is a data transfer protocol for transferring control information for data transferred according to RTP.
[0004]
When real-time distribution using RTP and RTCP is performed, the rate of RTP packets lost on the network (packet loss rate) and the delay time (jitter) of RTP packets received on the receiving device side are included in the RTCP packets. The data is transferred from the receiving device to the transmitting device. For this reason, the transmitting device determines that the network transfer efficiency is reduced if the packet loss rate or jitter increases, and reduces the data transmission rate, and if the packet loss rate or jitter decreases, the network transfer efficiency decreases. It is possible to increase the data transmission rate. As described above, in RTP and RTCP, the transmission rate is adaptively changed on the transmission side according to the state of the network, so that the moving image data can be distributed while real-time data is guaranteed.
[0005]
[Patent Document 1]
JP-A-11-308271
[Patent Document 2]
JP 2002-199398 A
[0006]
[Problems to be solved by the invention]
By the way, MPEG (Moving Picture Coding Experts Group) -1, 2, 4, etc. is generally used for encoding of moving image data in the case of performing real-time distribution. In the case of a moving picture coding method such as MPEG-1, 2, 4, or the like, the bit rate of the output data stream is controlled by changing the quantization scale at the time of the quantization processing. Specifically, in
[0007]
Therefore, when a data stream generated by a moving picture coding system such as MPEG-1, 2, 4, or the like is distributed in real time via a network, the transmission side adaptively changes the transmission rate according to the communication state of the network. , The quantization scale at the time of encoding may be controlled.
[0008]
However, when the quantization scale is increased, the image quality of the frame is also deteriorated in accordance with the increase of the quantization scale, and the minimum image quality may not be guaranteed depending on the content of the image.
[0009]
Also, a moving image encoding device that controls image quality by controlling a frame rate is known (for example, refer to Patent Literature 2). Since the frame rate is controlled using the feature of (1), it is not possible to control the frame rate according to the situation of the network to secure the real-time property.
[0010]
The present invention has been proposed in view of such a conventional situation, and is capable of guaranteeing a minimum image quality even if the bit rate of an output encoded data stream is changed. It is an object to provide an apparatus and a method, and a moving image transmitting apparatus.
[0011]
[Means for Solving the Problems]
The video encoding apparatus according to the present invention is configured such that a video data stream composed of frames arranged in time series is input, and a frame rate control unit that controls a frame rate of the input video data stream; Frame rate calculating means for calculating a set value of a frame rate of a moving image data stream, and encoded data generated by compression-encoding the moving image data stream output from the frame rate controlling means and compression-encoding Encoding means for outputting a stream, wherein the encoding means controls a bit rate of the encoded data stream according to a target bit rate set from the outside, and wherein the frame rate calculating means comprises: Frame rate based on the image quality of the encoded data stream output from the encoding means. Calculating the door settings, the frame rate control means, the frame rate of the moving picture data stream and controlling the set value calculated by the frame rate calculating means.
[0012]
The moving picture coding apparatus controls the bit rate of the coded data stream according to a target bit rate set from the outside, and calculates the frame rate of the moving picture data stream based on the image quality of the coded data stream. To the specified frame rate.
[0013]
In the moving picture coding method according to the present invention, a moving picture data stream composed of frames arranged in time series is input, and a coded data stream is generated by compression coding the inputted moving picture data stream. An image encoding method that performs compression encoding while controlling the bit rate of an encoded data stream to be output according to a set target bit rate, and reduces the image quality of the generated encoded data stream. It is characterized by detecting, calculating a frame rate set value based on the detected image quality, and controlling the frame rate of the moving image data stream.
[0014]
In the moving picture coding method, the bit rate of the coded data stream is controlled according to a target bit rate set from the outside, and the frame rate of the moving picture data stream is calculated based on the image quality of the coded data stream. To the specified frame rate.
[0015]
A moving image transmitting apparatus according to the present invention is configured such that a moving image data stream composed of frames arranged in time series is input, and a frame rate control unit that controls a frame rate of the input moving image data stream; Frame rate calculating means for calculating a set value of a frame rate of the image data stream; and an encoded data stream generated by compression-encoding the moving image data stream output from the frame rate control means and compression-encoding. And transmitting and receiving means for transmitting the encoded data stream encoded by the encoding means to the receiving device via a network, and transmitting and receiving control data to and from the receiving device. The transmitting and receiving means includes a network based on the control data received from the receiving device. And a target bit rate calculated on the basis of the detected network condition. The encoding means determines a bit rate of the encoded data stream according to the target bit rate calculated by the transmission / reception means. Controlling the frame rate, the frame rate calculation means calculates a frame rate setting value based on the image quality of the encoded data stream output from the encoding means, and the frame rate control means The frame rate is controlled to the set value calculated by the frame rate calculation means.
[0016]
In the moving image transmitting apparatus, the bit rate of the coded data stream is controlled according to a target bit rate determined according to a network condition, and the coded data stream having the controlled bit rate is transmitted over the network. At the same time, the frame rate of the moving image data stream is changed to a frame rate calculated based on the image quality of the encoded data stream.
[0017]
BEST MODE FOR CARRYING OUT THE INVENTION
Hereinafter, a real-time distribution system of moving image data to which the present invention is applied will be described as an embodiment of the present invention.
[0018]
FIG. 1 shows a configuration diagram of a moving image data real-time distribution system according to an embodiment of the present invention.
[0019]
As shown in FIG. 1, a moving image data real-
[0020]
In the real-
[0021]
Further, in the real-
[0022]
The receiving
[0023]
For this reason, in the real-
[0024]
Next, the configuration of the
[0025]
The transmitting
[0026]
Baseband moving image data is input from the
[0027]
The moving
[0028]
The MPEG-4 data stream output from the
[0029]
The receiving
[0030]
Various parameters indicating the communication status of the
[0031]
For example, the target bit
b ′ = b × (1-r) (1)
This equation (1) means that, when there is a packet that cannot be received by the receiving
[0032]
The method of calculating the target bit rate is not limited to the method represented by the above equation (1) as long as the optimum bit rate according to the communication state of the
[0033]
The frame
[0034]
Specifically, the frame
[0035]
The specific calculation processing of the target frame rate by the frame
[0036]
Next, the
[0037]
As shown in FIG. 3, the
[0038]
The
[0039]
The
[0040]
Moving image data is input to the
[0041]
The
[0042]
The
[0043]
To the
[0044]
The
[0045]
The image data output from the
[0046]
The
[0047]
The
[0048]
The variable-
[0049]
The
[0050]
The target bit rate value b ′ is input from the target
[0051]
As described above, the moving
[0052]
Further, in the moving
[0053]
Next, a specific process of calculating the frame rate by the frame
[0054]
Here, it is assumed that the frame rate of the moving image data output from the
[0055]
Further, as shown in FIG. 4, the frame
[0056]
In the above table, there is no target frame rate (6 fps) when the image is extracted once every five images, but this value is close to the target frame rate when the image is extracted once every six images (7.5 fps). Therefore, this is to make efficient use of the memory and to make the amount of change constant.
[0057]
FIG. 5 shows a flow of calculating the frame rate by the frame
[0058]
First, the frame
[0059]
Subsequently, the frame
[0060]
Subsequently, the frame
[0061]
When the read quantization scale is equal to or more than the first threshold value (Th1), that is, when the image quality is degraded beyond a certain reference value, the frame
[0062]
The frame
[0063]
When the read quantization scale is equal to or smaller than the second threshold value (Th2), that is, when the image quality is better than a certain reference value, the frame
[0064]
After updating the index i in steps S6 and S7, subsequently, the frame
[0065]
As a result of the determination in step S7, the frame
[0066]
FIG. 6 shows a specific processing operation example of the
[0067]
FIG. 6A shows moving image data input to the
[0068]
As shown in FIG. 6, for example, until a certain time t1, the communication state of the
[0069]
Here, it is assumed that it is determined that the communication state of the
[0070]
As described above, in the moving image data real-time distribution system according to the embodiment of the present invention, the bit rate of the MPEG-4 data stream is controlled according to the target bit rate determined according to the status of the
[0071]
In addition, in the moving image data real-time distribution system according to the embodiment of the present invention, the frame of the moving image data to be compression-encoded according to the deterioration degree of the image quality of the moving image data encoded by the MPEG-4 data stream. The rate has changed. Specifically, when the degree of deterioration of the image quality of the MPEG-4 data stream generated by the moving
[0072]
By the way, in the above example, the quantization scale is detected as a parameter for determining the degree of deterioration of the image quality of the MPEG-4 data stream. The S / N ratio (signal / noise ratio) of the moving image data may be used.
[0073]
That is, if the S / N ratio of the frame after the encoding becomes equal to or less than the set first threshold value, it is determined that the image quality has exceeded the standard, and the frame rate is lowered. If the value exceeds the second threshold value (a value higher than the first threshold value), the image quality is determined to be sufficiently good, and the frame rate is increased. However, since the relationship between the S / N ratio and the subjective image quality does not always match due to the characteristics of the input image, the S / N ratio is corrected using a parameter representing the image characteristics, for example, activity. It is desirable to do. That is, even if the images are subjectively similar in image quality, an image with low activity (many flat portions) has a high S / N ratio and an image with high activity (many complex portions). In this case, the S / N ratio tends to decrease. Therefore, it is desirable to correct the obtained S / N ratio for an image with low activity and to increase the obtained S / N ratio for an image with high activity.
[0074]
When the degree of image quality deterioration is determined based on the S / N ratio, for example, as shown in FIG. 7, the S / N
[0075]
The S / N
[0076]
First, the S / N
[0077]
(Equation 1)
[0078]
Subsequently, the S / N
[0079]
(Equation 2)
[0080]
As a method of calculating the error d, a sum of absolute values as shown in the following equation (4) can be used in addition to the sum of squares as shown in equation (2).
[0081]
[Equation 3]
[0082]
When the sum of absolute values is used, the S / N ratio is obtained as in the following equation (5).
[0083]
(Equation 4)
[0084]
Note that calculating the S / N ratio from the error d requires logarithmic calculation, which increases the amount of calculation. Since the S / N ratio is a function that simply decreases with respect to the error d, the error d may be output instead of outputting the S / N ratio.
[0085]
【The invention's effect】
In the moving picture coding apparatus and method according to the present invention, the coded data stream is output while controlling the bit rate of the coded data stream according to a target bit rate set from the outside, and the moving picture data stream is The frame rate is changed to a frame rate calculated based on the image quality of the encoded data stream.
[0086]
Thus, the moving picture coding apparatus and method according to the present invention can perform coding of a moving picture with minimum image quality guaranteed even if the bit rate of the output coded data stream is changed.
[0087]
In the moving picture transmitting apparatus according to the present invention, the bit rate of the coded data stream is controlled according to a target bit rate determined according to a network condition, and the coded data stream having the controlled bit rate is transmitted to the network. In addition to the above transmission, the frame rate of the moving image data stream is changed to the frame rate calculated based on the image quality of the encoded data stream.
[0088]
As a result, the moving picture transmitting apparatus according to the present invention can perform moving picture coding with guaranteed minimum image quality even if the bit rate of the output coded data stream is changed.
[Brief description of the drawings]
FIG. 1 is a configuration diagram of a moving image data real-time distribution system according to an embodiment of the present invention.
FIG. 2 is a diagram showing a data structure of moving image data of a base band and a data structure of moving image data after a frame rate is converted.
FIG. 3 is a block diagram of a moving image encoding unit in the transmission device.
FIG. 4 is a diagram showing a table in which a target frame rate is described.
FIG. 5 is a flowchart illustrating a flow of a process of calculating a frame rate.
FIG. 6 is a diagram illustrating a specific processing operation example of a transmission device when a control process of a frame rate is performed.
FIG. 7 is a block diagram of a video encoding unit provided with an S / N ratio calculation circuit.
[Explanation of symbols]
REFERENCE SIGNS
14 receiver, 15 bit rate calculator, 16 frame rate calculator
Claims (9)
上記動画像データストリームのフレームレートの設定値を算出するフレームレート算出手段と、
上記フレームレート制御手段から出力された上記動画像データストリームを圧縮符号化し、圧縮符号化することにより生成された符号化データストリームを出力する符号化手段とを備え、
上記符号化手段は、外部から設定された目標のビットレートに応じて上記符号化データストリームのビットレートを制御し、
上記フレームレート算出手段は、上記符号化手段から出力される上記符号化データストリームの画質に基づきフレームレートの設定値を算出し、
上記フレームレート制御手段は、動画像データストリームのフレームレートを上記フレームレート算出手段により算出された設定値に制御すること
を特徴とする動画像符号化装置。A moving image data stream composed of frames arranged in time series is input, and frame rate control means for controlling a frame rate of the input moving image data stream,
Frame rate calculating means for calculating a set value of a frame rate of the moving image data stream,
Encoding means for compression-encoding the moving image data stream output from the frame rate control means, and outputting an encoded data stream generated by compression-encoding,
The encoding means controls a bit rate of the encoded data stream according to a target bit rate set from outside,
The frame rate calculation unit calculates a frame rate set value based on the image quality of the encoded data stream output from the encoding unit,
The moving picture coding apparatus, wherein the frame rate control means controls a frame rate of the moving picture data stream to a set value calculated by the frame rate calculating means.
を特徴とする請求項1記載の動画像符号化装置。The frame rate calculation unit, when the degree of deterioration of the image quality of the encoded data stream encoded by the encoding unit is equal to or more than a predetermined value, the frame rate set value is lower than the current value 2. The moving picture coding apparatus according to claim 1, wherein the moving picture coding value is changed to a value.
を特徴とする請求項1記載の動画像符号化装置。The frame rate calculation unit sets the frame rate set value to be higher than the current value when the degree of image quality deterioration of the encoded data stream encoded by the encoding unit is equal to or less than a predetermined value. 2. The moving picture coding apparatus according to claim 1, wherein the moving picture coding value is changed to a value.
を特徴とする請求項1記載の動画像符号化装置。The frame rate calculating means, when the degree of image quality deterioration of the coded data stream coded by the coding means is equal to or greater than a first threshold value, sets the frame rate set value to a current value. Is changed to a lower value, and when the degree of deterioration of the image quality falls below a second threshold value lower than the first threshold value, the set value of the frame rate is set to a value higher than the current value. 2. The moving picture coding apparatus according to claim 1, wherein the moving picture coding is changed.
上記フレームレート算出手段は、上記符号化手段から出力される符号化データストリームの画質を、上記量子化スケール値に基づき判断すること
を特徴とする請求項1記載の動画像符号化装置。The encoding means performs compression encoding on the moving image data stream by quantizing data based on a quantization scale value,
2. The moving picture coding apparatus according to claim 1, wherein said frame rate calculating means determines the image quality of the coded data stream output from said coding means based on said quantization scale value.
上記フレームレート算出手段は、上記符号化手段から出力される符号化データストリームの画質を、上記S/N比に基づき判断すること
を特徴とする請求項1記載の動画像符号化装置。An S / N (signal / noise) ratio of the encoded data stream is calculated based on the pixel values of the moving image data stream before encoding and the pixel values of the moving image data stream after decoding the encoded data stream. / N ratio calculation means,
2. The moving picture coding apparatus according to claim 1, wherein said frame rate calculating means determines the image quality of the coded data stream output from said coding means based on said S / N ratio.
上記動画像データストリームの画素データを所定の画素ブロック単位で直交変換して、周波数領域の画素データから構成される動画像データストリームを生成する直交変換手段と、
上記直交変換手段から出力された周波数領域の画素データから構成される動画像データストリームを、上記所定の画素ブロック毎に設定した量子化スケールに基づき量子化する量子化手段と、
上記量子化手段により量子化された動画像データストリームを所定の符号化方式に対応した符号化データストリームに変換し、当該符号化データストリームを出力する符号化手段と、
上記量子化手段により量子化された動画像データストリームを、量子化時に用いられた量子化スケールに基づき逆量子化する逆量子化手段と、
上記逆量子化手段により逆量子化された動画像データストリームを、所定の画素ブロック単位で逆直交変換を行い、空間領域の画素データから構成される動画像データストリームを生成する逆直交変換手段と、
上記直交変換手段に入力される元の動画像データストリームの画素データと、逆直交変換手段から出力された符号化後の動画像データストリームの画素データとに基づき、上記符号化データストリームのS/N(シグナル/ノイズ)比を求めるS/N比算出手段とを備えること
を特徴とする動画像符号化装置。In a moving image encoding device that generates an encoded data stream by compressing and encoding a moving image data stream composed of pixel data in a spatial domain,
Orthogonal transformation means for orthogonally transforming the pixel data of the moving image data stream in a predetermined pixel block unit to generate a moving image data stream composed of pixel data in a frequency domain;
Quantizing means for quantizing a moving image data stream composed of pixel data in the frequency domain output from the orthogonal transform means, based on a quantization scale set for each of the predetermined pixel blocks,
Encoding means for converting the moving image data stream quantized by the quantization means into an encoded data stream corresponding to a predetermined encoding scheme, and outputting the encoded data stream;
Inverse quantization means for inversely quantizing the moving image data stream quantized by the quantization means based on a quantization scale used at the time of quantization;
An inverse orthogonal transform unit that performs an inverse orthogonal transform on the moving image data stream inversely quantized by the inverse quantization unit on a predetermined pixel block basis and generates a moving image data stream composed of pixel data in a spatial domain; ,
Based on the pixel data of the original moving image data stream input to the orthogonal transform means and the pixel data of the encoded moving image data stream output from the inverse orthogonal transform means, the S / S An S / N ratio calculating means for obtaining an N (signal / noise) ratio.
設定された目標のビットレートに応じて出力する符号化データストリームのビットレートを制御しながら圧縮符号化を行うとともに、
生成された上記符号化データストリームの画質を検出し、検出した画質に基づきフレームレートの設定値を算出し、上記動画像データストリームのフレームレートを制御すること
を特徴とする動画像符号化方法。A moving image data stream composed of frames arranged in time series is input, and in an image encoding method of generating an encoded data stream by compressing and encoding the input moving image data stream,
While performing compression encoding while controlling the bit rate of the encoded data stream to be output according to the set target bit rate,
A moving picture coding method comprising: detecting a picture quality of a generated coded data stream; calculating a frame rate set value based on the detected picture quality; and controlling a frame rate of the moving picture data stream.
上記動画像データストリームのフレームレートの設定値を算出するフレームレート算出手段と、
上記フレームレート制御手段から出力された上記動画像データストリームを圧縮符号化し、圧縮符号化することにより生成された符号化データストリームを出力する符号化手段と、
上記符号化手段により符号化された符号化データストリームをネットワークを介して受信装置に送信するとともに、当該受信装置との間で制御データの送受信を行う送受信手段とを備え、
上記送受信手段は、受信装置から受信した制御データに基づきネットワークの状況を検出し、検出したネットワークの状況に基づき目標のビットレートを算出し、
上記符号化手段は、上記送受信手段により算出された目標のビットレートに応じて上記符号化データストリームのビットレートを制御し、
上記フレームレート算出手段は、上記符号化手段から出力される上記符号化データストリームの画質に基づきフレームレートの設定値を算出し、
上記フレームレート制御手段は、動画像データストリームのフレームレートを上記フレームレート算出手段により算出された設定値に制御すること
を特徴とする動画像送信装置。A moving image data stream composed of frames arranged in time series is input, and frame rate control means for controlling a frame rate of the input moving image data stream,
Frame rate calculating means for calculating a set value of a frame rate of the moving image data stream,
Encoding means for compression-encoding the moving image data stream output from the frame rate control means, and outputting an encoded data stream generated by compression-encoding;
Transmitting the encoded data stream encoded by the encoding means to a receiving device via a network, and including transmitting and receiving means for transmitting and receiving control data to and from the receiving device,
The transmitting and receiving means detects a network condition based on the control data received from the receiving device, calculates a target bit rate based on the detected network condition,
The encoding means controls a bit rate of the encoded data stream according to a target bit rate calculated by the transmission / reception means,
The frame rate calculation unit calculates a frame rate set value based on the image quality of the encoded data stream output from the encoding unit,
The moving image transmitting apparatus, wherein the frame rate control means controls a frame rate of the moving image data stream to a set value calculated by the frame rate calculating means.
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2002309979A JP2004147104A (en) | 2002-10-24 | 2002-10-24 | Moving image coding device |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2002309979A JP2004147104A (en) | 2002-10-24 | 2002-10-24 | Moving image coding device |
Publications (1)
Publication Number | Publication Date |
---|---|
JP2004147104A true JP2004147104A (en) | 2004-05-20 |
Family
ID=32455637
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2002309979A Pending JP2004147104A (en) | 2002-10-24 | 2002-10-24 | Moving image coding device |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP2004147104A (en) |
Cited By (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2007134758A (en) * | 2005-11-08 | 2007-05-31 | Nippon Hoso Kyokai <Nhk> | Video data compression apparatus for video streaming |
JP2010074783A (en) * | 2008-09-22 | 2010-04-02 | Kddi Corp | Dynamic image encoding method, dynamic image encoding equipment, and dynamic image encoding program |
WO2015125405A1 (en) * | 2014-02-19 | 2015-08-27 | ソニー株式会社 | Image pickup apparatus, image pickup method and image pickup system |
JP2020053760A (en) * | 2018-09-25 | 2020-04-02 | 富士ゼロックス株式会社 | Information processing system, terminal device and program |
-
2002
- 2002-10-24 JP JP2002309979A patent/JP2004147104A/en active Pending
Cited By (8)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2007134758A (en) * | 2005-11-08 | 2007-05-31 | Nippon Hoso Kyokai <Nhk> | Video data compression apparatus for video streaming |
JP2010074783A (en) * | 2008-09-22 | 2010-04-02 | Kddi Corp | Dynamic image encoding method, dynamic image encoding equipment, and dynamic image encoding program |
WO2015125405A1 (en) * | 2014-02-19 | 2015-08-27 | ソニー株式会社 | Image pickup apparatus, image pickup method and image pickup system |
US20160353003A1 (en) * | 2014-02-19 | 2016-12-01 | Sony Corporation | Imaging apparatus, imaging method, and imaging system |
JPWO2015125405A1 (en) * | 2014-02-19 | 2017-03-30 | ソニー株式会社 | Imaging apparatus, imaging method, and imaging system |
US10469727B2 (en) | 2014-02-19 | 2019-11-05 | Sony Corporation | Imaging apparatus, imaging method, and imaging system |
JP2020053760A (en) * | 2018-09-25 | 2020-04-02 | 富士ゼロックス株式会社 | Information processing system, terminal device and program |
JP7255116B2 (en) | 2018-09-25 | 2023-04-11 | 富士フイルムビジネスイノベーション株式会社 | Information processing system, terminal device and program |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP4517495B2 (en) | Image information conversion apparatus, image information conversion method, encoding apparatus, and encoding method | |
US7809065B2 (en) | Picture encoding system conversion device and encoding rate conversion device | |
KR100850705B1 (en) | Method for adaptive encoding motion image based on the temperal and spatial complexity and apparatus thereof | |
JP3748717B2 (en) | Video encoding device | |
KR100970315B1 (en) | Transcoder and coded image conversion method | |
US9113194B2 (en) | Method and system for interleaving video and data for transmission over a network at a selected bit rate | |
JP2005260935A (en) | Method and apparatus for increasing average image refresh rate in compressed video bitstream | |
JP2004248285A (en) | Video encoder capable of differentially coding speaker's video image at pictorial call and video signal compression method using the same | |
US20050089092A1 (en) | Moving picture encoding apparatus | |
JP2012178864A (en) | Rate control for multi-layer video design | |
JP3668110B2 (en) | Image transmission system and image transmission method | |
JP2859830B2 (en) | Video signal decoding device | |
US20050036548A1 (en) | Method and apparatus for selection of bit budget adjustment in dual pass encoding | |
JP2010538575A (en) | Alternative entropy coding method | |
JP2009124518A (en) | Image transmission device | |
JP2002010261A (en) | Image coding transform apparatus | |
KR20040079084A (en) | Method for adaptively encoding motion image based on the temperal complexity and apparatus thereof | |
WO2011148887A1 (en) | Video image delivery system, video image transmission device, video image delivery method, and video image delivery program | |
JP2004147104A (en) | Moving image coding device | |
WO2010079797A1 (en) | Image conversion device, method, and program | |
JP4956527B2 (en) | Method and apparatus for reducing quantization error | |
JP3948597B2 (en) | Moving picture compression encoding transmission apparatus, reception apparatus, and transmission / reception apparatus | |
WO2007125574A1 (en) | Video transferring apparatus | |
JP2002344973A (en) | Method for converting size of image coding data, transmission method for image coding data and image coding data size converter | |
JP3779066B2 (en) | Video encoding device |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20040428 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20060425 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20060626 |
|
A02 | Decision of refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A02 Effective date: 20060801 |