JP2009049474A - 情報処理装置および再符号化方法 - Google Patents

情報処理装置および再符号化方法 Download PDF

Info

Publication number
JP2009049474A
JP2009049474A JP2007210973A JP2007210973A JP2009049474A JP 2009049474 A JP2009049474 A JP 2009049474A JP 2007210973 A JP2007210973 A JP 2007210973A JP 2007210973 A JP2007210973 A JP 2007210973A JP 2009049474 A JP2009049474 A JP 2009049474A
Authority
JP
Japan
Prior art keywords
encoding
information
indexing
encoding method
image information
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2007210973A
Other languages
English (en)
Inventor
Yoshiyuki Hirabayashi
義幸 平林
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Toshiba Corp
Original Assignee
Toshiba Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Toshiba Corp filed Critical Toshiba Corp
Priority to JP2007210973A priority Critical patent/JP2009049474A/ja
Publication of JP2009049474A publication Critical patent/JP2009049474A/ja
Pending legal-status Critical Current

Links

Images

Landscapes

  • Compression Or Coding Systems Of Tv Signals (AREA)

Abstract

【課題】インデキシングにより得られた情報などを用いて、シーンの重要度に応じてビットレートを調節することができる情報処理装置および再符号化方法を提供する。
【解決手段】動画データを復号化し、復号化された動画データにインデキシング処理部60によりインデキシング処理を行い、インデキシング処理の結果と予め設定されたパラメータに基づいて、動画データを再符号化する。
【選択図】 図3

Description

この発明は、例えば画像情報をトランスコードする技術に係り、特に所定の条件に一致した箇所の画質を向上することができる情報処理装置および再符号化方法に関する。
近年、画像情報をデジタルとして取り扱い、その際、効率の高い情報の伝送、蓄積を目的とし、画像情報特有の冗長性を利用して、離散コサイン変換等の直交変換と動き予測・補償とにより圧縮するMPEGなどの方式に準拠した装置が普及している。
さらに、テレビ会議用の画像符号化を当初の目的として、H.264(ITU-T Q6/16 VCEG)符号化方式の標準化が行われた。H.264は、MPEG2やMPEG4といった従来の符号化方式に比して、その符号化、復号により多くの演算量が要求されるものの、より高い符号化効率が実現されることが知られている。
例えば、MPEG2形式の符号化情報からH.264形式の符号化情報にトランスコードする場合、トランスコードの際画質の低下を抑えるために、入力ストリームをメモリに一時記憶し、長時間(数分)画質の推移を把握してエンコードに反映させる方法が開示されている(例えば特許文献1等参照)。
特開2006−295502公報
この特許文献1の技術では、入力ストリームの画質の変化に応じてエンコードのパラメータを動的に変化させるだけであり、映像シーンに応じた制御を行うことができない。
この発明は、このような事情を考慮してなされたものであり、シーンの重要度に応じてビットレートを調節することができる情報処理装置および再符号化方法を提供することを目的とする。
上記目的を達成するために、本発明の一態様によれば、画像情報が第1の符号化方式で符号化された第1符号化データを、第2の符号化方式で符号化された第2符号化データにトランスコードする情報処理装置であって、前記第1符号化データを復号化する復号化手段と、前記復号化手段が復号化した画像情報に対し、1以上のインデックスを付与して複数のシーンに分割するインデキシング手段と、前記復号化手段が復号化した画像情報を、前記インデキシング手段が分割した各シーン毎に異なる画質で符号化して前記第2符号化データに符号化する符号化手段と、を具備することを特徴とする情報処理装置が提供される。
また、画像情報が第1の符号化方式で符号化された第1符号化データを、第2の符号化方式で符号化された第2符号化データにトランスコードする再符号化方法であって、前記第1符号化データを復号化する復号化ステップと、前記復号化ステップで復号化された画像情報に対し、1以上のインデックスを付与して複数のシーンに分割するインデキシングステップと、前記復号化手段が復号化した画像情報を、前記インデキシング手段が分割した各シーン毎に異なる画質で符号化して前記第2符号化データに符号化する符号化ステップと、を有することを特徴とする再符号化方法が提供される。
この発明によれば、シーンの重要度に応じてビットレートを調節することができる情報処理装置および再符号化方法を提供できる。
以下、図面を参照して、この発明の実施の形態を説明する。
まず、図1および図2を参照して、この発明の一実施形態に係る情報処理装置の構成について説明する。この情報処理装置は、例えばノートブック型パーソナルコンピュータ10として実現されている。
図1は、ノートブック型パーソナルコンピュータ10のディスプレイユニットを開いた状態における斜視図である。本コンピュータ10は、コンピュータ本体1と、ディスプレイユニット2とから構成されている。ディスプレイユニット2には、LCD(Liquid Crystal Display)3から構成される表示装置が組み込まれており、そのLCD3の表示画面は、ディスプレイユニット2のほぼ中央に位置されている。
ディスプレイユニット2は、コンピュータ本体1に対して開放位置と閉塞位置との間を回動自在に取り付けられている。コンピュータ本体1は薄い箱形の筐体を有しており、その上面にはキーボード4、本コンピュータ10を電源オン/オフするためのパワーボタン5、入力操作パネル6およびタッチパッド7などが配置されている。
入力操作パネル6は、押下されたボタンに対応するイベントをシステムに入力する入力装置であり、複数の機能をそれぞれに起動するための複数のボタンを備えている。これらボタン群には、TV起動ボタン6A、DVD(Digital Versatile Disc)起動ボタン6Bが含まれている。TV起動ボタン6Aは、デジタルTV放送番組のような放送番組データの再生及び記録を行うためのTV機能を起動するためのボタンであり、ユーザによって押下されると、このTV機能を実行するためのTVアプリケーションプログラムが起動される。また、DVD起動ボタン6Bは、DVDに記録されたビデオコンテンツを再生するためのボタンであり、ユーザによって押下されると、ビデオコンテンツを再生するためのアプリケーションプログラムが自動的に起動される。
次に、図2を参照して、本コンピュータ10のシステム構成について説明する。
コンピュータ10は、図2に示されているように、CPU11、ノースブリッジ12、主メモリ13、グラフィクスコントローラ14、サウスブリッジ15、BIOS−ROM16、ハードディスクドライブ(HDD)17、光ディスクドライブ(ODD)18、デジタルTV放送チューナ19、エンベデッドコントローラ/キーボードコントローラIC(EC/KBC)20およびネットワークコントローラ21、副プロセッサ90等を備えている。
CPU11は、本コンピュータ10の動作を制御するために設けられたプロセッサであり、HDD17から主メモリ13にロードされる、オペレーティングシステム(OS)およびビデオ再生アプリケーションプログラム100のような各種アプリケーションプログラムを実行する。
副プロセッサ90は、符号化された動画像データを復号化(デコード)、再符号化および再生するためのハードウェアである。この副プロセッサ90は、H.264/AVC規格に対応するハードウェアデコーダである。副プロセッサ90は、H.264/AVC規格で定義された符号化方式で符号化されている動画像ストリーム(例えばデジタルTV放送チューナ19により受信されるデジタルTV放送番組やODD18から読み出されるHD(High Definition)規格のビデオコンテンツなど)をデコードするデコード機能を有している。また、デコードして得られるTV番組等を再符号化する機能を有している。この再符号化は、例えば、録画されたTV番組中のCM等の重要度の低いシーンのビットレートを低くする処理等を行い、ファイル容量を少なくする等を目的として行う。
この他、副プロセッサ90は、デコードして得られるTV番組等の動画像を解析して、例えば無音区間の検出や、顔画像の検出等に応じてインデキシング処理も行う。インデキシング処理では、該動画像に対してインデックスを付与することにより、複数のシーンに分割することができ、例えばCM区間や、特定の人物が出演しているシーン等を区別することができる。
CPU11は、BIOS−ROM16に格納されたBIOS(Basic Input Output System)も実行する。BIOSはハードウェア制御のためのプログラムである。
ノースブリッジ12は、CPU11のローカルバスとサウスブリッジ15との間を接続するブリッジデバイスである。ノースブリッジ12には、主メモリ13をアクセス制御するメモリコントローラも内蔵されている。また、ノースブリッジ12は、AGP(Accelerated Graphics Port)バスなどを介してグラフィクスコントローラ14との通信を実行する機能も有している。
グラフィクスコントローラ14は本コンピュータ10のディスプレイモニタとして使用されるLCD3を制御する表示コントローラである。このグラフィクスコントローラ14はビデオメモリ(VRAM)14Aに書き込まれた画像データからLCD3に送出すべき表示信号を生成する。
サウスブリッジ15は、LPC(Low Pin Count)バス上の各デバイス、およびPCI(Peripheral Component Interconnect)バス上の各デバイスを制御する。また、サウスブリッジ15は、HDD17、ODD18を制御するためのIDE(Integrated Drive Electronics)コントローラを内蔵している。さらに、サウスブリッジ15は、BIOS−ROM16をアクセス制御するための機能、およびPCIバスを介してデジタルTV放送チューナ19を制御する機能も有している。
HDD17は、各種ソフトウェア及びデータを格納する記憶装置である。光ディスクドライブ(ODD)18は、ビデオコンテンツが格納されたDVDなどの記憶メディアを駆動するためのドライブユニットである。デジタルTV放送チューナ19は、デジタルTV放送番組のような放送番組データを外部から受信するための受信装置である。
EC/KBC20は、電力管理のためのエンベデッドコントローラと、キーボード(KB)4およびタッチパッド7を制御するためのキーボードコントローラとが集積された1チップマイクロコンピュータである。EC/KBC20は、ユーザによるパワーボタン5の操作に応じて本コンピュータ10を電源オン/オフする機能を有している。さらに、EC/KBC20は、ユーザによるTV起動ボタン6A、DVD起動ボタン6Bの操作に応じて、本コンピュータ10を電源オンすることもできる。ネットワークコントローラ21は、例えばインターネット等の外部ネットワークとの通信を実行する通信装置である。
図3は、このような構成のコンピュータ10上で動作する副プロセッサ90が有する機能の機能ブロック図である。
副プロセッサ90は、図3に示すように、Transcode前の記憶装置50、Reader51、64、Demuxer52、映像Decoder53、映像Encoder61、音声Decoder54、音声Encoder55、スケーラ56、Muxer57、Writer58、65、Transcode後の記憶装置59、インデキシング処理部60、インデキシングデータの記憶装置66、インデキシング後処理部63、EPGなどの番組情報62を備えている。
Transcode前記憶装置50は、録画されたTV番組等である画像情報を記憶するHDD17である。Reader51は、録画されたTV番組等である画像情報をTranscode前記憶装置50から読み出す。Demuxer52は、画像情報から音声情報と映像情報とを分離する。映像Decoder53、音声Decoder54は、それぞれ映像情報および音声情報のデコードを行う。音声Encoder55は、デコードされた音声のエンコードを行う。スケーラ56は、映像情報のスケールの変更を行う。Muxer57は、エンコードされた音声情報とスケールの変更が行われた映像情報とを合成処理する。インデキシング処理部60は、音声Decoder54およびスケーラ56からの音声情報および映像情報によって、インデキシング処理を行ってインデックスを付与して複数のシーンに分割すると共に、各シーンの重要度を決定する。インデキシングデータの記憶装置66は、インデキシングデータをWriter65により記憶するHDD17である。EPGなどの番組情報62は、EPG等の番組情報を配信しているサイト等から受信した番組表データである。インデキシング後処理部63は、インデキシングデータの記憶装置66からインデキシングデータをReader64によって読み出し、画像情報に適用する。この際、EPGなどの番組情報62から番組情報も読み出し、インデキシング後処理に適用する。このインデキシング後処理によって、画像情報は、CM等の重要度の低い箇所(シーン)のビットレートを下げる処理が行われ、映像Encoder61に出力される。
画像情報の重要度の高低(評価値)は、例えば図4に示すように、予めパラメータ情報として設定される。例えば、録画したTV番組のジャンルによって、以下のように設定する。なお、録画したTV番組のジャンルは、EPG等の番組表データに基づいて判別可能である。
まず、録画されたTV番組の元の画質が、例えば17Mbps(第1符号化データ)であるとする。この画質を所定の条件によって、第2符号化データである、15〜8.5Mbpsにトランスコードする。
例えば、CMは全番組において、ビットレート8.5Mbpsとして、最低の画質にトランスコードの設定を行う。また、録画されたTV番組がスポーツ、例えばサッカーであれば、例えば、アナウンサー等の音声データを検出し、「ゴール」や「フリーキック」等のキーワードを検出した場合は、評価値0.8として17Mbpsのビットレート(最高画質)とする。また、歓声の音量を検出し、歓声の音量の割合によって、評価値を設定する。例えば、評価値は0.2〜0.8とする。ビットレートは、図4に示すように評価値に対応して、10、12、15、17(Mbps)とする。
さらに、録画されたTV番組のジャンルがドラマであれば、お気に入りの出演者を登録し、この出演者に一致する条件の割合で評価値を0〜0.8に設定する。例えば、字幕のキーワードに一致した回数や、顔認識を用いて、お気に入りの出演者である確率の高さ等で評価値を設定する。例えば、評価値は0.2〜0.8とする。ビットレートは、図4に示すように評価値に対応して、10、12、15、17(Mbps)とする。
また、録画されたTV番組のジャンルが歌番組であれば、お気に入りの出演者や歌を登録し、この出演者や歌に一致する条件の割合で評価値を0〜0.8に設定する。例えば、字幕のキーワードに一致した回数や、顔認識を用いて、お気に入りの出演者である確率の高さ等で評価値を設定する。さらに、メロディーの一致度に応じて、登録した歌である確率に応じて評価値を設定することもできる。例えば、評価値は0.2〜0.8とする。ビットレートは、図4に示すように評価値に対応して、10、12、15、17(Mbps)とする。
次に、図5のフローチャートを参照して、副プロセッサ90の処理の手順を説明する。
Transcode前記憶装置50は、録画されたTV番組等である画像情報を読み出し、動画データの再生を開始する(ステップS101)。副プロセッサ90はTVアプリケーションプログラムの設定が画質重視設定か否かを判別する(ステップS102)。副プロセッサ90は、TVアプリケーションプログラムの設定が画質重視設定であった場合には、画質設定に従って処理を行う。すなわち、トランスコードを行わずに、すべて最高画質で動画データを保存する。
一方、TVアプリケーションプログラムの設定が画質重視設定でない場合は(ステップS102のNO)、副プロセッサ90は、動画データのインデキシング処理を行う。このインデキシング処理では、動画データの音声検出や、字幕検出、歓声検出、顔認識、CM検出等を行い、インデキシングデータとしてインデキシングデータの記憶装置66に記憶する(ステップS103)。
副プロセッサ90のインデキシング後処理部63は、インデキシングデータの記憶装置66からインデキシングデータを読み出し、またEPGなどの番組情報62から番組情報も読み出し(ステップS104)、インデキシング後処理を行う(ステップS105)。このインデキシング後処理によって、画像情報は、CM等の重要度の低い箇所(シーン)のビットレートを下げる処理が行われ。映像Encoder61に出力される。
以上のように、本実施形態によれば、インデキシングにより得られた情報などを用いて、シーンの重要度に応じてビットレートを調節することができる。このため、重要度の低いシーンでは、ビットレートを下げることができるため、録画された番組データのファイルサイズを抑えることができる。
なお、本発明は上記実施形態そのままに限定されるものではなく、実施段階ではその要旨を逸脱しない範囲で構成要素を変形して具体化できる。また、上記実施形態に開示されている複数の構成要素の適宜な組み合わせにより、種々の発明を形成できる。例えば、実施形態に示される全構成要素から幾つかの構成要素を削除してもよい。さらに、異なる実施形態にわたる構成要素を適宜組み合わせてもよい。
本発明の一実施形態に係るコンピュータの外観を示す斜視図。 同実施形態のコンピュータのシステム構成を示す図。 同実施形態のコンピュータで用いられる副プロセッサが有する機能の機能ブロック図。 インデキシング処理に用いる各種パラメータを示す模式図。 同実施形態の処理の手順を示すフローチャート。
符号の説明
1…コンピュータ本体、2…ディスプレイユニット、3…LCD、4…キーボード、5…パワーボタン、6…入力操作パネル、6A…TV起動ボタン、6B…DVD起動ボタン、7…タッチパッド、10…コンピュータ、11…CPU、12…ノースブリッジ、13…主メモリ、14…グラフィクスコントローラ、14A…ビデオメモリ、15…サウスブリッジ、16…BIOS−ROM、17…ハードディスクドライブ(HDD)、18…光ディスクドライブ(ODD)、19…デジタルTV放送チューナ、20…エンベデッドコントローラ/キーボードコントローラIC(EC/KBC)、21…ネットワークコントローラ、50…Transcode前の記憶装置、51、64…Reader、52…Demuxer、53…映像Decoder、61…映像Encoder、54…音声Decoder、55…音声Encoder、56…スケーラ、57…Muxer、58、65…Writer、59…Transcode後の記憶装置、60…インデキシング処理部、62…EPGなどの番組情報、63…インデキシング後処理部、66…インデキシングデータの記憶装置、90…副プロセッサ、100…ビデオ再生アプリケーションプログラム、110…復号処理部、111…スライスヘッダ処理部、112…スライスデータ処理部、112A…マクロブロック構文解析処理部、120…信号処理部、121…信号処理制御部、122…マクロブロック信号処理部、123…デブロック処理部、201…逆量子化部、202…逆DCT部、203…加算部、204…モード切替スイッチ部、205…イントラ予測部、206…重み付き予測部、207…動きベクトル予測部、208…補間予測部。

Claims (8)

  1. 画像情報が第1の符号化方式で符号化された第1符号化データを、第2の符号化方式で符号化された第2符号化データにトランスコードする情報処理装置であって、
    前記第1符号化データを復号化する復号化手段と、
    前記復号化手段が復号化した画像情報に対し、1以上のインデックスを付与して複数のシーンに分割するインデキシング手段と、
    前記復号化手段が復号化した画像情報を、前記インデキシング手段が分割した各シーン毎に異なる画質で符号化して前記第2符号化データに符号化する符号化手段と、
    を具備することを特徴とする情報処理装置。
  2. 前記インデキシング手段は、前記画像情報に関連付けられたジャンル情報に基づいてインデックスを付与することを特徴とする請求項1記載の情報処理装置。
  3. 前記符号化手段は、各シーン毎にビットレートを設定することを特徴とする請求項1記載の情報処理装置。
  4. 前記符号化手段は、音声認識によるキーワード、字幕検出によるキーワード、CM検出、歓声検出、および顔認識による一致のいずれか1つ以上の情報に基づいて、各シーンの画質を決定することを特徴とする請求項1記載の情報処理装置。
  5. 画像情報が第1の符号化方式で符号化された第1符号化データを、第2の符号化方式で符号化された第2符号化データにトランスコードする再符号化方法であって、
    前記第1符号化データを復号化する復号化ステップと、
    前記復号化ステップで復号化された画像情報に対し、1以上のインデックスを付与して複数のシーンに分割するインデキシングステップと、
    前記復号化手段が復号化した画像情報を、前記インデキシング手段が分割した各シーン毎に異なる画質で符号化して前記第2符号化データに符号化する符号化ステップと、
    を有することを特徴とする再符号化方法。
  6. 前記インデキシングステップでは、前記画像情報に関連付けられたジャンル情報に基づいてインデックスを付与することを特徴とする請求項5記載の再符号化方法。
  7. 前記符号化ステップでは、各シーン毎にビットレートを設定することを特徴とする請求項5記載の再符号化方法。
  8. 前記符号化ステップでは、音声認識によるキーワード、字幕検出によるキーワード、CM検出、歓声検出、および顔認識による一致のいずれか1つ以上の情報に基づいて、各シーンの画質を決定することを特徴とする請求項5記載の再符号化方法。
JP2007210973A 2007-08-13 2007-08-13 情報処理装置および再符号化方法 Pending JP2009049474A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2007210973A JP2009049474A (ja) 2007-08-13 2007-08-13 情報処理装置および再符号化方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2007210973A JP2009049474A (ja) 2007-08-13 2007-08-13 情報処理装置および再符号化方法

Publications (1)

Publication Number Publication Date
JP2009049474A true JP2009049474A (ja) 2009-03-05

Family

ID=40501322

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2007210973A Pending JP2009049474A (ja) 2007-08-13 2007-08-13 情報処理装置および再符号化方法

Country Status (1)

Country Link
JP (1) JP2009049474A (ja)

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR20120105970A (ko) * 2011-03-17 2012-09-26 에스케이플래닛 주식회사 비디오 트랜스코딩 방법 및 시스템
EP2560405A1 (en) 2011-08-19 2013-02-20 Funai Electric Co., Ltd. Digital broadcast reception device
JP2014511137A (ja) * 2011-01-28 2014-05-08 アイ アイオー,リミテッド・ライアビリティ・カンパニー シーンに基づく適用性のあるビットレート制御

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2014511137A (ja) * 2011-01-28 2014-05-08 アイ アイオー,リミテッド・ライアビリティ・カンパニー シーンに基づく適用性のあるビットレート制御
KR20120105970A (ko) * 2011-03-17 2012-09-26 에스케이플래닛 주식회사 비디오 트랜스코딩 방법 및 시스템
KR101882889B1 (ko) * 2011-03-17 2018-07-30 에스케이플래닛 주식회사 비디오 트랜스코딩 방법 및 시스템
EP2560405A1 (en) 2011-08-19 2013-02-20 Funai Electric Co., Ltd. Digital broadcast reception device

Similar Documents

Publication Publication Date Title
US8625668B2 (en) Information processing apparatus and video decoding method of information processing apparatus
US8040951B2 (en) Information processing apparatus and program for use in the same
JP4825644B2 (ja) 画像復号装置、画像符号化装置、およびシステムlsi
US11706424B2 (en) Device and method of video decoding with first and second decoding code
US20060203917A1 (en) Information processing apparatus with a decoder
JP2008072647A (ja) 情報処理装置、デコーダおよび再生装置の動作制御方法
US20010017977A1 (en) Video reproducing method and video reproducing apparatus
US20080031356A1 (en) Information processing apparatus and decode controlling method of an information processing apparatus
US11849124B2 (en) Device and method of video encoding with first and second encoding code
US20090034615A1 (en) Decoding device and decoding method
US20060203910A1 (en) Information processing apparatus and decoding method
US20060203909A1 (en) Information processing apparatus and decoding method
US8611433B2 (en) Information processing apparatus and video decoding method of information processing apparatus
JP2007295392A (ja) 情報処理装置、復号処理方法、およびプログラム
JP2009049474A (ja) 情報処理装置および再符号化方法
US8107536B2 (en) Video decoder
JP2009253758A (ja) 情報処理装置およびデコーダの判定モード設定方法
JP2006101321A (ja) 情報処理装置および同装置で用いられるプログラム
JP2006101405A (ja) 情報処理装置および同装置で用いられるプログラム
US7200562B2 (en) Multimedia data decoder
JP4291185B2 (ja) トランスコーディング方法、トランスコーダ及びプログラム
JP5238850B2 (ja) 情報処理装置および動画像ストリームの復号方法
JP2010148048A (ja) 動画像再圧縮装置および動画像再圧縮方法
JP2010028436A (ja) 動画像復号装置、プログラムおよび復号処理簡略化方法
JP2008085868A (ja) 情報処理装置および情報処理方法