JP5136546B2 - 動画像ストリーム加工装置及び該装置を備えた動画像再生装置並びに方法とプログラム - Google Patents

動画像ストリーム加工装置及び該装置を備えた動画像再生装置並びに方法とプログラム Download PDF

Info

Publication number
JP5136546B2
JP5136546B2 JP2009500205A JP2009500205A JP5136546B2 JP 5136546 B2 JP5136546 B2 JP 5136546B2 JP 2009500205 A JP2009500205 A JP 2009500205A JP 2009500205 A JP2009500205 A JP 2009500205A JP 5136546 B2 JP5136546 B2 JP 5136546B2
Authority
JP
Japan
Prior art keywords
stream
picture
image
bit stream
intra
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
JP2009500205A
Other languages
English (en)
Other versions
JPWO2008102794A1 (ja
Inventor
達治 森吉
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
NEC Corp
Original Assignee
NEC Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by NEC Corp filed Critical NEC Corp
Priority to JP2009500205A priority Critical patent/JP5136546B2/ja
Publication of JPWO2008102794A1 publication Critical patent/JPWO2008102794A1/ja
Application granted granted Critical
Publication of JP5136546B2 publication Critical patent/JP5136546B2/ja
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N5/00Details of television systems
    • H04N5/76Television signal recording
    • H04N5/78Television signal recording using magnetic recording
    • H04N5/782Television signal recording using magnetic recording on tape
    • H04N5/783Adaptations for reproducing at a rate different from the recording rate
    • GPHYSICS
    • G11INFORMATION STORAGE
    • G11BINFORMATION STORAGE BASED ON RELATIVE MOVEMENT BETWEEN RECORD CARRIER AND TRANSDUCER
    • G11B27/00Editing; Indexing; Addressing; Timing or synchronising; Monitoring; Measuring tape travel
    • G11B27/005Reproducing at a different information rate from the information rate of recording
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/102Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
    • H04N19/103Selection of coding mode or of prediction mode
    • H04N19/107Selection of coding mode or of prediction mode between spatial and temporal predictive coding, e.g. picture refresh
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/102Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
    • H04N19/103Selection of coding mode or of prediction mode
    • H04N19/112Selection of coding mode or of prediction mode according to a given display mode, e.g. for interlaced or progressive display mode
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/102Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
    • H04N19/132Sampling, masking or truncation of coding units, e.g. adaptive resampling, frame skipping, frame interpolation or high-frequency transform coefficient masking
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/169Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding
    • H04N19/17Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object
    • H04N19/172Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object the region being a picture, frame or field
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/44Decoders specially adapted therefor, e.g. video decoders which are asymmetric with respect to the encoder
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/50Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding
    • H04N19/503Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding involving temporal prediction
    • H04N19/51Motion estimation or motion compensation
    • H04N19/573Motion compensation with multiple frame prediction using two or more reference frames in a given prediction direction
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/50Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding
    • H04N19/503Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding involving temporal prediction
    • H04N19/51Motion estimation or motion compensation
    • H04N19/577Motion compensation with bidirectional frame interpolation, i.e. using B-pictures
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/50Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding
    • H04N19/587Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding involving temporal sub-sampling or interpolation, e.g. decimation or subsequent interpolation of pictures in a video sequence

Landscapes

  • Engineering & Computer Science (AREA)
  • Multimedia (AREA)
  • Signal Processing (AREA)
  • Compression Or Coding Systems Of Tv Signals (AREA)
  • Television Signal Processing For Recording (AREA)
  • Signal Processing For Digital Recording And Reproducing (AREA)

Description

(関連出願)本願は、先の日本特許出願2007−041124号(2007年2月21日出願)の優先権を主張するものであり、前記先の出願の全記載内容は、本書に引用をもって繰込み記載されているものとみなされる。
本発明は動画像の再生方法及び装置に関し、特に、高速再生、高速逆再生等の特殊再生に適用して好適な動画像の再生方法及び装置に関する。
動画像信号を低ビットレート、高圧縮率かつ高画質で符号化して符号化データを生成したり、符号化された動画像を復号化したりする技術として、ITU(International Telecommunication Union)が標準化したH.261、H.263や、ISO(International Organization for Standardization)のMPEG−1、MPEG−2、MPEG−4等が国際標準規格として広く用いられている。
ITUとISOが共同で規格化を行なったH.264(非特許文献1参照)においては、従来の動画像符号化技術に比べ、さらなる圧縮効率向上、画質向上を実現できることが知られている。
これらの動画像符号化技術では、動画像信号を効率よく圧縮するために、各フレームの時間的な相関を利用するフレーム間予測符号化技術が広く用いられている。
フレーム間予測符号化では、すでに符号化したフレームの画像信号から現在のフレームの画像信号を予測し、予測した信号と現在の信号との間の予測誤差信号を符号化する。
一般的な動画像では、時間的に近接するフレームの画像信号には高い相関が存在するため、この技術は、圧縮効率向上に効果的である。
MPEG(Moving Picture Expert Group)−1、MPEG−2、MPEG−4、H.264等の動画像符号化技術では、
・フレーム間予測符号化を利用しないIピクチャ(Intra picture:フレーム内符号化画像)、
・すでに符号化した1枚のフレームからのフレーム間予測符号化を利用するPピクチャ(Predictive picture:片方向予測符号化画像)、
・すでに符号化した2枚のフレームからのフレーム間予測符号化を利用するBピクチャ(Bidirectional predicative picture:双方向予測符号化画像)
を組み合わせて用い動画像を符号化する。
復号化の際には、Iピクチャは1フレーム単独で復号できるが、Pピクチャ、Bピクチャは復号するのに、フレーム間予測で予測に用いる画像データがあらかじめ必要であるため、1フレーム単独では、復号できない。
動画像符号化方式でのピクチャ構成の例を、図13に模式的に示す。それぞれの四角形が1フレームを表し、下にはピクチャ種別と表示順を示している(例えばB5は、表示順で5番目のフレームでBピクチャとして符号化されていることを表す)。このように、性質の異なるIピクチャ、Pピクチャ、Bピクチャを適切に組み合わせて動画像を符号化することが従来から広く行われている。
図13に示すように、符号化された動画像ビットストリームを、高速再生や高速逆再生(逆高速再生ともいう)等の特殊再生する場合、ビットストリームから、単独で復号化可能なIピクチャのビットストリームのみを抜き出して再生することが、従来から行われてきた。
図14は、関連技術として、高速再生ビットストリーム、高速逆再生ビットストリームを得る手法の動作例を説明するための模式図である。図15は、図14の手法を実現する装置構成の典型例を示す図である。
図15において、ビットストリームはストリーム抜き出し部101に入力される。ストリーム抜き出し部101は、入力されたビットストリームから、Iピクチャのビットストリームのみを抜き出し、ストリーム並び替え部102に供給する。
ストリーム並び替え部102は、供給されるIピクチャのビットストリームを必要に応じて並び替えて外部に出力する。
高速再生の場合には、ストリーム抜き出し部101は、図14(A)のビットストリームから、Iピクチャのビットストリームのみを順番に抜き出し、抜き出したIピクチャを並べてビットストリームを構成することで、高速再生ビットストリーム(例えば図14(B)のI0、I6、I12、I18・・・)を得る。高速再生の場合には、ストリーム並び替え部102での並び替え処理は発生しない。
また、高速逆再生の場合には、同じく、ストリーム抜き出し部101にて、ビットストリームからIピクチャのみを抜き出し、抜き出したIピクチャを、ストリーム並び替え部102で表示順とは逆順に並び替えて出力することで、高速逆再生ビットストリーム(例えば図14(C)の・・・I18、I12、I6、I0)が得られる。例えば特許文献1には、前記の方法を発展させ、表示に必要な最小限のIピクチャのみを抜き出して高速再生用ストリームを生成する技術が開示されている。すなわち、特許文献1には、早送り再生を行うとき、所定間隔おきに表示フレームを指定し、指定されたフレームが独立フレーム(Iピクチャ)であった場合、そのフレームを表示に供し、独立フレームでなかった場合(Pピクチャ又はBピクチャ)、そのフレームに時間的に最も近い独立フレーム(Iピクチャ)を表示に供する構成が開示されている。
前記した方法は、近年規格化されたH.264動画像符号化技術で符号化されたビットストリームの特殊再生でも利用できる。しかしながら、H.264では、MPEG−1、MPEG−2、MPEG−4等の従来の符号化標準と比較して、符号化の自由度が高くなっており、従来の方法が適用できない場合がある。以下でその内容を説明する。
H.264では、プログレッシブ画像(順次走査フォーマットの画像)に適したフレーム符号化と、インターレース画像(飛び越し走査フォーマットの画像)に適したフィールド符号化を適応的に選択して利用できる。
図16(A)に示すように、フレーム符号化では、画像全体を1ピクチャ(フレームピクチャ)として符号化するのに対し、図16(B)に示すように、フィールド符号化では、画像の奇数ラインと偶数ラインを分離し、それぞれを別々のピクチャ(フィールドピクチャ)として符号化する。
さらに、H.264では、フィールド符号化を用いた場合に、その画像を構成する2つのフィールドピクチャを、それぞれ異なる符号化(Iピクチャ、Pピクチャ、又はBピクチャ)で符号化することも可能である。
図17に、フィールド符号化で符号化されたビットストリームの例を示す。図17において、それぞれの4角形は、1つのフィールドピクチャを表し、2つのフィールドピクチャで1フレームが構成される。また、矢印は、フレーム間予測の参照関係を示しており、この例では、P13のフィールドピクチャが、I12をフレーム間予測に利用していることを示している。なお、図17では、P13以外のピクチャのフレーム間予測参照関係については図示していない。
図17には、I12とP13が1フレームを構成しており、そのうち、I12はIピクチャであるが、P13はPピクチャである場合の例が示されている。
図17に示すようなビットストリームに対して、図15に示した構成では、高速再生ビットストリーム、及び、高速逆再生ビットストリームを作成することはできない。
すなわち、図15に示した前記構成では、ストリーム抜き出し部101で入力されたビットストリームからIピクチャのビットストリームのみを抜き出すが、図17に示した例の場合には、抜き出されるのは、I12及びI24のストリームのみであり、それぞれ、1フィールド分の画像情報しか含まれず、抜き出したストリームを復号しても、1画面を構成する復号結果は得られない。
このため、図15に示した構成において、高速再生ビットストリームを作成しても、該高速再生ビットストリームを復号すると、
・画像の片方のフィールド(奇数ライン又は偶数ライン)しか画像が更新されない、
・過去のフィールドと現在のフィールドの画像とが混ざって出力される、
等の問題が発生する場合がある。
そこで、図15等を参照して説明した上記手法を発展させ、フィールド符号化の場合には、Iピクチャ(フィールドピクチャ)のみを抜き出すのではなく、Iピクチャを含む2つのフィールドピクチャを抜き出すように構成することは、容易に想像できる。
この場合、図15のストリーム抜き出し部101は、図17において、I12及びI24のみを抜き出すのではなく、I12及びP13、I24及びP25をそれぞれ抜き出すように構成される(「手法2」という)。
この手法2を用いると、図17に示した例の場合、前記した問題を解決することができる。すなわち、ストリーム抜き出し部101でI12及びP13を抜き出せば、この2ピクチャを復号することで、1画面を構成する復号結果が得られるようになる。したがって、高速再生ビットストリーム、高速逆再生ビットストリームを作成することができる。
しかしながら、これは、図17の例では、P13が、フレーム間予測にI12のみを利用しているために有効なのであって、前記した問題を根本的に解決するものではない。以下に説明する。
H.264では、フレーム間予測の自由度が高く、例えば、図18に示すようなフレーム間予測も可能である。すなわち、I12と対応するフィールドピクチャB13は、I12以外に、P18、P19を、フレーム間予測に用いている。
このような場合には、前記手法2にしたがってストリーム抜き出し部101で、I12及びB13を抜き出しても、B13は、フレーム間予測に必要な画像データ(図18の例では、P18及びP19)が得られないため、復号することができず、1画面を構成する復号結果は得られない。
上記の問題を解決するための動画像復号装置(方法)として、例えば特許文献2には、高速再生モード時には、フレーム構造の符号化方式により符号化されたフレーム内符号化画像又は当該フレーム内符号化画像における一方のフィールドの符号化画像データ、及び、フィールド構造の符号化方式により符号化されたフィールド内符号化画像の符号化画像データに対してのみ復号化処理を施すように、復号化手段を制御する制御手段を備えた画像復号化装置が開示されている。特許文献2記載の発明は、高速再生モード時には、フレーム符号化されたIピクチャ又はフレーム符号化されたIピクチャの片方のフィールド又はフィールド符号化されたIピクチャのみを復号し、得られた1フィールドの復号画像を他方のフィールドにコピーして1画面を構成する。
なお、前述した背景技術に関連して、特許文献3には、MPEGストリームから、Iピクチャを抽出し、再符号化して間歇ストリームを生成して記録媒体に記録し、記録媒体から間歇ストリームを読み出してデコードし、Iピクチャのみを用いて再符号化し情報量を低減する記録再生装置が開示されている。特許文献4には、インターレース映像画像データの奇数フィールド画像と偶数フィールド画像を合成してフレーム画像を得る構成(画像を直接処理する構成)が開示されている。さらに特許文献5には、ビデオ信号の1フレームを構成する2フィールドのうち片フィールドの画像(例えばTopフィールドのデータ)を他方のフィールドのデータ(Bottomフィールド画像データ)としてコピーしてフレーム画像を生成し、フレーム画像を圧縮符号化する構成が開示されている。特許文献6には、符号化モード情報を解析し符号化モード解析情報を出力するヘッダ解析手段として、入力ビデオストリームが順次走査画像をフレーム符号化したビットストリームであるか、飛び越し走査画像をフレーム又はフィールド符号化した画像であるかを識別し、符号化モード解析情報として復号制御手段に出力し、復号制御手段は、符号化モード解析情報をもとに、飛び越し走査画像をフレーム又はフィールド符号化した第1のビットストリームを復号する場合、トップフィールドの復号開始を示す第1のタイミング信号とボトムフィールドの復号開始を示す第2のタイミング信号を交互に出力し、順次走査画像をフレーム符号化した第2のビットストリームを復号する場合には、表示開始信号の中間で復号開始を示す第3のタイミング信号を出力する構成が開示されている。なお、前記特許文献1乃至6に記載されている各発明は、後述される本発明とは、目的、構成、作用効果のいずれの点についても全く相違している。
特開平05−344494号公報 特開2004−328634号公報 特開2003−219362号公報 特開2004−015700号公報 特開2004−040516号公報 特開平11−041591号公報 ITU−T Recommendation H.264「Advanced video coding for generic audiovisual services」、2005年3月
なお、上記特許文献1乃至6、非特許文献1の全開示内容はその引用をもって本書に繰込み記載する。以下に、本発明による関連技術の分析を与える。
特許文献2に記載の発明を用いた復号化装置の場合、H.264でフィールド符号化されたビットストリームの高速再生を実現することはできるものの、復号化装置に新たな機能を加えているため、特許文献2に記載の発明を用いた復号化装置と、特許文献2に記載の発明を用いない復号化装置とでは、同一のビットストリームを入力しても、復号化結果が大きく異なってしまう、という問題がある。
MPEG−1、MPEG−2、MPEG−4、H.264等の国際標準規格の動画像符号化技術では、復号化装置の動作を厳密に規定しており、同一のビットストリームを入力すれば、規格に準拠した復号化装置であれば、どの製造者(ベンダー)の製造した復号化装置であっても、ほぼ、同じ又は全く同一の復号化結果が得られることが保証される。この点が、国際標準規格の動画像符号化技術の大きな利点の一つである。
このため、復号化装置に、標準規格外の機能を加えるという手法は、利用目的によっては、好ましくない。
また、特許文献2の発明は、復号化装置に機能を加えるものであるため、
・復号化装置の構成が複雑になり、
・設計や製造の難易度が高くなる、
・費用が上がる、
等の各種問題が発生する場合がある。
動画像の符号化装置と復号化装置では、通常、復号化装置の方が多数利用されるため、復号化装置の構成が複雑になる影響は大きい。
したがって、本発明は、上記課題に鑑みて創案されたものであって、その主たる目的は、復号化装置の変更無しに、高速再生、高速逆再生等の特殊再生を実現できる動画像再生方法及び装置とプログラムを提供することにある。
本発明によれば、動画像を符号化したビットストリームより抜き出された、フレーム内符号化されたピクチャのビットストリームを受け取って解析し、該解析結果を基に、前記抜き出されたフレーム内符号化されたピクチャを復号すれば前記フレーム内符号化されたピクチャを含む1画面の復号画像が得られるか否かを判定するストリーム解析部と、
前記ストリーム解析部で1画面の復号画像が得られないと判定された場合に、前記ストリーム解析部での解析結果に基づき、1画面のうち復号画像が得られない領域の画像を補完するビットストリームを生成するストリーム生成部と、を備えたことを特徴とする動画像ストリーム加工装置が提供される。本発明の動画像ストリーム加工装置において、前記動画像を符号化したビットストリームからフレーム内符号化されたピクチャのビットストリームを抜き出し、抜き出したビットストリームを前記ストリーム解析部に供給するストリーム抜き出し部を備えた構成としてもよい。
本発明の動画像ストリーム加工装置において、前記ストリーム抜き出し部は、フレーム内符号化されたピクチャを先頭に含む所定数の連続するピクチャのビットストリームを抜き出し、前記ストリーム解析部は、前記抜き出されたビットストリームを復号すれば前記フレーム内符号化されたピクチャを含む1画面の復号画像が得られるか否かを判定する、ように構成してもよい。
本発明の動画像ストリーム加工装置において、前記ストリーム生成部は、フレーム内符号化されたピクチャがフィールドピクチャである場合に、1画面のうち復号画像が得られないフィールドを、フレーム内符号化されたフィールドピクチャの画像に類似した画像で補完するビットストリームを生成するように構成してもよい。
本発明の動画像ストリーム加工装置において、前記ストリーム生成部は、1画面のうち復号画像が得られない領域の画像を、フレーム内符号化されたピクチャに類似した画像で補完するように、フレーム内符号化されたピクチャのビットストリームの所定箇所を変更したフレーム内符号化ピクチャを生成してもよい。あるいは、前記ストリーム生成部は、前記フレーム内符号化されたピクチャのみをフレーム間予測で参照し、前記1画面のうち復号画像が得られない領域の画像を補完する片方向予測符号化又は双方向予測符号化されたピクチャのビットストリームを生成してもよい。
本発明の動画像ストリーム加工装置は、前記抜き出されたビットストリームと、前記ストリーム生成部で生成されたストリームから、1画面の復号画像を得られるビットストリームを合成するストリーム合成部をさらに備えてもよい。
本発明の他の側面に係る動画像再生装置は、動画像を符号化したビットストリームの復号化を行なう動画像復号化装置と、前記した本発明に係る動画像ストリーム加工装置と、ビットストリーム切り替え装置と、動画像表示装置と、を備えている。前記ビットストリーム切り替え装置は、通常再生時には、前記動画像ストリーム加工装置を通さずに、入力ビットストリームを、直接、前記動画像復号化装置に供給し、高速再生又は高速逆再生等の特殊再生時には、入力ビットストリームを前記動画像ストリーム加工装置に供給し、前記動画像ストリーム加工装置は生成したビットストリームを前記動画像復号化装置に供給する。前記動画像復号化装置は、供給されたビットストリームを復号化して復号画像を前記動画像表示装置に供給し、前記動画像表示装置は復号画像を表示出力する。
本発明の他の側面に係る記録媒体(記憶装置)は、動画像を符号化したビットストリームと、前記動画像を符号化したビットストリームを、前記した本発明に係る動画像ストリーム加工装置に入力し、前記動画像ストリーム加工装置の出力として生成された特殊再生用ビットストリームと、前記ビットストリームと前記特殊再生用ビットストリームとのストリーム切り替えを行うための関連付け情報を有する管理テーブルと、を備えている。
本発明のさらに他の側面に係る動画像配信装置は、前記した本発明に係る記憶媒体と、ビットストリーム切り替え装置と、ビットストリーム送出装置と、を備えている。前記ビットストリーム切り替え装置は、通常再生時には、前記記憶媒体から、前記ビットストリームを読み出して前記ビットストリーム送出装置に供給し、高速再生又は高速逆再生等の特殊再生時には、前記記憶媒体から、前記管理テーブルを参照して、前記ビットストリームと関連付けられている前記特殊再生用ビットストリームを読み出して、前記ビットストリーム送出装置に供給し、前記ビットストリーム送出装置は、供給されたビットストリームを所定の受信端末に向けて伝送路に送出する。
本発明に係る方法は、その1つの側面において、
動画像を符号化したビットストリームより抜き出された、フレーム内符号化されたピクチャのビットストリームを受け取って解析し、該解析結果を基に、前記抜き出されたフレーム内符号化されたピクチャを復号すれば前記フレーム内符号化されたピクチャを含む1画面の復号画像が得られるか否かを判定する、ストレーム解析工程と、
前記ストリーム解析部で1画面の復号画像が得られないと判定された場合に、前記ストリーム解析部での解析結果に基づき、1画面のうち復号画像が得られない領域の画像を補完するビットストリームを生成する、ストリーム生成工程と、
を含む。
本発明に係るコンピュータプログラムは、その1つの側面において、
動画像を符号化したビットストリームより抜き出された、フレーム内符号化されたピクチャのビットストリームを受け取って解析し、該解析結果を基に、前記抜き出されたフレーム内符号化されたピクチャを復号すれば前記フレーム内符号化されたピクチャを含む1画面の復号画像が得られるか否かを判定する、ストレーム解析処理と、
前記ストリーム解析部で1画面の復号画像が得られないと判定された場合に、前記ストリーム解析部での解析結果に基づき、1画面のうち復号画像が得られない領域の画像を補完するビットストリームを生成する、ストリーム生成処理と、
をコンピュータに実行させるプログラムよりなる。
本発明によれば、復号化装置の変更等無しに、高速再生、高速逆再生等の特殊再生を実現することができる。
本発明の第1の実施の形態の構成を示すブロック図である。 本発明の第1の実施の形態の処理手順を示す流れ図である。 本発明の第1の実施の形態の動作を説明する図である。 本発明の第2の実施の形態の処理手順を示す流れ図である。 本発明の第2の実施の形態の動作を説明する図である。 本発明の第2の実施の形態の動作の別の例を説明する図である。 本発明の第3の実施の形態の構成を示すブロック図である。 本発明の第3の実施の形態の処理手順を示す流れ図である。 本発明の第4の実施の形態の構成を示すブロック図である。 本発明の第5の実施の形態の構成を示すブロック図である。 本発明の第5の実施の形態における管理テーブルの例を示す図である。 本発明の第5の実施の形態における管理テーブルの別の例を示す図である。 動画像符号化のピクチャ構成の例を示す図である。 関連技術の動作例を説明する図である。 関連技術の構成を示すブロック図である。 フレーム符号化とフィールド符号化の動作を示す図である。 フィールド符号化されたビットストリームの例を示す図である。 フィールド符号化されたビットストリームの別の例を示す図である。
符号の説明
101 ストリーム抜き出し部
102 ストリーム並び替え部
201 ストリーム抜き出し部
202 ストリーム解析部
204 ストリーム生成部
251 ストリーム抜き出し部
252 ストリーム解析部
253 ストリーム合成部
254 ストリーム生成部
301 ビットストリーム切り替え装置
302 動画像ストリーム加工装置
303 動画像復号化装置
304 動画像表示装置
401 記憶媒体
402 ビットストリーム切り替え装置
403 ビットストリーム送出装置
411 ビットストリーム
412 特殊再生用ビットストリーム
413 管理テーブル
次に、本発明を実施の形態について図面を参照して詳細に説明する。関連技術等にしたがって手法で作成した高速再生ビットストリームや高速逆再生ビットストリームでは、1フィールド分の画像情報しか含まれず、そのストリームを復号化しても1画面の復号結果が得られない場合に対して、本発明においては、1画面のうち復号画像が得られない領域の画像を補完するストリームを追加生成し合成して、高速再生や高速逆再生等、特殊再生用のビットストリームを出力し、作成された特殊再生用ビットストリームを復号化することで1画面の復号結果が得られるようにしている。この特殊再生用ビットストリームは、通常の復号化装置に入力して復号可能であるため、特殊再生を実現するための追加機能等を持たない、通常の復号化装置に、特殊再生用ストリームを入力して復号することで、高速再生や高速逆再生等の特殊再生が実現できる。このように、本発明によれば、関連技術の手法では、高速再生ビットストリームや高速逆再生ビットストリームを作成することができないようなピクチャ構造、フレーム間予測関係で符号化されたビットストリームを入力した場合でも、高速再生や高速逆再生を実現するための追加機能を持たない任意の復号化装置を用いて、高速再生、高速逆再生等の特殊再生を実現することができる。
<実施の形態1>
図1は、本発明の第1の実施の形態の構成を示す図である。図2は、本発明の第1の実施形態の動作手順を示すフローチャートである。図3は、本発明の第1の実施形態を模式的に説明するための図である。図1を参照すると、本発明の第1の実施形態は、動画像を符号化したビットストリームからフレーム内符号化されたピクチャのビットストリームを抜き出すストリーム抜き出し部201と、抜き出されたフレーム内符号化されたピクチャのビットストリームを解析し、該解析結果から、該フレーム内符号化されたピクチャを復号すれば前記フレーム内符号化されたピクチャを含む1画面の復号画像が得られるか否かを判定するストリーム解析部202と、ストリーム解析部202で1画面の復号画像が得られないと判定された場合に、ストリーム解析部202で為された解析結果に基づき、1画面のうち復号画像が得られない領域の画像を補完するビットストリームを生成するストリーム生成部204とを備えている。なお、図1のストリーム抜き出し部201は、図15のストリーム抜き出し部101と実質的に同一の構成とされる。ストリーム抜き出し部201とストリーム解析部202とストリーム生成部204とは、動画像ストリーム加工装置を構成している。
次に、本発明の第1の実施形態の動作を説明する。処理が開始すると(ステップS1001)、ストリーム抜き出し部201は、入力されるビットストリームを読み、Iピクチャが含まれるかどうかを判定する(ステップS1002)。ステップS1002の判定処理において、H.264の場合(ステップS1002のYes分岐)、例えばslice_header()のslice_typeによって、符号化タイプを判定できる。
ステップS1002の判定の結果、Iピクチャが存在しない場合には(ステップS1002のNo分岐)、ステップS1009に移る。
ステップS1002の判定の結果、Iピクチャが存在する場合には(ステップS1002のYes分岐)、ストリーム抜き出し部201でIピクチャのストリームを抜き出し、ストリーム解析部202に供給する(ステップS1003)。
ストリーム解析部202は、Iピクチャのストリームを解析し、以降の処理の必要な情報を取得する(ステップS1004)。ここで、ストリーム解析部202が取得する情報として、例えば、フレーム符号化かフィールド符号化か、フィールド符号化の場合にはトップフィールドであるか、IDR(Instantaneous Decoding Refresh)ピクチャであるか、等が含まれる。
次に、ストリーム解析部202は、取得した解析情報を基に、Iピクチャを復号化することで、1画面全体の復号画像が得られるか否かを判定する(ステップS1005)。H.264の場合、Iピクチャがフィールド符号化されていれば、1画面のうち片方のフィールドの復号画像しか得られず、ステップS1005の判定は「No」となる。
ステップS1005の判定が「No」の場合には、ストリーム解析部202は、ストリーム生成部204に必要な情報(ビットストリームの解析結果情報)を供給し、ストリーム生成部204で、復号画像が得られない領域の画像を補完するようなビットストリームを生成する(ステップS1006)。
ステップS1005の判定が「Yes」の場合には、ステップS1007に移る。
ステップS1007では、ストリーム抜き出し部201で抜き出されたIピクチャのストリームと、ストリーム生成部204で生成したビットストリーム(存在する場合のみ)を出力し、その後、ステップS1002に戻って、入力ビットストリームから次のIピクチャを探す。
ステップS1009で処理が終了する。
ストリーム生成部204で生成するビットストリームとしては、復号結果を自然な画像にするのが望ましいため、例えばIピクチャの復号画像と全く同一であるか、あるいは、ほぼ同一な復号画像を得られるように、Iピクチャのビットストリームを複製し、動画像符号化規格に準拠するために必要な変更を加えることで生成するようにしてもよい。
H.264の場合、例えばIピクチャがIDRピクチャであった場合には、生成するピクチャはIDRで無くす必要があるため、
nal_unit_type(NAL(Network Abstraction Layer)ユニットの種類を識別する識別子)を変更する、
slice_header()のidr_pic_idを削除する
等の変更を行なう。
さらに、Iピクチャの符号化パラメータによっては、slice_header()の
frame_num、
bottom_field_flag、
pic_order_cnt_lsb
等のパラメータを修正する。
また、Iピクチャをフレーム間予測で参照し、長さ零の動きベクトルで動き補償し、残差信号は零であるようなPピクチャ又はBピクチャのビットストリームを生成するようにしてもよい。
また、Iピクチャの復号画像から空間的に画像を補間する復号画像が得られるように、Iピクチャをフレーム間予測で参照し、縦方向に、長さ0.5画素の動きベクトルで動き補償し、残差信号は零であるようなPピクチャ又はBピクチャのビットストリームを生成するようにしてもよい。
H.264の場合、ピクチャ内の全てのマクロブロックを、長さ零(ゼロ)の動きベクトルや、縦方向に長さ0.5画素の動きベクトルで、動き補償し、残差信号は零であるようなビットストリームは、例えば、ピクチャ先頭の一定個数のマクロブロックについてのみ動きベクトル情報を符号化し、残りはスキップマクロブロックとして符号化することで、容易に生成できる。
H.264の場合について図3の例を用い、IピクチャI12のビットストリームを抜き出した場合の動作例を説明する。
説明を簡単にするため、I12はIDRピクチャ(すなわち、nal_unit_type=5)であり、トップフィールドピクチャ(すなわち、field_pic_flag=1、bottom_field_flag=0)であるとする。
このストリームを、ストリーム解析部202で解析すると、I12は、フィールドピクチャであるため、I12のみを復号しても、1画面全体の復号画像が得られないと判定される。
そこで、ストリーム生成部204では、復号画像が得られない領域の画像を補完するようなビットストリームを生成する。
I12は、トップフィールドピクチャであるため、ボトムフィールドピクチャのビットストリームを生成すればよい。
作成するストリームの例として、IピクチャI12と同じ復号結果が得られるIピクチャ(ここではI13’と呼ぶ)を生成する場合について説明する。
この場合、slice_data()以下のビットストリームはI12を流用できるが、slice_header()より上の層では、動画像符号化規格に準拠するためにストリームの変更が必要である。
具体的には、非IDRのIピクチャで、ボトムフィールドピクチャ(field_pic_flag=1、bottom_field_flag=1)、frame_num=0となるように、slice_header()より上の層のビットストリームを変更する。
動画像符号化規格に準拠するためには、上記以外にも変更が必要なパラメータが生ずる場合もあるが、個々のケースの詳細説明は省略する。
このようにして、I13’のビットストリームを生成するにあたり、通常の符号化処理は不要であり、ビットストリームの一部を変更するだけで済み、このため少ない演算量で実現できる。
また、作成するストリームの別の例として、I12のみをフレーム間予測で参照し、縦方向に、長さ0.5画素の動きベクトルで動き補償し、残差信号は零であるようなPピクチャ(ここではPS13’と呼ぶ)を生成する場合についても、以下に簡単に説明する。
この場合、ボトムフィールドピクチャ、frame_num=0のPピクチャを生成する。また、マクロブロックは、すべて、縦方向に+0.5画素の位置から動き補償し、残差信号は零とする。これにより、I12の復号画像からH.264で規定されている半画素位置補間フィルタによって補間画像を作成し、それを、ボトムフィールドの画像とするようなビットストリームを容易に生成できる。
I13’を生成する第1の例では、ボトムフィールドの画素値は、I12の画素値を繰り返したのに相当する復号画像が得られるが、PS13’を生成する第2の例では、半画素位置補間フィルタで、ボトムフィールドを補間したのに相当する復号結果が得られる。画質的には、第1の例より、第2の例の方が優れている。
本発明の第1の実施の形態では、Iピクチャのストリームを抜き出した後に、それを解析し、H.264でフィールド符号化されている場合等、Iピクチャのみでは1画面全体の復号画像が得られない場合には、復号画像が得られない領域の画像を補完するようなビットストリームを生成する。
図3の例では、抜き出したIピクチャI12だけでは1画面の復号画像が得られないため、補完するPピクチャのストリームP13’を生成する。例えばH.264のような動画像符号化の国際標準規格に準拠したフォーマットでストリームを生成することで、出力される、I12及びP13’のビットストリームを合わせると、1画面の復号画像が得られるビットストリームとなり、規格に準拠した復号化装置で復号化すれば、同じ復号化画像が得られる。
これにより、復号化装置の変更無しに高速再生、高速逆再生等の特殊再生を実現できる動画像ストリーム加工装置及び方法を提供することができる。
<実施の形態2>
図4は、本発明の第2の実施の形態の動作手順を示すフローチャートである。図5は、第2の実施形態の動作の概要を説明するための図である。本発明の第2の実施の形態の構成は、図1に示した構成とされ、前記第1の実施の形態の構成と同一である。
また、図4のフローチャートにおいて、ステップS1103、S1104、S1105を除くステップS1101〜S1109は、それぞれ、図2のフローチャートのステップS1001〜S1009と同一である。
本発明の第2の実施の形態では、ステップS1103のストリーム抜き出し部201の処理が、Iピクチャのみでなく、Iピクチャに後続する所定数のピクチャのストリームも合わせて抜き出し、ストリーム解析部202に供給する。
ストリーム解析部202は、入力されるIピクチャ及び後続ピクチャのストリームを解析し、以降の処理の必要な情報を取得する(ステップS1104)。ストリーム解析部202が取得する情報には、前記第1の実施形態で挙げた情報の他に、例えば、
・各ピクチャのフレーム番号、
・表示順番号
等が含まれる。
次のステップS1105において、取得した情報を基に、Iピクチャ及び後続ピクチャのストリームを復号化することで、Iピクチャを含む1画面全体の復号画像が得られるかどうかを判定する。
例えば、H.264でIピクチャ及び後続の1枚のピクチャを抜き出す場合、
Iピクチャと後続ピクチャが、complementary field pairであり、かつ、
IピクチャがIDRピクチャであるか、後続ピクチャがIピクチャである、
場合等に、1画面全体の復号画像が得られると判定できる。
本発明の第2の実施の形態では、Iピクチャ及び後続の所定数のピクチャのストリームを抜き出した後に、解析し、抜き出したストリームのみでは、Iピクチャを含む1画面全体の復号画像が得られない場合に、復号画像が得られない領域の画像を補完するようなビットストリームを生成する。
図5は、Iピクチャ及び後続の1枚のピクチャのストリームを抜き出す場合の動作例である。
前記第1の実施の形態では、抜き出したIピクチャI12だけでは1画面の復号画像が得られないため、補完するPピクチャのストリームP13’(図3参照)を生成する。
本発明の第2の実施形態では、IピクチャI12に加え、後続のPピクチャP13も抜き出す。
I12及びP13を復号化すれば、I12を含む1画面の復号画像が得られる。このため、本発明の第2の実施の形態では、ストリーム生成部204は、ストリーム生成を行わない。
Iピクチャ及び後続の所定数のピクチャのストリームを復号することで、Iピクチャを含む1画面全体の復号画像が得られる場合には、ストリーム生成処理を行わないようにしたため、演算処理量を低減している。また、画像の入力ビットストリームをそのまま特殊再生に利用するため、画質低下が生じない。
図6は、入力ストリームのピクチャ構成が異なる別の例を示している。図6に示す例は、図5で説明した、Iピクチャ及び後続の1枚のピクチャのストリームを抜き出す動作ではI12を含む1画面の復号画像を得られないため、I12に対応するフィールドピクチャのストリームをストリーム生成部204で生成する。
図6に示す例では、別の動作例として、ストリーム抜き出し部201は、Iピクチャ及び後続の3枚のピクチャのストリームを抜き出す。この動作では、抜き出したストリームを復号すれば、I12を含む1画面の復号画像が得られるため、ストリーム生成部204でのストリーム生成は行わなくて良い。
しかし、図6に示した、Iピクチャ及び後続の3枚のピクチャのストリームを抜き出す動作でも、図3に示したようなピクチャ構成の入力ビットストリームが入力された場合には、ストリーム生成部204でのストリーム生成が必要になる。
このように、Iピクチャに後続してストリームを抜き出すピクチャの枚数が多いほど、ストリーム生成部204でのストリーム生成を行わなくてよい場合が増加する。しかし、Iピクチャを含む1画面全体の復号画像を得るために復号しなければならないストリーム量が増加し、復号化装置の負荷が増大する可能性がある。
このため、Iピクチャに後続してストリームを抜き出すピクチャの適切な枚数は、動作条件や要求性能に応じて、変わる。
<実施の形態3>
図7は、本発明の第3の実施の形態の構成を示すブロック図である。図8は、本発明の第3の実施の形態の動作手順を示すフローチャートである。
図7を参照すると、本発明の第3の実施の形態の構成における、ストリーム抜き出し部251、ストリーム解析部252、ストリーム生成部254は、図1の前記第1及び第2の実施の形態における、201、202、204とそれぞれ同一である。
本発明の第3の実施の形態の構成は、さらにストリーム合成部253を備えている。
図8のフローチャートにおいて、ステップS1207、S1208を除くステップS1201〜S1209は、それぞれ、図4を参照して説明した、前記第2の実施の形態のフローチャートのステップS1101〜S1109と同一である。
本発明の第3の実施の形態では、ステップS1207において、ストリーム抜き出し部251で抜き出されたビットストリームと、ストリーム生成部254で生成したビットストリームをストリーム合成部253に対して出力する。
ステップS1208では、ストリーム抜き出し部251及びストリーム生成部254から供給されるビットストリームを、1画面の復号結果が得られる単位ごとに合成し、1本のビットストリームとして出力する。例えば図3に示した例では、I12とP13’のビットストリームをこの順で並べたものが1画面の復号結果が得られる単位となる。
本発明の第3の実施の形態では、ストリーム抜き出し部251で抜き出したビットストリームと、ストリーム生成部254で生成したビットストリームをストリーム合成部253で1画面の復号結果が得られる単位ごとに合成して出力するため、この単位ごとに独立して復号化装置で復号し1画面の復号画像を得ることができる。
このため、出力ビットストリームを、この単位毎に並び替えることで、特殊再生を容易に実現できる効果が得られる。
例えば、ビットストリームを、この単位毎に、表示順序に従って並べて出力すると、高速再生用ビットストリームとなる。
また、ビットストリームを、この単位毎に、表示順序と逆順に並べて出力すると、高速逆再生用ビットストリームとなる。
さらに、所定のプレイリストに従って並べて出力すると、プレイリスト再生が容易に実現できる。
<実施の形態4>
図9は、本発明の第4の実施の形態の構成を示す図である。図9において、動画像ストリーム加工装置302は、前記した第1又は第2の実施の形態の動画像ストリーム加工装置からなる。
ビットストリーム切り替え装置301は、
・通常再生時には、入力されるビットストリームを直接動画像復号化装置303に供給し、
・高速再生、高速逆再生等特殊再生時には、入力ビットストリームを動画像ストリーム加工装置302に供給し、また動画像ストリーム加工装置302の出力ビットストリームを動画像復号化装置303に供給する。
動画像ストリーム加工装置302は、入力されたビットストリームに対し、前記第1又は第2の実施の形態で説明した、特殊再生用ビットストリーム生成の処理を行い、処理結果のビットストリームを出力する。
動画像復号化装置303は、入力されるビットストリームの復号処理を行い、復号結果の画像を動画像表示装置304に供給する。
動画像表示装置304は、入力される画像を例えばCRTや液晶ディスプレイ等の表示部に表示出力する。
本発明の第4の実施の形態では、通常再生時には、入力ビットストリームをそのまま動画像復号化装置303に供給し、高速再生、高速逆再生等特殊再生時には、動画像ストリーム加工装置302で高速再生、高速逆再生等特殊再生用ストリームを生成して動画像復号化装置303に供給する。
かかる構成により、動画像復号化装置に特殊再生向けの新たな機能追加等を行わずに高速再生、高速逆再生等の特殊再生を実現できる動画像再生装置を提供することができる。
<実施の形態5>
次に、本発明の第5の実施の形態を説明する。図10は、本発明の第5の実施の形態の構成を示すブロック図である。記憶媒体401は、動画像を符号化したビットストリーム411と、ビットストリーム411を、前記第1又は第2の実施の形態の動画像ストリーム加工装置に入力して生成した高速再生、高速逆再生等特殊再生用の特殊再生用ビットストリーム412と、ビットストリーム411と特殊再生用ビットストリーム412の関連付け情報を記録した管理テーブル413とを備える。
管理テーブル413には、ビットストリーム411と特殊再生用ビットストリーム412の切り替えを可能にする情報を格納する。
図11は、管理テーブル413の簡易な一例を示す図である。図11に示した例では、図10の管理テーブル413は、ビットストリーム411と特殊再生用ビットストリーム412それぞれを格納したファイル名を対応付けて格納し、ストリーム切り替えを可能にする。
また、図10の管理テーブル413には、例えば図12に示すような情報を格納してもよい。図12に示す例では、図10の管理テーブル413は、ビットストリーム411と、特殊再生用ビットストリーム412(高速再生用ビットストリーム、及び、高速逆再生用ビットストリーム)をそれぞれを格納したファイル名を対応付けて格納するのに加え、特殊再生用ビットストリーム412の各ピクチャに対応するビットストリーム411でのタイムスタンプを格納している。このような情報を格納することで、
・通常再生から特殊再生へ、あるいは、
・特殊再生から通常再生へ、
動作を切り替える際に、再生位置のタイムスタンプを継承した自然な動作切り替えが可能になる。
図10を参照すると、ビットストリーム切り替え装置402は、通常再生時には記憶媒体401からビットストリーム411を読み出してビットストリーム送出装置403に供給し、高速再生、高速逆再生等の特殊再生時には、管理テーブル413を参照してビットストリーム411に関連付けられている特殊再生用ビットストリーム412を読み出してビットストリーム送出装置403に供給する。
ビットストリーム送出装置403は、入力されるビットストリームを所定の受信端末に向けてコンピュータネットワーク等の伝送路に送出する。
本発明の第5の実施の形態では、通常のビットストリームと、特殊再生用ビットストリームとを関連付けて格納し、
通常再生時には、通常のビットストリームを受信端末に向け送出し、
特殊再生時には、関連付けられている特殊再生用ビットストリームを受信端末に向け送出する、
ように構成することで、受信端末の動画像復号化装置に特殊再生向けの新たな機能追加等を行うことなく、高速再生、高速逆再生等の特殊再生を実現できる動画像配信装置を提供することができる。
上記各実施の形態では、本発明を、H.264動画像符号化方式に適用した例について説明したが、本発明は、前記適用例にのみに限定されるものではなく、Iピクチャ抜き出しによる従来の特殊再生ストリーム生成方式では1画面全体の復号結果が得られない場合がある、他の動画像符号化方式、例えばSMPTE(Society of Motion Pictures and Television Engineers)が規格化したVC−1等にも適用可能である。
また、抜き出したストリームを復号すれば、1画面全体の復号画像が得られるかの判定に関して、
・Iピクチャがフィールド符号化されているか、あるいは、
・Iピクチャと後続ピクチャとがcomplementary field pairであるか、
等の情報から判定する例について説明したが、判定の方法は、これらに限定されるものではないことは勿論である。例えば、実際に復号処理を実行してみて正しく復号可能であったか、という判定方法等を用いてもよい。
また、ストリーム生成部では、
・Iピクチャのビットストリームを複製し、動画像符号化規格に準拠するために必要な変更を加えてストリームを生成する例や、
・Iピクチャをフレーム間予測で参照し、縦方向に長さ0.5画素の動きベクトルで動き補償するようなPピクチャ又はBピクチャのビットストリームを生成する例
に即して説明したが、ストリームの生成手法は、これらに限定されるものではないことは勿論である。
例えば、復号画像の得られない領域の画像信号を補間フィルタ等で生成し、それを、動画像を圧縮符号化してビットストリームを出力する符号化装置に入力して符号化することでストリームを生成するという手法を用いてもよい。
また、フレーム内符号化されたピクチャをIピクチャと表記して説明してきたが、より小さい画像領域を指すことが多いIスライスを利用して特殊再生ストリームを生成する場合にも、本発明を適用することができる。
さらに、スライス単位やマクロブロック単位のイントラリフレッシュを用いて符号化されたビットストリームにも、本発明を適用することができることは勿論である。
また、特殊再生の例として、高速再生や高速逆再生の場合を例に挙げて説明したが、再生方式は、これらに限定されることは無い。例えばプレイリスト再生や、別のビットストリームへの再生位置移動等にも、本発明を適用することができる。請求の範囲の特殊再生は、高速再生、高速逆再生以外を含むことは勿論である。
また上記各実施の形態における、ストリーム抜き出し部、ストリーム解析部、ストリーム生成部、あるいはストリーム合成部は、これら各部の処理・機能を実現するコンピュータ・プログラムを例えば記録媒体から、主記憶等にロードして実行するコンピュータ(プロセッサ)で実現するようにしてもよい。
なお、本発明の全開示(請求の範囲を含む)の枠内において、さらにその基本的技術思想に基づいて、実施形態ないし実施例の変更・調整が可能である。また、本発明の請求の範囲の枠内において種々の開示要素の多様な組み合わせないし選択が可能である。すなわち、本発明は、請求の範囲を含む全開示、技術的思想にしたがって当業者であればなし得るであろう各種変形、修正を含むことは勿論である。

Claims (23)

  1. 動画像を符号化したビットストリームより抜き出された、フレーム内符号化されたピクチャのビットストリームを解析し、該解析結果を基に、前記抜き出されたフレーム内符号化されたピクチャを復号すれば前記フレーム内符号化されたピクチャを含む1画面の復号画像が得られるか否かを判定するストリーム解析部と、
    前記ストリーム解析部で1画面の復号画像が得られないと判定された場合に、前記ストリーム解析部での解析結果に基づき、1画面のうち復号画像が得られない領域の画像を補完するビットストリームを生成するストリーム生成部と、
    を備え
    前記フレーム内符号化されたピクチャがフィールドピクチャであり、
    前記ストリーム生成部は、前記1画面のうち復号画像が得られない領域を、前記フレーム内符号化されたピクチャの情報を利用して、前記フレーム内符号化されたフィールドピクチャの画像と同一又は類似した画像で補完するビットストリームを生成する、ことを特徴とする動画像ストリーム加工装置。
  2. 前記動画像を符号化したビットストリームからフレーム内符号化されたピクチャのビットストリームを抜き出し、該抜き出したビットストリームを前記ストリーム解析部に供給するストリーム抜き出し部をさらに備えた、
    ことを特徴とする請求項1記載の動画像ストリーム加工装置。
  3. 前記ストリーム生成部は、前記フレーム内符号化されたピクチャのビットストリームの所定箇所を変更し、前記1画面のうち復号画像が得られない領域の画像を補完する、フレーム内符号化されたピクチャのビットストリームを生成する、
    ことを特徴とする請求項1又は2に記載の動画像ストリーム加工装置。
  4. 動画像を符号化したビットストリームより抜き出された、フレーム内符号化されたピクチャのビットストリームを解析し、該解析結果を基に、前記抜き出されたフレーム内符号化されたピクチャを復号すれば前記フレーム内符号化されたピクチャを含む1画面の復号画像が得られるか否かを判定するストリーム解析部と、
    前記ストリーム解析部で1画面の復号画像が得られないと判定された場合に、前記ストリーム解析部での解析結果に基づき、1画面のうち復号画像が得られない領域の画像を補完するビットストリームを生成するストリーム生成部と、
    を備え、
    前記ストリーム生成部は、前記フレーム内符号化されたピクチャのみをフレーム間予測で参照し、前記1画面のうち復号画像が得られない領域の画像を補完する片方向予測符号化又は双方向予測符号化されたピクチャのビットストリームを生成する、
    ことを特徴とする動画像ストリーム加工装置。
  5. 前記動画像を符号化したビットストリームからフレーム内符号化されたピクチャのビットストリームを抜き出し、該抜き出したビットストリームを前記ストリーム解析部に供給するストリーム抜き出し部をさらに備えた、
    ことを特徴とする請求項4記載の動画像ストリーム加工装置。
  6. 前記動画像を符号化したビットストリームより抜き出された、フレーム内符号化されたピクチャのビットストリームと、前記ストリーム生成部で生成されたビットストリームとを受け、受けとった前記ビットストリームから、1画面の復号画像を得られるビットストリームを合成するストリーム合成部をさらに備えた、
    ことを特徴とする請求項1乃至5のいずれか一項に記載の動画像ストリーム加工装置。
  7. 前記ストリーム抜き出し部は、前記フレーム内符号化されたピクチャ及び後続の所定数のピクチャのビットストリームを抜き出して前記ストリーム解析部に供給する、
    ことを特徴とする請求項2に記載の動画像ストリーム加工装置。
  8. 前記ストリーム解析部が、前記ストリーム抜き出し部で抜き出された前記フレーム内符号化されたピクチャ及び後続の所定数のピクチャのビットストリームのみでは、前記フレーム内符号化されたピクチャを含む1画面の復号画像が得られないと判定した場合に、前記ストリーム生成部は、1画面のうち復号画像が得られない領域の画像を補完するようなビットストリームを生成する、ことを特徴とする請求項7に記載の動画像ストリーム加工装置。
  9. 動画像を符号化したビットストリームの復号化を行なう動画像復号化装置と、
    請求項1乃至8のいずれか一項に記載の動画像ストリーム加工装置と、
    ビットストリーム切り替え装置と、
    動画像表示装置と、
    を備え、
    前記ビットストリーム切り替え装置は、
    通常再生時には、前記動画像ストリーム加工装置を通さずに、入力ビットストリームを、直接、前記動画像復号化装置に供給し、
    特殊再生時には、入力ビットストリームを前記動画像ストリーム加工装置に供給し、前記動画像ストリーム加工装置は生成したビットストリームを前記動画像復号化装置に供給し、
    前記動画像復号化装置は、供給されたビットストリームを復号化して復号画像を前記動画像表示装置に供給し、
    前記動画像表示装置は復号画像を表示出力する、
    ことを特徴とする動画像再生装置。
  10. 動画像を符号化したビットストリームを、請求項1乃至8のいずれか一項に記載の動画像ストリーム加工装置に入力し、前記動画像ストリーム加工装置の出力として生成された、特殊再生用ビットストリーム。
  11. 動画像を符号化したビットストリームと、
    前記動画像を符号化したビットストリームを、請求項1乃至8のいずれか一項に記載の動画像ストリーム加工装置に入力し、前記動画像ストリーム加工装置の出力として生成された特殊再生用ビットストリームと、
    前記ビットストリームと前記特殊再生用ビットストリームとのストリーム切り替えを行うための関連付け情報を有する管理テーブルと、
    を備える、ことを特徴とする記憶媒体。
  12. 請求項11に記載の記憶媒体と、
    ビットストリーム切り替え装置と、
    ビットストリーム送出装置と、
    を備え、
    前記ビットストリーム切り替え装置は、
    通常再生時には、前記記憶媒体から、前記ビットストリームを読み出して前記ビットストリーム送出装置に供給し、
    特殊再生時には、前記記憶媒体から、前記管理テーブルを参照して、前記ビットストリームと関連付けられている前記特殊再生用ビットストリームを読み出して、前記ビットストリーム送出装置に供給し、
    前記ビットストリーム送出装置は、
    供給されたビットストリームを所定の受信端末に向けて伝送路に送出する、
    ことを特徴とする動画像配信装置。
  13. 動画像を符号化したビットストリームより抜き出された、フレーム内符号化されたピクチャのビットストリームを解析し、該解析結果を基に、前記抜き出されたフレーム内符号化されたピクチャを復号すれば前記フレーム内符号化されたピクチャを含む1画面の復号画像が得られるか否かを判定する、ストレーム解析工程と、
    前記ストリーム解析部で1画面の復号画像が得られないと判定された場合に、前記ストリーム解析部での解析結果に基づき、1画面のうち復号画像が得られない領域の画像を補完するビットストリームを生成する、ストリーム生成工程と、
    を含み、
    フレーム内符号化されたピクチャがフィールドピクチャであり、
    前記ストリーム生成工程は、前記1画面のうち復号画像が得られない領域を、前記フレーム内符号化されたピクチャの情報を利用しフレーム内符号化されたフィールドピクチャの画像と同一又は類似した画像で補完するビットストリームを生成する、
    ことを特徴とする動画像ストリーム加工方法。
  14. 前記ストリーム生成工程は、前記フレーム内符号化されたピクチャのビットストリームの所定箇所を変更し、前記1画面のうち復号画像が得られない領域の画像を補完するフレーム内符号化されたピクチャのビットストリームを生成する、
    ことを特徴とする請求項13に記載の動画像ストリーム加工方法。
  15. 動画像を符号化したビットストリームより抜き出された、フレーム内符号化されたピクチャのビットストリームを解析し、該解析結果を基に、前記抜き出されたフレーム内符号化されたピクチャを復号すれば前記フレーム内符号化されたピクチャを含む1画面の復号画像が得られるか否かを判定する、ストレーム解析工程と、
    前記ストリーム解析部で1画面の復号画像が得られないと判定された場合に、前記ストリーム解析部での解析結果に基づき、1画面のうち復号画像が得られない領域の画像を補完するビットストリームを生成する、ストリーム生成工程と、
    を含み、
    前記ストリーム生成工程は、前記フレーム内符号化されたピクチャのみをフレーム間予測で参照し前記1画面のうち復号画像が得られない領域の画像を補完する片方向予測符号化または双方向予測符号化されたピクチャのビットストリームを生成する、
    ことを特徴とする動画像ストリーム加工方法。
  16. 前記動画像を符号化したビットストリームより抜き出された、フレーム内符号化されたピクチャのビットストリームと、前記ストリーム生成工程で生成されたビットストリームとから、1画面の復号画像を得られるビットストリームを合成するストリーム合成工程をさらに含む、
    ことを特徴とする請求項13に記載の動画像ストリーム加工方法。
  17. 前記動画像を符号化したビットストリームから、フレーム内符号化されたピクチャ及び後続の所定数のピクチャのビットストリームを抜き出し、前記抜き出したビットストリームを前記ストリーム解析工程に供する、ストリーム抜き出し工程を含む、
    ことを特徴とする請求項13乃至1のいずれか一項に記載の動画像ストリーム加工方法。
  18. 通常再生時には、
    入力ビットストリームを、直接、動画像復号化装置に供給し、
    特殊再生時には、入力ビットストリームに対して、請求項13乃至1のいずれか一項に記載の動画像ストリーム加工方法で加工してなるビットストリームを前記動画像復号化装置に供給するように、
    ビットストリームの切り替えを行う工程と、
    前記動画像復号化装置は供給されたビットストリームを復号化し、動画像表示装置に復号画像を表示出力する工程と、
    を含む、ことを特徴とする動画像再生方法。
  19. 動画像を符号化したビットストリームより抜き出された、フレーム内符号化されたピクチャのビットストリームを入力して解析し、該解析結果を基に、前記抜き出されたフレーム内符号化されたピクチャを復号すれば前記フレーム内符号化されたピクチャを含む1画面の復号画像が得られるか否かを判定する、ストレーム解析処理と、
    前記ストリーム解析部で1画面の復号画像が得られないと判定された場合に、前記ストリーム解析部での解析結果に基づき、1画面のうち復号画像が得られない領域の画像を補完するビットストリームを生成する、ストリーム生成処理と、
    をコンピュータに実行させるプログラムであって、
    フレーム内符号化されたピクチャがフィールドピクチャであり、
    前記ストリーム生成処理は、前記1画面のうち復号画像が得られない領域を、前記フレーム内符号化されたピクチャの情報を利用しフレーム内符号化されたフィールドピクチャの画像と同一又は類似した画像で補完するビットストリームを生成する、
    ことを特徴とするプログラム。
  20. 前記ストリーム生成処理は、前記フレーム内符号化されたピクチャのビットストリームの所定箇所を変更し、前記1画面のうち復号画像が得られない領域の画像を補完するフレーム内符号化されたピクチャのビットストリームを生成する、
    ことを特徴とする請求項19に記載のプログラム。
  21. 動画像を符号化したビットストリームより抜き出された、フレーム内符号化されたピクチャのビットストリームを入力して解析し、該解析結果を基に、前記抜き出されたフレーム内符号化されたピクチャを復号すれば前記フレーム内符号化されたピクチャを含む1画面の復号画像が得られるか否かを判定する、ストレーム解析処理と、
    前記ストリーム解析部で1画面の復号画像が得られないと判定された場合に、前記ストリーム解析部での解析結果に基づき、1画面のうち復号画像が得られない領域の画像を補完するビットストリームを生成する、ストリーム生成処理と、
    をコンピュータに実行させるプログラムであって、
    前記ストリーム生成処理は、前記フレーム内符号化されたピクチャのみをフレーム間予測で参照し前記1画面のうち復号画像が得られない領域の画像を補完する片方向予測符号化または双方向予測符号化されたピクチャのビットストリームを生成する、
    ことを特徴とするプログラム。
  22. 前記動画像を符号化したビットストリームより抜き出された、フレーム内符号化されたピクチャのビットストリームと、前記ストリーム生成処理で生成されたビットストリームとから、1画面の復号画像を得られるビットストリームを合成するストリーム合成処理をさらに含む、
    ことを特徴とする請求項19乃至2のいずれか一項に記載のプログラム。
  23. 前記動画像を符号化したビットストリームから、フレーム内符号化されたピクチャ及び後続の所定数のピクチャのビットストリームを抜き出し、前記抜き出したビットストリームを前記ストリーム解析処理に供する、ストリーム抜き出し処理を含む、
    ことを特徴とする請求項19乃至2のいずれか一項に記載のプログラム。
JP2009500205A 2007-02-21 2008-02-20 動画像ストリーム加工装置及び該装置を備えた動画像再生装置並びに方法とプログラム Expired - Fee Related JP5136546B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2009500205A JP5136546B2 (ja) 2007-02-21 2008-02-20 動画像ストリーム加工装置及び該装置を備えた動画像再生装置並びに方法とプログラム

Applications Claiming Priority (4)

Application Number Priority Date Filing Date Title
JP2007041124 2007-02-21
JP2007041124 2007-02-21
JP2009500205A JP5136546B2 (ja) 2007-02-21 2008-02-20 動画像ストリーム加工装置及び該装置を備えた動画像再生装置並びに方法とプログラム
PCT/JP2008/052829 WO2008102794A1 (ja) 2007-02-21 2008-02-20 動画像ストリーム加工装置及び該装置を備えた動画像再生装置並びに方法とプログラム

Publications (2)

Publication Number Publication Date
JPWO2008102794A1 JPWO2008102794A1 (ja) 2010-05-27
JP5136546B2 true JP5136546B2 (ja) 2013-02-06

Family

ID=39710068

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2009500205A Expired - Fee Related JP5136546B2 (ja) 2007-02-21 2008-02-20 動画像ストリーム加工装置及び該装置を備えた動画像再生装置並びに方法とプログラム

Country Status (4)

Country Link
US (1) US8964841B2 (ja)
EP (1) EP2120456B1 (ja)
JP (1) JP5136546B2 (ja)
WO (1) WO2008102794A1 (ja)

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH09172605A (ja) * 1995-12-20 1997-06-30 Sanyo Electric Co Ltd 特殊再生映像生成回路
JP2006277927A (ja) * 2006-05-19 2006-10-12 Hitachi Ltd 光ディスク記録方法

Family Cites Families (18)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5146325A (en) * 1991-04-29 1992-09-08 Rca Thomson Licensing Corporation Video signal decompression apparatus for independently compressed even and odd field data
JPH05344494A (ja) 1992-06-10 1993-12-24 Ricoh Co Ltd Mpeg動画像の早送り再生方式
KR0134871B1 (ko) * 1992-07-17 1998-04-22 사또오 후미오 고능률 부호화 복호화 시스템
US5793927A (en) * 1995-06-07 1998-08-11 Hitachi America, Ltd. Methods for monitoring and modifying a trick play data stream to insure MPEG compliance
JPH1141591A (ja) 1997-07-16 1999-02-12 Matsushita Electric Ind Co Ltd 画像復号化装置
US6259734B1 (en) * 1998-04-03 2001-07-10 Matsushita Electric Industrial Co., Ltd. Image processing method, image processing apparatus, and data storage media
KR20010022752A (ko) 1998-06-11 2001-03-26 요트.게.아. 롤페즈 디지털 비디오 레코더용 트릭 플레이 신호 발생
CN100551009C (zh) * 2001-04-24 2009-10-14 皇家菲利浦电子有限公司 用于产生视频信号的方法和设备
US20030159152A1 (en) * 2001-10-23 2003-08-21 Shu Lin Fast motion trick mode using dummy bidirectional predictive pictures
US7274857B2 (en) * 2001-12-31 2007-09-25 Scientific-Atlanta, Inc. Trick modes for compressed video streams
JP2003219362A (ja) 2002-01-23 2003-07-31 Matsushita Electric Ind Co Ltd 映像記録再生装置、映像記録再生方法および監視システム
KR100353602B1 (en) * 2002-04-15 2002-09-28 Id Digital Co Ltd System and method for reproducing motion picture streams regardless of change in playback speed
JP2004015700A (ja) 2002-06-11 2004-01-15 Sony Corp プログレッシブ変換方法、プログレッシブ変換装置、シーケンス検出方法、シーケンス検出装置および映像データ処理装置
JP2004040516A (ja) 2002-07-04 2004-02-05 Hitachi Ltd 画像記録装置
JP2004328634A (ja) 2003-04-28 2004-11-18 Sony Corp 画像復号化装置及び方法
WO2004114672A1 (en) * 2003-06-19 2004-12-29 Thomson Licensing S.A. Method and apparatus for low-complexity spatial scalable encoding
US7852919B2 (en) 2003-09-07 2010-12-14 Microsoft Corporation Field start code for entry point frames with predicted first field
JP5211569B2 (ja) * 2007-07-26 2013-06-12 ソニー株式会社 コンテンツ再生装置、コンテンツ再生方法、およびプログラム

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH09172605A (ja) * 1995-12-20 1997-06-30 Sanyo Electric Co Ltd 特殊再生映像生成回路
JP2006277927A (ja) * 2006-05-19 2006-10-12 Hitachi Ltd 光ディスク記録方法

Also Published As

Publication number Publication date
EP2120456A1 (en) 2009-11-18
JPWO2008102794A1 (ja) 2010-05-27
US8964841B2 (en) 2015-02-24
EP2120456A4 (en) 2010-06-09
US20100080294A1 (en) 2010-04-01
WO2008102794A1 (ja) 2008-08-28
EP2120456B1 (en) 2013-10-16

Similar Documents

Publication Publication Date Title
JP6556868B2 (ja) ビデオストリーミング装置、ビデオストリーム、ビデオストリーミング方法、及び、コンピュータプログラム
US8107531B2 (en) Signaling and repeat padding for skip frames
US8116380B2 (en) Signaling for field ordering and field/frame display repetition
US8761252B2 (en) Method and apparatus for scalably encoding and decoding video signal
US8755434B2 (en) Method and apparatus for scalably encoding and decoding video signal
KR20060006183A (ko) 컬러 영상의 신축적 부호화, 복호화 방법 및 장치
JP2008536438A (ja) 基準ピクチャを用いてビデオ信号をデコードする方法及び装置
KR20060088461A (ko) 영상신호의 엔코딩/디코딩시에 영상블록을 위한 모션벡터를베이스 레이어 픽처의 모션벡터로부터 유도하는 방법 및장치
US7822123B2 (en) Efficient repeat padding for hybrid video sequence with arbitrary video resolution
KR20090097015A (ko) 스케일러블 영상 부호화장치 및 스케일러블 영상복호화장치
EP2642764B1 (en) Transcoding a video stream to facilitate accurate display
KR100883602B1 (ko) 기준 픽쳐를 이용하여 비디오 신호를 인코딩/디코딩하는방법 및 장치
KR100260475B1 (ko) 화상 데이타 부호화 방법 및 장치, 화상 데이타 복호화 방법 및 장치 및 화상 기록 매체
JP5155159B2 (ja) 動画像復号装置
JP5170708B2 (ja) 動画像ストリーム加工方法及び装置、それを用いた動画像再生装置並びに動画像配信装置
TWI826969B (zh) 具輪廓與位階相依寫碼選項之編碼器與解碼器、編碼方法及解碼方法
JP4660408B2 (ja) 符号化方法
US20120155538A1 (en) Methods and devices for creating, decoding and transcoding an encoded video data stream
JP5136546B2 (ja) 動画像ストリーム加工装置及び該装置を備えた動画像再生装置並びに方法とプログラム
KR100708209B1 (ko) 컬러 영상의 신축적 부호화, 복호화 방법 및 장치
JP2009081781A (ja) 動き補償装置及び動き補償方法
JP2011091592A (ja) 画像符号化装置、符号変換装置、画像記録装置、画像再生装置、画像符号化方法及び、集積回路
JP2005094800A (ja) 動画像再符号化装置
JP2002027478A (ja) 画像情報符号化装置及び方法
US20130114740A1 (en) Image coding method, image coding apparatus, image decoding method, image decoding apparatus, and storage medium

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20110112

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20120724

A521 Written amendment

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20120924

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20121016

A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20121029

R150 Certificate of patent or registration of utility model

Ref document number: 5136546

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

Free format text: JAPANESE INTERMEDIATE CODE: R150

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20151122

Year of fee payment: 3

LAPS Cancellation because of no payment of annual fees