JP2004336128A - Video and audio signal editing method - Google Patents

Video and audio signal editing method Download PDF

Info

Publication number
JP2004336128A
JP2004336128A JP2003125368A JP2003125368A JP2004336128A JP 2004336128 A JP2004336128 A JP 2004336128A JP 2003125368 A JP2003125368 A JP 2003125368A JP 2003125368 A JP2003125368 A JP 2003125368A JP 2004336128 A JP2004336128 A JP 2004336128A
Authority
JP
Japan
Prior art keywords
data
packet
video
audio
mpeg
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2003125368A
Other languages
Japanese (ja)
Inventor
Hidefumi Takeda
英史 竹田
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Canon Inc
Original Assignee
Canon Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Canon Inc filed Critical Canon Inc
Priority to JP2003125368A priority Critical patent/JP2004336128A/en
Publication of JP2004336128A publication Critical patent/JP2004336128A/en
Pending legal-status Critical Current

Links

Images

Landscapes

  • Television Signal Processing For Recording (AREA)
  • Compression Or Coding Systems Of Tv Signals (AREA)

Abstract

<P>PROBLEM TO BE SOLVED: To solve a problem that no sound is heard or noise sound is generated because audio information is interrupted in decoding the encoded data of two MPEG-2 transport streams (TS) in the vicinity of division positions after division editing processing. <P>SOLUTION: The edit method is used for video signal data and audio signal data subjected to time division multiplexing compression by an MPEG-2 transport stream method recorded on a random accessible recording medium, and replaces data which configures a transport packet having audio frame data before and after the division positions with a NULL packet having neither video information nor audio information when multiplexed audio frame information bridging over video data configuring a GOP (Group Of Pictures) exists at the division positions DIV of the MPEG-2 TS being an edit object. <P>COPYRIGHT: (C)2005,JPO&NCIPI

Description

【0001】
【発明の属する技術分野】
本発明は、ディジタル動画音声圧縮技術規格(Moving PictureExperts Group:以下、MPEGという。)を用いて、符号化ディジタル動画像データとディジタル音声データとを時分割多重化したMPEG2トランスポートストリームデータの編集方法に関するものである。
【0002】
【従来の技術】
現在、公知技術としてIEC/ISO 13818において規定されるMPEG規格は、日本国内及び欧米における衛星ディジタル放送や地上波ディジタル放送等においての映像(ビデオ)及び音声(オーディオ)信号を伝送するデータ方式として、MPEG−2 TS(MPEG−2トランスポートストリーム)方式が適用されている。
【0003】
このようなMPEG−2 TS方式で情報圧縮されたデータを、そのままのディジタル信号状態で、例えばハードディスクや光ディスク、高速読み書きが可能な半導体メモリ等のランダムアクセス可能な記録媒体に、書き込み記録やユーザーがアクセス可能なデータファイルとして保存することができれば、画質や音質をまったく劣化させることなく、高品質のAVプログラムを随時繰り返して視聴することや、即応性が高いランダムアクセス再生及び自由度の高いプログラム編集が可能となり得る。
【0004】
MPEG−2 TSは図5に示すように、188バイト固定サイズのTSパケット(トランスポートパケット)により構成され、該TSパケットは4バイトのヘッダー情報部と、残り184バイトの実質的なAV情報を持つペイロード情報部から構成される。
【0005】
TSパケットのヘッダー情報内には、ヘッダー情報以降に続くTSパケットのペイロード情報が映像データなのか音声データのなのかを識別する識別子(Packet ID:以下、PIDという。)が存在する。
【0006】
また該ヘッダー情報には、該ペイロード情報に新たなPESパケットデータが開始するか否かの情報ビット(unit_start_indicator)が存在する。
【0007】
unit_start_indicatorが”1”である場合は、新たなPESパケット(Packetized Elementary Stream)が開始することを意味し、そうでない場合は続くペイロードデータが、PESパケットデータの連続する一部であることを意味する。
【0008】
さらにTSパケットの特殊な情報として、ストリームを構成するデータのマップ情報を管理するProgram Map Table(以下、PMTという。)が規定されており、該パケットデータで対応する映像信号をもつTSパケット及び音声データを持つTSパケットのPIDが一意に定められる。
【0009】
上述の技術を用いた従来例として、ランダムアクセス可能な記録媒体上に記録したMPEG−2 TSを二つに分割する編集処理について説明する。
【0010】
図5にはランダムアクセス可能な記録媒体にMPEG−2 TS形式を用いて記録した場合についてのデータ構造概略図を示す。
【0011】
図5の符号として、Vは映像情報をもつTSパケットを表し、Aは音声情報をもつTSパケットであることを示す。またVは映像情報をもつTSパケットに関してユーザーによる編集単位となるGOPの先頭であること、Aは音声情報をもつTSパケットに関して音声フレームデータの先頭が存在することを示す。V,A, V,Aに付する数字は同期再生タイミングを示す。
【0012】
通常、映像信号と音声信号の多重化を行うタイミングは、音声信号と映像信号の符号化装置の機能とMPEG規格の復号化規定に起因するが、上記のように1GOP分のTSパケット化された映像信号の途中にTSパケット化された音声フレーム信号が存在する場合がほとんどである。
【0013】
上記方法によって記録媒体上に記録されたMPEG−2 TSデータを、例えば図中で示すGOP単位の境界となる位置DIVで分割する要求がユーザーから発生した場合、分割編集によって、図6に示したデータM1,M2が生成される。
上記のような技術に関しては、例えば、非特許文献1、非特許文献2、非特許文献3等に開示されている。
【0014】
【非特許文献1】
ポイント図解式 最新MPEG教科書 監修 藤原洋 マルチメディア通信研究会アスキー出版局
【非特許文献2】
画像&音声圧縮技術のすべて(インターネット・ディジタルテレビ・モバイル通信時代の必須技術) 監修 藤原洋 CQ出版社
【非特許文献3】
ディジタル放送の基礎技術入門(インターネット、移動体通信に続く新しい情報インフラ) CQ出版社
【0015】
【発明が解決しようとする課題】
MPEG方式で圧縮符号化された映像信号および音声信号をTS(トランスポートストリーム)の状態で記録及び編集するシステムにおいては、次の課題が存在する。
【0016】
第一に映像信号はGOP単位でMPEG圧縮されるが、画像のタイプ(Iピクチャ、Pピクチャ、Bピクチャ)、画像の絵柄等によって1フレームの画像データの長さが一定ではない(固定レートで圧縮されない)。一方、音声信号は、固定レートで圧縮される。従って、対応する映像信号と音声信号と同時にエンコードされたとしても、対応する映像信号と音声信号のパケットがTS上の離れた位置に配置されてしまう可能性がある。
【0017】
第二に、従来例で示したように、図6中における分割位置DIVでMPEG−2 TSを分割すると、分割位置近傍で1GOP分の映像情報をもつTSパケットの途中に音声情報をもつTSパケットが存在するために、ストリーム先頭から分割位置までのデータとして作成されるストリームでは、最後の音声情報をもつデータが、分割位置からストリーム終端までのデータとして作成されるストリームでは、最初の音声情報のデータが、最小復号単位としての音声フレームのデータ構造を満たしていない不完全な音声データとなってしまう。
【0018】
上記課題より、映像信号と音声信号のパケットがTS上の離れた位置に配置される構造で多重化されたトランスポートストリームデータを途中で分割するような編集を実行すると、映像信号のつながりのタイミングと音声信号のつながりのタイミングがずれ、分割処理後のトランスポートストリームデータの再生時にデコード不良となり、ユーザーに違和感を与えるような異音の発生や無音状態を生じてしまう。
【0019】
【課題を解決するための手段】
本発明の映像・音声信号編集方法は、MPEG−2トランスポートストリーム方式によって時分割多重化圧縮された映像信号データと音声信号データの編集方法において、
GOP(Group Of Pictures)を構成する映像信号データの境界で分割編集したとき、分割された映像信号データ内に復号単位のデータ構造を満たさない音声信号データのトランスポートパケットが存在する場合に、該トランスポートパケットを、映像情報及び音声情報を持たないトランスポートパケットで置き換えて、上書き記録を行うことを特徴とする。
【0020】
本発明は編集対象となるMPEG−2 TSの分割位置において、GOPを構成する映像情報データを跨いで多重化された音声フレーム情報が存在する場合、分割位置前後の音声フレームデータを持つ、TSパケットを構成するデータを映像情報も音声情報も持たないダミーのTSパケットで置き換えるものである。
【0021】
【発明の実施の形態】
以下、本発明の実施の形態について図面を用いて詳細に説明する。
【0022】
本発明による実施形態として、ランダムアクセス可能な記録媒体に記録されたMPEG−2 TSデータの分割編集処理について、図1及び分割処理手順を示したフローチャートである図2〜図4を用いて説明する。図7〜図9に、188バイトのデータで構成されるTSパケットのデータ種別及び、該データ種別毎のデータ構造を示す。図7はビデオ(映像)/オーディオ(音声)パケットのデータ構造、図8はNULLパケットのデータ構造、図9はPMTパケットのデータ構造を示す図である。
【0023】
図1は記録媒体上に記録を行ったMPEG−2 TS形式で時分割多重化圧縮を施したAV情報のデータ構造概略図である。ユーザーからの要求により、記録媒体上に記録されたMPEG−2 TSデータを、図中で示すGOP単位の境界となる分割位置DIVで分割する。
【0024】
図2に示すように、MPEG−2 TSを図1中のDIVで表されるGOPデータの境界に対応したTSパケット位置でユーザーがストリーム分割を要求したとする(ステップS1)。
【0025】
まず、分割後に生成される二つのMPEG−2 TSである M1, M2について、ストリーム情報をもつProgram Map Table(PMT)を検出する(ステップS2)。検出できない場合は、次のTSパケットをサーチする。
【0026】
PMT検出後、該データから音声情報をもつTSパケットの識別子(PID)を取得する(ステップS3)。
【0027】
なお、PMT検出後、該ストリームの映像及び音声データを構成するTSパケットの識別子(PID)を取得し、記憶する。この処理により分割位置前後のパケットデータを識別し、後述する映像データTSパケットと音声データTSパケットの振り分け処理、すなわち分割位置前後を構成するTSパケットデータに関して、映像TSパケットはそのままにし、音声データTSパケットはNULLTSパケットで置き換えることが実現できる。
【0028】
上記の分割要求によって、分割前のMPEG−2 TSデータの先頭から分割位置までのデータM1と、分割位置から終端までのデータM2の二つのMPEG−2 TSを生成する(ステップS4)。
【0029】
従来例では上記の段階で分割編集処理を終了していたため、不完全なデータ構造をもつ音声情報の存在を許していたが、本実施形態においては分割位置を跨いで存在する音声フレーム1つ分を構成する音声トランスポートパケット(音声TSパケット)の領域を検索し、該データ領域に対して映像情報も音声情報も持たないNULL TSパケット(MPEG規格ではNULLパケットのPID(0x1FFF)を一意に規定しており、このTSパケットのペイロードを復号器に伝送することを禁止している。つまり、データとしては無視される。)で上書き記録する。
【0030】
本実施形態では、分割後のM1とM2に対して、それぞれ音声データに関する処理(ステップS6、ステップS7)を行う。図3はステップS6の処理、図4はステップS7の処理を示す。
【0031】
(M1に対する処理)
図3に示すように、M1では分割位置をストリーム終端としてストリーム先頭に向かって、前方方向に音声TSパケットの検索を行う。すなわち、検索したTSパケットが映像TSパケットかどうかを判断し(ステップS61)、映像TSパケットであればさらに前のTSパケットを検索し(ステップS64)、検索したTSパケットが映像TSパケットかどうかを判断するステップS61に戻る。
【0032】
映像TSパケットでなければ、音声TSパケットかどうかを判断し(ステップS62)、音声TSパケットでなければさらに前のTSパケットを検索し(ステップS64)、検索したTSパケットが映像TSパケットかどうかを判断するステップS61に戻る。一方、音声TSパケットであれば、該TSパケットのヘッダー情報を読み、該TSパケットのペイロードデータに新たなPESパケットデータが開始するか否かの情報ビット(unit_start_indicator)を調べる(ステップS63)。
【0033】
unit_start_indicatorが”0”である場合は、該TSパケットを映像情報も音声情報も持たないNULL TSパケットデータで上書き記録する(ステップS65)。上書き記録後、前のTSパケットを検索し(ステップS64)、再び処理を繰り返す。
【0034】
unit_start_indicatorが”1”である場合、該TSパケットデータをNULL TSパケットで上書き記録し(ステップ66)、一連の分割処理を終了する。
【0035】
(M2に対する処理)
図4に示すように、M2では分割位置をストリーム先頭として、ストリーム終端に向かって、音声TSパケットの検索を行う。すなわち、検索したTSパケットが映像TSパケットかどうかを判断し(ステップS71)、映像TSパケットであればさらに次のTSパケットを検索し(ステップS74)、検索したTSパケットが映像TSパケットかどうかを判断するステップS71に戻る。
【0036】
映像TSパケットでなければ、音声TSパケットかどうかを判断し(ステップS72)、音声TSパケットでなければさらに先のTSパケットを検索し(ステップS74)、検索したTSパケットが映像TSパケットかどうかを判断するステップS71に戻る。一方、音声TSパケットであれば、該TSパケットのヘッダー情報を読み、該TSパケットのパイロードデータに新たなPESパケットデータが開始するか否かの情報ビット(unit_start_indicator)を調べる(ステップS73)。
【0037】
unit_start_indicatorが”0”である場合は、該TSパケットを映像情報も音声情報も持たないNULL TSパケットデータで上書き記録する(ステップS75)。上書き記録後、次のTSパケットを検索し(ステップS74)、再び処理を繰り返す。
【0038】
unit_start_indicatorが”1”である場合、何もせずに一連の分割処理を終了する。
【0039】
なお、上記の本発明によるMPEGストリームの編集処理を行う実施形態として、図10に示すように、ディスク状記録媒体あるいは半導体メモリ媒体などをAVデータの記録装置装置として組み込みんだ撮像システムあるいは、図11に示すように記録装置をPCの周辺機器の一つとして、記録媒体上のデータアクセスが可能なシステムに対し適用することが可能である。
【0040】
図10は編集機能を搭載したハンディカムコーダを示すブロック図である。図10において、11はEVF,LCD等の表示デバイス、12はカメラ部となる撮像デバイス、13はMPEG符号器/復号器、14はハードディスク、光ディスク等のディスク状記録装置、15は半導体メモリ記録装置である。カメラ部12で撮影した映像・音声情報は、MPEG符号器/復号器13で符号化され、ディスク状記録装置14のディスク状記録媒体や、半導体メモリ記録装置15の半導体メモリに記録される。カメラ部12で撮影した映像・音声情報、又はディスク状記録装置、半導体メモリ記録装置に記録された情報はMPEG符号器/復号器13で復号化されて表示デバイス11で表示される。ディスク状記録媒体に記録された情報はいったんバッファメモリに読み出される。上述したMPEGストリームの分割編集処理は、例えば、ディスク状記録装置14で行われる。ディスク状記録装置14は半導体メモリと、半導体メモリに記録されたデータを読み出して、図2〜図4に示した分割編集処理を行うデータ処理部とを有する。PMT検出後に取得された、該ストリームの映像及び音声データを構成するTSパケットの識別子(PID)は半導体メモリに記憶される。図3及び図4に示した処理は順次処理されてもよいが並行処理されてもよい。並行処理は半導体メモリ、データ処理部を二つ設けることで実現できる。
【0041】
また図2〜図4に示した分割編集処理は、図11に示すようなコンピュータで編集ソフトを動作させることで実現することができる。
【0042】
図11のハードディスク装置等のディスク装置23に図2〜図4に示した分割編集処理を行うプログラムを保存させ、光ディスク装置24から読み出したデータを半導体メモリ26に記憶させ、演算手段となるCPU25によりプログラムを実行させることで、図2〜図4に示した分割編集処理を実行する。
【0043】
光ディスク装置24にMPEG−2トランスポートストリーム方式によって時分割多重化圧縮された映像信号データと音声信号データが記録されており、ユーザーがキーボード21等の入力手段から分割編集要求を行った場合、CPU25は前述した図2〜図4の各ステップのフローを記述したプログラムに基づいて、処理を行う。LCD22は処理状況や映像・音声信号を再生する表示手段となる液晶デバイスである。27はデータバス等のバスを示す。
以上本発明の実施形態について説明したが、本発明の好適な実施の態様は以下に説明する態様である。
【0044】
(実施態様1) 記録媒体に記録された、MPEG−2トランスポートストリーム方式によって時分割多重化圧縮された映像信号データと音声信号データの編集方法において、
GOP(Group Of Pictures)を構成する映像信号データの境界で分割編集したとき、分割された映像信号データ内に復号単位のデータ構造を満たさない音声信号データのトランスポートパケットが存在する場合に、該トランスポートパケットを、映像情報及び音声情報を持たないトランスポートパケットで置き換えて前記記録媒体に上書き記録することを特徴とする映像・音声信号編集方法。
【0045】
(実施態様2) 実施態様1に記載の映像・音声信号編集方法において、前記上書き記録は、ユーザーがMPEG−2トランスポートストリームファイルの分割処理を要求した際に行われることを特徴とする映像・音声信号編集方法。
【0046】
(実施態様3) 実施態様1又は2に記載の映像・音声信号編集方法において、前記記録媒体はランダムアクセス可能な記録媒体であることを特徴とする映像・音声信号編集方法。
【0047】
(実施態様4) 記録媒体に記録された、MPEG−2トランスポートストリーム方式によって時分割多重化圧縮された映像信号データと音声信号データの編集を行うMPEG−2トランスポートストリーム記録再生装置において、
映像及び音声データを構成するトランスポートパケットの識別情報を取得して記憶手段に記憶し、この識別情報を基に分割位置前後のパケットデータが映像トランスポートパケットか音声データトランスポートパケットかを識別し、
GOP(Group Of Pictures)を構成する映像信号データの境界で分割編集したとき、分割された映像信号データ内に復号単位のデータ構造を満たさない音声信号データのトランスポートパケットが存在する場合に、該トランスポートパケットを、映像情報及び音声情報を持たないトランスポートパケットで置き換えて、前記記録媒体に上書き記録を行う手段を有することを特徴とするMPEG−2トランスポートストリーム記録再生装置。
【0048】
(実施態様5) 実施態様4に記載のMPEG−2トランスポートストリーム記録再生装置において、前記上書き記録は、ユーザーがMPEG−2トランスポートストリームファイルの分割処理を要求した際に行われることを特徴とするMPEG−2トランスポートストリーム記録再生装置。
【0049】
(実施態様6) 実施態様4又は5に記載の映像・音声信号編集装置において、前記記録媒体は、ランダムアクセス可能な記録媒体であることを特徴とする映像・音声信号編集装置。
【0050】
(実施態様7) MPEG−2トランスポートストリーム方式によって時分割多重化圧縮された映像信号データと音声信号データの編集プログラムにおいて、
映像及び音声データを構成するトランスポートパケットの識別情報を取得して記憶手段に記憶し、この識別情報を基に分割位置前後のパケットデータが映像トランスポートパケットか音声データトランスポートパケットかを識別し、
演算手段により、GOP(Group Of Pictures)を構成する映像信号データの境界で分割編集したとき、分割された映像信号データ内に復号単位のデータ構造を満たさない音声信号データのトランスポートパケットが存在する場合に、該トランスポートパケットを、映像情報及び音声情報を持たないトランスポートパケットで置き換えることを特徴とする、コンピュータに実行させるための映像・音声信号編集プログラム。
【0051】
【発明の効果】
以上説明したように、本発明によれば、分割後に生成された二つのストリームを復号再生した時に、ユーザーに違和感を与える可能性のある音声データを除去し、快適なAV情報の視聴を実現することができる。
【図面の簡単な説明】
【図1】本発明の実施形態に関わる、MPEG−2 TSの分割処理を示す図である。
【図2】本発明の実施に関わる、MPEG−2 TSの分割処理を示すフローチャートである。
【図3】本発明の実施に関わる、MPEG−2 TSの分割処理を示すフローチャートである。
【図4】本発明の実施に関わる、MPEG−2 TSの分割処理を示すフローチャートである。
【図5】MPEG−2 TSのデータ構造概略図である。
【図6】従来のMPEG−2 TSの分割処理を示す図である。
【図7】MPEG−2 TSパケットの種別とデータ構造である。
【図8】MPEG−2 TSパケットの種別とデータ構造である。
【図9】MPEG−2 TSパケットの種別とデータ構造である。
【図10】本発明の実施に関わる、装置の構成である。
【図11】本発明の実施に関わる、装置の構成である。
【符号の説明】
GOPの先頭となる映像情報を持つMPEG−2 TSパケット
V 映像情報を持つMPEG−2 TSパケット
音声フレームの先頭となる音声情報を持つMPEG−2 TSパケット
A 音声情報を持つMPEG−2 TSパケット
N 映像情報、音声情報を持たないNULL TSパケット
[0001]
TECHNICAL FIELD OF THE INVENTION
The present invention relates to a method for editing MPEG2 transport stream data in which encoded digital video data and digital audio data are time-division multiplexed using a digital moving picture audio compression technology standard (Move Picture Experts Group: hereinafter referred to as MPEG). It is about.
[0002]
[Prior art]
At present, the MPEG standard defined by IEC / ISO 13818 as a known technique is a data system for transmitting video (video) and audio (audio) signals in satellite digital broadcasting and terrestrial digital broadcasting in Japan, Europe and the United States. The MPEG-2 TS (MPEG-2 transport stream) system is applied.
[0003]
Such data compressed by the MPEG-2 TS system can be written in a digital signal state as it is on a random accessible recording medium such as a hard disk, an optical disk, or a high-speed readable / writable semiconductor memory. If it can be saved as an accessible data file, it is possible to repeatedly watch high-quality AV programs at any time without deteriorating the image quality and sound quality, and to have random access playback with high responsiveness and program editing with a high degree of freedom May be possible.
[0004]
As shown in FIG. 5, the MPEG-2 TS is constituted by a TS packet (transport packet) having a fixed size of 188 bytes. The TS packet includes a header information part of 4 bytes and substantial AV information of the remaining 184 bytes. It has a payload information section.
[0005]
In the header information of the TS packet, there is an identifier (Packet ID: hereinafter, referred to as PID) for identifying whether the payload information of the TS packet following the header information is video data or audio data.
[0006]
The header information includes an information bit (unit_start_indicator) indicating whether or not new PES packet data starts in the payload information.
[0007]
If unit_start_indicator is “1”, it means that a new PES packet (Packetized Elementary Stream) starts, otherwise it means that the following payload data is a continuous part of PES packet data. .
[0008]
Furthermore, as special information of the TS packet, a Program Map Table (hereinafter, referred to as PMT) for managing map information of data constituting a stream is defined, and the TS packet and audio having a video signal corresponding to the packet data are defined. The PID of a TS packet having data is uniquely determined.
[0009]
As a conventional example using the above-described technique, an editing process for dividing an MPEG-2 TS recorded on a randomly accessible recording medium into two will be described.
[0010]
FIG. 5 shows a schematic diagram of a data structure in a case where the data is recorded on a randomly accessible recording medium using the MPEG-2 TS format.
[0011]
As a symbol in FIG. 5, V represents a TS packet having video information, and A represents a TS packet having audio information. The V H it is the head of the GOP to be edited unit by the user with respect to TS packets having video information, A H indicates the presence of the head of the audio frame data on TS packets having the audio information. Figures subjecting V, A, V H, the A H indicates the synchronized playback timing.
[0012]
Usually, the timing at which the video signal and the audio signal are multiplexed depends on the function of the audio signal and the video signal encoding device and the decoding specification of the MPEG standard. In most cases, an audio frame signal converted into a TS packet exists in the middle of a video signal.
[0013]
When a user issues a request to divide the MPEG-2 TS data recorded on the recording medium by the above method at, for example, a position DIV which is a boundary of a GOP unit shown in the figure, the division editing shown in FIG. Data M1 and M2 are generated.
The techniques described above are disclosed in, for example, Non-Patent Document 1, Non-Patent Document 2, and Non-Patent Document 3.
[0014]
[Non-patent document 1]
Point illustration formula Latest MPEG textbook Supervision Hiroshi Fujiwara Multimedia Communication Research Society ASCII Publishing Office [Non-patent document 2]
All about image & audio compression technology (essential technology in the era of Internet, digital television and mobile communications) Supervised by Hiroshi Fujiwara CQ Publishing Company [Non-Patent Document 3]
Introduction to basic technology of digital broadcasting (new information infrastructure following the Internet and mobile communication) CQ Publisher
[Problems to be solved by the invention]
The following problems exist in a system that records and edits a video signal and an audio signal that are compression-encoded by the MPEG method in a TS (transport stream) state.
[0016]
First, a video signal is MPEG-compressed in GOP units. However, the length of one frame of image data is not constant depending on the type of image (I picture, P picture, B picture), picture design, and the like (at a fixed rate). Not compressed). On the other hand, audio signals are compressed at a fixed rate. Therefore, even if the corresponding video signal and audio signal are encoded at the same time, there is a possibility that the packet of the corresponding video signal and audio signal is placed at a remote position on the TS.
[0017]
Second, as shown in the conventional example, when the MPEG-2 TS is divided at the division position DIV in FIG. 6, a TS packet having audio information in the middle of a TS packet having 1 GOP of video information near the division position Exists in the stream created as data from the beginning of the stream to the division position, the data having the last audio information is used in the stream created as data from the division position to the end of the stream. The data becomes incomplete audio data that does not satisfy the data structure of the audio frame as the minimum decoding unit.
[0018]
Due to the above problem, when editing is performed to divide transport stream data multiplexed in a structure in which video signal and audio signal packets are arranged at distant positions on the TS, the timing of connection of video signals The timing of the connection between the stream data and the audio signal is shifted, resulting in poor decoding at the time of reproducing the transport stream data after the division processing, resulting in the generation of abnormal noise or a silent state that gives a sense of strangeness to the user.
[0019]
[Means for Solving the Problems]
A video / audio signal editing method according to the present invention is a video / audio signal editing method for time-division multiplexed and compressed video signal data and audio signal data by the MPEG-2 transport stream method.
If the divided video signal data includes a transport packet of audio signal data that does not satisfy the data structure of the decoding unit when the divided video signal data is divided and edited at the boundary of the video signal data constituting the GOP (Group Of Pictures). The overwrite recording is performed by replacing the transport packet with a transport packet having no video information and no audio information.
[0020]
The present invention relates to a TS packet having audio frame data before and after a division position when there is audio frame information multiplexed over video information data constituting a GOP at a division position of an MPEG-2 TS to be edited. Is replaced by a dummy TS packet having neither video information nor audio information.
[0021]
BEST MODE FOR CARRYING OUT THE INVENTION
Hereinafter, embodiments of the present invention will be described in detail with reference to the drawings.
[0022]
As an embodiment according to the present invention, a division editing process of MPEG-2 TS data recorded on a randomly accessible recording medium will be described with reference to FIG. 1 and FIGS. 2 to 4 which are flowcharts showing the division processing procedure. . FIGS. 7 to 9 show the data type of the TS packet composed of 188-byte data and the data structure for each data type. 7 shows the data structure of a video (video) / audio (sound) packet, FIG. 8 shows the data structure of a NULL packet, and FIG. 9 shows the data structure of a PMT packet.
[0023]
FIG. 1 is a schematic diagram of a data structure of AV information which has been recorded on a recording medium and subjected to time-division multiplex compression in the MPEG-2 TS format. In response to a request from the user, the MPEG-2 TS data recorded on the recording medium is divided at a division position DIV which is a boundary of a GOP unit shown in the figure.
[0024]
As shown in FIG. 2, it is assumed that a user requests stream division of an MPEG-2 TS at a TS packet position corresponding to the boundary of GOP data represented by DIV in FIG. 1 (step S1).
[0025]
First, for two MPEG-2 TSs M1 and M2 generated after division, a Program Map Table (PMT) having stream information is detected (step S2). If it cannot be detected, the next TS packet is searched.
[0026]
After the PMT is detected, an identifier (PID) of a TS packet having audio information is obtained from the data (step S3).
[0027]
After the PMT is detected, an identifier (PID) of a TS packet constituting the video and audio data of the stream is obtained and stored. By this processing, packet data before and after the division position is identified, and the video data TS packet and the audio data TS packet, which will be described later, are divided, that is, with respect to the TS packet data forming the division position before and after, the video TS packet is left as it is, The packet can be replaced with a NULLTS packet.
[0028]
In accordance with the above-mentioned division request, two MPEG-2 TSs of the data M1 from the head of the MPEG-2 TS data before division to the division position and the data M2 from the division position to the end are generated (step S4).
[0029]
In the prior art, since the divided editing process was completed at the above stage, the existence of audio information having an incomplete data structure was allowed. In the present embodiment, however, one audio frame existing across the division position is allowed. Is searched for an audio transport packet (audio TS packet) area, and a NULL TS packet (PID (0x1FFF) of a NULL packet in the MPEG standard) that has neither video information nor audio information is uniquely specified for the data area. Therefore, the transmission of the payload of the TS packet to the decoder is prohibited, that is, the TS packet is ignored as data.)
[0030]
In the present embodiment, processes (Steps S6 and S7) relating to audio data are respectively performed on M1 and M2 after division. FIG. 3 shows the process of step S6, and FIG. 4 shows the process of step S7.
[0031]
(Process for M1)
As shown in FIG. 3, at M1, a search for audio TS packets is performed in the forward direction toward the head of the stream with the division position as the end of the stream. That is, it is determined whether or not the searched TS packet is a video TS packet (step S61). If the searched TS packet is a video TS packet, a further previous TS packet is searched (step S64). It returns to step S61 to make a determination.
[0032]
If it is not a video TS packet, it is determined whether it is an audio TS packet (step S62). If it is not an audio TS packet, a further previous TS packet is searched (step S64). It returns to step S61 to make a determination. On the other hand, if the packet is a voice TS packet, the header information of the TS packet is read, and an information bit (unit_start_indicator) is checked in the payload data of the TS packet as to whether or not new PES packet data starts (step S63).
[0033]
If unit_start_indicator is "0", the TS packet is overwritten and recorded with NULL TS packet data having neither video information nor audio information (step S65). After the overwrite recording, the previous TS packet is searched (step S64), and the process is repeated again.
[0034]
If the unit_start_indicator is “1”, the TS packet data is overwritten and recorded with a NULL TS packet (step 66), and the series of division processing ends.
[0035]
(Process for M2)
As shown in FIG. 4, in M2, a search is made for audio TS packets with the division position as the stream head and toward the stream end. That is, it is determined whether or not the searched TS packet is a video TS packet (step S71). If the searched TS packet is a video TS packet, the next TS packet is further searched (step S74). It returns to step S71 to make a determination.
[0036]
If it is not a video TS packet, it is determined whether or not it is an audio TS packet (step S72). If it is not an audio TS packet, a further TS packet is searched (step S74). It returns to step S71 to make a determination. On the other hand, if the packet is a voice TS packet, the header information of the TS packet is read, and an information bit (unit_start_indicator) is checked in the payload data of the TS packet as to whether or not new PES packet data starts (step S73).
[0037]
If the unit_start_indicator is "0", the TS packet is overwritten and recorded with NULL TS packet data having neither video information nor audio information (step S75). After the overwrite recording, the next TS packet is searched (step S74), and the process is repeated again.
[0038]
When the unit_start_indicator is “1”, the series of division processing ends without doing anything.
[0039]
As an embodiment for performing the above-described editing processing of the MPEG stream according to the present invention, as shown in FIG. 10, an imaging system incorporating a disk-shaped recording medium or a semiconductor memory medium or the like as an AV data recording apparatus, or FIG. As shown in FIG. 11, the recording apparatus can be applied to a system that can access data on a recording medium by using the recording apparatus as one of peripheral devices of a PC.
[0040]
FIG. 10 is a block diagram showing a handy camcorder equipped with an editing function. 10, reference numeral 11 denotes a display device such as an EVF or LCD, 12 denotes an imaging device serving as a camera unit, 13 denotes an MPEG encoder / decoder, 14 denotes a disk-shaped recording device such as a hard disk or an optical disk, and 15 denotes a semiconductor memory recording device. It is. Video / audio information captured by the camera unit 12 is encoded by an MPEG encoder / decoder 13 and recorded on a disk-shaped recording medium of a disk-shaped recording device 14 or a semiconductor memory of a semiconductor memory recording device 15. The video / audio information photographed by the camera unit 12 or the information recorded in the disc-shaped recording device or the semiconductor memory recording device is decoded by the MPEG encoder / decoder 13 and displayed on the display device 11. The information recorded on the disk-shaped recording medium is temporarily read out to the buffer memory. The above-described split editing process of the MPEG stream is performed by, for example, the disk recording device 14. The disk-shaped recording device 14 includes a semiconductor memory and a data processing unit that reads data recorded in the semiconductor memory and performs the division editing process illustrated in FIGS. The identifier (PID) of the TS packet constituting the video and audio data of the stream obtained after the detection of the PMT is stored in the semiconductor memory. The processing shown in FIGS. 3 and 4 may be performed sequentially or may be performed in parallel. Parallel processing can be realized by providing two semiconductor memories and two data processing units.
[0041]
The divided editing processing shown in FIGS. 2 to 4 can be realized by operating editing software on a computer as shown in FIG.
[0042]
A program for performing the split editing process shown in FIGS. 2 to 4 is stored in a disk device 23 such as a hard disk device in FIG. 11, data read from the optical disk device 24 is stored in a semiconductor memory 26, and the data is read by a CPU 25 serving as arithmetic means. By executing the program, the divided editing process shown in FIGS. 2 to 4 is executed.
[0043]
The video signal data and the audio signal data which have been time-division multiplexed and compressed by the MPEG-2 transport stream system are recorded on the optical disk device 24, and when the user makes a divisional editing request from input means such as the keyboard 21, the CPU 25 Performs processing based on the above-described program describing the flow of each step in FIGS. The LCD 22 is a liquid crystal device serving as a display unit for reproducing a processing status and a video / audio signal. Reference numeral 27 denotes a bus such as a data bus.
The embodiments of the present invention have been described above, but the preferred embodiments of the present invention are the following.
[0044]
(Embodiment 1) In an editing method of video signal data and audio signal data recorded on a recording medium and time-division multiplexed and compressed by an MPEG-2 transport stream method,
If the divided video signal data includes a transport packet of audio signal data that does not satisfy the data structure of the decoding unit when the divided video signal data is divided and edited at the boundary of the video signal data constituting the GOP (Group Of Pictures). A video / audio signal editing method, wherein a transport packet is replaced with a transport packet having neither video information nor audio information, and overwritten on the recording medium.
[0045]
(Embodiment 2) In the video / audio signal editing method according to Embodiment 1, the overwrite recording is performed when a user requests division processing of an MPEG-2 transport stream file. Audio signal editing method.
[0046]
(Embodiment 3) The video / audio signal editing method according to embodiment 1 or 2, wherein the recording medium is a randomly accessible recording medium.
[0047]
(Embodiment 4) In an MPEG-2 transport stream recording / reproducing apparatus for editing video signal data and audio signal data recorded on a recording medium and time-division multiplexed and compressed by the MPEG-2 transport stream method,
The identification information of the transport packets constituting the video and audio data is obtained and stored in the storage means. Based on the identification information, it is determined whether the packet data before and after the division position is a video transport packet or an audio data transport packet. ,
If the divided video signal data includes a transport packet of audio signal data that does not satisfy the data structure of the decoding unit when the divided video signal data is divided and edited at the boundary of the video signal data constituting the GOP (Group Of Pictures). An MPEG-2 transport stream recording / reproducing apparatus, comprising: means for replacing a transport packet with a transport packet having neither video information nor audio information and performing overwrite recording on the recording medium.
[0048]
(Embodiment 5) In the MPEG-2 transport stream recording / playback apparatus according to Embodiment 4, the overwrite recording is performed when a user requests a division process of an MPEG-2 transport stream file. MPEG-2 transport stream recording / reproducing apparatus.
[0049]
(Embodiment 6) The video / audio signal editing apparatus according to Embodiment 4 or 5, wherein the recording medium is a random accessible recording medium.
[0050]
(Embodiment 7) In an editing program for video signal data and audio signal data time-division multiplexed and compressed by the MPEG-2 transport stream system,
The identification information of the transport packets constituting the video and audio data is obtained and stored in the storage means. Based on the identification information, it is determined whether the packet data before and after the division position is a video transport packet or an audio data transport packet. ,
When the arithmetic means performs divisional editing at the boundary of video signal data constituting a GOP (Group Of Pictures), there is a transport packet of audio signal data that does not satisfy the data structure of the decoding unit in the divided video signal data. A video / audio signal editing program to be executed by a computer, wherein the transport packet is replaced with a transport packet having neither video information nor audio information.
[0051]
【The invention's effect】
As described above, according to the present invention, when two streams generated after division are decoded and reproduced, audio data that may give a user a sense of discomfort is removed, and comfortable viewing of AV information is realized. be able to.
[Brief description of the drawings]
FIG. 1 is a diagram illustrating an MPEG-2 TS division process according to an embodiment of the present invention.
FIG. 2 is a flowchart showing a process of dividing an MPEG-2 TS according to an embodiment of the present invention.
FIG. 3 is a flowchart showing a process of dividing an MPEG-2 TS according to an embodiment of the present invention.
FIG. 4 is a flowchart showing a process of dividing an MPEG-2 TS according to an embodiment of the present invention.
FIG. 5 is a schematic diagram of a data structure of MPEG-2 TS.
FIG. 6 is a diagram showing a conventional MPEG-2 TS division process.
FIG. 7 shows the type and data structure of an MPEG-2 TS packet.
FIG. 8 shows the type and data structure of an MPEG-2 TS packet.
FIG. 9 shows the type and data structure of an MPEG-2 TS packet.
FIG. 10 shows a configuration of an apparatus according to an embodiment of the present invention.
FIG. 11 shows a configuration of an apparatus according to an embodiment of the present invention.
[Explanation of symbols]
MPEG-2 TS packet having video information at the beginning of VH GOP V MPEG-2 TS packet A having video information A MPEG-2 TS packet having audio information at the beginning of H audio frame MPEG-M having audio information 2 TS packet N NULL TS packet without video information and audio information

Claims (1)

記録媒体に記録された、MPEG−2トランスポートストリーム方式によって時分割多重化圧縮された映像信号データと音声信号データの編集方法において、
GOP(Group Of Pictures)を構成する映像信号データの境界で分割編集したとき、分割された映像信号データ内に復号単位のデータ構造を満たさない音声信号データのトランスポートパケットが存在する場合に、該トランスポートパケットを、映像情報及び音声情報を持たないトランスポートパケットで置き換えて前記記録媒体に上書き記録することを特徴とする映像・音声信号編集方法。
In a method for editing video signal data and audio signal data recorded on a recording medium and time-division multiplexed and compressed by the MPEG-2 transport stream method,
If the divided video signal data includes a transport packet of audio signal data that does not satisfy the data structure of the decoding unit when the divided video signal data is divided and edited at the boundary of the video signal data constituting the GOP (Group Of Pictures), A video / audio signal editing method, wherein a transport packet is replaced with a transport packet having neither video information nor audio information and overwritten on the recording medium.
JP2003125368A 2003-04-30 2003-04-30 Video and audio signal editing method Pending JP2004336128A (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2003125368A JP2004336128A (en) 2003-04-30 2003-04-30 Video and audio signal editing method

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2003125368A JP2004336128A (en) 2003-04-30 2003-04-30 Video and audio signal editing method

Publications (1)

Publication Number Publication Date
JP2004336128A true JP2004336128A (en) 2004-11-25

Family

ID=33502654

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2003125368A Pending JP2004336128A (en) 2003-04-30 2003-04-30 Video and audio signal editing method

Country Status (1)

Country Link
JP (1) JP2004336128A (en)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2008044518A1 (en) * 2006-10-05 2008-04-17 Sony Corporation Data processing device, data processing method, and computer program

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2008044518A1 (en) * 2006-10-05 2008-04-17 Sony Corporation Data processing device, data processing method, and computer program
CN101536504B (en) * 2006-10-05 2010-12-22 索尼株式会社 Data processing device, data processing method, and computer program
US8165455B2 (en) 2006-10-05 2012-04-24 Sony Corporation Data processing apparatus and data processing method, and computer program

Similar Documents

Publication Publication Date Title
EP2186340B1 (en) A video data reproduction system
US7675555B2 (en) Recording method, recording apparatus, recording medium, reproduction method, reproduction apparatus and image pickup apparatus
JP3900050B2 (en) Data processing apparatus, video camera, and data processing method
WO2006033279A1 (en) Data processing device
US8676038B2 (en) Recording/reproducing apparatus, recording apparatus, reproducing apparatus, recording method, reproducing method and computer program
JP4791969B2 (en) Data processing device
US7835618B2 (en) Recording apparatus, recording method, program of recording method, and recording medium having program of recording method recorded thereon
JP4548226B2 (en) Data processing method, apparatus and program thereof
KR20010033045A (en) Recording device for recording a digital information signal on a record carrier
JP4501854B2 (en) Video / audio recording device
KR100434740B1 (en) Method for controlling a slow motion playback in digital broadcasting program
JP2004336128A (en) Video and audio signal editing method
JP4464101B2 (en) Transport stream editing method and apparatus
JP2005006166A (en) Imaging apparatus
JP4763589B2 (en) Playback device and playback method thereof
JP3785107B2 (en) Moving picture and audio data recording / reproducing apparatus and reproducing method
JP3794146B2 (en) Information reproducing apparatus and method, and providing medium
JP2004110876A (en) Coding rate controlling method of video data
KR100431548B1 (en) Apparatus for reproducing a moving picture using stream header information
JP3897753B2 (en) Memory output device
JP4861221B2 (en) RECORDING DEVICE, RECORDING METHOD, VIDEO RECORDING / REPRODUCING DEVICE, AND RECORDING FILE PROCESSING METHOD THEREOF
JP5100852B2 (en) Digital signal recording / reproducing apparatus and method, digital signal reproducing apparatus and method
JP2001285800A (en) Data signal recording and reproducing device and data signal recording and reproducing method
JP2004310963A (en) Information recording method and its device
JP2004120083A (en) Data edit method