JP2013541271A - オーバーラップする境界に基づくマルチメディアのスライストランスコーディング方法およびシステム、記録媒体 - Google Patents

オーバーラップする境界に基づくマルチメディアのスライストランスコーディング方法およびシステム、記録媒体 Download PDF

Info

Publication number
JP2013541271A
JP2013541271A JP2013527454A JP2013527454A JP2013541271A JP 2013541271 A JP2013541271 A JP 2013541271A JP 2013527454 A JP2013527454 A JP 2013527454A JP 2013527454 A JP2013527454 A JP 2013527454A JP 2013541271 A JP2013541271 A JP 2013541271A
Authority
JP
Japan
Prior art keywords
slice
length
transcoding
fuzzy region
slices
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP2013527454A
Other languages
English (en)
Other versions
JP5546082B2 (ja
Inventor
定 局 朱
Original Assignee
中国科学院深▲しん▼先進技術研究院
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 中国科学院深▲しん▼先進技術研究院 filed Critical 中国科学院深▲しん▼先進技術研究院
Publication of JP2013541271A publication Critical patent/JP2013541271A/ja
Application granted granted Critical
Publication of JP5546082B2 publication Critical patent/JP5546082B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/80Generation or processing of content or additional data by content creator independently of the distribution process; Content per se
    • H04N21/83Generation or processing of protective or descriptive data associated with content; Content structuring
    • H04N21/845Structuring of content, e.g. decomposing content into time segments
    • H04N21/8456Structuring of content, e.g. decomposing content into time segments by decomposing the content in the time domain, e.g. in time segments
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/40Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using video transcoding, i.e. partial or full decoding of a coded input stream followed by re-encoding of the decoded output stream
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/20Servers specifically adapted for the distribution of content, e.g. VOD servers; Operations thereof
    • H04N21/23Processing of content or additional data; Elementary server operations; Server middleware
    • H04N21/234Processing of video elementary streams, e.g. splicing of video streams or manipulating encoded video stream scene graphs
    • H04N21/2343Processing of video elementary streams, e.g. splicing of video streams or manipulating encoded video stream scene graphs involving reformatting operations of video signals for distribution or compliance with end-user requests or end-user device requirements
    • H04N21/234309Processing of video elementary streams, e.g. splicing of video streams or manipulating encoded video stream scene graphs involving reformatting operations of video signals for distribution or compliance with end-user requests or end-user device requirements by transcoding between formats or standards, e.g. from MPEG-2 to MPEG-4 or from Quicktime to Realvideo
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/40Client devices specifically adapted for the reception of or interaction with content, e.g. set-top-box [STB]; Operations thereof
    • H04N21/43Processing of content or additional data, e.g. demultiplexing additional data from a digital video stream; Elementary client operations, e.g. monitoring of home network or synchronising decoder's clock; Client middleware
    • H04N21/442Monitoring of processes or resources, e.g. detecting the failure of a recording device, monitoring the downstream bandwidth, the number of times a movie has been viewed, the storage space available from the internal hard disk
    • H04N21/44209Monitoring of downstream path of the transmission network originating from a server, e.g. bandwidth variations of a wireless network

Landscapes

  • Engineering & Computer Science (AREA)
  • Multimedia (AREA)
  • Signal Processing (AREA)
  • Computer Networks & Wireless Communication (AREA)
  • Databases & Information Systems (AREA)
  • Compression Or Coding Systems Of Tv Signals (AREA)
  • Television Signal Processing For Recording (AREA)

Abstract

【課題】分割境界の境界ファジー領域を除去できる、オーバーラップする境界に基づくマルチメディアのスライストランスコーディング方法を提供する。
【解決手段】スライストランスコーディング方法は、所定単位でマルチメディアを分割して、複数のスライスを取得するステップS10と、前記スライスにおけるファジー領域の長さを取得するステップS20と、それぞれの前記スライスの両端において、前記ファジー領域の長さの分前記スライスの長さを冗長させるステップS30と、前記冗長させた後のスライスをトランスコーディングするステップS40と、前記トランスコーディングした後のスライスの両端において、前記冗長させたファジー領域の長さの分両端のスライスを除去するステップS50と、前記ファジー領域の長さの分を除去されたスライスを結合するステップS60と、を含む。
【選択図】図1

Description

本発明は、マルチメディアのトランスコーディング技術分野に関し、特にオーバーラップする境界に基づくマルチメディアのスライストランスコーディング方法およびシステム、コンピュータ読み取り可能な記録媒体に関する。
マルチメディアのトランスコーディングには、動画のトランスコーディング、音声のトランスコーディングおよび画像のトランスコーディングなどが含まれる。動画のトランスコーディングとは、異なるネットワークの帯域幅、端末処理能力およびユーザのニーズに応えるように、圧縮された動画ストリームを別の動画ストリームに変換することをいう。従来の動画のトランスコーディングは、一つの動画に対してスライスせずに直接トランスコーディングすることや、先に動画をスライスしてからトランスコーディングすることで行われる。スライスとは、時間軸および空間軸において動画を分割することをいい、たとえば、複数のフレームを単位として動画を複数の部分に分割することや、ある一つのフレーム画像を空間軸において複数の部分に分割することをいう。スライスされた動画には、通常、分割境界が生成される。分割して得られた複数のスライスに対しては、並列にトランスコーディングすることができ、トランスコーディングした後のそれぞれのスライスを再結合して一つの動画にすることができる。音声トランスコーディングの場合には、時間軸において音声を分割した後にトランスコーディングし、画像トランスコーディングの場合には、空間軸において画像を分割した後にトランスコーディングすることができる。
しかしながら、上記従来のマルチメディアのスライストランスコーディング方式には、トランスコーディングした後のスライスを結合する際、分割境界の位置がひずむか曖昧になってしまう現象がよく現れ、マルチメディアの視聴効果が劣ってしまう問題がある。このため、分割境界の境界ファジー(曖昧な)領域を除去できるマルチメディアのスライストランスコーディング方法の提供に対する要請がある。
本発明は、上記要請に応えるためになされたものであり、分割境界の境界ファジー領域を除去できる、オーバーラップする境界に基づくマルチメディアのスライストランスコーディング方法およびシステム、記録媒体を提供することを目的とする。
上記の目的を達成するための本発明に係るマルチメディアのスライストランスコーディング方法は、所定単位でマルチメディアを分割して、複数のスライスを取得するステップと、前記スライスにおけるファジー領域の長さを取得するステップと、それぞれの前記スライスの両端において、前記ファジー領域の長さ分前記スライスの長さを冗長させるステップと、前記冗長させた後のスライスをトランスコーディングするステップと、前記トランスコーディングした後のスライスの両端において、前記冗長させたファジー領域の長さ分両端のスライスを除去するステップと、前記ファジー領域の長さ分を除去されたスライスを結合するステップと、を含む。
好ましくは、前記スライスにおけるファジー領域の長さを取得するステップは、連続する少なくとも二つの前記スライスを選出するステップと、前記選出されたスライスをトランスコーディングするステップと、前記スライスの境界ファジー領域を検出するステップと、を含み、前記境界ファジー領域の長さを前記ファジー領域の長さとして取得する。
好ましくは、前記スライスの境界ファジー領域を検出するステップは、前記スライスの境界から中央に向かってスキャンするステップと、前記トランスコーディング前後のスライスを照合するステップと、前記トランスコーディング前後のスライスにおける一致率が所定値より小さいスライス部分を取得するステップと、を含み、前記取得したスライス部分を前記スライスの境界ファジー領域と設定する。
好ましくは、前記マルチメディアは、動画、画像または音声である。
上記の目的を達成するための本発明に係るマルチメディアのスライストランスコーディングシステムは、所定単位でマルチメディアを分割して、複数のスライスを取得する分割モジュールと、前記スライスにおけるファジー領域の長さを取得するファジー領域長さ取得モジュールと、それぞれの前記スライスの両端において、前記ファジー領域の長さ分前記スライスの長さを冗長させる冗長モジュールと、前記冗長させた後のスライスをトランスコーディングするトランスコーディングモジュールと、前記トランスコーディングした後のスライスの両端において、前記冗長させたファジー領域の長さ分両端のスライスを除去する除去モジュールと、前記ファジー領域の長さ分を除去されたスライスを結合する結合モジュールと、を含む。
好ましくは、前記ファジー領域長さ取得モジュールは、連続する少なくとも二つの前記スライスを選出する選出モジュールと、前記選出されたスライスをトランスコーディングした後のスライスの境界ファジー領域を検出する検出モジュールと、を含み、前記境界ファジー領域の長さを前記ファジー領域の長さをとして取得する。
好ましくは、前記検出モジュールは、前記スライスの境界から中央に向かってスキャンするスキャンモジュールと、前記トランスコーディング前後のスライスを照合する照合モジュールと、を含み、前記トランスコーディング前後のスライスにおける一致率が所定値より小さいスライス部分を取得し、当該取得したスライス部分を前記スライスの境界のファジー領域と設定する。
好ましくは、前記マルチメディアは、動画、画像または音声である。
上記の目的を達成するための本発明に係るマルチメディアのスライストランスコーディング方法が記録されているコンピュータ読み取り可能な記録媒体において、前記方法は、所定単位でマルチメディアを分割して、複数のスライスを取得するステップと、前記スライスにおけるファジー領域の長さを取得するステップと、それぞれの前記スライスの両端において、前記ファジー領域の長さ分前記スライスの長さを冗長させるステップと、前記冗長させた後のスライスをトランスコーディングするステップと、前記トランスコーディングした後のスライスの両端において、前記冗長させたファジー領域の長さ分両端のスライスを除去するステップと、前記ファジー領域の長さ分を除去されたスライスを結合するステップと、を含む。
好ましくは、前記スライスにおけるファジー領域の長さを取得するステップは、連続する少なくとも二つの前記スライスを選出するステップと、前記選出されたスライスをトランスコーディングするステップと、前記スライスの境界ファジー領域を検出するステップと、を含み、前記境界ファジー領域の長さを前記ファジー領域の長さとして取得する。
好ましくは、前記スライスの境界ファジー領域を検出するステップは、前記スライスの境界から中央に向かってスキャンするステップと、前記トランスコーディング前後のスライスを照合するステップと、前記トランスコーディング前後のスライスにおける一致率が所定値より小さいスライス部分を取得するステップと、を含み、前記取得したスライス部分を前記スライスの境界ファジー領域と設定する。
好ましくは、前記マルチメディアは、動画、画像または音声である。
本発明に係るマルチメディアスライスのトランスコーディング方法およびシステム、コンピュータ読み取り可能な記録媒体によれば、それぞれのスライスの両端において、ファジー領域の長さ分スライスの長さを冗長させる。また、トランスコーディングした後のスライスを結合する際、冗長させたファジー領域の長さ分両端のスライスを除去する。これにより、結合したスライスにはファジー領域が存在しないため、境界ファジー領域を除去する効果が達成できる。
したがって、結合後のマルチメディアの視聴効果は、より優れ、より自然で、流れもよりスムーズである。
マルチメディアのスライストランスコーディング方法を示すフローチャートである。 図1のファジー領域の長さを取得する処理の詳細を示すフローチャートである。 図2のスライスの境界ファジー領域を検出する処理の詳細を示すフローチャートである。 マルチメディアのスライストランスコーディングシステムの構成の一例を示すブロック図である。 マルチメディアのスライストランスコーディングシステムの構成の他の一例を示すブロック図である。 図5の検出モジュールの構成を示すブロック図である。 マルチメディアのスライストランスコーディングの原理を説明するために供する図である。
以下、添付した図面を参照して、本発明の実施形態を詳細に説明する。
図1は、マルチメディアのスライストランスコーディング方法を示すフローチャートである。図に示すように、マルチメディアのスライストランスコーディング方法は、次のようなステップを含む。
<ステップS10>
所定単位でマルチメディアを分割して、複数のスライスを取得する。マルチメディアは、動画、画像または音声であってよい。時間軸または空間軸において動画を分割、空間軸において画像を分割、または時間軸において音声を分割できる。分割後のマルチメディアは、同様の長さまたはサイズを有する部分に分けられ、これらの部分をスライスとも称する。
<ステップS20>
スライスにおけるファジー領域の長さを取得する。図2は、ファジー領域の長さを取得する処理の詳細を示すフローチャートである。
<ステップS210>
連続する少なくとも二つのスライスを選出する。本実施形態においては、二つの連続するスライスを選択して処理できる。たとえば、100フレームを有する一つの動画ファイルにおいて、二フレーム単位で分割して得られた50個のスライスから、最初の二つのスライスを選出できる。
<ステップS220>
選出されたスライスをトランスコーディングする。
<ステップS230>
スライスの境界ファジー領域を検出して、ファジー領域の長さを取得する。図3は、スライスの境界ファジー領域を検出する処理の詳細を示すフローチャートである。
<ステップS231>
スライスの境界から中央に向かってスキャンする。具体的には、トランスコーディング前後のスライスの両方に対してスキャンする。動画および画像に対しては画素をスキャンし、音声に対しては音声ストリームをスキャンする。
<ステップS232>
トランスコーディング前後のスライスを照合する。動画および画像に対しては、トランスコーディング前後のスライスの画像の画素を直接照合する。音声に対しては、音声ストリームが同じであるか否かを照合する。
<ステップS233>
トランスコーディング前後のスライスにおける一致率が所定値より小さいスライス部分を取得する。動画および画像の場合、トランスコーディング前後のスライスの画素の一致率が所定値より小さいスライス部分があれば、当該部分をファジー領域(またはひずみ領域)と認定する。音声の場合、音声の一致率が所定値より小さいスライス部分があれば、同様に、当該部分をファジー領域と認定する。
<ステップS234>
ファジー領域と認定した部分をスライスの境界ファジー領域と設定する。スライスの境界から中央に向かってスキャンするため、境界に近ければ近いほど、通常、一致率は高くない。一方、境界から離れれば離れるほど一致率は高い。したがって、最終的に確定するファジー領域の部分はスライスの境界に位置する。スライスの境界ファジー領域を取得すると、直接的にファジー領域の長さも取得できる。
<ステップS30>
それぞれのスライスの両端において、ファジー領域の長さの分スライスの長さを冗長させる。すなわち、それぞれのスライスの両端において、スライスの長さを別々に伸ばし、伸ばす長さはファジー領域の長さである。
<ステップS40>
冗長させた後のスライスをトランスコーディングする。
<ステップS50>
トランスコーディングした後のスライスの両端において、冗長させたファジー領域の長さの分両端のスライスを除去する。ファジー領域の長さの分冗長させたスライス部分には、マルチメディアの内容が実際に含まれていないため、直接除去されてもマルチメディアの視聴効果にほぼ影響を及ぼさない。
<ステップS60>
ファジー領域の長さの分を除去されたスライスを結合する。トランスコーディングした後のファジー領域の長さのスライス部分はすでに除去され、かつ、当該スライス部分の長さは冗長させたスライス部分の長さであるため、マルチメディアの内容が含まれていない。このように結合したスライスにはファジー領域が存在しないため、境界ファジー領域を除去した効果が達成できる。したがって、結合後のマルチメディアの視聴効果は、より優れ、より自然で、流れもよりスムーズである。
本発明は、さらに、一または複数のコンピュータ読み取り可能な記録媒体を提供する。記録媒体には、コンピュータにより実行可能な命令が記録されている。これらの命令は、上述したマルチメディアのスライストランスコーディング方法を実行するための命令である。
図4は、マルチメディアのスライストランスコーディングシステムの構成の一例を示すブロック図である。図に示すように、マルチメディアのスライストランスコーディングシステムは、分割モジュール10、ファジー領域長さ取得モジュール20、冗長モジュール30、トランスコーディングモジュール40、除去モジュール50および結合モジュール60を含む。
分割モジュール10は、所定単位でマルチメディアを分割して、複数のスライスを取得する。ファジー領域長さ取得モジュール20は、スライスにおけるファジー領域の長さを取得する。冗長モジュール30は、それぞれのスライスの両端において、ファジー領域の長さの分スライスの長さを冗長させる。トランスコーディングモジュール40は、冗長させた後のスライスをトランスコーディングする。除去モジュール50は、トランスコーディングした後のスライスの両端において、冗長させたファジー領域の長さ分両端のスライスを除去する。結合モジュール60は、ファジー領域の長さ分を除去されたスライスを結合する。
マルチメディアは、動画、画像または音声であってよい。動画に対しては時間軸または空間軸において分割、画像に対しては空間軸において分割、音声に対しては時間軸において分割できる。分割後のマルチメディアは、同様の長さまたは同じサイズを有する部分に分けられ、これらの部分がスライスである。
図5は、マルチメディアのスライストランスコーディングシステムの構成の他の一例を示すブロック図である。
図に示すように、ファジー領域長さ取得モジュール20は、選出モジュール210および検出モジュール220を含む。
選出モジュール210は、連続する少なくとも二つのスライスを選出する。本実施形態においては、二つの連続するスライスを選択して処理できる。たとえば、100フレームを有する一つの動画ファイルにおいて、二フレーム単位で分割して得られた50個のスライスから、最初の二つのスライスを選出できる。トランスコーディングモジュール40は、選出モジュール210により選出された少なくとも二つのスライスをトランスコーディングする。
検出モジュール220は、トランスコーディングした後のスライスの境界ファジー領域を検出して、ファジー領域の長さを取得する。
図6は、検出モジュールの構成を示すブロック図である。図に示すように、検出モジュール220は、スキャンモジュール2210および照合モジュール2220を含む。
スキャンモジュール2210は、スライスの境界から中央に向かってスキャンする。スキャンモジュール2210は、トランスコーディング前後のスライスの両方に対してスキャンする。動画および画像に対しては画素をスキャンし、音声に対しては音声ストリームをスキャンする。
照合モジュール2220は、トランスコーディング前後のスライスを照合し、両者の一致率が所定値より小さいスライス部分を取得し、当該部分をスライスの境界ファジー領域と設定する。動画および画像に対しては、トランスコーディング前後のスライスの画像の画素を直接照合する。トランスコーディング前後のスライスの画素の一致率が所定値(予め設けられた閾値)より小さいスライス部分があれば、当該部分をファジー領域(またはひずみ領域)と認定する。音声に対しては、音声ストリームが同じであるか否かを照合する。音声の一致率が所定値より小さいスライス部分があれば、同様に、当該部分をファジー領域と認定する。スライスの境界から中央に向かってスキャンするため、境界に近ければ近いほど、通常、一致率は高くない。一方、境界から離れれば離れるほど一致率は高い。したがって、最終的に確定するファジー領域の部分はスライスの境界に位置する。スライスの境界ファジー領域を取得すると、直接的にファジー領域の長さも取得できる。
以下、動画を例にして上述したマルチメディアスライスのトランスコーディング方法およびシステムの原理を詳細に説明する。画像および音声のトランスコーディングは、動画のトランスコーディングと原理が同じであるため、詳細な説明は省略する。
図7は、マルチメディアのスライストランスコーディングの原理を説明するために供する図である。
(1)分割される前、動画の長さは2hである。二つに分割されたそれぞれのスライスの長さはhである。
(2)取得したスライスのファジー領域の長さはkである。したがって、スライスの両端において、kの長さ分スライスの長さを別々に冗長させる。
(3)トランスコーディングした後、冗長させたkの長さのスライス部分には実際にマルチメディアの内容が含まれていないため、それぞれのスライスにおいて、冗長させたkの長さ部分のスライスを直接除去する(図7の網かけ部分)。
(4)冗長させたkの長さのスライス部分を除去したスライスを結合すると、長さが依然として2hの動画が得られる。
ファジー領域の長さがkの部分のスライスが既に除去され、ファジー領域部分が存在しないため、結合後の動画は、視聴効果がより優れている。
本実施形態においては、動画を二つのスライスの分割することについて説明したが、動画を二つ以上のスライスに分割した場合においても、同方法を適用できることは言うまでもない。
以上、本発明の好適な実施形態を説明したが、本発明は、上記実施形態にのみ限定されない。本発明は、その要旨を逸脱しない範囲で、上記実施形態とは異なる種々の態様で実施することができる。
10 分割モジュール、
20 ファジー領域長さ取得モジュール、
210 抽出モジュール、
220 検出モジュール、
2210 スキャンモジュール、
2220 照合モジュール、
30 冗長モジュール、
40 トランスコーディングモジュール、
50 除去モジュール、
60 結合モジュール。

Claims (12)

  1. 所定単位でマルチメディアを分割して、複数のスライスを取得するステップと、
    前記スライスにおけるファジー領域の長さを取得するステップと、
    それぞれの前記スライスの両端において、前記ファジー領域の長さ分前記スライスの長さを冗長させるステップと、
    前記冗長させた後のスライスをトランスコーディングするステップと、
    前記トランスコーディングした後のスライスの両端において、前記冗長させたファジー領域の長さ分両端のスライスを除去するステップと、
    前記ファジー領域の長さ分を除去されたスライスを結合するステップと、
    を含むことを特徴とするマルチメディアのスライストランスコーディング方法。
  2. 前記スライスにおけるファジー領域の長さを取得するステップは、
    連続する少なくとも二つの前記スライスを選出するステップと、
    前記選出されたスライスをトランスコーディングするステップと、
    前記スライスの境界ファジー領域を検出するステップと、
    を含み、
    前記境界ファジー領域の長さを前記ファジー領域の長さとして取得する、
    ことを特徴とする請求項1に記載のマルチメディアのスライストランスコーディング方法。
  3. 前記スライスの境界ファジー領域を検出するステップは、
    前記スライスの境界から中央に向かってスキャンするステップと、
    前記トランスコーディング前後のスライスを照合するステップと、
    前記トランスコーディング前後のスライスにおける一致率が所定値より小さいスライス部分を取得するステップと、
    を含み、
    前記取得したスライス部分を前記スライスの境界ファジー領域と設定する、
    ことを特徴とする請求項2に記載のマルチメディアのスライストランスコーディング方法。
  4. 前記マルチメディアは、動画、画像または音声である、
    ことを特徴とする請求項1〜3のいずれか一項に記載のマルチメディアのスライストランスコーディング方法。
  5. 所定単位でマルチメディアを分割して、複数のスライスを取得する分割モジュールと、
    前記スライスにおけるファジー領域の長さを取得するファジー領域長さ取得モジュールと、
    それぞれの前記スライスの両端において、前記ファジー領域の長さ分前記スライスの長さを冗長させる冗長モジュールと、
    前記冗長させた後のスライスをトランスコーディングするトランスコーディングモジュールと、
    前記トランスコーディングした後のスライスの両端において、前記冗長させたファジー領域の長さ分両端のスライスを除去する除去モジュールと、
    前記ファジー領域の長さ分を除去されたスライスを結合する結合モジュールと、
    を含むことを特徴とするマルチメディアのスライストランスコーディングシステム。
  6. 前記ファジー領域長さ取得モジュールは、
    連続する少なくとも二つの前記スライスを選出する選出モジュールと、
    前記選出されたスライスをトランスコーディングした後のスライスの境界ファジー領域を検出する検出モジュールと、
    を含み、
    前記境界ファジー領域の長さを前記ファジー領域の長さをとして取得する、
    ことを特徴とする請求項5に記載のマルチメディアのスライストランスコーディングシステム。
  7. 前記検出モジュールは、
    前記スライスの境界から中央に向かってスキャンするスキャンモジュールと、
    前記トランスコーディング前後のスライスを照合する照合モジュールと、
    を含み、
    前記トランスコーディング前後のスライスにおける一致率が所定値より小さいスライス部分を取得し、当該取得したスライス部分を前記スライスの境界のファジー領域と設定する、
    ことを特徴とする請求項6に記載のマルチメディアのスライストランスコーディングシステム。
  8. 前記マルチメディアは、動画、画像または音声である、
    ことを特徴とする請求項5〜7のいずれか一項に記載のマルチメディアのスライストランスコーディングシステム。
  9. 一または複数のコンピュータにより実行可能な命令が記憶されている記録媒体であって、前記命令は、マルチメディアのスライストランスコーディング方法を実行するための命令であり、前記方法は、
    所定単位でマルチメディアを分割して、複数のスライスを取得するステップと、
    前記スライスにおけるファジー領域の長さを取得するステップと、
    それぞれの前記スライスの両端において、前記ファジー領域の長さ分前記スライスの長さを冗長させるステップと、
    前記冗長させた後のスライスをトランスコーディングするステップと、
    前記トランスコーディングした後のスライスの両端において、前記冗長させたファジー領域の長さ分両端のスライスを除去するステップと、
    前記ファジー領域の長さ分を除去されたスライスを結合するステップと、
    を含むことを特徴とするコンピュータ読み取り可能な記録媒体。
  10. 前記スライスにおけるファジー領域の長さを取得するステップは、
    連続する少なくとも二つの前記スライスを選出するステップと、
    前記選出されたスライスをトランスコーディングするステップと、
    前記スライスの境界ファジー領域を検出するステップと、
    を含み、
    前記境界ファジー領域の長さを前記ファジー領域の長さとして取得する、
    ことを特徴とする請求項9に記載のコンピュータ読み取り可能な記録媒体。
  11. 前記スライスの境界ファジー領域を検出するステップは、
    前記スライスの境界から中央に向かってスキャンするステップと、
    前記トランスコーディング前後のスライスを照合するステップと、
    前記トランスコーディング前後のスライスにおける一致率が所定値より小さいスライス部分を取得するステップと、
    を含み、
    前記取得したスライス部分を前記スライスの境界ファジー領域と設定する、
    ことを特徴とする請求項10に記載のむコンピュータ読み取り可能な記録媒体。
  12. 前記マルチメディアは、動画、画像または音声である、
    ことを特徴とする請求項9〜11のいずれか一項に記載のコンピュータ読み取り可能な記録媒体。
JP2013527454A 2010-09-07 2011-07-19 オーバーラップする境界に基づくマルチメディアのスライストランスコーディング方法およびシステム、記録媒体 Active JP5546082B2 (ja)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
CN 201010275897 CN101951504B (zh) 2010-09-07 2010-09-07 基于重叠边界的多媒体切片转码方法和***
CN201010275897.0 2010-09-07
PCT/CN2011/077297 WO2012031506A1 (zh) 2010-09-07 2011-07-19 基于重叠边界的多媒体切片转码方法和***、存储介质

Publications (2)

Publication Number Publication Date
JP2013541271A true JP2013541271A (ja) 2013-11-07
JP5546082B2 JP5546082B2 (ja) 2014-07-09

Family

ID=43454844

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2013527454A Active JP5546082B2 (ja) 2010-09-07 2011-07-19 オーバーラップする境界に基づくマルチメディアのスライストランスコーディング方法およびシステム、記録媒体

Country Status (4)

Country Link
US (1) US9031135B2 (ja)
JP (1) JP5546082B2 (ja)
CN (1) CN101951504B (ja)
WO (1) WO2012031506A1 (ja)

Families Citing this family (15)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101951504B (zh) * 2010-09-07 2012-07-25 中国科学院深圳先进技术研究院 基于重叠边界的多媒体切片转码方法和***
CN102802053A (zh) * 2012-07-23 2012-11-28 深圳市融创天下科技股份有限公司 一种音视频文件转码集群调度方法及装置
CN106383681B (zh) * 2016-09-09 2020-09-01 航美传媒集团有限公司 多层画面协同播出方法
CN106491039B (zh) * 2016-11-14 2019-01-08 浙江工业大学 一种摆动式擦窗机器人玻璃边缘检测方法
CN106491040B (zh) * 2016-11-14 2019-04-09 浙江工业大学 一种摆动式擦窗机器人玻璃边缘触碰检测处理方法
CN106491042B (zh) * 2016-11-14 2019-01-08 浙江工业大学 一种摆动式擦窗机器人玻璃边缘处向下移动处理方法
CN106791930B (zh) * 2017-01-04 2020-03-31 北京百度网讯科技有限公司 一种视频处理方法和装置
US10560728B2 (en) * 2017-05-29 2020-02-11 Triton Us Vp Acquisition Co. Systems and methods for stitching separately encoded NAL units into a stream
CN109348309B (zh) * 2018-05-04 2020-07-28 上海交通大学 一种适用于帧率上变换的分布式视频转码方法
CN109151505B (zh) * 2018-11-07 2021-02-26 深圳市网心科技有限公司 一种视频转码方法、***、装置及计算机可读存储介质
CN109889919A (zh) * 2019-03-27 2019-06-14 深圳市网心科技有限公司 一种视频转码方法、装置、***及介质
CN109963167B (zh) * 2019-04-02 2021-08-06 深圳市网心科技有限公司 音视频处理方法、服务器、装置及存储介质
CN111866542B (zh) * 2019-04-30 2022-11-04 腾讯科技(深圳)有限公司 音频信号处理方法、多媒体信息处理方法、装置及电子设备
CN110611841B (zh) * 2019-09-06 2021-07-30 Oppo广东移动通信有限公司 整合方法、终端和可读存储介质
CN113852840B (zh) * 2021-09-18 2023-08-22 北京百度网讯科技有限公司 视频渲染方法、装置、电子设备以及存储介质

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2005176069A (ja) * 2003-12-12 2005-06-30 Ntt Data Corp 分散並列トランスコーダシステム及び分散並列トランスコード方法
JP2007274229A (ja) * 2006-03-30 2007-10-18 Sony Corp 情報処理装置および情報処理方法、並びにプログラム
WO2008114393A1 (ja) * 2007-03-19 2008-09-25 Fujitsu Limited ビットストリーム変換方法、ビットストリーム変換装置、ビットストリーム結合装置、ビットストリーム分割プログラム、ビットストリーム変換プログラム及びビットストリーム結合プログラム
JP2009272706A (ja) * 2008-04-30 2009-11-19 Toshiba Corp 動画像トランスコード装置およびその方法
WO2010053728A1 (en) * 2008-10-29 2010-05-14 Dolby Laboratories Licensing Corporation Signal clipping protection using pre-existing audio gain metadata

Family Cites Families (12)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP4403737B2 (ja) * 2003-08-12 2010-01-27 株式会社日立製作所 信号処理装置及びこれを用いた撮像装置
KR20070090241A (ko) * 2004-12-10 2007-09-05 코닌클리케 필립스 일렉트로닉스 엔.브이. 디지털 비디오 레코더에서 계층화된 디지털 비디오 코딩을위한 시스템 및 방법
US20080119953A1 (en) * 2005-04-07 2008-05-22 Iofy Corporation Device and System for Utilizing an Information Unit to Present Content and Metadata on a Device
TW200743386A (en) * 2006-04-27 2007-11-16 Koninkl Philips Electronics Nv Method and apparatus for encoding/transcoding and decoding
CN101098483A (zh) * 2007-07-19 2008-01-02 上海交通大学 以图像组结构为并行处理单元的视频集群转码***
DE102007049351A1 (de) * 2007-10-15 2009-04-16 Siemens Ag Verfahren und Vorrichtung zum Erstellen eines kodierten Ausgangsvideostroms aus mindestens zwei kodierten Eingangsvideoströmen, sowie Verwendung der Vorrichtung und kodierter Eingangsvideostrom
JP5400876B2 (ja) * 2008-06-16 2014-01-29 ドルビー ラボラトリーズ ライセンシング コーポレイション ビデオ符号化のための、スライス依存性に基づくレート制御モデル適合化
CA2730543C (en) * 2008-07-16 2014-04-22 Nokia Corporation Method and apparatus for track and track subset grouping
CN101420619A (zh) * 2008-11-20 2009-04-29 四川长虹电器股份有限公司 一种分布式的媒体格式转码方法
CN101459848B (zh) * 2008-12-26 2010-11-10 西安交通大学 一种分布式多格式数字视频转码结构设计方法
CN101459843B (zh) * 2008-12-31 2010-08-11 浙江师范大学 一种精确提取视频序列中损坏内容区域的方法
CN101951504B (zh) * 2010-09-07 2012-07-25 中国科学院深圳先进技术研究院 基于重叠边界的多媒体切片转码方法和***

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2005176069A (ja) * 2003-12-12 2005-06-30 Ntt Data Corp 分散並列トランスコーダシステム及び分散並列トランスコード方法
JP2007274229A (ja) * 2006-03-30 2007-10-18 Sony Corp 情報処理装置および情報処理方法、並びにプログラム
WO2008114393A1 (ja) * 2007-03-19 2008-09-25 Fujitsu Limited ビットストリーム変換方法、ビットストリーム変換装置、ビットストリーム結合装置、ビットストリーム分割プログラム、ビットストリーム変換プログラム及びビットストリーム結合プログラム
JP2009272706A (ja) * 2008-04-30 2009-11-19 Toshiba Corp 動画像トランスコード装置およびその方法
WO2010053728A1 (en) * 2008-10-29 2010-05-14 Dolby Laboratories Licensing Corporation Signal clipping protection using pre-existing audio gain metadata

Also Published As

Publication number Publication date
WO2012031506A1 (zh) 2012-03-15
JP5546082B2 (ja) 2014-07-09
US9031135B2 (en) 2015-05-12
CN101951504A (zh) 2011-01-19
US20130163675A1 (en) 2013-06-27
CN101951504B (zh) 2012-07-25

Similar Documents

Publication Publication Date Title
JP5546082B2 (ja) オーバーラップする境界に基づくマルチメディアのスライストランスコーディング方法およびシステム、記録媒体
US8009861B2 (en) Method and system for fingerprinting digital video object based on multiresolution, multirate spatial and temporal signatures
KR101987503B1 (ko) 콘텐츠 송신 장치, 콘텐츠 송신 방법, 콘텐츠 재생 장치, 콘텐츠 재생 방법, 프로그램 및 콘텐츠 배신 시스템
JP6102680B2 (ja) 符号化装置、復号装置、符号化データ、符号化方法、復号方法およびプログラム
US9177359B2 (en) Information processor, cloud platform, information processing method, and computer program product thereof
US8204314B2 (en) Method and system for fingerprinting digital video object based on multiresolution, multirate spatial and temporal signatures
US20200175724A1 (en) Distinct encoding and decoding of stable information and transient/stochastic information
KR20130140904A (ko) 비디오 적응 및 재타겟팅을 위한 비디오 캡션 재-오버레이 시스템 및 방법
US20110243474A1 (en) Video image processing apparatus and video image processing method
JPWO2009063554A1 (ja) 符号化装置および復号装置
US20110102627A1 (en) Image processing apparatus which sets a region of interest within a frame image and image pickup apparatus using the image processing apparatus
US20130121588A1 (en) Method, apparatus, and program for compressing images, and method, apparatus, and program for decompressing images
US9111363B2 (en) Video playback apparatus and video playback method
US8548272B2 (en) Image signal processing apparatus, image signal processing method, camera apparatus, image display apparatus, and image signal output apparatus
US8873642B2 (en) Video content analysis methods and systems
US8532465B2 (en) Moving image recording apparatus, moving image recording method and program
EP2166758A2 (en) Image signal processing apparatus and image signal processing method
JP5484132B2 (ja) 映像処理装置及びその制御方法
JP2007036388A (ja) 再生装置及び再生方法
JP5690163B2 (ja) 画像縮小装置、画像拡大装置、画像縮小プログラム、及び画像拡大プログラム
US20140281005A1 (en) Video retargeting using seam carving
US9813654B2 (en) Method and system for transmitting data
US12047619B2 (en) Video processing method of image quality compensation
WO2009139341A1 (ja) 映像情報処理装置
US7933494B2 (en) Recording apparatus and method, and program

Legal Events

Date Code Title Description
A871 Explanation of circumstances concerning accelerated examination

Free format text: JAPANESE INTERMEDIATE CODE: A871

Effective date: 20131203

A975 Report on accelerated examination

Free format text: JAPANESE INTERMEDIATE CODE: A971005

Effective date: 20131227

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20140107

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20140403

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20140507

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20140512

R150 Certificate of patent or registration of utility model

Ref document number: 5546082

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250