JP4188402B2 - Video receiver - Google Patents

Video receiver Download PDF

Info

Publication number
JP4188402B2
JP4188402B2 JP2006514365A JP2006514365A JP4188402B2 JP 4188402 B2 JP4188402 B2 JP 4188402B2 JP 2006514365 A JP2006514365 A JP 2006514365A JP 2006514365 A JP2006514365 A JP 2006514365A JP 4188402 B2 JP4188402 B2 JP 4188402B2
Authority
JP
Japan
Prior art keywords
video
time
display
display time
audio
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
JP2006514365A
Other languages
Japanese (ja)
Other versions
JPWO2005122578A1 (en
Inventor
純一 横里
優一 出原
文伸 小川
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Mitsubishi Electric Corp
Original Assignee
Mitsubishi Electric Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Mitsubishi Electric Corp filed Critical Mitsubishi Electric Corp
Publication of JPWO2005122578A1 publication Critical patent/JPWO2005122578A1/en
Application granted granted Critical
Publication of JP4188402B2 publication Critical patent/JP4188402B2/en
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L47/00Traffic control in data switching networks
    • H04L47/10Flow control; Congestion control
    • H04L47/28Flow control; Congestion control in relation to timing considerations
    • H04L47/283Flow control; Congestion control in relation to timing considerations in response to processing delays, e.g. caused by jitter or round trip time [RTT]
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/40Client devices specifically adapted for the reception of or interaction with content, e.g. set-top-box [STB]; Operations thereof
    • H04N21/43Processing of content or additional data, e.g. demultiplexing additional data from a digital video stream; Elementary client operations, e.g. monitoring of home network or synchronising decoder's clock; Client middleware
    • H04N21/4302Content synchronisation processes, e.g. decoder synchronisation
    • H04N21/4307Synchronising the rendering of multiple content streams or additional data on devices, e.g. synchronisation of audio on a mobile phone with the video output on the TV screen
    • H04N21/43072Synchronising the rendering of multiple content streams or additional data on devices, e.g. synchronisation of audio on a mobile phone with the video output on the TV screen of multiple content streams on the same device
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/20Servers specifically adapted for the distribution of content, e.g. VOD servers; Operations thereof
    • H04N21/23Processing of content or additional data; Elementary server operations; Server middleware
    • H04N21/234Processing of video elementary streams, e.g. splicing of video streams or manipulating encoded video stream scene graphs
    • H04N21/2343Processing of video elementary streams, e.g. splicing of video streams or manipulating encoded video stream scene graphs involving reformatting operations of video signals for distribution or compliance with end-user requests or end-user device requirements
    • H04N21/234318Processing of video elementary streams, e.g. splicing of video streams or manipulating encoded video stream scene graphs involving reformatting operations of video signals for distribution or compliance with end-user requests or end-user device requirements by decomposing into objects, e.g. MPEG-4 objects
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/40Client devices specifically adapted for the reception of or interaction with content, e.g. set-top-box [STB]; Operations thereof
    • H04N21/43Processing of content or additional data, e.g. demultiplexing additional data from a digital video stream; Elementary client operations, e.g. monitoring of home network or synchronising decoder's clock; Client middleware
    • H04N21/433Content storage operation, e.g. storage operation in response to a pause request, caching operations
    • H04N21/4331Caching operations, e.g. of an advertisement for later insertion during playback

Landscapes

  • Engineering & Computer Science (AREA)
  • Signal Processing (AREA)
  • Multimedia (AREA)
  • Computer Networks & Wireless Communication (AREA)
  • Two-Way Televisions, Distribution Of Moving Picture Or The Like (AREA)
  • Compression Or Coding Systems Of Tv Signals (AREA)

Description

この発明は、ネットワークを介して伝送されてきた映像データの受信時に発生する遅延時間を軽減して映像再生を行う映像受信装置に関するものである。   The present invention relates to a video receiving apparatus that reproduces video while reducing a delay time generated when video data transmitted via a network is received.

近年、ネットワークを経由させて、送信側より映像・音声の高能率符号化の標準MPEG(Moving Picture Experts Group)−4ビデオ等に代表される映像データを伝送し、受信側においてこれを復号化して映像再生を行う映像伝送システムが実現されるようになった。このようなシステムでは、受信側で復号化後、送信側における映像サンプリング時のタイムスタンプに合わせて映像データを出力させている。この受信再生方法では、第1映像フレーム目として伝送する映像データのサイズがネットワークの伝送速度に比べて大きい場合、その映像フレームの伝送遅延が原因となり再生側の表示に遅延が生じ、その後の映像ストリームが全てその遅延を有するまま再生されることになっていた。例えば第1映像フレーム目のサイズをSv1とし、ネットワーク伝送速度をRvとすると、第1映像フレームのネットワーク伝送時間はSv1/Rvとなる。通常、第1映像フレームが再生開始可能となった時間を起点として映像表示を開始し、続く映像フレームは各映像フレームに設定されている表示時間に合わせて表示を行っている。このことにより、撮影した映像と同じ動きの映像の再生がネットワーク経由で可能となる。   In recent years, video data typified by MPEG (Moving Picture Experts Group) -4 video and the like for high-efficiency video / audio coding is transmitted from a transmission side via a network, and this is decoded on the reception side. Video transmission systems for video playback have been realized. In such a system, after decoding on the reception side, video data is output in accordance with a time stamp at the time of video sampling on the transmission side. In this reception / playback method, when the size of the video data transmitted as the first video frame is larger than the transmission speed of the network, a delay occurs in the display on the playback side due to the transmission delay of the video frame, and the subsequent video All streams were to be played with that delay. For example, if the size of the first video frame is Sv1 and the network transmission rate is Rv, the network transmission time of the first video frame is Sv1 / Rv. Usually, video display is started from the time when the first video frame can be reproduced, and the subsequent video frames are displayed in accordance with the display time set for each video frame. As a result, it is possible to reproduce a video having the same motion as the shot video via the network.

しかし、上記状況下では、第1フレーム目の映像については、先頭のパケットが到着してから上記ネットワーク伝送時間Sv1/Rv後に全てのデータが揃うことになり、送信側遅延やデコード遅延とは別に少なくともSv1/Rvの遅延が生じることになる。Sv1≪Rvの場合はその遅延は小さいが、Sv1≫Rvの場合は遅延が大きく、さらに第1フレーム目の表示時間を起点として表示タイミングを計算する後続の映像フレーム全てがその遅延を有して再生されることになる。このような現象はライブ配信等のリアルタイム性が要求される場合においては大きな問題となっていた。   However, under the above situation, for the first frame of video, all data will be gathered after the network transmission time Sv1 / Rv after the arrival of the first packet, separately from the transmission side delay and decoding delay. A delay of at least Sv1 / Rv will occur. In the case of Sv1 << Rv, the delay is small, but in the case of Sv1 >> Rv, the delay is large, and all subsequent video frames for calculating the display timing from the display time of the first frame have the delay. Will be played. Such a phenomenon has been a serious problem when real-time performance such as live distribution is required.

この問題を解決するのに適用できそうな方法として、特開平11−262008号公報(文献1とする。)に記載された技術がある。文献1に記載されているものは、符号化ストリームのビットレートが変動するシステムにおいて、ビットレートが低く設定された場合にも遅延時間を短く維持可能とする符号化装置である。この技術は、主にMPEGをターゲットにしており、ストリームのビットレートが低く設定された場合にはVBV(Video Buffering Verifier)バッファ容量を減少させることにより、ストリーム配信中にビットレートが低ビットレートに変更された場合でも、復号化側における遅延が増加することなく映像データをストリーム配信可能とするものである。   As a method that can be applied to solve this problem, there is a technique described in Japanese Patent Laid-Open No. 11-262008 (referred to as Document 1). Document 1 describes an encoding apparatus that can maintain a short delay time even when the bit rate is set low in a system in which the bit rate of the encoded stream varies. This technology is mainly targeted for MPEG, and when the bit rate of the stream is set low, the bit rate is lowered during stream delivery by reducing the VBV (Video Buffering Verifier) buffer capacity. Even if it is changed, the video data can be streamed without increasing the delay on the decoding side.

文献1に記載された技術を上記問題点を解決するために適用する場合、最大許容遅延時間で復号化可能なVBVバッファ量を設定し、そのVBVバッファサイズを使用して送信側で映像を符号化することで遅延時間を最大許容遅延時間内に抑えることが可能である。しかしながら、アプリケーションによってはVGA(Video Graphics Array;640×480のサイズの表示解像度)レベルの比較的大きな画面の映像を低帯域ネットワークで送信するシステム要求も存在するので、そのような場合には最大許容遅延時間を満足するようにVBVバッファを設定すると画質面で問題が生じる可能性がある。特に、第1映像フレーム目の画像はイントラフレームである可能性が高いため、最大許容遅延時間を満たすVBVバッファ容量で符号化したストリームの場合、画像の劣化が予想される。   When the technique described in Document 1 is applied to solve the above problem, a VBV buffer amount that can be decoded with the maximum allowable delay time is set, and video is encoded on the transmission side using the VBV buffer size. Therefore, the delay time can be suppressed within the maximum allowable delay time. However, depending on the application, there is a system requirement to transmit a video with a relatively large screen of VGA (Video Graphics Array; 640 × 480 size) level over a low-bandwidth network. If the VBV buffer is set so as to satisfy the delay time, there may be a problem in image quality. In particular, since the image of the first video frame is likely to be an intra frame, in the case of a stream encoded with a VBV buffer capacity that satisfies the maximum allowable delay time, image degradation is expected.

この発明は、上記のような課題を解決するためになされたもので、受信側でデコード画像の表示時間管理を行うことにより、VBVバッファ容量をネットワーク帯域に対応して制限することなく、低帯域のネットワークを介して映像データを受信する場合でも遅延時間を少なくして再生可能にする映像受信装置を得ることを目的とする。   The present invention has been made in order to solve the above-described problems. By managing the display time of the decoded image on the reception side, the VBV buffer capacity is not limited in accordance with the network bandwidth, and the bandwidth is low. It is an object of the present invention to provide a video receiving apparatus that can be reproduced with reduced delay time even when receiving video data via the above network.

この発明に係る映像受信装置は、符号化された映像データとこの映像データの表示タイムスタンプをパケットによりネットワークを介して受信し、第1パケットの受信時に第1パケット到着通知を出力すると共に、各パケットを順次出力する映像受信部と、順次入力されるパケットから1映像フレーム分ごとの映像データを復号して該当映像フレームの表示タイムスタンプと共に出力する映像復号化部と、映像復号化部からの映像データと該当映像フレームの表示タイムスタンプを受信した際、入手した現在の表示時間と表示タイムスタンプに基づいて映像の表示を開始すると共に、表示開始通知を出力する映像出力部と、映像データの受信開始後から第1映像フレーム目の表示を行うまでの最大許容遅延時間が予め設定されており、第1パケット到着通知を受けると時間計測を開始し、当該計測値が前記最大許容遅延時間に達する前に映像出力部からの表示開始通知を受信した場合、および第1パケット到着通知を受けてから表示開始通知を受ける前に最大許容遅延時間を経過した場合のいずれか早い方の場合を起点にして表示時間の計測を行う表示時間管理を開始し、また映像出力部からの問い合わせに対して現在の表示時間を返す時間管理部とを備え、映像出力部は、計測された表示時間に基づいて次の映像フレームの映像データの表示を開始するようにしたものである。   The video receiving device according to the present invention receives encoded video data and a display time stamp of the video data via a network by a packet, and outputs a first packet arrival notification when receiving the first packet, A video receiving unit that sequentially outputs packets, a video decoding unit that decodes video data for each video frame from sequentially input packets, and outputs the video data together with a display time stamp of the video frame, and a video decoding unit When the video data and the display time stamp of the video frame are received, the video display is started based on the obtained current display time and the display time stamp, and a video output unit that outputs a display start notification; The maximum allowable delay time from the start of reception until the display of the first video frame is set in advance. When the display arrival notification is received, the time measurement starts, and when the display start notification is received from the video output unit before the measured value reaches the maximum allowable delay time, the display is performed after receiving the first packet arrival notification. Start display time management that measures display time starting from the earlier of the maximum allowable delay time before receiving the start notification, which is the earlier one, and in response to inquiries from the video output unit A time management unit for returning the display time, and the video output unit starts displaying video data of the next video frame based on the measured display time.

このことによって、第1映像フレームは伝送時間が大きく、最大許容遅延時間を越えて復号化された場合でも、第2映像フレーム以降は表示時間通りに表示することが可能となり、VBVバッファ容量をネットワーク帯域に対応して制限することなく、低帯域のネットワークを介して映像データを受信する場合でも遅延時間を少なくして再生可能にする効果がある。   As a result, even if the first video frame has a long transmission time and is decoded beyond the maximum allowable delay time, the second and subsequent video frames can be displayed according to the display time, and the VBV buffer capacity can be increased. Even when video data is received via a low-band network without being limited in accordance with the band, there is an effect that the reproduction can be performed with a reduced delay time.

この発明の実施の形態1および実施の形態2による映像受信装置が適用された映像伝送システムの基本構成を示すブロック図である。It is a block diagram which shows the basic composition of the video transmission system to which the video receiver by Embodiment 1 and Embodiment 2 of this invention was applied. この発明の実施の形態1による映像受信装置の機能構成を示すブロック図である。It is a block diagram which shows the function structure of the video receiver by Embodiment 1 of this invention. この発明の実施の形態1に係る時間管理部の動作を示すフローチャートである。It is a flowchart which shows operation | movement of the time management part which concerns on Embodiment 1 of this invention. この発明の実施の形態1に係る映像フレームの送受信および表示の状況を簡易的に示したタイムチャートである。It is the time chart which showed simply the condition of transmission / reception and display of a video frame concerning Embodiment 1 of this invention. 最大許容遅延時間の設定機能を有さない映像受信装置適用時の映像フレームの送受信および表示の状況を簡易的に示したタイムチャートである。6 is a time chart simply showing a state of transmission / reception and display of a video frame when a video receiving apparatus not having a function of setting a maximum allowable delay time is applied. この発明の実施の形態2による映像受信装置の機能構成を示すブロック図である。It is a block diagram which shows the function structure of the video receiver by Embodiment 2 of this invention. この発明の実施の形態3乃至実施の形態5の映像受信装置が適用される映像・音声伝送システムの基本構成を示すブロック図である。It is a block diagram which shows the basic composition of the image | video audio | voice transmission system with which the video receiver of Embodiment 3 thru | or Embodiment 5 of this invention is applied. この発明の実施の形態3による映像受信装置の機能構成を示すブロック図である。It is a block diagram which shows the function structure of the video receiver by Embodiment 3 of this invention. この発明の実施の形態4による映像受信装置の機能構成を示すブロック図である。It is a block diagram which shows the function structure of the video receiver by Embodiment 4 of this invention. この発明の実施の形態5による映像受信装置の機能構成を示すブロック図である。It is a block diagram which shows the function structure of the video receiver by Embodiment 5 of this invention.

以下、この発明をより詳細に説明するために、この発明を実施するための最良の形態について、添付の図面に従って説明する。
実施の形態1.
実施の形態1と実施の形態2では、映像としてMPEG−4ビデオを使用し、IPネットワーク上でIETF(Internet Engineering Task Force) RFC(Request for Comments)3550で規定されているRTP(Real-time Transport Protocol)を使用して映像や音声のリアルタイムデータを伝送する映像伝送システムを例に説明を行う。本例ではMPEG−4の1VOP(Video Object Plane)は複数のRTP(Real-time Transport Protocol)パケットに分割されて送信され、MPEG−4ビデオをRTPパケットに格納する方式についてはIETF RFC3016で規定されている形式を使用するものとする。
Hereinafter, in order to describe the present invention in more detail, the best mode for carrying out the present invention will be described with reference to the accompanying drawings.
Embodiment 1 FIG.
In the first embodiment and the second embodiment, MPEG-4 video is used as a video, and RTP (Real-time Transport) defined by IETF (Internet Engineering Task Force) RFC (Request for Comments) 3550 on the IP network. A video transmission system that transmits real-time video and audio data using the Protocol will be described as an example. In this example, 1 VOP (Video Object Plane) of MPEG-4 is transmitted after being divided into a plurality of RTP (Real-time Transport Protocol) packets, and a method for storing MPEG-4 video in RTP packets is defined by IETF RFC3016. Shall be used.

図1はこの発明の実施の形態1および実施の形態2による映像受信装置が適用された映像伝送システムの基本構成を示すブロック図である。このシステムは、映像送信装置101、映像受信装置102、カメラ103、モニタ104およびネットワーク105から構成されている。
図において、カメラ103から取り込まれた映像データは、映像送信装置101でMPEG−4ビデオに符号化され、RTPパケットによりネットワーク105を介して映像受信装置102に送信される。このとき、RTPパケットには、映像データを構成する映像フレームごとのサンプリング時間を表すタイムスタンプも共に組み込まれる。このタイムスタンプは、再生する際の表示時間として用いられる。映像受信装置102では、受信したRTPパケットから得られる符号化映像データを復号し、復号された映像データに対応する映像再生をモニタ104で行う。
FIG. 1 is a block diagram showing a basic configuration of a video transmission system to which video receivers according to Embodiments 1 and 2 of the present invention are applied. This system includes a video transmission device 101, a video reception device 102, a camera 103, a monitor 104, and a network 105.
In the figure, video data captured from the camera 103 is encoded into MPEG-4 video by the video transmission device 101 and transmitted to the video reception device 102 via the network 105 by RTP packets. At this time, a time stamp indicating a sampling time for each video frame constituting the video data is also incorporated in the RTP packet. This time stamp is used as a display time for reproduction. The video receiver 102 decodes the encoded video data obtained from the received RTP packet, and the monitor 104 performs video playback corresponding to the decoded video data.

図2は実施の形態1による映像受信装置102の機能構成を示すブロック図である。図において、映像受信装置102は、映像受信部201、映像復号化部202、映像出力部203および時間管理部204を備えている。なお、時間管理部204は、ここでは機能の説明上、映像出力部203と別に示されているが、映像出力部203内に含まれていてもよく、このことは実施の形態2においても同様である。
図2において、時間管理部204では、映像データを受信開始後から第1映像フレーム目の表示を行うまでの時間に対する最大許容値を表す最大許容遅延時間を予め設定しておく。映像受信部201は、ネットワーク105を通じて映像送信装置101から送信されたRTPパケットを受信する。映像受信部201では、第1パケットを受信すると、時間管理部204に対し第1パケット到着通知を送り、パケットの順序入れ替えを保証するためにバッファリングを行う。バッファリング後、映像受信部201は、第1パケットから順に映像復号化部202にパケットを入力していく。映像復号化部202では、入力されたパケットが1映像フレーム分揃うと、1映像フレーム分の復号した映像データを生成し、表示用のタイムスタンプと共に映像出力部203に渡す。
FIG. 2 is a block diagram showing a functional configuration of the video receiving apparatus 102 according to the first embodiment. In the figure, the video receiving apparatus 102 includes a video receiving unit 201, a video decoding unit 202, a video output unit 203, and a time management unit 204. Here, the time management unit 204 is shown separately from the video output unit 203 in the description of the function, but may be included in the video output unit 203, and this is the same in the second embodiment. It is.
In FIG. 2, the time management unit 204 sets in advance a maximum allowable delay time that represents a maximum allowable value for the time from the start of reception of video data until the display of the first video frame. The video reception unit 201 receives an RTP packet transmitted from the video transmission apparatus 101 through the network 105. When the video reception unit 201 receives the first packet, the video reception unit 201 sends a first packet arrival notification to the time management unit 204 and performs buffering in order to guarantee the packet order change. After buffering, the video receiving unit 201 inputs the packets to the video decoding unit 202 in order from the first packet. When the input packets for one video frame are prepared, the video decoding unit 202 generates decoded video data for one video frame and passes it to the video output unit 203 together with a display time stamp.

映像出力部203では、映像復号化部202からの映像データと表示用のタイムスタンプを受信すると、時間管理部204に対して表示開始通知を送り、モニタ104で映像の表示を開始する。ここで、映像の表示は、映像復号化部202から入力された表示用のタイムスタンプが示す表示時間のタイミングに合わせて行われるものとする。現在の表示時間については定期的に映像出力部203が時間管理部204に問い合わせることで知ることができるようになっている。時間管理部204は、第1パケット到着通知を受けてから表示開始通知を受けるまでの間に、設定した最大許容遅延時間が経過した場合、表示開始通知が到着する前であっても表示時間の時間管理を開始する。   When the video output unit 203 receives the video data and the display time stamp from the video decoding unit 202, the video output unit 203 sends a display start notification to the time management unit 204 and starts displaying the video on the monitor 104. Here, it is assumed that video display is performed in accordance with the timing of the display time indicated by the time stamp for display input from the video decoding unit 202. The current display time can be known by the video output unit 203 periodically inquiring of the time management unit 204. If the set maximum allowable delay time elapses between the time when the first packet arrival notification is received and the time when the display start notification is received, the time management unit 204 displays the display time even before the display start notification arrives. Start time management.

次に、第1パケット受信から表示時間管理開始までの時間管理部204の動作を図3のフローチャートで説明する。
映像受信部201から第1パケット到着通知を受信すると(ステップST1)、時間管理部204は内蔵した表示遅延タイマにより時間計測を開始する(ステップST2)。この表示遅延タイマの計測値が予め設定されている最大許容遅延時間を越えたかどうかを監視する(ステップST3)。計測値が最大許容遅延時間に達する前に映像出力部203より表示開始通知を受信した場合(ステップST4)、表示遅延タイマは時間計測を終了し、その時点を起点に内蔵した表示時間タイマを用いて表示時間の計測を行う表示時間管理を開始する(ステップST5)。この場合、表示開始通知を出した映像出力部203は映像の表示を開始する。
Next, the operation of the time management unit 204 from the reception of the first packet to the start of display time management will be described with reference to the flowchart of FIG.
When the first packet arrival notification is received from the video reception unit 201 (step ST1), the time management unit 204 starts time measurement using the built-in display delay timer (step ST2). It is monitored whether the measured value of the display delay timer has exceeded a preset maximum allowable delay time (step ST3). When the display start notification is received from the video output unit 203 before the measured value reaches the maximum allowable delay time (step ST4), the display delay timer ends the time measurement and uses the display time timer built in from that time point. Display time management for measuring the display time is started (step ST5). In this case, the video output unit 203 that has issued the display start notification starts video display.

一方、ステップST3において、映像出力部203から表示開始通知を未だ受信していない状態で表示遅延タイマが予め設定されている最大許容遅延時間に達した場合、その時点で表示時間タイマによる表示時間を計測する表示時間管理を開始する(ステップST5)。その後、映像出力部203から表示開始通知を受信した場合、時間管理部204は、すでに表示時間管理が開始されている旨と表示時間タイマの現在の表示時間とを映像出力部203へ応答する。これにより映像出力部203は最大許容遅延時間を超えていることを認識し、第1映像フレーム分を受け取った時点で映像の表示を開始する。   On the other hand, when the display delay timer reaches the preset maximum allowable delay time in a state where the display start notification has not yet been received from the video output unit 203 in step ST3, the display time by the display time timer is set at that time. The display time management to be measured is started (step ST5). Thereafter, when a display start notification is received from the video output unit 203, the time management unit 204 responds to the video output unit 203 that display time management has already started and the current display time of the display time timer. As a result, the video output unit 203 recognizes that the maximum allowable delay time has been exceeded, and starts displaying video when the first video frame is received.

映像の表示を開始した後、映像出力部203は、定期的に時間管理部204に問い合わせることにより現在の表示時間を獲得し、復号映像データを映像復号化部202から受け取った時点で、その復号映像データの表示用のタイムスタンプが現在の表示時間よりも以前の値の場合には直ちに映像の表示を実施する。   After starting the video display, the video output unit 203 periodically inquires the time management unit 204 to acquire the current display time, and when the decoded video data is received from the video decoding unit 202, the decoding is performed. When the time stamp for displaying the video data is a value before the current display time, the video is immediately displayed.

図4は、映像送信装置101のカメラ103により取り込まれた各映像フレームが映像受信装置102に伝送され、表示されるまでの状況を簡易的に示したタイムチャートである。901は時間軸を表している。一方、図5は、図4に対比させたタイムチャートで、最大許容遅延時間の設定機能を持たない映像受信装置を用いた場合の状況を示したものである。1001は時間軸、1002は最大許容遅延時間の設定機能を有さない映像受信装置である。図4と図5を用いてこの発明の効果について説明する。   FIG. 4 is a time chart schematically showing a situation until each video frame captured by the camera 103 of the video transmission apparatus 101 is transmitted to the video reception apparatus 102 and displayed. Reference numeral 901 represents a time axis. On the other hand, FIG. 5 is a time chart compared with FIG. 4 and shows a situation when a video receiving apparatus that does not have a function of setting a maximum allowable delay time is used. Reference numeral 1001 denotes a time axis, and reference numeral 1002 denotes a video receiving apparatus that does not have a function for setting a maximum allowable delay time. The effect of the present invention will be described with reference to FIGS.

両図において、映像送信装置101は、カメラ103から入力された映像をサンプリングし、符号化し、ネットワークを介して映像送信装置に送信する。VOPは映像フレームを表しており、VOP1のサンプリング時間を表すタイムスタンプTSは0、VOP2のタイムスタンプTSはT1、VOP3のタイムスタンプTSはT2、VOP4のタイムスタンプTSはT3である。映像送信装置101において、時間0にサンプリングした映像を符号化し、映像フレームVOP1を取得したとする。この映像フレームVOP1を、映像送信装置101からネットワーク105を介して映像受信装置102に伝送すると、ネットワーク伝送時間としてT1時間費やす。ここでは、映像フレームVOP1は複数のRTPパケットに分割され伝送されているものとする。次の符号化される映像はT1時間後の映像となり、符号化した映像フレームはVOP2である。同様にVOP3、VOP4も符号化されていく。   In both figures, the video transmission apparatus 101 samples the video input from the camera 103, encodes it, and transmits it to the video transmission apparatus via the network. VOP represents a video frame. The time stamp TS indicating the sampling time of VOP1 is 0, the time stamp TS of VOP2 is T1, the time stamp TS of VOP3 is T2, and the time stamp TS of VOP4 is T3. Assume that the video transmission apparatus 101 encodes a video sampled at time 0 and acquires a video frame VOP1. When this video frame VOP1 is transmitted from the video transmission apparatus 101 to the video reception apparatus 102 via the network 105, T1 time is spent as network transmission time. Here, it is assumed that the video frame VOP1 is divided into a plurality of RTP packets and transmitted. The next encoded video is the video after time T1, and the encoded video frame is VOP2. Similarly, VOP3 and VOP4 are also encoded.

映像送信装置101から送信された信号が図5に示される最大許容遅延時間の設定機能を持たない映像受信装置1002で受信された場合、映像受信装置1002は、映像フレームVOP1の全てのRTPパケットを受信すると、映像フレームのデータを復号し、表示可能になった時点で表示時間の計測を行う表示時間管理を開始する。そのため、基本的には映像フレームVOP2はVOP1の表示後のT1時間後に表示が行われ、映像フレームVOP3はVOP2表示後のT2時間後に表示が実施される。このため、第1映像フレームVOP1に生じた遅延は、VOP2以降の映像フレームにも影響を与え、VOP2以降の映像フレームもその遅延を有したまま再生を続けることになる。   When the signal transmitted from the video transmitting apparatus 101 is received by the video receiving apparatus 1002 that does not have the function of setting the maximum allowable delay time shown in FIG. 5, the video receiving apparatus 1002 receives all the RTP packets of the video frame VOP1. When received, the video frame data is decoded, and display time management for measuring the display time is started when display is possible. Therefore, basically, the video frame VOP2 is displayed after the time T1 after displaying the VOP1, and the video frame VOP3 is displayed after the time T2 after displaying the VOP2. Therefore, the delay generated in the first video frame VOP1 also affects the video frames after VOP2, and the video frames after VOP2 continue to be reproduced with the delay.

一方、映像送信装置101から送信された信号が図4に示される最大許容遅延時間の設定を有する映像受信装置102で受信された場合、映像受信装置102は、映像フレームVOP1をペイロードに格納する先頭パケットを受信したところで、表示遅延タイマにより最大遅延時間の計測を開始する。この例では、第1映像フレームVOP1は伝送速度に対して大きなサイズとなっており、VOP1の最初のパケットを受信開始して、VOP1の最終パケットを受信し終える前に最大許容遅延時間を経過してしまうことになる。そのため、映像フレームVOP1を表示する前に表示時間管理を開始する。この場合、映像フレームVOP1が表示可能になった時点では、既に表示時間管理は開始されているため、VOP1は直ちに表示される。続く映像フレームVOP2では、ネットワーク伝送時間に対して大きな映像フレームではなく、その映像フレームに設定されている表示時間より前に復号が可能であるため、設定された表示時間通りに表示される。その後、映像フレームVOP3、VOP4、…と順次それぞれの設定された表示時間通りに表示することが可能である。   On the other hand, when the signal transmitted from the video transmission device 101 is received by the video reception device 102 having the maximum allowable delay time setting shown in FIG. 4, the video reception device 102 stores the video frame VOP1 in the payload. When the packet is received, measurement of the maximum delay time is started by the display delay timer. In this example, the first video frame VOP1 has a large size with respect to the transmission rate, and the maximum allowable delay time elapses before the reception of the first packet of VOP1 and the reception of the final packet of VOP1. It will end up. Therefore, display time management is started before displaying the video frame VOP1. In this case, since the display time management has already been started when the video frame VOP1 can be displayed, the VOP1 is immediately displayed. The succeeding video frame VOP2 is not a video frame that is large with respect to the network transmission time, but can be decoded before the display time set for the video frame, so that it is displayed according to the set display time. After that, it is possible to display the video frames VOP3, VOP4,... Sequentially in accordance with the set display times.

以上のように、第1映像フレームVOP1は伝送時間が最大許容遅延時間より長かったため管理している平均的な表示時間より遅れて表示を開始するが、第2映像フレームVOP2以降は表示時間通りに表示することが可能となる。つまり、伝送速度に対してサイズが大きい映像フレームが第1映像フレーム目に存在した場合でも、第1映像フレームの映像表示は最大許容遅延時間分より遅延するが、その後システムで想定している平均的なサイズの映像フレームで構成される映像が送信される場合には、第1映像フレーム目の遅延は後続の映像フレームの表示時間には影響せず、映像ストリームの第1パケットを受信してから最大でも最大許容遅延時間の遅延で時間管理をしながら映像表示を行うことが可能となる。なお、映像出力部203において、表示時間に遅れて復号された映像フレームについては復号のみ行い、表示を実施しないことも可能である。その場合、この発明では、映像フレーム落ちは発生するが、遅れて到着した映像フレームを表示したことにより生じる不自然な速度の動きの発生を防止することも可能となる。   As described above, since the transmission time of the first video frame VOP1 is longer than the maximum allowable delay time, the display starts after the average display time managed, but after the second video frame VOP2, the display time is in accordance with the display time. It is possible to display. That is, even if a video frame having a size larger than the transmission speed exists in the first video frame, the video display of the first video frame is delayed by the maximum allowable delay time, but the average assumed by the system thereafter When a video composed of video frames of a certain size is transmitted, the delay of the first video frame does not affect the display time of the subsequent video frame, and the first packet of the video stream is received. Therefore, video display can be performed while managing the time with a maximum allowable delay time. Note that in the video output unit 203, it is possible to perform only decoding and not display the video frame decoded after the display time. In this case, in the present invention, video frame dropping occurs, but it is also possible to prevent the occurrence of unnatural speed movement caused by displaying a delayed video frame.

以上のように、この実施の形態1によれば、時間管理部204において、映像データの受信開始後から第1映像フレーム目の表示を行うまでの最大許容遅延時間が予め設定されており、映像受信部201から第1パケット到着通知を受けると時間計測を開始し、当該計測値が最大許容遅延時間に達する前に映像出力部203からの表示開始通知を受信した場合、および第1パケット到着通知を受けてから表示開始通知を受ける前に最大許容遅延時間を経過した場合のいずれか早い方の場合を起点にして表示時間の計測を行う表示時間管理を開始し、また映像出力部203からの問い合わせに対して現在の表示時間を返すようにし、映像出力部203が、計測された表示時間に基づいて次の映像フレームの映像データの表示を開始するようにしている。したがって、第1映像フレームは伝送時間が大きく、最大許容遅延時間を越えて復号化された場合でも、第2映像フレーム以降は表示時間通りに表示することが可能となる。そのため、VBVバッファ容量をネットワーク帯域に対応して制限することなく、低帯域のネットワークを介して映像データを受信する場合でも遅延時間を少なくして再生可能にする。   As described above, according to the first embodiment, in the time management unit 204, the maximum allowable delay time from the start of reception of video data until the display of the first video frame is set in advance. When the first packet arrival notification is received from the receiving unit 201, the time measurement starts, and when the display start notification is received from the video output unit 203 before the measured value reaches the maximum allowable delay time, and the first packet arrival notification Display time management for measuring the display time starting from the earlier of the cases where the maximum allowable delay time has elapsed before receiving the display start notification after receiving the display start, and from the video output unit 203 The current display time is returned in response to the inquiry, and the video output unit 203 starts displaying the video data of the next video frame based on the measured display time. There. Therefore, the first video frame has a long transmission time, and even when the first video frame is decoded exceeding the maximum allowable delay time, the second video frame and the subsequent frames can be displayed according to the display time. Therefore, without limiting the VBV buffer capacity corresponding to the network band, even when video data is received via a low-band network, it can be reproduced with a reduced delay time.

実施の形態2.
図6は実施の形態2による映像受信装置の機能構成を示すブロック図である。この図に示される映像受信装置102の構成は、実施の形態1の図2と比較すると、表示時間変換部301が追加され、映像出力部203の代わりに映像出力部303が設けられている。この映像出力部303は、上記映像出力部203の機能に加え、映像表示前に表示する映像フレームの表示用のタイムスタンプと現在の表示時間を表示時間変換部301に渡す機能を有している。表示時間変換部301は、表示時間に遅れた映像フレームの当該表示時間を徐々に戻すための予め設定された所定の時間パラメータを用いタイムスタンプと現在の表示時間に遅れによる差がある場合、その後順次受信される映像フレームのタイムスタンプを現在の表示時間と一致するまで徐々に補正していく手段である。以下の説明において、図2に相当する部分に対する重複説明を原則として省略するものとする。
Embodiment 2. FIG.
FIG. 6 is a block diagram showing a functional configuration of the video receiving apparatus according to the second embodiment. Compared with FIG. 2 of the first embodiment, the configuration of the video receiving apparatus 102 shown in FIG. 2 includes a display time conversion unit 301 and a video output unit 303 instead of the video output unit 203. In addition to the function of the video output unit 203, the video output unit 303 has a function of passing a time stamp for displaying a video frame to be displayed before video display and the current display time to the display time conversion unit 301. . The display time conversion unit 301 uses a predetermined time parameter that is set in advance to gradually return the display time of the video frame that is delayed in the display time. This is means for gradually correcting the time stamps of sequentially received video frames until they coincide with the current display time. In the following description, redundant description of the portion corresponding to FIG. 2 is omitted in principle.

映像出力部303は、映像復号化部202で復号された映像フレームを受信すると、時間管理部204に現在の表示時間を問い合わせる。映像出力部303は、得られた現在の表示時間を、受信した映像フレームの表示用のタイムスタンプと共に表示時間変換部301に渡す。表示時間変換部301は、受け取ったタイムスタンプを現在の表示時間と比較し、そのタイムスタンプが現在の表示時間よりも遅れている場合には、遅延時間ΔTdを求め、その遅延時間ΔTdと現在の表示時間Tmを記憶し、タイムスタンプと現在の表示時間についてはそのまま映像出力部303に対して返す。映像出力部303は、その映像フレームをモニタ104に表示させ、その後、続く次の映像フレームを映像復号化部202より受信すると、時間管理部204に現在の表示時間を問い合わせ、同様に表示時間変換部301にその映像フレームの表示用のタイムスタンプTSpと現在の表示時間Tpを渡す。   When receiving the video frame decoded by the video decoding unit 202, the video output unit 303 inquires of the time management unit 204 about the current display time. The video output unit 303 passes the obtained current display time to the display time conversion unit 301 together with a time stamp for displaying the received video frame. The display time conversion unit 301 compares the received time stamp with the current display time, and when the time stamp is behind the current display time, obtains a delay time ΔTd, and the delay time ΔTd and the current time are displayed. The display time Tm is stored, and the time stamp and the current display time are returned to the video output unit 303 as they are. When the video output unit 303 displays the video frame on the monitor 104 and then receives the subsequent video frame from the video decoding unit 202, the video output unit 303 inquires of the time management unit 204 about the current display time and similarly converts the display time. The time stamp TSp for displaying the video frame and the current display time Tp are passed to the unit 301.

ここで、表示時間変換部301には、表示時間に遅れた映像フレームが存在した場合にその表示時間を徐々に戻すための時間パラメータTrが予め設定されているものとする。表示時間変換部301では、記憶していた遅延時間ΔTdを時間パラメータTrで割った値(ΔTd÷Tr)を得る。次に、記憶している表示時間TmとタイムスタンプTSpの差分をこの(ΔTd÷Tr)に乗算した値ΔTを求め、さらにΔTを遅延時間ΔTdから減じた値を計算し、映像出力部303から受け取ったタイムスタンプTSpに(ΔTd−ΔT)を加算した値TSp’を補正後の表示用のタイムスタンプとして返す。この補正動作は、映像出力部303が復号化した映像を受け取る度に一度のみ実行する。   Here, it is assumed that the display time conversion unit 301 is set in advance with a time parameter Tr for gradually returning the display time when there is a video frame delayed with respect to the display time. The display time conversion unit 301 obtains a value (ΔTd ÷ Tr) obtained by dividing the stored delay time ΔTd by the time parameter Tr. Next, a value ΔT obtained by multiplying the difference between the stored display time Tm and the time stamp TSp by (ΔTd ÷ Tr) is obtained, and a value obtained by subtracting ΔT from the delay time ΔTd is calculated. A value TSp ′ obtained by adding (ΔTd−ΔT) to the received time stamp TSp is returned as a corrected time stamp for display. This correction operation is executed only once every time the video output unit 303 receives the decoded video.

最終的に表示時間変換部301が映像出力部303に返す補正後の表示用のタイムスタンプTSp’の計算式は(1)、(2)式のようになる。
ΔT=(TSp−Tm)×(ΔTd÷Tr) (1)
TSp’=TSp+(ΔTd−ΔT) (2)
ここで、(ΔTd−ΔT)が負の値になった場合には表示時間変換処理は終了し、受信した表示用のタイムスタンプをそのまま返すこととする。また、表示用のタイムスタンプTSpに(ΔTd−ΔT)を加算した値(補正後の表示用タイムスタンプTSp’)が現在の表示時間より小さかった(過去の時間を示している)場合、再度遅延時間ΔTと現在の表示時間Tmを受信した値として記憶し直す。
The calculation formulas of the corrected display time stamp TSp ′ finally returned to the video output unit 303 by the display time conversion unit 301 are as shown in formulas (1) and (2).
ΔT = (TSp−Tm) × (ΔTd ÷ Tr) (1)
TSp ′ = TSp + (ΔTd−ΔT) (2)
Here, when (ΔTd−ΔT) becomes a negative value, the display time conversion process ends, and the received display time stamp is returned as it is. If the value obtained by adding (ΔTd−ΔT) to the display time stamp TSp (the corrected display time stamp TSp ′) is smaller than the current display time (indicating the past time), the delay is again made. The time ΔT and the current display time Tm are stored again as received values.

以上のように、この実施の形態2によれば、表示時間変換部301において、復号された映像フレームを順次受信した際に映像出力部303が時間管理部204から得た現在の表示時間を、対応する映像フレームのタイムスタンプと共に受信し、最初の映像フレームのタイムスタンプが現在の表示時間よりも遅れている場合にはその遅延時間を求めて現在の表示時間と共に記憶しておき、表示時間に遅れた映像フレームの当該表示時間を徐々に戻すための予め設定された所定の時間パラメータと、記憶していた遅延時間および表示時間と、次に受け取った映像フレームに関する現在の表示時間に基づいて、次に受け取ったタイムスタンプを補正し、映像出力部303が、表示時間変換部301から返される元のタイムスタンプまたは補正後のタイムスタンプと、対応した現在の表示時間に基づいて映像の表示を行うようにしている。したがって、管理する表示時間に対し、表示時間に遅延して復号された映像フレームが存在した場合には、次映像フレーム以降の映像の表示時間を一度に正常に戻すと、動きが不自然になる可能性があるが、上記のように一定時間かけて徐々に正常な表示時間に近付けることで、自然に表示時間を元に戻すことが可能となる。   As described above, according to the second embodiment, the display time conversion unit 301 obtains the current display time obtained from the time management unit 204 by the video output unit 303 when sequentially receiving the decoded video frames. When the time stamp of the corresponding video frame is received and the time stamp of the first video frame is behind the current display time, the delay time is obtained and stored together with the current display time. Based on a predetermined time parameter set in advance for gradually returning the display time of the delayed video frame, the stored delay time and display time, and the current display time for the next received video frame, Next, the received time stamp is corrected, and the video output unit 303 returns the original time stamp returned from the display time conversion unit 301 or the corrected time stamp. And time stamp, so that the display of video based on the current display time corresponding. Therefore, if there is a video frame that is decoded with a delay relative to the display time to be managed, if the video display time after the next video frame is returned to normal at once, the motion becomes unnatural. Although there is a possibility, the display time can be naturally restored by gradually approaching the normal display time over a certain time as described above.

実施の形態3.
この実施の形態3では、上記各実施の形態と同様に、映像としてMPEG−4ビデオを使用し、IPネットワーク上でIETF RFC3550で規定されているRTPを使用して伝送する映像・音声伝送システムを例に説明する。また、MPEG−4の1VOPは複数のRTPパケットに分割されて送信され、MPEG−4ビデオをRTPパケットに格納する方式についてはIETF RFC3016で規定されている形式を使用するものとする。なお、続く実施の形態4および実施の形態5の場合も同じ条件に適用されたものとする。
Embodiment 3 FIG.
In this third embodiment, a video / audio transmission system that uses MPEG-4 video as video and transmits using RTP defined by IETF RFC3550 on the IP network, as in the above embodiments. Explained as an example. Further, one VOP of MPEG-4 is transmitted after being divided into a plurality of RTP packets, and the format defined in IETF RFC3016 is used as a method for storing MPEG-4 video in RTP packets. In the following fourth and fifth embodiments, the same conditions are applied.

図7は実施の形態3乃至実施の形態5の映像受信装置が適用される映像・音声伝送システムの基本構成を示すブロック図である。この場合の映像伝送システムは、映像送信装置401、映像受信装置402、マイク403、スピーカ404およびネットワーク105から構成されている。
図において、映像送信装置401は、カメラ103から入力された映像データとマイク403から入力された音声データを符号化し、両者を同期させて別々のポートを使用してRTPでストリーミング送信を行う。映像受信装置402は、別々のポートで受信した映像と音声のストリームから映像データと音声データを復号し、それぞれのタイムスタンプ情報を基に同期してそれぞれモニタ104とスピーカ404に出力し、映像と音声の再生を行う。
FIG. 7 is a block diagram showing a basic configuration of a video / audio transmission system to which the video receivers according to the third to fifth embodiments are applied. The video transmission system in this case includes a video transmission device 401, a video reception device 402, a microphone 403, a speaker 404, and a network 105.
In the figure, a video transmission device 401 encodes video data input from the camera 103 and audio data input from the microphone 403, and synchronizes both to perform streaming transmission by RTP using separate ports. The video receiving device 402 decodes video data and audio data from video and audio streams received at different ports, and outputs them to the monitor 104 and the speaker 404 in synchronization with each other based on the time stamp information. Play audio.

図8は実施の形態3による映像受信装置402の機能構成を示すブロック図である。図において、映像受信装置402は、映像受信部501、映像復号化部502、映像出力部503、時間管理部504、音声受信部505、音声復号化部506および音声出力部507を備えている。映像受信部501と映像復号化部502は、図2の映像受信部201と映像復号化部202と機能的に同じである。
図8において、映像受信部501は、映像の第1パケットを受信すると、時間管理部504に対し第1パケット到着通知を送る。映像復号化部502では、バッファリング後、映像受信部501から入力されるパケットが1映像フレーム分揃うと、1映像フレーム分の復号した映像データを生成し、表示用のタイムスタンプと共に映像出力部503に渡す。映像出力部503では、復号された第1映像フレームを映像復号化部502より受け取ると、表示準備完了通知とその第1映像フレームの表示用のタイムスタンプを時間管理部504に対して送る。
FIG. 8 is a block diagram illustrating a functional configuration of the video reception device 402 according to the third embodiment. In the figure, the video receiving device 402 includes a video receiving unit 501, a video decoding unit 502, a video output unit 503, a time management unit 504, an audio receiving unit 505, an audio decoding unit 506, and an audio output unit 507. The video receiving unit 501 and the video decoding unit 502 are functionally the same as the video receiving unit 201 and the video decoding unit 202 in FIG.
In FIG. 8, when receiving the first packet of video, the video reception unit 501 sends a first packet arrival notification to the time management unit 504. The video decoding unit 502 generates decoded video data for one video frame when the packets input from the video receiving unit 501 are arranged after buffering, and outputs the video data together with a display time stamp. Pass to 503. When receiving the decoded first video frame from the video decoding unit 502, the video output unit 503 sends a display preparation completion notification and a time stamp for displaying the first video frame to the time management unit 504.

一方、音声受信部505は、音声パケットを受信すると、時間管理部504に対して第1パケットの到着通知を送り、映像と同様にバッファリングすることでパケットの順序入れ替わりを保証し、その後、音声復号化部506に音声パケットを出力する。音声復号化部506では、符号化された音声を復号化し、復号データとしてPCM(Pulse Code Modulation)データを音声出力部507に出力する。音声出力部507では、最初のPCMデータを音声復号化部506より受信すると、時間管理部504に対して、表示準備完了通知と先頭のPCMデータのタイムスタンプを送る。   On the other hand, when receiving the audio packet, the audio receiving unit 505 sends an arrival notification of the first packet to the time management unit 504, and guarantees the packet order change by buffering in the same manner as the video. The voice packet is output to the decoding unit 506. The audio decoding unit 506 decodes the encoded audio, and outputs PCM (Pulse Code Modulation) data to the audio output unit 507 as decoded data. When the voice output unit 507 receives the first PCM data from the voice decoding unit 506, the voice output unit 507 sends a display preparation completion notification and a time stamp of the first PCM data to the time management unit 504.

時間管理部504では、映像と音声のタイムスタンプの同期をとる機能を有している。時間管理部504は、あらかじめ同一時刻を示す映像と音声のタイムスタンプの対応付けを知っており、双方の表示準備完了通知を受け取った場合、双方のタイムスタンプの内、時刻として過去を表しているタイムスタンプを起点に時間管理を開始して、その時点で、映像出力部503と音声出力部507に対して表示開始指示を返す。映像出力部503と音声出力部507は、表示開始指示を受信すると、定期的に時間管理部504に対して表示時間の問い合わせを行いながら同期したタイムスタンプに基づいて映像の表示と音声の再生を行う。ここで時間管理部504は各メディアのタイムスタンプの時刻表示に変換した値で時間情報を返すものとする。   The time management unit 504 has a function of synchronizing video and audio time stamps. The time management unit 504 knows in advance the correspondence between video and audio time stamps indicating the same time, and when both display preparation completion notifications are received, the time is included in the time stamps of both. Time management is started from the time stamp, and display start instructions are returned to the video output unit 503 and the audio output unit 507 at that time. When the video output unit 503 and the audio output unit 507 receive the display start instruction, the video output unit 503 and the audio output unit 507 periodically display the video and reproduce the audio based on the synchronized time stamp while inquiring of the display time to the time management unit 504. Do. Here, it is assumed that the time management unit 504 returns time information with a value converted into a time display of a time stamp of each medium.

また、時間管理部504には、図2の時間管理部204と同様に最大許容遅延時間が設定されている。時間管理部504は、映像または音声のいずれか一方の第1パケット到着通知を受信すると内蔵の表示遅延タイマにより時間計測を開始し、当該第1パケット到着通知を受けてから映像表示準備完了通知を受けるまでの間に、設定した最大許容遅延時間が経過した場合、映像の表示準備完了通知が到着する前であっても、その時点で、内蔵の表示時間タイマを用いて表示時間の計測を行う表示時間管理を開始する。この表示時間管理の開始時点では、既に音声出力部507からの音声の表示準備完了通知を受信しているので、表示開始指示を音声出力部507に送り音声の第1パケットのタイムスタンプを起点に表示時間管理を開始して、映像の表示と音声の再生を行わせる。   In the time management unit 504, the maximum allowable delay time is set in the same manner as the time management unit 204 in FIG. When receiving the first packet arrival notification of either video or audio, the time management unit 504 starts time measurement by the built-in display delay timer, and after receiving the first packet arrival notification, notifies the video display preparation completion notification. If the set maximum allowable delay time elapses before receiving it, the display time is measured using the built-in display time timer at that point even before the video display preparation completion notification arrives. Start display time management. At the start of this display time management, since the voice display preparation completion notification has already been received from the voice output unit 507, a display start instruction is sent to the voice output unit 507, and the time stamp of the first packet of voice is used as the starting point. Start display time management to display video and play audio.

以上のように、この実施の形態3によれば、時間管理部504において、最大許容遅延時間の設定に加え、かつ映像と音声のタイムスタンプの同期関係を知っており、映像または音声のいずれか一方の第1パケット到着通知を受けると時間計測を開始し、当該計測値が最大許容遅延時間に達する前に映像側の表示準備完了通知を受けた場合、および第1パケット到着通知を受けてから映像側の表示準備完了通知を受ける前に最大許容遅延時間を経過した場合のいずれか早い方を起点にして表示時間の計測を行う表示時間管理を開始し、当該表示時間管理の開始時点に表示開始指示を映像出力部と前記音声出力部に対して送り、また前記映像出力部と前記音声出力部からの定期的な問い合わせに対して現在の表示時間を返すようにし、映像出力部503と音声出力部507は、前記表示開始指示をそれぞれ受信すると、タイムスタンプと現在の表示時間に基づいて映像の表示および音声の再生を開始するようにしている。   As described above, according to the third embodiment, in addition to setting the maximum allowable delay time, the time management unit 504 knows the synchronization relationship between video and audio time stamps, and either video or audio is used. When one of the first packet arrival notifications is received, time measurement is started, and when the display preparation completion notification on the video side is received before the measured value reaches the maximum allowable delay time, and after the first packet arrival notification is received. Starts display time management that measures display time starting from the earlier of the maximum allowable delay time before receiving the display preparation completion notification on the video side, and displays it at the start of the display time management A start instruction is sent to the video output unit and the audio output unit, and the current display time is returned in response to a periodic inquiry from the video output unit and the audio output unit. 503 and audio output unit 507 receives the display start instruction to respectively so as to start reproduction of the display and audio video based on the time stamp and the current display time.

通常、音声の1サンプルはネットワーク帯域と比較してネットワーク伝送時間が問題になるほど大きなサイズになることは無いため、この実施の形態3でも、最大許容遅延時間の処理対象は映像ストリームについて行うことになる。したがって、伝送速度に対してサイズが大きい映像フレームが第1映像フレーム目に存在した場合には、その第1映像フレームの映像表示は最大許容遅延時間分より遅延して行われる。そのため、本来対応している音声と同期しないことになる。しかし、その後、この映像・音声伝送システムで想定している平均的なサイズの映像フレームで構成される映像が送信される場合、第1映像フレーム目の遅延は、この実施の形態3で許容範囲に補正されることにより、後続する映像フレームの表示時間には影響を及ぼさなくなる。その結果、音声は、第1映像フレームを構成する最終のパケットを受信してから最大でも最大許容遅延時間分の遅延で映像表示と同期しながら再生されることが可能となる。   Normally, one sample of audio is not so large that the network transmission time becomes a problem as compared with the network bandwidth. Therefore, even in the third embodiment, the processing target of the maximum allowable delay time is performed on the video stream. Become. Therefore, when a video frame having a size larger than the transmission speed exists in the first video frame, the video display of the first video frame is delayed with respect to the maximum allowable delay time. Therefore, it is not synchronized with the sound that is originally supported. However, after that, when a video composed of video frames of an average size assumed in this video / audio transmission system is transmitted, the delay of the first video frame is within an allowable range in the third embodiment. As a result of the correction, the display time of the subsequent video frame is not affected. As a result, the audio can be played back in synchronization with the video display with a delay equivalent to the maximum allowable delay time after receiving the last packet constituting the first video frame.

実施の形態4.
図9は実施の形態4による映像受信装置の機能構成を示すブロック図である。この図に示される映像受信装置402の構成は、実施の形態3の図8と比較すると、表示履歴記憶部601が追加され、時間管理部504の代わりに時間管理部604が設けられている。表示履歴記憶部601は映像の表示用のタイムスタンプと対応する表示時間を表示履歴情報として記憶する手段である。また、映像出力部602は、映像を出力した時間とタイムスタンプを時間管理部604に通知する機能を加えたものである。時間管理部604は、図8の時間管理部504の機能に追加して、表示履歴記憶部601の表示履歴情報を監視し、タイムスタンプが表示時間に対して一定以上の時間連続して遅れた場合には一時停止時間を含む再同期通知を行う機能を有している。以下の説明において、図8に相当する部分に対する重複説明は原則として省略するものとする。
Embodiment 4 FIG.
FIG. 9 is a block diagram showing a functional configuration of a video receiving apparatus according to the fourth embodiment. Compared with FIG. 8 of the third embodiment, the configuration of the video receiving device 402 shown in this figure is that a display history storage unit 601 is added and a time management unit 604 is provided instead of the time management unit 504. The display history storage unit 601 is means for storing a display time corresponding to a video display time stamp as display history information. The video output unit 602 has a function of notifying the time management unit 604 of the time and time stamp when the video is output. The time management unit 604 monitors the display history information in the display history storage unit 601 in addition to the function of the time management unit 504 in FIG. 8, and the time stamp is delayed for a certain time continuously with respect to the display time. In some cases, a resynchronization notification including a pause time is provided. In the following description, redundant description for the portion corresponding to FIG. 8 is omitted in principle.

時間管理部604は、最大許容遅延時間を経過した場合の表示時間管理を開始したときには、映像フレームの表示用のタイムスタンプと対応する表示時間を表示履歴記憶部601に記録して、表示履歴情報を監視する。表示履歴情報において、タイムスタンプが一定以上の時間連続して対応する表示時間に対して遅れている場合、再同期通知を音声出力部507に送る。この再同期通知は一時停止時間を含むものである。一時停止時間は、表示履歴記憶部601の表示履歴情報に基づいて、映像が表示時間に合わせて十分表示可能となるように設定されている。再同期通知を行った場合、音声出力部507は一時停止時間に合わせて音声の再生を停止し、映像が表示可能となった状態で再開する。再同期通知以降、時間管理部604は一時停止時間分遅れた時間を現在の表示時間として映像出力部602および音声出力部507からの問い合わせに対し返すようにし、音声出力部507は返された一時停止時間分遅れた現在の表示時間に基づいて音声を再生する。   When starting the display time management when the maximum allowable delay time has elapsed, the time management unit 604 records the display time corresponding to the time stamp for displaying the video frame in the display history storage unit 601, and displays the display history information. To monitor. In the display history information, when the time stamp is delayed with respect to the corresponding display time continuously for a certain time, a resynchronization notification is sent to the audio output unit 507. This resynchronization notification includes a pause time. The pause time is set based on the display history information in the display history storage unit 601 so that the video can be sufficiently displayed in accordance with the display time. When the resynchronization notification is performed, the audio output unit 507 stops the reproduction of the audio in accordance with the pause time, and resumes in a state where the video can be displayed. After the resynchronization notification, the time management unit 604 returns the time delayed by the pause time as the current display time in response to the inquiry from the video output unit 602 and the audio output unit 507, and the audio output unit 507 returns the temporary Audio is played back based on the current display time delayed by the stop time.

以上のように、この実施の形態4によれば、時間管理部604は、最大許容遅延時間を経過した場合の表示時間管理の開始において該当する映像のタイムスタンプと対応する表示時間を表示履歴情報として表示履歴記憶部601に記憶し、この表示履歴情報におけるタイムスタンプが対応する表示時間に対して一定以上の時間連続して遅れている場合には一時停止時間を含む再同期通知を音声出力部507に通知し、その再同期通知以降、一時停止時間分遅れた時間を現在の表示時間として映像出力部602と音声出力部507からの問い合わせに対し返し、音声出力部507は、時間管理部604から受信した再同期通知の一時停止時間に従って音声の再生を停止し、その後返された一時停止時間分遅れた現在の表示時間に基づいて音声を再生するようにしている。したがって、最大許容遅延時間の設定時に想定していた平均的なサイズ以上の映像フレームが続いた場合には、音声の再生を一時停止し、再同期を行うことで映像の表示と音声の同期を可能にする。   As described above, according to the fourth embodiment, the time management unit 604 displays the display time corresponding to the time stamp of the corresponding video at the start of the display time management when the maximum allowable delay time has elapsed. Is stored in the display history storage unit 601, and if the time stamp in the display history information is continuously delayed for a certain time or longer than the corresponding display time, a resynchronization notification including a pause time is sent to the audio output unit 507, and after the resynchronization notification, the time delayed by the pause time is returned as the current display time in response to the inquiry from the video output unit 602 and the audio output unit 507, and the audio output unit 507 transmits the time management unit 604. Stops playing audio according to the pause time of the resynchronization notification received from, and then plays the audio based on the current display time delayed by the returned pause time It is to be raw. Therefore, if video frames that exceed the average size assumed when setting the maximum allowable delay time continue, audio playback is paused and re-synchronization is performed to synchronize the video display and audio. enable.

実施の形態5.
図10は実施の形態5による映像受信装置の機能構成を示すブロック図である。この図に示される映像受信装置402の構成は、実施の形態4の図9と比較すると、出力時間変換部701が追加され、音声出力部507の代わりに音声出力部707が設けられている。音声出力部707は、上記音声出力部507のように一時停止通知の受信時に音声再生の一時停止を行うのではなく、出力時間変換部701で変換されたタイムスタンプに合わせて音声を出力する機能を有しているものである。そのため、出力時間変換部701は、後述するように、音声データと映像データ間の遅延時間を算出し、音声のタイムスタンプを当該遅延時間で補正した変換タイムスタンプを生成する手段である。
Embodiment 5 FIG.
FIG. 10 is a block diagram showing a functional configuration of the video receiving apparatus according to the fifth embodiment. Compared with FIG. 9 of the fourth embodiment, the configuration of the video reception device 402 shown in this figure is provided with an output time conversion unit 701 and an audio output unit 707 instead of the audio output unit 507. The audio output unit 707 does not pause audio reproduction when receiving a pause notification like the audio output unit 507, but outputs a sound in accordance with the time stamp converted by the output time conversion unit 701. It is what has. Therefore, as will be described later, the output time conversion unit 701 is means for calculating a delay time between the audio data and the video data and generating a conversion time stamp in which the audio time stamp is corrected by the delay time.

図10の場合の音声出力部707では、時間管理部604より一時停止時間を含む再同期通知を受信すると、出力時間変換部701に対して、現在の表示時間と一時停止時間を通知する。出力時間変換部701は、受信した一時停止時間Tsを予め設定された再同期処理時間で除算した値ΔTpを求める。その後出力する音声データが音声出力部707に到着した場合、音声出力部707は、時間管理部604に問い合わせて得た音声の表示用のタイムスタンプTSpを出力時間変換部701に渡す。出力時間変換部701では、タイムスタンプTSpから一時停止時間Tsを減算した値Ttを求める。さらに、タイムスタンプTSpと再同期通知が到着した時間Tmの差分を上記値ΔTpに乗算し、その積を上記値Ttに加算した結果TSp’を、出力タイムスタンプとして音声出力部707に返す。最終的に出力時間変換部701が音声出力部707に返す変換タイムスタンプTSp’の計算式は(3)、(4)式のようになる。
Tt=TSp−Ts (3)
TSp’=Tt+(TSp−Tm)×ΔTp (4)
When receiving the resynchronization notification including the pause time from the time management unit 604, the audio output unit 707 in the case of FIG. 10 notifies the output time conversion unit 701 of the current display time and the pause time. The output time conversion unit 701 obtains a value ΔTp obtained by dividing the received pause time Ts by a preset resynchronization processing time. When the audio data to be output thereafter arrives at the audio output unit 707, the audio output unit 707 passes the time stamp TSp for audio display obtained by making an inquiry to the time management unit 604 to the output time conversion unit 701. The output time conversion unit 701 obtains a value Tt obtained by subtracting the temporary stop time Ts from the time stamp TSp. Furthermore, the value ΔTp is multiplied by the difference between the time stamp TSp and the time Tm when the resynchronization notification arrives, and the result TSp ′ obtained by adding the product to the value Tt is returned to the audio output unit 707 as an output time stamp. The calculation formula of the conversion time stamp TSp ′ finally returned to the audio output unit 707 by the output time conversion unit 701 is expressed by the following equations (3) and (4).
Tt = TSp−Ts (3)
TSp ′ = Tt + (TSp−Tm) × ΔTp (4)

出力時間変換部701は、再同期通知が到着した時刻から、設定されている再同期処理時間が経過した時点で出力時間変換の処理を終了する。音声出力部707は、変換タイムスタンプによる出力時間に合わせて音声を出力することになり、音声が途切れることなく、映像の表示と音声の再生を再同期することが可能となる。但し音声の場合は、サンプリングタイミングと同様のタイミングで再生を行わないと雑音や歪みが発生する可能性があり、サンプルの補正等を行うことも必要となるが、その方法についてはこの実施の形態5では特定せず、一般的な方法を使用することとする。   The output time conversion unit 701 ends the output time conversion process when the set resynchronization processing time has elapsed from the time when the resynchronization notification arrives. The audio output unit 707 outputs audio in accordance with the output time based on the conversion time stamp, and can re-synchronize the video display and audio reproduction without interruption of the audio. However, in the case of audio, noise and distortion may occur if playback is not performed at the same timing as the sampling timing, and it is also necessary to perform sample correction and the like. The method is not specified in 5, and a general method is used.

以上のように、この実施の形態5によれば、出力時間変換部701により、一時停止時間、予め設定された再同期処理時間、音声のタイムスタンプおよび再同期通知が到着した時間に基づいて、音声データと映像データ間の遅延時間を算出し、音声のタイムスタンプに当該遅延時間を加算した変換タイムスタンプを生成して音声出力部707に返し、音声出力部707が、この変換タイムスタンプに合わせて音声の再生を行うようにしたものである。したがって、音声データの再生開始後、一定時間経過後も音声データと映像データ間に遅延時間が存在し、同期再生処理が不可能な場合には、映像データと音声データとの同期再生が正常に戻るまで音声の再生時間に遅延時間を加算して再生することができる。   As described above, according to the fifth embodiment, the output time conversion unit 701 uses the pause time, the preset resynchronization processing time, the time stamp of the voice, and the time when the resynchronization notification arrives, A delay time between the audio data and the video data is calculated, a conversion time stamp obtained by adding the delay time to the audio time stamp is generated and returned to the audio output unit 707, and the audio output unit 707 matches the conversion time stamp. Audio playback. Therefore, if there is a delay time between audio data and video data even after a certain time has elapsed after the start of audio data playback, and synchronous playback processing is not possible, synchronized playback of video data and audio data is normal. It is possible to reproduce the sound by adding a delay time to the sound reproduction time until returning.

以上のように、この発明に係る映像受信装置は、受信側でデコード画像の表示時間管理を行うことにより、低帯域のネットワークを介して映像データを受信する場合において遅延時間を少なくして再生可能にすることができるので、リアルタイムな映像を遠隔で扱う監視システムに適している。   As described above, the video receiving apparatus according to the present invention can reproduce with reduced delay time when video data is received via a low bandwidth network by managing the display time of the decoded image on the receiving side. Therefore, it is suitable for a monitoring system that remotely handles real-time video.

Claims (6)

符号化された映像データとこの映像データの表示タイムスタンプをパケットによりネットワークを介して受信し、第1パケットの受信時に第1パケット到着通知を出力すると共に、各パケットを順次出力する映像受信部と、
順次入力されるパケットから1映像フレーム分ごとの映像データを復号して該当映像フレームの表示タイムスタンプと共に出力する映像復号化部と、
復号された映像データと該当映像フレームの表示タイムスタンプを受信した際、入手した現在の表示時間と前記表示タイムスタンプに基づいて映像の表示を開始すると共に、表示開始通知を出力する映像出力部と、
映像データの受信開始後から第1映像フレーム目の表示を行うまでの最大許容遅延時間が予め設定されており、前記第1パケット到着通知を受けると時間計測を開始し、当該計測値が前記最大許容遅延時間に達する前に前記映像出力部からの表示開始通知を受信した場合、および前記第1パケット到着通知を受けてから前記表示開始通知を受ける前に前記最大許容遅延時間を経過した場合のいずれか早い方の場合を起点にして表示時間の計測を行う表示時間管理を開始し、また前記映像出力部からの問い合わせに対して現在の表示時間を返す時間管理部とを備え、
前記映像出力部は、計測された表示時間に基づいて次の映像フレームの映像データの表示を開始することを特徴とする映像受信装置。
A video reception unit that receives the encoded video data and a display time stamp of the video data via a network, outputs a first packet arrival notification when receiving the first packet, and sequentially outputs each packet; ,
A video decoding unit that decodes video data for each video frame from sequentially input packets and outputs the video data together with a display time stamp of the video frame;
When receiving the decoded video data and the display time stamp of the corresponding video frame, a video output unit for starting display of the video based on the acquired current display time and the display time stamp and outputting a display start notification; ,
The maximum allowable delay time from the start of the reception of the video data until the display of the first video frame is set in advance. When the first packet arrival notification is received, the time measurement is started, and the measured value is the maximum When the display start notification is received from the video output unit before reaching the allowable delay time, and when the maximum allowable delay time has elapsed before receiving the display start notification after receiving the first packet arrival notification A time management unit that starts display time measurement for measuring display time starting from whichever one is earlier, and that returns a current display time in response to an inquiry from the video output unit, and
The video output device, wherein the video output unit starts displaying video data of a next video frame based on the measured display time.
復号された映像フレームを順次受信した際に映像出力部が時間管理部から得た現在の表示時間を、対応する映像フレームの表示タイムスタンプと共に受信し、最初の映像フレームの表示タイムスタンプが現在の表示時間よりも遅れている場合にはその遅延時間を求めて現在の表示時間と共に記憶しておき、表示時間に遅れた映像フレームの当該表示時間を徐々に戻すための予め設定された所定の時間パラメータと、前記記憶していた遅延時間および表示時間と、次に受け取った映像フレームに関する現在の表示時間に基づいて、次に受け取った表示タイムスタンプを補正していく表示時間変換部を備え、
前記映像出力部は、前記表示時間変換部から返される元の表示タイムスタンプまたは補正後の表示タイムスタンプと、対応した現在の表示時間に基づいて映像の表示を行うようにしたことを特徴とする請求の範囲第1項記載の映像表示装置。
When the decoded video frames are sequentially received, the video output unit receives the current display time obtained from the time management unit together with the display time stamp of the corresponding video frame, and the display time stamp of the first video frame is the current If the display time is later than the display time, the delay time is obtained and stored together with the current display time, and a predetermined time for gradually returning the display time of the video frame delayed to the display time. A display time conversion unit that corrects the next received display time stamp based on the parameter, the stored delay time and display time, and the current display time for the next received video frame;
The video output unit displays video based on an original display time stamp returned from the display time conversion unit or a corrected display time stamp and a corresponding current display time. The video display device according to claim 1.
映像データに同期した符号化された音声データのパケットを受信し、音声の第1パケットの受信時に第1パケット到着通知を出力すると共に、音声パケットを順次出力する音声受信部と、
順次入力される音声パケットから音声データを復号してその表示タイムスタンプと共に出力する音声復号化部と、
最初の復号音声データを受信した際に表示準備完了通知と、対応する表示タイムスタンプとを出力し、その後入力される表示開始指示に従って音声の再生を開始する音声出力部と、
時間管理部は、最大許容遅延時間の設定に加え、同一時刻を示す映像と音声の表示タイムスタンプの対応づけをあらかじめ知っており、映像または音声のいずれか一方の第1パケット到着通知を受けると時間計測を開始し、当該計測値が最大許容遅延時間に達する前に映像側の表示準備完了通知を受けた場合、および前記第1パケット到着通知を受けてから映像側の表示準備完了通知を受ける前に前記最大許容遅延時間を経過した場合のいずれか早い方を起点にして表示時間の計測を行う表示時間管理を開始し、当該表示時間管理の開始時点に表示開始指示を映像出力部と前記音声出力部に対して送り、また前記映像出力部と前記音声出力部からの定期的な問い合わせに対して現在の表示時間を返すようにし、
前記映像出力部と前記音声出力部は、前記表示開始指示をそれぞれ受信すると、表示タイムスタンプと現在の表示時間に基づいて映像の表示および音声の再生を開始することを特徴とする請求の範囲第1項記載の映像受信装置。
An audio reception unit that receives a packet of encoded audio data synchronized with video data, outputs a first packet arrival notification upon reception of the first audio packet, and sequentially outputs the audio packet;
A voice decoding unit that decodes voice data from voice packets that are sequentially input and outputs the voice data together with the display time stamp;
An audio output unit that outputs a display preparation completion notification and a corresponding display time stamp when the first decoded audio data is received, and starts audio reproduction in accordance with a display start instruction that is input thereafter;
In addition to setting the maximum allowable delay time, the time management unit knows in advance the correspondence between video and audio display time stamps indicating the same time, and upon receiving the first packet arrival notification of either video or audio When time measurement is started and a video-side display preparation completion notice is received before the measured value reaches the maximum allowable delay time, and after receiving the first packet arrival notice, a video-side display preparation completion notice is received. Start display time management for measuring display time starting from the earlier one when the maximum allowable delay time has elapsed before, and display start instruction at the start time of the display time management and the video output unit Send to the audio output unit, and to return the current display time in response to regular inquiries from the video output unit and the audio output unit,
The video output unit and the audio output unit, when receiving the display start instruction, respectively, start video display and audio playback based on a display time stamp and a current display time. The video receiver according to claim 1.
映像の表示タイムスタンプと対応する表示時間を表示履歴情報として記憶する表示履歴記憶部を備え、
時間管理部は、最大許容遅延時間を経過した場合の表示時間管理の開始において該当する映像の表示タイムスタンプと対応する表示時間を表示履歴情報として前記表示履歴記憶部に記憶し、前記表示履歴情報における表示タイムスタンプが対応する表示時間に対して一定以上の時間連続して遅れている場合には一時停止時間を含む再同期通知を音声出力部に通知し、当該再同期通知以降、一時停止時間分遅れた時間を現在の表示時間として前記映像出力部と前記音声出力部からの問い合わせに対し返し、
前記音声出力部は、前記時間管理部から受信した再同期通知の一時停止時間に従って音声の再生を停止し、その後返された一時停止時間分遅れた現在の表示時間に基づいて音声を再生することを特徴とする請求の範囲第3項記載の映像受信装置。
A display history storage unit for storing display time stamps corresponding to video display time stamps as display history information;
The time management unit stores the display time corresponding to the display time stamp of the corresponding video at the start of display time management when the maximum allowable delay time has elapsed in the display history storage unit as display history information, and the display history information If the display time stamp in is continuously delayed for a certain time or longer than the corresponding display time, a resynchronization notification including the suspension time is sent to the audio output unit, and after the resynchronization notification, the suspension time In response to the inquiry from the video output unit and the audio output unit as the current display time the time delayed by minutes,
The audio output unit stops the audio reproduction according to the pause time of the resynchronization notification received from the time management unit, and then reproduces the audio based on the current display time delayed by the returned pause time. The video receiver according to claim 3, wherein:
一時停止時間、予め設定された再同期処理時間、音声の表示タイムスタンプおよび再同期通知が到着した時間に基づいて、音声データと映像データ間の遅延時間を算出し、前記音声の表示タイムスタンプに当該遅延時間を加算した変換表示タイムスタンプを生成して音声出力部に返す出力時間変換部を備え、
前記音声出力部は、前記変換表示タイムスタンプに合わせて音声の再生を行うことを特徴とする請求の範囲第4項記載の映像受信装置。
Based on the pause time, the preset resynchronization processing time, the audio display time stamp, and the time when the resynchronization notification arrives, the delay time between the audio data and the video data is calculated, and the audio display time stamp An output time conversion unit that generates a conversion display time stamp added with the delay time and returns it to the audio output unit,
5. The video receiving apparatus according to claim 4, wherein the audio output unit reproduces audio in accordance with the converted display time stamp.
復号された映像フレームを順次受信した際に映像出力部が時間管理部から得た現在の表示時間を、対応する映像フレームのタイムスタンプと共に受信し、最初の映像フレームのタイムスタンプが現在の表示時間よりも遅れている場合にはその遅延時間を求めて現在の表示時間と共に記憶しておき、表示時間に遅れた映像フレームの当該表示時間を徐々に戻すための予め設定された所定の時間パラメータと、前記記憶していた遅延時間および表示時間と、次に受け取った映像フレームに関する現在の表示時間に基づいて、次に受け取ったタイムスタンプを補正していく表示時間変換部を備え、
前記映像出力部は、前記表示時間変換部から返される元のタイムスタンプまたは補正後のタイムスタンプと、対応した現在の表示時間に基づいて映像の表示を行うようにしたことを特徴とする請求の範囲第3項記載の映像受信装置。
When the decoded video frames are sequentially received, the video output unit receives the current display time obtained from the time management unit together with the time stamp of the corresponding video frame, and the time stamp of the first video frame is the current display time. A predetermined time parameter set in advance for gradually returning the display time of the video frame delayed to the display time. A display time conversion unit that corrects the next received time stamp based on the stored delay time and display time and the current display time for the next received video frame,
The video output unit displays video based on an original time stamp returned from the display time conversion unit or a corrected time stamp and a corresponding current display time. The video receiver according to claim 3.
JP2006514365A 2004-06-08 2004-06-08 Video receiver Expired - Fee Related JP4188402B2 (en)

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
PCT/JP2004/007954 WO2005122578A1 (en) 2004-06-08 2004-06-08 Video receiver apparatus

Publications (2)

Publication Number Publication Date
JPWO2005122578A1 JPWO2005122578A1 (en) 2008-04-10
JP4188402B2 true JP4188402B2 (en) 2008-11-26

Family

ID=35503514

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2006514365A Expired - Fee Related JP4188402B2 (en) 2004-06-08 2004-06-08 Video receiver

Country Status (2)

Country Link
JP (1) JP4188402B2 (en)
WO (1) WO2005122578A1 (en)

Family Cites Families (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH0951515A (en) * 1995-08-04 1997-02-18 Canon Inc Data transmission system and communication device
JPH09214936A (en) * 1996-02-06 1997-08-15 Nippon Telegr & Teleph Corp <Ntt> Network moving image distribution system
JP4616537B2 (en) * 2002-03-26 2011-01-19 パナソニック電工株式会社 Video communication system

Also Published As

Publication number Publication date
WO2005122578A1 (en) 2005-12-22
JPWO2005122578A1 (en) 2008-04-10

Similar Documents

Publication Publication Date Title
US8189679B2 (en) Content receiving apparatus, method of controlling video-audio output timing and content providing system
EP1879347B1 (en) System and method of audio/video streaming
JP5489675B2 (en) Video information playback method and system, and video information content
KR101350754B1 (en) Method for reducing channel change times and synchronizing audio/video content during channel change
US8745432B2 (en) Delay controller, control method, and communication system
US8526501B2 (en) Decoder and decoding method based on video and audio time information
JP2004507178A (en) Video signal encoding method
JP2009512265A (en) Video data transmission control system and method on network
KR20140104969A (en) Apparatus and method for synchronized transmission of multimedia content over an asynchronous network
KR20060134911A (en) Content reception device, video/audio output timing control method, and content providing system
EP1879346A1 (en) System and method of audio/video streaming
JP2004509491A (en) Synchronization of audio and video signals
US20060161676A1 (en) Apparatus for IP streaming capable of smoothing multimedia stream
JP5186094B2 (en) Communication terminal, multimedia playback control method, and program
JP2005286749A (en) Video image decoding device and video image transmission system using it
JP2004289295A (en) Data processing system, data processor, and data processing method
JP4188402B2 (en) Video receiver
JP4882213B2 (en) Content receiving apparatus, video / audio output timing control method, and content providing system
JP2008278323A (en) Network camera
JP4735932B2 (en) Content receiving apparatus, video / audio output timing control method, and content providing system
JP4506222B2 (en) COMMUNICATION SYSTEM, TRANSMISSION DEVICE AND METHOD, AND PROGRAM
WO2021006137A1 (en) Reception device, reception method, and transmission/reception system
JP5720285B2 (en) Streaming system
JP6335775B2 (en) Media receiver
JP2005252515A (en) Data distribution method

Legal Events

Date Code Title Description
RD04 Notification of resignation of power of attorney

Free format text: JAPANESE INTERMEDIATE CODE: A7424

Effective date: 20080703

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20080812

A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20080910

R150 Certificate of patent or registration of utility model

Free format text: JAPANESE INTERMEDIATE CODE: R150

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20110919

Year of fee payment: 3

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20110919

Year of fee payment: 3

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20120919

Year of fee payment: 4

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20130919

Year of fee payment: 5

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

LAPS Cancellation because of no payment of annual fees