JP6651197B2 - Mixer device and live relay system - Google Patents

Mixer device and live relay system Download PDF

Info

Publication number
JP6651197B2
JP6651197B2 JP2016005614A JP2016005614A JP6651197B2 JP 6651197 B2 JP6651197 B2 JP 6651197B2 JP 2016005614 A JP2016005614 A JP 2016005614A JP 2016005614 A JP2016005614 A JP 2016005614A JP 6651197 B2 JP6651197 B2 JP 6651197B2
Authority
JP
Japan
Prior art keywords
mixer
mixing
information
relay
group
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
JP2016005614A
Other languages
Japanese (ja)
Other versions
JP2017126902A (en
Inventor
橋本 浩二
浩二 橋本
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Iwate Prefectural University
Original Assignee
Iwate Prefectural University
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Iwate Prefectural University filed Critical Iwate Prefectural University
Priority to JP2016005614A priority Critical patent/JP6651197B2/en
Publication of JP2017126902A publication Critical patent/JP2017126902A/en
Application granted granted Critical
Publication of JP6651197B2 publication Critical patent/JP6651197B2/en
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Description

本発明は、複数の情報送信装置からの少なくともビデオ情報を含む複数種の中継情報をミキシング処理し、該ミキシング処理にて得られたミキシング中継情報を出力するミキサ装置及びライブ中継システムに関する。   The present invention relates to a mixer device and a live relay system that mix a plurality of types of relay information including at least video information from a plurality of information transmitting devices and output the mixing relay information obtained by the mixing process.

インターネットを利用したライブ中継用サービス(非特許文献1〜3参照)の台頭と、インターネットの末端において使用可能な通信速度の向上、および個人で利用可能な計算機端末の性能向上により、ライブ中継は容易に実施可能となった。民生品のビデオカメラと汎用PC、またはスマートデバイス(スマートフォン、タブレットPC)を用いる簡単な構成であれば、業務用の機器を用いずともインターネットを利用したライブ中継が可能である。実施されているライブ中継の数は増加し、その内容も多様なものとなっている。ライブ中継の実施に係る敷居が下がり実施者の裾野が広がるに伴い、単一のビデオカメラを用いる簡単な構成のライブ中継のみならず、複数のビデオカメラを用いた複数ビデオソースによるライブ中継も、より容易に実施を可能とするシステムの実現への期待が高まっている。   Live broadcasting is easy due to the rise of live broadcasting services using the Internet (see Non-Patent Documents 1 to 3), the improvement of communication speed usable at the end of the Internet, and the improvement of the performance of computer terminals that can be used by individuals. It became feasible. With a simple configuration using a consumer video camera and a general-purpose PC, or a smart device (smartphone, tablet PC), live broadcasting over the Internet is possible without using commercial equipment. The number of live broadcasts in operation is increasing, and the content is also diverse. As the threshold for implementing live broadcasts has fallen and the base of practitioners has expanded, not only live broadcasts with a simple configuration using a single video camera, but also live broadcasts with multiple video sources using multiple video cameras, There is a growing expectation for a system that can be implemented more easily.

例えば、特許文献1に記載されるミキシングシステムが知られている。このミキシングシステムでは、コンサート会場において複数のマイクで取得された複数の音声信号(中継情報)が、各音声信号に対応する符号化オーディオデータを含むフレームデータに変換され、そのフレームデータが会場ゲートウェイから所定のネットワークを介してスタジオのミキサ装置に提供される。そして、ミキサ装置が受信したフレームデータから抽出される複数の音声信号に対応したオーディオデータをミキシング処理し、得られるミキシングオーディオデータが当該ミキサ装置から前記ネットワークを介して会場ゲートウェイに送信され、そのミキシングオーディオデータに対応した音声がコンサート会場に設置されたスピーカから出力される。   For example, a mixing system described in Patent Document 1 is known. In this mixing system, a plurality of audio signals (relay information) acquired by a plurality of microphones at a concert venue are converted into frame data including encoded audio data corresponding to each audio signal, and the frame data is transmitted from a venue gateway. It is provided to the studio mixer device via a predetermined network. Then, the mixer device performs a mixing process on the audio data corresponding to the plurality of audio signals extracted from the received frame data, and the obtained mixed audio data is transmitted from the mixer device to the venue gateway via the network, and the mixing is performed. A sound corresponding to the audio data is output from a speaker installed in the concert hall.

このようなミキシングシステムによれば、コンサート会場にミキサ装置を持ち込むことなく、当該コンサート会場で取得されるオーディオデータやビデオデータを遠隔のスタジオに設置されたミキサ装置によりミキシング処理することができる。そして、スタジオに設置されたミキシング装置でのミキシング処理により得られたミキシングオーディオデータやミキシングビデオデータに基づいてミキシング後の音声や映像をコンサート会場で出力させることができる。   According to such a mixing system, audio data and video data acquired at the concert hall can be mixed by a mixer installed in a remote studio without bringing the mixer into the concert hall. Then, based on the mixing audio data and the mixing video data obtained by the mixing processing in the mixing device installed in the studio, the mixed audio and video can be output at the concert hall.

特開2013−192244号公報JP 2013-192244 A

Ustream - The leading HD streaming video platform, available from < http:// http://www.ustream.tv> (accessed 2015-10-13)Ustream-The leading HD streaming video platform, available from <http: // http://www.ustream.tv> (accessed 2015-10-13) Live - YouTube, available from < https://www.youtube.com/live> (accessed 2015-10-13)Live-YouTube, available from <https://www.youtube.com/live> (accessed 2015-10-13) ニコニコ生放送, 入手先 < http://live.nicovideo.jp> (参照 2015-10-13)Nico Nico Live Broadcasting, where to get it <http://live.nicovideo.jp> (Ref. 2015-10-13) OpenLDAP Foundation: OpenLDAP, Main Page, available from <http://www.openldap.org> (accessed 2015-10-13).OpenLDAP Foundation: OpenLDAP, Main Page, available from <http://www.openldap.org> (accessed 2015-10-13). Koji Hashimoto and Yoshitaka Shibata: MidField: An Adaptive Middleware System for Multipoint Digital Video Communication, Digital Video, Floriano De Rango (Ed.), ISBN: 978-953-7619-70-1, InTech, DOI: 10.5772/8032 (2010). available from: http://www.intechopen.com/books/digital-video/midfield-an-adaptive-middleware-system-for-multipoint-digital-video-communication (accessed 2015-10-13).Koji Hashimoto and Yoshitaka Shibata: MidField: An Adaptive Middleware System for Multipoint Digital Video Communication, Digital Video, Floriano De Rango (Ed.), ISBN: 978-953-7619-70-1, InTech, DOI: 10.5772 / 8032 (2010 available from: http://www.intechopen.com/books/digital-video/midfield-an-adaptive-middleware-system-for-multipoint-digital-video-communication (accessed 2015-10-13). MSDN Library: DirectShow, available from < https://msdn.microsoft.com/en-us/library/windows/desktop/dd375454(v=vs.85).aspx > (accessed 2015-10-13).MSDN Library: DirectShow, available from <https://msdn.microsoft.com/en-us/library/windows/desktop/dd375454(v=vs.85).aspx> (accessed 2015-10-13). Download Microsoft Expression Encoder 4 with Service Pack 2 (SP2) from Official Microsoft Download Center, available from <http://www.microsoft.com/en-us/download/details.aspx?id=27870> (accessed 2015-10-13).Download Microsoft Expression Encoder 4 with Service Pack 2 (SP2) from Official Microsoft Download Center, available from <http://www.microsoft.com/en-us/download/details.aspx?id=27870> (accessed 2015-10 -13). AWT Native Interface, available from < http://docs.oracle.com/javase/7/docs/technotes/guides/awt/AWT_Native_Interface.html> (accessed 2015-10-13).AWT Native Interface, available from <http://docs.oracle.com/javase/7/docs/technotes/guides/awt/AWT_Native_Interface.html> (accessed 2015-10-13). Roland VR-3EX | AV Mixer, 入手先 < http://www.roland.co.jp/products/vr-3ex> (参照 2015-10-13).Roland VR-3EX | AV Mixer, available at <http://www.roland.co.jp/products/vr-3ex> (Ref. 2015-10-13). 鎧沢勇, 滝川啓, 大久保栄, 渡辺義郎: 衛星通信を利用した画像会議におけるエコー及び伝搬遅延の影響, 電子情報通信学会論文誌B, Vol.J64-B, No.11, pp.1281-1288 (1981).Isamu Yawazawa, Kei Takigawa, Sakae Okubo, Yoshiro Watanabe: Effects of Echo and Propagation Delay in Image Conferences Using Satellite Communications, IEICE Transactions on Electronics, B, Vol.J64-B, No.11, pp.1281- 1288 (1981). Roland VR-50HD | Multi-Format AV Mixer, 入手先 < http://www.roland.co.jp/products/vr-50hd> (参照 2015-10-13).Roland VR-50HD | Multi-Format AV Mixer, available at <http://www.roland.co.jp/products/vr-50hd> (Ref. 2015-10-13). media encoder, video capture software, audio capture software | Adobe Flash Media Live Encoder, available from < http://www.adobe.com/products/flash-media-encoder.html> (accessed 2015-10-13).media encoder, video capture software, audio capture software | Adobe Flash Media Live Encoder, available from <http://www.adobe.com/products/flash-media-encoder.html> (accessed 2015-10-13). Live Webcasting Software | Telestream Wirecast | Overview, available from < http://www.telestream.net/wirecast> (accessed 2015-10-13).Live Webcasting Software | Telestream Wirecast | Overview, available from <http://www.telestream.net/wirecast> (accessed 2015-10-13). Niconico Live Encoder - ニコニコ生放送, 入手先 < http://live.nicovideo.jp/s/encoder> (参照 2015-10-13).Niconico Live Encoder-Niconico Live Broadcasting, available at <http://live.nicovideo.jp/s/encoder> (Ref. 2015-10-13). media encoder, video capture software, audio capture software | Adobe Flash Media Live Encoder, available from <http://www.adobe.com/products/flash-media-encoder.html> (accessed 2015-08-05).media encoder, video capture software, audio capture software | Adobe Flash Media Live Encoder, available from <http://www.adobe.com/products/flash-media-encoder.html> (accessed 2015-08-05). Live Webcasting Software | Telestream Wirecast | Overview, available from <http://www.telestream.net/wirecast> (accessed 2015-08-05).Live Webcasting Software | Telestream Wirecast | Overview, available from <http://www.telestream.net/wirecast> (accessed 2015-08-05). Niconico Live Encoder - ニコニコ生放送, 入手先 <http://live.nicovideo.jp/s/encoder> (参照 2015-08-05).Niconico Live Encoder-Niconico Live Broadcasting, available at <http://live.nicovideo.jp/s/encoder> (Ref.2015-08-05). Koji Hashimoto and Yoshitaka Shibata: MidField: An Adaptive Middleware System for Multipoint Digital Video Communication, Digital Video, Floriano De Rango (Ed.), ISBN: 978-953-7619-70-1, InTech, DOI: 10.5772/8032 (2010). available from: http://www.intechopen.com/books/digital-video/midfield-an-adaptive-middleware-system-for-multipoint-digital-video-communication (accessed 2015-08-05).Koji Hashimoto and Yoshitaka Shibata: MidField: An Adaptive Middleware System for Multipoint Digital Video Communication, Digital Video, Floriano De Rango (Ed.), ISBN: 978-953-7619-70-1, InTech, DOI: 10.5772 / 8032 (2010 available from: http://www.intechopen.com/books/digital-video/midfield-an-adaptive-middleware-system-for-multipoint-digital-video-communication (accessed 2015-08-05). MSDN Library: DirectShow, available from <https://msdn.microsoft.com/en-us/library/windows/desktop/dd375454(v=vs.85).aspx>(accessed 2015-08-05).MSDN Library: DirectShow, available from <https://msdn.microsoft.com/en-us/library/windows/desktop/dd375454 (v = vs.85) .aspx> (accessed 2015-08-05). Roland VR-3EX | AV Mixer, 入手先 < http://www.roland.co.jp/products/vr-3ex> (参照 2015-08-05).Roland VR-3EX | AV Mixer, available at <http://www.roland.co.jp/products/vr-3ex> (Ref. 2015-08-05). 森安辰, 大島浩太, 高田治, 寺田松昭: オンデマンド型動画同時視聴における端末間高精度再生同期方式, 情報処理学会論文誌, Vol.54, No.2, pp.538-550 (2013).Moriyasu Tatsu, Oshima Kota, Takada Osamu, Terada Matsuaki: High-precision playback synchronization method between terminals for simultaneous on-demand video viewing, Transactions of Information Processing Society of Japan, Vol.54, No.2, pp.538-550 (2013) . SLA(サービス品質保証制度) | サービス・ソリューション | IIJ, 入手先 <http://www.iij.ad.jp/svcsol/sla> (参照 2015-11-15).SLA (Service Quality Assurance System) | Service Solutions | IIJ, Obtain <http://www.iij.ad.jp/svcsol/sla> (Ref. 2015-11-15). サービス品質保証制度(SLA) | サービス紹介 | NTT Communications ntt.net, 入手先 <http://www.ntt.net/service/sla_ts.html> (参照 2015-11-15).Service Quality Assurance System (SLA) | Service Introduction | NTT Communications ntt.net, Obtained from <http://www.ntt.net/service/sla_ts.html> (Ref. 2015-11-15). KDDI インターネットゲートウェイ: サービス品質保証 (SLA) | インターネット | 法人・ビジネス向け | KDDI株式会社, 入手先 <http://www.kddi.com/business/network/internet/internet-gateway/sla> (参照 2015-11-15).KDDI Internet Gateway: Service Quality Assurance (SLA) | Internet | For Business & Business | KDDI CORPORATION, Availability <http://www.kddi.com/business/network/internet/internet-gateway/sla> (Ref. 2015) -11-15). 鎧沢勇, 滝川啓, 大久保栄, 渡辺義郎: 衛星通信を利用した画像会議におけるエコー及び伝搬遅延の影響, 電子情報通信学会論文誌B, Vol.J64-B, No.11, pp.1281-1288 (1981).Isamu Yawazawa, Kei Takigawa, Sakae Okubo, Yoshiro Watanabe: Effects of Echo and Propagation Delay in Image Conferences Using Satellite Communications, IEICE Transactions on Electronics, B, Vol.J64-B, No.11, pp.1281- 1288 (1981). 玉木秀和, 東野豪, 小林稔, 井原雅行: 音声遅延が遠隔会議中の発話衝突と精神的ストレスに与える影響, 電子情報通信学会論文誌D, Vol.J96-D, No.1, pp.35-45 (2013).Hidekazu Tamaki, Go Higashino, Minoru Kobayashi, Masayuki Ihara: Effects of speech delay on speech collision and mental stress during teleconference, IEICE Transactions on Information and Communication D, Vol.J96-D, No.1, pp.35 -45 (2013).

例えば、複数の会場で同時に開催されるスポーツイベントや、神輿/山車/踊り手等が長い列を作る祭りのライブ中継を想定した場合、中継情報(ビデオ情報、オーディオ情報を含み得る)の送信元は特定の1地点のみでなく物理的に離れた複数の地点となり得る。複数の送信元からのビデオソースをまとめて、最終的にライブ中継用のサービスを用いてストリーミング配信するためには、複数の送信元から提供されるビデオストリームをミキシングしたり切り替えたりする必要がある。また、例えば、比較的広い範囲を対象とした移動する物についてのライブ中継では、中継情報の送信元の数が対象の物の移動とともに増加し得る。   For example, assuming a live event of a sporting event held at a plurality of venues at the same time or a festival in which mikoshi, floats, dancers, and the like form a long line, the source of the relay information (which may include video information and audio information) May be not only one specific point but also a plurality of points physically separated. In order to combine video sources from multiple sources and ultimately stream them using a live broadcast service, it is necessary to mix and switch video streams provided from multiple sources. . Also, for example, in live relay of a moving object in a relatively wide range, the number of relay information transmission sources may increase as the target object moves.

しかし、前述した特許文献1に記載の従来のミキサシステムでは、複数の会場で同時に開催されるイベントにおける映像や音声の中継等、複数の地点の送信元から送信される中継情報をミキシングすることは考慮されておらず、また、その中継情報の送信元の数を容易に増やすことができない。   However, in the conventional mixer system described in Patent Literature 1 described above, it is not possible to mix relay information transmitted from sources at a plurality of points, such as video and audio relay at events held simultaneously at a plurality of venues. No consideration is given, and the number of transmission sources of the relay information cannot be easily increased.

本発明は、このような事情に鑑みてなされたもので、ミキシング処理の対象となる中継情報の送信元を容易に増やすことのできるミキサ装置及び該ミキサ装置を用いたライブ中継システムを提供するものである。   The present invention has been made in view of such circumstances, and provides a mixer device capable of easily increasing the number of transmission sources of relay information to be subjected to mixing processing, and a live relay system using the mixer device. It is.

本発明に係るミキサ装置は、それぞれが少なくともビデオ情報を含む複数種の中継情報のミキシング処理を行って該ミキシング処理により得られるミキシング中継情報を出力するミキサ装置であって、情報送信装置から、予め設定されたミキシング処理の対象となる中継情報の送信元のグループへの参加要求があった場合に、当該情報送信装置を当該グループに参加する中継情報の送信元として許容し、該情報送信装置から送信される中継情報をミキシング処理の対象とするミキシング参加制御手段を有する構成となる。   A mixer device according to the present invention is a mixer device that performs mixing processing of a plurality of types of relay information each including at least video information and outputs mixing relay information obtained by the mixing processing, and from an information transmission apparatus, If there is a request to join the group of the source of the relay information to be subjected to the set mixing process, the information transmitting apparatus is permitted as the source of the relay information to join the group, and the information transmitting apparatus The configuration includes a mixing participation control unit that sets the transmitted relay information as a target of the mixing process.

このような構成により、情報送信装置からグループへの参加要求があると、当該情報送信装置が中継情報の送信元として許容され、該情報送信装置からの中継情報がミキシング処理の対象となってミキシング処理される。   With such a configuration, when there is a request to join the group from the information transmitting apparatus, the information transmitting apparatus is permitted as a transmission source of the relay information, and the relay information from the information transmitting apparatus becomes a target of the mixing process and is mixed. It is processed.

本発明に係るミキサ装置において、前記グループを設定するソースグループ設定手段を有する構成とすることができる。   The mixer device according to the present invention may be configured to include a source group setting unit for setting the group.

このような構成により、ミキサ装置側で、当該ミキサ装置でのミキシング処理の対象となる中継情報の送信元のグループを自由に設定することができる。   With such a configuration, the mixer device side can freely set the group of the transmission source of the relay information to be subjected to the mixing process in the mixer device.

本発明に係るミキサ装置において、前記ミキシング参加制御手段は、前記情報送信装置からの前記グループへの参加要求があったときに、参加許可または参加拒否の応答を当該情報送信装置に送る可否応答制御手段を有し、参加許可の応答を前記情報送信装置に送った後に、前記情報送信装置から送信される中継情報をミキシング処理の対象とする構成とすることができる。   In the mixer device according to the present invention, the mixing participation control means controls whether or not to send a response of participation permission or participation rejection to the information transmitting device when there is a request to join the group from the information transmitting device. Means for transmitting, after transmitting a participation permission response to the information transmitting apparatus, the relay information transmitted from the information transmitting apparatus to be subjected to the mixing process.

このような構成により、参加許可の応答を送った情報送信装置からの中継情報だけをミキシング処理の対象とすることができる。   According to such a configuration, only the relay information from the information transmitting apparatus that has transmitted the response of the participation permission can be subjected to the mixing process.

本発明に係るミキサ装置において、ミキシング処理の対象となる中継情報の送信元となる情報送信装置から前記グループからの退出要求があった場合に、当該情報送信装置をミキシング処理の対象となる中継情報の送信元から外し、該情報送信装置からの中継情報のミキシング処理を行わないミキシング退出制御手段を有する構成とすることができる。   In the mixer device according to the present invention, when there is a request to leave the group from the information transmitting device that is the source of the relay information to be subjected to the mixing process, the information transmitting device is configured to transmit the relay information to be subjected to the mixing process. And a mixing exit control unit that does not perform the mixing process of the relay information from the information transmitting apparatus.

このような構成により、ミキシング処理の対象となる中継情報の送信元となる情報送信装置から前記グループからの退出要求があると、当該情報送信装置がミキシング処理の対象となる中継情報の送信元から外されて、該情報送信装置からの中継情報のミキシング処理が行われなくなるので、キシング処理の対象となる中継情報の送信元を容易に減らすことのできるようになる。その結果、ミキシング処理の対象となる中継情報の送信元の数を動的に増減させることができるようになる。   With such a configuration, when there is a request to leave the group from the information transmission device that is the transmission source of the relay information to be subjected to the mixing process, the information transmission device is transmitted from the transmission source of the relay information to be subjected to the mixing process. As a result, the mixing process of the relay information from the information transmitting apparatus is not performed, so that the number of transmission sources of the relay information to be subjected to the mixing process can be easily reduced. As a result, it is possible to dynamically increase or decrease the number of transmission sources of the relay information to be subjected to the mixing process.

本発明に係るミキサ装置において、前記グループへの参加要求がある毎に、その要求元の情報送信装置に対応したバッファ部を形成する入力制御手段を有し、前記ミキシング処理の対象とする前記情報送信装置からの中継情報を当該情報送信装置に対応する前記バッファ部を介してミキシング処理に供する構成とすることができる。   In the mixer device according to the present invention, each time there is a request to join the group, the mixer device has input control means for forming a buffer unit corresponding to the information transmitting device of the request source, and the information to be subjected to the mixing process The relay information from the transmission device may be provided to the mixing process via the buffer unit corresponding to the information transmission device.

このような構成により、前記グループへの参加要求がある毎に作成されるバッファを介してその要求元の情報送信装置からの中継情報がミキシング処理に供されるので、異なるタイミングでグループに参加する複数の情報送信装置からの複数種の中継情報を同時にミキシング処理することができる。   With such a configuration, the relay information from the requesting information transmitting apparatus is provided to the mixing process via the buffer created each time there is a request to join the group, so that it joins the group at different timing. A plurality of types of relay information from a plurality of information transmitting devices can be mixed simultaneously.

本発明に係るミキサ装置において、前記ミキシング中継情報を所定のネットワーク上のライブ中継用サービスサイトに提供する出力制御手段を有する構成とすることができる。   The mixer device according to the present invention may have a configuration including output control means for providing the mixing relay information to a live relay service site on a predetermined network.

このような構成により、複数種の中継情報をミキシング処理して得られるミキシング中継情報をライブ中継用サービスサイトから多くの端末装置に配信することができる。   With this configuration, it is possible to distribute mixing relay information obtained by mixing a plurality of types of relay information from a live relay service site to many terminal devices.

本発明に係るミキサ装置において、他のミキサ装置に対して設定されている他のグループへの参加要求を送信するソースグループ参加要求制御手段を有し、前記他のグループへの参加要求を前記他のミキサ装置に送信した後に、前記ミキシング中継情報を前記他のミキサ装置におけるミキシング処理の対象とすべき中継情報として当該他のミキサ装置に提供する構成とすることができる。
In the mixer device according to the present invention, a source group join request control means for transmitting a request to join the other groups that are set for another mixer apparatus, said other request to join the other group And transmitting the mixing relay information to the other mixer device as relay information to be subjected to the mixing process in the other mixer device.

このような構成により、複数種の中継情報をミキシング処理した結果得られるミキシング中継情報を、他のミキシング装置において、他の中継情報とともにミキシング処理することができるようになる。   With such a configuration, the mixing relay information obtained as a result of mixing the plurality of types of relay information can be mixed with the other relay information in another mixing apparatus.

本発明に係るミキサ装置において、前記他のグループからの退出要求を前記他のミキサ装置に送信するソースグループ退出要求制御手段を有し、ミキシング処理の対象となるミキシング中継情報の前記他のミキサ装置に対する送信元から外れる構成とすることができる。
In the mixer device according to the present invention, there is provided a source group leaving request control means for transmitting the leaving request from the other group to the other mixer device, and the other mixer device of the mixing relay information to be subjected to the mixing process. Can be deviated from the transmission source for

このような構成により、他のミキサ装置において、ミキシング処理の対象となるミキシング中継情報の送信元となる当該ミキサ装置から前記他のグループからの退出要求があると、当該ミキサ装置がミキシング処理の対象となるミキシング中継情報の送信元から外されて、該ミキサ装置からのミキシング中継情報のミキシング処理が行われなくなるので、キシング処理の対象となるミキシング中継情報の送信元を容易に減らすことのできるようになる。
With such a configuration, in another mixer device, if there is a request from the other group that is the transmission source of the mixing relay information to be subjected to the mixing process to leave from the other group, the mixing device becomes the target of the mixing process. been removed from a source to become mixing relay information, the mixing process of mixing relay information from the mixer device is not performed, it can be reduced the source of mixing relay information to be Mi Kishingu process easier Become like

本発明に係るライブ中継システムは、少なくともビデオ情報を含む中継情報を送信する複数の情報送信装置と、複数種の中継情報のミキシング処理を行って該ミキシング処理により得られるミキシング中継情報を出力するミキサ装置とを有し、前記複数の情報送信装置のそれぞれは、予め設定されたミキシング処理の対象となる中継情報の送信元のグループへの参加要求を前記ミキサ装置に送るソースグループ参加要求制御手段を有し、前記ミキサ装置は、前記複数の情報送信装置のいずれかから前記グループへの参加要求があった場合に、当該情報送信装置を当該グループに参加する中継情報の送信元として許容し、該情報送信装置から送信される中継情報をミキシング処理の対象とするミキシング参加制御手段を有する構成となる。   A live relay system according to the present invention includes a plurality of information transmitting apparatuses that transmit at least relay information including video information, and a mixer that performs mixing processing of a plurality of types of relay information and outputs mixing relay information obtained by the mixing processing. Device, and each of the plurality of information transmitting devices includes a source group participation request control unit that sends a request for participation in a group of a transmission source of relay information to be subjected to a preset mixing process to the mixer device. The mixer device, when there is a request to join the group from any of the plurality of information transmission devices, accepts the information transmission device as a source of relay information to join the group, The configuration includes a mixing participation control unit that targets the relay information transmitted from the information transmitting device to the mixing process.

このような構成により、情報送信装置からミキサ装置に対してグループへの参加要求があると、ミキサ装置は、当該情報送信装置が中継情報の送信元として許容し、該情報送信装置からの中継情報をミキシング処理の対象としてミキシング処理を実行する。   With such a configuration, when the information transmitting device requests the mixer device to join the group, the mixer device allows the information transmitting device as a transmission source of the relay information and transmits the relay information from the information transmitting device. Is subjected to the mixing process.

また、本発明に係るライブ中継システムは、少なくともビデオ情報を含む複数種の中継情報のミキシング処理を行って該ミキシング処理により得られるミキシング中継情報を出力する複数の第1ミキサ装置と、前記複数の第1ミキサ装置に対して設定されるミキシング処理の対象となる中継情報の送信元のグループに参加し、当該第1ミキサ装置にミキシング処理の対象となる中継情報を送る複数の情報送信装置と、ミキシング処理の対象となるミキシング中継情報の送信元のグループとして設定し、前記複数の第1ミキシング装置を、ミキシング処理の対象となるミキシング中継情報の送信元のグループに参加するミキシング中継情報の送信元として許容し、当該複数の第1ミキサ装置からのミキシング中継情報をミキシング処理して統合されたミキシング中継情報を出力する第2ミキサ装置とを有する構成となる。   In addition, the live relay system according to the present invention includes a plurality of first mixer devices that perform mixing processing of a plurality of types of relay information including at least video information and output mixing relay information obtained by the mixing processing, A plurality of information transmitting devices that participate in a group of transmission source of relay information to be subjected to the mixing process set for the first mixer device and transmit the relay information to be subjected to the mixing process to the first mixer device; The plurality of first mixing devices are set as a group of the source of the mixing relay information to be subjected to the mixing process, and the plurality of first mixing apparatuses are the sources of the mixing relay information that participate in the group of the source of the mixing relay information to be subjected to the mixing process. , And mixes and processes the mixing relay information from the plurality of first mixer devices. The a configuration and a second mixer unit for outputting a mixing relay information.

このような構成により、複数の第1ミキサ装置それぞれでの複数の情報送信装置からの複数種の中継情報に対するミキシング処理によりミキシング中継情報が得られ、それら複数の第1ミキサ装置にて得られた複数種のミキシング中継情報が第2ミキサ装置にてミキシング処理され、統合されたミキシング中継情報が得られる。   With such a configuration, mixing relay information is obtained by mixing processing of a plurality of types of relay information from a plurality of information transmitting devices in each of the plurality of first mixer devices, and is obtained by the plurality of first mixer devices. A plurality of types of mixing relay information are subjected to mixing processing in the second mixer device, and integrated mixing relay information is obtained.

また、本発明に係るライブ中継システムは、少なくともビデオ情報を含む中継情報を送信する複数の情報送信装置と、所定のネットワーク上に配置され、複数種の中継情報のミキシング処理を行って該ミキシング処理により得られるミキシング中継情報を出力するミキサ装置と、前記ミキシング装置でのミキシング処理の遠隔操作を行う操作装置とを有し、前記複数の情報送信装置のそれぞれは、予め設定されたミキシング処理の対象となる中継情報の送信元のグループへの参加要求を前記操作装置に送るソースグループ参加要求制御手段を有し、前記グループへの参加要求を行った後に前記操作装置により当該グループに参加する中継情報の送信元として許容され、前記ミキサ装置は、前記グループに参加する中継情報の送信元として許容された複数の情報送信装置からの中継情報を、前記操作装置での遠隔操作に従ってミキシング処理するグループミキシング処理手段と、該グループミキシング処理手段により得られたミキシング中継情報を前記操作装置に送る出力制御手段とを有する構成となる。   In addition, the live relay system according to the present invention includes a plurality of information transmitting devices that transmit at least relay information including video information, and a mixing process that is arranged on a predetermined network and performs a mixing process of a plurality of types of relay information. And a control device for remotely controlling the mixing process in the mixing device, wherein each of the plurality of information transmitting devices is a target of a preset mixing process. A source group participation request control means for sending a request to join the group of the source of relay information to be transmitted to the operation device, and relay information for joining the group by the operation device after making a request to join the group. And the mixer device is allowed as a source of relay information that participates in the group. Group mixing processing means for mixing the relay information from the plurality of information transmitting apparatuses according to the remote control of the operation device, and output control for transmitting the mixing relay information obtained by the group mixing processing means to the operation device Means.

このような構成により、情報送信装置から操作装置に対してグループへの参加要求があると、操作装置により当該情報送信装置が前記グループに参加する中継情報の送信元として許容され、該情報送信装置からの中継情報が操作装置での遠隔操作に従ってミキシング処理され、当該ミキシング処理により得られたミキシング中継情報が操作装置に送信される。これにより、操作装置では、ミキシング中継情報を確認しつつ複数種の中継情報のミキシング処理を遠隔操作することができる。   With such a configuration, when the information transmitting device requests the operating device to join the group, the operating device allows the information transmitting device as a transmission source of the relay information to join the group, and the information transmitting device Is processed in accordance with the remote control on the operating device, and the mixing relay information obtained by the mixing process is transmitted to the operating device. This allows the operating device to remotely control the mixing process of a plurality of types of relay information while checking the mixing relay information.

本発明に係るライブ中継システムにおいて、前記操作装置は、前記グループを設定するソースグループ設定手段を有する構成とすることができる。   In the live relay system according to the present invention, the operation device may include a source group setting unit configured to set the group.

このような構成により、ミキサ装置を遠隔操作する操作装置により、当該ミキサ装置でのミキシング処理の対象となる中継情報の送信元のグループを自由に設定することができる。   With such a configuration, the group of the transmission source of the relay information to be subjected to the mixing process in the mixer device can be freely set by the operation device that remotely controls the mixer device.

本発明に係るライブ中継システムにおいて、前記複数の情報送信装置のそれぞれは、前記グループからの退出要求を前記操作装置に送るソースグループ退出要求制御手段を有し、前記操作装置は、ミキシング処理の対象となる中継情報の送信元となる情報送信装置から前記グループからの退出要求があった場合に、当該情報送信装置をミキシング処理の対象となる中継情報の送信元から外すミキシング退出制御手段を有する構成とすることができる。   In the live relay system according to the present invention, each of the plurality of information transmitting devices has a source group leaving request control unit that sends a leaving request from the group to the operating device, and the operating device is a target of the mixing process. And a mixing exit control unit that removes the information transmitting apparatus from the transmission source of the relay information to be subjected to the mixing process when there is a request for exit from the group from the information transmitting apparatus that is the transmission source of the relay information to be transmitted. It can be.

このような構成により、ミキシング処理の対象となる中継情報の送信元となる情報送信装置から前記グループからの退出要求があると、当該情報送信装置がミキシング処理の対象となる中継情報の送信元から外されて、該情報送信装置からの中継情報のミキシング処理が行われなくなるので、キシング処理の対象となる中継情報の送信元を容易に減らすことのできるようになる。その結果、ミキシング処理の対象となる中継情報の送信元の数を動的に増減させることができるようになる。   With such a configuration, when there is a request to leave the group from the information transmission device that is the transmission source of the relay information to be subjected to the mixing process, the information transmission device is transmitted from the transmission source of the relay information to be subjected to the mixing process. As a result, the mixing process of the relay information from the information transmitting apparatus is not performed, so that the number of transmission sources of the relay information to be subjected to the mixing process can be easily reduced. As a result, it is possible to dynamically increase or decrease the number of transmission sources of the relay information to be subjected to the mixing process.

本発明に係るライブ中継システムにおいて、前記ネットワーク上に配置され、当該ネットワーク上に配置された複数のミキサ装置のいずれかを前記操作装置による遠隔操作の対象となる前記ミキサ装置として割り付ける制御装置を有する構成とすることができる。   In the live relay system according to the present invention, the live relay system includes a control device arranged on the network and allocating any one of the plurality of mixer devices arranged on the network as the mixer device to be remotely controlled by the operation device. It can be configured.

このような構成により、ミキシング処理の負荷を考慮して複数のミキサ装置から適切なミキサ装置を操作装置に割り付けることができる。   With such a configuration, an appropriate mixer device can be assigned to the operation device from a plurality of mixer devices in consideration of the load of the mixing process.

本発明に係るミキサ装置及びライブ中継システムによれば、情報送信装置からグループへの参加要求があると、当該情報送信装置が中継情報の送信元として許容され、該情報送信装置からの中継情報がミキシング処理の対象となってミキシング処理されるので、前記グループに参加するミキシング処理の対象となる中継情報の送信元を容易に増やすことができる。   According to the mixer device and the live relay system according to the present invention, when there is a request to join a group from an information transmitting device, the information transmitting device is allowed as a source of the relay information, and the relay information from the information transmitting device is Since the mixing process is performed and the mixing process is performed, it is possible to easily increase the transmission sources of the relay information that is the target of the mixing process and participate in the group.

本発明の第1の実施の形態に係るライブ中継システムを示す図である。FIG. 1 is a diagram illustrating a live broadcast system according to a first embodiment of the present invention. 本発明の第1の実施の形態に係るライブ中継システムの基本構成例を示すブロック図である。FIG. 1 is a block diagram illustrating a basic configuration example of a live relay system according to a first embodiment of the present invention. カスケード接続された複数のミキサ端末(ミキサ装置)を含むライブ中継システムの第1の基本構成例を示すブロック図である。FIG. 2 is a block diagram illustrating a first basic configuration example of a live relay system including a plurality of mixer terminals (mixer devices) connected in cascade. カスケード接続された複数のミキサ端末を含むライブ中継システムの第2の基本構成例を示すブロック図である。FIG. 9 is a block diagram illustrating a second basic configuration example of a live relay system including a plurality of cascaded mixer terminals. ライブ中継システムにおけるソースグループの登録及び該ソースグループへの参加に際してのメッセージフローを示す図である。FIG. 4 is a diagram showing a message flow when registering a source group and participating in the source group in the live relay system. ライブ中継システムにおけるストリームノードとストリームコネクションの確率/解放に際してのメッセージフローを示す図である。It is a figure which shows the message flow at the time of the probability / release of a stream node and a stream connection in a live relay system. ミキサ端末の機能構成例を示すブロック図である。FIG. 3 is a block diagram illustrating a functional configuration example of a mixer terminal. ミキサ端末での表示に係るビューワの構成例を示す図である。FIG. 3 is a diagram illustrating a configuration example of a viewer related to display on a mixer terminal. ミキサ端末におけるプレビューワ及びミキシングビューワの構成例を示す図である。FIG. 3 is a diagram illustrating a configuration example of a preview viewer and a mixing viewer in a mixer terminal. ミキサ端末における操作GUIの画面イメージの一例を示す図である。FIG. 7 is a diagram illustrating an example of a screen image of an operation GUI in the mixer terminal. 第1の実施の形態に係るライブ中継システムの評価実験環境を示すブロック図である。FIG. 2 is a block diagram illustrating an evaluation experiment environment of the live relay system according to the first embodiment. 単一のミキサ端末を用いた評価実験用のライブ中継システムの基本構成例を示す図である。It is a figure which shows the example of a basic structure of the live relay system for evaluation experiments using a single mixer terminal. カスケード接続される複数のミキサ端末を用いた評価実験用のライブ中継システムの基本構成例を示す図である。FIG. 2 is a diagram illustrating a basic configuration example of a live relay system for an evaluation experiment using a plurality of mixer terminals connected in cascade. ミキサ端末におけるCPUの利用率及び出力フレームレートについての評価実験結果を示す図である。FIG. 9 is a diagram illustrating an evaluation experiment result on a CPU utilization rate and an output frame rate in a mixer terminal. ミキサ端末におけるCPUの利用率及び出力フレームレートについての他の評価実験結果を示す図である。FIG. 13 is a diagram illustrating another evaluation experiment result on the CPU utilization and the output frame rate in the mixer terminal. 中継サーバを経由した送信端末(情報提供装置)とミキサ端末との間の遅延についての評価実験結果を示す図である。FIG. 13 is a diagram illustrating an evaluation experiment result on delay between a transmission terminal (information providing device) and a mixer terminal via a relay server. 中継サーバ用いない状態での送信端末とミキサ端末との間の遅延についての評価実験結果を示す図である。FIG. 13 is a diagram illustrating an evaluation experiment result on delay between a transmission terminal and a mixer terminal without using a relay server. 単一のミキサ端末を有するシステムにおけるミキサ端末のCPUの利用効率についての評価実験結果を示す図である。FIG. 11 is a diagram illustrating the results of an evaluation experiment on the utilization efficiency of the CPU of a mixer terminal in a system having a single mixer terminal. 単一のミキサ装置を有するすステムにおけるミキサ装置の出力フレームレートについての評価実験結果を示す図である。FIG. 10 is a diagram illustrating an evaluation experiment result on an output frame rate of a mixer device in a stem having a single mixer device. 単一のミキサ装置を有するシステムにおけるミキサ端末と送信端末との間の遅延時間についての評価実験結果を示す図である。FIG. 13 is a diagram illustrating an evaluation experiment result on delay time between a mixer terminal and a transmission terminal in a system having a single mixer device. カスケード接続される複数のミキサ端末を有するシステムにおけるミキサ端末と送信端末との間の遅延時間についての評価実験結果を示す図である。FIG. 10 is a diagram illustrating the results of an evaluation experiment on the delay time between a mixer terminal and a transmission terminal in a system having a plurality of mixer terminals connected in cascade. 本発明の第2の実施の形態に係るライブ中継システムの第1の構成例(パブリックビューイングを想定)を示す図である。FIG. 11 is a diagram illustrating a first configuration example (assuming public viewing) of a live relay system according to a second embodiment of the present invention. 本発明の第2の実施の形態に係るライブ中継システムの第2の構成例(プライベートビューイングを想定)を示す図である。It is a figure showing the 2nd example of composition (assuming private viewing) of the live relay system concerning a 2nd embodiment of the present invention. ライブ中継システムにおけるソースグループの登録、ミキササーバの選択及びソースグループへの参加に際してのメッセージフローを示す図である。It is a figure which shows the message flow at the time of registration of a source group, selection of a mixer server, and participation in a source group in a live relay system. 第1の構成例(パブリックビューイング)のライブ中継システムにおけるストリームノードの接続状態を示す図である。It is a figure showing the connection state of the stream node in the live relay system of the 1st example of composition (public viewing). 第2の構成例(プライベートビューイング)のライブ中継システムにおけるストリームノードの接続状態を示す図である。It is a figure showing the connection state of the stream node in the live relay system of the 2nd example of composition (private viewing). ミキサ部(ミキサストリームノード)の遠隔操作機能について示す図である。FIG. 3 is a diagram illustrating a remote operation function of a mixer unit (mixer stream node). ミキササーバにおいてビデオのミキシング機能を実現させるフィルタグラフの構成例を示すブロック図である。FIG. 4 is a block diagram showing a configuration example of a filter graph for realizing a video mixing function in a mixer server. ミキササーバにおいてオーディオのミキシング機能を実現させるフィルタグラフの構成例を示すブロック図である。FIG. 3 is a block diagram showing a configuration example of a filter graph for realizing an audio mixing function in a mixer server. 利用者端末における表示に係るビューワの構成例を示す図である。FIG. 3 is a diagram illustrating a configuration example of a viewer related to display on a user terminal. 利用者端末におけるミキシング操作用GUIのコンポーネントの画面の構成例を示す図である。FIG. 4 is a diagram illustrating a configuration example of a screen of a component of a mixing operation GUI in a user terminal. 第2の実施の形態に係るライブ中継システムの第1の構成例(パブリックビューイング)の評価実験環境を示すブロック図である。It is a block diagram showing an evaluation experiment environment of the 1st example of composition (public viewing) of a live relay system concerning a 2nd embodiment. 第2の実施の形態に係るライブ中継システムの第2の構成例(プライベートビューイング)の評価実験環境を示すブロック図である。It is a block diagram showing an evaluation experiment environment of the 2nd example of composition (private viewing) of a live relay system concerning a 2nd embodiment. ミキササーバにおけるCPUの利用率についての評価実験結果を示す図である。FIG. 14 is a diagram illustrating the results of an evaluation experiment on the CPU utilization in the mixer server. ミキサストリームノードの出力フレームレートについての評価実験結果を示す図である。FIG. 10 is a diagram illustrating an evaluation experiment result regarding an output frame rate of a mixer stream node. 送信端末とミキササーバとの間の往復遅延についての評価実験結果を示す図である。FIG. 14 is a diagram illustrating an evaluation experiment result regarding a round-trip delay between a transmission terminal and a mixer server. 利用者端末からミキササーバを操作した際の応答遅延についての評価実験結果を示す図である。FIG. 14 is a diagram illustrating an evaluation experiment result on a response delay when the mixer server is operated from the user terminal. 中継サーバの入力スループットについての評価実験結果を示す図である。FIG. 14 is a diagram illustrating an evaluation experiment result on the input throughput of the relay server. 中継サーバの出力スループットについての評価実験結果を示す図である。FIG. 14 is a diagram illustrating the results of an evaluation experiment on the output throughput of the relay server. ミキササーバのCPUの利用率の送信端末の数に対する予測特性(多項式近似)を示す図である。FIG. 14 is a diagram illustrating prediction characteristics (polynomial approximation) of the CPU utilization of the mixer server with respect to the number of transmission terminals.

以下、本発明の実施の形態について図面を用いて説明する。   Hereinafter, embodiments of the present invention will be described with reference to the drawings.

本発明の第1の実施の形態に係るミキサ装置が適用されるライブ中継システムの基本的な構成は図1に示されるようになっている。   The basic configuration of a live relay system to which the mixer device according to the first embodiment of the present invention is applied is as shown in FIG.

図1に示すライブ中継システムにおいて、ミキサ端末10(Mixer Terminal:ミキサ装置)は、複数(例えば4台)の送信端末20(Source Terminal:情報送信装置)のそれぞれが送信するストリームデータを受信し、ミキシングや切り替え処理を行う。ミキサ端末10は、そのミキシングや切り替えにより得られた映像出力や音声出力(ミキシング中継情報)をライブ中継用サービスサイト60へ送信する(出力制御手段)。そして、最終的に複数の受信端末30(Sink Terminal)においてライブ中継用サービスサイト60から提供されるそれら映像及び音声の視聴可が能となる。   In the live relay system shown in FIG. 1, a mixer terminal 10 (mixer terminal) receives stream data transmitted by each of a plurality of (for example, four) transmission terminals 20 (source terminals: information transmission devices), Performs mixing and switching processing. The mixer terminal 10 transmits the video output and the audio output (mixing relay information) obtained by the mixing and switching to the live relay service site 60 (output control means). Finally, the plurality of receiving terminals 30 (Sink Terminals) can view and listen to the video and audio provided from the live relay service site 60.

ミキサ端末10は、ビデオカメラとマイクロフォンに加えて、ネットワーク200経由のストリームを入力として扱う。キャプチャデバイスからの入力を処理するためには、通常、キャプチャデバイスと端末を予め物理的に接続しておく必要がある。一方、ネットワーク200経由のストリームをミキサ端末10の入力として扱う際は、有線/無線を問わず、ストリーム用の論理的なコネクション(ストリームコネクション)を確立して利用する。予め物理的な接続をしておく形態の入力と異なり、必要な時にストリームコネクションを確立してミキサ端末10の入力として扱う機能が実現し易い。複数の送信端末20のそれぞれは、ビデオカメラとマイクロフォンからの入力データをリアルタイムに圧縮してミキサ端末10へ送信する。ここで、送信端末20からミキサ端末10へストリームコネクションを直接確立できる場合は直接ストリームの転送を行う。一方、送信端末20とミキサ端末10が異なるプライベートネットワークに繋がっていて、ストリームコネクションを直接確立できないなどの場合も考慮し、ネットワーク200内の中継サーバ50(Relay Server)経由でストリーム転送できるような仕組みとなっている。   The mixer terminal 10 handles a stream via the network 200 as an input in addition to a video camera and a microphone. In order to process the input from the capture device, it is usually necessary to physically connect the capture device and the terminal in advance. On the other hand, when handling a stream via the network 200 as an input of the mixer terminal 10, a logical connection (stream connection) for the stream is established and used regardless of wired or wireless. Unlike an input of a form in which a physical connection is made in advance, a function of establishing a stream connection when necessary and handling it as an input of the mixer terminal 10 is easily realized. Each of the plurality of transmitting terminals 20 compresses input data from the video camera and the microphone in real time and transmits the data to the mixer terminal 10. Here, when a stream connection can be directly established from the transmitting terminal 20 to the mixer terminal 10, the stream is directly transferred. On the other hand, in consideration of the case where the transmitting terminal 20 and the mixer terminal 10 are connected to different private networks and a stream connection cannot be directly established, a mechanism that enables stream transfer via the relay server 50 (Relay Server) in the network 200 is considered. It has become.

そして、ミキサ端末10への入力となるストリーム数の増減に対応するために、ミキサ端末10はライブ中継実施時に論理的なソースグループを設定(ソースグループ設定手段)し、送信端末20のそれぞれはそのグループに参加したうえでビデオの送信を行う。図2は、ソースグループ(Source Group:SGP)を含むシステムの基本構成を示している。ミキサ端末10が設定するソースグループSGPには、送信端末20及び前段のミキサ端末10のそれぞれが任意の時間に参加/退出できる。ソースグループSGPに参加している端末20、10(S、M)からのストリームを中継サーバ50経由で受信したミキサ端末10は、ミキシング処理後のストリームを出力する。その出力先は、後段のミキサ端末またはライブ中継用のソフトウェアとなる。また、ソースグループSGP内の端末20、10(S、M)とミキサ端末10間で直接ストリームコネクションを確立できる場合は、中継サーバ50による中継処理が省略される。   Then, in order to cope with an increase or a decrease in the number of streams to be input to the mixer terminal 10, the mixer terminal 10 sets a logical source group at the time of live relaying (source group setting means), and each of the transmitting terminals 20 Send video after joining a group. FIG. 2 shows a basic configuration of a system including a source group (Source Group: SGP). Each of the transmitting terminal 20 and the preceding mixer terminal 10 can join / leave the source group SGP set by the mixer terminal 10 at an arbitrary time. The mixer terminal 10 that has received the streams from the terminals 20 and 10 (S, M) participating in the source group SGP via the relay server 50 outputs the streams after the mixing processing. The output destination is a mixer terminal at the subsequent stage or live relay software. If a stream connection can be directly established between the terminals 20 and 10 (S, M) in the source group SGP and the mixer terminal 10, the relay processing by the relay server 50 is omitted.

図2に示す基本構成をもとに、カスケードミキサの構成例を図3と図4に示す。   3 and 4 show examples of the configuration of the cascade mixer based on the basic configuration shown in FIG.

図3に示す構成例では、ミキサ端末10(M0:第2ミキサ装置)が設定したソースグループSGP(M0)に、ミキサ端末10(M1)〜10(Mn)(第1ミキサ装置)が参加している。また、ミキサ端末10(M1)〜10(Mn)のそれぞれもソースグループSGP(M1)〜SGP(Mn)を設定しており、各ソースグループSGP(M1)、・・・、SGP(Mn)には複数の送信端末20が参加している。ミキサ端末10(M0)とミキサ端末10(M1)〜10(Mn)のそれぞれはストリームコネクションを直接確立できるネットワークに繋がっている一方、ミキサ端末10(M1)〜10(Mn)と各ソースグループSGP(M1)〜SGP(Mn)内の送信端末20(S)間には中継サーバ50(R1)〜50(Rn)が必要なネットワーク構成となっている。この構成例は、ソースグループSGPを意味的に分ける場合を想定している。例えば、スポーツの試合において特定の選手毎にソースグループSGPを用意し、マルチアングルで撮影した複数のビデオを、ミキサ端末10(M0)とミキサ端末10(M1)〜10(Mn)が設置されている場所に集め、各ミキサ操作者がミキシング処理を行うような場合である。   In the configuration example shown in FIG. 3, the mixer terminals 10 (M1) to 10 (Mn) (first mixer device) participate in the source group SGP (M0) set by the mixer terminal 10 (M0: second mixer device). ing. Further, each of the mixer terminals 10 (M1) to 10 (Mn) also sets the source groups SGP (M1) to SGP (Mn), and is assigned to each of the source groups SGP (M1),..., SGP (Mn). Indicates that a plurality of transmission terminals 20 are participating. Each of the mixer terminals 10 (M0) and 10 (M1) to 10 (Mn) is connected to a network that can directly establish a stream connection, while the mixer terminals 10 (M1) to 10 (Mn) and each source group SGP The network configuration requires the relay servers 50 (R1) to 50 (Rn) between the transmission terminals 20 (S) in (M1) to SGP (Mn). This configuration example assumes that the source groups SGP are semantically divided. For example, in a sports game, a source group SGP is prepared for each specific player, and a plurality of videos taken at multi-angles are provided with mixer terminals 10 (M0) and mixer terminals 10 (M1) to 10 (Mn). This is the case where the mixers are collected at a certain location and each mixer operator performs a mixing process.

図4に示す例でも図3に示す例と同様に、ミキサ端末10(M0)が設定したソースグループSGP(M0)へミキサ端末10(M1)〜10(Mn)が参加し、ミキサ端末10(M1)〜10(Mn)のソースグループSGP(M1)〜SGP(Mn)のそれぞれに複数の送信端末20が参加している。図3に示す構成と異なり、ミキサ端末10(M0)とミキサ端末10(M1)〜10(Mn)の間には中継サーバ50があり、ミキサ端末10(M1)〜10(Mn)と各ソースグループSGP内の送信端末20間はストリームコネクションを直接確立できるネットワーク構成となっている。この構成例は、ソースグループを物理的に分ける場合を想定している。例えば、長い列を作る祭りを中継する際、その祭りの中継ポイントとなる複数の地点毎にソースグループSGPを用意する場合である。中継ポイント毎にミキサ端末10(M1)〜10(Mn)のミキサ操作者は複数のビデオソースをミキシングしたり切り替えたりした結果を物理的に離れたミキサ端末10(M0)へネットワーク200上の中継サーバ50経由で送信し、ミキサ端末10(M0)で最終的なライブ中継用のストリームを作ることが可能となる。   In the example illustrated in FIG. 4, similarly to the example illustrated in FIG. 3, the mixer terminals 10 (M1) to 10 (Mn) participate in the source group SGP (M0) set by the mixer terminal 10 (M0), and A plurality of transmission terminals 20 participate in each of the source groups SGP (M1) to SGP (Mn) of (M1) to (Mn). Unlike the configuration shown in FIG. 3, there is a relay server 50 between the mixer terminal 10 (M0) and the mixer terminals 10 (M1) to 10 (Mn), and the mixer terminals 10 (M1) to 10 (Mn) and each source The network configuration is such that a stream connection can be directly established between the transmission terminals 20 in the group SGP. This configuration example assumes that the source groups are physically separated. For example, when relaying a festival that forms a long line, there is a case where a source group SGP is prepared for each of a plurality of points that are relay points of the festival. The mixer operator of the mixer terminals 10 (M1) to 10 (Mn) relays the result of mixing or switching a plurality of video sources to the physically separated mixer terminal 10 (M0) on the network 200 for each relay point. The data is transmitted via the server 50, and a final stream for live relay can be created by the mixer terminal 10 (M0).

つづいて、ソースグループSGPを構成するためのメッセージフローを図5に示す。   Next, FIG. 5 shows a message flow for forming the source group SGP.

まず、ミキサ端末10は、ソースグループ登録要求メッセージ(Register Source Group Request)をネットワーク200中に含まれる中継サーバ50へ送り(1)、ソースグループSGPに関する情報を表すソースグループプロパティを中継サーバ50へ登録する(ソースグループ設定手段)。ソースグループプロパティには、そのソースグループSGPがどのようなライブ中継用のソースグループなのかを説明するテキストが含まれている。また必要に応じて、そのソースグループSGPに参加できる利用者のIDを含めることもできる。前記ソースグループプロパティを登録した中継サーバ50は、その応答(Response)メッセージを当該ソースグループプロパティの送信元のミキサ端末10に送る(2)。   First, the mixer terminal 10 sends a source group registration request message (Register Source Group Request) to the relay server 50 included in the network 200 (1), and registers a source group property indicating information on the source group SGP in the relay server 50. (Source group setting means). The source group property contains text describing what kind of live relay source group the source group SGP is. If necessary, the ID of a user who can participate in the source group SGP can be included. The relay server 50 that has registered the source group property sends the response (Response) message to the mixer terminal 10 that has transmitted the source group property (2).

一方、送信側の端末(送信端末20(S)または前段のミキサ端末10(M))は、ソースグループプロパティ要求メッセージ(Source Group Property Request)を中継サーバ50へ送信する(3)。ソースグループプロパティ要求メッセージ(Source Group Property Request)を受信した中継サーバ50は、その応答として、登録されたソースグループプロパティのリストを前記送信側の端末(20(S)、10(M))に送る(4)。これにより、送信側の端末(20(S)、10(M))は、登録されているソースグループプロパティのリストを取得することができる。そして、送信側の端末(20(S)、10(M))は、例えば、操作者による操作に従って、そのリストの中から参加すべきソースグループSGPを選び、ソースグループ参加要求メッセージ(Join Source Group Request)を中継サーバ50経由でミキサ端末10へ送る(5:ソースグループ参加要求制御手段)。ミキサ端末10は必要に応じて利用者認証を行い、送信側の端末(20(S)、10(M))へ参加の可否(参加許可または参加拒否)の応答メッセージを送り返す(6:可否応答制御手段)。   On the other hand, the transmitting terminal (the transmitting terminal 20 (S) or the preceding mixer terminal 10 (M)) transmits a source group property request message (Source Group Property Request) to the relay server 50 (3). The relay server 50 that has received the source group property request message (Source Group Property Request) sends a list of registered source group properties to the terminal (20 (S), 10 (M)) on the transmission side as a response. (4). This allows the transmitting terminal (20 (S), 10 (M)) to obtain a list of registered source group properties. Then, the terminal on the transmission side (20 (S), 10 (M)) selects a source group SGP to join from the list, for example, according to an operation by the operator, and a source group join request message (Join Source Group). Request) is sent to the mixer terminal 10 via the relay server 50 (5: source group participation request control means). The mixer terminal 10 performs user authentication as necessary, and sends back a response message indicating whether or not participation is permitted (participation permission or participation rejection) to the transmitting terminal (20 (S), 10 (M)) (6: response to permission / rejection). Control means).

また、図5には示されていないが、送信側の端末(20(S)、10(M))が、ソースグループSGPから退出する際は、送信側の端末(20(S)、10(M))から中継サーバ50経由でミキサ端末10へ、ソースグループ退出要求メッセージ(Leave Source Group Request)を送る(ソースグループ退出要求制御手段)。ミキサ端末10は、送信側の端末(20(S)、10(M))の退出による終了処理を行い、送信側の端末(20(S)、10(M))へ中継サーバ50経由でソースグループ退出応答メッセージ(Leave Source Group Response)を送り返す。   Although not shown in FIG. 5, when the transmitting terminal (20 (S), 10 (M)) leaves the source group SGP, the transmitting terminal (20 (S), 10 (M)) exits from the source group SGP. M)) sends a source group leaving request message (Leave Source Group Request) to the mixer terminal 10 via the relay server 50 (source group leaving request control means). The mixer terminal 10 performs a termination process by leaving the terminal on the transmission side (20 (S), 10 (M)) and sends the source terminal to the terminal on the transmission side (20 (S), 10 (M)) via the relay server 50. Send back a group leave response message (Leave Source Group Response).

さらに、ライブ中継を終了する等、ミキサ端末10がソースグループSGPを必要としなくなった場合、ミキサ端末10はソースグループ登録解除要求メッセージ(Unregister Source Group Request)を中継サーバ50へ送る。中継サーバ50ではソースグループSGPの登録解除処理を行い、ソースグループ登録解除応答メッセージ(Unregister Source Group Response)をミキサ端末10に送る。   Further, when the mixer terminal 10 does not need the source group SGP, such as when the live relay is finished, the mixer terminal 10 sends a source group registration release request message (Unregister Source Group Request) to the relay server 50. The relay server 50 performs the deregistration process of the source group SGP, and sends a source group deregistration response message (Unregister Source Group Response) to the mixer terminal 10.

なお、図5において、ソースグループSGPを設定するミキサ端末10と送信側の端末(20(S)、10(M))との間でストリームコネクションを直接確立できるネットワーク構成の場合は、メッセージのやり取りに関して中継サーバ50を必要とせず、ソースグループ登録要求メッセージ(Register Source Group Request)(1)とその応答メッセージ(Response)(2)は省略され、ソースグループ登録解除要求メッセージ(Unregister Source Group Request)とソースグループ登録解除応答メッセージ(Unregister Source Group Response)も省略される。   In FIG. 5, in the case of a network configuration in which a stream connection can be directly established between the mixer terminal 10 that sets the source group SGP and the terminal on the transmission side (20 (S), 10 (M)), message exchange is performed. Does not require the relay server 50, the source group registration request message (Register Source Group Request) (1) and its response message (Response) (2) are omitted, and the source group registration release request message (Unregister Source Group Request) The source group registration release response message (Unregister Source Group Response) is also omitted.

前述したように送信側の端末(20(S)、10(M))がミキサ端末10からの参加許可の応答メッセージを受信してソースグループSGPへ参加すると、その端末はミキサ端末10へストリームを送信できる状態となり、ミキサ端末10は、当該送信側の端末(20(S)、10(M))から送信されるストリームをミキシング処理の対象とするようになる(ミキシング参加制御手段)。一方、ミキサ端末10は、送信側の端末(20(S)、10(M))からのソースグループ退出要求メッセージ(Leave Source Group Request)に応答して、ソースグループ退出応答メッセージ(Leave Source Group Response)を送ると、当該送信側の端末(20(S)、10(M))をミキシング処理の対象となるストリームの送信元から外し、以後、当該端末からのストリームのミキシング処理を行わない(ミキシング退出制御手段)。   As described above, when the transmitting side terminal (20 (S), 10 (M)) receives the response message of permission of participation from the mixer terminal 10 and participates in the source group SGP, the terminal transmits a stream to the mixer terminal 10. The mixer terminal 10 is ready to transmit, and the stream transmitted from the terminal on the transmission side (20 (S), 10 (M)) is subjected to the mixing process (mixing participation control means). On the other hand, the mixer terminal 10 responds to the source group leaving request message (Leave Source Group Request) from the transmitting terminal (20 (S), 10 (M)), and responds to the source group leaving response message (Leave Source Group Response). ), The terminal on the transmitting side (20 (S), 10 (M)) is removed from the source of the stream to be subjected to the mixing process, and thereafter, the mixing process of the stream from the terminal is not performed (mixing). Exit control means).

図6は、送信側の端末(20(S)、10(M))がソースグループSGPに参加した際における、ストリーム処理を行うストリームノードと、ストリームノードを繋ぐストリームコネクションの確立/解放に必要となるメッセージフローを示している。本実施の形態に係るライブ中継システムにおいて、ストリームノードはビデオまたはオーディオストリームの入出力を伴うストリーム処理機能の単位である。ストリームノード間を接続しているのがストリームコネクション(Stream Connection)であり、ストリームノードとストリームコネクションの一連のまとまりをフローパス(Flow Path)と呼ぶ。   FIG. 6 is a diagram illustrating the necessity for establishing / releasing a stream node performing a stream process and a stream connection connecting the stream nodes when the transmitting terminal (20 (S), 10 (M)) joins the source group SGP. FIG. In the live relay system according to the present embodiment, a stream node is a unit of a stream processing function involving input / output of a video or audio stream. A connection between the stream nodes is a stream connection, and a series of the stream nodes and the stream connections is called a flow path.

送信側の端末(20(S)、10(M))からミキサ端末10までのストリームコネクションの確立と解放手順を、図6のメッセージフローに従って説明する。   The procedure for establishing and releasing the stream connection from the transmitting terminal (20 (S), 10 (M)) to the mixer terminal 10 will be described with reference to the message flow in FIG.

図6において、まず、送信側の端末(20(S)、10(M))は、ストリーム送信を行うソースストリームノード(Source Stream Node:src)を生成する。次に、送信側の端末(20(S)、10(M))は、中継ノードセットアップ要求メッセージ(Setup Relay Node Request)を中継サーバ60へ送り(1)、中継サーバ50は、内部に中継処理のみを行う中継ストリームノード(Relay Stream Node:rly)を生成する。中継サーバ50は、中継ストリームノード(rly)を生成すると、フローパス更新メッセージ(Flow Path Update [+])を送信側の端末(20(S)、10(M))へ送信する(2)。そして、送信側の端末(20(S)、10(M))と中継サーバ50間でストリームコネクションが確立される(Establishes Stream Connection)。ストリームコネクションの確立が終了すると、中継サーバ50は中継ノードセットアップ応答メッセージ(Setup Relay Node Response)を送信側の端末(20(S)、10(M))へ送り返す(3)。その後、中継サーバ50は、ソースノード更新レポートメッセージ(Source Node Update Report)をミキサ端末10へ送ることにより、ビデオソースが追加されたことをミキサ端末10へ通知する(4)。   In FIG. 6, first, the terminal on the transmission side (20 (S), 10 (M)) generates a source stream node (Source Stream Node: src) for performing stream transmission. Next, the transmitting side terminal (20 (S), 10 (M)) sends a relay node setup request message (Setup Relay Node Request) to the relay server 60 (1), and the relay server 50 internally performs the relay processing. Generate a relay stream node (rly) that performs only After generating the relay stream node (rly), the relay server 50 transmits a flow path update message (Flow Path Update [+]) to the terminal on the transmission side (20 (S), 10 (M)) (2). Then, a stream connection is established between the transmitting terminal (20 (S), 10 (M)) and the relay server 50 (Establishes Stream Connection). When the establishment of the stream connection is completed, the relay server 50 sends back a relay node setup response message (Setup Relay Node Response) to the transmitting terminal (20 (S), 10 (M)) (3). Thereafter, the relay server 50 notifies the mixer terminal 10 that the video source has been added by sending a source node update report message (Source Node Update Report) to the mixer terminal 10 (4).

ソースノード更新レポートメッセージ(Source Node Update Report)を受信したミキサ端末10は、フローパス更新メッセージ(Flow Path Update [+])を中継サーバ50経由で送信側の端末(20(S)、10(M))へ送信し(5、6)、中継サーバ50とミキサ端末10間のストリームコネクションが確立される(Establishes Stream Connection)。ミキサ端末10内には、ミキシング処理を行うミキサストリームノード(Mixer Stream Node:mix)が生成されるとともにその前段に中継ストリームノード(rly)が生成される。中継サーバ50内の中継ストリームノード(rly)はストリーム用のパケットを中継するが、ミキサ端末10内の中継ストリームノード(rly)は、ミキサ端末10の入力となるビデオまたはオーディオデータを端末10内のミキサストリームノード(mix)へ直接渡す。   The mixer terminal 10 having received the source node update report message (Source Node Update Report) transmits the flow path update message (Flow Path Update [+]) via the relay server 50 to the terminal on the transmission side (20 (S), 10 (M)). ) (5, 6), and a stream connection between the relay server 50 and the mixer terminal 10 is established (Establishes Stream Connection). In the mixer terminal 10, a mixer stream node (mixer) for performing a mixing process is generated, and a relay stream node (rly) is generated in a preceding stage thereof. The relay stream node (rly) in the relay server 50 relays the packet for the stream, but the relay stream node (rly) in the mixer terminal 10 transmits the video or audio data input to the mixer terminal 10 in the terminal 10. Pass directly to the mixer stream node (mix).

上述した手順に従って送信側の端末(20(S)、10(M))と中継サーバ50を介したミキサ端末10との間のストリームコネクションが確立すると、送信側の端末(20(S)、10(M))のソースストリームノード(src)で生成されるストリームデータ(ビデオ、オーディオ)の中継サーバ50の中継ストリームノード(rly)を介したミキサ端末10への提供が可能になる。ミキサ端末10では、入力したストリームデータが中継ストリームノード(rly)を介してミキサストリームノード(mix)に提供され、当該ストリームデータのミキシング処理がなされてそのミキシング処理により得られた映像や音声が出力される。   When the stream connection between the transmitting terminal (20 (S), 10 (M)) and the mixer terminal 10 via the relay server 50 is established according to the above-described procedure, the transmitting terminal (20 (S), 10 (M)) (M)) The stream data (video, audio) generated by the source stream node (src) can be provided to the mixer terminal 10 via the relay stream node (rly) of the relay server 50. In the mixer terminal 10, the input stream data is provided to the mixer stream node (mix) via the relay stream node (rly), the stream data is mixed, and the video and audio obtained by the mixing process are output. Is done.

一方、前記ストリームコネクションの解放時のメッセージフローは、図6の手順7〜11に従ってなされる。   On the other hand, the message flow at the time of releasing the stream connection is performed according to procedures 7 to 11 in FIG.

即ち、ストリームコネクションの解放操作のなされた送信側の端末(20(S)、10(M))は、ソースストリーム閉鎖メッセージ(Close Source Stream)を中継サーバ50経由でミキサ端末10へ送信する(7、8)。これにより、送信側の端末(20(S)、10(M))につながるミキサ端末10と中継サーバ50との間のストリームコネクションが解放(Shutdowns Stream Connection)され、ミキサ端末10は、フローパス更新メッセージ(Flow path Update [-])を中継サーバ50経由で送信側の端末(20(S)、10(M))に送信する(9、10)。これにより、中継サーバ50とストリームコネクションの解放操作のなされた送信側の端末(20(S)、10(M))との間のストリームコネクションが解放され(Shutdown Stream Connection)、中継サーバ50内の当該送信側の端末(20(S)、10(M))のための中継ストリームノード(rly)が削除される(Deletes Relay Node)。中継ストリームノード(rly)が削除されると、中継サーバ50は、フローパス更新メッセージ(Flow Path Update [-])を当該送信側の端末(20(S)、10(M))に送信する(11)。それにより、フローパスが更新される。   That is, the transmitting-side terminal (20 (S), 10 (M)) on which the stream connection release operation has been performed transmits a source stream closing message (Close Source Stream) to the mixer terminal 10 via the relay server 50 (7). , 8). As a result, a stream connection between the mixer terminal 10 connected to the transmitting terminal (20 (S), 10 (M)) and the relay server 50 is released (Shutdowns Stream Connection), and the mixer terminal 10 transmits the flow path update message. (Flow path Update [-]) is transmitted to the transmitting terminal (20 (S), 10 (M)) via the relay server 50 (9, 10). As a result, the stream connection between the relay server 50 and the transmitting terminal (20 (S), 10 (M)) on which the release operation of the stream connection has been performed is released (Shutdown Stream Connection). The relay stream node (rly) for the transmitting terminal (20 (S), 10 (M)) is deleted (Deletes Relay Node). When the relay stream node (rly) is deleted, the relay server 50 transmits a flow path update message (Flow Path Update [-]) to the terminal (20 (S), 10 (M)) on the transmission side (11). ). Thereby, the flow path is updated.

ここまで、図6のメッセージフローに従って、送信端末側(20(S)、10(M))からストリームコネクションを確立/解放する流れを示したが、ミキサ端末10側から確立/解放を行う場合は、フローパス更新メッセージ(Flow Path Update [+/-])を利用する。図6において、ソースノード更新レポートメッセージ(Source Node Update Report)を受信したミキサ端末10では、そのソースストリームノード(src)からの中継を自動的または選択的に受信することができる。受信する場合は、フローパス更新メッセージ(Flow Path Update [+])を中継サーバ50へ送り、ストリームコネクションを確立する。一方、ミキサ端末10側からストリームコネクションを解放する場合は、ストリームコネクションを解放した後にフローパス更新メッセージ(Flow Path Update [-])を中継サーバ50に送る。   The flow of establishing / releasing a stream connection from the transmitting terminal side (20 (S), 10 (M)) according to the message flow in FIG. 6 has been described so far. Use the flow path update message (Flow Path Update [+/-]). In FIG. 6, the mixer terminal 10 that has received the source node update report message (Source Node Update Report) can automatically or selectively receive the relay from the source stream node (src). When receiving, a flow path update message (Flow Path Update [+]) is sent to the relay server 50 to establish a stream connection. On the other hand, when releasing the stream connection from the mixer terminal 10, a flow path update message (Flow Path Update [-]) is sent to the relay server 50 after releasing the stream connection.

本実施の形態に係るライブ中継システムでは、フローパス(Flow Path)とストリームコネクション(Stream Connection)を論理的に分けて管理することにより、局所的な通信断と復帰にも柔軟に対応できる。想定しているライブ中継では、送信端末20が移動することも考慮している。例えば、送信端末20がネットワーク200へ無線で繋がっている場合、突然の通信断へ対応できる仕組みが必要となる。そこでフローパス(Flow Path)が確立されていれば、ストリームコネクション(Stream Connection)の一部で一時的な通信断が発生したとしても、該当箇所のストリームコネクション(Stream Connection)のみを接続し直すことが可能な設計とした。ここで、ストリームコネクション(Stream Connection)の一時的な切断後、一定時間以上再接続が行われない場合は、中継ストリームノード(rly)とフローパス(Flow Path)は解放される。また、ストリームコネクション(Stream Connection)が確立されていても、何らかの原因により送信端末20側からのストリームデータをミキサ端末10で受信できない場合も、中継ストリームノード(rly)とフローパス(Flow Path)を解放する。受信側のストリームノードでは、送信側のストリームノードに対して定期的に受信状況を報告するが、送信側ではその報告を受けていない時間を計測し、受信側ではストリームデータを受信していない時間を計測している。これらの時間に閾値を設け、その閾値を超えた場合、送信側または受信側からフローパス(Flow Path)を解放する。その際、ストリームコネクション(Stream Connection)が確立されていれば、ストリームコネクション(Stream Connection)を解放した後にフローパス(Flow Path)を解放する。正常な処理としては、図6に示すフローパス更新メッセージ(Flow Path Update [-])によりフローパスは解放されるが、メッセージ用のコネクションが利用できない状況も考慮し、送信側と受信側それぞれでタイムアウトによるフローパス(Flow Path)の解放が行われる。   The live relay system according to the present embodiment can flexibly cope with local disconnection and restoration of communication by logically managing a flow path and a stream connection. In the envisioned live relay, it is considered that the transmitting terminal 20 moves. For example, when the transmitting terminal 20 is wirelessly connected to the network 200, a mechanism that can cope with a sudden communication loss is required. Therefore, if a flow path (Flow Path) is established, even if a temporary communication interruption occurs in a part of the stream connection (Stream Connection), it is possible to re-connect only the stream connection (Stream Connection) at the corresponding location. Possible design. Here, after a temporary disconnection of the stream connection (Stream Connection), if reconnection is not performed for a certain period of time or more, the relay stream node (rly) and the flow path (Flow Path) are released. Further, even if the stream connection is established, if the stream data from the transmitting terminal 20 cannot be received by the mixer terminal 10 for some reason, the relay stream node (rly) and the flow path (Flow Path) are released. I do. The receiving stream node periodically reports the reception status to the transmitting stream node.The transmitting side measures the time during which the report is not received, and the receiving side measures the time during which the stream data is not received. Is being measured. A threshold is set for these times, and when the threshold is exceeded, a flow path is released from the transmission side or the reception side. At this time, if a stream connection has been established, the flow path is released after releasing the stream connection. As a normal process, the flow path is released by the flow path update message (Flow Path Update [-]) shown in FIG. 6, but in consideration of the situation where the connection for the message cannot be used, each of the transmitting side and the receiving side has a timeout. Release of the flow path is performed.

ミキサ端末10における中継ストリームノード(rly)とミキサストリームノード(mix)の機能モジュール構成を図7に示す。ミキサ端末10への入力の動的な増減へ対応するため、ミキサストリームノード(mix)では入力用のリングバッファ13(Ring Buffer)の追加/削除を可能としている。リングバッファ13(Ring Buffer)は、ミキサストリームノード12(mix)の入力となる中継ストリームノード11(rly)毎に生成される。中継ストリームノード11(rly)では、パケット受信部111(Packet Receiver/Depacketizer)が受信したパケットからビデオフレームデータまたはオーディオサンプルデータを作り、それをデコーダ112(Decoder)がデコードする。その後、デコードされたデータをプレビューワ113(Previewer)によりプレビュー表示すると共に、リングバッファ13(Ring Buffer)へもデータをコピーする。ミキサストリームノード12(mix)内ではオーディオ・ビデオミキサモジュール121(Audio Video Mixer)がリングバッファ13(Ring Buffer)からデータを読み込み、ミキシング処理を行い、その結果をミキシングビューワ122(Mixing Viewer)に表示させる。   FIG. 7 shows a functional module configuration of the relay stream node (rly) and the mixer stream node (mix) in the mixer terminal 10. In order to cope with the dynamic increase and decrease of the input to the mixer terminal 10, the mixer stream node (mix) enables addition / deletion of an input ring buffer 13 (Ring Buffer). The ring buffer 13 (Ring Buffer) is generated for each relay stream node 11 (rly) that is input to the mixer stream node 12 (mix). In the relay stream node 11 (rly), video frame data or audio sample data is created from the packet received by the packet receiver 111 (Packet Receiver / Depacketizer), and the decoder 112 (Decoder) decodes it. Thereafter, the decoded data is preview-displayed by a previewer 113 (Previewer), and the data is also copied to a ring buffer 13 (Ring Buffer). In the mixer stream node 12 (mix), an audio / video mixer module 121 (Audio Video Mixer) reads data from the ring buffer 13 (Ring Buffer), performs a mixing process, and displays the result on a mixing viewer 122 (Mixing Viewer). Let it.

ミキシング処理後のデータを、さらに後段のミキサ端末10へ送信する場合は、エンコーダモジュール123(Encoder)によりエンコードされたデータがパケット送信部124によりパケットに分割され、送信される。一方、ミキシング処理後のデータをライブ中継用ソフトウェアやライブ中継用サービスサイトへ送信する場合は、ストリーム・エクスポートモジュール125(Stream Exporter)を利用する。   When the data after the mixing process is transmitted to the mixer terminal 10 at the subsequent stage, the data encoded by the encoder module 123 (Encoder) is divided into packets by the packet transmission unit 124 and transmitted. On the other hand, when the data after the mixing process is transmitted to live relay software or a live relay service site, a stream exporter 125 is used.

ミキシング操作は、ミキサストリームノード(mix)のミキサ制御インタフェース14(Mixer Control Interface)を通して行われる。ビデオをタイル状に並べるタイルビュー(Tiled View)と、縦または横に並べるボックスビュー(Box View)をレイアウトの基本とし、そのレイアウトを切り替える機能も実現する。図8は、ミキサ端末10上でミキシング操作をする際の空間的な配置の例を示している。中継ストリームノード(rly)でデコード(Decoder)されたビデオデータはプレビューワ113(Previewer)上に自動的にプレビュー表示されると共に、ミキシング処理の入力データとして利用可能な状態になる。ミキサ端末10の操作者は、プレビューワ113(Previewer)に表示されたビデオを確認し、必要に応じてミキシングビューワ122(Mixing Viewer)上でミキシング処理の対象とすることができる。ミキシングビューワ122は、背景を表示する背景層(Background Layer)上にタイルビュー層(Tiled View Layer)とボックスビュー層(Box View Layer)とが重なる3層構造となっている。ボックスビュー層(Box View Layer)は、タイルビュー層(Tiled View Layer)上でピクチャ・イン・ピクチャ(Picture-in-Picture)の機能を提供する層である。   The mixing operation is performed through the mixer control interface 14 (Mixer Control Interface) of the mixer stream node (mix). The layout is based on a tile view (Tiled View) that arranges videos in a tile and a box view (Box View) that arranges them vertically or horizontally, and a function to switch the layout is also realized. FIG. 8 shows an example of a spatial arrangement when performing a mixing operation on the mixer terminal 10. The video data decoded by the relay stream node (rly) is automatically preview-displayed on the previewer 113 (Previewer), and becomes usable as input data for the mixing process. The operator of the mixer terminal 10 checks the video displayed on the preview viewer 113 (Previewer), and can perform the mixing process on the mixing viewer 122 (Mixing Viewer) as necessary. The mixing viewer 122 has a three-layer structure in which a tile view layer (Tiled View Layer) and a box view layer (Box View Layer) overlap on a background layer (Background Layer) displaying a background. The box view layer (Box View Layer) is a layer that provides a picture-in-picture (Picture-in-Picture) function on the tile view layer (Tiled View Layer).

中継ストリームノード(rly)が削除された場合は、ビューワにおける表示も自動的に除去されて背景が表示される。ライブ中継の内容にもよるが、予測が困難な原因による中継ストリームノード(rly)の削除が発生することを想定すると、今まで表示されていたビデオが突然背景表示に変わることは望ましくない。一方、数秒間のビデオの停止は許容できることがある。これらを考慮し、中継ストリームノード(rly)の削除時には、最後に表示していたビデオフレームを一定時間表示させる。その時間は設定値として与える。この機能により、中継ストリームノード(rly)の削除後、背景が表示されるまでの間に、ミキサ端末10の操作者にはミキサを操作する時間的な余裕ができる。   When the relay stream node (rly) is deleted, the display in the viewer is automatically removed and the background is displayed. Although it depends on the content of the live broadcast, if it is assumed that the relay stream node (rly) is deleted due to a cause that is difficult to predict, it is not desirable that the video that has been displayed until now suddenly changes to the background display. On the other hand, stopping the video for a few seconds may be acceptable. Considering these, when deleting the relay stream node (rly), the video frame displayed last is displayed for a certain period of time. The time is given as a set value. With this function, the operator of the mixer terminal 10 has time to operate the mixer after the relay stream node (rly) is deleted and before the background is displayed.

以上、本発明の第1の実施の形態に係るミキサ装置(ミキサ端末10)及びライブ中継システムの機能について述べた。引き続き、プロトタイプシステムの実装についてまとめる。   The functions of the mixer device (mixer terminal 10) and the live relay system according to the first embodiment of the present invention have been described above. Next, we summarize the implementation of the prototype system.

複数ビデオソースの動的な構成を可能とするミキサ装置に対して、実機を用いた機能的な検証を行うため、Windows 7(登録商標)を搭載した汎用PC上にプロトタイプシステムを実装した。   A prototype system was implemented on a general-purpose PC equipped with Windows 7 (registered trademark) in order to perform functional verification using a real device with respect to a mixer device capable of dynamically configuring a plurality of video sources.

<メッセージ通信と利用者認証>
提案するプロトタイプのライブ中継システムは分散システムであり、システムを構成する各端末は、図5と図6に示したメッセージを含む多くのメッセージを相互にやりとりする必要がある。プロトタイプシステムでは、TCP上にテキストベースの簡単なメッセージプロトコルを実装した。また、送信側の端末(S、M)がソースグループへ参加する際には、必要に応じて利用者認証を行えるよう、企業内ネットワーク等で利用されているLDAP(Lightweight Directory Access Protocol)を用いた利用者認証機能を適用した。プロトタイプシステムではWindows(登録商標)用のOpen LDAP(非特許文献4参照)を中継サーバ50またはミキサ端末10上で動作させ、メッセージ通信用のTCPコネクションを確立する際に、利用者認証を可能としている。
<Message communication and user authentication>
The proposed live relay system of the prototype is a distributed system, and each terminal constituting the system needs to exchange many messages including the messages shown in FIGS. In the prototype system, we implemented a simple text-based message protocol over TCP. In addition, when the transmitting terminal (S, M) joins the source group, it uses LDAP (Lightweight Directory Access Protocol) used in a company network or the like so that user authentication can be performed as necessary. Applied user authentication function. In the prototype system, Open LDAP for Windows (see Non-Patent Document 4) is operated on the relay server 50 or the mixer terminal 10 to enable user authentication when establishing a TCP connection for message communication. I have.

<ストリームノードおよびミキサの実装>
各ストリームノードは、既存システム(非特許文献5参照)のストリーミング機能を改良して実装した。ビデオとオーディオの伝送にはRTPを基本とした簡易ストリーミングプロトコルを、TCPまたはUDP上で動作するよう実装し、ストリームノード内部におけるメディア処理にはDirect Show(非特許文献6参照)を用いている。ビデオおよびオーディオのミキシング機能も既存システム(非特許文献5参照)におけるミキシング機能を改良して実装した。非特許文献5記載のミキサは、図8に示す3層構造には対応していない。また、入力の動的な追加/削除機能も実装されていないので、動的に追加/削除可能かつスレッドセーフなリングバッファをミキサの入力として繋ぐ仕組みを新たに実装した。図7に示すオーディオ・ビデオミキサ121(Audio Video Mixer)は、リングバッファ13から一定間隔(評価実験では、ビデオは1/30sec.、オーディオは1/25sec.)でビデオとオーディオのデータを取得する。その際、時間的な揺らぎを吸収するため、リングバッファ13内でバッファリング(ビデオは2/30sec.、オーディオは2/25sec.)を行っており、その分はミキシング処理の遅延となる。一方、ミキサ端末10の入力となる中継ストリームノード(rly)とミキサストリームノード(mix)におけるミキシング処理を異なるスレッドに分けることにより処理の並列性を高めている。また、ビデオデータのミキシングの際は、ビデオデータをRGB(各8bit、計24bit/pixel)に統一し、オーディオデータはPCM(サンプリング周波数48kHz、量子化ビット数16bit)に統一した入力データをミキシングしている。
<Implementation of stream node and mixer>
Each stream node is implemented with an improved streaming function of an existing system (see Non-Patent Document 5). For video and audio transmission, a simple streaming protocol based on RTP is implemented to operate on TCP or UDP, and Direct Show (see Non-Patent Document 6) is used for media processing inside the stream node. A video and audio mixing function was also implemented by improving the mixing function in the existing system (see Non-Patent Document 5). The mixer described in Non-Patent Document 5 does not support the three-layer structure shown in FIG. In addition, since a function for dynamically adding / deleting inputs is not implemented, a mechanism for connecting a dynamically addable / deletable and thread-safe ring buffer as an input of the mixer is newly implemented. An audio / video mixer 121 (Audio Video Mixer) shown in FIG. 7 acquires video and audio data from the ring buffer 13 at regular intervals (in the evaluation experiment, video is 1/30 sec. And audio is 1/25 sec.). . At this time, in order to absorb temporal fluctuations, buffering (2/30 sec. For video and 2/25 sec. For audio) is performed in the ring buffer 13, which delays the mixing process. On the other hand, the parallelism of the processing is enhanced by dividing the mixing processing in the relay stream node (rly) and the mixing stream node (mix), which are the inputs of the mixer terminal 10, into different threads. When mixing video data, video data is unified to RGB (8 bits each, 24 bits / pixel in total), and audio data is input data that is unified to PCM (sampling frequency 48 kHz, quantization bit number 16 bits). ing.

また、図7におけるストリーム・エクスポートモジュール125(Stream Exporter)では、ローカルTCPコネクションを用いて、ビデオとオーディオデータを他のプロセス(Another Process for Live Video streaming)へ渡す仕組みを実装した。プロトタイプシステムでは、ライブ配信ソフトウェアの1つとしてMicrosoft (登録商標)Expression Encoder 4(非特許文献7参照)を想定し、Microsoft (登録商標)Expression Encoder 4における入力として利用できるDirectShowのソースフィルタも実装した。そのソースフィルタとストリーム・エクスポートモジュール125(Stream Exporter)間でローカルTCPコネクションを確立し、ミキシングされたビデオとオーディオデータをMicrosoft (登録商標)Expression Encoder 4の入力としている。   Further, the stream export module 125 (Stream Exporter) in FIG. 7 has implemented a mechanism for transferring video and audio data to another process (Another Process for Live Video streaming) using a local TCP connection. In the prototype system, Microsoft (R) Expression Encoder 4 (see Non-Patent Document 7) is assumed as one of the live distribution software, and a DirectShow source filter that can be used as an input in Microsoft (R) Expression Encoder 4 is also implemented. . A local TCP connection is established between the source filter and the stream export module 125 (Stream Exporter), and the mixed video and audio data is input to the Microsoft (registered trademark) Expression Encoder 4.

<ビューワと操作用GUI>
ビューワと操作用のGUIは、Java言語を用いて実装した。図8で示したプレビューワ113(Previewer)とミキシングビューワ122(Mixing viewer)を、図9に示す通り実現した。タイルビュー層(Tiled View Layer)では、列と行を任意の数に変更したり、表示区画をまとめたりすることができる。ボックスビュー層(Box View Layer)では、縦また横に並べたビデオをまとめて、配置位置を変更したり大きさや透明度を変更したりすることが可能である。図10はミキシング操作用GUIの画面イメージである。図7におけるミキサ制御インタフェース14(Mixer Control Interface)を用いて、ビデオ(Video Mixer)に関してはタイルビュー(Tiled View)およびボックスビュー(Box View)の操作とレイアウトの切り替えが可能であり、オーディオ(Audio Mixer)に関しては音量調整が可能である。
<Viewer and operation GUI>
The viewer and the GUI for operation were implemented using the Java language. The preview viewer 113 (Previewer) and the mixing viewer 122 (Mixing viewer) shown in FIG. 8 are realized as shown in FIG. In the tile view layer (Tiled View Layer), the number of columns and rows can be changed to an arbitrary number, and the display sections can be combined. The Box View Layer allows you to group videos that are arranged vertically or horizontally, change their placement, and change their size and transparency. FIG. 10 is a screen image of the mixing operation GUI. Using the Mixer Control Interface 14 shown in FIG. 7, the operation of the tile view and the box view of the video (Video Mixer) and switching of the layout can be performed, and the audio (Audio) can be switched. Mixer) can be adjusted in volume.

Windows(登録商標)以外のプラットフォームへの移植も考慮し、GUIはJava言語を用いている一方、ストリームの送受信やミキシング処理には、パフォーマンスを上げるためC言語およびC++言語を用いて実装している。ここで、C/C++側のメモリ領域で処理しているビデオデータをJava側のGUIコンポーネント上で表示するためには、通常、大量のメモリコピーが発生する。これを回避するために、プロトタイプシステムではAWT Native Interface(非特許文献8参照)を用いた。AWT Native InterfaceによりJavaのGUIコンポーネントに内包されているWindows(登録商標)のネイティブなウィンドウハンドラをC/C++側で扱うことが可能となる。プロトタイプシステムでは、C/C++側のDirectShowの画面描画用フィルタで処理されたビデオデータを、効率良くJavaのGUIコンポーネント上で表示している。   In consideration of porting to platforms other than Windows (registered trademark), the GUI uses the Java language, while the stream transmission and reception and mixing processing are implemented using C and C + + languages to improve performance. . Here, in order to display video data processed in the memory area on the C / C ++ side on the GUI component on the Java side, a large amount of memory copying usually occurs. To avoid this, the prototype system used AWT Native Interface (see Non-Patent Document 8). The AWT Native Interface allows the C / C ++ side to handle a Windows (registered trademark) native window handler included in a Java GUI component. In the prototype system, video data processed by the C / C ++ side DirectShow screen drawing filter is efficiently displayed on a Java GUI component.

図11に示す実験環境において、図12と図13に示す構成でライブ中継システムの評価実験を行った。   In the experimental environment shown in FIG. 11, an evaluation experiment of the live relay system was performed with the configurations shown in FIGS.

図12に示す単一構成では、ミキサ端末10(M0)がソースグループを設定し、そのソースグループに参加した送信端末20(S0〜S9)からのストリームを中継サーバ50(R)経由でミキサ端末10(M0)が受信し、ミキシング処理を行った。また、ミキシングしたストリームデータをミキサ端末10(M0)内で動作しているMicrosoft (登録商標)Expression Encoder 4へ送り、最終的に利用者端末40(U)内のWindows (登録商標)Media Playerで再生表示できることを確認した。この構成では、送信端末20(S0〜S9)がそれぞれビデオストリームとオーディオストリームを1本ずつ送信した場合の、ミキサ端末10(M0)におけるCPU利用率と出力フレームレート、および送信端末20とミキサ端10末間の遅延を測定した。   In the single configuration shown in FIG. 12, the mixer terminal 10 (M0) sets a source group, and streams from the transmitting terminals 20 (S0 to S9) that have joined the source group via the relay server 50 (R). 10 (M0) received and performed a mixing process. Further, the mixed stream data is sent to Microsoft (registered trademark) Expression Encoder 4 operating in the mixer terminal 10 (M0), and finally, Windows (registered trademark) Media Player in the user terminal 40 (U) is used. Confirmed that playback can be displayed. In this configuration, when the transmitting terminal 20 (S0 to S9) transmits one video stream and one audio stream, respectively, the CPU utilization and the output frame rate in the mixer terminal 10 (M0), and the transmitting terminal 20 and the mixer terminal The delay between the ten powders was measured.

一方、図13のカスケード構成ではミキサ端末10(M0)がソースグループを設定し、そのソースグループに参加した前段のミキサ端末10(M1〜M3)からのストリームを中継サーバ50(R)経由でミキサ端末10(M0)が受信し、ミキシング処理を行った。ミキサ端末10(M1〜M3)は、それぞれ送信端末20(S0~S9)からのストリームを直接受信してミキシング処理を行った。この構成は、図4に示したカスケードミキサの構成における前段のミキサ端末10を3台としたものである。実際のライブ中継としては、長い列を作り行進するような祭りにおいて、その行進開始地点と終了地点および中間地点を中継元とした場合の3地点を想定している。ここで、送信端末20は10台であるが、実験では送信端末20から複数本のストリームを送出することで、ミキサ端末10(M1〜M3)への入力ストリーム数を確保した。1台のミキサ端末10で処理可能な入力ストリーム数は図12の構成における実験から明らかになるので、図13の構成における実験では、カスケードミキサの構成における、送信端末20(S0~S9)とミキサ端末10(M0)間の遅延を測定した。   On the other hand, in the cascade configuration shown in FIG. 13, the mixer terminal 10 (M0) sets a source group, and streams from the preceding mixer terminals 10 (M1 to M3) that have joined the source group via the relay server 50 (R). The terminal 10 (M0) received and performed a mixing process. The mixer terminals 10 (M1 to M3) directly received the streams from the transmission terminals 20 (S0 to S9) and performed the mixing process. This configuration is different from the cascade mixer shown in FIG. 4 in that three mixer terminals 10 are provided at the preceding stage. As an actual live broadcast, in a festival where a long line is formed and a march is made, three points are assumed in which the starting point, the end point, and the intermediate point of the march are set as relay sources. Here, although the number of the transmission terminals 20 is 10, in the experiment, the transmission terminals 20 transmitted a plurality of streams to secure the number of input streams to the mixer terminals 10 (M1 to M3). Since the number of input streams that can be processed by one mixer terminal 10 becomes apparent from the experiment in the configuration of FIG. 12, in the experiment in the configuration of FIG. 13, the transmission terminal 20 (S0 to S9) and the mixer in the configuration of the cascade mixer are used. The delay between the terminals 10 (M0) was measured.

実験で用いた中継端末50(R)とミキサ端末10(M0、M1〜M3)のスペックとして、CPUと搭載メモリおよびNICを表1に示す。

Figure 0006651197
プロトタイプシステムではミキシング処理をCPUで行っているので、ミキサ端末10の性能はCPUの性能に依存する。評価実験を行うにあたっては、専用機器としてのミキサ端末10のうち、比較的入手し易い機器(非特許文献9参照)と同程度の価格で入手可能なPCを用いた。ミキサ端末10(M0、M1〜M3)は全て同型のPCである。送信端末20(S0〜S9)としては、今回の実験で利用するビデオとオーディオストリームの送信に充分対応でき、ビデオカメラとマイクロフォンを搭載しているPCを用いた。また、送信端末20(S0〜S9)とミキサ端末10(M0)間の遅延を測定するに当たり、ネットワーク200内の遅延は無視できるよう、図11に示すように、ギガビットスイッチングハブ70に各端末10、20、30、40、50を接続して実験を行った。また、LANを利用しているので、中継サーバ50を利用せずともストリームの中継は可能であるが、実際のライブ中継ではバックエンドの中継サーバ50が必要である場合が多いことを想定し、中継サーバ50を含めた構成としている。加えて、プロトタイプシステムのストリーミングプロトコルはTCPとUDPに対応しているが、インターネットの末端からバックエンドの中継サーバ50を利用することを想定し、実験ではTCPを用いた。一方、中継サーバ50の有無による遅延の比較を行うため、図12に示す単一構成における送信端末20とミキサ端末10(M0)間の遅延の測定実験のみ、中継サーバ50を利用しなかった場合の実験も行った。 Table 1 shows the CPU, the mounted memory, and the NIC as specifications of the relay terminal 50 (R) and the mixer terminal 10 (M0, M1 to M3) used in the experiment.
Figure 0006651197
In the prototype system, the mixing process is performed by the CPU, so the performance of the mixer terminal 10 depends on the performance of the CPU. In performing the evaluation experiment, a PC available at a price similar to that of a relatively easily available device (see Non-Patent Document 9) among the mixer terminals 10 as dedicated devices was used. The mixer terminals 10 (M0, M1 to M3) are all the same type of PC. As the transmission terminal 20 (S0 to S9), a PC that can sufficiently support transmission of the video and audio streams used in this experiment and has a video camera and a microphone was used. Further, in measuring the delay between the transmitting terminal 20 (S0 to S9) and the mixer terminal 10 (M0), as shown in FIG. 11, each terminal 10 is connected to the gigabit switching hub 70 so that the delay in the network 200 can be ignored. , 20, 30, 40, and 50 were connected to conduct an experiment. Also, since the LAN is used, it is possible to relay the stream without using the relay server 50, but it is assumed that the actual live relay often requires the back-end relay server 50, The configuration includes the relay server 50. In addition, although the streaming protocol of the prototype system is compatible with TCP and UDP, TCP is used in the experiment, assuming that the back-end relay server 50 is used from the end of the Internet. On the other hand, in order to compare delays depending on the presence / absence of the relay server 50, only the delay measurement experiment between the transmission terminal 20 and the mixer terminal 10 (M0) in the single configuration shown in FIG. Experiments were also conducted.

送信端末20から送信するビデオストリームのフォーマットは、720p(ピクセル解像度:1280×720pixel、フレームレート:30fps)および360p(ピクセル解像度:640×360pixel、フレームレート:30fps)を用いた。圧縮にはWMV(Windows (登録商標)Media Video)のCBR(Constant Bit Rate)を用い、720pの場合は4Mbps、360pの場合は1Mbpsの設定を利用した。オーディオストリームのフォーマットはPCM(チャンネル数:1、サンプリング周波数:44.1kHz、量子化ビット数:16bit、キャプチャ間隔:1/25sec.)を用いており、キャプチャしたPCMデータを圧縮せず705.6Kbpsのオーディオストリームとして利用した。また、ミキサ端末10(M0)内で動作させたMicrosoft (登録商標)Expression Encoder 4では、実際の配信を考慮し、720pのビデオデータについてはVC-1アドバンストのエンコーダを用いてCBR 2Mbpsのストリームを生成し、360pのビデオデータについてはCBR 500Kbpsのストリームを生成した。オーディオデータについては、WMAのエンコーダを用いてCBR 64Kbpsのストリームを生成した。実際に配信をする場合は、通常、生成したビデオとオーディオのストリームを配信ポイントとなるWindows (登録商標)MediaサーバかIISスムーズストリーミングサーバーへ送信するが、実験ではミキサ端末10(M0)から利用者端末30(U)上のWindows (登録商標)Media Playerへストリーミング再生を行った。   The format of the video stream transmitted from the transmission terminal 20 used was 720p (pixel resolution: 1280 × 720 pixels, frame rate: 30 fps) and 360p (pixel resolution: 640 × 360 pixels, frame rate: 30 fps). CBR (Constant Bit Rate) of WMV (Windows (registered trademark) Media Video) was used for compression, and the setting of 4 Mbps for 720p and 1 Mbps for 360p was used. The audio stream format uses PCM (number of channels: 1, sampling frequency: 44.1 kHz, number of quantization bits: 16 bits, capture interval: 1/25 sec.), And the captured PCM data is not compressed and is 705.6 Kbps audio. Used as a stream. Also, in the Microsoft (registered trademark) Expression Encoder 4 operated in the mixer terminal 10 (M0), in consideration of actual distribution, for a 720p video data, a VC-1 advanced encoder is used to convert a CBR 2 Mbps stream. For the 360p video data, a CBR 500Kbps stream was generated. For audio data, a CBR 64 Kbps stream was generated using a WMA encoder. When actually distributing, the generated video and audio streams are usually transmitted to a Windows (registered trademark) Media server or an IIS smooth streaming server serving as a distribution point. However, in an experiment, the user transmits the stream from the mixer terminal 10 (M0) to the user. Streaming playback was performed to Windows (registered trademark) Media Player on the terminal 30 (U).

また、プロトタイプシステムではビデオとオーディオデータにタイムスタンプが付加され、ストリーム毎に同期をとって処理される実装となっている。送信端末20ではビデオとオーディオデータのキャプチャ時にタイムスタンプを付加しており、ミキサ端末10ではビデオとオーディオデータをそれぞれミキシングした後にタイムスタンプを付加している。一方、現在のプロトタイプシステムでは送信端末20間の同期は考慮していない。   In the prototype system, a time stamp is added to video and audio data, and the stream is processed in synchronization with each stream. The transmission terminal 20 adds a time stamp when capturing video and audio data, and the mixer terminal 10 adds the time stamp after mixing the video and audio data. On the other hand, in the current prototype system, synchronization between the transmission terminals 20 is not considered.

プロトタイプシステムとして実装したミキサ端末10の性能評価として、ミキサ端末10(M0)におけるCPU利用率と出力フレームレート、および送信端末とミキサ端末10間の遅延を測定した。   As the performance evaluation of the mixer terminal 10 implemented as a prototype system, the CPU utilization and the output frame rate of the mixer terminal 10 (M0), and the delay between the transmission terminal and the mixer terminal 10 were measured.

<入力の動的な追加/削除機能>
まず、ミキサ端末10(M0)に対して入力を動的に追加/削除した場合の実験結果をまとめる。実験では、ミキサ端末(M0)が設定したソースグループへ送信端末20(S0〜S9)が参加し、各送信端末20からのビデオとオーディオストリームを10秒毎に追加した。送信端末20(S0〜S9)全てからのストリームをミキサ端末10(M0)の入力として10秒間処理した後、同じく10秒毎にビデオとオーディオストリームを削除した。この間1秒間隔でCPU利用率とミキサ端末10の出力フレームレートを測定し、720pと360pに分けてグラフにしたのが図14と図15である。グラフ左の縦軸はミキサ端末10(M0)のCPU利用率を、グラフ右の縦軸は出力フレームレートを示している。横軸は経過時間であり、グラフの上部には送信端末20の数を示している。前述した通り、この出力フレームレートは図12におけるミキサストリームノード(mix)から、他プロセスとして動作しているMicrosoft (登録商標)Expression Encoder 4へのフレームレートである。また、送信端末20とミキサ端末10(M0)間の遅延は、送信端末20においてビデオカメラからキャプチャしたビデオフレームのキャプチャ時刻に対して、そのビデオフレームがミキサ端末10(M0)上のミキシングビューワで表示されるまでの時間である。図16は中継サーバ50を経由した場合の遅延を、図17は中継サーバ50を利用しなかった場合の遅延を示している。
<Dynamic input addition / deletion function>
First, the experimental results in the case of dynamically adding / deleting an input to / from the mixer terminal 10 (M0) will be summarized. In the experiment, the transmitting terminals 20 (S0 to S9) participated in the source group set by the mixer terminal (M0), and added video and audio streams from each transmitting terminal 20 every 10 seconds. After processing the streams from all the transmission terminals 20 (S0 to S9) as inputs to the mixer terminal 10 (M0) for 10 seconds, the video and audio streams were also deleted every 10 seconds. During this time, the CPU utilization and the output frame rate of the mixer terminal 10 were measured at one-second intervals, and graphs are shown in FIGS. The vertical axis on the left side of the graph indicates the CPU utilization of the mixer terminal 10 (M0), and the vertical axis on the right side of the graph indicates the output frame rate. The horizontal axis indicates elapsed time, and the upper part of the graph indicates the number of transmitting terminals 20. As described above, this output frame rate is a frame rate from the mixer stream node (mix) in FIG. 12 to Microsoft (registered trademark) Expression Encoder 4 operating as another process. In addition, the delay between the transmission terminal 20 and the mixer terminal 10 (M0) is different from the capture time of the video frame captured from the video camera in the transmission terminal 20 by that the video frame is mixed by the mixing viewer on the mixer terminal 10 (M0). It is the time until it is displayed. FIG. 16 shows a delay when the relay server 50 is used, and FIG. 17 shows a delay when the relay server 50 is not used.

図14と図15に示すグラフからは、入力の追加/削除に対するCPU利用率と出力フレームレートの変化の概要がわかる。CPU利用率は測定値をそのままグラフにしているのでバラつきはあるが、入力数に応じて増減していることがわかる。また、図14からは、追加のタイミングでCPU利用率が大きく変化する傾向も見て取れる。これは、資源の確保と追加した入力に対する処理の開始による変化である。削除のタイミングでもその傾向は見受けられるが、追加のタイミングに比べると変化は少ない。一方、出力フレームレートの測定結果を見てみると、追加/削除のタイミングでフレームレートは一瞬下がる。プロトタイプシステムにおけるミキサ端末10の実装では、図7におけるオーディオ・ビデオミキサ121(Audio Video Mixer)へリングバッファ13(Ring Buffer)を追加/削除する際、中継ストリームノード(Relay Stream Node:rly)とミキサストリームノード(Mixer Stream Node:mix)それぞれのスレッド間で処理の同期をとっている。その同期処理が、出力フレームレートに影響しているものと考えられる。また、図14に示すグラフから720pの場合は、入力数が7〜10の区間でフレームレートにバラつきが見られる。後の実験結果として示すが、入力数7までは平均的には充分なフレームレートを確保することができる。しかし、入力数が8〜10の区間はCPU利用率も高く、プロトタイプシステムにおけるミキサ端末の処理能力がフレームレートに影響していると考えられる。   The graphs shown in FIG. 14 and FIG. 15 show the outline of changes in the CPU utilization rate and the output frame rate with respect to addition / deletion of an input. The CPU utilization rate varies as the measured value is graphed as it is, but it can be seen that it increases and decreases according to the number of inputs. FIG. 14 also shows a tendency that the CPU utilization greatly changes at the additional timing. This is a change due to the securing of resources and the start of processing for the added input. Although the tendency can be seen at the timing of deletion, the change is small compared to the timing of addition. On the other hand, looking at the measurement result of the output frame rate, the frame rate drops momentarily at the timing of addition / deletion. In the implementation of the mixer terminal 10 in the prototype system, when adding / deleting the ring buffer 13 (Ring Buffer) to / from the audio / video mixer 121 (Audio Video Mixer) in FIG. 7, the relay stream node (Relay Stream Node: rly) and the mixer are used. Mixer Stream Node (mix) Synchronizes the processing between each thread. It is considered that the synchronization process affects the output frame rate. Further, from the graph shown in FIG. 14, in the case of 720p, the frame rate varies in the section where the number of inputs is 7 to 10. As will be shown as the experimental results later, a sufficient frame rate can be secured on average up to 7 inputs. However, in the section where the number of inputs is 8 to 10, the CPU utilization is high, and it is considered that the processing capability of the mixer terminal in the prototype system affects the frame rate.

次に、図16と図17に示すグラフからは、入力の追加/削除に対する送信端末20とミキサ端末10(M0)との間の遅延の変化の概要がわかる。中継サーバ50の有無によらず720pの場合は、入力数が増えると遅延も増加傾向にあることが見て取れる。一方、360pの場合、入力数の増加による遅延の増加は顕著には現れていない。ここで、遅延の測定については中継サーバ50を経由する場合としない場合の実験を行ったので、その結果を比較する。入力を追加/削除した全19区間毎の平均遅延の差を求めると、360pを用いた実験では、11区間で中継サーバ50無しの場合の方が遅延は少なかった。720pを用いた実験では、8区間で中継サーバ50無しの場合の方が遅延は少なかった。逆に、中継サーバ50経由の方が平均遅延は少ない区間がある。中継サーバ50の有無による、区間毎の平均遅延の差は±20msecの範囲であった。遅延の測定には、前述した通りビデオカメラからキャプチャしたビデオフレームのキャプチャ時刻と、そのビデオフレームがミキサ端末10上のミキシングビューワ122で表示される時刻との差を求めている。従って30fpsのビデオフレームを1枚表示している時間、約33msec分の誤差が含まれる。よって、この実験における遅延測定方法では、中継サーバ50の有無による遅延の差は測定誤差の範囲に収まる程度である。一方、全サンプルデータの標準偏差を算出したところ、360pの場合はほとんど変化が無い(中継サーバ経由: 14.1msec、中継サーバ無し: 14.8msec)が、720pの場合は中継サーバ50経由の方が若干大きい(中継サーバ経由: 19.0msec、中継サーバ無し: 15.7msec)結果となった。720pの場合は、中継サーバ50を経由することで若干遅延のバラつきが増えたとも考えられるが、結果としては、中継サーバ50の有無による遅延には顕著な差は見られない。   Next, the graphs shown in FIG. 16 and FIG. 17 show the outline of the change in the delay between the transmission terminal 20 and the mixer terminal 10 (M0) with respect to the addition / deletion of the input. In the case of 720p regardless of the presence or absence of the relay server 50, it can be seen that the delay tends to increase as the number of inputs increases. On the other hand, in the case of 360p, an increase in delay due to an increase in the number of inputs does not appear remarkably. Here, an experiment was performed with and without the relay server 50 for measuring the delay, and the results are compared. When an average delay difference for all 19 sections where input was added / deleted was obtained, in an experiment using 360p, the delay was smaller in the 11 sections without the relay server 50 than in the 11 sections. In the experiment using 720p, the delay was smaller in the eight sections without the relay server 50. Conversely, there is a section where the average delay is smaller through the relay server 50. The difference in average delay for each section depending on the presence or absence of the relay server 50 was in the range of ± 20 msec. In measuring the delay, as described above, the difference between the capture time of the video frame captured from the video camera and the time at which the video frame is displayed on the mixing viewer 122 on the mixer terminal 10 is obtained. Therefore, an error of about 33 msec is included in the time during which one 30 fps video frame is displayed. Therefore, in the delay measurement method in this experiment, the difference in delay due to the presence or absence of the relay server 50 is within the range of the measurement error. On the other hand, when the standard deviation of all the sample data was calculated, there was almost no change in the case of 360p (via the relay server: 14.1 msec, without the relay server: 14.8 msec), but in the case of 720p, the change via the relay server 50 was slightly larger. The result was large (via relay server: 19.0msec, without relay server: 15.7msec). In the case of 720p, it is considered that the variation in delay slightly increased by passing through the relay server 50, but as a result, there is no remarkable difference in the delay depending on the presence or absence of the relay server 50.

以上、入力の動的な追加/削除機能の動作に合わせて、CPU利用率と出力フレームレート、および送信端末20とミキサ端末10(M0)間の遅延に関する実験結果をまとめた。動的な追加/削除機能を試すため、比較的短い間隔でストリームの追加と削除を行ったので、そのタイミングにおける各測定値の変化は確認できた。一方、ミキサ端末10の入力数に対する平均的な性能を確認するためには、入力数毎の測定時間を増やし、各測定値のサンプル数を増やす必要がある。引き続き、ミキサ端末10の入力数に対する評価実験結果をまとめる。   As described above, the experimental results regarding the CPU utilization, the output frame rate, and the delay between the transmission terminal 20 and the mixer terminal 10 (M0) are summarized in accordance with the operation of the dynamic input addition / deletion function. In order to test the dynamic addition / deletion function, streams were added and deleted at relatively short intervals, so that the change of each measured value at that timing could be confirmed. On the other hand, in order to confirm the average performance with respect to the number of inputs of the mixer terminal 10, it is necessary to increase the measurement time for each number of inputs and increase the number of samples of each measurement value. Subsequently, the results of evaluation experiments on the number of inputs of the mixer terminal 10 will be summarized.

<入力数に対するミキサの性能評価>
先の実験同様、ミキサ端末10(M0)が設定したソースグループへ送信端末20(S0〜S9)が参加し、各送信端末20はビデオとオーディオストリームを送信した。各送信端末20からのストリームをミキサ端末10(M0)が受信し、ミキシング処理を開始した後3分間、ミキサ端末10(M0)のCPU利用率とフレームレート、および送信端末20とミキサ端末10(M0)間の遅延を測定した。CPU利用率の平均値をグラフにしたのが図18である。図18に示す縦軸およびグラフの下表はミキサ端末10(M0)のCPU利用率を示しており、横軸は送信端末数を示している。また、グラフには送信端末数毎の標準偏差も合わせて示してある。同様に図19は、出力フレームレートの平均値と標準偏差を、図20は送信端末20とミキサ端末10(M0)間の遅延の平均値と標準偏差を示している。
<Evaluation of mixer performance against the number of inputs>
As in the previous experiment, the transmitting terminals 20 (S0 to S9) participated in the source group set by the mixer terminal 10 (M0), and each transmitting terminal 20 transmitted a video and an audio stream. The mixer terminal 10 (M0) receives the stream from each transmission terminal 20, and for 3 minutes after starting the mixing process, the CPU utilization and the frame rate of the mixer terminal 10 (M0), and the transmission terminal 20 and the mixer terminal 10 (M0). The delay between M0) was measured. FIG. 18 is a graph of the average value of the CPU utilization. The vertical axis and the lower table of the graph shown in FIG. 18 indicate the CPU utilization of the mixer terminal 10 (M0), and the horizontal axis indicates the number of transmission terminals. The graph also shows the standard deviation for each number of transmission terminals. Similarly, FIG. 19 shows the average value and the standard deviation of the output frame rate, and FIG. 20 shows the average value and the standard deviation of the delay between the transmitting terminal 20 and the mixer terminal 10 (M0).

720pのミキシング処理を行った場合、図18より、送信端末20の数が1台から8台目まではCPU利用率がほぼ単調増加している。これはデコード処理の増加によるもので、プロトタイプシステムでは、1台の送信端末20につき約7%〜10%のCPU資源を必要とする。一方、8台目から9台目に送信端末20が増加した際にはCPU利用率の平均で3.91%増加しているが、これは、9台目の送信端末20から受信したストリームのデコード処理を充分に行えていないことを示している。また、送信端末20の数が7台目以降、CPU利用率の標準偏差の幅が小さくなることも図18から確認できる。これは、ミキサ端末10(M0)における処理に余裕が無くなっていることを示しており、CPU利用率がほぼ単調増加していた8台目でもミキシング処理の結果である出力フレームレートに影響していることが図19から見てとれる。図19における720pの場合の平均出力フレームレートは、送信端末20の数が7台目までは、ほぼ30fpsであるが、送信端末20の8台目は29.97fpsとなる。標準偏差の幅も送信端末の数が8台目から明らかに増え、一定のフレームレートによる処理ができない状態となっている。図20における720pの場合の送信端末20とミキサ端末10(M0)間の遅延を見ても、送信端末20が7台目までは多少のばらつきはあるものの、ほぼ一定であるが、送信端末20が8台目以降は増加していることがわかる。以上により、この実験で用いたコーデックの設定において、プロトタイプシステムのミキサ端末10では、720pの場合、送信端末20が7台までミキシング処理できたことがわかる。一方、360pのミキシング処理を行った場合、送信端末20が10台までのミキシング処理は充分可能であることが図18〜図20に示す実験結果より確認できる。   When the 720p mixing process is performed, as shown in FIG. 18, the CPU utilization increases almost monotonically from the first to eighth transmission terminals 20. This is due to an increase in decoding processing. In the prototype system, about 7% to 10% of CPU resources are required for one transmission terminal 20. On the other hand, when the number of the transmitting terminals 20 increases from the eighth to the ninth, the CPU utilization rate increases by an average of 3.91%. This is because the decoding processing of the stream received from the ninth transmitting terminal 20 is performed. Is not sufficiently performed. Also, it can be confirmed from FIG. 18 that the width of the standard deviation of the CPU utilization rate becomes smaller after the seventh transmission terminal 20 is transmitted. This indicates that there is no room in the processing in the mixer terminal 10 (M0), and even in the eighth unit where the CPU utilization has almost monotonically increased, the output frame rate which is the result of the mixing processing is affected. 19 can be seen from FIG. The average output frame rate in the case of 720p in FIG. 19 is approximately 30 fps up to the seventh transmitting terminal 20, but is 29.97 fps for the eighth transmitting terminal 20. The width of the standard deviation is also clearly increased from the eighth transmission terminal, and processing at a constant frame rate cannot be performed. Looking at the delay between the transmission terminal 20 and the mixer terminal 10 (M0) in the case of 720p in FIG. 20, although there is some variation up to the seventh transmission terminal 20, the transmission terminal 20 is almost constant. It can be seen that the number has increased after the eighth vehicle. From the above, it can be seen that in the setting of the codec used in this experiment, the mixing processing of up to seven transmitting terminals 20 was possible at 720p in the mixer terminal 10 of the prototype system. On the other hand, when 360p mixing processing is performed, it can be confirmed from the experimental results shown in FIGS. 18 to 20 that the mixing processing can be sufficiently performed for up to ten transmission terminals 20.

引き続き、カスケード構成の場合の、送信端末20とミキサ端末10(M0)間における遅延の測定結果を図21に示す。図13に示すカスケード構成において、後段のミキサ端末10(M0)への入力ストリームは前段のミキサ端末10(M1〜M3)3台分となる。これは図18〜図20における送信端末20が3台の場合と同じである。一方、カスケード構成により送信端末20とミキサ端末10(M0)との間の遅延は単一構成の場合より増加する。どの程度の遅延が発生するかを確認するため、前段のミキサ端末10の1つであるミキサ端末10(M1)に対して送信端末20の数を1台〜10台まで変化(増加)させ、遅延の測定を行った。ここで、図7におけるミキサ端末10の機能モジュールのうち、カスケード構成の前段のミキサ装置10では、オーディオ・ビデオミキサ121(Audio Video Mixer)の出力をエンコーダモジュール123(Encoder)でエンコードした後、パケット化し中継サーバ50経由で後段のミキサ端末10宛に送信する。単一構成の場合同様、送信端末20から受信したストリームのデコード処理とミキシング操作後のエンコード処理はCPUで行っている。前段のミキサ10から後段のミキサ10へ送信されるストリームのフォーマットは、送信端末20の送信ストリームフォーマットと同じ設定としている。前段のミキサ端末10における処理と後段のミキサ端末10における処理はほぼ同じであり、その結果として、前段のミキサ端末10(M1)におけるCPU負荷が、送信端末20と後段のミキサ端末10(M0)間の遅延にも反映される。720pの場合、図21に示すグラフから送信端末20が8台目まではほぼ変化しないが、送信端末20が9台目と10台目では、8台目までより遅延が増加していることがわかる。360pの場合は、送信端末20が3台目までに比べて4台目以降で遅延が若干増加するが、実験した送信端末が10台までの範囲では、顕著な遅延の増加は発生していない。   Subsequently, FIG. 21 shows a measurement result of the delay between the transmission terminal 20 and the mixer terminal 10 (M0) in the case of the cascade configuration. In the cascade configuration shown in FIG. 13, the input stream to the rear-stage mixer terminal 10 (M0) is equivalent to three front-stage mixer terminals 10 (M1 to M3). This is the same as the case where there are three transmitting terminals 20 in FIGS. On the other hand, the delay between the transmission terminal 20 and the mixer terminal 10 (M0) is increased by the cascade configuration as compared with the case of the single configuration. In order to confirm how much delay occurs, the number of transmission terminals 20 is changed (increased) from 1 to 10 for the mixer terminal 10 (M1), which is one of the preceding mixer terminals 10, Delay measurements were taken. Here, among the functional modules of the mixer terminal 10 in FIG. 7, in the mixer device 10 in the preceding stage of the cascade configuration, the output of the audio / video mixer 121 (Audio Video Mixer) is encoded by the encoder module 123 (Encoder), and then the packet is encoded. And transmits it to the subsequent mixer terminal 10 via the relay server 50. As in the case of the single configuration, the decoding process of the stream received from the transmitting terminal 20 and the encoding process after the mixing operation are performed by the CPU. The format of the stream transmitted from the previous-stage mixer 10 to the subsequent-stage mixer 10 is set to be the same as the transmission stream format of the transmission terminal 20. The processing in the front-stage mixer terminal 10 and the processing in the rear-stage mixer terminal 10 are almost the same. As a result, the CPU load in the front-stage mixer terminal 10 (M1) is reduced by the transmission terminal 20 and the rear-stage mixer terminal 10 (M0). Is also reflected in the delay between them. In the case of 720p, from the graph shown in FIG. 21, the transmission terminal 20 hardly changes until the eighth transmission terminal 20. However, in the case where the transmission terminals 20 are the ninth and tenth transmission terminals, the delay increases more than the eighth transmission terminal 20. Understand. In the case of 360p, the delay slightly increases after the fourth transmitting terminal 20 as compared with the third transmitting terminal, but no noticeable delay increase occurs within the range of the ten transmitting terminals tested. .

以上、プロトタイプシステムのライブ中継システムの性能評価として、ミキサ端末10(M0)におけるCPU利用率と出力フレームレート、および送信端末20とミキサ端末10(M0)間の遅延の測定結果を示した。測定結果から、実験で用いた720pのフォーマットであれば、最大で送信端末20が7台分のストリームを1台のミキサ端末10で処理できることが確認できた。360pのフォーマットについては、少なくとも送信端末20が10台分のストリームまで処理できることも確認した。   As described above, as the performance evaluation of the live relay system of the prototype system, the measurement results of the CPU utilization and the output frame rate in the mixer terminal 10 (M0) and the delay between the transmission terminal 20 and the mixer terminal 10 (M0) are shown. From the measurement results, it was confirmed that, with the 720p format used in the experiment, a maximum of seven transmitting terminals 20 can process one stream with one mixer terminal 10. With regard to the 360p format, it was also confirmed that at least the transmitting terminal 20 can process up to 10 streams.

また、送信端末20とミキサ端末10(M0)間の遅延については、単一構成の場合とカスケード構成の場合の測定結果を示した。 前述したように、中継元におけるビデオ撮影者とミキサ操作者との間でタイミングをとれる程度のエンド間遅延内でストリーミングとミキシング処理が行われる必要がある。ここで、過去に実施された遠隔会議における伝播遅延の影響の実験(非特許文献10参照)を参照すると、往復遅延250msではほとんどの会議場面が許容されるが、500msでは一部適さない会議場面(速くてひん度の高いやりとりが要求される会議場面)が生ずる、とする一方で、討論、意見交換が主体である一般の会議では500msでもほとんど支障がない、と報告されている。この文献の実験結果を参照し、中継元におけるビデオ撮影者とミキサ操作者間のやりとりが、速くてひん度の高いやりとりではない場合を想定し、ここでは、往復遅延500msを許容値の目安とする。   As for the delay between the transmission terminal 20 and the mixer terminal 10 (M0), the measurement results in the case of the single configuration and the case of the cascade configuration are shown. As described above, the streaming and mixing processes need to be performed within an end-to-end delay that allows timing between the video shooter and the mixer operator at the relay source. Here, referring to an experiment on the effect of propagation delay in a remote conference performed in the past (see Non-Patent Document 10), most conference scenes are allowed with a round-trip delay of 250 ms, but some conference scenes are not suitable for a 500 ms round-trip delay. (Meeting scenes requiring fast and frequent exchanges), but it has been reported that there is almost no problem even at 500 ms in general meetings where discussions and exchange of opinions are mainly performed. Referring to the experimental results in this document, assuming that the exchange between the video photographer and the mixer operator at the relay source is not a fast and frequent exchange, here, a round-trip delay of 500 ms is a guideline of an allowable value. I do.

プロトタイプシステムを用いた実験では、送信端末20からミキサ端末10(M0)までの片方向の遅延を測定しているので、単純に500msの半分の250msを許容値とすると、図20から、ミキサ端末10で処理可能なストリーム数の範囲ではこの値以下の遅延であることがわかる。しかし、カスケード構成の場合、720pのストリームでは全て250msを超えている。カスケード構成の場合でも、中継元におけるビデオ撮影者と前段のミキサ操作者間のやりとりには支障がないと考えられるが、中継元におけるビデオ撮影者と後段のミキサ操作者間でタイミングをとるためには、より遅延を少なくする工夫が必要となる。プロトタイプシステムでは時間的な揺らぎを吸収するため、リングバッファにてバッファリング(ビデオは2/30sec.、オーディオは2/25sec.)を行っているので、カスケード構成の場合はミキサストリームノードにおいて少なくとも4/25sec.(=160ms)分の遅延が発生する。片方向の遅延を250ms内に抑えるためには、ビデオ1フレーム分(対応するオーディオデータを含む)のエンド間におけるデータ処理を平均90ms以内で行う必要があることになる。実験環境はネットワーク200の遅延をほぼ無視できる環境であることも考慮すると、遅延は可能な限り抑えられることが望ましい。前述したように、プロトタイプシステムではミキサ端末10の入力となる中継ストリームノード(rly)とミキサストリームノード(mix)におけるミキシング処理を異なるスレッドに分けることにより、処理の並列性を高めているが、より遅延を抑えるためには今後検討の余地がある。   In the experiment using the prototype system, a one-way delay from the transmitting terminal 20 to the mixer terminal 10 (M0) is measured. Therefore, if the allowable value is simply 250 ms, which is half of 500 ms, FIG. In the range of the number of streams that can be processed by 10, the delay is equal to or less than this value. However, in the case of a cascade configuration, all of the 720p streams exceed 250 ms. Even in the case of a cascade configuration, it is considered that there is no problem in the exchange between the video photographer at the relay source and the mixer operator at the preceding stage, but in order to take timing between the video photographer at the relay source and the mixer operator at the subsequent stage, Requires a device to reduce the delay. In the prototype system, buffering is performed in a ring buffer (2/30 sec. For video and 2/25 sec. For audio) in order to absorb temporal fluctuations. / 25sec. (= 160ms) delay occurs. In order to suppress the one-way delay to within 250 ms, data processing between ends of one video frame (including corresponding audio data) must be performed within 90 ms on average. Considering that the experimental environment is an environment in which the delay of the network 200 can be almost ignored, it is desirable that the delay be suppressed as much as possible. As described above, in the prototype system, the parallel processing of the processing is enhanced by dividing the mixing processing in the relay stream node (rly) and the mixing stream node (mix), which are the inputs of the mixer terminal 10, into different threads. There is room for further study to reduce the delay.

評価実験の結果を踏まえ、ライブ配信ソフトウェア(非特許文献12〜14)、および専用機器として比較的入手しやすいAVミキサ(非特許文献9参照)とその上位機種(非特許文献11参照)の機能を参照し、本実施の形態に係るシステムの機能的な考察を以下に述べる。   Based on the results of the evaluation experiment, the functions of live distribution software (Non-patent Documents 12 to 14), AV mixers (see Non-Patent Document 9), which are relatively easily available as dedicated equipment, and higher-level models (see Non-Patent Document 11) The functional considerations of the system according to the present embodiment will be described below with reference to FIG.

<入力の動的な追加/削除機能と入力数>
本実施の形態に係るミキサ装置(ミキサ端末10)において実現した、ミキサへの入力となるビデオソースの動的な追加/削除機能は、既存のライブ配信ソフトウェアや専用機器では実現されておらず、本実施の形態に係るシステムにおける機能の新規性を示すものである。入力として扱えるビデオソースの数は、ライブ配信ソフトウェアではPCの構成や性能および利用するビデオとオーディオのフォーマットに依存する一方、参照した専用機器では4系統のビデオ入力を扱え、その他の専用機器における主流は4系統または8系統である。プロトタイプシステムの評価結果から、本実施の形態に係るシステムでは720pの場合で7入力、360pでは少なくとも10入力のミキシング処理が可能であることを示した。プロトタイプシステムは、ビデオソースの動的な追加/削除に対応し、既存の専用機器と同等の入力数を処理することができる。また、ソフトウェアとしてミキサ装置を実現しているので、必要に応じて高性能なPCを使用することにより、操作や設定の大きな変更無しに処理可能な入力数を増やすことも可能である。これは、入力数が固定である専用機器に対し、ソフトウェアとして動作するミキサ装置の利点である。
<Dynamic addition / deletion function of input and number of inputs>
The function of dynamically adding / deleting a video source to be input to the mixer, realized in the mixer device (mixer terminal 10) according to the present embodiment, is not realized by existing live distribution software or dedicated equipment. It shows the novelty of the function in the system according to the present embodiment. The number of video sources that can be handled as inputs depends on the configuration and performance of the PC in live distribution software and the video and audio formats used. Are four or eight systems. From the evaluation results of the prototype system, it was shown that the system according to the present embodiment can perform mixing processing of 7 inputs at 720p and at least 10 inputs at 360p. The prototype system supports dynamic addition / deletion of video sources and can process as many inputs as existing dedicated devices. In addition, since the mixer device is realized as software, it is possible to increase the number of inputs that can be processed without a large change in operation and settings by using a high-performance PC as necessary. This is an advantage of a mixer device that operates as software for a dedicated device having a fixed number of inputs.

<カスケードミキサの動的構成機能>
専用機器をカスケード接続し、カスケードミキサとして利用することは以前より可能であるが、物理的にケーブルを用いた接続が必要であり、比較的広い範囲を想定するとカスケード接続は困難である。専用機器のミキサ機能とライブ配信ソフトウェアのミキサ機能を組み合わせて、予め物理的または論理的にカスケードミキサを構成することも可能である。しかし、ネットワーク200経由でミキサを動的に追加/削除できる機能は、ライブ配信ソフトウェアや専用機器では実現されていない。対象としている複数の会場で同時に実施されるスポーツイベントや、神輿/山車/踊り手等が長い列を作る祭りのライブ中継を容易に実現することを考慮した場合、複数の送信端末20とミキサ端末10を1つの送信グループとして扱い、それを動的に追加/削除できる機能は実用性がある。
<Dynamic configuration function of cascade mixer>
Although it is possible to cascade dedicated equipment and use it as a cascade mixer, connection using a cable is physically required, and cascade connection is difficult if a relatively wide range is assumed. By combining the mixer function of the dedicated device and the mixer function of the live distribution software, a cascade mixer can be physically or logically configured in advance. However, the function of dynamically adding / deleting mixers via the network 200 is not realized by live distribution software or dedicated equipment. Considering that it is easy to perform live broadcasting of sporting events held simultaneously at a plurality of target venues and festivals in which a portable shrine, floats, dancers, and the like form a long line, a plurality of transmission terminals 20 and mixer terminals are considered. The function of treating 10 as one transmission group and dynamically adding / deleting it is practical.

<既存ストリーミングサービスを利用した配信機能>
ライブ配信ソフトウェアは、既存のストリーミングサービスを利用した配信機能を搭載している。専用機器を用いる場合は、通常、専用機器をPCへ接続し、ライブ配信ソフトウェアを用いて既存のストリーミングサービスを利用する。通常、既存のストリーミングサービスを利用するためには、そのサービスに適合しているライブ配信ソフトウェアを用いる。本実施の形態に係るミキサ装置(ミキサ端末10)は、ミキシング処理後のデータをプロセス間通信により既存のライブ配信ソフトウェアへ渡す機能を実現した。プロトタイプシステムではMicrosoft (登録商標)Expression Encoder 4の入力として利用可能なDirectShowのソースフィルタを実装し、接続できることを確認した。同様の仕組みにより、ビデオカメラやマイクロフォン用のデバイスドライバとしてソフトウェアモジュールを実装することで、Microsoft (登録商標)Expression Encoder 4以外の既存システムへもビデオとオーディオデータを渡すことは可能である。実装したプロトタイプシステムにより、その実現可能性を確認できた。様々な既存のライブ配信ソフトウェアから見て、本システムの出力がビデオカメラとマイクロフォンとして扱える機能の実装を今後も継続して行う。
<Distribution function using existing streaming service>
Live distribution software has a distribution function that uses existing streaming services. When using a dedicated device, usually, the dedicated device is connected to a PC, and an existing streaming service is used using live distribution software. Usually, to use an existing streaming service, live distribution software adapted to the service is used. The mixer device (mixer terminal 10) according to the present embodiment has realized a function of transferring data after mixing processing to existing live distribution software by inter-process communication. The prototype system has implemented a DirectShow source filter that can be used as an input for Microsoft® Expression Encoder 4 and confirmed that it can be connected. By implementing a software module as a device driver for a video camera or microphone by a similar mechanism, it is possible to transfer video and audio data to an existing system other than Microsoft® Expression Encoder 4. The feasibility was confirmed by the implemented prototype system. From the viewpoint of various existing live distribution software, we will continue to implement the function that can handle the output of this system as a video camera and microphone.

本実施の形態に係るミキサ装置は、複数のビデオソースを扱うライブ中継を支援するために必要となる機能を備え、複数ビデオソースの動的な構成を可能とする。ライブ中継システムの要件としては、(1)ミキサへの入力となるビデオソースの数の動的な増減に対応できること、(2)ミキサのカスケード構成が可能であること、(3)ビデオソースからミキサまでの遅延がタイミングをとれる程度に小さいことが挙げられる。これらの要件を満たすためには、送信側の端末が任意の時間に送信するストリームを自動的にミキサ端末10の入力とする機能と、その機能をミキサ装置間でも利用できる仕組みが必要となる。そこで、ミキサ端末10はソースグループを設定し、送信端末20はそのソースグループに参加した上でストリーム送信を行うためのプロトコルを設計・実装した。ソースグループに参加している送信端末20からのストリームは、ミキサ端末10へ自動的に中継されプレビュー表示される。ミキサ操作者は必要に応じて自動的に中継されるビデオソースに対してミキシング操作をすることが可能となる。また、既存のライブ配信ソフトウェアを利用してミキシング処理後のストリームを配信するための仕組みも実装した。そしてプロトタイプシステムを用いた評価実験では、単一構成とカスケード構成のミキサ装置に対してビデオソースの動的な追加/機能を確認するとともに、既存の専用機器と同程度の入力数を処理できることを確認した。送信端末20とミキサ端末10との間の遅延については、実装上の検討の余地も残るが、機能的な要件を満たすミキサ装置をPC上で実現できる。   The mixer device according to the present embodiment includes a function necessary to support live broadcasting that handles a plurality of video sources, and enables a dynamic configuration of a plurality of video sources. The requirements for a live relay system include (1) the ability to dynamically increase and decrease the number of video sources input to the mixer, (2) a cascade configuration of the mixers, and (3) the mixer from the video sources. Is small enough to take timing. In order to satisfy these requirements, it is necessary to have a function of automatically inputting a stream transmitted by the transmitting terminal at an arbitrary time to the mixer terminal 10 and a mechanism capable of using the function between the mixer devices. Thus, the mixer terminal 10 sets a source group, and the transmission terminal 20 designs and implements a protocol for performing stream transmission after joining the source group. The stream from the transmitting terminal 20 participating in the source group is automatically relayed to the mixer terminal 10 and is previewed. The mixer operator can perform a mixing operation on the automatically relayed video source as needed. In addition, a mechanism for distributing the stream after mixing using existing live distribution software has been implemented. In evaluation experiments using a prototype system, it was confirmed that dynamic addition / functionality of video sources could be confirmed for single and cascaded mixer devices, and that the same number of inputs as existing dedicated devices could be processed. confirmed. The delay between the transmission terminal 20 and the mixer terminal 10 leaves room for consideration in implementation, but a mixer device that satisfies functional requirements can be realized on a PC.

次に第2の実施の形態に係るミキサ装置及びそれを用いたライブ中継システムについて説明する。この第2の実施の形態に係るミキサ装置は、ネットワーク(バックエンド)中に配置されるミキサ部を操作部にて遠隔操作する構成となる。   Next, a mixer device according to a second embodiment and a live relay system using the same will be described. The mixer device according to the second embodiment has a configuration in which a mixer unit arranged in a network (back end) is remotely operated by an operation unit.

本発明の第2の実施の形態に係るライブ中継システムは、パブリックビューイング用の第1の構成例と、プライベートビューイング用の第2の構成例の2種類に分けられ、それぞれのシステム構成の概要が図22と図23に示される。図22及び図23において、各システムは、中継元の送信端末20(S)、ネットワーク200内のバックエンドにおいてミキシング処理を行うミキササーバ10(M:オンデマンド型ミキサ(ミキサ装置))、及びそのミキササーバ10(M)を利用する利用者端末80(U:操作装置)を有している。そして、送信端末20(S)、ミキササーバ10(M)および利用者端末80(U)の間におけるストリームデータ(ビデオ、オーディオ)とメッセージの中継を、中継サーバ50(R:制御装置)が行う。中継されるメッセージには、各端末20、80やミキササーバ10でやりとりされる制御情報と、ミキササーバ10の遠隔操作コマンドが含まれる。また中継サーバ50は、負荷分散を考慮して適切なミキササーバ10を利用者端末80(U)へ割り当てたり、利用者端末80(U)とミキササーバ10(M)との間における遠隔操作コマンドを転送したりする。   The live relay system according to the second embodiment of the present invention is divided into two types, a first configuration example for public viewing and a second configuration example for private viewing. An overview is shown in FIGS. 22 and 23, each system includes a transmission terminal 20 (S) as a relay source, a mixer server 10 (M: on-demand type mixer (mixer device)) that performs mixing processing at a back end in a network 200, and It has a user terminal 80 (U: operating device) that uses the mixer server 10 (M). The relay server 50 (R: control device) relays the stream data (video and audio) and the message between the transmission terminal 20 (S), the mixer server 10 (M), and the user terminal 80 (U). . The relayed message includes control information exchanged between the terminals 20 and 80 and the mixer server 10, and a remote operation command of the mixer server 10. In addition, the relay server 50 allocates an appropriate mixer server 10 to the user terminal 80 (U) in consideration of load distribution, or executes a remote operation command between the user terminal 80 (U) and the mixer server 10 (M). Or transfer.

図22で示すシステム構成は、パブリックビューイング用のものであり、最終的には既存のライブ中継用サービスサイト60を利用して多くの視聴者へのライブビデオ中継を想定した構成である。図22の利用者端末80(操作部)は、ミキササーバ10内で動作するミキシング処理機能(ミキサ部)を遠隔から操作する。ミキササーバ10を利用する際、利用者端末80は、ソースグループSGP(Source Group)を設定し(ソースグループ設定手段)、送信端末20はそのソースグループに参加する。送信端末20が中継を開始すると、送信端末20からのビデオが自動的にミキササーバ10の入力として扱われ、ミキササーバ10の出力は中継サーバ50経由で利用者端末80と送信端末20へ送信される(出力制御手段)。また、利用者端末80におけるミキシング後のビデオストリームは、エンコーダ85(E)へ渡され、エンコーダ85(E)からライブ中継用サービスサイト60を利用して複数の端末30(P)に配信される。そして、各端末30から出力されるビデオが視聴者によって視聴される。このパブリックビューイング用のシステムでは、図22におけるエンコーダ85として汎用PCが利用され、エンコーダ85以降の中継には、既存のライブ中継用ソフトウェア(非特許文献15〜17参照)の適用を想定している。   The system configuration shown in FIG. 22 is for public viewing, and is a configuration that ultimately assumes live video relay to many viewers using the existing live relay service site 60. The user terminal 80 (operation unit) in FIG. 22 remotely operates a mixing processing function (mixer unit) that operates in the mixer server 10. When using the mixer server 10, the user terminal 80 sets a source group SGP (Source Group) (source group setting means), and the transmitting terminal 20 participates in the source group. When the transmission terminal 20 starts relaying, the video from the transmission terminal 20 is automatically treated as an input of the mixer server 10, and the output of the mixer server 10 is transmitted to the user terminal 80 and the transmission terminal 20 via the relay server 50. (Output control means). The video stream after mixing in the user terminal 80 is passed to the encoder 85 (E), and is distributed from the encoder 85 (E) to the plurality of terminals 30 (P) using the live relay service site 60. . Then, the video output from each terminal 30 is viewed by the viewer. In this system for public viewing, a general-purpose PC is used as the encoder 85 in FIG. 22, and it is assumed that existing live relay software (see Non-Patent Documents 15 to 17) is applied to the relay after the encoder 85. I have.

一方、図23に示すシステ構成はプライベートビューイング用を想定したものであり、複数の送信端末20からのビデオストリームを、利用者端末80(操作装置)毎のミキササーバ10(ミキサ装置)で処理している。同じソースグループSGPに参加している複数の送信端末20からのビデオを、中継サーバ50が各ミキササーバ10へ分配する。各ミキササーバ10では、利用者毎に独立したミキシング処理を実行し、その出力結果をそれぞれの利用者端末80へ送信する(出力制御手段)。この場合、送信端末20から見ると複数のミキササーバ10の出力結果に、自身が送信しているビデオストリームが含まれている可能性がある。そこで、送信端末20側では任意のミキササーバ10の出力結果を選択的に受信して確認する。   On the other hand, the system configuration shown in FIG. 23 is intended for private viewing, and processes video streams from a plurality of transmission terminals 20 in the mixer server 10 (mixer device) for each user terminal 80 (operation device). are doing. The relay server 50 distributes the videos from the plurality of transmitting terminals 20 participating in the same source group SGP to the respective mixer servers 10. Each mixer server 10 executes an independent mixing process for each user and transmits the output result to each user terminal 80 (output control means). In this case, from the viewpoint of the transmission terminal 20, there is a possibility that the output results of the plurality of mixer servers 10 include the video stream transmitted by themselves. Therefore, the transmitting terminal 20 selectively receives and confirms the output result of any mixer server 10.

図22および図23のどちらの構成においても、バックエンド(ネットワーク200内)のミキササーバ10を利用する際には利用者端末80がソースグループSGPを設定し、送信端末20はそのソースグループSGPに参加する。遠隔地からのビデオストリームを容易にミキササーバ10の入力として扱うためには、送信端末20から任意の時間に送信されるビデオストリームを自動的に処理できる必要がある。次に、ソースグループSGPの設定とミキササーバ10の選択に必要となるメッセージフローを示す。   In both configurations of FIGS. 22 and 23, when using the mixer server 10 on the back end (within the network 200), the user terminal 80 sets the source group SGP, and the transmission terminal 20 sets the source group SGP to the source group SGP. participate. In order to easily handle a video stream from a remote location as an input to the mixer server 10, it is necessary to be able to automatically process a video stream transmitted at an arbitrary time from the transmission terminal 20. Next, a message flow required for setting the source group SGP and selecting the mixer server 10 will be described.

利用者端末80(操作部)がオンデマンドでミキササーバ10の機能(ミキサ部)を利用する際は、ソースグループSGPを設定する一方、中継サーバ50はミキシング処理の負荷分散も行う。図24はそのメッセージフローを示している。   When the user terminal 80 (operation unit) uses the function (mixer unit) of the mixer server 10 on demand, the source server sets the source group SGP, and the relay server 50 also distributes the load of the mixing process. FIG. 24 shows the message flow.

図24において、まず、利用者端末80(U)はソースグループ登録要求メッセージ(Register Source Group Request)を中継サーバ50(R)へ送る(1:ソースグループ設定手段)。その際、ソースグループプロパティ(ソースグループに関する情報)を中継サーバ50へ送信する。このソースグループプロパティは、ソースグループSGPの説明や利用するミキサ部のフォーマット情報を含んでおり、送信端末20がソースグループSGPへ参加する際に参照することができる。また、ソースグループプロパティには、必要に応じて、そのソースグループSGPに参加できる送信端末20側の利用者IDを含めることもできる。次に中継サーバ50は、利用可能な複数のミキササーバ10へ資源状態要求メッセージ(Resource Status Request)を送信し(2)、その応答メッセージ(Resource Status Response)を受ける。応答メッセージ(Response)にはミキササーバ10の資源利用状況(CPU利用率、ストリーム入出力スループット等)が含まれており、中継サーバ50はその資源利用状況に基づいて適切なミキササーバ10を選択する。中継サーバ50は選択したミキササーバ10上に新しいミキサ部を生成した後、利用者端末80へソースグループ登録応答メッセージ(Register Source Group Response)を送り返す(3)。   In FIG. 24, first, the user terminal 80 (U) sends a source group registration request message (Register Source Group Request) to the relay server 50 (R) (1: source group setting means). At this time, a source group property (information about the source group) is transmitted to the relay server 50. The source group property includes a description of the source group SGP and format information of a mixer unit to be used, and can be referred to when the transmitting terminal 20 participates in the source group SGP. In addition, the source group property may include a user ID of the transmitting terminal 20 that can participate in the source group SGP, if necessary. Next, the relay server 50 transmits a resource status request message (Resource Status Request) to the plurality of available mixer servers 10 (2), and receives the response message (Resource Status Response). The response message (Response) includes the resource usage status of the mixer server 10 (CPU utilization, stream input / output throughput, etc.), and the relay server 50 selects an appropriate mixer server 10 based on the resource usage status. . After generating a new mixer unit on the selected mixer server 10, the relay server 50 sends back a source group registration response message (Register Source Group Response) to the user terminal 80 (3).

送信端末20はソースグループプロパティ要求メッセージ(Source Group Property Request)およびその応答メッセージ(Response)により、登録されているソースグループプロパティのリストを中継サーバ50から取得する(4)。送信端末20は、例えば、操作部での操作に従って、参加すべきソースグループSGPを選び、中継サーバ50を経由して、ソースグループ参加要求メッセージ(Join Source Group Request)を利用者端末80に送り(ソースグループ参加要求制御手段)、利用者端末80からその応答メッセージ(Response)を受信する(5)。これにより、送信端末20は、ビデオストリーム及びオーディオストリームを送信することが可能となる。そして、送信端末20は、ビデオストリームまたはオーディオストリームを送信する際には、ソースグループSGPを設定した利用者端末80に対してソースノード追加要求メッセージ(Add Source Node Request)を送り、ミキサ部からの入力が追加されることを利用者端末80に伝える(6)。   The transmitting terminal 20 acquires a list of registered source group properties from the relay server 50 by using a source group property request message (Source Group Property Request) and its response message (Response) (4). The transmission terminal 20 selects, for example, a source group SGP to join according to an operation on the operation unit, and sends a source group participation request message (Join Source Group Request) to the user terminal 80 via the relay server 50 ( The source group participation request control means) receives the response message (Response) from the user terminal 80 (5). Thereby, the transmission terminal 20 can transmit the video stream and the audio stream. Then, when transmitting the video stream or the audio stream, the transmission terminal 20 sends a source node addition request message (Add Source Node Request) to the user terminal 80 that has set the source group SGP, and The user terminal 80 is notified that the input is added (6).

なお、ライブ中継の開始時には、中継サーバ50が負荷分散を考慮してミキササーバ10を選択するが、ここではそのアルゴリズム自体は定めない。一方、後述するプロトタイプシステムではミキササーバ10として汎用PCを用いており、ミキシングとエンコード処理に対して多くのCPU資源を必要とするので、CPU利用率の移動平均値を用いてミキササーバ10の選択を行っている。   At the start of live relay, the relay server 50 selects the mixer server 10 in consideration of load distribution, but the algorithm itself is not defined here. On the other hand, in a prototype system described later, a general-purpose PC is used as the mixer server 10, and a large amount of CPU resources are required for mixing and encoding processing. Therefore, the selection of the mixer server 10 using the moving average of the CPU utilization rate is performed. It is carried out.

また、図24には示されていないが、送信端末20が、ソースグループSGPから退出する際は、送信端末20から中継サーバ50経由で利用者端末80へ、ソースグループ退出要求メッセージ(Leave Source Group Request)を送る(ソースグループ退出要求制御手段)。利用者端末80は、送信端末20の退出による終了処理を行い、送信端末20へ中継サーバ50経由でソースグループ退出応答メッセージ(Leave Source Group Response)を送り返す。   Although not shown in FIG. 24, when the transmitting terminal 20 leaves the source group SGP, a source group leaving request message (Leave Source Group) is transmitted from the transmitting terminal 20 to the user terminal 80 via the relay server 50. Request) (source group leaving request control means). The user terminal 80 performs a termination process when the transmitting terminal 20 leaves, and returns a source group leaving response message (Leave Source Group Response) to the transmitting terminal 20 via the relay server 50.

更に、ライブ中継を終了する等、利用者端末80がソースグループSGPを必要としなくなった場合、利用者端末80は、ソースグループ登録解除要求メッセージ(Unregister Source Group Request)を中継サーバ50に送る。中継サーバ50は、ソースグループSGPの登録解除処理を行い、ソースグループ登録解除応答メッセージ(Unregister Source Group Response)を利用端末80に送る。また、中継サーバ50は、ミキササーバ10の利用者端末80への割り当てを解放する。   Further, when the user terminal 80 no longer needs the source group SGP, for example, by ending the live relay, the user terminal 80 sends a source group registration release request message (Unregister Source Group Request) to the relay server 50. The relay server 50 performs registration cancellation processing of the source group SGP, and sends a source group registration cancellation response message (Unregister Source Group Response) to the use terminal 80. The relay server 50 releases the assignment of the mixer server 10 to the user terminal 80.

前述したように送信装置20が利用者端末80からの参加許可の応答メッセージを受信してソースグループSGPへ参加すると、利用者端末80は、その送信装置20を当該ソースグループSGPに参加するストリームの送信元として許容し、ミキササーバ10は、利用者端末80の遠隔操作に従って、該ソースグループSGPに参加する複数の送信端末20からの複数のストリームをミキシング処理する(グループミキシング処理手段)。一方、利用者端末80は、送信装置20からのソースグループ退出要求メッセージ(Leave Source Group Request)を受信すると、その送信端末20へソースグループ退出応答メッセージ(Leave Source Group Response)を送り返し、その送信装置20をミキササーバ10でのミキシング処理の対象となるストリームの送信元から外す(ミキシング退出制御手段)。   As described above, when the transmitting device 20 receives the participation permission response message from the user terminal 80 and participates in the source group SGP, the user terminal 80 transmits the transmitting device 20 to the stream of the source group SGP. The mixer server 10 accepts as a transmission source, and performs a mixing process on a plurality of streams from a plurality of transmission terminals 20 participating in the source group SGP according to a remote operation of the user terminal 80 (group mixing processing means). On the other hand, upon receiving the source group leaving request message (Leave Source Group Request) from the transmitting device 20, the user terminal 80 sends back a source group leaving response message (Leave Source Group Response) to the transmitting terminal 20, and the transmitting device 20 is removed from the source of the stream to be subjected to the mixing process in the mixer server 10 (mixing exit control means).

前述したように送信端末20がソースグループSGPに参加した際において、図24に示すメッセージフローに合わせて、ビデオストリームやオーディオストリームを処理するためのストリームノードを各端末間で接続する。図25と図26は、その接続パターンを示している。図25に示す接続パターンは、図22に示すパブリックビューイングを想定したシステムに対応しており、図26に示す接続パターンは、図23に示すプライベートビューイングを想定したシステムに対応している。図25および図26において、Aに含まれるストリームノード(利用者端末80のシンクストリームノードsnk、中継サーバ50の中継ストリームノードrly、ミキササーバ10のミキサストリームノードmix)は、図24に示すフローにおいて、ソースグループ登録要求メッセージ(Register Source Group Request)の応答メッセージ(Response)を利用者端末80が受信した後に接続される。Bに含まれるストリームノード(送信端末20のシンクストリームノードsnk、中継サーバ50の中継ストリームノードrly)(図26では省略)は、送信端末20がソースグループ参加要求メッセージ(Join Source Group Request)の応答メッセージ(Response)を受信した後に必要に応じて接続される。また、送信端末20がビデオストリーム送信を開始する場合、送信端末20がソースノード追加要求メッセージ(Add Source Node Request)の応答メッセージ(Response)を受信した後にCに含まれるストリームノード(送信端末20のソースストリームノードsrc、中継サーバ50の中継ストリームノードrly、ミキササーバ10の中継ストリームノードrly)が接続される。   As described above, when the transmitting terminal 20 participates in the source group SGP, a stream node for processing a video stream or an audio stream is connected between the terminals according to the message flow shown in FIG. FIG. 25 and FIG. 26 show the connection patterns. The connection pattern shown in FIG. 25 corresponds to the system assuming public viewing shown in FIG. 22, and the connection pattern shown in FIG. 26 corresponds to the system assuming private viewing shown in FIG. 25 and 26, the stream nodes included in A (the sink stream node snk of the user terminal 80, the relay stream node rly of the relay server 50, and the mixer stream node mix of the mixer server 10) are included in the flow illustrated in FIG. The connection is made after the user terminal 80 receives the response message (Response) of the source group registration request message (Register Source Group Request). The stream node (sink stream node snk of the transmitting terminal 20 and relay stream node rly of the relay server 50) included in B (omitted in FIG. 26) is a response from the transmitting terminal 20 to the source group join request message (Join Source Group Request). Connected as necessary after receiving the message (Response). In addition, when the transmitting terminal 20 starts video stream transmission, after the transmitting terminal 20 receives the response message (Response) of the source node addition request message (Add Source Node Request), the stream node included in C (of the transmitting terminal 20) The source stream node src, the relay stream node rly of the relay server 50, and the relay stream node rly of the mixer server 10 are connected.

ここで、送信端末20からの同一ビデオストリームが複数のミキサ部(mix)の入力に成り得ることを想定すると、そのストリームの中継は効率よく行われるべきである。図26は、3台の利用者端末80が、2台のミキササーバ10に生成される独立した3つのミキサ部(ミキサストリームノードmix)を利用している例を示している。図26に示すように、第2の実施の形態に係るシステム(プライベートビューイング用のシステム)では、ミキサーストリームノード(mix)の入力となるストリームをミキササーバ10が既に受信している場合、同一ストリームを入力とする異なるミキサーストリームノード(mix)に対しては、ミキササーバ10内でストリームが分配される。   Here, assuming that the same video stream from the transmission terminal 20 can be input to a plurality of mixer units (mixes), the stream should be efficiently relayed. FIG. 26 shows an example in which three user terminals 80 use three independent mixer units (mixer stream nodes mix) generated in two mixer servers 10. As shown in FIG. 26, in the system according to the second embodiment (a system for private viewing), when the mixer server 10 has already received a stream to be input to the mixer stream node (mix), the same Streams are distributed in the mixer server 10 to different mixer stream nodes (mixes) that receive streams.

利用者端末80におけるミキサ部(ミキサストリームノードmix)に対する操作としては、パブリックビューイングやプライベートビューイング等、用途に応じて選択可能な操作機能を実現する。パブリックビューイングのシステム(図22、図25参照)では、予め決められた中継元からのビデオをそのシーンに応じてミキシングする際、プリセットされたレイアウトを用いることが多い。多くの視聴者がいることを想定し、どの入力をどのタイミングで出力するかを決めるのはミキサ操作者となる。そこで、プリセット可能なレイアウトの機能を各種のGUIコンポーネントで実現する。一方、プライベートビューイングのシステム(図23、図26参照)で任意のビデオストリームを視聴する際は、より直感的な操作が必要である。前述したように、スポーツイベントやコンサートに集まる観客のスマートデバイスもミキサ部(mix)の入力として考慮すると、ミキサ部(mix)の入力は任意の時間に生成され、任意の時間に終了することが想定される。したがって、プリセット可能なレイアウトの切り替え機能等よりも、ビューワ上に表示されているビデオに対するミキシングをマウスやタッチ操作で行えることが有用である。   As an operation on the mixer section (mixer stream node mix) in the user terminal 80, an operation function such as public viewing or private viewing that can be selected according to the intended use is realized. In a public viewing system (see FIGS. 22 and 25), a preset layout is often used when mixing video from a predetermined relay source according to the scene. Assuming that there are many viewers, it is up to the mixer operator to decide which input to output and at what timing. Therefore, the preset layout function is realized by various GUI components. On the other hand, when viewing an arbitrary video stream in a private viewing system (see FIGS. 23 and 26), a more intuitive operation is required. As described above, when smart devices of spectators gathering at a sporting event or concert are also considered as inputs of the mixer unit (mix), the input of the mixer unit (mix) is generated at an arbitrary time and may end at an arbitrary time. is assumed. Therefore, it is more useful to be able to mix the video displayed on the viewer with a mouse or a touch operation than with a layout switching function that can be preset.

こうした利用形態を考慮したミキサ部(mix)の遠隔操作機能を図27に示す。ミキササーバ10(M)内のミキサストリームノード(mix)では、前述した第1の実施の形態に係るシステムと同様に、ビデオをタイル状に配置可能なタイルビュー層(Tiled View Layer)と、縦/横に並べて配置するボックスビュー層(Box View Layer)の2つのレイヤーを持つミキシング機能(Layered Mixing Function)を実現する。タイルビュー層(Tiled View Layer)では、どのタイルにどの入力を表示させるか、および、タイルのサイズと位置を遠隔の利用者端末80での操作により変更できる。ボックスビュー層(Box View Layer)では、縦/横にビデオを並べたボックスのサイズと位置、ビデオの並び順、透明度を遠隔の利用者端末80での操作により変更できる。オーディオの音量も含めて、これらの操作を行うために利用者端末80は、操作者による操作に従ってミキサ制御コマンド(Mixer Control Commands)をミキササーバ10に送る。一方、ミキサ部(ミキサストリームノードmix)の入力が追加/削除されるタイミングでミキササーバ10は利用者端末80へミキサ更新レポート(Mixer Update Report)を送信する。ミキサ更新レポート(Mixer Update Report)には、追加/削除された中継ストリームノード(rly ミキサの入力)のノードID(Node ID)と、その中継ストリームノード(rly)の情報、および現在ミキサ部(mix)の入力として接続されている中継ストリームノード(rly)の情報の配列が含まれている。これにより、利用者端末80側でミキサ更新レポート(Mixer Update Report)を受信すると、追加/削除されたミキサ部(mix)の入力に対するGUIの追加/削除も可能となる。   FIG. 27 shows a remote control function of the mixer unit (mix) in consideration of such a use form. In the mixer stream node (mix) in the mixer server 10 (M), similarly to the system according to the above-described first embodiment, a tile view layer (Tiled View Layer) in which videos can be arranged in a tile, / A mixing function (Layered Mixing Function) having two layers of a box view layer arranged side by side is realized. In the tile view layer (Tiled View Layer), it is possible to change which input is displayed on which tile, and the size and position of the tile by operation on the remote user terminal 80. In the box view layer (Box View Layer), the size and position of boxes in which videos are arranged vertically and horizontally, the arrangement order of the videos, and the transparency can be changed by operating the remote user terminal 80. In order to perform these operations, including the volume of the audio, the user terminal 80 sends mixer control commands to the mixer server 10 according to the operation by the operator. On the other hand, the mixer server 10 transmits a mixer update report (Mixer Update Report) to the user terminal 80 at the time when the input of the mixer unit (mixer stream node mix) is added / deleted. The mixer update report (Mixer Update Report) includes the node ID (Node ID) of the added / deleted relay stream node (input of the rly mixer), information on the relay stream node (rly), and the current mixer section (mix). ) Includes an array of information of the relay stream nodes (rly) connected as inputs. Thereby, when the user terminal 80 receives the mixer update report (Mixer Update Report), it is also possible to add / delete the GUI for the input of the added / deleted mixer unit (mix).

以上、第2の実施の形態に係るミキサ装置(オンデマンド型ミキサ)の機能の概要を述べた。次に、プロトタイプシステムの実装について説明する。   The overview of the functions of the mixer device (on-demand type mixer) according to the second embodiment has been described above. Next, implementation of the prototype system will be described.

複数ビデオストリームの統合中継を可能とするオンデマンド型ミキサに対して、実機を用いた機能評価を行うため、汎用PC(OS: Windows(登録商標)7)上にプロトタイプシステムを実装した。メッセージ通信とGUIにはJava言語を用い、ストリーム処理にはC++言語を用いている。まず、遠隔ミキサの操作に関するメッセージや、図24で示したメッセージの送受信に対しては、テキストベースの簡単なメッセージ通信機能をTCP上に実装した。ビデオとオーディオのストリーム処理機能は、既存システム(非特許文献18参照)を改良して実現した。この既存システムにおけるストリーム処理機能には、複数の端末間でストリームノードを多段接続する機能が実装されているので、プロトタイプシステムでもその機能を使い、図25と図26に示したストリームノードの接続を実装した。一方、図27で示した遠隔操作可能なミキサ部の機能は 前記既存システムに含まれていないので新たに実装を行った。   A prototype system was installed on a general-purpose PC (OS: Windows (registered trademark) 7) to evaluate the functions of an on-demand mixer that enables integrated relay of multiple video streams using an actual device. Java language is used for message communication and GUI, and C ++ language is used for stream processing. First, a simple text-based message communication function was implemented on TCP for transmitting and receiving messages related to the operation of the remote mixer and the messages shown in FIG. The video and audio stream processing function is realized by improving an existing system (see Non-Patent Document 18). In the stream processing function of this existing system, a function of connecting the stream nodes among a plurality of terminals in a multi-stage manner is implemented. Therefore, the function is also used in the prototype system to connect the stream nodes shown in FIGS. 25 and 26. Implemented. On the other hand, the function of the mixer unit which can be remotely controlled shown in FIG. 27 is not included in the existing system, so that it was newly implemented.

<ミキサストリームノードの実装>
既存システム(非特許文献18参照)ではビデオとオーディオの処理にDirect Show(非特許文献19参照)を用いており、プロトタイプシステムにおける遠隔操作可能なミキサ部の機能もDirect Showをベースに実装した。Direct Showでは、ビデオフレームやオーディオサンプルデータの単位で処理を行うモジュールをフィルタと呼んでいる。通常は、一連の処理に必要なフィルタを1つのフィルタグラフ内で繋ぎ合せて利用する。
<Implementation of mixer stream node>
The existing system (see Non-Patent Document 18) uses Direct Show (see Non-Patent Document 19) for video and audio processing, and the function of a remotely controllable mixer unit in a prototype system is implemented based on Direct Show. In Direct Show, a module that processes video frames or audio sample data is called a filter. Normally, filters necessary for a series of processes are connected and used in one filter graph.

プロトタイプシステムでは、Direct Showのフィルタグラフを複数用いてミキサの機能を実装した。図28及び図29は、ミキササーバ10におけるフィルタグラフとフィルタの構成を示している。図28は、ビデオについてのフィルタグラフの構成を示しており、図29は、オーディオについてのフィルタグラフの構成を示している。   In the prototype system, the mixer function was implemented using multiple Direct Show filter graphs. FIG. 28 and FIG. 29 show the configuration of a filter graph and filters in the mixer server 10. FIG. 28 shows a configuration of a filter graph for video, and FIG. 29 shows a configuration of a filter graph for audio.

フィルタグラフのインタフェースを用いることで、フィルタグラフ内のフィルタの動作をまとめて操作(開始/停止/各種パラメータの設定と取得)することができる。しかし、ミキサ部への入力が動的に追加/削除されることを考慮すると、ミキサ部への入力処理とミキシング処理とは別々に機能させる必要がある。そこで、プロトタイプシステムでは、フィルタグラフを分けてミキサ部(mix)への入力処理(入力処理部)とミキシング処理(ミキシング処理部)を実装した。   By using the filter graph interface, the operations of the filters in the filter graph can be collectively operated (start / stop / setting and acquisition of various parameters). However, considering that the input to the mixer section is dynamically added / deleted, the input processing to the mixer section and the mixing processing need to function separately. Therefore, in the prototype system, input processing (input processing section) and mixing processing (mixing processing section) to the mixer section (mix) are implemented by dividing the filter graph.

図28に示すビデオに関する構成では、各中継ストリームノード(rly)に対応して構成される入力処理部15(フィルタグラフ)は、入力パケットをビデオデータ化するデパケタイザ(Depacketizer)151、ビデオデコーダ(Video Decoder)152及びビデオミキサへの入力データを出力するRGBミキサコネクタ(RGB Mixer Connector)153の各フィルタを有している。そして、ミキサストリームノード(ミキサ部:mix)に対応して構成されるビデオミキシング処理部16(フィルタグラフ)は、ビデオのミキシング処理を行うビデオミキサソース(Vide Miser Source)161、ビデオエンコーダ(Video Encoder)162及びビデオミキシングデータをパケット化するパケタイザ(Packetizer)163の各フィルタを有している。   In the configuration related to video illustrated in FIG. 28, the input processing unit 15 (filter graph) configured corresponding to each relay stream node (rly) includes a depacketizer 151 that converts an input packet into video data, a video decoder (Video). Decoder 152 and an RGB mixer connector 153 for outputting input data to the video mixer. The video mixing processing unit 16 (filter graph) configured corresponding to the mixer stream node (mixer unit: mix) includes a video mixer source (Vide Miser Source) 161 for performing video mixing processing, a video encoder (Video Encoder). ) 162 and a packetizer 163 for packetizing the video mixing data.

また、図29に示すオーディオに関する構成では、各中継ストリームノード(rly)に対応して構成される入力処理部17(フィルタグラフ)は、ビデオに関する構成(図28参照)と同様に、入力パケットをオーディオデータ化するデパケタイザ(Depacketizer)171、オーディオデコーダ(Audio Decoder)172及びオーディオミキサへの入力データを出力するPCMミキサコネクタ(PCM Mixer Connector)173の各フィルタを有している。そして、ミキサストリームノード(mix)に対応して構成されるオーディオミキシング処理部18(フィルタグラフ)は、オーディオのミキシング処理を行うオーディオミキサソース(Audio Mixer Source)181、オーディオエンコーダ1(Audio Encoder)82及びオーディオデータをパケット化するパケタイザ(Packetizer)183の各フィルタを有している。   Also, in the configuration related to audio shown in FIG. 29, the input processing unit 17 (filter graph) configured corresponding to each relay stream node (rly) converts the input packet into the same as the configuration related to video (see FIG. 28). It has filters of a depacketizer 171 for converting into audio data, an audio decoder 172, and a PCM mixer connector 173 for outputting input data to the audio mixer. The audio mixing processing unit 18 (filter graph) configured corresponding to the mixer stream node (mix) includes an audio mixer source (Audio Mixer Source) 181 and an audio encoder 1 (Audio Encoder) 82 that perform audio mixing processing. And a packetizer 183 for packetizing audio data.

更に、図28に示すビデオに関する構成において、異なるフィルタグラフ(入力処理部15とビデオミキシング処理部16)内のフィルタであるRGBミキサコネクタ(RGB Mixer Connector)153とビデオミキサソース(Video Mixer Source)161とを直接つなげるために、ビデオミキサソース(Vide Mixer Source)161内に独自のリングバッファ(Ring Buffer)165を設け、RGBミキサコネクタ(RGB Mixer Connector)153から直接そのリングバッファ(Ring Buffer)165にRGBデータを渡す仕組みを実装した。また、図29に示すオーディオに関する構成においても同様に、オーディオミキサソース(Audio Mixer Source)181内に独自のリングバッファ(Ring Buffer)185を設け、PCMミキサコネクタ(PCM Mixer Connector)173から直接そのリングバッファ(Ring Buffer)185にPCMデータを渡す仕組みを実装した。   Further, in the configuration related to video shown in FIG. 28, an RGB mixer connector (RGB Mixer Connector) 153 and a video mixer source (Video Mixer Source) 161 as filters in different filter graphs (input processing unit 15 and video mixing processing unit 16) are provided. In order to directly connect the ring buffer (Ring Buffer) 165 in the video mixer source (Vide Mixer Source) 161, a unique ring buffer (Ring Buffer) 165 is provided from the RGB mixer connector (RGB Mixer Connector) 153. Implemented a mechanism to pass RGB data. Similarly, in the configuration related to audio shown in FIG. 29, a unique ring buffer (Ring Buffer) 185 is provided in an audio mixer source (Audio Mixer Source) 181, and the ring is directly transmitted from a PCM mixer connector (PCM Mixer Connector) 173. A mechanism for passing PCM data to the buffer (Ring Buffer) 185 has been implemented.

また、プロトタイプで実装したミキシング処理部16、18では、ビデオデータはRGB(各8bit、24bit/pixel)に、オーディオデータはPCM(サンプリング周波数48kHz、量子化ビット数16bit)に統一したフォーマットが用いられる。ビデオミキサソース(Vide Mixer Source)161及びオーディオミキサソース(Audio Mixer Source)181の各フィルタがリングバッファ(Ring Buffer)165、185から入力データを取得する間隔は、デフォルトではビデオデータが1/30sec.、オーディオデータは1/25sec.としている。   In the mixing processing units 16 and 18 implemented as prototypes, the video data uses a unified format of RGB (8 bits, 24 bits / pixel) and the audio data uses PCM (sampling frequency of 48 kHz, quantization bit number of 16 bits). . By default, the interval at which the filters of the video mixer source (Vide Mixer Source) 161 and the audio mixer source (Audio Mixer Source) 181 acquire input data from the ring buffers (Ring Buffers) 165 and 185 is 1/30 sec. The audio data is 1/25 sec.

<ミキサ部の遠隔操作機能>
ミキサ部の遠隔操作機能としては、表2に示すメソッドを実装した。

Figure 0006651197
これらのメソッドは、図27で示した利用者端末80内のビューワとミキシング操作用GUIから呼ばれ、メソッドの中からミキササーバ10に対して操作コマンドが送信される。ここで、プロトタイプシステムのミキササーバ10では、利用者端末80が指定したピクセル解像度でのミキシング処理が行われる。その際の座標系をミキサ座標系とする。これに対し、利用者端末80における操作用GUIの座標系は異なる。図27で示したビューワおよびミキシング操作用GUIコンポーネントそれぞれのローカル座標系からミキサ座標系に座標変換した矩形情報を用いて、表2のメソッドを使うことによりビデオミキサを操作する。 <Remote control function of mixer section>
As a remote control function of the mixer unit, the methods shown in Table 2 were implemented.
Figure 0006651197
These methods are called from the viewer and the mixing operation GUI in the user terminal 80 shown in FIG. 27, and operation commands are transmitted to the mixer server 10 from the methods. Here, in the mixer server 10 of the prototype system, mixing processing is performed at the pixel resolution specified by the user terminal 80. The coordinate system at that time is referred to as a mixer coordinate system. On the other hand, the coordinate system of the operation GUI in the user terminal 80 is different. The video mixer is operated by using the methods shown in Table 2 using the rectangular information obtained by performing coordinate conversion from the local coordinate system of each of the viewer and the GUI component for mixing operation shown in FIG. 27 to the mixer coordinate system.

図30は、利用者端末80におけるビューワを示し、図31は、ミキシング操作用GUIのコンポーネントの画面を示す。図30に示すビューワ上では、マウスまたはタッチ操作により入力ビデオの配置を変更することができる。また、マウスの右ボタン押下または長押しによりプルダウンメニューを表示して各操作機能を使うことが可能である。図31にミキシング操作用のGUIにおいて示す操作コンポーネント81のGUIを用いてタイルビュー層(Tiled View Layer)の複数のレイアウトをプリセットしておきレイアウトの切り替えを行ったり、操作コンポーネント82のGUIを用いてボックスビュー層(Box View Layer)のビデオボックスの位置やボックス内のビデオのローテーション、透明度とサイズの調整を行ったりすることができる。また、操作コンポーネント83のGUIを用いてオーディオのボリューム調整用を行うことができる。   FIG. 30 shows a viewer of the user terminal 80, and FIG. 31 shows a screen of a GUI component for mixing operation. On the viewer shown in FIG. 30, the arrangement of the input video can be changed by a mouse or touch operation. In addition, each operation function can be used by displaying a pull-down menu by pressing or holding down the right button of the mouse. A plurality of layouts of the tile view layer (Tiled View Layer) are preset using the GUI of the operation component 81 shown in the GUI for the mixing operation in FIG. You can adjust the position of the video box in the Box View Layer, rotate the video in the box, and adjust the transparency and size. Further, audio volume adjustment can be performed using the GUI of the operation component 83.

上述したように実装したプロトタイプシステムを用いて、評価実験を行った。実験で用いた中継サーバ50とミキササーバ10のスペックは表3に示すとおりである。

Figure 0006651197
評価実験においては、専用機器として販売されているAVミキサのうち、比較的入手し易い機器(非特許文献20参照)と同程度の価格で入手可能なPCをミキササーバ10として利用した。送信端末20と利用者端末80としては、評価実験で利用するビデオとオーディオの処理に十分対応可能なPCを利用している。また、送信端末20における往復遅延の測定では、ネットワーク200内の遅延を考慮せずプロトタイプシステムとしての遅延を測定するため、図32(パブリックビューイング用を想定)及び図33(プライベートビューイングを想定)に示すように、ギガビットスイッチングハブ70に中継サーバ50、ミキササーバ10、送信端末20及び利用者端末80に相当する各PCを接続して実験を行った。 An evaluation experiment was performed using the prototype system implemented as described above. The specifications of the relay server 50 and the mixer server 10 used in the experiment are as shown in Table 3.
Figure 0006651197
In the evaluation experiment, among the AV mixers sold as dedicated equipment, a PC available at a price comparable to a relatively easily available equipment (see Non-Patent Document 20) was used as the mixer server 10. As the transmission terminal 20 and the user terminal 80, a PC capable of sufficiently processing video and audio used in an evaluation experiment is used. In the measurement of the round-trip delay in the transmitting terminal 20, since the delay as a prototype system is measured without considering the delay in the network 200, FIG. 32 (assuming for public viewing) and FIG. As shown in (), an experiment was performed by connecting each PC corresponding to the relay server 50, the mixer server 10, the transmission terminal 20, and the user terminal 80 to the gigabit switching hub 70.

送信端末20が送信するビデオストリームのフォーマットは、1080p(1920×1080pixel)、720p(1280×720pixel)、480p(854×480pixel)および360p(640×360pixel)の4種類を用い、フレームレートは全て30fpsとした。圧縮にはWMV(Windows Media Video)のCBR(Constant Bit Rate)を用い、フォーマット毎に、1080p:8Mbps、720p:4Mbps、480p:2Mbps、360p:1Mbpsの設定を利用している。オーディオストリームのフォーマットはPCM(チャンネル数:1、サンプリング周波数:44.1kHz、量子化ビット数:16bit、キャプチャ間隔:1/25sec.)を用いており、キャプチャしたPCMデータを圧縮せず705.6Kbpsのオーディオストリームとして利用した。   The format of the video stream transmitted by the transmitting terminal 20 uses four types of 1080p (1920 × 1080 pixels), 720p (1280 × 720 pixels), 480p (854 × 480 pixels) and 360p (640 × 360 pixels), and the frame rate is all 30 fps. And For compression, CBR (Constant Bit Rate) of WMV (Windows Media Video) is used, and settings of 1080p: 8 Mbps, 720p: 4 Mbps, 480p: 2 Mbps, and 360p: 1 Mbps are used for each format. The audio stream format uses PCM (number of channels: 1, sampling frequency: 44.1 kHz, number of quantization bits: 16 bits, capture interval: 1/25 sec.), And the captured PCM data is not compressed and is 705.6 Kbps audio. Used as a stream.

まず、プロトタイプシステムのミキササーバ10上で、開発したオンデマンド型ミキサの性能を評価するために、図32の評価実験環境を用いて実験を行った。実験では、利用者端末80(U1)とミキササーバ10(M1)および中継サーバ50(R)に対して、送信端末20(S1〜S12)を1台から12台まで追加した場合の、ミキササーバ10(M1)におけるCPU利用率と出力フレームレートを測定した。また、送信端末20(S1)が送信したビデオストリームがミキササーバ10(M1)によりミキシング処理され、送信端末20(S1)に戻って表示されるまでの往復遅延も合わせて測定した。実験では、まず利用者端末80(U1)が中継サーバ50(R)上に生成したソースグループSGPへ送信端末20(S1〜S12)が順番に参加し、各送信端末20はビデオストリームを送信する。次に、各送信端末20からのストリームを中継サーバ50(R)を経由してミキササーバ10(M1)が受信し、ミキササーバ10(M1)は利用者端末80(U1)からの遠隔操作を受けてミキシング処理を行う。実験では、ミキサ部の遠隔操作機能を用いて1つのビデオをタイルビュー層(Tiled View Layer)全体に配置し、その他のビデオはボックスビュー層(Box View Layer)内で横に並べて配置している(図30参照)。また、ソースグループSGPに参加している送信端末20(S1〜S12)および利用者端末80(U1)へ、ミキササーバ10(M1)におけるミキシング処理の出力を中継サーバ50(R)を経由して中継した。   First, an experiment was performed on the mixer server 10 of the prototype system using the evaluation experiment environment of FIG. 32 to evaluate the performance of the developed on-demand mixer. In the experiment, the mixer server in the case where 1 to 12 transmission terminals 20 (S1 to S12) are added to the user terminal 80 (U1), the mixer server 10 (M1), and the relay server 50 (R). The CPU utilization and output frame rate at 10 (M1) were measured. In addition, the video stream transmitted by the transmission terminal 20 (S1) was subjected to mixing processing by the mixer server 10 (M1), and the round trip delay until the video stream was returned to the transmission terminal 20 (S1) and displayed was also measured. In the experiment, first, the transmission terminals 20 (S1 to S12) sequentially participate in the source group SGP generated by the user terminal 80 (U1) on the relay server 50 (R), and each transmission terminal 20 transmits a video stream. . Next, the mixer server 10 (M1) receives the stream from each transmitting terminal 20 via the relay server 50 (R), and the mixer server 10 (M1) performs a remote operation from the user terminal 80 (U1). And perform mixing processing. In the experiment, one video was placed on the entire tiled view layer (Tiled View Layer) using the remote control function of the mixer section, and the other videos were placed side by side in the box view layer (Box View Layer). (See FIG. 30). Also, the output of the mixing process in the mixer server 10 (M1) is sent to the transmission terminal 20 (S1 to S12) and the user terminal 80 (U1) participating in the source group SGP via the relay server 50 (R). Relayed.

各送信端末20が順番にビデオストリームを送信し、ミキササーバ10(M1)の入力が増える毎に3分間、ミキササーバ10(M1)のCPU利用率と出力フレームレート、そして送信端末20(S1)とミキササーバ10(M1)との間の往復遅延を測定した。ミキササーバ10(M1)におけるCPU利用率の平均値をグラフにしたのが図34である。横軸は送信端末数を示している。図35は出力フレームレートの平均値を示しており、送信端末数毎の標準偏差の値も合わせて示す。同様に図36は往復遅延の平均値と標準偏差の値を示している。   Each transmitting terminal 20 transmits the video stream in order, and every time the input of the mixer server 10 (M1) increases, the CPU utilization and the output frame rate of the mixer server 10 (M1) and the transmitting terminal 20 (S1) are kept for 3 minutes. A round trip delay between the mixer server 10 and the mixer server 10 (M1) was measured. FIG. 34 is a graph of the average value of the CPU utilization rate in the mixer server 10 (M1). The horizontal axis indicates the number of transmitting terminals. FIG. 35 shows the average value of the output frame rate, and also shows the value of the standard deviation for each number of transmission terminals. Similarly, FIG. 36 shows the average value and the standard deviation value of the round trip delay.

ミキシング処理と入力数に応じて、ミキササーバ10(M1)では計算機及びネットワーク資源を消費する。プロトタイプシステムでは、まず、利用者端末80(U1)が中継サーバ50(R)を経由してミキササーバ10(M1)の利用を開始すると、ミキササーバ10(M1)にはミキサーストリームノード(mix)が生成される。ミキササーバ10(M1)は、ミキシングとエンコードおよびパケット化までの処理を1つのスレッドで行い、パケット化されたストリームデータは別の送信スレッドで中継サーバ50(R)へ送信する。その後、送信端末20が1台増える毎にミキササーバ10(M1)では2つのスレッドが生成される。1つはパケット受信用のスレッドであり、もう1つは中継ストリームノード(rly)におけるデパケット化とデコード処理を行うスレッドである。送信端末20の数が増える毎に、ミキササーバ10(M1)では、ネットワークI/O(受信)処理とスレッドの数、および単位時間当たりに処理すべきデータ量が増加する。これに応じてCPU利用率は増加し、出力フレームレートと往復遅延も変化する。   According to the mixing process and the number of inputs, the mixer server 10 (M1) consumes computer and network resources. In the prototype system, first, when the user terminal 80 (U1) starts using the mixer server 10 (M1) via the relay server 50 (R), the mixer server 10 (M1) has a mixer stream node (mix). Is generated. The mixer server 10 (M1) performs the processes from mixing, encoding, and packetization in one thread, and transmits the packetized stream data to the relay server 50 (R) in another transmission thread. After that, two threads are generated in the mixer server 10 (M1) each time the transmission terminal 20 increases by one. One is a thread for receiving packets, and the other is a thread for performing depacketization and decoding processing in the relay stream node (rly). Every time the number of transmission terminals 20 increases, the number of network I / O (reception) processes and threads, and the amount of data to be processed per unit time increase in the mixer server 10 (M1). Accordingly, the CPU utilization increases, and the output frame rate and the round trip delay also change.

ここで、ミキササーバ10(M1)における平均出力フレームレートが30.0fpsであることを、処理可能な入力数(送信端末1台をミキササーバ10(M1)における1入力とする)の条件とすると、1080pでは3入力、720pでは10入力、480pと360pの場合は12入力以上の入力を処理できたことが図35からわかる。720pの場合、11入力でも平均フレームレートは29.94fpsと、比較的高い値となっているが、グラフに示している標準偏差の値が示す通り10入力までに比べると11入力の場合のフレームレートは安定しない。一方、送信端末20(S1)における往復遅延(図36参照))を見ると、1080pでは1〜3入力に対して4入力の往復遅延は大きく増加しており、720pでも1〜10入力に対して11入力の往復遅延は明らかに増加している。ここで図34に示すCPU利用率を見ると、1080pの場合は3入力(約63%)から4入力(約75%)の間、720pの場合は10入力(約80%)から11入力(約94%)の間で、単位時間当たりに処理すべきデータを十分に処理できなくなったことが分かる。480pと360pの場合における処理可能な入力数については、12入力までの実験結果を示したが、その上限については、図34の結果をもとに後に考察としてまとめる。   Here, assuming that the average output frame rate in the mixer server 10 (M1) is 30.0 fps, as a condition of the number of inputs that can be processed (one transmission terminal is defined as one input in the mixer server 10 (M1)): It can be seen from FIG. 35 that three inputs could be processed in 1080p, ten inputs in 720p, and 12 or more inputs in 480p and 360p. In the case of 720p, the average frame rate is relatively high at 29.94 fps even with 11 inputs, but as shown by the standard deviation value shown in the graph, the frame rate in the case of 11 inputs compared to 10 inputs Is not stable. On the other hand, looking at the round trip delay at the transmitting terminal 20 (S1) (see FIG. 36), the round trip delay of 4 inputs greatly increases from 1 to 3 inputs at 1080p, and the round trip delay of 1 input to 1 to 10 inputs also increases at 720p. Thus, the round trip delay of 11 inputs is clearly increased. Looking at the CPU utilization rate shown in FIG. 34, in the case of 1080p, between 3 inputs (about 63%) and 4 inputs (about 75%), and in the case of 720p, 10 inputs (about 80%) to 11 inputs (about 80%) (About 94%), data to be processed per unit time cannot be sufficiently processed. Although the experimental results up to 12 inputs are shown for the number of inputs that can be processed in the case of 480p and 360p, the upper limit will be summarized later as a consideration based on the results of FIG.

一方、図37は利用者端末80(U1)からミキササーバ10(M1)を操作した際の応答遅延の測定結果を示している。応答遅延の評価実験では、利用者端末80(U1)のビューワ上に表示されている任意のビデオの配置場所をマウス操作により変更した。その変更処理を開始した時刻から、変更が利用者端末80(U1)のビューワ上に反映されるまでの時間を応答遅延としている。ミキササーバ10(M1)への入力を増やす毎に利用者端末80(U1)では配置場所の変更を10回行い、その応答遅延の平均と標準偏差を求めた。1080pに関しては、平均フレームが30.0fps未満となる4入力までの実験を行った。30fps(1フレーム約33ms)のビデオストリームを利用しているので、応答遅延の平均値から、360pと480pの場合はほぼ2フレーム(約67ms)以内でビューワに反映されたことが分かる。720pの場合9入力までは、ほぼ3フレーム(約100ms)以内でビューワに反映され、10入力でもほぼ4フレーム(約133ms)以内にはビューワへ反映された。同様に、1080pの場合2入力までは3フレーム前後、3入力では5フレーム(約167ms)前後でビューワへ反映されたことが分かる。また、720pと1080pにおいては、それぞれフレームレートが平均で30.0fps未満となる11入力と4入力の時点で応答遅延も大幅に増加する結果となった。   On the other hand, FIG. 37 shows a measurement result of a response delay when the mixer server 10 (M1) is operated from the user terminal 80 (U1). In the response delay evaluation experiment, the location of an arbitrary video displayed on the viewer of the user terminal 80 (U1) was changed by mouse operation. The time from the start of the change process to the time when the change is reflected on the viewer of the user terminal 80 (U1) is defined as the response delay. Each time the number of inputs to the mixer server 10 (M1) was increased, the user terminal 80 (U1) changed the arrangement location ten times, and obtained the average and standard deviation of the response delay. Regarding 1080p, an experiment was performed up to four inputs, in which the average frame was less than 30.0 fps. Since a video stream of 30 fps (one frame of about 33 ms) is used, it can be seen from the average value of the response delay that the case of 360p and 480p was reflected on the viewer within almost two frames (about 67 ms). In the case of 720p, up to 9 inputs were reflected on the viewer within approximately 3 frames (about 100 ms), and even 10 inputs were reflected on the viewer within approximately 4 frames (about 133 ms). Similarly, in the case of 1080p, it can be seen that up to two inputs are reflected on the viewer in about three frames, and three inputs are reflected on the viewer in about five frames (about 167 ms). In addition, in 720p and 1080p, the response delay significantly increased at the time of 11 inputs and 4 inputs at which the frame rate was less than 30.0 fps on average, respectively.

次に、複数のミキササーバ10を用いた場合の負荷分散機能を評価するために、図33に示す評価実験環境を用いて実験を行った。4台の送信端末20(S1〜S4)と4台のミキササーバ10(M1〜M4)に対して、12台の利用者端末80(U1〜U12)がそれぞれ個別のミキサ(プライベートミキサ)機能を利用した場合の、ミキササーバ10におけるCPU利用率を測定した。また、中継サーバ50(R)におけるビデオストリームの入出力スループットを測定し、図26で示したストリームの中継が行われていることも確認した。   Next, in order to evaluate the load distribution function when a plurality of mixer servers 10 are used, an experiment was performed using an evaluation experiment environment shown in FIG. For the four transmission terminals 20 (S1 to S4) and the four mixer servers 10 (M1 to M4), the twelve user terminals 80 (U1 to U12) have individual mixer (private mixer) functions. The CPU utilization of the mixer server 10 when used was measured. In addition, the input / output throughput of the video stream in the relay server 50 (R) was measured, and it was confirmed that the stream shown in FIG. 26 was relayed.

この実験では、利用者端末80毎に割り当てられたミキササーバ10内で、利用者端末80毎のミキサストリームノードが生成される。4台の送信端末20は、それぞれビデオストリームを中継サーバ50(R)を経由して各ミキササーバ10へ送信し、そのビデオストリームは各ミキササーバ10におけるミキサーストリームノード(mix)の入力となる。ここで、送信端末20がミキシング処理後のストリームを選択的に受信することは可能であるが、この実験ではミキシング後のストリームを送信端末20では受信していない。   In this experiment, a mixer stream node for each user terminal 80 is generated in the mixer server 10 assigned to each user terminal 80. Each of the four transmission terminals 20 transmits a video stream to each mixer server 10 via the relay server 50 (R), and the video stream is input to a mixer stream node (mix) in each mixer server 10. Here, it is possible for transmitting terminal 20 to selectively receive the stream after the mixing process, but in this experiment, transmitting terminal 20 does not receive the mixed stream.

図38〜図39は、中継サーバ50(R)における入出力スループットの測定結果を示している。上述した通り、ビデオストリームは1本につき、720p:4Mbps、480p:2Mbps、360p:1Mbpsのフォーマットを利用しており、オーディオストリームは1本につき705.6Kbpsのフォーマットを利用している。ビデオとオーディオストリームに必要となるビットレートを足した値が1組のストリームに必要なビットレートとなる。図38と図39は、測定結果(meas.)と合わせて、必要となるビットレートの計算値(calc.)も示している。   38 and 39 show the measurement results of the input / output throughput in the relay server 50 (R). As described above, each video stream uses a format of 720p: 4 Mbps, 480p: 2 Mbps, and 360p: 1 Mbps, and each audio stream uses a format of 705.6 Kbps. The value obtained by adding the bit rates required for the video and audio streams is the bit rate required for a set of streams. FIGS. 38 and 39 also show the calculated value (calc.) Of the required bit rate along with the measurement result (meas.).

利用者端末80(U1)がプライベートミキサの利用を開始すると、中継サーバ50(R)は、送信端末20(S1〜S4)からのストリームとミキササーバ10(U1)用のプライベートミキサからのストリーム、計5組のストリームを受信し、その後は利用者端末80が増えるたびに1組分のストリームを追加受信することになる。利用者端末80(U2)以降の利用者端末がプライベートミキサを利用しても、送信端末(S1〜S4)からのストリームの入力数に変化は無く、追加されたプライベートミキサからの入力が1組分増えるのみとなる。図38に示すグラフから、中継サーバ50(R)における入力スループットの測定値は、ほぼ計算値通り増加していることが確認できる。   When the user terminal 80 (U1) starts using the private mixer, the relay server 50 (R) transmits the stream from the transmitting terminal 20 (S1 to S4) and the stream from the private mixer for the mixer server 10 (U1). After receiving a total of five sets of streams, each time the number of user terminals 80 increases, one set of streams is additionally received. Even if the user terminals after the user terminal 80 (U2) use the private mixer, the number of stream inputs from the transmission terminals (S1 to S4) does not change, and one set of inputs from the added private mixer is provided. Only increase by minutes. From the graph shown in FIG. 38, it can be confirmed that the measured value of the input throughput in the relay server 50 (R) has increased almost as calculated.

一方、中継サーバ50(R)における出力スループットはミキササーバ10の数によって増加分が変わる。まず、利用者端末80(U1)がプライベートミキサの利用を開始すると、中継サーバ50(R)では送信端末20(S1〜S4)からのストリームを、そのプライベートミキサが動作しているミキササーバ10へ送信する。また、プライベートミキサの出力を受けて利用者端末80(U1)へ送信するので、計5組のストリームを送信することになる。この実験では、4台のミキササーバ10が用いられ、利用者端末20が増えるごとにCPU利用率の低いミキササーバ10でプライベートミキサを動作させている。したがって利用者端末80(U1〜U4)それぞれのプライベートミキサがミキササーバ10(M1〜M4)のいずれかで処理を開始するまでは、利用者端末80が増えるたびに5組分のストリーム送信処理が追加される。一方、各ミキササーバ10で送信端末20(S1〜S1)からのストリームを受信した後、利用者端末80が増えると、その利用者端末80用のプライベートミキサへの入力は、ミキササーバ10内で分配される。図39のグラフが示す通り、利用者端末80(U5)以降の利用者端末80の増加に対しては、ストリーム1組分の出力スループットが増えるのみとなる。これは図26で示したパターン通りにストリームの接続が行われたことを示している。また図38から、中継サーバ50(R)における出力スループットの測定値も、入力スループットと同様にほぼ計算値通り増加していることが確認できる。   On the other hand, the output throughput of the relay server 50 (R) varies depending on the number of the mixer servers 10. First, when the user terminal 80 (U1) starts using the private mixer, the relay server 50 (R) sends the stream from the transmitting terminal 20 (S1 to S4) to the mixer server 10 on which the private mixer is operating. Send. Also, since the output of the private mixer is received and transmitted to the user terminal 80 (U1), a total of five streams are transmitted. In this experiment, four mixer servers 10 are used, and each time the number of user terminals 20 increases, the private mixer is operated by the mixer server 10 with a low CPU utilization. Therefore, until each of the private mixers of the user terminals 80 (U1 to U4) starts processing in one of the mixer servers 10 (M1 to M4), stream transmission processing for five sets is performed every time the number of user terminals 80 increases. Will be added. On the other hand, when the number of user terminals 80 increases after each mixer server 10 receives the stream from the transmission terminal 20 (S1 to S1), the input to the private mixer for the user terminal 80 is performed within the mixer server 10. Be distributed. As shown in the graph of FIG. 39, as the number of user terminals 80 after the user terminal 80 (U5) increases, only the output throughput of one set of streams increases. This indicates that the streams have been connected according to the pattern shown in FIG. In addition, from FIG. 38, it can be confirmed that the measured value of the output throughput in the relay server 50 (R) has also increased substantially as calculated, similarly to the input throughput.

上述したような実験結果を踏まえて、開発したオンデマンド型ミキサの機能に関する考察を述べる。   Based on the experimental results described above, we discuss the functions of the developed on-demand mixer.

<ミキササーバの入力数>
プロトタイプシステムではCPUがミキシング処理を行っているので、処理可能な入力数は、PCの構成や性能および利用するビデオとオーディオのフォーマットに依存する。これは、既存のライブ中継用ソフトウェア(非特許文献15〜17参照)と同じである。一方、参照している専用機器(非特許文献20参照)では4系統のビデオ入力を扱え、その他の専用機器においても4系統または8系統が主流である。ここで、第2の実施の形態に係る中継用ミキサ装置(オンデマンドミキサ)は、多くの送信端末20からの入力を想定しているので、少なくとも専用機器における入力数と同等以上の入力を処理できるべきである。プロトタイプシステムにおける性能評価実験結果からは、1080pの場合は3入力、720pの場合は10入力のミキシング処理が可能であることを確認した。一方、前記専用機(非特許文献20参照)におけるミキシング処理は、NTSC設定の場合480/59.94p、PAL設定の場合は576/50pで行われる。プロトタイプシステムによる評価実験では、入出力を1080pまたは720pとした場合、ミキシング処理も1080/30pまたは720/30pで行っている。ミキシング処理時のフレームレートはプロトタイプシステムの方が低いが、単位時間当たりに処理すべきデータ量はプロトタイプシステムの方が多い。
<Number of inputs to mixer server>
In the prototype system, since the CPU performs mixing processing, the number of inputs that can be processed depends on the configuration and performance of the PC and the video and audio formats used. This is the same as existing live relay software (see Non-Patent Documents 15 to 17). On the other hand, the dedicated device being referred to (see Non-Patent Document 20) can handle four video inputs, and the other dedicated devices are mainly of four or eight systems. Here, the relay mixer device (on-demand mixer) according to the second embodiment assumes inputs from many transmission terminals 20, and therefore processes at least as many inputs as dedicated devices. Should be able to. From the results of the performance evaluation experiment in the prototype system, it was confirmed that mixing processing of 3 inputs was possible in the case of 1080p and 10 inputs in the case of 720p. On the other hand, the mixing process in the dedicated machine (see Non-Patent Document 20) is performed at 480 / 59.94p in the case of NTSC setting and 576 / 50p in the case of PAL setting. In an evaluation experiment using a prototype system, when the input / output is set to 1080p or 720p, the mixing process is also performed at 1080 / 30p or 720 / 30p. Although the frame rate at the time of mixing processing is lower in the prototype system, the amount of data to be processed per unit time is larger in the prototype system.

ここで、実験に用いた端末の数の関係上480pと360pの入力数の上限を評価実験では確認できていないが、少なくとも、それぞれ16入力または32入力程度を処理できるものと推察する。480pと360pにおいて単位時間に処理すべきデータ量は720pに比べるとそれぞれ約1/2と1/4になる。図34〜図36の結果から720pの入力数の上限は10入力であった。720pの10入力に相当するデータ量は、480pと360pの場合それぞれ約20入力分と40入力分となる。しかし、これはデータ量のみを考慮した場合の数なので、実際には、より少ない入力数が上限になると予想される。一方、前述したように、プロトタイプシステムにおいて出力フレームレートを十分に確保できなくなるのはCPU利用率が70%から80%を越える付近だと考えられる。加えて、単位時間当たりに処理すべきデータを十分に処理できない状態になるにつれ、CPU利用率は急激に増加することを考慮し、図34における480pと360pのグラフに対して2次の多項式近似を行った結果が図40のグラフである。図40のグラフにおいて、CPU利用率が70%と80%の時の送信端末数を見てみると、480pの場合は16〜17、360pの場合は32〜36となる。この入力数はデータ量のみで見積もった概数未満であり、入力数の上限として妥当な数である。   Here, the upper limit of the number of inputs of 480p and 360p has not been confirmed in the evaluation experiment due to the number of terminals used in the experiment, but it is assumed that at least about 16 inputs or 32 inputs can be processed, respectively. At 480p and 360p, the amount of data to be processed per unit time is about 1/2 and 1/4 of 720p, respectively. From the results of FIGS. 34 to 36, the upper limit of the number of 720p inputs was 10 inputs. The data amount corresponding to 10 inputs of 720p is approximately 20 inputs and 40 inputs in the case of 480p and 360p, respectively. However, since this is a number when only the data amount is considered, a smaller number of inputs is expected to be the upper limit in practice. On the other hand, as described above, it is considered that the output frame rate cannot be sufficiently secured in the prototype system in the vicinity where the CPU utilization exceeds 70% to 80%. In addition, in consideration of the fact that the CPU utilization rapidly increases as data to be processed per unit time cannot be sufficiently processed, a second-order polynomial approximation to the graphs of 480p and 360p in FIG. Is a graph of FIG. Looking at the number of transmission terminals when the CPU utilization rate is 70% and 80% in the graph of FIG. 40, the transmission terminal numbers are 16 to 17 for 480p and 32 to 36 for 360p. This number of inputs is less than the approximate number estimated only by the data amount, and is an appropriate number as the upper limit of the number of inputs.

また、ミキサ部を遠隔操作する際の応答遅延も、利用する端末やフォーマットに依存するが、ここでは非特許文献21同様に100msを応答性の目安として検討する。評価実験で用いたネットワーク環境においては、360pと480pの場合、実験した12入力全てにおいて応答遅延の平均値は100ms未満であった。720pでは9入力まで、1080pでは2入力までが100ms未満の平均値となっている。一方、実際のライブ中継におけるネットワーク環境では、ネットワーク内の遅延を考慮する必要がある。参考値ではあるが、インターネット接続サービスや各種のクラウドサービスを展開している国内のISPでは、SLA(サービス品質保証制度)としてネットワーク内の国内における平均往復遅延を25msで保証している(非特許文献22〜24参照)。近年では、このように短い遅延を保証するインターネットサービスの利用が可能であり、ミキサ部の遠隔操作に対しても、インターネットを利用することが現実的な選択肢になり得る。   In addition, the response delay when remotely operating the mixer unit also depends on the terminal and format used, but here, as in Non-Patent Document 21, 100 ms will be considered as a measure of the response. In the network environment used in the evaluation experiment, in the case of 360p and 480p, the average value of the response delay was less than 100 ms for all 12 inputs tested. In 720p, up to 9 inputs, and in 1080p, up to 2 inputs have an average value of less than 100 ms. On the other hand, in a network environment in an actual live broadcast, it is necessary to consider a delay in the network. As a reference value, domestic ISPs that offer Internet connection services and various cloud services guarantee an average round-trip delay of 25 ms in the network as an SLA (Service Quality Assurance System) (non-patented). References 22 to 24). In recent years, it is possible to use an Internet service that guarantees such a short delay, and the use of the Internet can be a realistic option for remote control of the mixer unit.

一方、応答性を損なう長さの応答遅延が発生する場合においても、利用者の操作感を損なわないような仕組みが必要である。例えば、利用者端末80におけるミキシング操作開始後、利用者端末80上でミキシング操作の対象となったビデオフレームのデータを用いてアニメーションによるトランジション効果を開始し、そのトランジション効果を、遠隔操作結果が反映されたビデオへシームレスに繋げる。これにより、利用者がミキシング操作を開始した直後から、表示されているビデオは変化することになるので、応答性の確保に効果がある。   On the other hand, even when a response delay having a length that impairs responsiveness occurs, a mechanism that does not impair the operational feeling of the user is required. For example, after starting the mixing operation on the user terminal 80, a transition effect by animation is started using the data of the video frame subjected to the mixing operation on the user terminal 80, and the result of the remote operation reflects the transition effect. Seamless connection to the video. As a result, the displayed video changes immediately after the user starts the mixing operation, which is effective in ensuring responsiveness.

以上、プロトタイプシステムにおけるミキササーバ10の入力数について述べた。プロトタイプシステムにおけるミキサ部は、1080pと720pの場合は専用機器と同等以上、480pと360pの場合は、より多くの入力を処理できる。一方で4台のミキササーバ10を用いた実験からは、負荷分散しながらオンデマンドミキサを利用できることも確認した。よって、バックエンドシステム上で、ミキサ部の機能に対してスケーラビリティを確保する仕組みと、ミキサ部の機能を遠隔からオンデマンドで利用するための機能をプロトタイプシステムとして実装できた。   The number of inputs of the mixer server 10 in the prototype system has been described above. The mixer unit in the prototype system can process more inputs than the dedicated device in the case of 1080p and 720p, and can process more inputs in the case of 480p and 360p. On the other hand, an experiment using four mixer servers 10 confirmed that the on-demand mixer can be used while distributing the load. Therefore, on the back-end system, a mechanism for ensuring scalability for the function of the mixer unit and a function for using the function of the mixer unit remotely and on demand could be implemented as a prototype system.

<送信端末におけるビデオの確認>
ミキシング処理後のビデオを、中継元の送信端末へも中継できる機能を実装したが、中継元では、ある程度の往復遅延の範囲内でミキシング後のビデオを確認できる必要がある。ここでは、遠隔会議における往復遅延の許容値を既出の文献から引用し、往復遅延の測定結果について考察する。まず非特許文献25によると、往復遅延250msではほとんどの会議場面が許容されるが、500msでは一部適さない会議場面(速くてひん度の高いやりとりが要求される会議場面)が生ずる、と述べられている。また、非特許文献26では、発話衝突や、それに起因して起こる精神的ストレスを低減するための遠隔会議の要件として、音声遅延量を200ms以内に抑えれば良いことが実験から示されている。非特許文献25は映像と音声を用いた実験結果であり、非特許文献26では音声のみの実験結果が報告されている。送信端末20から送信するストリームにはオーディオデータも含まれており、ミキシング後のビデオのみならずオーディオデータを含めた確認が行われることも想定し、これらの文献における250msと200msを往復遅延の許容値として検討する。
<Confirmation of video at transmitting terminal>
Although the function that can relay the video after the mixing process to the transmission terminal of the relay source is implemented, the relay source needs to be able to check the video after the mixing within a certain round-trip delay. Here, the allowable value of the round-trip delay in the teleconference is quoted from the above-mentioned literature, and the measurement result of the round-trip delay is considered. First, according to Non-Patent Document 25, most of the conference scenes are allowed with a round-trip delay of 250 ms, but a partly unsuitable conference scene (a conference scene requiring fast and frequent exchanges) occurs at 500 ms. Have been. In addition, Non-Patent Document 26 has shown from experiments that as a requirement for a remote conference to reduce utterance collision and mental stress caused by the collision, it is sufficient to suppress the voice delay amount to 200 ms or less. . Non-Patent Document 25 reports experimental results using video and audio, and Non-Patent Document 26 reports experimental results using only audio. The stream transmitted from the transmitting terminal 20 includes audio data, and it is assumed that confirmation is performed not only for the mixed video but also for the audio data. Consider as a value.

図36における送信端末20とミキササーバ10との間の往復遅延の測定結果より、360pおよび480pの場合は往復遅延が200ms未満であることがわかる。また、720pにおいても入力数の上限とした10入力までは200msを下回っている。1080pの場合は1入力でも約240ms、3入力では約256msの往復遅延であった。結果として、評価実験で用いたネットワーク環境においては、720p以下のフォーマットを利用する場合、遠隔会議中に発話衝突が発生しない程度の往復遅延でミキシング後のビデオを確認でき、1080pの場合は、ほとんどの会議場面で許容できる250ms前後での確認ができる。当然、実際のライブ中継におけるネットワーク環境ではネットワーク内の遅延を考慮する必要があるが、短い遅延が保証されたインターネットサービスを利用することが選択肢の1つになる。   From the measurement result of the round trip delay between the transmission terminal 20 and the mixer server 10 in FIG. 36, it can be seen that the round trip delay is less than 200 ms for 360p and 480p. Also, at 720p, the time is less than 200 ms up to 10 inputs, which is the upper limit of the number of inputs. In the case of 1080p, the round trip delay was about 240 ms for one input and about 256 ms for three inputs. As a result, in the network environment used in the evaluation experiment, when using a format of 720p or less, the mixed video can be confirmed with a round trip delay that does not cause speech collision during the remote conference, and in the case of 1080p, almost no You can check in about 250ms which is acceptable in the meeting scene. Naturally, in a network environment in an actual live broadcast, it is necessary to consider the delay in the network, but using an Internet service that guarantees a short delay is one of the options.

以上、説明したように、本発明の第2の実施の形態に係るミキサ装置(オンデマンド型ミキサ)では、前述した第1の実施の形態の場合と同様に、ソースグループSGPを設定し、各送信端末20がそのソースグループSGPに参加して、ビデオストリームやオーディオストリームを送信する仕組みにより、ミキサへの入力となるビデオソースの数の動的な増減に対応できる。それに加えて、このライブ中継システムは、ライブ中継用のバックエンドシステム内で動作可能なミキサ部の機能を遠隔からオンデマンドで利用でき、中継元のビデオ撮影者(送信端末20の操作者)が必要に応じてミキシング後のビデオを確認でき、更に、バックエンドシステムがミキサ部の機能に対してスケーラビリティを確保するための仕組みを備えている。   As described above, in the mixer device (on-demand type mixer) according to the second embodiment of the present invention, the source group SGP is set as in the case of the first embodiment, and The mechanism in which the transmission terminal 20 participates in the source group SGP and transmits a video stream or an audio stream can cope with a dynamic increase or decrease in the number of video sources to be input to the mixer. In addition, in this live relay system, the function of a mixer unit operable in a back-end system for live relay can be used on demand from a remote location, and a video photographer (operator of the transmission terminal 20) of a relay source can use the function. The video after mixing can be checked if necessary, and a mechanism is provided for the back-end system to ensure scalability for the functions of the mixer section.

なお、本発明のいくつかの実施形態を説明したが、これらの実施形態は、例として提示したものであり、発明の範囲を限定することは意図していない。上述したこれら新規な実施の形態は、その他の様々な形態で実施されることが可能であり、発明の要旨を逸脱しない範囲で、種々の省略、置き換え、変更を行うことができる。これら実施の形態やその変形は、発明の範囲や要旨に含まれるとともに、特許請求の範囲に記載された発明とその均等の範囲に含まれる。   Although some embodiments of the present invention have been described, these embodiments are presented as examples and are not intended to limit the scope of the invention. These new embodiments described above can be implemented in other various forms, and various omissions, replacements, and changes can be made without departing from the spirit of the invention. These embodiments and their modifications are included in the scope and gist of the invention, and are also included in the invention described in the claims and their equivalents.

10 ミキサ端末 ミキササーバ(ミキサ装置)
20 送信端末(情報送信装置)
30 受信端末
40 利用者端末
50 中継サーバ(制御装置)
60 ライブ中継用サービスサイト
ギガビットスイッチングハブ
80 利用者端末(操作装置)
200 ネットワーク
10 Mixer terminal Mixer server (mixer device)
20 transmitting terminal (information transmitting device)
30 receiving terminal 40 user terminal 50 relay server (control device)
60 Live broadcast service site Gigabit switching hub 80 User terminal (operating device)
200 Network

Claims (21)

それぞれが少なくともビデオ情報を含む複数種の中継情報のミキシング処理を行って該ミキシング処理により得られるミキシング中継情報を出力するミキサ装置であって、
情報送信装置から、予め設定されたミキシング処理の対象となる中継情報の送信元のグループへの参加要求があった場合に、当該情報送信装置を当該グループに参加する中継情報の送信元として許容し、該情報送信装置から送信される中継情報をミキシング処理の対象とするミキシング参加制御手段を有するミキサ装置。
A mixer device that performs mixing processing of a plurality of types of relay information each including at least video information and outputs mixing relay information obtained by the mixing processing,
When a request to join a relay information source group to be subjected to a preset mixing process is requested from the information transmitting apparatus, the information transmitting apparatus is permitted as a relay information source to participate in the group. A mixer device having a mixing participation control unit for performing a mixing process on relay information transmitted from the information transmitting device.
前記グループを設定するソースグループ設定手段を有する請求項1記載のミキサ装置。   2. The mixer device according to claim 1, further comprising a source group setting unit for setting the group. 前記ミキシング参加制御手段は、
前記情報送信装置からの前記グループへの参加要求があったときに、参加許可または参加拒否の応答を当該情報送信装置に送る可否応答制御手段を有し、
参加許可の応答を前記情報送信装置に送った後に、前記情報送信装置から送信される中継情報をミキシング処理の対象とする請求項1または2記載のミキサ装置。
The mixing participation control means,
When there is a request to join the group from the information transmitting device, having a permission / rejection response control means for sending a response of participation permission or participation rejection to the information transmitting device,
3. The mixer device according to claim 1, wherein the relay information transmitted from the information transmitting device is subjected to the mixing process after the response of the participation permission is transmitted to the information transmitting device. 4.
ミキシング処理の対象となる中継情報の送信元となる情報送信装置から前記グループからの退出要求があった場合に、当該情報送信装置をミキシング処理の対象となる中継情報の送信元から外し、該情報送信装置からの中継情報のミキシング処理を行わないミキシング退出制御手段を有する請求項1乃至3のいずれかに記載のミキサ装置。   When there is a request from the group to be transmitted from the information transmitting device that is the source of the relay information to be subjected to the mixing process, the information transmitting device is removed from the source of the relay information to be subjected to the mixing process, and 4. The mixer device according to claim 1, further comprising a mixing exit control unit that does not perform a process of mixing relay information from the transmission device. 前記グループへの参加要求がある毎に、その要求元の情報送信装置に対応したバッファ部を形成する入力制御手段を有し、
前記ミキシング処理の対象とする前記情報送信装置からの中継情報を当該情報送信装置に対応する前記バッファ部を介してミキシング処理に供する請求項1乃至4のいずれかに記載のミキサ装置。
Each time there is a request to join the group, having an input control means forming a buffer unit corresponding to the information transmitting device of the request source,
The mixer device according to claim 1, wherein relay information from the information transmitting device to be subjected to the mixing process is provided to the mixing process via the buffer unit corresponding to the information transmitting device.
前記ミキシング中継情報を所定のネットワーク上のライブ中継用サービスサイトに提供する出力制御手段を有する請求項1乃至5のいずれかに記載のミキサ装置。   The mixer device according to any one of claims 1 to 5, further comprising output control means for providing the mixing relay information to a live relay service site on a predetermined network. 他のミキサ装置に対して設定されている他のグループへの参加要求を送信するソースグループ参加要求制御手段を有し、
前記他のグループへの参加要求を前記他のミキサ装置に送信した後に、前記ミキシング中継情報を前記他のミキサ装置におけるミキシング処理の対象とすべき中継情報として当該他のミキサ装置に提供する請求項1乃至6のいずれかに記載のミキサ装置。
Having a source group participation request control means for transmitting a participation request to another group set for another mixer device,
After transmitting the request to join the other group to the other mixer device, provide the mixing relay information to the other mixer device as relay information to be subjected to mixing processing in the other mixer device. 7. The mixer device according to any one of 1 to 6.
前記他のグループからの退出要求を前記他のミキサ装置に送信するソースグループ退出要求制御手段を有し、
ミキシング処理の対象となるミキシング中継情報の前記他のミキサ装置に対する送信元から外れる請求項7記載のミキサ装置。
Source group leaving request control means for transmitting a leaving request from the other group to the other mixer device,
The mixer apparatus according to claim 7, wherein the mixing relay information to be subjected to the mixing process is excluded from a transmission source to the other mixer apparatus.
少なくともビデオ情報を含む中継情報を送信する複数の情報送信装置と、
複数種の中継情報のミキシング処理を行って該ミキシング処理により得られるミキシング中継情報を出力するミキサ装置を有し、
前記複数の情報送信装置のそれぞれは、
予め設定されたミキシング処理の対象となる中継情報の送信元のグループへの参加要求を前記ミキサ装置に送るソースグループ参加要求制御手段を有し、
前記ミキサ装置は、
前記複数の情報送信装置のいずれかから前記グループへの参加要求があった場合に、当該情報送信装置を当該グループに参加する中継情報の送信元として許容し、該情報送信装置から送信される中継情報をミキシング処理の対象とするミキシング参加制御手段を有するライブ中継システム。
A plurality of information transmission devices transmitting relay information including at least video information,
A mixer device that performs mixing processing of a plurality of types of relay information and outputs mixing relay information obtained by the mixing processing,
Each of the plurality of information transmission devices,
Source group participation request control means for sending a request for participation in the group of the transmission source of relay information to be subjected to a preset mixing process to the mixer device,
The mixer device,
When there is a request to join the group from any of the plurality of information transmitting apparatuses, the information transmitting apparatus is permitted as a transmission source of relay information for joining the group, and the relay transmitted from the information transmitting apparatus is permitted. A live relay system having a mixing participation control unit for making information into a mixing process.
前記ミキサ装置は、前記グループを設定するソースグループ設定手段を有する請求項9記載のライブ中継システム。   The live relay system according to claim 9, wherein the mixer device has a source group setting unit that sets the group. 前記ミキサ装置の前記ミキシング参加制御手段は、
前記複数の情報送信装置のいずれかからの前記グループへの参加要求があったときに、参加許可または参加拒否の応答を当該情報送信装置に送る可否応答制御手段を有し、
前記複数の情報送信装置のそれぞれは、前記ミキサ装置から前記参加許可の応答を受信した後に、前記中継情報を前記ミキサ装置へ送信し、
前記ミキサ装置は、前記参加許可の応答を情報送信装置に送った後に、当該情報送信装置から送信される中継情報をミキシング処理の対象とする請求項9または10記載のライブ中継システム。
The mixing participation control means of the mixer device,
When there is a request to join the group from any of the plurality of information transmission devices, having a permission / rejection response control means for sending a response of participation permission or participation rejection to the information transmission device,
Each of the plurality of information transmitting devices, after receiving the participation permission response from the mixer device, transmits the relay information to the mixer device,
11. The live relay system according to claim 9, wherein the mixer device transmits the response of the participation permission to the information transmitting device, and then sets relay information transmitted from the information transmitting device as a target of the mixing process. 12.
前記複数の情報送信装置のそれぞれは、
前記グループからの退出要求を前記ミキサ装置に送るソースグループ退出要求制御手段を有し、
前記ミキサ装置は、
ミキシング処理の対象となる中継情報の送信元となる情報送信装置から前記グループからの退出要求があった場合に、当該情報送信装置をミキシング処理の対象となる中継情報の送信元から外し、該情報送信装置からの中継情報のミキシング処理を行わないミキシング退出制御手段を有する請求項9乃至11のいずれかに記載のライブ中継システム。
Each of the plurality of information transmission devices,
Having a source group leaving request control means for sending a leaving request from the group to the mixer device,
The mixer device,
When there is a request from the group to be transmitted from the information transmitting device that is the source of the relay information to be subjected to the mixing process, the information transmitting device is removed from the source of the relay information to be subjected to the mixing process, and The live relay system according to any one of claims 9 to 11, further comprising a mixing exit control unit that does not perform a process of mixing relay information from the transmitting device.
前記ミキサ装置は、
前記グループへの参加要求がある毎に、その要求元の情報送信装置に対応したバッファ部を形成する入力制御手段を有し、
前記ミキシング処理の対象とする前記情報送信装置からの中継情報を当該情報送信装置に対応する前記バッファ部を介してミキシング処理に供する請求項9乃至12のいずれかに記載のライブ中継システム。
The mixer device,
Each time there is a request to join the group, having an input control means forming a buffer unit corresponding to the information transmitting device of the request source,
The live relay system according to any one of claims 9 to 12, wherein relay information from the information transmitting device to be subjected to the mixing process is supplied to the mixing process via the buffer unit corresponding to the information transmitting device.
前記ミキサ装置は、
前記ミキシング中継情報を所定のネットワーク上のライブ中継用サービスサイトに提供する出力制御手段を有する請求項9乃至13のいずれかに記載のライブ中継システム。
The mixer device,
The live relay system according to any one of claims 9 to 13, further comprising output control means for providing the mixing relay information to a live relay service site on a predetermined network.
他のミキサ装置を有し、
前記ミキサ装置は、情報送信装置として、前記他のミキサ装置に対して設定されている他のグループへの参加要求を送信するソースグループ参加要求制御手段を有し、
前記他のグループへの参加要求を送信した後に、前記ミキシング中継情報を前記他のミキサ装置におけるミキシング処理の対象となる中継情報として当該他のミキサ装置に送信する請求項9乃至14のいずれかに記載のライブ中継システム。
Having other mixer devices,
The mixer device, as an information transmission device, has a source group participation request control unit that transmits a request to join another group set for the other mixer device,
The transmission method according to any one of claims 9 to 14, wherein after transmitting the request to join the other group, the mixing relay information is transmitted to the other mixer apparatus as relay information to be subjected to mixing processing in the other mixer apparatus. Live broadcast system described.
前記ミキサ装置は、
前記他のグループからの退出要求を前記他のミキサ装置に送信するソースグループ退出要求制御手段を有し、
ミキシング処理の対象となるミキシング中継情報の送信元から外れる請求項15記載のライブ中継システム。
The mixer device,
Source group leaving request control means for transmitting a leaving request from the other group to the other mixer device,
16. The live relay system according to claim 15, wherein the live relay system is out of the transmission source of the mixing relay information to be subjected to the mixing process.
少なくともビデオ情報を含む複数種の中継情報のミキシング処理を行って該ミキシング処理により得られるミキシング中継情報を出力する複数の第1ミキサ装置と、
前記複数の第1ミキサ装置に対して設定されるミキシング処理の対象となる中継情報の送信元のグループに参加し、当該第1ミキサ装置にミキシング処理の対象となる中継情報を送る複数の情報送信装置と、
ミキシング処理の対象となるミキシング中継情報の送信元のグループとして設定し、前記複数の第1ミキシング装置を、ミキシング処理の対象となるミキシング中継情報の送信元のグループに参加するミキシング中継情報の送信元として許容し、当該複数の第1ミキサ装置からのミキシング中継情報をミキシング処理して統合されたミキシング中継情報を出力する第2ミキサ装置とを有するライブ中継システム。
A plurality of first mixer devices that perform mixing processing of a plurality of types of relay information including at least video information and output mixing relay information obtained by the mixing processing;
A plurality of information transmissions which participate in a group of transmission source of the relay information to be set for the plurality of first mixer devices and transmit the relay information to be mixed to the first mixer devices. Equipment and
The plurality of first mixing devices are set as a group of the source of the mixing relay information to be subjected to the mixing process, and the plurality of first mixing apparatuses are the sources of the mixing relay information that participate in the group of the source of the mixing relay information to be subjected to the mixing process. And a second mixer device that mixes the mixing relay information from the plurality of first mixer devices and outputs integrated mixing relay information.
少なくともビデオ情報を含む中継情報を送信する複数の情報送信装置と、
所定のネットワーク上に配置され、複数種の中継情報のミキシング処理を行って該ミキシング処理により得られるミキシング中継情報を出力するミキサ装置と、
前記ミキシング装置でのミキシング処理の遠隔操作を行う操作装置とを有し、
前記複数の情報送信装置のそれぞれは、
予め設定されたミキシング処理の対象となる中継情報の送信元のグループへの参加要求を前記操作装置に送るソースグループ参加要求制御手段を有し、前記グループへの参加要求を行った後に前記操作装置により当該グループに参加する中継情報の送信元として許容され、
前記ミキサ装置は、
前記グループに参加する中継情報の信元として許容された複数の情報送信装置からの中継情報を、前記操作装置での遠隔操作に従ってミキシング処理するグループミキシング処理手段と、
該グループミキシング処理手段により得られたミキシング中継情報を前記操作装置に送る出力制御手段とを有するライブ中継システム。
A plurality of information transmission devices transmitting relay information including at least video information,
A mixer device that is arranged on a predetermined network, performs mixing processing of a plurality of types of relay information, and outputs mixing relay information obtained by the mixing processing;
An operating device for performing remote control of the mixing process in the mixing device,
Each of the plurality of information transmission devices,
Source group participation request control means for sending to the operation device a request to join a group of a source of relay information to be subjected to a preset mixing process; and Is allowed as a source of relay information participating in the group,
The mixer device,
The relay information from a plurality of information transmitting apparatus which is acceptable as a feed Xinyuan relay information to participate in the group, and group mixing processing means for mixing processing according to the remote operation of in the operating device,
A live relay system having output control means for transmitting the mixing relay information obtained by the group mixing processing means to the operation device.
前記操作装置は、前記グループを設定するソースグループ設定手段を有する請求項18記載のライブ中継システム。   19. The live relay system according to claim 18, wherein the operation device includes a source group setting unit that sets the group. 前記複数の情報送信装置のそれぞれは、
前記グループからの退出要求を前記操作装置に送るソースグループ退出要求制御手段を有し、
前記操作装置は、
ミキシング処理の対象となる中継情報の送信元となる情報送信装置から前記グループからの退出要求があった場合に、当該情報送信装置をミキシング処理の対象となる中継情報の送信元から外すミキシング退出制御手段を有する請求項18または19記載のライブ中継システム。
Each of the plurality of information transmission devices,
Source group leaving request control means for sending a leaving request from the group to the operating device,
The operating device includes:
Mixing / leaving control that removes the information transmitting apparatus from the source of the relay information to be subjected to the mixing process when there is a request from the group to transmit from the information transmitting apparatus to be the source of the relay information to be subjected to the mixing processing. 20. The live relay system according to claim 18 or 19, further comprising means.
前記ネットワーク上に配置され、当該ネットワーク上に配置された複数のミキサ装置のいずれかを前記操作装置による遠隔操作の対象となる前記ミキサ装置として割り付ける制御装置を有する請求項18乃至20のいずれかに記載のライブ中継システム。   21. The control device according to claim 18, further comprising a control device arranged on the network and allocating any one of the plurality of mixer devices arranged on the network as the mixer device to be remotely controlled by the operation device. Live broadcast system described.
JP2016005614A 2016-01-14 2016-01-14 Mixer device and live relay system Active JP6651197B2 (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2016005614A JP6651197B2 (en) 2016-01-14 2016-01-14 Mixer device and live relay system

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2016005614A JP6651197B2 (en) 2016-01-14 2016-01-14 Mixer device and live relay system

Publications (2)

Publication Number Publication Date
JP2017126902A JP2017126902A (en) 2017-07-20
JP6651197B2 true JP6651197B2 (en) 2020-02-19

Family

ID=59365644

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2016005614A Active JP6651197B2 (en) 2016-01-14 2016-01-14 Mixer device and live relay system

Country Status (1)

Country Link
JP (1) JP6651197B2 (en)

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPWO2022269723A1 (en) * 2021-06-21 2022-12-29

Family Cites Families (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2006333044A (en) * 2005-05-26 2006-12-07 Sony Corp Information processing device and method, recording medium, and program
JP2007026199A (en) * 2005-07-19 2007-02-01 Fujitsu Ltd Multipoint conference system
JP4941107B2 (en) * 2007-05-30 2012-05-30 ヤマハ株式会社 Mixer equipment
JP5401896B2 (en) * 2008-09-30 2014-01-29 ヤマハ株式会社 Audio signal processing device
JP5529177B2 (en) * 2011-01-19 2014-06-25 ネイバー ビジネス プラットフォーム コーポレーション System and method for buffering with P2P-based streaming service, and system for distributing an application that processes buffering on a client
JP5949272B2 (en) * 2012-07-25 2016-07-06 株式会社リコー Communication system and program
JP2015156572A (en) * 2014-02-20 2015-08-27 ヤマハ株式会社 Audio processing system, control device, and processing device

Also Published As

Publication number Publication date
JP2017126902A (en) 2017-07-20

Similar Documents

Publication Publication Date Title
JP5345081B2 (en) Method and system for conducting resident meetings
JP6174501B2 (en) Video conference server, video conference system, and video conference method
US8988486B2 (en) Adaptive video communication channel
US9338394B2 (en) System and method for providing enhanced audio in a video environment
KR101574031B1 (en) Real-time multi-media streaming bandwidth management
KR101555855B1 (en) Method and system for conducting video conferences of diverse participating devices
CN104756099B (en) Add content and associated client device
US9118808B2 (en) Dynamic allocation of encoders
JP6172610B2 (en) Video conferencing system
US8749611B2 (en) Video conference system
WO2008131644A1 (en) A method, device and system for realizing picture switching in the video service
JP2011259365A (en) Camera system, video selection apparatus, and video selection method
US9113037B2 (en) Video conference virtual endpoints
JP2015192230A (en) Conference system, conference server, conference method, and conference program
JP6651197B2 (en) Mixer device and live relay system
JP2013042492A (en) Method and system for switching video streams in resident display type video conference
JP2016192610A (en) Remote conference program, controller and remote conference method
CN101141615B (en) External implementing method of session television terminal supporting double currents
US20160255375A1 (en) Multipoint broadcast method
TWI491218B (en) Media relay video communication
JP2017092802A (en) Conference speech system and back-end system used for the same
JP2017041696A (en) Transmission system, reproduction control method, transmission terminal, and program
KR101691124B1 (en) System and method for providing multi-sharing of multimedia
TWI531244B (en) Method and system for processing video data of meeting
CN115529298B (en) System, method and device for transmitting dense video and audio

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20181221

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20191008

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20191015

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20191121

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20191224

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20200114

R150 Certificate of patent or registration of utility model

Ref document number: 6651197

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250