JPWO2005094077A1 - 多地点会議システムおよび多地点会議装置 - Google Patents

多地点会議システムおよび多地点会議装置 Download PDF

Info

Publication number
JPWO2005094077A1
JPWO2005094077A1 JP2005518742A JP2005518742A JPWO2005094077A1 JP WO2005094077 A1 JPWO2005094077 A1 JP WO2005094077A1 JP 2005518742 A JP2005518742 A JP 2005518742A JP 2005518742 A JP2005518742 A JP 2005518742A JP WO2005094077 A1 JPWO2005094077 A1 JP WO2005094077A1
Authority
JP
Japan
Prior art keywords
speaker
image
unit
processing unit
terminal
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2005518742A
Other languages
English (en)
Inventor
松本 晃一
晃一 松本
一範 小澤
一範 小澤
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
NEC Corp
Original Assignee
NEC Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by NEC Corp filed Critical NEC Corp
Publication of JPWO2005094077A1 publication Critical patent/JPWO2005094077A1/ja
Pending legal-status Critical Current

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N7/00Television systems
    • H04N7/14Systems for two-way working
    • H04N7/15Conference systems
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N7/00Television systems
    • H04N7/14Systems for two-way working
    • H04N7/141Systems for two-way working between two video terminals, e.g. videophone
    • H04N7/147Communication arrangements, e.g. identifying the communication as a video-communication, intermediate storage of the signals
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N7/00Television systems
    • H04N7/14Systems for two-way working
    • H04N7/15Conference systems
    • H04N7/152Multipoint control units therefor

Landscapes

  • Engineering & Computer Science (AREA)
  • Multimedia (AREA)
  • Signal Processing (AREA)
  • Telephonic Communication Services (AREA)
  • Two-Way Televisions, Distribution Of Moving Picture Or The Like (AREA)
  • Compression Or Coding Systems Of Tv Signals (AREA)

Abstract

会議端末としてSIP端末の利用が可能な多地点会議システム及び多地点会議装置において、話者を検出した時に、イントラフレームの送信を会議端末に要求することなく、クリアでスムーズな話者切替えを行うことを可能とするシステムを提供する。本発明の多地点接続装置は、会議に参加している会議端末からの画像データをメモリ13に蓄積しておき、メディア処理部15で話者を検出すると、メモリ13に蓄積された話者の画像データを復号化し該復号化した画像を再符号化する画像処理部を備える。話者切替え時、画像処理部は始めの画像をイントラフレームとして再符号化して、話者以外の会議端末に画像データを送信することにより、話者以外の会議端末は、イントラフレームから復号化することができ、話者切替えをクリアでスムーズに行うことができる。

Description

本発明は、多地点間通信システムに関し、特に、多地点会議システムおよび多地点会議装置に関する。
従来の多地点会議システムにおいては、会議に参加している複数の会議端末から話者を検出する方法として、
(1)多地点会議装置が話者を検出する、
(2)会議端末が、多地点会議装置に自端末が話者であると通知する、
のいずれかの方法が用いられている。
上記(1)、(2)のいずれの方法においても、話者を特定した多地点会議装置は、このまま話者を切替えた場合、インター(Inter)フレーム(フレーム間符号化されたフレーム)の途中で切替える状態となるため、話者以外の会議端末は、イントラ(Intra)フレーム(フレーム内符号化されたフレーム)を受信するまでは、スムーズ(円滑)な話者切替えを行うことができない。
そのため、話者画像を切替えるために、話者である会議端末に対して、Intraフレームの送信または再送要求を行っている。
従来の多地点会議システムの一例として、会議端末が、多地点会議装置に自端末が話者であると通知するシステムとして特許文献1が参照される。このシステムは、多地点に配置された複数の会議端末と多地点間の通信制御装置(多地点会議装置)を備えて構成されている。従来の多地点会議システムは以下のように動作する。
(A1)多地点会議装置は、任意の会議端末から話者切替えを要求されると、要求した会議端末に対して、Intraフレームを送信または再送するように要求を行い、会議に参加している他の会議端末に対しては、多地点会議装置が送信するIntraフレームを受信するまで、各会議端末が表示している現在の画像をフリーズするように要求する。
(A2)そして、多地点会議装置からIntraフレーム送信要求を受信した会議端末は、多地点会議装置に対して、Intraフレームを送信する。一方、多地点会議装置からフリーズ要求を受信した会議端末は、Intraフレームを受信するまで、表示している現在の画像をフリーズさせる。
(A3)話者である会議端末からIntraフレームを受信した多地点会議装置は、他の会議端末に対して、Intraフレームを送信し、Intraフレームを受信した話者以外の会議端末は画像のフリーズを解除し、Intraフレームにより、画像を切替える。
このように、従来の多地点会議システムでは、
話者である会議端末に、多地点会議装置からIntraフレーム送信要求を送信し、
話者である会議端末からIntraフレームを多地点会議装置に送信することにより、多地点会議装置が、話者切替えを可能にしている。
なお、多地点会議システムに関連した刊行物として、例えば後記特許文献2には、会議端末の各々からの多重化されたデータの中からビデオデータのピクチャヘッダを検出してフレーム内符号化されたイントラフレームビデオデータのみを抽出し、抽出されたイントラフレームビデオデータを合成する多地点制御装置が開示されている。また後記特許文献3には、違和感のない映像、音声の切り替えを実現する多地点ビデオ会議制御装置が開示されている。該特許文献3には、映像データのイントラフレームを検出しイントラフレーム検出情報を生成し、生成されたイントラフレーム検出情報を基に、代表話者に選定された端末の映像データに切り替える構成が開示されている。さらに、後記特許文献4には、現在の話者を正確に判別できるようにした多地点間通信システムが開示されている。
特開平02−274084号公報(第3頁、第1図) 特開2001−69474号公報(第3頁、第1図) 特開2002−176503号公報(第3頁、第1図) 特開平08−331535号公報(第2−3頁、第1図)
しかしながら、上記した従来のシステムは下記記載の問題点を有している。
第1の問題点は、会議端末としてSIP端末を利用する場合、クリアに話者画面に切替えることができない、ということである。
その理由は、SIP端末は、IETF標準RFC3261(2543)で規定されたSIP(Session Initiation Protocol)を呼処理に用いて、IPネットワーク上で、リ1アルタイムに、双方向マルチメディア通信を行う端末であるが、メディア転送用にリアルタイム伝送をサポートするRTP(Real−time Transport Protocol)や、再送手順を持たないUDP(User Datagram Protocol)を用いている。
このため、画像の再送要求をサポートしていない。したがって、多地点会議装置が話者切替えのため、SIP端末にIntraフレームを要求することができず、Intraフレームが再送されないため、クリアな話者の切替えができないからである。
第2の問題点は、スムーズに話者を切替えるまでに時間がかかることである。
その理由は、多地点会議装置が話者切替えを行っても、前の話者であるSIP端末から送信されるInterフレームの途中で切替える状態となるため、話者であるSIP端末からIntraフレームが送信され、話者以外のSIP端末がIntraフレームを受信するまでクリアに話者切替えができないからである。
したがって、本発明の目的は、会議端末としてSIP端末を利用する場合においても、クリアに話者画面に切替えができる多地点会議システムおよび多地点会議装置を提供することにある。
本発明の他の目的は、スムーズに話者を切替えることができる多地点会議システムおよび多地点会議装置を提供することにある。
本願で開示される発明は、前記目的を達成するため、概略以下にように構成される。
本発明は、再送要求機能をサポートしていないSIP(Session Initiation Protocol)端末が参加可能な多地点会議システムに適用することで、話者切替え時に切替え対象のSIP端末からの画像データを、多地点会議装置で処理することにより、切替え時の一番初めの画像データとして、イントラ(Intra)フレームを、他の会議に参加しているSIP端末に送信することにより、SIP端末で表示される話者の画像切替え時の画像が乱れず、スムーズに、話者切替えを可能としたものである。
本発明の1つのアスペクト(側面)に係るシステムは、複数の端末と、複数の端末と接続する多地点会議装置と、を備え、画像及び音声を送受信して会議を行う多地点会議システムにおいて、前記多地点会議装置が、話者の検出を行うメディア処理部と、会議に参加している端末からの画像を保持する記憶部と、前記メディア処理部で話者を検出した時に、前記話者の画像を復号化し該復号化した画像を再符号化する画像処理部と、を備え、前記メディア処理部で話者を検出した時、前記画像処理部は、話者切替え時の画像フレームにイントラフレームを送信する。
本発明において、前記画像処理部が、前記メディア処理部での話者検出結果に基づき、前記記憶部に保持されている話者の画像を復号化する復号化部と、前記復号化部により、前記記憶部に保存されている話者の最後の画像を復号化して得られる参照画像を保持する参照画像記憶部と、話者検出以降に受信した画像を、前記参照画像記憶部に保持されている参照画像に基づき、前記復号化部により復号化した画像を再度符号化する符号化部と、を有し、話者検出以降に、受信した話者の画像の少なくとも最初のフレームを、イントラフレームで符号化する構成とされる。
本発明の他のアスペクトに係る方法は、話者切替え検出後、話者切替え処理手段により、話者検出以降に受信した画像データを復号化/再符号化する時、始めの画像をIntraフレームとして再符号化し、次以降は、Interフレームで再符号化して話者以外のSIP端末に画像データを送信する。これにより話者以外のSIP端末は話者切替え時、Intraフレームから復号化することができる。
本発明によれば、話者切替え時にIntraフレームを送信することにより、話者の画像に切替える時に画像が乱れず、スムーズに切替えを行うことができる。
その理由は、本発明においては、話者検出以降に受信した画像データを復号化/再符号化する時、始めの画像を、Intraフレームとして再符号化し、次以降は、Interフレームで再符号化して、話者以外のSIP端末に画像データを送信するからである。
本発明によれば、会議端末(ソフト)に依存しないで、スムーズに話者の画像に切替えることができる。
その理由は、本発明においては、会議システム装置で、画像切替え処理を行うためである。
本発明によれば、リアルタイム通信(RTP)でもスムーズな話者画像の切替えができる。
その理由は、本発明においては、Intraフレームの送信を要求しないので、話者検出後、すぐに話者切替え処理を行うことができるためである。
本発明の第1の実施形態のシステム構成を示す図である。 本発明の第1の実施形態の多地点会議装置の構成を示す図である。 本発明の第1の実施形態における話者切替え処理の動作を説明するためのフローチャートである。 本発明の第2の実施形態における話者切替え処理の動作を説明するためのフローチャートである。 本発明の第3の実施形態のシステム構成を示す図である。 本発明の第3の実施形態の多地点会議装置の構成を示す図である。 本発明の第3の実施形態における話者切替え処理の動作を説明するためのフローチャートである。
符号の説明
1 多地点会議装置
2−a〜2−c SIP端末
3 SIPproxyサーバ
4 IPネットワーク
5 3G網
6−a〜6−c 端末
11 RTP受信部
12 呼処理部
13 メモリ
14 会議制御部
15 メディア処理部
16 RTP送信部
20 画像処理部
21 デコーダ(復号化部)
22 参照画像メモリ
23 エンコーダ(符号化部)
31 受信部
32 送信部
本発明を実施するための最良の形態ついて添付図面を参照して以下に詳細に説明する。図1は、本発明の一実施形態の構成を示す図である。
図1を参照すると、本発明の第1の実施形態に係るシステムは、多地点会議装置1と、SIP端末2−a〜2−cと、SIPproxyサーバ(SIP代理サーバ)3と、これら装置を接続するIPネットワーク4とから構成されている。図1において、多地点会議装置1は、メディアデータの送受信と話者切替えを行う。SIP端末2−a〜2−cは、自端末の画像・音声データを多地点会議装置1に送信し、多地点会議装置1から受信する話者の画像・音声データを、デバイスに出力する。
SIPproxyサーバ3は、SIP端末2−a〜2−cと多地点会議装置1の間のSIPプロトコルを中継する。
図2は、図1の多地点会議装置1を構成を示す図である。多地点会議装置1は、RTP受信部11と、呼処理部12と、メモリ13と、会議制御部14と、メディア処理部15と、RTP送信部16と、画像処理部20とを備えている。画像処理部20は、デコーダ(復号化部)21と、参照画像メモリ22と、エンコーダ(符号化部)23とを含む。
図2において、RTP受信部11は、SIP端末2−aからのRTP/UDP/IPパケットを受信し、RTPペイロード部を抽出する。
抽出したRTPペイロード部が、SIPプロトコルの場合には、呼処理部12に、RTPペイロードを渡し、メディアデータの場合には、メディア処理部15にRTPペイロードを渡す。
呼処理部12は、セッションの呼処理を行い、呼処理の可否結果を、RTP送信部16に通知する。
また、会議参加者のIPアドレス、メディア受信ポートを会議制御部14に通知する。
メディア処理部15は、会議に参加しているSTP端末2−a〜2−cに対して、自端末以外のSIP端末から送信されてくるメディアをミックスする。同時に、話者の検出も行い、話者検出結果を会議制御部14に通知する。
会議制御部14は、会議参加者のIPアドレス、メディア受信ポートなどの会議参加者情報の管理行う。
また、メディア処理部15から話者検出結果を通知された場合には、話者切替えのための処理開始通知を、画像処理部20に通知する。
画像処理部20は、会議制御部14から、話者切替え処理開始通知を受信すると、メモリ13に蓄積されている各SIP端末からの画像RTPパケットデータの内、切替え対象者のデータをメモリ13からコピーする。
メモリ13は、会議に参加しているSIP端末2−a〜2−cからの画像RTPパケットを各端末毎に蓄積する。
画像処理部20は、メモリ13からコピーした話者切替え対象者の画像データを、デコーダ21で復号化する。
最後に、復号化された画像を参照画像メモリ22に蓄積する。
その後、デコーダ21は、RTP受信部11から、話者切替え対象者の画像RTPデータを直接コピーし、参照画像メモリ22に蓄積されている参照画像を基に、復号化処理を行い、復号画像を、エンコーダ23に渡す。
エンコーダ23は、デコーダ21で復号化された画像を再符号化して、再度符号化された画像データを、メディア処理部15にコピーする。
メディア処理部15は、エンコーダ23からコピーされた再符号化画像を、話者以外に送信するようにミキシングし、RTP送信部16にコピーする。
RTP送信部16は、メディア処理部15から渡されたメディアデータを、RTP/UDP/IPパケット化して、SIP端末2−b,2−cに送信する。
また、RTP送信部16は、呼処理部12からSIPプロトコルを送信するように要求された場合、SIPプロトコルを、RTP/UDP/IPパケット化して、対象のSIP端末2−a〜2−cに送信する。
図3は、本発明の実施形態の動作を説明するための流れ図である。次に、図3のフローチャートを使用して、本実施形態の多地点会議装置の話者切替え処理動作について詳細に説明する。
まず、メディア処理部15は、新たに話者が検出されるか常にチェックを行う(ステップS1)。
メディア処理部15で話者が検出されなかった場合、RTP受信部11では、現時点で、話者以外の会議参加者の画像RTPヘッダを各々チェックする(ステップS2)。
現時点で話者以外の会議参加者の各々の画像RTPヘッダをチェックして、会議参加者であるSIP端末2−aの画像RTPヘッダがIntraフレームでなかった場合(Interフレーム)には、RTP受信部11は、SIP端末2−aの画像RTPペイロードを、メモリ13にコピーする(ステップS4)。
RTP受信部11は、SIP端末2−aの画像RTPヘッダがIntraフレームである場合には、SIP端末2−a用にメモリ13にコピーされていた画像RTPペイロードをクリアし(ステップS3)、画像RTPペイロードを、メモリ13にコピーする(ステップS4)。
メディア処理部15でSIP端末2−aが話者と検出された場合(ステップS1のYES分岐)、画像処理部20は、メモリ13に蓄積されているSIP端末2−aの画像RTPペイロードのデータを、デコーダ21に入力する(ステップS5)。
デコーダ21は、入力された画像データを復号化し(ステップS6)、最後に復号化した画像フレームを、参照画像メモリ22に一時保存する(ステップS7)。
話者検出から参照画像を参照画像メモリ22に保存するまでの間、RTP受信部11は、話者であるSIP端末2−aからの画像RTPヘッダをチェックして(ステップS8)、SIP端末2−aの画像RTPヘッダがIntraフレームであった場合、SIP端末2−aの画像RTPペイロードをデコーダ21に入力することを終了し、SIP端末2−aの画像RTPペイロードをメディア処理部15に渡して話者切替え処理が終了する。
SIP端末2−aの画像RTPヘッダがIntraフレームでなかった場合(Interフレーム)、RTP受信部11は、SIP端末2−aの画像RTPペイロードをデコーダ21に入力する(ステップS9)。
デコーダ21は、参照画像メモリ22に一時保存されている画像フレームを基に、入力された画像RTPペイロードの復号化を開始する(ステップS10)。
復号化された画像データは、エンコーダ23に入力し、再度符号化する(ステップS11)。
エンコーダ23は、再符号化する時、始めのフレームをIntraフレームに符号化して、それ以降は、Interフレームに符号化する。再符号化した画像データをメディア処理部15にコピーする(ステップS12)。
メディア処理部15は、RTP受信部11から会議参加者の全ての音声RTPペイロードをコピーしてミキシングする。ミキシングされた音声RTPペイロードと再符号化画像データをRTP送信部16にコピーする。RTP送信部16は、メディア処理部15から渡された画像と音声データをRTP/UDP/IPパケット化して、話者以外のSIP端末2−b,2−cに送信する(ステップS13)。
1つの画像フレームを、デコーダ21に渡したRTP受信部11は、次に受信した話者であるSIP端末2−aの画像RTPヘッダをチェックする(ステップS8)。
話者の画像RTPヘッダがIntraフレームでなかった場合(Interフレーム)、話者切替えの処理を継続し(ステップS9〜S13)、一方、Intraフレームであった場合には、SIP端末2−aの画像RTPペイロードをデコーダ21に入力することを終了し、SIP端末2−aの画像RTPペイロードを、メディア処理部15に渡して話者切替え処理が終了する。
次に、本発明の第2の実施形態について図を参照して詳細に説明する。
本発明の第2の実施形態の構成は、前記第1の実施形態の構成と同じであるが、メディア処理部15が話者を検出した場合、メディア処理部15からの指示により、RTP送信部16が、話者であるSIP端末2−aへ、Intraフレーム送信要求を意味する情報を含んだSIPメソッド(例えば、INFOメソッド)を送信する制御を行う点で、前記第1の実施形態と相違している。
メディア処理部15は、話者を検出した場合、話者検出結果を、会議制御部14に通知する。同時に、メディア処理部15は、RTP送信部16にIntraフレーム送信要求を話者に送信するよう通知する。
RTP送信部16は、Intraフレーム送信要求を意味する情報を含めたINFOメソッドを話者であるSIP端末2−aに送信する。
INFOメソッドを受信したSIP端末2−aは、要求情報により、次に送信する画像フレームをIntraフレームとして符号化して、Intraフレームである画像パケットを多地点会議装置1に送信する。これ以降の動作は、前記第1の実施形態と同様である。
図4は、本発明の第2の実施形態の動作を説明するためのフローチャートである。図4を参照して、本実施形態の多地点会議装置1の話者切替え処理動作について詳細に説明する。
図4のフローチャートのステップS21、S22、S23、S24は、図3のフローチャートのステップS1、S2、S3、S4の動作と同一であるため、説明は省略する。
SIP端末2−aが話者と検出された場合(ステップS21)、RTP送信部16にIntraフレーム送信要求を話者に送信するよう通知し、RTP送信部16は、Intraフレーム送信要求情報を含めたINFOメソッドを話者であるSIP端末2−aに送信する(ステップS25)。
INFOメソッドを話者SIP端末2−aに送信した後の手順である、ステップS26〜S34は、前記第1の実施形態の図3のステップS5〜S13の動作と同様であるので説明を省略する。
このように、本実施形態では、話者検出直後に、Intraフレーム送信要求をしているので、前記第1の実施形態のように、話者である会議端末からIntraフレームが送信されるまで、話者切替え処理を継続することが無いため、よりスムーズに話者画像を切替えることができる、という作用効果を奏する。
本実施形態において、SIPメソッドとして、INFOメソッドを用いたが、他のSIPメソッドを使用してもよい。また、Intraフレーム送信要求にSIPメソッドを使用したが、Intraフレーム送信要求を意味する別のコマンドを使用してもよい。
また、本実施形態において、会議端末はIntraフレーム送信要求を受信すると、Intraフレームを送信するとしているが、Intraフレーム送信要求に対応していなくてもよい。
次に、本発明の第3の実施形態について図を参照して詳細に説明する。
図5、図6は、本発明の第3の実施形態の構成を示す図である。本実施形態は、図1に示した前記第1の実施形態のシステム構成に加えて、3G網5と、端末6−a〜6−cを有する。また、図2に示した第1の実施形態の多地点会議装置の機能ブロックにおいて、RTP受信部11と、RTP送信部16を、それぞれ受信部31と、送信部32で置き換えた点で相違している。
図5において、端末6−a〜6−cは、画像および音声の通信が可能な第3世代電話(3G−324M)であり、3G網5は、端末6−a〜6−cが接続するネットワークである。
多地点会議装置1は、IPネットワーク4と3G網5の異種網接続を行うことにより、SIP端末2−a〜2−cと端末6−a〜6−cで多地点会議を行う。
図6において、受信部31は端末6−aからのデータを受信してデータを抽出する。抽出したデータが、呼接続Q.931の場合には、呼処理部12にデータを渡し、メディアデータの場合には、メディア処理部15にデータを渡す。
呼処理12は、呼接続処理を行ない、呼処理結果を送信部32に通知する。
また、会議参加者である端末6−aの電話番号、ユーザIDなどを会議制御部14に通知する。
メディア処理部15は、会議に参加しているSIP端末2−a〜2−cと、端末6−b、6−cに対して、自端末以外の会議端末から送信されるメディアをミックスするが、SIP端末2−a〜2−cと端末6−a〜6−cで使用している画像、音声のコーデックが異なる場合には、メディア処理部15において、一度、メディアデータを復号化して、各会議端末のコーデックに合わせて、再符号化、ミキシングを行う。
メディア処理部15は、同時に、話者検出を行い、話者検出結果を会議制御部14に通知してから、メモリ13が各会議端末からの画像データを蓄積する動作は、第1の実施形態の図2の動作と同じであるため、説明は省略する。
画像処理部20は、メモリ13からコピーした話者切替え対象の画像データを、話者である端末の使用している画像コーデックに合わせて、デコーダ21で復号化する。
最後に復号化された画像を参照画像メモリ22に蓄積してから、復号画像をエンコーダ23に渡す動作は、前記第1の実施形態の図2の動作と同じであるため、説明は省略する。
エンコーダ23は、デコーダ21で復号化された画像を再符号化するが、話者以外の会議端末の画像コーデックに合わせて再符号化して、再符号化された画像データをメディア処理部15にコピーする。メディア処理部15は、エンコーダ23からコピーされた話者以外の会議端末の画像コーデックに合った再符号化画像を該当する会議端末に送信するようにミキシングし、送信部32にコピーする。
送信部32は、メディア処理部15から渡されたメディアデータをIPネットワーク4と3G網5のメディアフォーマットに合わせて、SIP端末2−a〜2−cと端末6−b、6−cに送信する。また、呼処理12から通知された呼処理結果を基に、呼処理Q.931で対象の端末6−a〜6−cに送信する。
SIP端末2−a〜2−cの場合は、前記した第1の実施形態の動作(図2参照)と同じであるので説明は省略する。
次に、図7のフローチャートを使用して、本実施形態の多地点会議装置1の話者切替え処理動作について詳細に説明する。
まず、メディア処理部15は新たに話者が検出されるか常にチェックを行う(ステップS41)。
話者が検出されなかった場合、受信部31は現時点で話者以外の会議参加者の画像データを各々チェックする(ステップS42)。現時点で、話者以外の会議参加者の各々の画像データをチェックして、会議参加者である端末6−aの画像データがIntraフレームでなかった場合(Interフレーム)、端末6−aの画像データをメモリ13にコピーする(ステップS44)。
端末6−aの画像データがIntraフレームである場合には、端末6−a用にメモリ13にコピーされていた画像データをクリアし(ステップS43)、画像データをメモリ13にコピーする(ステップS44)。
端末6−aが話者と検出された場合(ステップS41)、メモリ13に蓄積されている端末6−aの画像データをデコーダ21に入力する(ステップS45)。
デコーダ21は、入力された画像データの画像コーデックに合わせて復号化し(ステップS46)、最後に復号化した画像フレームを参照画像メモリ22に一時保存する(ステップS47)。
話者検出から参照画像を参照画像メモリ22に保存するまでの間、受信部31は、話者である端末6−aからの画像データをチェックして(ステップS48)、端末6−aの画像データがIntraフレームであった場合、端末6−aの画像データをデコーダ21に入力することを終了し、端末6−aの画像データをメディア処理部に渡して話者処理が終了する。
端末6−aの画像データがIntraフレームでなかった場合(Interフレーム)、受信部31は端末6−aの画像データをデコーダ21に入力し(ステップS49)、参照画像メモリ22に一時保管されている画像フレームを基に、デコーダ21に入力された画像データの画像コーデックに合わせて復号化を開始する(ステップS50)。
復号化された画像データは、エンコーダ23に入力し、話者以外の会議端末の画像コーデックに合わせて再符号化する(ステップS51)。
再符号化する時、始めのフレームをIntraフレームに符号化して、それ以降はInterフレームに符号化する。再符号化した画像データをメディア処理部15にコピーする(ステップS12)。
メディア処理部15は、受信部31から会議参加者の音声データをコピーして、復号化して話者以外の会議端末の音声コーデックに合わせて再復号化、ミキシングを行う。各会議端末の呼デックに合わせてミキシングされた音声データと再符号化画像データを送信部32にコピーする。送信部32は、メディア処理部15から渡された画像、音声データをIPネットワーク4、3G網5で送信できるフォーマットに変換して話者以外の会議端末であるSIP端末2−a〜2−cと端末6−b、6−cに送信する(ステップS53)。
このように、本実施形態では、IPネットワーク4と異種網である3G網5を相互接続できる多地点会議装置1により、SIP端末と3G網の端末でも多地点会議を行うことができる、という作用効果が得られる。
本実施形態において、IPネットワークの異種網として3G網を接続するとしたが、ISDN網、インターネットサービスプロバイダ網(ISP網)、公衆交換電話網(PSTN)を使用してもよい。
また、話者検出直後にIntraフレーム送信要求をしていないが、第2の実施形態のように話者検出直後にIntraフレーム送信要求してもよい。例えば、3G網の端末の場合、多地点会議装置からITU−T準拠H.245のVideoFastUpdateコマンドを送信することによりIntraフレームの送信を要求してもよい。
以上本発明を上記実施例に即して説明したが、本発明は上記実施例の構成に限定されるものでなく、本発明の範囲内で当業者であればなし得るであろう各種変形、修正を含むことは勿論である。

Claims (18)

  1. 複数の端末と、複数の端末と接続する多地点会議装置と、を備え、画像及び音声を送受信して会議を行う多地点会議システムにおいて、
    前記多地点会議装置が、
    話者の検出を行うメディア処理部と、
    会議に参加している端末からの画像を保持する記憶部と、
    前記メディア処理部で話者を検出した時に、前記話者の画像を復号化し該復号化した画像を再符号化する画像処理部と、
    を備え、
    前記メディア処理部で話者を検出した時、前記画像処理部は、話者切替え時の画像フレームにイントラフレームを送信する、ことを特徴とする多地点会議システム。
  2. 前記画像処理部が、
    前記メディア処理部での話者検出結果に基づき、前記記憶部に保持されている話者の画像を復号化する復号化部と、
    前記復号化部により、前記記憶部に保存されている話者の最後の画像を復号化して得られる参照画像を保持する参照画像記憶部と、
    話者検出以降に受信した画像を、前記参照画像記憶部に保持されている参照画像に基づき、前記復号化部により復号化した画像を再度符号化する符号化部と、
    を有し、
    話者検出以降に、受信した話者の画像の少なくとも最初のフレームを、イントラフレームで符号化する、ことを特徴とする請求項1記載の多地点会議システム。
  3. 前記端末と前記多地点会議装置とが、再送手順を具備しない通信プロトコルを用いて通信可能とされてなる、ことを特徴とする請求項1記載の多地点会議システム。
  4. 複数の端末と通信接続する多地点会議装置において、
    話者の検出を行うメディア処理部と、
    会議に参加している端末からの画像を保持する記憶部と、
    話者を検出した時に前記話者の画像を復号化し復号化した画像を再符号化する画像処理部と、
    前記メディア処理部で話者を検出した時、話者切替え時の画像フレームに、前記画像処理部で再符号化されたイントラフレームを送信する送信部と、
    を備えている、ことを特徴とする多地点会議装置。
  5. 複数の端末と接続され、
    話者検出するメディア処理部と、
    会議に参加している端末からの画像を保持する記憶部と、を有する多地点会議装置に設けられ、話者検出時に話者の画像を復号化/再符号化する画像処理装置において、
    話者検出結果に基づき、前記記憶部に保持されている話者の画像を復号化する復号化部と、
    前記復号化部により、前記記憶部に保存されている話者の最後の画像を復号化して得られる参照画像を保持する参照画像記憶部と、
    話者検出以降に、受信した画像を、前記参照画像記憶部に保持されている参照画像に基づき、前記復号化部により復号化した画像を再度符号化する符号化部と、
    を有し、
    話者検出以降に、受信した話者の画像の少なくとも最初のフレームを、イントラフレームで符号化する、ことを特徴とする画像処理装置。
  6. 第1のネットワークと、第1のネットワークと異種網である第2のネットワークと、を接続する多地点会議システムにおいて、
    話者の検出を行うメディア処理部と、
    会議に参加している端末からの画像を保持する記憶部と、
    前記メディア処理部で話者を検出した時に、話者の画像を復号化し、復号化された画像を再符号化する画像処理部と、
    を備え、
    前記メディア処理部で話者を検出した時、前記画像処理部は、話者切替え時の画像フレームにイントラフレームを送信する、ことを特徴とする多地点会議システム。
  7. 複数の端末と接続され、話者検出するメディア処理部を有する多地点会議装置に設けられ、話者検出時に話者の画像を復号化/再符号化する画像処理装置において、
    前記メディア処理部での話者検出の結果、話者である端末のコーデックに合わせて画像を記憶する記憶部と、
    前記記憶部に保持されている話者の画像を復号化する復号化部と、
    前記復号化部により、前記記憶部に保存されている話者の最後の画像を復号化して得られる参照画像を保持する参照画像記憶部と、
    話者検出以降に、受信部で受信した画像を前記参照画像記憶部に保持されている参照画像に基づき、前記復号化部により復号化した画像を再度符号化する符号化部と、
    を有し、
    話者検出以降に前記受信部で受信した話者の画像の少なくとも最初のフレームをイントラフレームで符号化し、
    異種網に接続している端末から送信される画像データが複数であっても対応可能としてなる、ことを特徴とする画像処理装置。
  8. 話者を検出するメディア処理部と、話者検出以降に、受信部で受信した始めの話者の画像をイントラフレームで符号化する画像処理部と、を有し、会議に参加している話者以外の端末に、イントラフレームを送信することで、話者画像を切替える多地点会議装置の話者切替え方法であって、
    受信している話者の画像がイントラフレームであるか否か判定する工程と、
    イントラフレームであると検出された場合、前記画像処理部での処理を停止し、受信した話者のイントラフレームを送信する工程と、
    前記話者の画像がイントラフレームでないと検出された場合、前記画像処理部の処理を継続する工程と、
    を含む、ことを特徴とする話者切替え方法。
  9. 複数の端末と接続する多地点会議装置の話者切替え方法において、
    前記多地点会議装置が、話者を検出した場合、イントラフレーム送信要求を端末に送信する工程と、
    前記多地点会議装置からイントラフレーム送信要求を受信した端末が、イントラフレームを前記多地点会議装置に送信する工程と、
    を有する、ことを特徴とする話者切替え方法。
  10. 画像処理部が話者検出以降に受信部で受信した始めの話者の画像をイントラフレームで符号化することで、会議に参加している話者以外の端末にイントラフレームを送信し、話者画像を切替え制御する多地点会議装置の話者切替え方法であって、
    受信部で受信している話者の画像がイントラフレームであると検出された場合、前記画像処理部の処理を停止し、前記受信部で受信した話者のイントラフレームを送信する工程と、
    話者の画像がイントラフレームでないと検出された場合、前記画像処理部の処理を継続する工程と、
    を含み、異種網に接続している端末から送信される画像データのコーデックが複数であっても対応可能としてなる、ことを特徴とする話者切替え方法。
  11. 異種網に接続している複数の端末のうち多地点会議装置が話者を検出する工程と、
    前記多地点会議装置が、話者検出結果に基づき、イントラフレーム送信要求を端末に送信する工程と、
    イントラフレーム送信要求を受信した端末が前記多地点会議装置にイントラフレームを出力する工程と、
    を含む、ことを特徴とする話者切替え方法。
  12. 複数の端末と接続する多地点会議装置が、話者の切替え検出する工程と、
    前記多地点会議装置が、前記話者検出後、話者検出以降に受信した画像データを復号化して再符号化するにあたり、始めの画像をイントラフレームとして再符号化し、次以降は、インターフレームで再符号化して、話者以外の端末に画像データを送信する工程と、
    を含み、話者以外の前記端末は、話者切替え時、イントラフレームから復号化することを可能としてなる、ことを特徴とする話者切替え方法。
  13. 複数の端末と接続する多地点会議装置が、
    話者の切替え検出する検出部と、
    前記話者検出後、話者検出以降に受信した画像データを復号化して再符号化するにあたり、始めの画像をイントラフレームとして再符号化し、次以降は、インターフレームで再符号化して、話者以外の端末に画像データを送信する画像処理部と、
    を含み、
    話者以外の前記端末をして、話者切替え時にイントラフレームから復号化することを可能たらしめる、ことを特徴とする多地点会議装置。
  14. 通信接続する端末からのパケットを受信する受信部と、
    送信パケットを送信する送信部と、
    呼処理を行う呼処理部と、
    話者の検出を行うメディア処理部と、
    会議参加者情報の管理を行う会議制御部と、
    会議に参加している端末からの画像データを端末に対応させて蓄積する記憶部と、
    復号化部、参照画像記憶部、及び符号化部を含む画像処理部と、
    を備え、
    前記会議制御部は、前記メディア処理部から話者検出結果を通知された場合に、話者切替えのための処理開始通知を前記画像処理部に通知し、
    前記画像処理部は、前記会議制御部から、前記話者切替えのための処理開始通知を受信すると、前記記憶部に蓄積されている端末からの画像データの内、切替え対象者の蓄積画像データを前記記憶部からコピーして、前記復号化部で復号化し、最後に復号化された画像を参照画像として前記参照画像記憶部に蓄積し、さらに、前記受信部から切替え対象者の画像データを受け取り、前記画像データがイントラフレームでなかった場合、前記画像データは前記復号化部に入力され、前記復号化部では、前記参照画像記憶部に蓄積されている前記参照画像を基に、復号化処理を行い、該復号化された画像データを前記符号化部で再符号化し、該再符号化された画像データを前記メディア処理部に渡し、
    前記メディア処理部は、前記再符号化された画像データを、話者以外の端末に送信するようにミキシングして前記送信部に渡し、
    前記送信部は、前記メディア処理部からの画像データをパケット化して前記端末に送信する、ことを特徴とする多地点会議装置。
  15. 前記メディア処理部での話者の検出から、前記画像処理部で前記参照画像を前記参照画像記憶部に保存するまでの間、前記受信部は、話者の端末から受信した画像データをチェックし、前記画像データがイントラフレームであった場合、前記画像データの前記復号化部への入力を終了し、前記画像データは前記メディア処理部に渡され、話者切替え処理が終了する、ことを特徴とする請求項14記載の多地点会議装置。
  16. 複数の端末に接続する会議装置による話者切替え方法であって、
    会議に参加している端末からの画像データを記憶部に記憶する工程と、
    話者の検出を行う工程と、
    話者検出時、前記記憶部に記憶されている切替え対象話者の画像データを復号化し、最後に復号化された画像を参照画像として参照画像記憶部に蓄積する工程と、
    話者検出以降、話者の端末から受信した画像データがイントラフレームであるか否か判定する工程と、
    イントラフレームでなかった場合、前記参照画像記憶部に蓄積されている前記参照画像を基に、前記画像データの復号化処理を行い、該復号化された画像データを再符号化し、その際、話者切替え時の前記話者の端末からの最初の画像データはイントラフレームとして再符号化し、前記再符号化された画像データを、話者以外の会議に参加している端末に送信する工程と、
    イントラフレームであった場合、前記話者の端末から受信したイントラフレームを、話者以外の会議に参加している端末に送信する工程と、
    を含む、ことを特徴とする話者切替え方法。
  17. 話者切替え時に、切替え対象話者の端末から受信した、符号化された画像データを復号化する第1の工程と、
    前記復号化された画像データを再符号化する第2の工程と、
    を含み
    前記第2の工程では、再符号化に際して、話者切替え時の話者の端末からの最初の画像データをイントラフレームに符号化し、
    話者切替え時、話者以外の会議に参加している端末にイントラフレームを送信する、ことを特徴とする話者切替え方法。
  18. 話者切替え時に、切替え対象話者の端末から送信された符号化画像データを復号化する復号化手段と、
    前記復号化された画像データを再符号化する符号化手段と、
    を備え、
    前記符号化手段は、再符号化に際して、話者切替え時の話者の端末からの最初の画像データをイントラフレームに符号化し、
    話者切替え時、話者以外の会議に参加している端末にイントラフレームを送信する、ことを特徴とする会議システム。
JP2005518742A 2004-03-25 2005-03-22 多地点会議システムおよび多地点会議装置 Pending JPWO2005094077A1 (ja)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
JP2004089434 2004-03-25
JP2004089434 2004-03-25
PCT/JP2005/005093 WO2005094077A1 (ja) 2004-03-25 2005-03-22 多地点会議システムおよび多地点会議装置

Publications (1)

Publication Number Publication Date
JPWO2005094077A1 true JPWO2005094077A1 (ja) 2008-02-14

Family

ID=35056562

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2005518742A Pending JPWO2005094077A1 (ja) 2004-03-25 2005-03-22 多地点会議システムおよび多地点会議装置

Country Status (7)

Country Link
US (1) US7667729B2 (ja)
EP (1) EP1732323B1 (ja)
JP (1) JPWO2005094077A1 (ja)
KR (1) KR100906687B1 (ja)
CN (1) CN1934861A (ja)
DE (1) DE602005018753D1 (ja)
WO (1) WO2005094077A1 (ja)

Families Citing this family (20)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR101176628B1 (ko) 2006-01-16 2012-08-23 삼성전자주식회사 멀티미디어 컨퍼런스에서의 컨퍼런스 데이터 저장 방법 및그 시스템
JP2007306317A (ja) * 2006-05-11 2007-11-22 Nec Corp メディアモニタシステムおよびメディアモニタ方法
JP4620696B2 (ja) * 2007-02-27 2011-01-26 株式会社日立製作所 ストリーミングデータ伝送システム、コグニティブ制御ノード、ビデオサーバ、トランスコーディング方法、及び帯域予約方法
US8675853B1 (en) * 2007-06-20 2014-03-18 West Corporation System, method, and computer-readable medium for diagnosing a conference call
JP4850286B2 (ja) * 2007-07-05 2012-01-11 三菱電機株式会社 デジタル映像伝送システム
JP2009044328A (ja) * 2007-08-07 2009-02-26 Seiko Epson Corp 会議システム、サーバ、画像表示方法、コンピュータプログラム及び記録媒体
EP3206369A1 (en) 2009-11-10 2017-08-16 Interdigital Patent Holdings, Inc. Collaborative session control transfer and interdevice transfer in internet protocol multimedia subsystem
CN102131071B (zh) 2010-01-18 2013-04-24 华为终端有限公司 视频画面切换的方法和装置
CN105119904B (zh) 2010-03-04 2018-10-26 交互数字专利控股公司 网际协议多媒体子***协同会话中的识别和传递的方法
ES2711601T3 (es) 2010-03-18 2019-05-06 Interdigital Patent Holdings Inc Autorización de transferencia de sesión de elementos entre usuarios
JP5693065B2 (ja) * 2010-07-06 2015-04-01 キヤノン株式会社 通信端末、通信端末の制御方法及びプログラム
JP2013042492A (ja) * 2011-08-11 2013-02-28 Polycom Inc 常駐表示式ビデオ会議においてビデオストリームを切替える方法およびシステム
US20130147906A1 (en) * 2011-12-07 2013-06-13 Reginald Weiser Systems and methods for offloading video processing of a video conference
US11659138B1 (en) 2013-06-26 2023-05-23 Touchcast, Inc. System and method for interactive video conferencing
US10356363B2 (en) 2013-06-26 2019-07-16 Touchcast LLC System and method for interactive video conferencing
US11405587B1 (en) 2013-06-26 2022-08-02 Touchcast LLC System and method for interactive video conferencing
US10085029B2 (en) * 2015-07-21 2018-09-25 Qualcomm Incorporated Switching display devices in video telephony
EP3425852B1 (en) 2016-02-29 2022-03-02 Audio-Technica Corporation Conference system
WO2019056001A1 (en) * 2017-09-18 2019-03-21 Touchcast LLC INTERACTIVE VIDEOCONFERENCE SYSTEM AND METHOD
CN109587432A (zh) * 2018-10-29 2019-04-05 视联动力信息技术股份有限公司 一种会议发言终端切换方法及***

Family Cites Families (18)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2504180B2 (ja) 1989-04-14 1996-06-05 三菱電機株式会社 多地点間画像通信システム
JP2839295B2 (ja) 1989-09-12 1998-12-16 富士通株式会社 多地点間テレビ会議システムの画面更新方式
JP3081425B2 (ja) 1993-09-29 2000-08-28 シャープ株式会社 映像符号化装置
JPH07222129A (ja) * 1994-01-28 1995-08-18 Hitachi Ltd 映像通信装置
JPH08331535A (ja) 1995-06-05 1996-12-13 Canon Inc 多地点間通信システム
JPH11220711A (ja) 1998-02-03 1999-08-10 Fujitsu Ltd 多地点会議システム及び会議端末装置
JP2000270305A (ja) 1999-03-12 2000-09-29 Kansai Tlo Kk 多地点会議システム
JP2001045495A (ja) 1999-08-02 2001-02-16 Nec Eng Ltd 画面合成装置
JP2001069474A (ja) 1999-08-25 2001-03-16 Nec Corp 多地点制御装置及びそれに用いる映像表示方法
JP3818054B2 (ja) 2000-12-08 2006-09-06 日本電気株式会社 多地点ビデオ会議制御装置、音声切替え方法、およびそのプログラムを記録した記録媒体
JP2002209195A (ja) * 2001-01-11 2002-07-26 Mitsubishi Electric Corp 通信サービスユニットおよびマルチメディア通信方式
US7085842B2 (en) 2001-02-12 2006-08-01 Open Text Corporation Line navigation conferencing system
JP2002262251A (ja) 2001-02-27 2002-09-13 Matsushita Electric Ind Co Ltd 会議サーバ装置及び多地点会議システム
US7020203B1 (en) * 2001-12-21 2006-03-28 Polycom, Inc. Dynamic intra-coded macroblock refresh interval for video error concealment
JP2003244130A (ja) 2002-02-14 2003-08-29 Canon Inc 会議システム
EP1381237A3 (en) * 2002-07-10 2004-05-12 Seiko Epson Corporation Multi-participant conference system with controllable content and delivery via back-channel video interface
US6963353B1 (en) * 2003-05-14 2005-11-08 Cisco Technology, Inc. Non-causal speaker selection for conference multicast
US8140980B2 (en) 2003-08-05 2012-03-20 Verizon Business Global Llc Method and system for providing conferencing services

Also Published As

Publication number Publication date
EP1732323A1 (en) 2006-12-13
DE602005018753D1 (de) 2010-02-25
CN1934861A (zh) 2007-03-21
US7667729B2 (en) 2010-02-23
EP1732323B1 (en) 2010-01-06
US20080218584A1 (en) 2008-09-11
KR100906687B1 (ko) 2009-07-07
EP1732323A4 (en) 2007-06-06
WO2005094077A1 (ja) 2005-10-06
KR20070018029A (ko) 2007-02-13

Similar Documents

Publication Publication Date Title
KR100906687B1 (ko) 다지점회의시스템 및 다지점회의장치
US7773581B2 (en) Method and apparatus for conferencing with bandwidth control
US7290058B2 (en) Video mail server with reduced frame loss
EP1578129A1 (en) Method and apparatus for conferencing with stream selectivity
US6646674B1 (en) TV telephone system
JP2006217592A (ja) 第3のディスプレイを通じた画像提供を可能にするビデオ通話方法
JP2008131143A (ja) 符号化処理装置および符号化処理方法
JP2007150916A (ja) コミュニケーションシステム、端末装置及びコンピュータプログラム
US8339439B2 (en) Method of speeding up video recovery of videotelephony after an interruption and mobile terminal and system using the same
EP1949682A1 (en) Method for gatekeeper streaming
US8681199B2 (en) Method of providing video-call service using general voice-call terminal and private branch exchange for performing the method
JP2007306317A (ja) メディアモニタシステムおよびメディアモニタ方法
JP2010512075A (ja) 呼セッションのための方法、電話システムおよび電話端末
WO2007068139A1 (fr) Systeme et procede pour la commande de flux multimedias sur la communication video a plusieurs abonnes
JP2006217167A (ja) Ip電話装置およびipアダプタ装置
JP2008042767A (ja) テレビ電話システム、これに用いられるゲートウエイ及びipテレビ電話端末
JP5223444B2 (ja) 通信システム及び呼制御装置
US7535995B1 (en) System and method for volume indication during a communication session
JP5430915B2 (ja) 呼制御方法及びインターホンシステム
KR100666956B1 (ko) 네트워크에서의 미디어 전송 장치 및 방법
JP4118897B2 (ja) 画像伝送装置
JP4165384B2 (ja) 映像音声通信システム
CN117650932A (zh) 一种多层安全的实时音视频方法及装置
JP2005184450A (ja) 通信保存システム
JP2006180371A (ja) ゲートウェイ装置、通信端末及び呼制御方法

Legal Events

Date Code Title Description
A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20080325

A02 Decision of refusal

Free format text: JAPANESE INTERMEDIATE CODE: A02

Effective date: 20080715