JP6390607B2 - Program and remote conference method - Google Patents
Program and remote conference method Download PDFInfo
- Publication number
- JP6390607B2 JP6390607B2 JP2015250701A JP2015250701A JP6390607B2 JP 6390607 B2 JP6390607 B2 JP 6390607B2 JP 2015250701 A JP2015250701 A JP 2015250701A JP 2015250701 A JP2015250701 A JP 2015250701A JP 6390607 B2 JP6390607 B2 JP 6390607B2
- Authority
- JP
- Japan
- Prior art keywords
- sound
- terminal device
- sound data
- data
- terminal
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired - Fee Related
Links
- 238000000034 method Methods 0.000 title claims description 190
- 238000003860 storage Methods 0.000 claims description 69
- 230000005540 biological transmission Effects 0.000 claims description 60
- 238000006243 chemical reaction Methods 0.000 claims description 50
- 239000002131 composite material Substances 0.000 claims description 30
- 230000002194 synthesizing effect Effects 0.000 claims description 17
- 230000002238 attenuated effect Effects 0.000 claims description 8
- 238000004891 communication Methods 0.000 description 48
- 239000000463 material Substances 0.000 description 10
- 238000009434 installation Methods 0.000 description 8
- 230000003287 optical effect Effects 0.000 description 6
- 125000002066 L-histidyl group Chemical group [H]N1C([H])=NC(C([H])([H])[C@](C(=O)[*])([H])N([H])[H])=C1[H] 0.000 description 3
- 230000004044 response Effects 0.000 description 3
- 230000015572 biosynthetic process Effects 0.000 description 2
- 230000000694 effects Effects 0.000 description 2
- 230000006870 function Effects 0.000 description 2
- 238000004519 manufacturing process Methods 0.000 description 2
- 230000004048 modification Effects 0.000 description 2
- 238000012986 modification Methods 0.000 description 2
- 239000004065 semiconductor Substances 0.000 description 2
- 238000003786 synthesis reaction Methods 0.000 description 2
- 239000004973 liquid crystal related substance Substances 0.000 description 1
- 238000003825 pressing Methods 0.000 description 1
Images
Landscapes
- Two-Way Televisions, Distribution Of Moving Picture Or The Like (AREA)
- Telephonic Communication Services (AREA)
Description
本発明は、第一端末装置と第二端末装置によるネットワークを介した遠隔会議において第一端末装置を制御するコンピュータに所定の処理を実行させるプログラムと、サーバ装置を制御するコンピュータに所定の処理を実行させるプログラムと、遠隔会議方法に関する。 The present invention relates to a program for causing a computer that controls a first terminal device to execute a predetermined process in a remote conference via a network between the first terminal device and the second terminal device, and a predetermined process for a computer that controls a server device. The present invention relates to a program to be executed and a remote conference method.
ネットワークを介した遠隔会議に関する技術が提案されている。例えば、特許文献1には、通信会議システムに関する技術が開示されている。通信会議システムでは、次のような機能が実現される。即ち、音声の発言内容が文字データに変換され、話者が識別される。モニタ画面上に、文字データが表示される。文字データは、所望の時間遅延されてモニタ画面に表示される。 Techniques related to remote conferencing via a network have been proposed. For example, Patent Document 1 discloses a technique related to a communication conference system. In the teleconference system, the following functions are realized. That is, the speech content is converted into character data, and the speaker is identified. Character data is displayed on the monitor screen. The character data is displayed on the monitor screen after a desired time delay.
複数の端末装置による遠隔会議の開催中に、他の端末装置のユーザの発言を聞き逃すことがある。特許文献1に開示の技術では、ユーザの発言を文字データに変換し、これに基づき文字を表示することで、聞き逃した発言の内容を認識することができる。但し、そのためには、文字を読む必要がある。遠隔会議では、例えば、各端末装置で撮影された映像データに対応する撮影画像及び/又は各端末装置で共有される資料画像の確認が必要になることがある。このような場合、撮影画像及び/又は資料画像を確認しつつ、更に、文字を読み、聞き逃した内容を認識することは、困難な作業であると思われる。発言を文字データとするためには、音声認識の処理が必要である。従って、映像データを用いる遠隔会議では、端末装置での処理負荷が高くなることもある。 While a teleconference is being held by a plurality of terminal devices, the user's speech of other terminal devices may be missed. In the technique disclosed in Patent Document 1, the content of the missed speech can be recognized by converting the user's speech into character data and displaying the character based on this. However, for that purpose, it is necessary to read characters. In a remote conference, for example, it may be necessary to check a captured image corresponding to video data captured by each terminal device and / or a material image shared by each terminal device. In such a case, it may be difficult to read the characters and recognize the missed contents while confirming the captured image and / or the material image. In order to make the utterance text data, speech recognition processing is required. Therefore, in a remote conference using video data, the processing load on the terminal device may increase.
本発明は、端末装置のユーザが聞き逃した他のユーザの発言内容を、遠隔会議の進行中に端末装置のユーザに認識させることが可能な、遠隔会議用のプログラムと遠隔会議方法を提供することを目的とする。 The present invention provides a remote conference program and a remote conference method that allow a user of a terminal device to recognize the content of another user's message that the user of the terminal device missed while the remote conference is in progress. For the purpose.
本発明の一側面は、ネットワークに接続された第一端末装置を制御するコンピュータに、前記第一端末装置と、前記ネットワークに接続された第二端末装置と、による前記ネットワークを介した遠隔会議を実行するサーバ装置から送信される、前記第二端末装置で集音された第一タイミングの第一音に少なくとも対応する第一音データを取得する第一取得処理と、前記第二端末装置で集音された前記第一タイミングより前の第二タイミングの第二音に対応する第二音データの送信を要求する第一リプレイ要求を、前記サーバ装置へと送信させる第一送信処理と、前記サーバ装置から送信される前記第二音データを取得する第二取得処理と、前記第一音データと前記第二音データとを合成した第一合成データを生成する第一ミキシング処理と、前記第一合成データを再生し、再生された第一合成音を出力させる再生処理と、を実行させるプログラムである。 One aspect of the present invention provides a computer that controls a first terminal device connected to a network, a remote conference via the network by the first terminal device and a second terminal device connected to the network. A first acquisition process for acquiring first sound data corresponding to at least the first sound of the first timing collected by the second terminal device, transmitted from the server device to be executed, and collected by the second terminal device; A first transmission process for transmitting, to the server device, a first replay request for requesting transmission of second sound data corresponding to a second sound at a second timing before the sounded first timing; A second acquisition process for acquiring the second sound data transmitted from the apparatus; a first mixing process for generating first synthesized data obtained by synthesizing the first sound data and the second sound data; Play the serial first composite data, a program for executing a reproducing process of outputting the first synthesized sound reproduced.
このプログラムによれば、第二端末装置で集音された第一タイミングの第一音と第二タイミングの第二音を含む第一合成音を出力させることができる。第一端末装置のユーザに、第一音を聞き取らせつつ、第二音を聞き取らせることが可能となる。 According to this program, the first synthesized sound including the first sound of the first timing and the second sound of the second timing collected by the second terminal device can be output. The user of the first terminal device can hear the second sound while listening to the first sound.
本発明の他の側面は、ネットワークに接続されたサーバ装置を制御するコンピュータに、前記ネットワークに接続された第一端末装置と、前記ネットワークに接続された第二端末装置と、前記ネットワークに接続された第三端末装置と、による前記ネットワークを介した遠隔会議において、前記第二端末装置から送信される、前記第二端末装置で集音された第四音に対応する第四音データを取得する第四取得処理と、取得された前記第四音データを記憶部に記憶させる第一記憶処理と、前記遠隔会議において、前記第三端末装置から送信される、前記第三端末装置で集音された第五音に対応する第五音データを取得する第五取得処理と、第一タイミングの前記第四音に対応する前記第四音データと、前記第一タイミングの前記第五音に対応する前記第五音データと、を合成した第二合成データを生成する第二ミキシング処理と、前記第二合成データを、前記第一端末装置へと送信させる第三送信処理と、前記第一端末装置から送信される、前記第一タイミングより前の第二タイミングの前記第四音に対応する前記第四音データの送信を要求する第二リプレイ要求を取得する第六取得処理と、前記第二リプレイ要求が取得された場合、前記第二タイミングの前記第四音に対応する前記第四音データを、前記第一端末装置に送信させる第四送信処理と、を実行させるプログラムである。 Another aspect of the present invention provides a computer that controls a server device connected to a network, a first terminal device connected to the network, a second terminal device connected to the network, and a computer connected to the network. The fourth sound data corresponding to the fourth sound collected by the second terminal device transmitted from the second terminal device in a remote conference via the network by the third terminal device. The fourth acquisition process, the first storage process for storing the acquired fourth sound data in the storage unit, and the third terminal apparatus, which is transmitted from the third terminal apparatus, is collected in the remote conference. A fifth acquisition process for acquiring fifth sound data corresponding to the fifth sound, the fourth sound data corresponding to the fourth sound at the first timing, and the fifth sound at the first timing. A second mixing process for generating second synthesized data obtained by synthesizing the fifth sound data; a third transmission process for transmitting the second synthesized data to the first terminal apparatus; and the first terminal apparatus. A sixth acquisition process for acquiring a second replay request for requesting transmission of the fourth sound data corresponding to the fourth sound at a second timing before the first timing, and the second replay When a request is acquired, a fourth transmission process for causing the first terminal device to transmit the fourth sound data corresponding to the fourth sound at the second timing is a program.
このプログラムによれば、第二端末装置で集音された第一タイミングの第四音に対応する第四音データと、第三端末装置で集音された第一タイミングの第五音に対応する第五音データによる第二合成データを、第一端末装置に送信させ、第二リプレイ要求に応じて、第二タイミングの第四音に対応する第四音データを、第一端末装置に送信させることができる。第一端末装置のユーザに、第一タイミングの第四音及び第五音を聞き取らせつつ、第二タイミングの第四音を聞き取らせることが可能となる。 According to this program, the fourth sound data corresponding to the fourth sound of the first timing collected by the second terminal device and the fifth sound of the first timing collected by the third terminal device The second synthesized data based on the fifth sound data is transmitted to the first terminal device, and the fourth sound data corresponding to the fourth sound at the second timing is transmitted to the first terminal device in response to the second replay request. be able to. The user of the first terminal device can hear the fourth sound at the second timing while listening to the fourth sound and the fifth sound at the first timing.
本発明の更に他の側面は、ネットワークに接続された、第一端末装置と第二端末装置と第三端末装置とサーバ装置と、を含む遠隔会議システムで実行される遠隔会議方法であって、前記第一端末装置と前記第二端末装置と前記第三端末装置とによる前記ネットワークを介した遠隔会議において、前記第二端末装置から送信される、前記第二端末装置で集音された第六音に対応する第六音データを取得する工程と、取得された前記第六音データを記憶する工程と、前記遠隔会議において、前記第三端末装置から送信される、前記第三端末装置で集音された第七音に対応する第七音データを取得する工程と、第一タイミングの前記第六音に対応する前記第六音データと、前記第一タイミングの前記第七音に対応する前記第七音データと、を合成した第三合成データを生成する工程と、前記第三合成データを再生し、再生された第二合成音を出力する工程と、前記第一タイミングより前の第二タイミングの前記第六音の再生を要求するリプレイ要求を取得する工程と、前記リプレイ要求が取得された場合、前記第三合成データと、前記第二タイミングの前記第六音に対応する前記第六音データと、を合成した第四合成データを生成する工程と、前記第四合成データを再生し、再生された第三合成音を出力する工程と、を含む遠隔会議方法である。 Still another aspect of the present invention is a remote conference method executed in a remote conference system including a first terminal device, a second terminal device, a third terminal device, and a server device connected to a network, In a remote conference via the network by the first terminal device, the second terminal device, and the third terminal device, a sixth sound collected from the second terminal device and transmitted from the second terminal device Acquiring the sixth sound data corresponding to the sound, storing the acquired sixth sound data, and collecting the third sound data transmitted from the third terminal device in the remote conference. Obtaining seventh sound data corresponding to the sounded seventh sound; the sixth sound data corresponding to the sixth sound at the first timing; and the seventh sound data corresponding to the seventh sound at the first timing. Synthesize the seventh sound data Generating a third synthesized data; reproducing the third synthesized data; outputting the reproduced second synthesized sound; and reproducing the sixth sound at a second timing before the first timing. A step of obtaining a replay request to be requested; and a fourth that is obtained by synthesizing the third synthesized data and the sixth sound data corresponding to the sixth sound at the second timing when the replay request is obtained. A teleconferencing method comprising: generating synthesized data; and reproducing the fourth synthesized data and outputting the reproduced third synthesized sound.
この遠隔会議方法によれば、第二端末装置で集音された第一タイミングの第六音と、第三端末装置で集音された第一タイミングの第七音と、第二端末装置で集音された第二タイミングの第六音を含む第三合成音を出力させることができる。ユーザに、第一タイミングの第六音及び第七音を聞き取らせつつ、第二タイミングの第六音を聞き取らせることが可能となる。 According to this remote conference method, the sixth sound of the first timing collected by the second terminal device, the seventh sound of the first timing collected by the third terminal device, and the seventh sound collected by the second terminal device are collected. It is possible to output a third synthesized sound including the sixth sound having the second timing. The user can hear the sixth sound at the second timing while listening to the sixth sound and the seventh sound at the first timing.
本発明によれば、端末装置のユーザが聞き逃した他のユーザの発言内容を、遠隔会議の進行中に端末装置のユーザに認識させることが可能な、遠隔会議用のプログラムと遠隔会議方法を得ることができる。 According to the present invention, there is provided a remote conference program and a remote conference method capable of causing a user of a terminal device to recognize the content of another user's message that the user of the terminal device missed while the remote conference is in progress. Can be obtained.
本発明を実施するための実施形態について、図面を用いて説明する。本発明は、以下に記載の構成に限定されるものではなく、同一の技術的思想において種々の構成を採用することができる。例えば、以下に示す構成の一部は、省略し又は他の構成等に置換してもよい。他の構成を含むようにしてもよい。 Embodiments for carrying out the present invention will be described with reference to the drawings. The present invention is not limited to the configurations described below, and various configurations can be employed in the same technical idea. For example, some of the configurations shown below may be omitted or replaced with other configurations. Other configurations may be included.
<遠隔会議システム>
遠隔会議システム10の概略について、図1を参照して説明する。遠隔会議システム10は、図1に示すように、サーバ装置20と、端末装置を含む。図1では、3台の端末装置が図示されている。端末装置の台数は、実施される遠隔会議のシチュエーションに応じて変化する。実施形態では、3台の端末装置による遠隔会議を例として説明する。図1に図示された3台の端末装置のそれぞれを、端末装置41,42,43という。端末装置41,42,43は、同一の遠隔会議に出席しているユーザによってそれぞれ操作される。サーバ装置20と端末装置41,42,43は、ネットワーク90に接続されている。ネットワーク90は、例えば、インターネット又はローカルエリアネットワーク(LAN)のようなネットワークである。遠隔会議システム10では、端末装置41,42,43による遠隔会議は、サーバ装置20と端末装置41,42,43のそれぞれとの間でセッションが確立された状態で行われる。
<Remote conference system>
An outline of the
サーバ装置20は、端末装置41,42,43の間を送受信されるデータを中継する。端末装置41,42,43の間を送受信されるデータとしては、映像データと音データが例示される。映像データは、端末装置41,42,43のそれぞれで撮影された撮影画像61(後述する図2参照)に対応するデータである。音データは、端末装置41,42,43のそれぞれで集音された音に対応するデータである。サーバ装置20は、端末装置41,42,43からそれぞれ送信された映像データを受信し、受信された各映像データを、その映像データの送信元の端末装置を除く端末装置に送信する。例えば、サーバ装置20は、端末装置42から送信された映像データを、端末装置42を除く端末装置41,43に送信する。但し、サーバ装置20は、端末装置41,42,43からそれぞれ送信された全ての映像データを、全ての端末装置41,42,43に送信するようにしてもよい。
The
サーバ装置20は、端末装置41,42,43からそれぞれ送信された音データを受信し、受信された複数の音データを合成する。実施形態では、サーバ装置20で、複数の音データを合成して生成された音データを、「合成データ」という。例えば、端末装置42,43からの音データを端末装置41に送信する場合、サーバ装置20は、端末装置42,43からの音データを合成し、前述の各音データを含む合成データを生成する。その後、サーバ装置20は、生成された合成データを、端末装置41に送信する。つまり、サーバ装置20は、端末装置41,42,43のうち、合成データの送信先となる端末装置からの音データを除く複数の音データを合成し、生成された合成データを、前述の送信先の端末装置に送信する。これに伴い、ユーザが自身が発した声を直接聞き取りつつ、自装置から出力される自身の声と同じ音が、重複して聞き取れるといった、事態の発生を防止することができる。サーバ装置20から端末装置41,42,43への映像データと合成データの送信は、公知の遠隔会議システムと同様、ストリーミング方式によって行われる。
The
この他、サーバ装置20は、資料データを中継する。資料データは、遠隔会議で用いられる資料画像62(後述する図2参照)に対応するデータである。遠隔会議システム10では、公知の遠隔会議システムと同様、端末装置41,42,43の間で同一の資料データに対応する資料画像62が共有された状態で、遠隔会議を進行することができる。サーバ装置20は、端末装置41,42,43のうちの何れか1台の端末装置から送信された資料データを、他の2台の端末装置に送信する。端末装置41,42,43では、資料データに対応する資料画像62が表示される。
In addition, the
サーバ装置20を介して実行される遠隔会議は、会議IDによって識別される。即ち、端末装置41,42,43による遠隔会議は、会議IDによって、サーバ装置20を介して実行される他の遠隔会議と識別される。会議IDによって識別される遠隔会議において、端末装置41,42,43は、端末IDにより識別される。実施形態では、端末装置41,42,43の各端末IDは、次の通りとする。端末装置41の端末IDは、「USER41」とする。端末装置42の端末IDは、「USER42」とする。端末装置43の端末IDは、「USER43」とする。
The remote conference executed via the
遠隔会議システム10では、所定のユーザによって、事前に遠隔会議の開催が予約される。予約は、サーバ装置20によって提供される所定のサイトに登録される。予約の際、例えば、遠隔会議の開催を、出席者に通知することができる。この通知は、例えば、電子メールを用いて行われる。即ち、電子メールの本文には、遠隔会議の開催日時と、サーバ装置20のURLが含められる。サーバ装置20のURLには、例えば、予約された遠隔会議を識別する会議IDに関する情報が含められる。
In the
<サーバ装置>
サーバ装置20について、図1を参照して説明する。サーバ装置20は、CPU21と、記憶装置22と、RAM23と、通信部24を備える。CPU21と記憶装置22とRAM23と通信部24は、バス25に接続される。CPU21は、演算処理を実行する。記憶装置22は、コンピュータが読み取り可能な記憶媒体である。記憶装置22としては、ハードディスク及び/又はフラッシュメモリが例示される。この他、記憶装置22は、ROMを含むものであってもよい。記憶装置22には、各種のプログラムが記憶される。例えば、OS(Operating System)と各種のアプリケーションが記憶装置22に記憶される。記憶装置22に記憶されるアプリケーションには、サーバプログラムが含まれる。サーバプログラムは、所定のサーバ装置を、遠隔会議システム10におけるサーバ装置20として動作させる遠隔会議用のプログラムである。サーバプログラムには、後述する中継処理(図6参照)のプログラムが含まれる。
<Server device>
The
サーバプログラムは、記憶装置22に事前にインストールされる。事前のインストールは、例えば、半導体メモリ等のコンピュータが読み取り可能な記憶媒体に記憶されたサーバプログラムが、サーバ装置20の読取部(不図示)によって読み取られることで行われる。サーバ装置20が、例えば、光学ドライブ(不図示)を備えている場合、事前のインストールは、光学メディアに記憶されたサーバプログラムが、光学ドライブによって読み取られることで行われるようにしてもよい。この他、事前のインストールは、ネットワーク90に接続されるサーバ装置20とは別のサーバ装置のハードディスク等のコンピュータが読み取り可能な記憶媒体に記憶されたサーバプログラムが、通信部24で伝送信号として受信されることで行われるようにしてもよい。記憶装置22へのサーバプログラムのインストールについて、上述した何れの形態とするかは、諸事情を考慮して適宜決定される。コンピュータが読み取り可能な記憶媒体は、一時的な記憶媒体(例えば、伝送信号)を含まない、非一時的な記憶媒体であってもよい。非一時的な記憶媒体は、情報を記憶する期間に関わらず、情報を記憶可能な記憶媒体であればよい。
The server program is installed in the
RAM23は、CPU21が各種のプログラムを実行する際に利用される記憶領域となる。RAM23には、処理の実行途中に、処理で利用される所定のデータ及び情報が所定の領域に記憶される。例えば、接続リストがRAM23に記憶される。但し、接続リストは、記憶装置22に記憶されるようにしてもよい。接続リストには、例えば、会議IDによって識別される遠隔会議において、セッションが確立されている端末装置41,42,43の端末IDが登録されている。サーバ装置20では、CPU21が記憶装置22に記憶されたOSと中継処理のプログラムを含むサーバプログラムを実行する等して、サーバ装置20を制御する。これにより、サーバ装置20では、各種の処理が実行される。
The
通信部24は、サーバ装置20をネットワーク90に接続し、ネットワーク90を介したデータ通信を行う。サーバ装置20では、通信部24を介して、端末装置41,42,43のそれぞれとの間で各種のデータが送受信される。通信部24は、例えば、イーサネット(登録商標)規格に適合するインターフェース回路である。通信部24によるネットワーク90への接続は、有線接続とされる。但し、通信部24によるネットワーク90への接続は、無線接続であってもよい。
The
サーバ装置20は、中継処理のプログラムを含むサーバプログラムが記憶装置22に記憶されている点が、公知のサーバ装置と相違する。但し、サーバ装置20は、ハードウェア的には、公知のサーバ装置と同じである。従って、サーバ装置20は、更に、公知のサーバ装置が備える構成を備える。
The
<端末装置>
端末装置41,42,43は、ネットワーク90を介した通信機能を有する同一又は同種の端末装置である。例えば、端末装置41,42,43は、パーソナルコンピュータ、スマートフォン又はタブレット端末である。実施形態では、端末装置41,42,43として、パーソナルコンピュータが例示されている(図1参照)。端末装置41,42,43の説明は、図1及び図2を参照しつつ、端末装置41を例として説明する。この説明では、図2に示す遠隔会議画面60は、端末装置41で表示されている遠隔会議画面とする。端末装置42,43は、次に説明する端末装置41が備える構成と同じ構成を備える。端末装置42,43では、図2に示す遠隔会議画面60と同じ態様の遠隔会議画面が表示される。
<Terminal device>
The
端末装置41は、CPU47と、記憶装置48と、RAM49と、表示部50と、操作部51と、スピーカ52と、通信部53と、接続インターフェース54を備える。CPU47と記憶装置48とRAM49と表示部50と操作部51とスピーカ52と通信部53と接続インターフェース54は、バス55に接続される。実施形態では、接続インターフェース54を「接続I/F54」と記載する。接続I/F54には、カメラ56とマイク57が接続される。
The
CPU47は、演算処理を実行する。記憶装置48は、コンピュータが読み取り可能な記憶媒体である。記憶装置48としては、ハードディスク及び/又はフラッシュメモリが例示される。この他、記憶装置48は、ROMを含むものであってもよい。記憶装置48には、各種のプログラムが記憶される。例えば、OSと各種のアプリケーションが記憶装置48に記憶される。記憶装置48に記憶されるアプリケーションには、クライアントプログラムが含まれる。クライアントプログラムは、所定の端末装置を、遠隔会議システム10における端末装置41,42,43として動作させる遠隔会議用のプログラムである。クライアントプログラムには、後述する音処理(図3参照)と変換処理(図4参照)とミキシング処理(図5参照)のプログラムが含まれる。
The
クライアントプログラムは、記憶装置48に事前にインストールされていてもよい。事前のインストールは、例えば、半導体メモリ等のコンピュータが読み取り可能な記憶媒体に記憶されたクライアントプログラムが、端末装置41の読取部(不図示)により読み取られることで行われる。端末装置41が、例えば、光学ドライブ(不図示)を備えている場合、事前のインストールは、光学メディアに記憶されたプログラムが、光学ドライブにより読み取られることで行われるようにしてもよい。この他、事前のインストールは、ネットワーク90を介して端末装置41に接続されるサーバ装置(サーバ装置20又は不図示のサーバ装置)のハードディスク等のコンピュータが読み取り可能な記憶媒体に記憶されたクライアントプログラムが、通信部53で伝送信号として受信されることで行われるようにしてもよい。クライアントプログラムは、遠隔会議への接続に際し、端末装置41がサーバ装置20にアクセスした場合に、サーバ装置20からネットワーク90を介して伝送信号として端末装置41に送信されてもよい。クライアントプログラムは、そのタイミングで、記憶装置48にインストールされるようにしてもよい。この場合、クライアントプログラムは、RAM49に記憶されてもよい。記憶装置48又はRAM49へのクライアントプログラムのインストールについて、上述した何れの形態とするかは、諸事情を考慮して適宜決定される。コンピュータが読み取り可能な記憶媒体は、一時的な記憶媒体(例えば、伝送信号)を含まない、非一時的な記憶媒体であってもよい。非一時的な記憶媒体は、情報を記憶する期間に関わらず、情報を記憶可能な記憶媒体であればよい。
The client program may be installed in the
RAM49は、CPU47が各種のプログラムを実行する際に利用される記憶領域となる。RAM49には、処理の実行途中に、処理で利用される所定のデータ及び情報が所定の領域に記憶される。端末装置41では、CPU47が記憶装置48に記憶されたOSと音処理と変換処理とミキシング処理を含むクライアントプログラムを実行する等して、端末装置41を制御する。これにより、端末装置41では、各種の処理が実行される。
The
表示部50は、例えば液晶ディスプレイである。表示部50には、各種の情報が表示される。表示部50には、遠隔会議画面60が表示される。遠隔会議画面60は、図2に示すように、撮影画像61と、資料画像62と、操作情報63と、報知情報64と、終了ボタン65を含む。
The
撮影画像61は、端末装置41,42,43のうちの何れかの端末装置で撮影された映像データに対応する画像である。図2では、端末装置42の撮影画像61と端末装置43の撮影画像61が例示されている。遠隔会議画面60では、自装置(端末装置41)の撮影画像61を表示することもできる。実施形態では、サーバ装置20は、端末装置41からの映像データを端末装置41に送信しない。従って、端末装置41では、自装置の撮影画像61は、自装置で撮影された映像データから直接表示される。但し、サーバ装置20が、端末装置41からの映像データを端末装置41にも送信する場合、端末装置41では、自装置の撮影画像61は、端末装置42,43の撮影画像61と同様、サーバ装置20から送信される映像データに従い表示される。
The captured
遠隔会議画面60では、撮影画像61の表示又は非表示を設定することができる。撮影画像61の表示又は非表示は、端末装置41,42,43の各撮影画像61に対して個別に設定することができる。図2に示す遠隔会議画面60に基づけば、端末装置41の撮影画像61は、非表示に設定され、端末装置42,43の撮影画像61は、表示に設定されている。遠隔会議画面60では、端末装置42,43の撮影画像61に対する表示の設定に従い、2個の撮影画像61が表示されている。
On the
遠隔会議画面60では、表示に設定された撮影画像61と共にその撮影画像61に対応する端末IDが表示される。従って、図2では、端末装置42の撮影画像61と共に端末ID「USER42」が表示され、端末装置43の撮影画像61と共に端末ID「USER43」が表示されている。遠隔会議画面60において、端末装置42,43の各ユーザをそれぞれ含む撮影画像61及び/又は撮影画像61と共に表示される端末IDは、端末装置42,43に対応する相手先情報となる。即ち、端末装置41のユーザは、撮影画像61及び端末IDの一方又は両方に基づき、遠隔会議に出席している他のユーザを認識することができる。
On the
操作情報63は、例えば、リプレイ要求の送信に対応する操作ボタンである。リプレイ要求は、操作情報63と関連付けられた撮影画像61及び端末IDの端末装置からサーバ装置20に送信された音データの送信を、サーバ装置20に対して要求する指示である。送信要求の対象となる音データは、次に記載のタイミングより前に、端末装置41,42,43のうちの何れかの端末装置で取得された音に対応する音データである。前述のタイミングは、現在、受信されている合成データの生成時に合成対象とされた、この合成データに含まれる音データに対応する音が取得されたタイミングである。操作情報63は、撮影画像61及び端末IDに関連付けられた状態で表示される。例えば、端末IDが「USER42」である端末装置42の撮影画像61と共に表示されている操作情報63は、次に記載のタイミングより前に、端末装置42で取得された音に対応する音データの送信を、サーバ装置20に対して要求するリプレイ要求の送信に対応する。前述のタイミングは、現在、受信されている合成データに含まれる端末装置42からの音データに対応する音が端末装置42で取得されたタイミングである。以下では、リプレイ要求に応じてサーバ装置20から送信される音データを、他の音データ(合成データ及び後述する再合成データを含む)と区別する場合、「リプレイデータ」という。
The
報知情報64は、リプレイ情報が取得されたことを示す情報である。端末装置41で表示される遠隔会議画面60を対象とした場合、リプレイ情報は、自装置で過去に取得された音に対応するリプレイデータが、サーバ装置20から端末装置42,43の何れかの端末装置に送信されていることを示す情報である。端末装置41のリプレイデータは、端末装置42,43の何れかの端末装置で、端末装置41の撮影画像61及び端末IDに関連付けられた操作情報63に対応する入力が受け付けられた場合に、サーバ装置20から送信される。リプレイ情報は、リプレイデータの送信先(リプレイ要求の送信元)である端末装置の端末IDを含む。実施形態では、報知情報64は、「リプレイ中」とされている。報知情報64は、撮影画像61及び端末IDに関連付けられた状態で表示される。例えば、端末装置42で端末装置41の撮影画像61及び端末IDに関連付けられた操作情報63が押下され、端末装置41のリプレイデータが、サーバ装置20から端末装置42に送信されているとする。この場合、端末装置41で表示中の遠隔会議画面60では、報知情報64が、図2に示すように、端末IDが「USER42」である端末装置42の撮影画像61と共に表示される。操作情報63が押下された端末装置の撮影画像61が非表示である場合、リプレイ情報の取得に応じて、操作情報63が押下された端末装置の撮影画像61及び/又は端末IDと報知情報64が、互いに関連付けられた状態で遠隔会議画面60の所定の領域に表示される。
The
終了ボタン65は、遠隔会議の終了に対応する操作ボタンである。端末装置41のユーザは、遠隔会議を終了する場合、終了ボタン65を押下する。この場合、遠隔会議は終了し、サーバ装置20との間で確立されたセッションは、切断される。
The
操作部51は、端末装置41に対する各種の指示等の入力を受け付ける。操作部51は、キーボード及びマウスを含む。詳細は省略するが、キーボード及びマウスへの各操作に対応する入力情報を生成する処理は、公知のパーソナルコンピュータで採用されている技術であり、端末装置41でも採用される。スピーカ52は、音を出力する音出力部である。スピーカ52での出力対象は、例えば、上述したサーバ装置20から送信される合成データに対応する合成音である。通信部53は、端末装置41をネットワーク90に接続し、ネットワーク90を介したデータ通信を行う。端末装置41では、通信部53を介してサーバ装置20との間で各種のデータが送受信される。通信部53は、例えば、イーサネット(登録商標)規格に適合するインターフェース回路である。通信部53によるネットワーク90への接続は、無線接続又は有線接続の何れであってもよい。
The
接続I/F54は、端末装置41に所定の装置を接続するインターフェースである。接続I/F54は、例えば、USB(Universal Serial Bus)ポートを含むインターフェースである。接続I/F54は、無線通信モジュールを含むものであってもよい。無線通信モジュールとしては、Bluetooth(登録商標)に対応した通信モジュールが例示される。接続I/F54に接続されたカメラ56は、外界像を撮影する。端末装置41は、カメラを内蔵する構成であってもよい。接続I/F54に接続されたマイク57は、外界音を集音する集音部である。例えば、マイク57は、端末装置41のユーザが発した音声を集音する。
The connection I /
端末装置41は、音処理と変換処理とミキシング処理を含むクライアントプログラムが記憶装置48又はRAM49に記憶されている点が、公知の端末装置と相違する。但し、端末装置41は、ハードウェア的には、公知の端末装置と同じである。従って、端末装置41は、更に、公知の端末装置が備える構成を備える。
The
<遠隔会議システムで実行される処理>
遠隔会議システム10で、端末装置41,42,43による遠隔会議が行われる場合、端末装置41で実行される音処理と変換処理とミキシング処理と、サーバ装置20で実行される中継処理について説明する。端末装置41では、操作部51を介して、サーバ装置20のURLを対象とした操作が入力される。この操作が入力された場合、CPU47は、クライアントプログラムを起動する。このプログラムの起動に伴い、端末装置41は、サーバ装置20にアクセスし、サーバ装置20との間でセッションを確立する。サーバ装置20との間でセッションを確立する場合に端末装置41で実行される手順は、公知の遠隔会議システムにおける手順と同様である。従って、これに関する説明は、省略する。
<Processing executed by the remote conference system>
When a remote conference is performed by the
サーバ装置20との間でセッションが確立されることで、端末装置41は、会議IDによって識別される遠隔会議に参加した状態となる。即ち、端末装置41のユーザは、会議IDによって識別される遠隔会議が開催されるバーチャルな会議室に入室した状態となる。端末装置41では、サーバ装置20との間でセッションが確立されると、カメラ56で撮影された映像データとマイク57で集音された音に対応する音データが、通信部53からサーバ装置20に送信される。映像データと音データには、送信元を示す端末IDがそれぞれ含められる。例えば、端末装置41から送信される映像データと音データには、端末ID「USER41」が含められる。
As a session is established with the
サーバ装置20は、端末装置41,42,43との間でセッションが確立された場合、映像データを中継すると共に、所定の2台の端末装置からの音データを合成し、他の1台の端末装置に合成データを送信する。なお、端末装置41,42とセッションが確立され、端末装置43とはセッションが確立されていない場合、サーバ装置20から端末装置41に送信される合成データは、実質的には、端末装置42で集音された音に対応する音データであり、サーバ装置20から端末装置42に送信される合成データは、実質的には、端末装置41で集音された音に対応する音データである。即ち、前述した場合、サーバ装置20は、端末装置42からの音データを、そのまま端末装置41に送信し、端末装置41からの音データを、そのまま端末装置42に送信する。
When a session is established with the
端末装置41では、サーバ装置20との間でセッションが確立されると、表示部50に遠隔会議画面60が表示される。端末装置41では、サーバ装置20を経由して送信される、セッションが確立された端末装置(端末装置42,43の両方又は一方)からの映像データと合成データが、通信部53で受信される。表示部50に表示されている遠隔会議画面60では、受信された映像データに対応する撮影画像61が表示される。スピーカ52では、受信された合成データに対応する合成音が出力される。遠隔会議画面60では、撮影画像61に対して、その撮影画像61に対応する端末IDが表示される。更に、撮影画像61と端末IDに対する操作情報63が表示される。例えば、端末装置41では、CPU47は、撮影画像61と端末IDと操作情報63の表示指令を表示部50に出力する。これに伴い、表示部50には、例えば、図2に示すような遠隔会議画面60が表示される。但し、資料データが取得されていない場合、資料画像62は、表示されない。
In the
遠隔会議を終了させる場合、端末装置41では、操作部51が操作され、終了ボタン65が押下される。この場合、端末装置41では、セッションを切断する手順が、サーバ装置20との間で実行される。セッションの切断によって、端末装置41での遠隔会議は、終了する。サーバ装置20との間のセッションを切断する場合に端末装置41で実行される手順は、公知の遠隔会議システムにおける手順と同様である。従って、これに関する説明は、省略する。
When terminating the remote conference, in the
以下では、サーバ装置20と端末装置42,43との間でも、セッションが確立されているとする。端末装置42,43でも、端末装置41と同様、以下に説明する、音処理と変換処理とミキシング処理が実行される。従って、端末装置42,43でも、端末装置41と同様、遠隔会議画面60が表示され、合成データに対応する合成音と後述する再合成データに対応する再合成音が出力される。映像データを対象とする処理に関する説明は、公知の遠隔会議システムと同様であるため、省略する。
In the following, it is assumed that a session is also established between the
<音処理>
端末装置41で実行される音処理について、図3を参照して説明する。音処理は、サーバ装置20とのセッションが確立されたタイミングで開始される。CPU47は、リプレイ操作が受け付けられたかを判断する(S11)。リプレイ操作は、操作部51を介して遠隔会議画面60に含まれる操作情報63を押下する操作であり、操作部51によって受け付けられる。CPU47は、リプレイ操作の受け付けに応じて操作部51から出力される指令が取得された場合、リプレイ操作が受け付けられたと判断する。CPU47は、リプレイ操作と共に、押下された操作情報63が関連付けられた端末IDを取得する。リプレイ操作が受け付けられていない場合(S11:No)、CPU47は、処理をS15に移行する。
<Sound processing>
The sound processing executed by the
リプレイ操作が受け付けられた場合(S11:Yes)、CPU47は、リプレイ要求と要求元端末IDと要求先端末IDを送信させる(S13)。要求元端末IDは、リプレイ要求の送信元の端末装置の端末IDである。要求先端末IDは、S11でリプレイ操作と共に取得された端末IDである。要求元端末IDと要求先端末IDは、例えば、リプレイ要求に含まれてもよい。リプレイ要求と要求元端末ID及び要求先端末IDの送信先は、サーバ装置20とされる。CPU47は、リプレイ要求と要求元端末IDと要求先端末IDの送信指令を通信部53に出力する。送信指令に従い、リプレイ要求と要求元端末IDと要求先端末IDが、通信部53からサーバ装置20へと送信される。その後、CPU47は、処理をS15に移行する。
When the replay operation is accepted (S11: Yes), the
S15でCPU47は、合成データを取得する。合成データは、サーバ装置20から送信され、通信部53で受信される。CPU47は、通信部53を介して合成データを取得する。取得された合成データは、RAM49の領域Aに記憶される。続けて、CPU47は、リプレイデータが取得されたかを判断する(S17)。リプレイデータは、後述する図6のS79でサーバ装置20から送信される。リプレイデータが取得されていない場合(S17:No)、CPU47は、処理をS23に移行する。
In S15, the
上記では説明を省略したが、遠隔会議システム10において、端末装置41,42,43では、集音された音をA/D変換した波形データがエンコードされて音データが生成され、サーバ装置20に送信される。エンコードの方式としては、G.722.1とSpeexとOPUSが例示される。サーバ装置20では、端末装置41,42,43からの各音データがデコードされ、デコードされた状態で音データが合成されて合成データが生成される(後述する図6のS73参照)。その後、サーバ装置20では、合成データがエンコードされ、上述したように、所定の端末装置へと送信される。CPU47は、S15で取得されたエンコードされた合成データをデコードし、デコードされた合成データを、RAM49の領域Aに記憶させる。
Although not described above, in the
リプレイデータが取得された場合(S17:Yes)、CPU47は、変換処理を実行する(S19)。リプレイデータは、通信部53で受信される。CPU47は、通信部53を介してリプレイデータを取得する。取得されたリプレイデータは、RAM49の領域Bに記憶される。サーバ装置20からのリプレイデータは、合成データと同様、エンコードされた状態である。そのため、CPU47は、エンコードされたリプレイデータをデコードし、デコードされたリプレイデータを、RAM49の領域Bに記憶させる。変換処理は、取得されたリプレイデータの再生に影響する状態を、第一状態から第二状態へと変換する処理である。変換処理に関する説明は、後述する。その後、CPU47は、ミキシング処理を実行する(S21)。詳細は後述するが、ミキシング処理では、合成データ(S15参照)とリプレイデータ(S17:Yes参照)が合成され、新たな合成データが生成される(後述する図5のS55参照)。実施形態では、ミキシング処理で新たに生成される合成データを、「再合成データ」という。再合成データは、RAM49の領域Cに記憶される。ミキシング処理に関するこの他の説明は、後述する。S21を実行した後、CPU47は、処理をS23に移行する。
When the replay data is acquired (S17: Yes), the
S23でCPU47は、再生処理を実行する。再生処理の対象は、RAM49の領域Aに記憶された合成データ(S15参照)又はRAM49の領域Cに記憶された再合成データ(S21参照)とされる。S17が否定されていた場合(S17:No)、CPU47は、RAM49の領域Aに記憶された合成データを再生し、再生された合成音の出力指令をスピーカ52に出力する。S17が肯定されていた場合(S17:Yes)、CPU47は、RAM49の領域Cに記憶された再合成データを再生し、再生された再合成音の出力指令をスピーカ52に出力する。これに伴い、スピーカ52から合成音又は再合成音が出力される。
In S23, the
S23を実行した後、CPU47は、リプレイ情報が取得されたかを判断する(S25)。リプレイ情報は、後述する図6のS81でサーバ装置20から送信され、通信部53で受信される。CPU47は、通信部53を介してリプレイ情報を取得する。リプレイ情報が取得された場合(S25:Yes)、CPU47は、報知情報64を表示させる(S27)。CPU47は、取得されたリプレイ情報に含まれる端末IDを特定する。CPU47は、報知情報64の表示指令を表示部50に出力する。表示指令では、特定された端末IDに一致する端末IDと共に表示されている撮影画像61の領域の所定の位置が指定される。表示部50では、表示指令に従い、報知情報64が、前述した撮影画像61と重ね合わされた状態で表示される(図2参照)。リプレイ情報が取得されていない場合(S25:No)又はS27を実行した後、CPU47は、処理をS11に戻す。その後、CPU47は、再度、S11以降の処理を実行する。音処理は、サーバ装置20とのセッションが切断されるまで継続される。
After executing S23, the
<変換処理>
図3のS19で実行される変換処理について、図4を参照して説明する。変換処理は、デコードされた状態のリプレイデータを対象として実行される。CPU47は、RAM49の領域Bに記憶されたリプレイデータ(図3のS17:Yes参照)を、RAM49の領域Dに記憶させる(S31)。RAM49の領域Bに記憶されたリプレイデータは、RAM49の領域Dに記憶された後、RAM49の領域Bから消去される。続けて、CPU47は、速度変換処理を実行する(S33)。速度変換処理は、RAM49の領域Dに記憶されたリプレイデータを対象として実行される。速度変換処理は、リプレイデータのテンポを変換させる処理である。ここで、テンポの変換は、再生速度の変換に対応する。再生速度の変換とは、変換されたリプレイデータを再生した場合に、リプレイデータの再生に必要な時間が、変換前と比較して変化することを意味する。例えば、リプレイデータの再生速度を速くさせる場合、リプレイデータは、時間方向に間引かれた状態へと変換される。速度変換処理としては、例えば、タイムストレッチと称される公知の変換処理を採用することができる。従って、速度変換処理に関するこの他の説明は、省略する。
<Conversion processing>
The conversion process executed in S19 of FIG. 3 will be described with reference to FIG. The conversion process is executed on the replay data in the decoded state. The
次に、CPU47は、振幅変換処理を実行する(S35)。振幅変換処理は、RAM49の領域Dに記憶された速度変換処理後のリプレイデータを対象として実行される。振幅変換処理は、速度変換処理後のリプレイデータのボリューム(dB)を増幅させる処理である。振幅変換処理は、リプレイデータの振幅を増幅させる公知の処理を採用することができる。従って、振幅変換処理に関するこの他の説明は、省略する。振幅変換処理に伴い、RAM49の領域Dには、この処理の実行前のリプレイデータと比較し、ボリューム(dB)が増幅されたリプレイデータが記憶される。このリプレイデータは、デコードされた状態のままとされる。S35を実行した後、CPU47は、変換処理を終了する。
Next, the
<ミキシング処理>
図3のS21で実行されるミキシング処理について、図5を参照して説明する。ミキシング処理は、デコードされた状態の合成データ及びリプレイデータを対象として実行される。CPU47は、RAM49の領域Aに記憶された合成データ(図3のS15参照)を、RAM49の領域Cに記憶させる(S41)。RAM49の領域Aに記憶された合成データは、RAM49の領域Cに記憶された後、RAM49の領域Aから消去される。CPU47は、再合成データにおける合成データの音チャネルを、第一チャネルに設定する(S43)。例えば、再合成データがステレオのデータである場合、第一チャネルは、左右の音チャネルのうちの一方の音チャネル(例えば、右チャネル)である。
<Mixing process>
The mixing process executed in S21 of FIG. 3 will be described with reference to FIG. The mixing process is executed on the decoded composite data and replay data. The
続けて、CPU47は、第一減衰処理を実行する(S45)。第一減衰処理は、RAM49の領域Cに記憶された合成データを対象として実行される。第一減衰処理は、合成データのボリューム(dB)を減衰させる処理である。第一減衰処理における減衰比率は、第一比率とされる。第一比率については、後述する。第一減衰処理は、上述した振幅変換処理と同様、公知の処理を採用することができる。従って、第一減衰処理に関するこの他の説明は、省略する。
Subsequently, the
次に、CPU47は、RAM49の領域Dに記憶された変換処理後のリプレイデータ(図4のS35参照)を、RAM49の領域Cに記憶させる(S47)。RAM49の領域Dに記憶された変換処理後のリプレイデータは、RAM49の領域Cに記憶された後、RAM49の領域Dから消去される。CPU47は、再合成データにおけるリプレイデータの音チャネルを、第二チャネルに設定する(S49)。例えば、再合成データがステレオのデータである場合、第二チャネルは、左右の音チャネルのうちの他方の音チャネル(例えば、左チャネル)である。続けて、CPU47は、第二減衰処理を実行する(S51)。第二減衰処理は、RAM49の領域Cに記憶された合成データを対象として実行される。第二減衰処理は、合成データのボリューム(dB)を減衰させる処理である。第二減衰処理における減衰比率は、第二比率とされる。
Next, the
第一減衰処理(S45参照)での第一比率と第二減衰処理の第二比率の関係は、「第一比率>第二比率」とされる。第一比率と第二比率の関係は、「第一比率+第二比率=100%」としてもよい。例えば、第一比率は75%で、第二比率は25%とされる。第一減衰処理と第二減衰処理は、処理対象となるデータが相違するが、技術的には同一の処理である。第二減衰処理は、上述した振幅変換処理と同様、公知の処理を採用することができる。従って、第二減衰処理に関するこの他の説明は、省略する。 The relationship between the first ratio in the first attenuation process (see S45) and the second ratio in the second attenuation process is “first ratio> second ratio”. The relationship between the first ratio and the second ratio may be “first ratio + second ratio = 100%”. For example, the first ratio is 75% and the second ratio is 25%. The first attenuation process and the second attenuation process are technically the same process, although the data to be processed is different. As the second attenuation process, a known process can be adopted as in the above-described amplitude conversion process. Therefore, the other description regarding a 2nd attenuation process is abbreviate | omitted.
S51を実行した後、CPU47は、再合成データを生成する(S53)。CPU47は、RAM49の領域Cに記憶された、第一減衰処理後の合成データと第二減衰処理後のリプレイデータを合成する。このとき、合成データの音チャネルは、S43で設定された第一チャネルとされる。リプレイデータの音チャネルは、S49で設定された第二チャネルとされる。S53の実行後、合成データとリプレイデータは、RAM49の領域Cから消去され、RAM49の領域Cには、再合成データが記憶される。再合成データを生成する処理としては、複数の音データを合成する公知の処理を採用することができる。従って、再合成データの生成に関するこの他の説明は、省略する。S53を実行した後、CPU47は、ミキシング処理を終了する。
After executing S51, the
<中継処理>
サーバ装置20で実行される中継処理について、図6を参照して説明する。中継処理は、端末装置41,42,43のうちの何れかの端末装置とセッションが確立されたタイミングで開始される。実施形態では、上述した通り、端末装置41,42,43の全てとセッションが確立されているとする。CPU21は、端末装置41,42,43のうちの何れかの端末装置から送信された音データを取得する(S61)。音データは、通信部24で受信される。CPU21は、通信部24を介して音データを取得する。CPU21は、上述した通り、取得された音データをデコードする。取得された音データは、デコードされた状態で、RAM23の所定の領域に記憶される。
<Relay processing>
The relay process executed by the
CPU21は、S61と後述するS63〜S71の各処理を、セッションが確立されている端末装置41,42,43のそれぞれに対応させて実行する。即ち、サーバ装置20と端末装置41,42,43の間でセッションが確立されている場合、CPU21は、S61〜S71を3回繰り返す。例えば、1サイクル目のS61では、CPU21は、端末装置41からの音データを取得し、その後、S63〜S71を順次実行する。1サイクル目のS71を実行した後、CPU21は、処理をS61に戻し、2サイクル目のS61で端末装置42からの音データを取得し、S63〜S71を順次実行する。2サイクル目のS71を実行した後、CPU21は、再度、処理をS61に戻し、3サイクル目のS61で端末装置43からの音データを取得し、S63〜S71を順次実行する。CPU21は、セッションが確立されている端末装置の数分、S61〜S71を実行した後、処理をS73に移行する。
CPU21 performs each process of S61 and S63-S71 mentioned later corresponding to each of the
従って、中継処理では、RAM23に、接続リストに登録された端末ID毎に、音データを記憶する領域が確保される。実施形態では、端末装置41からの音データが記憶されるRAM23の領域を、「領域E」という。端末装置42からの音データが記憶されるRAM23の領域を、「領域F」という。端末装置43からの音データが記憶されるRAM23の領域を、「領域G」という。領域Eは、端末ID「USER41」に関連付けられる。領域Fは、端末ID「USER42」に関連付けられる。領域Gは、端末ID「USER43」に関連付けられる。例えば、取得された音データが端末ID「USER42」を含む音データである場合、この音データは、デコードされてRAM23の領域Fに記憶される。
Therefore, in the relay process, an area for storing sound data is secured in the
S61を実行した後、CPU21は、S61で取得された音データが無音状態の音データであるかを判断する(S63)。音データが無音状態であるかは、例えば、次のようにして判断される。判断対象とされる音データは、デコードされた状態の音データ(波形データ)である。無音状態は、取得された音データの振幅値が基準時間連続して基準値未満である状態に対応する。換言すれば、無音状態でない状態(有音状態)は、取得された音データの振幅値が基準時間連続して基準値以下とならない状態に対応する。基準時間は、例えば、ユーザが発言している場合の1音1音の間隔を考慮して予め決定される。基準値は、例えば、ユーザが、発言していると判断できる音のボリュームを考慮して予め決定される。基準値を、無音状態又は有音状態の何れとするかは、諸条件を考慮して適宜決定される。基準時間と基準値は、中継処理のプログラムに登録されている。解析される音データの振幅値としては、全ての周波数の波形の振幅値が解析の対象とされる。但し、特定の帯域の周波数の波形の振幅値を解析の対象としてもよい。特定の帯域としては、人が発する声の周波数帯域が例示される。この場合、取得された音データが音声以外の音が集音された音に対応する音データであった場合に、無音状態であると判断することができる。
After executing S61, the
音データが無音状態でない場合(S63:No)、CPU21は、この音データを記憶装置22の所定の領域に記憶させる(S65)。実施形態では、端末装置41からの音データが記憶される記憶装置22の領域を、「領域H」という。端末装置42からの音データが記憶される記憶装置22の領域を、「領域I」という。端末装置43からの音データが記憶される記憶装置22の領域を、「領域J」という。領域Hは、端末ID「USER41」に関連付けられる。領域Iは、端末ID「USER42」に関連付けられる。領域Jは、端末ID「USER43」に関連付けられる。例えば、取得された音データが端末ID「USER42」を含む音データである場合、この音データは、記憶装置22の領域Iに記憶される。既に記憶済みの音データがある場合、新たに記憶される今回の音データは、記憶済みの音データと結合するようにしてもよい。この場合、今回の音データの結合位置は、記憶済み音データの終端とされる。記憶装置22の領域H,I,Jに記憶された音データは、後述するS79でリプレイデータとして送信される。実施形態では、記憶装置22の領域H,I,Jに記憶された、要求元端末IDの端末装置に送信される前の音データについても、「リプレイデータ」という。S65におけるリプレイデータの記憶先は、RAM23としてもよい。
When the sound data is not silent (S63: No), the
音データが無音状態である場合(S63:Yes)、CPU21は、記憶装置22の所定の領域に記憶された音データを消去する(S67)。消去対象となる音データは、取得された音データに含まれる端末IDに対応する音データである。例えば、取得された音データが端末ID「USER43」を含む音データである場合、記憶装置22の領域Jに記憶されている音データは、消去される。
When the sound data is silent (S63: Yes), the
S65又はS67を実行した後、CPU21は、リプレイ要求が取得されたかを判断する(S69)。リプレイ要求は、上述した図3のS13で送信され、通信部24で受信される。このとき、通信部24では、要求先端末IDと要求元端末IDも受信される。CPU21は、通信部24を介してリプレイ要求と要求先端末IDと要求元端末IDを取得する。続けて、CPU21は、リプレイ要求に従い、取得された要求先端末IDを接続リストに登録する(S71)。CPU21は、リプレイ要求と共に取得される要求元端末IDに一致する接続リストに登録されている端末IDに関連付けて、要求先端末IDを登録する。
After executing S65 or S67, the
CPU21は、セッションが確立されている端末装置41,42,43の数分(3回)、S61〜S71を実行した後、処理をS73に移行する。S73でCPU21は、合成データを生成する。合成データは、RAM23の領域E,F,Gに記憶された音データのうちの2個の音データを合成して生成される。例えば、CPU21は、RAM23の領域F及び領域Gに記憶された端末装置42,43からの音データを合成し、端末装置41に送信される合成データを生成する。生成された合成データは、RAM23の領域Kに記憶される。領域Kに記憶される合成データには、送信先となる端末装置の端末ID(前述した例に基づけば、端末ID「USER41」)が関連付けられる。S73の実行後、RAM23の領域E,F,Gに記憶された音データは、領域E,F,Gから消去される。S73では、S63で無音状態と判断(S63:No)される音データについては、合成対象から除外するようにしてもよい。この場合、端末装置41,42,43に対応させて3回繰り返されるS61で取得された音データが、全て無音状態である場合、S73及び後述するS75は、スキップされる。合成データを生成する処理としては、複数の音データを合成する公知の処理を採用することができる。従って、合成データの生成に関するこの他の説明は、省略する。
The
続けて、CPU21は、合成データを送信させる(S75)。合成データの送信先は、セッションが確立されている端末装置41,42,43とされる。CPU21は、端末ID「USER41」が関連付けられた端末装置41への合成データの送信指令を通信部24に出力する。CPU21は、端末ID「USER42」が関連付けられた端末装置42への合成データの送信指令を通信部24に出力する。CPU21は、端末ID「USER43」が関連付けられた端末装置43への合成データの送信指令を通信部24に出力する。前述した各送信指令に従い、合成データが、通信部24から端末装置41,42,43へと順次送信される。送信に際し、合成データは、エンコードされる。S75の実行後、合成データは、RAM23の領域Kから消去される。
Subsequently, the
次に、CPU21は、接続リストに要求先端末IDが記憶されているかを判断する(S77)。CPU21は、接続テーブルにアクセスする。要求先端末IDが登録されている場合(S77:Yes)、CPU21は、リプレイデータを送信させる(S79)。CPU21は、接続テーブルから、セッションが確立されている端末装置41,42,43の端末ID「USER41,42,43」とこれら端末IDに関連付けられた要求先端末IDを特定する。リプレイデータの送信先は、接続テーブルで、要求先端末IDが関連付けられた端末IDの端末装置とされる。CPU21は、記憶装置22の領域H,I,Jのうち、要求先端末IDに一致する端末IDに関連付けられた記憶装置22の領域に記憶されているリプレイデータを読み出す。続けて、CPU21は、読み出されたリプレイデータの送信指令を通信部24に出力する。送信指令に従い、リプレイデータが、通信部24から、送信先として設定された端末装置へと送信される。送信に際し、リプレイデータは、エンコードされる。
Next, the
続けて、CPU21は、リプレイ情報を送信させる(S81)。リプレイ情報には、S79で特定された要求先端末IDが関連付けられた端末ID(要求元端末ID)が含められる。リプレイ情報の送信先は、S79で特定された要求先端末IDの端末装置に設定される。CPU21は、リプレイ情報の送信指令を通信部24に出力する。送信指令に従い、リプレイ情報が、通信部24から送信先として設定された端末装置へと送信される。要求先端末IDが登録されていない場合(S77:No)又はS81を実行した後、CPU21は、処理をS61に戻す。その後、CPU21は、再度、S61以降の処理を実行する。中継処理は、全ての端末装置41,42,43とのセッションが切断されるまで継続される。
Subsequently, the
<実施形態の効果>
実施形態によれば、次のような効果を得ることができる。この説明では、端末装置41,42,43による遠隔会議に関する内容は、端末装置41を主体として記載する。
<Effect of embodiment>
According to the embodiment, the following effects can be obtained. In this description, the contents related to the remote conference by the
(1)遠隔会議システム10で実施される端末装置41,42,43による遠隔会議において、サーバ装置20では、端末装置41,42,43から順次送信される音データが取得される(図6のS61参照)。順次取得される端末装置41からの音データは、記憶装置22の領域Hに繰り返して記憶され、順次取得される端末装置42からの音データは、記憶装置22の領域Iに繰り返して記憶され、順次取得される端末装置43からの音データは、記憶装置22の領域Jに繰り返して記憶される(図6のS65参照)。サーバ装置20では、例えば、端末装置42,43からの音データを合成した合成データが生成され、この合成データが、端末装置41に送信される(図6のS73、S75参照)。
(1) In the remote conference by the
端末装置41では、遠隔会議画面60に、端末装置42の撮影画像61及び端末ID「USER42」に関連付けて操作情報63が表示され、端末装置43の撮影画像61及び端末ID「USER43」に関連付けて操作情報63が表示される(図2参照)。端末装置41では、操作部51を介した操作情報63の押下に伴い、リプレイ操作が受け付けられた場合、リプレイ要求と要求元端末IDと要求先端末IDがサーバ装置20に送信される(図3のS11:Yes、S13参照)。サーバ装置20では、リプレイ要求と共に取得される要求先端末IDに対応するリプレイデータが、端末装置41に送信される(図6のS79参照)。端末装置41では、リプレイデータが取得され、合成データとリプレイデータを合成した再合成データが生成される(図3のS17:Yes、図5のS53参照)。端末装置41では、再合成データが再生され、合成データに対応する合成音とリプレイデータに対応する音を含む再合成音が、スピーカ52から出力される(図3のS23参照)。
In the
そのため、遠隔会議システム10では、例えば、端末装置41で、端末装置42,43でそれぞれ現在取得されている最新の音と、端末装置42,43の何れかの端末装置で過去に取得された音を、同時に出力させることができる。端末装置41のユーザに、端末装置42,43の各ユーザの現在の発言内容を認識させつつ、端末装置41のユーザが聞き逃した端末装置42,43の何れかのユーザの過去の発言内容を、認識させることができる。実施形態におけるリプレイ要求は、端末装置41で、端末装置42,43の何れかの端末装置で過去に取得された音が出力される点を考慮すると、次のような指示ということもできる。即ち、リプレイ要求は、最新の音が取得されたタイミングより前に端末装置42,43のうちの何れかの端末装置で取得された過去の音の再生を要求する指示ということもできる。
Therefore, in the
(2)端末装置41では、リプレイデータが取得された場合、変換処理が実行される(図3のS17:Yes、S19及び図4参照)。変換処理では、リプレイデータは、速度変換処理によって再生速度が速くなる状態へと変換される(図4のS33参照)。そのため、再合成データを対象とした再生処理(図3のS23参照)において、リプレイデータに対応する音の再生時間を短くすることができる。端末装置41のユーザに、聞き逃した端末装置42,43の何れかのユーザの過去の発言内容を、迅速に認識させることができる。
(2) In the
(3)端末装置41では、リプレイデータが取得された場合、ミキシング処理が実行される(図3のS17:Yes、S21及び図5参照)。ミキシング処理では、合成データは、第一比率だけ減衰され、リプレイデータは、第二比率だけ減衰される(図5のS45、S51参照)。第二比率は、第一比率より小さな値とされる。第一比率だけ減衰された合成データと第二比率だけ減衰されたリプレイデータが合成され、再合成データが生成される(図5のS53参照)。その際、合成データの音チャネルは、第一チャネルとされ、リプレイデータの音チャネルは、第二チャネルとされる(図5のS43、S49参照)。そのため、再合成データを対象とした再生処理(図3のS23参照)において、リプレイデータに対応する音を、第一チャネルから出力される合成データに対応する合成音より大きなボリュームで、第二チャネルから出力させることができる。端末装置41のユーザに、聞き逃した端末装置42,43の何れかのユーザの過去の発言内容を、スムーズに認識させることができる。
(3) In the
(4)例えば、端末装置42から、リプレイ要求と要求元端末ID「USER42」と要求先端末ID「USER41」が送信され、サーバ装置20で、これらが取得された場合、サーバ装置20では、端末装置41に、リプレイ情報が送信される(図6のS81参照)。端末装置41では、リプレイ情報の取得に応じて、報知情報64が表示される(図3のS27参照)。その際、報知情報64は、取得されたリプレイ情報に含まれる端末ID「USER42」と共に表示されている撮影画像61の領域の所定の位置に表示される(図2参照)。そのため、端末装置41のユーザに、端末装置42で、自身の発言内容が聞き直されていることを報知することができる。
(4) For example, when the replay request, the request source terminal ID “USER42”, and the request destination terminal ID “USER41” are transmitted from the
(5)サーバ装置20では、取得された音データが無音状態であるかが判断され、音データが無音状態でない場合、音データが、記憶装置22の領域H,I,Jのうち、音データに含まれる端末IDに対応する領域に記憶される(図6のS63:No、S65参照)。これに対して、取得された音データが無音状態である場合、それまでに記憶された音データが消去される(図6のS63:Yes、S67参照)。そのため、リプレイ要求に応じて送信される音データを、無音状態ではない音データとすることができる。音データの記憶を、無音状態から無音状態までの期間とすることができる。
(5) In the
<変形例>
実施形態は、次のようにすることもできる。以下に示す変形例のうちの幾つかの構成は、適宜組み合わせて採用することもできる。以下では、上記とは異なる点を説明することとし、同様の点についての説明は、適宜省略する。
<Modification>
The embodiment can also be performed as follows. Some configurations of the modifications shown below can be appropriately combined and employed. Hereinafter, points different from the above will be described, and description of similar points will be omitted as appropriate.
(1)上記では、サーバ装置20で、合成データが生成され、生成された合成データが、端末装置41,42,43に適宜送信される(図6のS73、S75参照)。サーバ装置20は、音データを合成することなく、取得された音データを、音データの送信元以外の端末装置に送信するようにしてもよい。例えば、サーバ装置20は、端末装置42,43からの音データを、合成することなく、端末装置41に送信する。この場合、図6の中継処理では、S63〜S79は省略される。
(1) In the above, the
端末装置41,42,43では、次のような処理が実行される。ここでは、端末装置41を例として説明する。端末装置41では、サーバ装置20から送信される端末装置42,43からの2個の音データが、受信される。CPU47は、通信部53を介して前述の2個の音データを取得する。CPU47は、取得された各音データをデコードし、デコードされた各音データを対象として、図6のS63〜S67に対応する処理を実行する。CPU47は、リプレイ操作が受け付けられた場合(図3のS11:Yes参照)、自装置の記憶装置48の所定の領域から、操作情報63が関連付けられた端末IDの音データを取得し(図3のS17:Yes参照)、上記同様、S19以降の処理を実行する。CPU47は、自装置の端末ID(上記に準じて「要求元端末ID」という)と、操作情報63が関連付けられた端末ID(上記に準じて「要求先端末ID」という)を含むリプレイ情報を、サーバ装置20に送信する。
In the
サーバ装置20では、CPU21は、通信部24を介して、このリプレイ情報を取得する。続けて、CPU21は、リプレイ情報を送信させる。リプレイ情報の送信先は、要求先端末IDの端末装置とされる。この端末装置では、リプレイ情報に含まれる要求元端末IDに従い、図3のS27が実行される。
In the
(2)上記では説明を省略したが、遠隔会議システム10では、公知の遠隔会議システムと同様、端末装置41,42,43のそれぞれに対して、所定の役割が設定される。役割としては、主催者と発表者と参加者が例示される。これら3つの役割について、主催者は最上位の役割であり、発表者と参加者は、主催者より下位の役割である。発表者は、参加者より上位の役割である。図6のS63では、例えば、判断条件となる基準時間及び/又は振幅値の基準値は、役割に応じて適宜変更するようにしてもよい。例えば、上位の役割程、基準時間を長く設定するようにしてもよい。この他、無音状態であるかに関わらず、一定時間、音データを記憶するようにしてもよい。この場合も、前述した一定時間は、役割に応じて変更するようにしてもよい。例えば、上位の役割程、音データを長い時間記憶させるようにしてもよい。
(2) Although not described above, in the
(3)上記では、音データが取得される毎に、取得された音データが無音であるかが判断され、取得された1個の音データが、無音状態である場合、それまでに記憶された音データが消去される(図6のS61、S63:Yes、S67参照)。S63の判断は、同一の端末装置から取得される音データが、例えば、予め定めた回数又は時間連続して無音状態であった場合、肯定(図6のS63:Yes参照)されるようにしてもよい。この場合、端末装置毎に、無音状態の音データが連続して取得された回数、又は無音状態の音データの時間がカウントされる。サーバ装置20と端末装置41,42,43の間を送受信される音データを、一定時間(例えば、20msec)のデータとした場合、無音状態の音データが連続して取得された回数をカウントすることで、無音状態である時間を計測することができる。無音状態の判断条件となる基準時間は、上記の場合と比較し、長い時間に設定される。
(3) In the above, every time the sound data is acquired, it is determined whether the acquired sound data is silent, and if the acquired single sound data is in the silent state, it is stored until then. The sound data is deleted (see S61, S63: Yes, S67 in FIG. 6). The determination in S63 is made so that the sound data acquired from the same terminal device is affirmed (see S63: Yes in FIG. 6) when, for example, the sound data is silent for a predetermined number of times or continuously. Also good. In this case, for each terminal device, the number of times that silent sound data is continuously acquired or the time of silent data is counted. When the sound data transmitted and received between the
(4)上記では、変換処理(図4参照)では、S33で速度変換処理が実行される。速度変換処理は、省略してもよい。速度変換処理は、リプレイデータの再生速度を遅くする処理(テンポを遅くする処理)であってもよい。変換処理では、S35で振幅変換処理が実行される。ミキシング処理(図5参照)では、S51で第二減衰処理が実行される。振幅変換処理又は第二減衰処理の一方は、省略してもよい。例えば、振幅変換処理は、省略してもよい。 (4) In the above, in the conversion process (see FIG. 4), the speed conversion process is executed in S33. The speed conversion process may be omitted. The speed conversion process may be a process of slowing down the playback speed of replay data (a process of slowing down the tempo). In the conversion process, the amplitude conversion process is executed in S35. In the mixing process (see FIG. 5), the second attenuation process is executed in S51. One of the amplitude conversion process and the second attenuation process may be omitted. For example, the amplitude conversion process may be omitted.
10 遠隔会議システム
20 サーバ装置
21 CPU
22 記憶装置
23 RAM
24 通信部
25 バス
41,42,43 端末装置
47 CPU
48 記憶装置
49 RAM
50 表示部
51 操作部
52 スピーカ
53 通信部
54 接続インターフェース(接続I/F)
55 バス
56 カメラ
57 マイク
60 遠隔会議画面
61 撮影画像
62 資料画像
63 操作情報
64 報知情報
65 終了ボタン
90 ネットワーク
10
22
24
48
50
55
Claims (11)
前記第一端末装置と、前記ネットワークに接続された第二端末装置と、による前記ネットワークを介した遠隔会議を実行するサーバ装置から送信される、前記第二端末装置で集音された第一タイミングの第一音に少なくとも対応する第一音データを取得する第一取得処理と、
前記第二端末装置で集音された前記第一タイミングより前の第二タイミングの第二音に対応する第二音データの送信を要求する第一リプレイ要求を、前記サーバ装置へと送信させる第一送信処理と、
前記サーバ装置から送信される前記第二音データを取得する第二取得処理と、
前記第一音データと前記第二音データとを合成した第一合成データを生成する第一ミキシング処理と、
前記第一合成データを再生し、再生された第一合成音を出力させる再生処理と、
前記第二音データの再生に影響する状態を第一状態から第二状態へと変換する変換処理と、を実行させ、
前記第一ミキシング処理は、前記第一音データと、前記第二状態へと変換された前記第二音データと、を合成する処理である、プログラム。 To the computer that controls the first terminal device connected to the network,
First timing collected by the second terminal device, transmitted from a server device that executes a remote conference via the network by the first terminal device and a second terminal device connected to the network A first acquisition process for acquiring first sound data corresponding to at least the first sound;
A first replay request for requesting transmission of second sound data corresponding to a second sound at a second timing before the first timing collected by the second terminal device is sent to the server device. One transmission process,
A second acquisition process for acquiring the second sound data transmitted from the server device;
A first mixing process for generating first synthesized data obtained by synthesizing the first sound data and the second sound data;
A reproduction process for reproducing the first synthesized data and outputting the reproduced first synthesized sound;
A conversion process for converting the state affecting the reproduction of the second sound data from the first state to the second state ;
The first mixing process is a program that synthesizes the first sound data and the second sound data converted into the second state .
前記第一端末装置と、前記ネットワークに接続された第二端末装置と、による前記ネットワークを介した遠隔会議を実行するサーバ装置から送信される、前記第二端末装置で集音された第一タイミングの第一音に少なくとも対応する第一音データを取得する第一取得処理と、
前記第二端末装置で集音された前記第一タイミングより前の第二タイミングの第二音に対応する第二音データの送信を要求する第一リプレイ要求を、前記サーバ装置へと送信させる第一送信処理と、
前記サーバ装置から送信される前記第二音データを取得する第二取得処理と、
前記第一音データと前記第二音データとを合成した第一合成データを生成する第一ミキシング処理と、
前記第一合成データを再生し、再生された第一合成音を出力させる再生処理と、
前記第一音データを、第一比率だけ減衰させる第一減衰処理と、
前記第二音データを、前記第一比率より小さな第二比率だけ減衰させる第二減衰処理と、を実行させ、
前記第一ミキシング処理は、減衰された前記第一音データと、減衰された前記第二音データと、を合成する処理である、プログラム。 To the computer that controls the first terminal device connected to the network,
First timing collected by the second terminal device, transmitted from a server device that executes a remote conference via the network by the first terminal device and a second terminal device connected to the network A first acquisition process for acquiring first sound data corresponding to at least the first sound;
A first replay request for requesting transmission of second sound data corresponding to a second sound at a second timing before the first timing collected by the second terminal device is sent to the server device. One transmission process,
A second acquisition process for acquiring the second sound data transmitted from the server device;
A first mixing process for generating first synthesized data obtained by synthesizing the first sound data and the second sound data;
A reproduction process for reproducing the first synthesized data and outputting the reproduced first synthesized sound;
A first attenuation process for attenuating the first sound data by a first ratio ;
A second attenuation process for attenuating the second sound data by a second ratio smaller than the first ratio;
The first mixing process is a program that combines the attenuated first sound data and the attenuated second sound data.
前記第一端末装置と、前記ネットワークに接続された第二端末装置と、による前記ネットワークを介した遠隔会議を実行するサーバ装置から送信される、前記第二端末装置で集音された第一タイミングの第一音に少なくとも対応する第一音データを取得する第一取得処理と、First timing collected by the second terminal device, transmitted from a server device that executes a remote conference via the network by the first terminal device and a second terminal device connected to the network A first acquisition process for acquiring first sound data corresponding to at least the first sound;
前記第二端末装置で集音された前記第一タイミングより前の第二タイミングの第二音に対応する第二音データの送信を要求する第一リプレイ要求を、前記サーバ装置へと送信させる第一送信処理と、A first replay request for requesting transmission of second sound data corresponding to a second sound at a second timing before the first timing collected by the second terminal device is sent to the server device. One transmission process,
前記サーバ装置から送信される前記第二音データを取得する第二取得処理と、A second acquisition process for acquiring the second sound data transmitted from the server device;
前記第一音データと前記第二音データとを合成した第一合成データを生成する第一ミキシング処理と、A first mixing process for generating first synthesized data obtained by synthesizing the first sound data and the second sound data;
前記第一合成データを再生し、再生された第一合成音を出力させる再生処理と、A reproduction process for reproducing the first synthesized data and outputting the reproduced first synthesized sound;
前記第二端末装置に対応する相手先情報と、前記第一リプレイ要求の送信に対応する操作情報と、を関連付けて表示させる第一表示処理と、を実行させ、A first display process for displaying the destination information corresponding to the second terminal device and the operation information corresponding to the transmission of the first replay request in association with each other;
前記第一送信処理は、前記相手先情報と前記操作情報とが表示されている状態で、前記操作情報に対する入力が受け付けられた場合、前記第一リプレイ要求と、前記遠隔会議で前記第二端末装置を識別する端末情報と、を前記サーバ装置へと送信させる処理である、プログラム。In the first transmission process, when the destination information and the operation information are displayed and an input to the operation information is received, the second terminal is used in the first replay request and the remote conference. A program which is a process of transmitting terminal information for identifying a device to the server device.
前記第一端末装置と、前記ネットワークに接続された第二端末装置と、による前記ネットワークを介した遠隔会議を実行するサーバ装置から送信される、前記第二端末装置で集音された第一タイミングの第一音に少なくとも対応する第一音データを取得する第一取得処理と、First timing collected by the second terminal device, transmitted from a server device that executes a remote conference via the network by the first terminal device and a second terminal device connected to the network A first acquisition process for acquiring first sound data corresponding to at least the first sound;
前記第二端末装置で集音された前記第一タイミングより前の第二タイミングの第二音に対応する第二音データの送信を要求する第一リプレイ要求を、前記サーバ装置へと送信させる第一送信処理と、A first replay request for requesting transmission of second sound data corresponding to a second sound at a second timing before the first timing collected by the second terminal device is sent to the server device. One transmission process,
前記サーバ装置から送信される前記第二音データを取得する第二取得処理と、A second acquisition process for acquiring the second sound data transmitted from the server device;
前記第一音データと前記第二音データとを合成した第一合成データを生成する第一ミキシング処理と、A first mixing process for generating first synthesized data obtained by synthesizing the first sound data and the second sound data;
前記第一合成データを再生し、再生された第一合成音を出力させる再生処理と、A reproduction process for reproducing the first synthesized data and outputting the reproduced first synthesized sound;
前記第一端末装置で集音された第三音に対応する第三音データを、前記サーバ装置へと送信させる第二送信処理と、Second transmission processing for transmitting third sound data corresponding to the third sound collected by the first terminal device to the server device;
前記サーバ装置から送信される、前記第一端末装置で集音された、前記第一タイミングより前の第三タイミングの前記第三音に対応する前記第三音データが前記サーバ装置から前記第二端末装置に送信されていることを示すリプレイ情報を取得する第三取得処理と、The third sound data transmitted from the server device and collected by the first terminal device and corresponding to the third sound at the third timing before the first timing is transmitted from the server device to the second A third acquisition process for acquiring replay information indicating transmission to the terminal device;
前記リプレイ情報が取得された場合、前記第二端末装置に対応する相手先情報と、前記リプレイ情報の取得を示す報知情報と、を関連付けて表示させる第二表示処理と、を実行させる、プログラム。A program for executing, when the replay information is acquired, a second display process for displaying the destination information corresponding to the second terminal device and the notification information indicating the acquisition of the replay information in association with each other.
前記第一ミキシング処理は、前記第一音データを、前記複数の音チャネルのうちの第一チャネルに合成し、前記第二音データを、前記複数の音チャネルのうちの第二チャネルに合成する処理である、請求項1から請求項5の何れか1項に記載のプログラム。 The first synthesized data is composed of a plurality of sound channels,
In the first mixing process, the first sound data is combined with a first channel of the plurality of sound channels, and the second sound data is combined with a second channel of the plurality of sound channels. The program according to any one of claims 1 to 5 , which is a process.
前記第一端末装置と、前記ネットワークに接続された第二端末装置と、による前記ネットワークを介した遠隔会議を実行するサーバ装置から送信される、前記第二端末装置で集音された第一タイミングの第一音に少なくとも対応する第一音データを取得する第一取得処理と、First timing collected by the second terminal device, transmitted from a server device that executes a remote conference via the network by the first terminal device and a second terminal device connected to the network A first acquisition process for acquiring first sound data corresponding to at least the first sound;
前記第二端末装置で集音された前記第一タイミングより前の第二タイミングの第二音に対応する第二音データの送信を要求する第一リプレイ要求を、前記サーバ装置へと送信させる第一送信処理と、A first replay request for requesting transmission of second sound data corresponding to a second sound at a second timing before the first timing collected by the second terminal device is sent to the server device. One transmission process,
前記サーバ装置から送信される前記第二音データを取得する第二取得処理と、A second acquisition process for acquiring the second sound data transmitted from the server device;
前記第一音データと前記第二音データとを合成した第一合成データを生成する第一ミキシング処理と、A first mixing process for generating first synthesized data obtained by synthesizing the first sound data and the second sound data;
前記第一合成データを再生し、再生された第一合成音を出力させる再生処理と、A reproduction process for reproducing the first synthesized data and outputting the reproduced first synthesized sound;
前記第二音データの再生に影響する状態を第一状態から第二状態へと変換する変換処理と、A conversion process for converting the state affecting the reproduction of the second sound data from the first state to the second state;
前記第一音データを、第一比率だけ減衰させる第一減衰処理と、A first attenuation process for attenuating the first sound data by a first ratio;
前記第二音データを、前記第一比率より小さな第二比率だけ減衰させる第二減衰処理と、A second attenuation process for attenuating the second sound data by a second ratio smaller than the first ratio;
前記第二端末装置に対応する相手先情報と、前記第一リプレイ要求の送信に対応する操作情報と、を関連付けて表示させる第一表示処理と、A first display process for displaying the destination information corresponding to the second terminal device and the operation information corresponding to the transmission of the first replay request in association with each other;
前記第一端末装置で集音された第三音に対応する第三音データを、前記サーバ装置へと送信させる第二送信処理と、Second transmission processing for transmitting third sound data corresponding to the third sound collected by the first terminal device to the server device;
前記サーバ装置から送信される、前記第一端末装置で集音された、前記第一タイミングより前の第三タイミングの前記第三音に対応する前記第三音データが前記サーバ装置から前記第二端末装置に送信されていることを示すリプレイ情報を取得する第三取得処理と、The third sound data transmitted from the server device and collected by the first terminal device and corresponding to the third sound at the third timing before the first timing is transmitted from the server device to the second A third acquisition process for acquiring replay information indicating transmission to the terminal device;
前記リプレイ情報が取得された場合、前記第二端末装置に対応する相手先情報と、前記リプレイ情報の取得を示す報知情報と、を関連付けて表示させる第二表示処理と、を実行させ、When the replay information is acquired, the second display process for displaying the destination information corresponding to the second terminal device and the notification information indicating the acquisition of the replay information in association with each other is executed.
前記第一ミキシング処理は、前記第一音データと、前記第二状態へと変換された前記第二音データと、を合成する処理であり、The first mixing process is a process of combining the first sound data and the second sound data converted into the second state,
前記変換処理は、前記第一状態の前記第二音データを、前記第二音データの再生速度が前記第一状態より速い前記第二状態へと間引く処理であり、The conversion process is a process of thinning the second sound data in the first state to the second state where the reproduction speed of the second sound data is faster than the first state,
前記第一合成データは、複数の音チャネルから構成され、The first synthesized data is composed of a plurality of sound channels,
前記第一ミキシング処理は、更に、The first mixing process further includes:
前記第一音データを、前記複数の音チャネルのうちの第一チャネルに合成し、前記第二音データを、前記複数の音チャネルのうちの第二チャネルに合成する処理で、且つ、A process of combining the first sound data with a first channel of the plurality of sound channels, and combining the second sound data with a second channel of the plurality of sound channels; and
減衰された前記第一音データと、減衰された前記第二音データと、を合成する処理であり、A process of synthesizing the attenuated first sound data and the attenuated second sound data;
前記第一送信処理は、前記相手先情報と前記操作情報とが表示されている状態で、前記操作情報に対する入力が受け付けられた場合、前記第一リプレイ要求と、前記遠隔会議で前記第二端末装置を識別する端末情報と、を前記サーバ装置へと送信させる処理である、プログラム。In the first transmission process, when the destination information and the operation information are displayed and an input to the operation information is received, the second terminal is used in the first replay request and the remote conference. A program which is a process of transmitting terminal information for identifying a device to the server device.
前記ネットワークに接続された第一端末装置と、前記ネットワークに接続された第二端末装置と、前記ネットワークに接続された第三端末装置と、による前記ネットワークを介した遠隔会議において、前記第二端末装置から送信される、前記第二端末装置で集音された第四音に対応する第四音データを取得する第四取得処理と、
取得された前記第四音データを記憶させる第一記憶処理と、
前記遠隔会議において、前記第三端末装置から送信される、前記第三端末装置で集音された第五音に対応する第五音データを取得する第五取得処理と、
第一タイミングの前記第四音に対応する前記第四音データと、前記第一タイミングの前記第五音に対応する前記第五音データと、を合成した第二合成データを生成する第二ミキシング処理と、
前記第二合成データを、前記第一端末装置へと送信させる第三送信処理と、
前記第一端末装置から送信される、前記第一タイミングより前の第二タイミングの前記第四音に対応する前記第四音データの送信を要求する第二リプレイ要求を取得する第六取得処理と、
前記第二リプレイ要求が取得された場合、前記第二タイミングの前記第四音に対応する前記第四音データを、前記第一端末装置に送信させる第四送信処理と、を実行させるプログラム。 To the computer that controls the server device connected to the network,
In a remote conference via the network by a first terminal device connected to the network, a second terminal device connected to the network, and a third terminal device connected to the network, the second terminal A fourth acquisition process for acquiring fourth sound data corresponding to the fourth sound collected by the second terminal device transmitted from the device;
A first storage process for storing the acquired fourth sound data;
In the remote conference, a fifth acquisition process of acquiring fifth sound data corresponding to the fifth sound collected by the third terminal device, transmitted from the third terminal device;
Second mixing for generating second synthesized data obtained by synthesizing the fourth sound data corresponding to the fourth sound at the first timing and the fifth sound data corresponding to the fifth sound at the first timing. Processing,
A third transmission process for transmitting the second composite data to the first terminal device;
A sixth acquisition process for acquiring a second replay request for requesting transmission of the fourth sound data corresponding to the fourth sound at the second timing before the first timing, transmitted from the first terminal device; ,
When the second replay request is acquired, a program for executing a fourth transmission process for causing the first terminal device to transmit the fourth sound data corresponding to the fourth sound at the second timing.
前記第一端末装置と前記第二端末装置と前記第三端末装置とによる前記ネットワークを介した遠隔会議において、前記第二端末装置から送信される、前記第二端末装置で集音された第六音に対応する第六音データを取得する工程と、
取得された前記第六音データを記憶する工程と、
前記遠隔会議において、前記第三端末装置から送信される、前記第三端末装置で集音された第七音に対応する第七音データを取得する工程と、
第一タイミングの前記第六音に対応する前記第六音データと、前記第一タイミングの前記第七音に対応する前記第七音データと、を合成した第三合成データを生成する工程と、
前記第三合成データを再生し、再生された第二合成音を出力する工程と、
前記第一タイミングより前の第二タイミングの前記第六音の再生を要求するリプレイ要求を取得する工程と、
前記リプレイ要求が取得された場合、前記第三合成データと、前記第二タイミングの前記第六音に対応する前記第六音データと、を合成した第四合成データを生成する工程と、
前記第四合成データを再生し、再生された第三合成音を出力する工程と、を含む遠隔会議方法。 A remote conference method executed in a remote conference system including a first terminal device, a second terminal device, a third terminal device, and a server device connected to a network,
In a remote conference via the network by the first terminal device, the second terminal device, and the third terminal device, a sixth sound collected from the second terminal device and transmitted from the second terminal device Obtaining sixth sound data corresponding to the sound;
Storing the acquired sixth sound data;
Obtaining the seventh sound data corresponding to the seventh sound collected by the third terminal device transmitted from the third terminal device in the remote conference;
Generating third synthesized data obtained by synthesizing the sixth sound data corresponding to the sixth sound at the first timing and the seventh sound data corresponding to the seventh sound at the first timing;
Reproducing the third synthesized data and outputting the reproduced second synthesized sound;
Obtaining a replay request for requesting reproduction of the sixth sound at a second timing prior to the first timing;
When the replay request is acquired, generating fourth synthesized data obtained by synthesizing the third synthesized data and the sixth sound data corresponding to the sixth sound at the second timing;
Reproducing the fourth synthesized data and outputting the reproduced third synthesized sound.
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2015250701A JP6390607B2 (en) | 2015-12-22 | 2015-12-22 | Program and remote conference method |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2015250701A JP6390607B2 (en) | 2015-12-22 | 2015-12-22 | Program and remote conference method |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2017118281A JP2017118281A (en) | 2017-06-29 |
JP6390607B2 true JP6390607B2 (en) | 2018-09-19 |
Family
ID=59230962
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2015250701A Expired - Fee Related JP6390607B2 (en) | 2015-12-22 | 2015-12-22 | Program and remote conference method |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP6390607B2 (en) |
Family Cites Families (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP3826827B2 (en) * | 2002-04-08 | 2006-09-27 | 日本電気株式会社 | Speech management system for remote conference system |
JP2010085688A (en) * | 2008-09-30 | 2010-04-15 | Seiko Epson Corp | Projector, conference system, sound source direction determination method, and camera control method |
-
2015
- 2015-12-22 JP JP2015250701A patent/JP6390607B2/en not_active Expired - Fee Related
Also Published As
Publication number | Publication date |
---|---|
JP2017118281A (en) | 2017-06-29 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN110730952B (en) | Method and system for processing audio communication on network | |
US9386278B2 (en) | Teleconference method, storage medium storing program for teleconference, and terminal apparatus | |
US20160294892A1 (en) | Storage Medium Storing Program, Server Apparatus, and Method of Controlling Server Apparatus | |
WO2019071808A1 (en) | Video image display method, apparatus and system, terminal device, and storage medium | |
JP5211001B2 (en) | Conference communication system, conference communication method and program | |
JP7500574B2 (en) | Method, apparatus, device and computer program for executing a stand-alone program | |
JP2015126524A (en) | Remote conference program, terminal device, and remote conference method | |
JP6390607B2 (en) | Program and remote conference method | |
JP2019176375A (en) | Moving image output apparatus, moving image output method, and moving image output program | |
JP2013183280A (en) | Information processing device, imaging device, and program | |
JP2008141348A (en) | Communication apparatus | |
JP2019176386A (en) | Communication terminals and conference system | |
JP3031320B2 (en) | Video conferencing equipment | |
JP2017158137A (en) | Conference system | |
JP5777233B1 (en) | Movie generation apparatus and movie generation method | |
JP5889162B2 (en) | CONFERENCE SUPPORT DEVICE, CONFERENCE SUPPORT SYSTEM, METHOD AND PROGRAM | |
JP2020135556A (en) | Processing device, program, and processing method | |
JP2012004756A (en) | Terminal device, conference system, and processing program | |
JP6399001B2 (en) | Remote conference method and program | |
WO2013146510A1 (en) | Conference system, program and conference method | |
US20230035219A1 (en) | Teleconference method and teleconference system | |
WO2022201431A1 (en) | Information processing device, participant terminal, assistance system, information processing method, assistance method, and assistance program | |
WO2024032111A1 (en) | Data processing method and apparatus for online conference, and device, medium and product | |
JP6610572B2 (en) | Editing device | |
JP2022130028A (en) | karaoke system |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20170922 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20180531 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20180605 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20180620 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20180724 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20180806 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 6390607 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
LAPS | Cancellation because of no payment of annual fees |