JP3604817B2 - Voice transmission system and receiving terminal - Google Patents
Voice transmission system and receiving terminal Download PDFInfo
- Publication number
- JP3604817B2 JP3604817B2 JP17199496A JP17199496A JP3604817B2 JP 3604817 B2 JP3604817 B2 JP 3604817B2 JP 17199496 A JP17199496 A JP 17199496A JP 17199496 A JP17199496 A JP 17199496A JP 3604817 B2 JP3604817 B2 JP 3604817B2
- Authority
- JP
- Japan
- Prior art keywords
- voice
- audio
- data
- packet
- decoding
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired - Fee Related
Links
Images
Landscapes
- Data Exchanges In Wide-Area Networks (AREA)
- Small-Scale Networks (AREA)
Description
【0001】
【発明の属する技術分野】
本発明は、音声伝送システム及び受信端末に関し、より具体的には、例えば遠隔地間で音声を伝送する音声伝送システム及び受信端末に関する。
【0002】
【従来の技術】
遠隔地間で音声を伝送する音声伝送システムでは、符号化された音声データを通信回線を介して伝送し、受信側で、復号化して音声出力している。
【0003】
【発明が解決しようとする課題】
従来例では、受信側は、受信した音声情報を単純に復号化して音声出力しているだけであり、伝送遅延は全く考慮されていない。つまり、従来例では、音声伝送で遅延が生じた場合、遅延された状態で音声が再生されている。
【0004】
本発明はこのような問題点を解決し、伝送遅延を解消する音声伝送システム及び受信端末を提示することを目的とする。
【0005】
本発明はまた、一連の音声ストリーム中で長さの異なる遅延が生じていても、その遅延の影響を緩和又は抑制する音声伝送システム及び受信端末を提示することを目的とする。
【0006】
【課題を解決するための手段】
本発明に係る音声伝送システムは、ネットワーク上の複数の端末がそれぞれ、音声符号化手段と、音声復号化手段と、受信音声情報を一時格納するバッファと、受信した符号化音声データが無音か否かを判定する無音/有音判定手段とを具備し、これら複数の端末間で音声を伝送する音声伝送システムであって、送信側端末は、音声情報に予め音声送信開始時点の時間情報を付加してネットワークに送出し、受信側端末は、受信した音声情報に付加される前記時間情報と実時間との差が予め決められた値以上の場合に、無音データの復号化をバイパスすることを特徴とする。
本発明に係る受信端末は、ネットワーク上の送信端末から送信された符号化音声データを受信する受信端末であって、前記受信した符号化音声データを一時格納するバッファと、前記バッファに格納された符号化音声データを復号化する音声復号化手段と、前記受信した符号化音声データが無音か否かを判定する判定手段と、前記受信した音声情報に対して前記送信端末で付加された音声送信の開始時点の時間情報と実時間情報との差が予め定められた値以上の場合、前記判定手段によって無音データと判定された無音データの復号化をバイパスする制御手段とを具備することを特徴とする。
【0007】
【発明の実施の形態】
以下、図面を参照して本発明の実施の形態を詳細に説明する。
【0008】
図1は、本発明の一実施例の概略構成ブロック図を示す。ローカル・エリア・ネットワーク(LAN)などの通信ネットワーク10に、音声通信端末20,40が接続する。音声通信端末20,40は共に同じ構成からなり、コンピュータ22,42にマイク24,44とスピーカ26,46が接続し、コンピュータ22,42には、受信音声を一時格納する音声バッファ28,48、受信音声の無音/有音を判定する無音/有音判定手段30,50、音声符号化手段32,52及び音声復号化手段34,54を具備する。手段30,32,34;50,52,54はそれぞれ、ソフトウエア、ハードウエア又はソフトウエアとハードウエアからなる。音声バッファ28,48は基本的にはFIFO(先入れ先出し)メモリであり、その容量は、利用可能なメモリ容量の範囲内で任意に変更可能である。
【0009】
コンピュータ22,42はまた、全体を制御するCPU、各種プログラム及びデータ等を記憶するROM、ネットワーク10に対するデータ送受信手段、並びにユーザが操作する操作手段などを備えている。音声は、PCM方式で取り込まれる。
【0010】
端末20と端末40は互いに双方向に音声を伝送できるが、ここでは、端末20から端末40に音声を伝送する場合の動作を説明する。端末20のマイク24により取り込まれた音声は、音声符号化手段32により符号化される。符号化された音声データは、本実施例では、1秒分の音声データを1つのパケット・データとして、1パケット・データずつネットワーク10を介して端末40に転送される。
【0011】
端末40はネットワーク10から入力したパケット・データをバッファ48に格納する。無音/有音判定手段50は、バッファ48に格納されたパケット・データが無音かどうかを調べる。具体的には、端末20が、音声を取り込んだときに、1パケット毎に音声データの分散を算出し、得られた分散が所定値以下の時に、そのパケットの部分は無音であるとして、データ’0’をそのパケットに入れる。従って、受信側の端末40の無音/有音判定手段50は、受信したパケットのデータが’0’であれば、それは無音のパケットであるとする。伝送すべき音声信号と、パケットとの関係の一例を図2に示す。4つ目のパケットが無音になる。
【0012】
図3は、端末40における音声再生処理のフローチャートである。バッファ48に1以上のパケットが格納されるのを待ち(S1)、1以上のパケットがあれば(S1)、パケットが1個かどうかを調べる(S2)。音声伝送に遅延が生じていない時、バッファ48内の音声パケットの個数は、常に1つである。パケットが1つならば(S2)、そのパケットの符号化音声データを音声復号化手段54に供給する(S4)。音声復号化手段54は入力する符号化音声データを復号化し、スピーカ46に供給して音声出力させる。音声出力したパケットはバッファ48から抹消して(S5)、S1に戻る。
【0013】
2つ以上のパケットがあると(S2)、音声の再生に遅延が生じているので、無音のパケットの音声出力をパスする。即ち、無音/有音判定手段50が先頭のパケットが無音かどうかを調べ(S3)、無音であれば、そのパケットをバッファ48から抹消してS1に戻り(S5)、有音であれば(S3)、その先頭パケットの符号化音声データを音声復号化手段54により復号化させ、スピーカ46から音声出力させる(S4)。音声出力したパケットはバッファ48から抹消して(S5)、S1に戻る。
【0014】
音声再生に遅延が生じているときに、本実施例では、無音データの再生出力をパスするので、その無音の時間だけ、音声再生の遅延を解消できる。
【0015】
上記実施例では、音声送信側が、無音部分のパケットに特定データを埋め込んだが、送信する各パケットに時間情報を入れてもよい。その時間情報は、時刻情報であっても、音声送信の開始時点からの経過時間情報であってもよい。この場合、図4に示すように、端末20での送信すべき音声の入力と、端末40における受信音声の再生出力との間には、送信側での音声符号化、伝送及び受信側での音声復号化に要する時間に相当する微小時間の遅れが発生する。この遅れをδtとする。
【0016】
図5は、このような変更例における音声受信端末40での音声処理のフローチャートを示す。
【0017】
バッファ48から先頭パケットを取り出し(S11)、そのパケットの時間情報を実時間と比較し、差が微小時間δt以下であれば(S12)、音声再生に深刻な遅延が生じていないことになり、そのパケットの符号化音声データを復号化して音声出力し(S14)、そのパケットをバッファ48から消去して(S15)、次のパケットの処理(S11)に戻る。
【0018】
差がδtより大きければ(S12)、深刻な遅延が生じていることになり、先頭パケットが無音かどうかを調べる(S13)。無音のパケットであれば(S13)、復号化せずにバッファ48から抹消し(S15)、次のパケットの処理(S11)に戻る。無音でなければ(S13)、そのパケットの符号化音声データを復号化して音声出力し(S14)、そのパケットをバッファ48から消去して(S15)、次のパケットの処理(S11)に戻る。
【0019】
このように、無音のパケットを復号化(及び音声出力)しないので、その無音の区間だけ、音声の遅延を解消できる。
【0020】
【発明の効果】
以上の説明から容易に理解できるように、本発明によれば、伝送等による音声再生の遅延を、再生音声出力に影響しないような形で効果的に解消できる。
【図面の簡単な説明】
【図1】本発明の一実施例の概略構成ブロック図である。
【図2】音声とパケットとの対応を示す模式図である。
【図3】本実施例の音声再生処理のフローチャートである。
【図4】伝送遅延等の遅延の説明図である。
【図5】本実施例の変更例の音声再生処理のフローチャートである。
【符号の説明】
10:通信ネットワーク
20,40:音声通信端末
22,42:コンピュータ
24,44:マイク
26,46:スピーカ
28,48:音声バッファ
30,50:無音/有音判定手段
32,52:音声符号化手段
34,54:音声復号化手段[0001]
TECHNICAL FIELD OF THE INVENTION
The present invention relates to a voice transmission system and a receiving terminal , and more specifically, to a voice transmission system and a receiving terminal for transmitting voice between remote locations, for example.
[0002]
[Prior art]
2. Description of the Related Art In a voice transmission system for transmitting voice between remote locations, encoded voice data is transmitted via a communication line, and the receiving side decodes and outputs voice.
[0003]
[Problems to be solved by the invention]
In the conventional example, the receiving side simply decodes the received audio information and outputs the audio, and does not consider transmission delay at all. That is, in the conventional example, when a delay occurs in the audio transmission, the audio is reproduced in a delayed state.
[0004]
An object of the present invention is to solve such a problem and to present a voice transmission system and a receiving terminal that eliminate transmission delay.
[0005]
Another object of the present invention is to provide an audio transmission system and a receiving terminal that reduce or suppress the influence of a delay having a different length even in a series of audio streams.
[0006]
[Means for Solving the Problems]
In the audio transmission system according to the present invention, a plurality of terminals on the network each include an audio encoding unit, an audio decoding unit, a buffer for temporarily storing received audio information, and whether received encoded audio data is silent. A voice transmission system for transmitting voice between the plurality of terminals, wherein the transmitting terminal adds time information at the start of voice transmission to the voice information in advance. And transmitting it to the network, and the receiving terminal, if the difference between the time information added to the received voice information and the real time is equal to or greater than a predetermined value, bypasses the decoding of silence data. Features.
The receiving terminal according to the present invention is a receiving terminal that receives coded voice data transmitted from a transmitting terminal on a network, and a buffer that temporarily stores the received coded voice data, and a buffer that is stored in the buffer. Voice decoding means for decoding coded voice data, determining means for determining whether or not the received coded voice data is silent, voice transmission added to the received voice information by the transmitting terminal And control means for bypassing the decoding of the silence data determined as silence data by the judgment means when the difference between the time information at the start time and the real time information is equal to or greater than a predetermined value. And
[0007]
BEST MODE FOR CARRYING OUT THE INVENTION
Hereinafter, embodiments of the present invention will be described in detail with reference to the drawings.
[0008]
FIG. 1 shows a schematic block diagram of an embodiment of the present invention.
[0009]
The
[0010]
Although the
[0011]
The
[0012]
FIG. 3 is a flowchart of the audio reproduction process in the
[0013]
If there are two or more packets (S2), the audio output of the silent packet is passed because the reproduction of the audio is delayed. That is, the silent / sound determining means 50 checks whether the first packet is silent (S3). If there is no sound, the packet is deleted from the
[0014]
In this embodiment, when a delay occurs in the sound reproduction, the reproduction output of the silent data is passed, so that the delay of the sound reproduction can be eliminated only during the silent period.
[0015]
In the above embodiment, the voice transmitting side embeds the specific data in the packet of the silence part, but time information may be inserted in each packet to be transmitted. The time information may be time information or elapsed time information from the start of voice transmission. In this case, as shown in FIG. 4, between the input of the audio to be transmitted at the terminal 20 and the reproduction output of the received audio at the terminal 40, the audio encoding on the transmission side, the transmission and the transmission A small time delay corresponding to the time required for speech decoding occurs. This delay is defined as δt.
[0016]
FIG. 5 shows a flowchart of audio processing in the
[0017]
The first packet is extracted from the buffer 48 (S11), the time information of the packet is compared with the real time, and if the difference is less than the minute time δt (S12), no serious delay has occurred in the audio reproduction. The encoded audio data of the packet is decoded and output as audio (S14), the packet is deleted from the buffer 48 (S15), and the process returns to the next packet processing (S11).
[0018]
If the difference is larger than δt (S12), it means that a serious delay has occurred, and it is checked whether or not the head packet is silent (S13). If the packet is a silent packet (S13), the packet is deleted from the
[0019]
As described above, since the silent packet is not decoded (and the voice is not output), the delay of the voice can be eliminated only in the silent section.
[0020]
【The invention's effect】
As can be easily understood from the above description, according to the present invention, the delay of sound reproduction due to transmission or the like can be effectively eliminated without affecting the reproduced sound output.
[Brief description of the drawings]
FIG. 1 is a schematic block diagram of an embodiment of the present invention.
FIG. 2 is a schematic diagram showing correspondence between voice and packets.
FIG. 3 is a flowchart of a sound reproduction process according to the embodiment.
FIG. 4 is an explanatory diagram of a delay such as a transmission delay.
FIG. 5 is a flowchart of a sound reproduction process according to a modification of the embodiment.
[Explanation of symbols]
10:
Claims (2)
前記受信した符号化音声データを一時格納するバッファと、A buffer for temporarily storing the received encoded audio data,
前記バッファに格納された符号化音声データを復号化する音声復号化手段と、Audio decoding means for decoding the encoded audio data stored in the buffer,
前記受信した符号化音声データが無音か否かを判定する判定手段と、Determining means for determining whether or not the received encoded voice data is silent;
前記受信した音声情報に対して前記送信端末で付加された音声送信の開始時点の時間情報と実時間情報との差が予め定められた値以上の場合、前記判定手段によって無音データと判定された無音データの復号化をバイパスする制御手段If the difference between the time information at the start of voice transmission added by the transmitting terminal to the received voice information and the real-time information is greater than or equal to a predetermined value, the voice data is determined to be silent data by the determination unit. Control means for bypassing the decoding of silence data
とを具備することを特徴とする受信端末。A receiving terminal comprising:
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP17199496A JP3604817B2 (en) | 1996-07-02 | 1996-07-02 | Voice transmission system and receiving terminal |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP17199496A JP3604817B2 (en) | 1996-07-02 | 1996-07-02 | Voice transmission system and receiving terminal |
Publications (2)
Publication Number | Publication Date |
---|---|
JPH1023067A JPH1023067A (en) | 1998-01-23 |
JP3604817B2 true JP3604817B2 (en) | 2004-12-22 |
Family
ID=15933563
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP17199496A Expired - Fee Related JP3604817B2 (en) | 1996-07-02 | 1996-07-02 | Voice transmission system and receiving terminal |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP3604817B2 (en) |
Families Citing this family (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
EP1045559A1 (en) * | 1999-04-13 | 2000-10-18 | Lucent Technologies Inc. | Medium access control (MAC) method in a cellular packet system |
US7324635B2 (en) | 2000-05-04 | 2008-01-29 | Telemaze Llc | Branch calling and caller ID based call routing telephone features |
JP5680430B2 (en) * | 2011-01-31 | 2015-03-04 | 沖電気工業株式会社 | Voice packet communication system |
RU2766575C2 (en) * | 2017-07-21 | 2022-03-15 | Сони Корпорейшн | Transmitting module, transmission method, receiving module, receiving method and program |
-
1996
- 1996-07-02 JP JP17199496A patent/JP3604817B2/en not_active Expired - Fee Related
Also Published As
Publication number | Publication date |
---|---|
JPH1023067A (en) | 1998-01-23 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US9437216B2 (en) | Method of transmitting data in a communication system | |
US8155285B2 (en) | Switchboard for dual-rate single-band communication system | |
US7742466B2 (en) | Switchboard for multiple data rate communication system | |
JP2001298479A (en) | Internet telephone system | |
JP2000332829A (en) | Reception data quantity control method in telephone system, device therefor and storage medium recording its method | |
JP2000270024A (en) | Method for exchanging capability of frame packet processing size in internet phone, terminal utilizing internet phone and medium recording program of internet phone | |
JP3604817B2 (en) | Voice transmission system and receiving terminal | |
JP3014366B2 (en) | Internet telephone communication method and apparatus, and recording medium storing the program | |
JP4561301B2 (en) | Audio reproduction device and program for controlling reproduction and stop of audio | |
JP2005157045A (en) | Voice transmission method | |
JPH10322673A (en) | Communication equipment/method and storage medium | |
US20050169245A1 (en) | Arrangement and a method for handling an audio signal | |
US6785234B1 (en) | Method and apparatus for providing user control of audio quality | |
JP3172774B2 (en) | Variable silence suppression controller for voice | |
JPH08251313A (en) | Voice/data transmitter | |
JP4432257B2 (en) | Image / audio information communication system | |
JP2804534B2 (en) | Voice packet transmitting device and receiving device | |
JP2002077241A (en) | Asynchronous voice data processing system | |
JP2550690B2 (en) | Voice packet transfer method | |
JP3492561B2 (en) | Communication voice processing device and storage medium storing voice processing program | |
JP3398484B2 (en) | Packet transmitting device, packet receiving device, and multipoint voice communication system | |
JPH01241240A (en) | Voice packet processor | |
WO2005122575A1 (en) | Communication device | |
JPH11150562A (en) | Real time sound communication equipment | |
JP2004032225A (en) | Two-way communication system |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20040331 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20040622 |
|
A521 | Written amendment |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20040820 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20040914 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20040930 |
|
R150 | Certificate of patent or registration of utility model |
Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20071008 Year of fee payment: 3 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20081008 Year of fee payment: 4 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20091008 Year of fee payment: 5 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20091008 Year of fee payment: 5 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20101008 Year of fee payment: 6 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20101008 Year of fee payment: 6 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20111008 Year of fee payment: 7 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20111008 Year of fee payment: 7 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20121008 Year of fee payment: 8 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20131008 Year of fee payment: 9 |
|
LAPS | Cancellation because of no payment of annual fees |