JP3796240B2 - Network telephone and voice decoding apparatus - Google Patents
Network telephone and voice decoding apparatus Download PDFInfo
- Publication number
- JP3796240B2 JP3796240B2 JP2003336494A JP2003336494A JP3796240B2 JP 3796240 B2 JP3796240 B2 JP 3796240B2 JP 2003336494 A JP2003336494 A JP 2003336494A JP 2003336494 A JP2003336494 A JP 2003336494A JP 3796240 B2 JP3796240 B2 JP 3796240B2
- Authority
- JP
- Japan
- Prior art keywords
- buffer
- packet
- stored
- jitter
- jitter absorption
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired - Fee Related
Links
Images
Landscapes
- Data Exchanges In Wide-Area Networks (AREA)
- Telephone Function (AREA)
Description
この発明は、インターネット電話機等のVoIPを利用したネットワーク電話機および音声復号化装置に関する。 The present invention relates to a network telephone and a voice decoding apparatus using VoIP such as an Internet telephone.
例えば、インターネットを使用して音声通話を行うインターネット電話が既に開発されている。インターネット電話は、"VoIP" という技術を利用している。VoIP(Voice over Internet Protocol)は、インターネットやイントラネットなどのTCP/IPネットワーク上で音声通話を行う、つまり音声データを送受信することを可能にする技術である。 For example, Internet telephones that make voice calls using the Internet have already been developed. Internet telephones use a technology called "VoIP". VoIP (Voice over Internet Protocol) is a technology that enables a voice call over a TCP / IP network such as the Internet or an intranet, that is, transmission / reception of voice data.
インターネット電話では、従来の電話機とは異なり、音声を圧縮した後にパケット化して、IPネットワークを通して通話するものである。この種の通話装置では、IPネットワークの状況によって、パケットの到達時刻にばらつきが生じる( ジッタ) 場合が多い。つまり、IPネットワークを経由して到達するパケットの間隔は一定ではないことが多い。しかしながら、パケット受信側において復号化音声を連続的に出力するためには、符号化データを一定間隔で復号器に渡す必要がある。そこで、図1に示すように復号器102の前段にジッタを吸収するためのジッタ吸収バッファ101が設けられている。
Unlike conventional telephones, Internet telephones compress voices, packetize them, and talk over IP networks. In this type of communication device, there are many cases where the arrival time of packets varies (jitter) depending on the state of the IP network. That is, the interval between packets that arrive via the IP network is often not constant. However, in order to continuously output decoded speech on the packet receiving side, it is necessary to pass the encoded data to the decoder at regular intervals. Therefore, as shown in FIG. 1, a
ジッタ吸収バッファ101は、複数のパケットを記憶するための複数のバッファ部(パケット記憶部)を備えている。ジッタ吸収バッファ101のバッファ部には、到達したパケットが、パケット番号の順番で左側から順番に格納されていく。最も左側のバッファ部に格納されているパケットが一定時間毎に読み出されて復号器102に渡される。復号器102に1パケットが渡されると、ジッタ吸収バッファ101内の他のパケットが左側に1つずつシフトされる。復号器102は、ジッタ吸収バッファ101から渡されたパケット(符号化データ)を復号化して出力する。
The
図2(a)に示すように、ジッタ吸収バッファ101の最も左端に格納されているパケットが復号器に渡される時刻において、到達パケットが格納されるバッファ部の位置を表す分布を、パケット到達時刻の分布ということにする。このような分布をパケット到達時刻の分布と呼ぶのは、この分布は、ジッタ吸収バッファ101の左端を原点とし、右方向に時刻をとり、上方向に確率をとった場合において、到達パケットが格納される時刻の分布を表したことになるからである。
As shown in FIG. 2A, at the time when the packet stored at the leftmost end of the
パケット到達時刻の分布が図2(a)に示すようなS0である場合には、ジッタ吸収バッファ101は効率よく働く。図2(a)に示すパケットの到達時刻の分布S0では、左から5番目のパケット部に到達パケットが格納される確率が最も高くなっている。
When the packet arrival time distribution is S0 as shown in FIG. 2A, the
通話中にIPネットワークにおける固定的な遅延が減少した場合、ジッタ吸収バッファ101に到達するパケットの分布は、図2(b)に示すように、S0からS1に移動する。この場合、IPネットワークにおける固定的な遅延は少なくなっているにもかかわらず、ジッタ吸収バッファ101において、固定的に時間Tの遅延が生じることとなり、円滑な通話に支障をきたす。
When the fixed delay in the IP network decreases during a call, the distribution of packets that reach the
通話中にIPネットワークにおける固定的な遅延が増加した場合、ジッタ吸収バッファ101に到達するパケットの分布は、図2(c)に示すように、S0からS2に移動する。この場合、ジッタ吸収バッファ101から外れた部分に到達するパケットは復号器102に出力することができず、パケット損失と同様に音声品質が劣化する。
When the fixed delay in the IP network increases during a call, the distribution of packets reaching the
通話中にIPネットワークにおけるジッタ量が増加した場合、ジッタ吸収バッファ101に到達するパケットの分布は、図2(d)に示すように、S0からS3に変化する。この場合、ジッタ吸収バッファ101から外れた部分に到達するパケットは復号器102に出力することができず、パケット損失と同様に音声品質が劣化する。
When the amount of jitter in the IP network increases during a call, the distribution of packets reaching the
通話中にIPネットワークにおけるジッタ量が減少した場合、ジッタ吸収バッファ101に到達するパケットの分布は、図2(e)に示すように、S0からS4に変化する。この場合、IPネットワークにおけるジッタを吸収するために必要なバッファ量が少なくなるにもかかわらず、ジッタ吸収バッファ101において固定的に時間Tの遅延が生じることとなり、ジッタ吸収バッファ101の利用効率が悪い。
When the amount of jitter in the IP network decreases during a call, the distribution of packets reaching the
パケットの到達時刻の分布を最適な分布にするためには、ジッタ吸収バッファ101内に格納されているパケットの数を調整することが考えられる。例えば、パケット到達時刻の分布が、図2(b)または図2(e)のような場合には、ジッタ吸収バッファ101内に格納されているパケットを廃棄(間引き)することによって、パケットの到達時刻の分布を最適な分布にする。また、パケットの到達時刻の分布が、図2(c)または図2(d)のような場合には、ジッタ吸収バッファ101内に格納されているパケットを複製することによって、パケット到達時刻の分布を最適な分布にする。
In order to optimize the distribution of arrival times of packets, it is conceivable to adjust the number of packets stored in the
しかしながら、ジッタ吸収バッファ101内に格納されているパケットの数(パケット蓄積量)を調整する手法では、パケットの廃棄や複製によって、出力音声の品質が劣化するという問題がある。 However, the method of adjusting the number of packets stored in the jitter absorption buffer 101 (packet accumulation amount) has a problem that the quality of output sound is deteriorated due to packet discard or duplication.
なお、ジッタ吸収バッファ101内に格納されているパケットを廃棄(間引き)するか複製するかの判別は、従来は複数のパケットの到達遅延偏差を算出し、算出された到達遅延偏差に基づいて行っている。しかしながら、この判別方法では、信頼性の高い到達遅延偏差(統計量)を算出するためには、十分なデータ量が必要となるため、ジッタ吸収バッファ101内のパケット蓄積量制御に遅延が生ずるという問題がある。
Note that the determination of whether to discard (decimate) or duplicate the packet stored in the
なお、ジッタ吸収バッファ101内のパケット蓄積量を制御することは、言い換えれば、ジッタ吸収バッファにパケットが格納されてからそのパケットが復号されるまでの遅延時間を制御することである。
Note that controlling the amount of accumulated packets in the
この発明は、ジッタ吸収バッファ内に格納されているパケットの廃棄や複製を行うことなく、パケットの到達時刻の分布を最適な分布となるように調整できるネットワーク電話機および音声復号化装置を提供することを目的とする。 The present invention provides a network telephone and a speech decoding apparatus that can adjust the distribution of arrival times of packets to an optimum distribution without discarding or duplicating the packets stored in the jitter absorption buffer. With the goal.
また、この発明は、ジッタ吸収バッファにパケットが格納されてから復号されるまでの遅延時間を制御する際に、制御遅延を小さくできるネットワーク電話機および音声復号化装置を提供することを目的とする。 Another object of the present invention is to provide a network telephone and a speech decoding apparatus that can reduce the control delay when controlling the delay time from when a packet is stored in a jitter absorption buffer to when it is decoded.
この発明による第1の音声復号化装置は、受信パケットを格納するための複数のバッファ部を有するジッタ吸収バッファと、ジッタ吸収バッファに格納されているパケットを復号化するための復号手段とを備えており、復号手段にパケットを出力するジッタ吸収バッファの出力端側のパケットのパケット番号を基準として、受信パケットがジッタ吸収バッファにおける当該受信パケットのパケット番号に対応した位置に格納される音声復号化装置において、復号手段によって得られた復号化音声信号に対して再生速度の変換を行うための再生速度変更手段、再生速度変更手段から出力されるデジタル音声信号を一時的に蓄積する出力バッファ、出力バッファに蓄積されたデジタル音声信号を所定時間間隔で読み出す手段、ジッタ吸収バッファへの受信パケットの格納位置に基づいて、再生速度変更手段を制御する再生速度制御手段、ならびに出力バッファのデータ蓄積量に基づいて、復号手段による復号タイミングを制御する復号タイミング制御手段を備えており、ジッタ吸収バッファ内に、ジッタ吸収バッファの出力端から所要数のバッファ部からなる第1領域と、第1領域よりジッタ吸収バッファの他端側において所要数のバッファ部からなる第2領域と、第2領域よりジッタ吸収バッファの他端側において所要数のバッファ部からなる第3領域とが設定されており、再生速度制御手段は、ジッタ吸収バッファ内の第1領域に受信パケットが格納される場合に、再生速度が遅くなるように再生速度変更手段を制御し、ジッタ吸収バッファ内の第3領域に受信パケットが所定回数連続して格納された場合には、再生速度が早くなるように、再生速度変更手段を制御するものであることを特徴とする。 A first speech decoding apparatus according to the present invention comprises a jitter absorption buffer having a plurality of buffer units for storing received packets, and a decoding means for decoding packets stored in the jitter absorption buffer. Audio decoding in which the received packet is stored at a position corresponding to the packet number of the received packet in the jitter absorbing buffer with reference to the packet number of the packet on the output end side of the jitter absorbing buffer that outputs the packet to the decoding means In the apparatus, reproduction speed changing means for converting the reproduction speed on the decoded audio signal obtained by the decoding means, an output buffer for temporarily storing the digital audio signal output from the reproduction speed changing means, and output means for reading the digital audio signals stored in the buffer at a predetermined time interval, jitter buffer Based in the storage position of the received packet, the reproduction speed control means for controlling the playback speed change means, and based on the amount of data stored in the output buffer comprises a decoding timing control means for controlling the decoding timing by the decoding means, In the jitter absorption buffer, a first area consisting of a required number of buffer sections from the output end of the jitter absorption buffer, a second area consisting of a required number of buffer sections on the other end side of the jitter absorption buffer from the first area, The third area composed of the required number of buffer sections is set on the other end side of the jitter absorption buffer from the two areas, and the reproduction speed control means stores the received packet in the first area in the jitter absorption buffer. In addition, the playback speed changing means is controlled so that the playback speed becomes slow, and a received packet is received a predetermined number of times in the third area in the jitter absorption buffer. When stored continue to, as the playback speed becomes faster, and characterized in that for controlling the reproduction speed changing unit.
復号タイミング制御手段としては、例えば、出力バッファのデータ蓄積量が所定の基準量より少なくなったときに、復号手段にパケットの復号化を要求するものが用いられる。 As the decoding timing control means, for example, a means for requesting the decoding means to decode a packet when the data accumulation amount of the output buffer becomes smaller than a predetermined reference amount is used.
この発明による第2の音声復号化装置は、受信パケットを格納するための複数のバッファ部を有するジッタ吸収バッファと、ジッタ吸収バッファに格納されているパケットを復号化するための復号手段とを備えており、復号手段にパケットを出力するジッタ吸収バッファの出力端側のパケットのパケット番号を基準として、受信パケットがジッタ吸収バッファにおける当該受信パケットのパケット番号に対応した位置に格納される音声復号化装置において、ジッタ吸収バッファ内に、ジッタ吸収バッファの出力端から所要数のバッファ部からなる第1領域と、第1領域よりジッタ吸収バッファの他端側において所要数のバッファ部からなる第2領域と、第2領域よりジッタ吸収バッファの他端側において所要数のバッファ部からなる第3領域とが設定されており、ジッタ吸収バッファ内の第1領域に受信パケットが格納される場合に、ジッタ吸収バッファにパケットが格納されてからそのパケットが復号されるまでの遅延時間が長くなるような制御を行い、ジッタ吸収バッファ内の第3領域に受信パケットが所定回数連続して格納された場合には、ジッタ吸収バッファにパケットが格納されてからそのパケットが復号されるまでの遅延時間が短くなるような制御を行う遅延時間制御手段を備えていることを特徴とする。 A second speech decoding apparatus according to the present invention comprises a jitter absorbing buffer having a plurality of buffer units for storing received packets, and a decoding means for decoding the packets stored in the jitter absorbing buffer. Audio decoding in which the received packet is stored at a position corresponding to the packet number of the received packet in the jitter absorbing buffer with reference to the packet number of the packet on the output end side of the jitter absorbing buffer that outputs the packet to the decoding means In the apparatus, in the jitter absorption buffer, a first area composed of a required number of buffer sections from the output end of the jitter absorption buffer, and a second area composed of the required number of buffer sections on the other end side of the jitter absorption buffer from the first area. And a third region comprising a required number of buffer portions on the other end side of the jitter absorption buffer from the second region When the received packet is stored in the first area in the jitter absorption buffer, the delay time from when the packet is stored in the jitter absorption buffer until the packet is decoded is increased. If the received packet is stored continuously in the third area in the jitter absorption buffer for a predetermined number of times, the delay time from when the packet is stored in the jitter absorption buffer to when the packet is decoded is shortened. A delay time control means for performing such control is provided .
遅延時間制御手段としては、たとえば、復号手段によって得られた復号化音声信号に対して再生速度の変換を行うための再生速度変更手段、再生速度変更手段から出力されるデジタル音声信号を一時的に蓄積する出力バッファ、出力バッファに蓄積されたデジタル音声信号を所定時間間隔で読み出す手段、ジッタ吸収バッファ内の第1領域に受信パケットが格納される場合に、再生速度が遅くなるように、再生速度変更手段を制御し、ジッタ吸収バッファ内の第3領域に受信パケットが所定回数連続して格納された場合には、再生速度が早くなるように、再生速度変更手段を制御する手段、ならびに出力バッファのデータ蓄積量に基づいて、復号手段による復号タイミングを制御する復号タイミング制御手段を備えているものが用いられる。 As the delay time control means, for example, a reproduction speed changing means for converting the reproduction speed on the decoded audio signal obtained by the decoding means, and a digital audio signal output from the reproduction speed changing means are temporarily received. An output buffer for accumulating, a means for reading out digital audio signals accumulated in the output buffer at predetermined time intervals, and a reproduction speed so that the reproduction speed is reduced when a received packet is stored in the first area in the jitter absorption buffer. Means for controlling the changing means and controlling the reproducing speed changing means so that the reproducing speed is increased when the received packet is stored continuously in the third area in the jitter absorption buffer a predetermined number of times, and the output buffer Based on the amount of data stored, a decoding timing control means for controlling the decoding timing by the decoding means is used.
遅延時間制御手段としては、たとえば、ジッタ吸収バッファ内の第1領域に受信パケットが格納される場合に、パケット読み出しタイミングにおいてジッタ吸収バッファ内から読み出したパケットが、今回を含めて複数回の連続するパケット読み出しタイミングにおいて繰り返し復号されるようにかつその間においてジッタ吸収バッファからのパケットの読み出しを禁止するように、ジッタ吸収バッファの読み出しおよび復号手段へ送るパケットを制御し、ジッタ吸収バッファ内の第3領域に受信パケットが所定回数連続して格納された場合には、パケット読み出しタイミングにおいてジッタ吸収バッファ内に格納されている複数のパケットを一度に読み出して、その一つのみを復号し、その他を破棄するようにジッタ吸収バッファからのパケットの読み出しおよび復号手段へ送るパケットを制御するものが用いられる。 As the delay time control means, for example, when a received packet is stored in the first area in the jitter absorption buffer , the packet read from the jitter absorption buffer at the packet read timing is continued a plurality of times including this time. The third region in the jitter absorption buffer is controlled by controlling the packet to be read from the jitter absorption buffer and sent to the decoding means so as to be repeatedly decoded at the packet read timing and to prohibit the reading of the packet from the jitter absorption buffer in the meantime. When a received packet is stored continuously for a predetermined number of times , a plurality of packets stored in the jitter absorption buffer are read at a time at the packet read timing, only one of them is decoded, and the others are discarded. The jitter absorption buffer Controls the packet sent to Tsu City of reading and decoding means are used.
この発明による第1のネットワーク電話機は、受信パケットを格納するための複数のバッファ部を有するジッタ吸収バッファと、ジッタ吸収バッファに格納されているパケットを復号化するための復号手段とを備えており、復号手段にパケットを出力するジッタ吸収バッファの出力端側のパケットのパケット番号を基準として、受信パケットがジッタ吸収バッファにおける当該受信パケットのパケット番号に対応した位置に格納されるネットワーク電話機において、復号手段によって得られた復号化音声信号に対して再生速度の変換を行うための再生速度変更手段、再生速度変更手段から出力されるデジタル音声信号を一時的に蓄積する出力バッファ、出力バッファに蓄積されたデジタル音声信号を所定時間間隔で読み出す手段、ジッタ吸収バッファへの受信パケットの格納位置に基づいて、再生速度変更手段を制御する再生速度制御手段、ならびに出力バッファのデータ蓄積量に基づいて、復号手段による復号タイミングを制御する復号タイミング制御手段を備えており、ジッタ吸収バッファ内に、ジッタ吸収バッファの出力端から所要数のバッファ部からなる第1領域と、第1領域よりジッタ吸収バッファの他端側において所要数のバッファ部からなる第2領域と、第2領域よりジッタ吸収バッファの他端側において所要数のバッファ部からなる第3領域とが設定されており、再生速度制御手段は、ジッタ吸収バッファ内の第1領域に受信パケットが格納される場合に、再生速度が遅くなるように再生速度変更手段を制御し、ジッタ吸収バッファ内の第3領域に受信パケットが所定回数連続して格納された場合には、再生速度が早くなるように、再生速度変更手段を制御するものであることを特徴とする。 The first network phone according to the present invention, comprises a jitter buffer having a plurality of buffer portions for storing the received packet, and a decoding means for decoding the packets stored in the jitter buffer In the network telephone in which the received packet is stored at a position corresponding to the packet number of the received packet in the jitter absorbing buffer with reference to the packet number of the packet on the output end side of the jitter absorbing buffer that outputs the packet to the decoding means Reproduction speed changing means for converting the playback speed to the decoded audio signal obtained by the means, an output buffer for temporarily storing the digital audio signal output from the reproduction speed changing means, and an output buffer Means for reading out digital audio signals at predetermined time intervals, jitter absorption Based on the storage location of the received packet to Ffa, playback speed control means for controlling the playback speed change means, and based on the amount of data stored in the output buffer, comprises a decoding timing control means for controlling the decoding timing by the decoding means A first region including a required number of buffer portions from the output end of the jitter absorbing buffer, and a second region including a required number of buffer portions on the other end side of the jitter absorbing buffer from the first region. The third region including the required number of buffer units is set on the other end side of the jitter absorption buffer from the second region, and the reproduction speed control means stores the received packet in the first region in the jitter absorption buffer. The playback speed changing means is controlled so that the playback speed becomes slow, and the received packet is stored in the third area in the jitter absorption buffer. If the stored constant number continuously, as the playback speed becomes faster, and characterized in that for controlling the reproduction speed changing unit.
復号タイミング制御手段としては、例えば、出力バッファのデータ蓄積量が所定の基準量より少なくなったときに、復号手段にパケットの復号化を要求するものが用いられる。 As the decoding timing control means, for example, a means for requesting the decoding means to decode a packet when the data accumulation amount of the output buffer becomes smaller than a predetermined reference amount is used.
この発明による第2のネットワーク電話機は、受信パケットを格納するための複数のバッファ部を有するジッタ吸収バッファと、ジッタ吸収バッファに格納されているパケットを復号化するための復号手段とを備えており、復号手段にパケットを出力するジッタ吸収バッファの出力端側のパケットのパケット番号を基準として、受信パケットがジッタ吸収バッファにおける当該受信パケットのパケット番号に対応した位置に格納されるネットワーク電話機において、ジッタ吸収バッファ内に、ジッタ吸収バッファの出力端から所要数のバッファ部からなる第1領域と、第1領域よりジッタ吸収バッファの他端側において所要数のバッファ部からなる第2領域と、第2領域よりジッタ吸収バッファの他端側において所要数のバッファ部からなる第3領域とが設定されており、ジッタ吸収バッファ内の第1領域に受信パケットが格納される場合に、ジッタ吸収バッファにパケットが格納されてからそのパケットが復号されるまでの遅延時間が長くなるような制御を行い、ジッタ吸収バッファ内の第3領域に受信パケットが所定回数連続して格納された場合には、ジッタ吸収バッファにパケットが格納されてからそのパケットが復号されるまでの遅延時間が短くなるような制御を行う遅延時間制御手段を備えていることを特徴とする。 Second network telephone according to the invention comprises a jitter buffer having a plurality of buffer portions for storing the received packet, and a decoding means for decoding the packets stored in the jitter buffer , based on the packet number of the output end side of the jitter buffer to output the packet to the decoding unit packet, in a network phone received packet is stored in the position corresponding to the packet number of the received packet in the jitter buffer, the jitter In the absorption buffer, a first area consisting of a required number of buffer sections from the output end of the jitter absorption buffer, a second area consisting of a required number of buffer sections on the other end side of the jitter absorption buffer from the first area, and a second area It consists of the required number of buffer sections on the other end side of the jitter absorption buffer from the area. When three areas are set and the received packet is stored in the first area in the jitter absorption buffer, the delay time from when the packet is stored in the jitter absorption buffer until the packet is decoded becomes longer When the received packet is stored for a predetermined number of times in the third area in the jitter absorption buffer, the delay time from when the packet is stored in the jitter absorption buffer until the packet is decoded It is characterized by comprising delay time control means for performing control so as to shorten .
遅延時間制御手段としては、たとえば、復号手段によって得られた復号化音声信号に対して再生速度の変換を行うための再生速度変更手段、再生速度変更手段から出力されるデジタル音声信号を一時的に蓄積する出力バッファ、出力バッファに蓄積されたデジタル音声信号を所定時間間隔で読み出す手段、ジッタ吸収バッファ内の第1領域に受信パケットが格納される場合に、再生速度が遅くなるように、再生速度変更手段を制御し、ジッタ吸収バッファ内の第3領域に受信パケットが所定回数連続して格納された場合には、再生速度が早くなるように、再生速度変更手段を制御する手段、ならびに出力バッファのデータ蓄積量に基づいて、復号手段による復号タイミングを制御する復号タイミング制御手段を備えているものが用いられる。 As the delay time control means, for example, a reproduction speed changing means for converting the reproduction speed on the decoded audio signal obtained by the decoding means, and a digital audio signal output from the reproduction speed changing means are temporarily received. An output buffer for accumulating, a means for reading out digital audio signals accumulated in the output buffer at predetermined time intervals, and a reproduction speed so that the reproduction speed is reduced when a received packet is stored in the first area in the jitter absorption buffer. Means for controlling the changing means and controlling the reproducing speed changing means so that the reproducing speed is increased when the received packet is stored continuously in the third area in the jitter absorption buffer a predetermined number of times, and the output buffer Based on the amount of data stored, a decoding timing control means for controlling the decoding timing by the decoding means is used.
遅延時間制御手段としては、たとえば、ジッタ吸収バッファ内の第1領域に受信パケットが格納される場合に、パケット読み出しタイミングにおいてジッタ吸収バッファ内から読み出したパケットが、今回を含めて複数回の連続するパケット読み出しタイミングにおいて繰り返し復号されるようにかつその間においてジッタ吸収バッファからのパケットの読み出しを禁止するように、ジッタ吸収バッファの読み出しおよび復号手段へ送るパケットを制御し、ジッタ吸収バッファ内の第3領域に受信パケットが所定回数連続して格納された場合には、パケット読み出しタイミングにおいてジッタ吸収バッファ内に格納されている複数のパケットを一度に読み出して、その一つのみを復号し、その他を破棄するようにジッタ吸収バッファからのパケットの読み出しおよび復号手段へ送るパケットを制御するものが用いられる。 As the delay time control means, for example, when a received packet is stored in the first area in the jitter absorption buffer , the packet read from the jitter absorption buffer at the packet read timing is continued a plurality of times including this time. The third region in the jitter absorption buffer is controlled by controlling the packet to be read from the jitter absorption buffer and sent to the decoding means so as to be repeatedly decoded at the packet read timing and to prohibit the reading of the packet from the jitter absorption buffer in the meantime. When a received packet is stored continuously for a predetermined number of times , a plurality of packets stored in the jitter absorption buffer are read at a time at the packet read timing, only one of them is decoded, and the others are discarded. The jitter absorption buffer Controls the packet sent to Tsu City of reading and decoding means are used.
この発明によれば、ジッタ吸収バッファ内に格納されているパケットの廃棄や複製を行うことなく、パケットの到達時刻の分布を最適な分布となるように調整できるようになる。 According to the present invention, it is possible to adjust the distribution of arrival times of packets so as to be an optimum distribution without discarding or duplicating the packets stored in the jitter absorption buffer.
また、この発明によれば、ジッタ吸収バッファにパケットが格納されてから復号されるまでの遅延時間を制御する際に、制御遅延を小さくできるようになる。 According to the present invention, the control delay can be reduced when the delay time from when the packet is stored in the jitter absorption buffer to when it is decoded is controlled.
以下、図3〜図14を参照して、この発明をインターネット電話に適用した場合の実施例について説明する。 Hereinafter, with reference to FIGS. 3 to 14, an embodiment in which the present invention is applied to an Internet telephone will be described.
以下、第1の実施例について説明する。 The first embodiment will be described below.
〔1〕インターネット電話機の構成の説明 [1] Explanation of configuration of Internet telephone
図3は、インターネット電話機の構成を示している。 FIG. 3 shows the configuration of the Internet telephone.
インターネット電話機は、A/Dコンバータ1、D/Aコンバータ2、DSP(音声復号化装置)3、マイコン4およびネットワークコントローラ5を備えている。
The Internet telephone includes an A /
入力音声信号は、A/Dコンバータ1によってデジタル音声信号に変換された後にDSP3に送られる。DSP3では、デジタル音声信号が圧縮された後にパケット化される。DSP3によって得られたパケットは、マイコン4およびネットワークコントローラ5を介してIPネットワークに送出される。
The input audio signal is converted into a digital audio signal by the A /
IPネットワークを介して送られてきたパケットは、ネットワークコントローラ5およびマイコン4 を介してDSP3に送られる。DSP3では、パケットが復号化される。DSP3によって得られたデシタル音声信号はD/Aコンバータ2によってアナログの音声信号に変換されて出力される。
A packet sent via the IP network is sent to the
図4は、DSP3の詳細な構成を示している。
FIG. 4 shows a detailed configuration of the
DSP3は、送信パケットを生成するための手段と、復号化音声信号を生成するための手段とを備えている。
The
送信パケットを生成するための手段は、A/Dコンバータ1から入力される入力音声信号を圧縮するための符号器31および符号器31によって得られた符号化データをパケット化してRTPパケットを生成するRTPパケット化部32を備えている。
The means for generating the transmission packet generates an RTP packet by packetizing the
復号化音声信号を生成するための手段は、ジッタ吸収バッファ33、復号器34、再生速度変更部(以下、可変速再生部という)35、出力バッファ36、再生速度制御部37および復号タイミング制御部38を備えている。再生速度制御部37および復号タイミング制御部38は、実際は、1つの制御部によって構成されているが、説明の便宜上、2つの制御部に分けている。
Means for generating a decoded audio signal include a
ジッタ吸収バッファ33は、図1のジッタ吸収バッファ101と同様に、複数のバッファ部(パケット記憶部)を備えている。ジッタ吸収バッファ33の各バッファ部には、到達したパケットが、パケット番号の順番で左側から順番に格納されていく。最も左側のバッファ部に格納されているパケットが所定のタイミングで読み出されて復号器34に渡される。復号器34に1パケットが渡されると、ジッタ吸収バッファ33内の他のパケットが左側に1つずつシフトされる。
The
復号器34は、ジッタ吸収バッファ33から渡されたパケット(符号化データ)を復号化する。復号器34によって得られた復号化音声信号は、可変速再生部35に送られ、再生速度の変更処理(話速変換処理)が施される。可変速再生部35から出力されるデジタル音声信号は出力バッファ36に蓄積される。出力バッファ36に蓄積されたデジタル音声信号は、所定時間間隔毎に1データずつ順次読み出されて、D/Aコンバータ2に出力される。
The
再生速度制御部37は、ジッタ吸収バッファ33のバッファ量(パケット蓄積量)に基づいて、可変速再生部35を制御する。復号タイミング制御部38は、出力バッファ36のデータ蓄積量に基づいて、復号器34による復号タイミングを制御する。
The playback
上記復号化音声信号を生成するための手段の特徴は、ジッタ吸収バッファ33のバッファ量(パケット蓄積量)に応じて復号化音声信号の再生速度を制御することにより、ジッタ吸収バッファ33からのパケット出力タイミング(復号タイミング)を制御することにある。ジッタ吸収バッファ33からのパケット出力は、出力バッファ36内に格納されているデータ量が、所定の基準量を下回ったときに行われる。
The feature of the means for generating the decoded audio signal is that the packet from the
これにより、ジッタ吸収バッファ33内に格納されているパケットの廃棄や複製を行うことなく、パケット到達時刻の分布が最適な位置にくるようにジッタ吸収バッファ33内のバッファ量、言い換えれば、パケットがジッタ吸収バッファ33内に格納されてから、そのパケットが復号化されるまでの遅延時間を調整することが可能となる。なお、再生音声の再生速度は、ピッチ幅を変えることなく、再生速度のみを変更する。
Thereby, without discarding or duplicating the packet stored in the
〔2〕復号化音声信号を生成するための手段の動作についての説明 [2] Description of operation of means for generating a decoded speech signal
以下、復号化音声信号を生成するための手段の動作について、さらに詳しく説明する。 Hereinafter, the operation of the means for generating the decoded audio signal will be described in more detail.
通話中において、ジッタ吸収バッファ33に到達するパケットの分布が、図5(a)に破線S1で示すような分布であり、実線の分布S0のように分布を移動させたい場合には、再生速度が早くなるように可変速再生部35を制御する。可変速再生部35は、再生速度を早くする際には、例えば、図6に示すように、3ピッチ分の波形から2ピッチ分の波形を生成する。
During a call, the distribution of packets reaching the
つまり、まず、原波形内の3ピッチ分の波形のうち、前から2ピッチ分の波形に右下がり直線で表される重みをかけるとともに、後から2ピッチ分の波形に右上がりの直線で表される重みをかける。そして、これらの2ピッチ分の波形を加算することにより、2ピッチ分の波形を生成する。 That is, first, among the waveforms for 3 pitches in the original waveform, the waveform for 2 pitches from the front is applied with the weight represented by a right-downward straight line, and the waveform for 2 pitches from the back is represented by a straight line rising to the right To be weighted. And the waveform for 2 pitches is produced | generated by adding the waveform for these 2 pitches.
このように、再生速度が早くされると、1パケットに対するデータ量が減少するため、出力バッファ36内の蓄積データが所定の基準量を下回るタイミングが早くなり、ジッタ吸収バッファ33からのパケット出力タイミング(復号タイミング)が早くなる。言い換えれば、パケットがジッタ吸収バッファ33内に格納されてから、そのパケットが復号化されるまでの遅延時間が短くなる。この結果、パケット到達時刻の分布が最適な位置S0に移動する。
As described above, when the reproduction speed is increased, the amount of data for one packet decreases, and therefore, the timing at which the accumulated data in the
通話中において、ジッタ吸収バッファ33に到達するパケットの分布が、図5(b)に破線S2で示すような分布であり、実線の分布S0のように分布を移動させたい場合には、再生速度が遅くなるように可変速再生部35を制御する。可変速再生部35は、再生速度を遅くする際には、例えば、図7に示すように、3ピッチ分の波形から4ピッチ分の波形を生成する。
During a call, the distribution of packets reaching the
つまり、まず、原波形内の3ピッチ分の波形のうち、前から2ピッチ分の波形に右上がり直線で表される重みをかけるとともに、後から2ピッチ分の波形に右下がりの直線で表される重みをかける。そして、これらの2ピッチ分の波形を加算することにより、2ピッチ分の波形を生成する。そして、得られた波形を、原波形の中央の1ピッチ分の波形と置き換えることにより、4ピッチ分の波形を生成する。 That is, first, among the waveforms of 3 pitches in the original waveform, the waveform of 2 pitches from the front is weighted with a straight line rising to the right, and the waveform of 2 pitches from the back is represented by a straight line with a downward slope. To be weighted. And the waveform for 2 pitches is produced | generated by adding the waveform for these 2 pitches. Then, by replacing the obtained waveform with the waveform for one pitch at the center of the original waveform, a waveform for four pitches is generated.
このように、再生速度が遅くされると、1パケットに対するデータ量が増加するため、出力バッファ36内の蓄積データが所定の基準量を下回るタイミングが遅くなり、ジッタ吸収バッファ33からのパケット出力タイミング(復号タイミング)が遅くなる。言い換えれば、パケットがジッタ吸収バッファ33内に格納されてから、そのパケットが復号化されるまでの遅延時間が長くなる。この結果、パケット到達時刻の分布が最適な位置S0に移動する。
As described above, when the reproduction speed is slowed down, the amount of data for one packet increases, so the timing at which the accumulated data in the
通話中において、IPネットワークにおけるジッタ量が増加した場合、ジッタ吸収バッファ33に到達するパケットの分布が、図5(c)に破線S3で示すような分布であり、実線の分布S0のように分布を移動させたい場合には、再生速度が遅くなるように可変速再生部35を制御することにより、ジッタ吸収バッファ33からのパケット出力タイミングを遅くさせる。
When the amount of jitter in the IP network increases during a call, the distribution of packets reaching the
通話中において、IPネットワークにおけるジッタ量が減少した場合、ジッタ吸収バッファ33に到達するパケットの分布が、図5(d)に破線S4で示すような分布であり、実線の分布S0のように分布を移動させたい場合には、再生速度が早くなるように可変速再生部35を制御することにより、ジッタ吸収バッファ33からのパケット出力タイミングを早くさせる。
When the amount of jitter in the IP network decreases during a call, the distribution of packets reaching the
〔3〕再生速度制御部37によって行われる再生速度制御についての説明
[3] Description of playback speed control performed by the playback
図8において、ジッタ吸収バッファ33の左端のバッファ部からパケットが読み出されるものとし、S0を目標とするパケット到達時刻の分布とする。ジッタ吸収バッファ33の左端部の3つのバッファ部からなる領域をバッファ領域A(第1領域)と定義し、バッファ領域Aの右隣の1つのバッファ部からなる領域をバッファ領域B(第2領域)と定義し、バッファ領域Bより右側の領域をバッファ領域C(第3領域)と定義する。なお、各領域A、B、Cのバッファ部の量は、設定により変更することが可能である。
In FIG. 8, it is assumed that a packet is read from the leftmost buffer section of the
再生速度制御の基本的な考え方について説明する。図9(a)に示すように、実際のパケット到達時刻の分布S2が目標とするパケット到達時刻の分布S0よりも左側にずれている場合には、ジッタ吸収バッファ33のバッファ領域Aに到達パケットが格納されるようになる。したがって、バッファ領域Aに到達パケットが格納される場合には、再生速度制御部37は、再生速度が遅くなるように可変速再生部35を制御する。この結果、復号器34へのパケット出力タイミング(復号タイミング)が遅くなる。
The basic concept of playback speed control will be described. As shown in FIG. 9A, when the actual packet arrival time distribution S2 is shifted to the left side of the target packet arrival time distribution S0, the arrival packet reaches the buffer area A of the
一方、図9(b)に示すように、実際のパケット到達時刻の分布S1が目標とするパケット到達時刻の分布S0よりも右側にずれている場合には、ジッタ吸収バッファ33のバッファ領域AおよびBからなる領域に一定時間、到達パケットが格納されなくなる。つまり、一定時間、到達パケットがバッファ領域Cのみに格納される。したがって、バッファ領域AおよびBからなる領域に一定時間、到達パケットが格納されない場合には、再生速度制御部37は、再生速度が早くなるように可変速再生部35を制御する。この結果、復号器34へのパケット出力タイミング(復号タイミング)が早くなる。
On the other hand, as shown in FIG. 9B, when the actual packet arrival time distribution S1 is shifted to the right from the target packet arrival time distribution S0, the buffer area A of the
図10は、初期化処理手順を示している。 FIG. 10 shows the initialization processing procedure.
電源オン時に行われる初期化処理においては、カウンタb_cntに、所定値B_THL(例えば100)を設定する(ステップ1)。また、可変速再生部35に与える再生速度制御内容を再生速度を変更しない状態に設定する(ステップ2)。
In the initialization process performed when the power is turned on, a predetermined value B_THL (for example, 100) is set in the counter b_cnt (step 1). Further, the playback speed control content to be given to the variable
図11は、再生速度の制御処理手順を示している。 FIG. 11 shows a playback speed control processing procedure.
再生速度の制御処理は、ジッタ吸収バッファ33への到達パケットの入力処理が開始される毎に行われる。
The reproduction speed control process is performed each time the arrival packet input process to the
パケット入力処理が開始されると、ジッタ吸収バッファ33へのパケット入力位置が図8のバッファ領域Aであるか否かを判別する(ステップ11)。パケット入力位置がバッファ領域Aである場合には、図9(a)に示すように、実際のパケット到達時刻の分布S2が目標とするパケット到達時刻の分布S0よりも左側にずれていると判断し、カウンタb_cntに所定値B_THLを格納するとともに(ステップ12)、再生速度制御内容を再生速度を遅くする状態に設定する(ステップ13)。そして、パケットをジッタ吸収バッファ33に格納することにより(ステップ20)、今回のパケット入力処理を終了する。
When the packet input process is started, it is determined whether or not the packet input position to the
上記ステップ11において、パケット入力位置がバッファ領域Aではないと判別した場合には、パケット入力位置がバッファ領域Bであるか否かを判別する(ステップ14)。パケット入力位置がバッファ領域Bである場合には、実際のパケット到達時刻の分布が目標とするパケット到達時刻の分布と一致している可能性が高いと判断し、カウンタb_cntに所定値B_THLを格納するとともに(ステップ15)、再生速度制御内容を再生速度を変更しない状態に設定する(ステップ16)。そして、パケットをジッタ吸収バッファ33に格納することにより(ステップ20)、今回のパケット入力処理を終了する。
If it is determined in
上記ステップ14において、パケット入力位置がバッファ領域Bではないと判別した場合には、カウンタ値b_cntを1だけデクリメント(−1)する(ステップ17)。そして、カウンタ値b_cntが0以下になったか否かを判別する(ステップ18)。カウンタ値b_cntが0より大きいときには、実際のパケット到達時刻の分布が目標とするパケット到達時刻の分布と一致している可能性が高いと判断し、再生速度制御内容を再生速度を変更しない状態に設定する(ステップ16)。そして、パケットをジッタ吸収バッファ33に格納することにより(ステップ20)、今回のパケット入力処理を終了する。
If it is determined in
上記ステップ18において、カウンタ値b_cntが0以下になったと判別した場合には、図9(b)に示すように、実際のパケット到達時刻の分布S1が目標とするパケット到達時刻の分布S0よりも右側にずれていると判断して、再生速度制御内容を再生速度を早くする状態に設定する(ステップ19)。そして、パケットをジッタ吸収バッファ33に格納することにより(ステップ20)、今回のパケット入力処理を終了する。
When it is determined in
〔4〕復号タイミング制御処理手順についての説明 [4] Description of decoding timing control processing procedure
図12は、復号タイミングの制御処理手順を示している。 FIG. 12 shows a decoding timing control processing procedure.
D/Aコンバータ2への出力処理(D/A出力処理)が開始されると、出力バッファ36から1つのデータを出力する(ステップ31)。そして、出力バッファ36内のデータ量が所定の基準量B_DATA_THLより小さくなったか否かを判別する(ステップ32)。出力バッファ36内のデータ量が所定の基準量以上である場合には、今回のD/A出力処理を終了する。
When output processing to the D / A converter 2 (D / A output processing) is started, one data is output from the output buffer 36 (step 31). Then, it is determined whether or not the amount of data in the
上記ステップ32において、出力バッファ36内のデータ量が所定の基準量B_DATA_THLより小さくなったと判別した場合には、復号器34に復号を要求した後(ステップ33)、今回のD/A出力処理を終了する。
If it is determined in
以下、第2の実施例について説明する。第2の実施例においては、インターネット電話機の全体的な構成は、図3に示すものと同様であるが、DSP3の構成が図4に示すものと異なっている。
The second embodiment will be described below. In the second embodiment, the overall configuration of the Internet telephone is the same as that shown in FIG. 3, but the configuration of the
図13は、DSP3の詳細な構成を示している。
FIG. 13 shows a detailed configuration of the
DSP3は、送信パケットを生成するための手段と、復号化音声信号を生成するための手段とを備えている。送信パケットを生成するための手段は、図4と同様に、A/Dコンバータ1から入力される入力音声信号を圧縮するための符号器31および符号器31によって得られた符号化データをパケット化してRTPパケットを生成するRTPパケット化部32を備えている。
The
復号化音声信号を生成するための手段は、図4とは異なり、ジッタ吸収バッファ33、復号器34、出力バッファ36および遅延時間制御部39を備えている。遅延時間制御部39は、ジッタ吸収バッファ33の後段であって、復号器34の前段に設けられており、パケットがジッタ吸収バッファ33に格納されてから、そのパケットが復号化されるまでの遅延時間を制御する。この実施例では、ジッタ吸収バッファ33からパケットを読み出すタイミング(復号タイミング)は、一定期間毎に到来する。
Unlike FIG. 4, the means for generating the decoded audio signal includes a
遅延時間制御部39によって行われる遅延時間制御について説明する。
The delay time control performed by the delay
図8において、ジッタ吸収バッファ33の左端のバッファ部からパケットが読み出されるものとし、S0を目標とするパケット到達時刻の分布とする。ジッタ吸収バッファ33の左端部の3つのバッファ部からなる領域をバッファ領域Aと定義し、バッファ領域Aの右隣の1つのバッファ部からなる領域をバッファ領域Bと定義し、バッファ領域Bより右側の領域をバッファ領域Cと定義する。なお、各領域A、B、Cのバッファ部の量は、設定により変更することが可能である。
In FIG. 8, it is assumed that a packet is read from the leftmost buffer section of the
図9(a)に示すように、実際のパケット到達時刻の分布S2が目標とするパケット到達時刻の分布S0よりも左側にずれている場合には、ジッタ吸収バッファ33のバッファ領域Aに到達パケットが格納されるようになる。ジッタ吸収バッファ33のバッファ領域Aに到達パケットが格納される場合には、遅延時間制御部39は、ジッタ吸収バッファ33内に格納されているパケットを複製するのと等価な処理を行う。
As shown in FIG. 9A, when the actual packet arrival time distribution S2 is shifted to the left side of the target packet arrival time distribution S0, the arrival packet reaches the buffer area A of the
具体的には、ある復号タイミングにおいてジッタ吸収バッファ33から読み出された1つのパケットを復号器34に送るとともに保持しておき、次の復号タイミングにおいてはジッタ吸収バッファ33から新たなパケットの読み出しを行うことなく保持しているパケット(前回の復号タイミングで読み出されたパケット)を復号器34に送るように、ジッタ吸収バッファ33からのパケットの読み出しおよび復号器34へ送るパケットを制御する。この結果、パケットがジッタ吸収バッファ33に格納されてから、そのパケットが復号化されるまでの遅延時間が長くなる。遅延時間制御部39によるこのような制御を行う動作モードを、遅延時間延長化モードということにする。
Specifically, one packet read from the
一方、図9(b)に示すように、実際のパケット到達時刻の分布S1が目標とするパケット到達時刻の分布S0よりも右側にずれている場合には、ジッタ吸収バッファ33のバッファ領域AおよびBからなる領域に一定時間、到達パケットが格納されなくなる。つまり、一定時間、到達パケットがバッファ領域Cのみに格納される。バッファ領域AおよびBからなる領域に一定時間、到達パケットが格納されない場合には、遅延時間制御部39は、ジッタ吸収バッファ33内に格納されているパケットを削除(間引き)するのと等価な処理を行う。
On the other hand, as shown in FIG. 9B, when the actual packet arrival time distribution S1 is shifted to the right from the target packet arrival time distribution S0, the buffer area A of the
具体的には、復号タイミングにおいてジッタ吸収バッファ33から2つのパケットを連続して読み出し、そのうちの一方を破棄し、他方のみを復号器34に送るように、ジッタ吸収バッファ33からのパケットの読み出しおよび復号器34へ送るパケットを制御する。この結果、パケットがジッタ吸収バッファ33に格納されてから、そのパケットが復号化されるまでの遅延時間が短くなる。遅延時間制御部39によるこのような制御を行う動作モードを、遅延時間短縮化モードということにする。
Specifically, two packets are continuously read from the
なお、遅延時間制御部39は、通常動作モード時には、復号タイミングにおいてジッタ吸収バッファ33から1つのパケットを読み出して、そのパケットを復号器34に送るといった動作を行う。
In the normal operation mode, the delay
図14は、遅延時間制御部39による動作モード決定処理手順を示している。
FIG. 14 shows an operation mode determination processing procedure by the delay
なお、電源オン時に行われる初期化処理において、カウンタb_cntに、所定値B_THL(例えば100)が設定されるとともに、遅延時間制御部39の動作モードとしては、通常動作モードが設定されているものとする。
In the initialization process performed when the power is turned on, a predetermined value B_THL (for example, 100) is set in the counter b_cnt, and the normal operation mode is set as the operation mode of the delay
遅延時間制御処理は、ジッタ吸収バッファ33への到達パケットの入力処理が開始される毎に行われる。
The delay time control process is performed every time the arrival packet input process to the
パケット入力処理が開始されると、ジッタ吸収バッファ33へのパケット入力位置が図8のバッファ領域Aであるか否かを判別する(ステップ111)。パケット入力位置がバッファ領域Aである場合には、図9(a)に示すように、実際のパケット到達時刻の分布S2が目標とするパケット到達時刻の分布S0よりも左側にずれていると判断し、カウンタb_cntに所定値B_THLを格納するとともに(ステップ112)、動作モードを遅延時間延長化モードに設定する(ステップ113)。そして、パケットをジッタ吸収バッファ33に格納することにより(ステップ120)、今回のパケット入力処理を終了する。
When the packet input process is started, it is determined whether or not the packet input position to the
上記ステップ111において、パケット入力位置がバッファ領域Aではないと判別した場合には、パケット入力位置がバッファ領域Bであるか否かを判別する(ステップ114)。パケット入力位置がバッファ領域Bである場合には、実際のパケット到達時刻の分布が目標とするパケット到達時刻の分布と一致している可能性が高いと判断し、カウンタb_cntに所定値B_THLを格納するとともに(ステップ115)、動作モードを通常動作モードに設定する(ステップ116)。そして、パケットをジッタ吸収バッファ33に格納することにより(ステップ120)、今回のパケット入力処理を終了する。
If it is determined in
上記ステップ114において、パケット入力位置がバッファ領域Bではないと判別した場合には、カウンタ値b_cntを1だけデクリメント(−1)する(ステップ117)。そして、カウンタ値b_cntが0以下になったか否かを判別する(ステップ118)。カウンタ値b_cntが0より大きいときには、実際のパケット到達時刻の分布が目標とするパケット到達時刻の分布と一致している可能性が高いと判断し、動作モードを通常動作モードに設定する(ステップ116)。そして、パケットをジッタ吸収バッファ33に格納することにより(ステップ120)、今回のパケット入力処理を終了する。
If it is determined in
上記ステップ118において、カウンタ値b_cntが0以下になったと判別した場合には、図9(b)に示すように、実際のパケット到達時刻の分布S1が目標とするパケット到達時刻の分布S0よりも右側にずれていると判断して、動作モードを遅延時間短縮化モードに設定する(ステップ119)。そして、パケットをジッタ吸収バッファ33に格納することにより(ステップ120)、今回のパケット入力処理を終了する。
When it is determined in
3 DSP
33 ジッタ吸収バッファ
34 復号器
35 可変速再生部
36 出力バッファ
37 再生速度制御部
38 復号タイミング制御部
39 遅延時間制御部
3 DSP
33
Claims (10)
復号手段によって得られた復号化音声信号に対して再生速度の変換を行うための再生速度変更手段、
再生速度変更手段から出力されるデジタル音声信号を一時的に蓄積する出力バッファ、 出力バッファに蓄積されたデジタル音声信号を所定時間間隔で読み出す手段、
ジッタ吸収バッファへの受信パケットの格納位置に基づいて、再生速度変更手段を制御する再生速度制御手段、ならびに
出力バッファのデータ蓄積量に基づいて、復号手段による復号タイミングを制御する復号タイミング制御手段を備えており、
ジッタ吸収バッファ内に、ジッタ吸収バッファの出力端から所要数のバッファ部からなる第1領域と、第1領域よりジッタ吸収バッファの他端側において所要数のバッファ部からなる第2領域と、第2領域よりジッタ吸収バッファの他端側において所要数のバッファ部からなる第3領域とが設定されており、
再生速度制御手段は、ジッタ吸収バッファ内の第1領域に受信パケットが格納される場合に、再生速度が遅くなるように再生速度変更手段を制御し、ジッタ吸収バッファ内の第3領域に受信パケットが所定回数連続して格納された場合には、再生速度が早くなるように、再生速度変更手段を制御するものであることを特徴とする音声復号化装置。 A jitter absorbing buffer having a plurality of buffer units for storing received packets and a decoding means for decoding the packets stored in the jitter absorbing buffer, and outputting the packets to the decoding means In the speech decoding apparatus in which the received packet is stored at a position corresponding to the packet number of the received packet in the jitter absorption buffer with reference to the packet number of the packet on the output end side of the buffer ,
Reproduction speed changing means for converting the reproduction speed of the decoded audio signal obtained by the decoding means;
An output buffer for temporarily storing the digital audio signal output from the reproduction speed changing means; a means for reading out the digital audio signal stored in the output buffer at predetermined time intervals;
A reproduction speed control means for controlling the reproduction speed changing means based on the storage position of the received packet in the jitter absorption buffer, and a decoding timing control means for controlling the decoding timing by the decoding means based on the amount of data stored in the output buffer. equipped and,
In the jitter absorption buffer, a first area consisting of a required number of buffer sections from the output end of the jitter absorption buffer, a second area consisting of a required number of buffer sections on the other end side of the jitter absorption buffer from the first area, A third region consisting of a required number of buffer portions is set on the other end side of the jitter absorption buffer from two regions;
The reproduction speed control means controls the reproduction speed changing means so that the reproduction speed is slowed down when the received packet is stored in the first area in the jitter absorption buffer, and the reception speed is controlled in the third area in the jitter absorption buffer. Is stored in a predetermined number of times, the playback speed changing means is controlled so that the playback speed becomes faster .
ジッタ吸収バッファ内に、ジッタ吸収バッファの出力端から所要数のバッファ部からなる第1領域と、第1領域よりジッタ吸収バッファの他端側において所要数のバッファ部からなる第2領域と、第2領域よりジッタ吸収バッファの他端側において所要数のバッファ部からなる第3領域とが設定されており、
ジッタ吸収バッファ内の第1領域に受信パケットが格納される場合に、ジッタ吸収バッファにパケットが格納されてからそのパケットが復号されるまでの遅延時間が長くなるような制御を行い、ジッタ吸収バッファ内の第3領域に受信パケットが所定回数連続して格納された場合には、ジッタ吸収バッファにパケットが格納されてからそのパケットが復号されるまでの遅延時間が短くなるような制御を行う遅延時間制御手段を備えていることを特徴とする音声復号化装置。 A jitter absorbing buffer having a plurality of buffer units for storing received packets and a decoding means for decoding the packets stored in the jitter absorbing buffer, and outputting the packets to the decoding means In the speech decoding apparatus in which the received packet is stored at a position corresponding to the packet number of the received packet in the jitter absorption buffer with reference to the packet number of the packet on the output end side of the buffer,
In the jitter absorption buffer, a first area consisting of a required number of buffer sections from the output end of the jitter absorption buffer, a second area consisting of a required number of buffer sections on the other end side of the jitter absorption buffer from the first area, A third region consisting of a required number of buffer portions is set on the other end side of the jitter absorption buffer from two regions;
When a received packet is stored in the first area in the jitter absorption buffer, control is performed to increase the delay time from when the packet is stored in the jitter absorption buffer until the packet is decoded. When the received packet is stored continuously in the third area within a predetermined number of times, the delay is controlled so that the delay time from when the packet is stored in the jitter absorption buffer to when the packet is decoded is shortened A speech decoding apparatus comprising a time control means .
復号手段によって得られた復号化音声信号に対して再生速度の変換を行うための再生速度変更手段、
再生速度変更手段から出力されるデジタル音声信号を一時的に蓄積する出力バッファ、 出力バッファに蓄積されたデジタル音声信号を所定時間間隔で読み出す手段、
ジッタ吸収バッファ内の第1領域に受信パケットが格納される場合に、再生速度が遅くなるように、再生速度変更手段を制御し、ジッタ吸収バッファ内の第3領域に受信パケットが所定回数連続して格納された場合には、再生速度が早くなるように、再生速度変更手段を制御する手段、ならびに
出力バッファのデータ蓄積量に基づいて、復号手段による復号タイミングを制御する復号タイミング制御手段、
を備えていることを特徴とする請求項3に記載の音声復号化装置。 The delay time control means is
Reproduction speed changing means for converting the reproduction speed of the decoded audio signal obtained by the decoding means;
An output buffer for temporarily storing the digital audio signal output from the reproduction speed changing means; a means for reading out the digital audio signal stored in the output buffer at predetermined time intervals;
When the received packet is stored in the first area in the jitter absorption buffer, the reproduction speed changing means is controlled so that the reproduction speed becomes slow, and the received packet continues in the third area in the jitter absorption buffer a predetermined number of times. Means for controlling the playback speed changing means so as to increase the playback speed, and
Decoding timing control means for controlling the decoding timing by the decoding means based on the amount of data stored in the output buffer;
The speech decoding apparatus according to claim 3, further comprising:
復号手段によって得られた復号化音声信号に対して再生速度の変換を行うための再生速度変更手段、Reproduction speed changing means for converting the reproduction speed of the decoded audio signal obtained by the decoding means;
再生速度変更手段から出力されるデジタル音声信号を一時的に蓄積する出力バッファ、 出力バッファに蓄積されたデジタル音声信号を所定時間間隔で読み出す手段、An output buffer for temporarily storing the digital audio signal output from the reproduction speed changing means; a means for reading out the digital audio signal stored in the output buffer at predetermined time intervals;
ジッタ吸収バッファへの受信パケットの格納位置に基づいて、再生速度変更手段を制御する再生速度制御手段、ならびにA reproduction speed control means for controlling the reproduction speed changing means based on the storage position of the received packet in the jitter absorption buffer; and
出力バッファのデータ蓄積量に基づいて、復号手段による復号タイミングを制御する復号タイミング制御手段を備えており、A decoding timing control means for controlling the decoding timing by the decoding means based on the amount of data stored in the output buffer;
ジッタ吸収バッファ内に、ジッタ吸収バッファの出力端から所要数のバッファ部からなる第1領域と、第1領域よりジッタ吸収バッファの他端側において所要数のバッファ部からなる第2領域と、第2領域よりジッタ吸収バッファの他端側において所要数のバッファ部からなる第3領域とが設定されており、In the jitter absorption buffer, a first region including a required number of buffer portions from the output end of the jitter absorption buffer, a second region including a required number of buffer portions on the other end side of the jitter absorption buffer from the first region, A third region composed of a required number of buffer portions is set on the other end side of the jitter absorption buffer from two regions;
再生速度制御手段は、ジッタ吸収バッファ内の第1領域に受信パケットが格納される場合に、再生速度が遅くなるように再生速度変更手段を制御し、ジッタ吸収バッファ内の第3領域に受信パケットが所定回数連続して格納された場合には、再生速度が早くなるように、再生速度変更手段を制御するものであることを特徴とするネットワーク電話機。The reproduction speed control means controls the reproduction speed changing means so that the reproduction speed is slowed down when the received packet is stored in the first area in the jitter absorption buffer, and the reception speed is controlled in the third area in the jitter absorption buffer. A network telephone characterized by controlling the reproduction speed changing means so that the reproduction speed becomes faster when a predetermined number of times is stored.
ジッタ吸収バッファ内に、ジッタ吸収バッファの出力端から所要数のバッファ部からなる第1領域と、第1領域よりジッタ吸収バッファの他端側において所要数のバッファ部からなる第2領域と、第2領域よりジッタ吸収バッファの他端側において所要数のバッファ部からなる第3領域とが設定されており、
ジッタ吸収バッファ内の第1領域に受信パケットが格納される場合に、ジッタ吸収バッファにパケットが格納されてからそのパケットが復号されるまでの遅延時間が長くなるような制御を行い、ジッタ吸収バッファ内の第3領域に受信パケットが所定回数連続して格納された場合には、ジッタ吸収バッファにパケットが格納されてからそのパケットが復号されるまでの遅延時間が短くなるような制御を行う遅延時間制御手段を備えていることを特徴とするネットワーク電話機。 A jitter absorbing buffer having a plurality of buffer units for storing received packets and a decoding means for decoding the packets stored in the jitter absorbing buffer, and outputting the packets to the decoding means In the network telephone in which the received packet is stored at a position corresponding to the packet number of the received packet in the jitter absorption buffer with reference to the packet number of the packet on the output end side of the buffer,
In the jitter absorption buffer, a first area consisting of a required number of buffer sections from the output end of the jitter absorption buffer, a second area consisting of a required number of buffer sections on the other end side of the jitter absorption buffer from the first area, A third region consisting of a required number of buffer portions is set on the other end side of the jitter absorption buffer from two regions;
When a received packet is stored in the first area in the jitter absorption buffer, control is performed to increase the delay time from when the packet is stored in the jitter absorption buffer until the packet is decoded. When the received packet is stored continuously in the third area within a predetermined number of times, the delay is controlled so that the delay time from when the packet is stored in the jitter absorption buffer to when the packet is decoded is shortened A network telephone comprising a time control means .
復号手段によって得られた復号化音声信号に対して再生速度の変換を行うための再生速度変更手段、
再生速度変更手段から出力されるデジタル音声信号を一時的に蓄積する出力バッファ、 出力バッファに蓄積されたデジタル音声信号を所定時間間隔で読み出す手段、
ジッタ吸収バッファ内の第1領域に受信パケットが格納される場合に、再生速度が遅くなるように、再生速度変更手段を制御し、ジッタ吸収バッファ内の第3領域に受信パケットが所定回数連続して格納された場合には、再生速度が早くなるように、再生速度変更手段を制御する手段、ならびに
出力バッファのデータ蓄積量に基づいて、復号手段による復号タイミングを制御する復号タイミング制御手段、
を備えていることを特徴とする請求項8に記載のネットワーク電話機。 The delay time control means is
Reproduction speed changing means for converting the reproduction speed of the decoded audio signal obtained by the decoding means;
An output buffer for temporarily storing the digital audio signal output from the reproduction speed changing means; a means for reading out the digital audio signal stored in the output buffer at predetermined time intervals;
When the received packet is stored in the first area in the jitter absorption buffer, the reproduction speed changing means is controlled so that the reproduction speed becomes slow, and the received packet continues in the third area in the jitter absorption buffer a predetermined number of times. Means for controlling the playback speed changing means so as to increase the playback speed, and
Decoding timing control means for controlling the decoding timing by the decoding means based on the amount of data stored in the output buffer;
The network telephone according to claim 8, further comprising:
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2003336494A JP3796240B2 (en) | 2002-09-30 | 2003-09-26 | Network telephone and voice decoding apparatus |
Applications Claiming Priority (3)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2002285567 | 2002-09-30 | ||
JP2003051467 | 2003-02-27 | ||
JP2003336494A JP3796240B2 (en) | 2002-09-30 | 2003-09-26 | Network telephone and voice decoding apparatus |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2004282692A JP2004282692A (en) | 2004-10-07 |
JP3796240B2 true JP3796240B2 (en) | 2006-07-12 |
Family
ID=33303647
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2003336494A Expired - Fee Related JP3796240B2 (en) | 2002-09-30 | 2003-09-26 | Network telephone and voice decoding apparatus |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP3796240B2 (en) |
Families Citing this family (10)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
EP2189978A1 (en) | 2004-08-30 | 2010-05-26 | QUALCOMM Incorporated | Adaptive De-Jitter Buffer for voice over IP |
US8085678B2 (en) | 2004-10-13 | 2011-12-27 | Qualcomm Incorporated | Media (voice) playback (de-jitter) buffer adjustments based on air interface |
JP4959935B2 (en) * | 2004-11-09 | 2012-06-27 | 株式会社東芝 | Decoding device |
US8155965B2 (en) | 2005-03-11 | 2012-04-10 | Qualcomm Incorporated | Time warping frames inside the vocoder by modifying the residual |
US8355907B2 (en) | 2005-03-11 | 2013-01-15 | Qualcomm Incorporated | Method and apparatus for phase matching frames in vocoders |
JP4869882B2 (en) * | 2006-11-24 | 2012-02-08 | 三菱電機株式会社 | Speech decoder |
JP2008197825A (en) * | 2007-02-09 | 2008-08-28 | Oki Electric Ind Co Ltd | Data processing system |
JP4594401B2 (en) * | 2008-01-28 | 2010-12-08 | 株式会社エヌ・ティ・ティ・ドコモ | Voice mobile communication device |
JP5691721B2 (en) * | 2011-03-25 | 2015-04-01 | 三菱電機株式会社 | Audio data processing device |
US9806967B2 (en) * | 2014-05-30 | 2017-10-31 | Sony Corporation | Communication device and data processing method |
-
2003
- 2003-09-26 JP JP2003336494A patent/JP3796240B2/en not_active Expired - Fee Related
Also Published As
Publication number | Publication date |
---|---|
JP2004282692A (en) | 2004-10-07 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
KR100644978B1 (en) | Network telephone and voice decording device | |
KR100964437B1 (en) | Adaptive de-jitter buffer for voice over ip | |
US8363678B2 (en) | Techniques to synchronize packet rate in voice over packet networks | |
US7830862B2 (en) | System and method for modifying speech playout to compensate for transmission delay jitter in a voice over internet protocol (VoIP) network | |
US8937963B1 (en) | Integrated adaptive jitter buffer | |
JP4842075B2 (en) | Audio transmission device | |
CN1154288C (en) | Sub-packet insertion for packet loss compensation in voice over IP net works | |
JP4744444B2 (en) | STREAM DATA RECEIVING / REPRODUCING DEVICE, COMMUNICATION SYSTEM, AND STREAM DATA RECEIVING / REPRODUCING METHOD | |
US7924711B2 (en) | Method and apparatus to adaptively manage end-to-end voice over internet protocol (VolP) media latency | |
JP3796240B2 (en) | Network telephone and voice decoding apparatus | |
JP4955243B2 (en) | Method and apparatus for enhancing voice intelligibility for late arriving packets in VoIP network applications | |
JP2007258928A (en) | Fluctuation absorbing buffer controller | |
KR20070001267A (en) | Audio communication method and device | |
JP2006238445A (en) | Method and apparatus for handling network jitter in voice-over ip communication network using virtual jitter buffer and time scale modification | |
WO2007129243A2 (en) | Synthesizing comfort noise | |
TW200807395A (en) | Controlling a time-scaling of an audio signal | |
JP2002271389A (en) | Packet processor and packet processing method | |
US7418013B2 (en) | Techniques to synchronize packet rate in voice over packet networks | |
Kim et al. | Enhancing VoIP speech quality using combined playout control and signal reconstruction | |
JPH07334191A (en) | Method of decoding packet sound | |
JP4050961B2 (en) | Packet-type voice communication terminal | |
JP4454255B2 (en) | Voice / fax communication system, voice / fax receiver, and fluctuation absorbing buffer amount control method | |
JP4534582B2 (en) | Audio stream reproduction apparatus and audio stream reproduction method | |
JP2006253843A (en) | Voice data interpolator and voice data interpolation method | |
JPH03296346A (en) | Voice packet recovery control method |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20051117 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20051130 |
|
A521 | Written amendment |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20060123 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20060329 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20060414 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20090421 Year of fee payment: 3 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20100421 Year of fee payment: 4 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20110421 Year of fee payment: 5 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20120421 Year of fee payment: 6 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20130421 Year of fee payment: 7 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20140421 Year of fee payment: 8 |
|
S111 | Request for change of ownership or part of ownership |
Free format text: JAPANESE INTERMEDIATE CODE: R313113 |
|
R350 | Written notification of registration of transfer |
Free format text: JAPANESE INTERMEDIATE CODE: R350 |
|
LAPS | Cancellation because of no payment of annual fees |