JP2008283667A - Voip communication device - Google Patents

Voip communication device Download PDF

Info

Publication number
JP2008283667A
JP2008283667A JP2008034717A JP2008034717A JP2008283667A JP 2008283667 A JP2008283667 A JP 2008283667A JP 2008034717 A JP2008034717 A JP 2008034717A JP 2008034717 A JP2008034717 A JP 2008034717A JP 2008283667 A JP2008283667 A JP 2008283667A
Authority
JP
Japan
Prior art keywords
voice data
rtp packet
data rtp
unit
stream
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP2008034717A
Other languages
Japanese (ja)
Other versions
JP5211736B2 (en
Inventor
Terutaka Mita
輝貴 三田
Yoshihiro Ariyama
義博 有山
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Oki Electric Industry Co Ltd
Original Assignee
Oki Electric Industry Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Oki Electric Industry Co Ltd filed Critical Oki Electric Industry Co Ltd
Priority to JP2008034717A priority Critical patent/JP5211736B2/en
Publication of JP2008283667A publication Critical patent/JP2008283667A/en
Application granted granted Critical
Publication of JP5211736B2 publication Critical patent/JP5211736B2/en
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Landscapes

  • Data Exchanges In Wide-Area Networks (AREA)
  • Telephonic Communication Services (AREA)

Abstract

<P>PROBLEM TO BE SOLVED: To provide a voice over Internet protocol (VoIP) communication device capable of communicating non-audio data in audio data real-time transport protocol (RTP) stream packet communication. <P>SOLUTION: A VoIP communication device according to the present invention prepares audio data RTP packets to be transmitted to a communication network by receiving or generating a stream of the audio data RTP packets, generates non-audio data RTP packets in a different data size from the prepared audio data RTP packets, replaces at least one of the prepared audio data RTP packets with the relevant non-audio data RTP packets, and transmits a stream of audio data RTP packets including the replacing non-audio data RTP packets to the relevant communication network. Furthermore, the VoIP communication device according to the present invention extracts the non-audio data RTP packets contained in the stream of audio data RTP packets received from the communication network based on the data size of the non-audio data RTP packets and reads information contained in the extracted non-audio data RTP packets. <P>COPYRIGHT: (C)2009,JPO&INPIT

Description

本発明は音声データRTPパケットのストリームを送受信して通信を行うVoIP通信装置に関する。   The present invention relates to a VoIP communication apparatus that performs communication by transmitting and receiving a stream of voice data RTP packets.

VoIP(Voice Over Internet Protocol)通信装置にて音声をストリーミング再生するための伝送プロトコルとして音声RTP(Real-time Transport Protocol)が知られている。音声データRTPパケットのストリーミングによる音声データの通信と併行した非音声データの通信が要望される場合がある。例えばインターネットなどのネットワークを通じて音声などのデジタルデータをやり取りする際に、通信途中で第三者に盗み見られたり改ざんされたりしないように暗号化することが多いが、この場合、暗号鍵という非音声データを通信することになる。RTPパケットの暗号化についてはIETF(Internet Engineering Task Force)により発行されたRFC(Request For Comments)3711にてSRTP(The Secure Real-time Transport Protocol)として標準化されている。ここでは暗号化のために必要な暗号鍵は予め登録するかあるいは別のプロトコルを使用して交換する方法が採用されている。RTPパケットの暗号通信では、暗号化のために必要な暗号鍵情報を、通信を行う装置に予め設定しない場合には、適宜、通信相手の端末に暗号鍵情報を送信する必要がある。非音声データの通知方法として例えば、特許文献1にはRTPとは別のプロトコルであるRTCP(RTP Control Protocol)を使用する通信装置及び暗号通信方法が開示されている。ここでの非音声データ(暗号鍵)通信方法は、通信装置自身のセッション鍵および当該鍵の識別情報を通話相手の公開鍵で暗号化し、これをRTCPパケットに格納して通話相手へ送信する。また、通話相手から受信したRTCPパケットに格納されている暗号化された通話相手のセッション鍵および当該鍵の識別情報を通信装置自身の秘密鍵で復号化する方法が開示されている。
特開2005−159959号公報
Voice RTP (Real-time Transport Protocol) is known as a transmission protocol for streaming reproduction of voice in a VoIP (Voice Over Internet Protocol) communication apparatus. In some cases, non-voice data communication in parallel with voice data communication by streaming voice data RTP packets is desired. For example, when exchanging digital data such as voice over a network such as the Internet, it is often encrypted so that it is not stolen or altered by a third party during communication. In this case, non-voice data called an encryption key is used. Will communicate. RTP packet encryption is standardized as SRTP (The Secure Real-time Transport Protocol) in RFC (Request For Comments) 3711 issued by IETF (Internet Engineering Task Force). Here, a method of registering an encryption key necessary for encryption in advance or exchanging it using another protocol is adopted. In encryption communication of RTP packets, if encryption key information necessary for encryption is not set in advance in a device that performs communication, it is necessary to appropriately transmit the encryption key information to a communication partner terminal. As a non-voice data notification method, for example, Patent Document 1 discloses a communication device and an encryption communication method using RTCP (RTP Control Protocol), which is a protocol different from RTP. In this non-voice data (encryption key) communication method, the session key of the communication device itself and the identification information of the key are encrypted with the public key of the other party, stored in an RTCP packet, and transmitted to the other party. Also disclosed is a method of decrypting the encrypted session partner's session key and identification information of the key stored in the RTCP packet received from the other party with the private key of the communication device itself.
JP 2005-159959 A

ところで、RTCPはデータの送受信チェックや送信者/受信者間などの付随情報を伝達するために用いられ、RTPのサブプロトコルとして位置付けられる。セキュリティの観点から、RTCPの如き付随情報を通信するために利用されるプロトコルによる情報通信を制限しているネットワークがしばしば見られる。RTCPパケットの通信路内に、RTCPプロトコルを利用した情報通信を制限しているネットワークが1つでも存在した場合、特許文献1に開示される通信方法を適用できず、暗号鍵などの非音声データを通信できないという問題点があった。   By the way, RTCP is used for transmitting / receiving data transmission / reception and accompanying information such as between a sender and a receiver, and is positioned as a sub-protocol of RTP. From the viewpoint of security, there are often seen networks that restrict information communication by a protocol used for communicating accompanying information such as RTCP. If there is at least one network that restricts information communication using the RTCP protocol in the communication path of the RTCP packet, the communication method disclosed in Patent Document 1 cannot be applied, and non-voice data such as an encryption key. There was a problem that could not communicate.

本発明は上記した如き問題点に鑑みてなされたものであって、音声データRTPストリームパケット通信において非音声データの通信を可能とするVoIP通信装置を提供することを目的とする。   The present invention has been made in view of the above-described problems, and an object thereof is to provide a VoIP communication apparatus that enables non-voice data communication in voice data RTP stream packet communication.

本発明によるVoIP通信装置は、通信ネットワークを介して音声データRTPパケットのストリームを送受信するVoIP通信装置であって、前記通信ネットワークへ送信すべき音声データRTPパケットのストリームを受信若しくは生成して準備する送信音声データRTPストリームパケット準備手段と、当該準備した音声データRTPパケットのデータサイズと異なるデータサイズの非音声データRTPパケットを生成する非音声データRTPパケット生成部と、当該準備した音声データRTPパケットの内の少なくとも1つを前記非音声データRTPパケットに置き換える非音声データRTPパケット挿入部と、当該置き換えた非音声データRTPパケットを含む音声データRTPパケットのストリームを前記通信ネットワークに送信するRTPストリームパケット送信手段と、を含むことを特徴とする。   A VoIP communication apparatus according to the present invention is a VoIP communication apparatus that transmits and receives a stream of voice data RTP packets via a communication network, and receives or generates a stream of voice data RTP packets to be transmitted to the communication network. A transmission voice data RTP stream packet preparation means, a non-voice data RTP packet generator for generating a non-voice data RTP packet having a data size different from the data size of the prepared voice data RTP packet, and the prepared voice data RTP packet A non-voice data RTP packet insertion unit that replaces at least one of them with the non-voice data RTP packet, and a stream of voice data RTP packets including the replaced non-voice data RTP packet to the communication network. Characterized in that it comprises a RTP stream packet transmitting means for, the.

また、本発明によるVoIP通信装置は、通信ネットワークを介して音声データRTPパケットのストリームを送受信するVoIP通信装置であって、前記通信ネットワークから受信した音声データRTPパケットのストリームに含まれる非音声データRTPパケットを当該非音声データRTPパケットのデータサイズに基づいて抽出する非音声データRTPパケット抽出部と、当該抽出した非音声データRTPパケットに含まれる情報を読み取る非音声データRTPパケット読取部と、を含むことを特徴とする。   The VoIP communication apparatus according to the present invention is a VoIP communication apparatus that transmits and receives a stream of voice data RTP packets via a communication network, and includes non-voice data RTP included in the stream of voice data RTP packets received from the communication network. A non-voice data RTP packet extraction unit that extracts packets based on the data size of the non-voice data RTP packet; and a non-voice data RTP packet reading unit that reads information contained in the extracted non-voice data RTP packet. It is characterized by that.

以下、本発明に係る実施例について添付の図面を参照しつつ詳細に説明する。   Hereinafter, embodiments according to the present invention will be described in detail with reference to the accompanying drawings.

図1は本発明によるVoIP通信装置を通信ネットワークと共に表すブロック図である。VoIP通信装置100は、RTP制御部110と、非音声データ読取生成部120と、DSP部130と、WANポート140と、SLIC部150と、を含む。   FIG. 1 is a block diagram showing a VoIP communication apparatus according to the present invention together with a communication network. The VoIP communication apparatus 100 includes an RTP control unit 110, a non-voice data reading / generating unit 120, a DSP unit 130, a WAN port 140, and an SLIC unit 150.

RTP制御部110は、RTPパケット送受信部111と、非音声データRTPパケット挿入部112と、非音声データRTPパケット抽出部113と、を含む。   The RTP control unit 110 includes an RTP packet transmission / reception unit 111, a non-voice data RTP packet insertion unit 112, and a non-voice data RTP packet extraction unit 113.

RTPパケット送受信部111は、WANポート140経由でインターネットなどの通信ネットワーク200を介して、音声データRTPパケットのストリームを送受信する。RTPパケット送受信部111は、WANポート140経由で通信ネットワーク200から音声データRTPパケットを受信したら、これをRTPパケット送受信部111に供給する。RTPパケット送受信部111は、音声データRTPパケットのストリーム内に非音声データRTPパケットが含まれていれば、これもRTPパケット送受信部111に供給する。また、RTPパケット送受信部111は、非音声データRTPパケット挿入部112から供給され且つ非音声データRTPパケットを含む音声データRTPパケットのストリームをWANポート140経由で通信ネットワーク200に送信する。なお、本実施例におけるRTPパケットはIETF(Internet Engineering Task Force)によって発行されたRFC(Request For Comments)1889の規定に準拠したものであれば良い。   The RTP packet transmission / reception unit 111 transmits / receives a stream of voice data RTP packets via the WAN port 140 and the communication network 200 such as the Internet. When the RTP packet transmission / reception unit 111 receives the voice data RTP packet from the communication network 200 via the WAN port 140, the RTP packet transmission / reception unit 111 supplies this to the RTP packet transmission / reception unit 111. The RTP packet transmission / reception unit 111 supplies the non-voice data RTP packet to the RTP packet transmission / reception unit 111 if the stream of the voice data RTP packet includes the non-voice data RTP packet. Further, the RTP packet transmission / reception unit 111 transmits a stream of voice data RTP packets supplied from the non-voice data RTP packet insertion unit 112 and including the non-voice data RTP packets to the communication network 200 via the WAN port 140. The RTP packet in this embodiment may be any packet that conforms to the provisions of RFC (Request For Comments) 1889 issued by the Internet Engineering Task Force (IETF).

非音声データRTPパケット挿入部112は、音声データRTPパケット生成部131から受け取った音声データRTPパケットの内の少なくとも1つを、非音声データRTPパケット生成部121から受け取った非音声データRTPパケットに置き換える。非音声データRTPパケット挿入部112は、好ましいタイミングにて音声データRTPパケットを非音声データRTPパケットに置き換えれば良い。非音声データRTPパケット挿入部112は、当該置き換えた非音声データRTPパケットを含む音声データRTPパケットのストリームをRTPパケット送受信部111に供給する。   The non-voice data RTP packet insertion unit 112 replaces at least one of the voice data RTP packets received from the voice data RTP packet generation unit 131 with the non-voice data RTP packet received from the non-voice data RTP packet generation unit 121. . The non-voice data RTP packet insertion unit 112 may replace the voice data RTP packet with a non-voice data RTP packet at a preferred timing. The non-voice data RTP packet insertion unit 112 supplies a stream of voice data RTP packets including the replaced non-voice data RTP packet to the RTP packet transmission / reception unit 111.

非音声データRTPパケット抽出部113は、RTPパケット送受信部111から受け取った音声データRTPパケットのストリームに含まれる非音声データRTPパケットを当該非音声データRTPパケットのデータサイズに基づいて抽出する。非音声データRTPパケット抽出部113は、当該抽出した非音声データRTPパケットを非音声データRTPパケット読取部122に供給する。また、非音声データRTPパケット抽出部113は、当該抽出した非音声データRTPパケット以外の音声データRTPパケットのストリームを音声信号変換部132に供給する。   The non-voice data RTP packet extraction unit 113 extracts the non-voice data RTP packet included in the stream of voice data RTP packets received from the RTP packet transmission / reception unit 111 based on the data size of the non-voice data RTP packet. The non-voice data RTP packet extraction unit 113 supplies the extracted non-voice data RTP packet to the non-voice data RTP packet reading unit 122. Further, the non-voice data RTP packet extraction unit 113 supplies a stream of voice data RTP packets other than the extracted non-voice data RTP packet to the voice signal conversion unit 132.

パケットのデータサイズはペイロード部分に含まれるデータ量によって異なってくる。通常、パケットのヘッダ内にパケット全体のサイズ情報が格納されている。非音声データRTPパケット抽出部113は、当該サイズ情報を参照するなどしてパケットのデータサイズを判別することができる。非音声データRTPパケット抽出部113は、音声データRTPパケットの所定データサイズを予め記憶しておく。非音声データRTPパケット抽出部113は、音声データRTPパケットまたは非音声データRTPパケットを受け取る度に、当該受け取ったRTPパケットのヘッダ内に格納されているサイズ情報を参照するなどして、パケットのデータサイズを判別する。非音声データRTPパケット抽出部113は、当該判別したサイズが予め記憶してある所定データサイズと異なる場合に、受け取ったRTPパケットが非音声データRTPパケットであると判別して、これを抽出する。   The data size of the packet varies depending on the amount of data included in the payload portion. Usually, the size information of the entire packet is stored in the header of the packet. The non-voice data RTP packet extraction unit 113 can determine the data size of the packet by referring to the size information. The non-voice data RTP packet extraction unit 113 stores a predetermined data size of the voice data RTP packet in advance. Each time the non-voice data RTP packet extraction unit 113 receives a voice data RTP packet or a non-voice data RTP packet, the non-voice data RTP packet extraction unit 113 refers to the size information stored in the header of the received RTP packet. Determine the size. When the determined size is different from the predetermined data size stored in advance, the non-voice data RTP packet extraction unit 113 determines that the received RTP packet is a non-voice data RTP packet and extracts it.

例えば、非音声データRTPパケット抽出部113は、音声データRTPパケットの所定データサイズを1000バイトとして予め記憶しておく。非音声データRTPパケット抽出部113は、音声データRTPパケットまたは非音声データRTPパケットを受け取る度に、当該受け取ったRTPパケットのヘッダ内に格納されているサイズ情報を参照し、当該サイズ情報が予め記憶してある所定データサイズの1000バイトと一致するか否かを判別する。例えば当該判別したサイズが1400バイトであった場合、受け取ったRTPパケットが非音声データRTPパケットであると判別して、これを抽出する。   For example, the non-voice data RTP packet extraction unit 113 stores the predetermined data size of the voice data RTP packet as 1000 bytes in advance. Each time the non-voice data RTP packet extraction unit 113 receives the voice data RTP packet or the non-voice data RTP packet, the non-voice data RTP packet extraction unit 113 refers to the size information stored in the header of the received RTP packet and stores the size information in advance. It is determined whether or not the predetermined data size matches 1000 bytes. For example, if the determined size is 1400 bytes, it is determined that the received RTP packet is a non-voice data RTP packet, and this is extracted.

非音声データ読取生成部120は、非音声データRTPパケット生成部121と、非音声データRTPパケット読取部122と、を含む。   The non-voice data reading / generating unit 120 includes a non-voice data RTP packet generating unit 121 and a non-voice data RTP packet reading unit 122.

非音声データRTPパケット生成部121は、音声データRTPパケット生成部131が生成している音声データRTPパケットと異なるデータサイズの非音声データRTPパケットを生成する。非音声データRTPパケット生成部121は、生成すべき非音声データRTPパケットの所定データサイズを予め記憶しておき、当該所定データサイズの非音声データRTPパケットを生成する。非音声データRTPパケットのサイズは、音声データRTPパケット生成部131が生成する音声データRTPパケットのサイズと異なるサイズであれば良く、音声データRTPパケットのサイズと比較した場合の大小は問わない。パケットのデータサイズはペイロード部分に含まれるデータ量によって異なるため、非音声データRTPパケットにおいて当該データ量を音声データRTPパケットのそれと異なるデータ量にすれば良い。   The non-voice data RTP packet generator 121 generates a non-voice data RTP packet having a data size different from that of the voice data RTP packet generated by the voice data RTP packet generator 131. The non-voice data RTP packet generation unit 121 stores a predetermined data size of the non-voice data RTP packet to be generated in advance, and generates a non-voice data RTP packet having the predetermined data size. The size of the non-voice data RTP packet may be any size different from the size of the voice data RTP packet generated by the voice data RTP packet generation unit 131, and the size of the non-voice data RTP packet is not limited when compared with the size of the voice data RTP packet. Since the data size of the packet differs depending on the amount of data included in the payload portion, the data amount in the non-voice data RTP packet may be set to a data quantity different from that of the voice data RTP packet.

例えば、非音声データRTPパケット生成部121は、生成すべき非音声データRTPパケットの所定データサイズを1400バイトとして予め記憶しておき、データサイズが1400バイトの非音声データRTPパケットを生成する。非音声データRTPパケット生成部121は好ましいタイミングにて非音声データRTPパケットを生成すれば良い。非音声データRTPパケット生成部121がペイロード部分に含めるデータは、例えば、端末識別情報、端末使用状況情報及びサービス対応状況情報などである。   For example, the non-voice data RTP packet generation unit 121 stores a predetermined data size of the non-voice data RTP packet to be generated as 1400 bytes in advance, and generates a non-voice data RTP packet with a data size of 1400 bytes. The non-voice data RTP packet generation unit 121 may generate the non-voice data RTP packet at a preferable timing. The data included in the payload portion by the non-voice data RTP packet generation unit 121 is, for example, terminal identification information, terminal usage status information, and service response status information.

端末識別情報とは例えば、当該VoIP通信装置の識別情報などであり、IPアドレスやMACアドレスなども含む。また、通信相手となるVoIP通信装置の同情報を確認情報として含むこともありうる。端末使用状況情報とは例えばアナログ電話端末300の使用状況や応答状況などである。サービス対応状況情報とはアナログ電話端末300がファクシミリやテレビ電話などのサービスに対応しているか否かを表す情報である。VoIP装置100は予めアナログ電話端末300からこれらの情報を入手しておくなどして、好ましいタイミングにて当該端末識別情報を含む非音声データRTPパケットを生成する。非音声データRTPパケットを受信する側のVoIP通信装置は、当該パケットに含まれる端末識別情報を送信する側のVoIP通信装置の認証処理などに利用できる。   The terminal identification information is, for example, identification information of the VoIP communication device, and includes an IP address and a MAC address. In addition, the same information of the VoIP communication device as a communication partner may be included as confirmation information. The terminal usage status information is, for example, the usage status or response status of the analog telephone terminal 300. The service support status information is information indicating whether or not the analog telephone terminal 300 supports services such as facsimile and videophone. The VoIP device 100 obtains such information from the analog telephone terminal 300 in advance, and generates a non-voice data RTP packet including the terminal identification information at a preferred timing. The VoIP communication device on the side that receives the non-voice data RTP packet can be used for authentication processing of the VoIP communication device on the side that transmits the terminal identification information included in the packet.

非音声データRTPパケット読取部122は、非音声データRTPパケット抽出部113から供給された非音声データRTPパケットに含まれる情報を読み取る。当該情報は例えば、上述した端末識別情報、端末使用状況情報及びサービス対応状況情報などである。VoIP通信装置100は、非音声データRTPパケット読取部122が読み取った端末識別情報に基づいて、送信側のVoIP通信装置の認証処理などを行うことができる。   The non-voice data RTP packet reading unit 122 reads information included in the non-voice data RTP packet supplied from the non-voice data RTP packet extraction unit 113. The information includes, for example, the above-described terminal identification information, terminal usage status information, service response status information, and the like. The VoIP communication apparatus 100 can perform authentication processing of the transmission-side VoIP communication apparatus based on the terminal identification information read by the non-voice data RTP packet reading unit 122.

DSP(Digital Signal Processor)部130は、音声データRTPパケット生成部131と、音声信号変換部132と、を含む。   The DSP (Digital Signal Processor) unit 130 includes an audio data RTP packet generation unit 131 and an audio signal conversion unit 132.

音声データRTPパケット生成部131は、SLIC部150から供給された音声信号に基づいて音声データRTPパケットのストリームを生成する。音声データRTPパケット生成部131は、当該生成によって準備した音声データRTPパケットを非音声データRTPパケット挿入部112に供給する。音声データRTPパケット生成部131は、生成すべき音声データRTPパケットの所定データサイズを予め記憶しておき、当該所定データサイズの音声データRTPパケットを生成する。例えば、音声データRTPパケット生成部131は、生成すべき音声データRTPパケットの所定データサイズを1000バイトとして予め記憶しておき、1000バイトの音声データRTPパケットを生成する。   The audio data RTP packet generation unit 131 generates a stream of audio data RTP packets based on the audio signal supplied from the SLIC unit 150. The voice data RTP packet generation unit 131 supplies the voice data RTP packet prepared by the generation to the non-voice data RTP packet insertion unit 112. The voice data RTP packet generation unit 131 stores a predetermined data size of the voice data RTP packet to be generated in advance, and generates a voice data RTP packet having the predetermined data size. For example, the voice data RTP packet generation unit 131 stores a predetermined data size of the voice data RTP packet to be generated as 1000 bytes in advance, and generates a 1000 byte voice data RTP packet.

音声信号変換部132は、非音声データRTPパケット抽出部113から供給された音声データRTPパケットのストリームを音声信号に変換してSLIC部150に供給する。また、音声信号変換部132は、PLC(packet Loss Concealment)などの補間機能を備えており、非音声データRTPパケット抽出部113によって抽出された非音声データRTPパケットを穴埋めするための音声データを生成できる。   The audio signal converter 132 converts the audio data RTP packet stream supplied from the non-audio data RTP packet extractor 113 into an audio signal and supplies the audio signal to the SLIC unit 150. The audio signal conversion unit 132 has an interpolation function such as PLC (packet loss concealment), and generates audio data for filling in the non-audio data RTP packet extracted by the non-audio data RTP packet extraction unit 113. it can.

WAN(World Area Network)ポート140は、RTPパケット送受信部111と通信ネットワーク200との間にあって音声データRTPパケットを中継する。   A WAN (World Area Network) port 140 is located between the RTP packet transmitting / receiving unit 111 and the communication network 200 and relays voice data RTP packets.

SLIC(Subscriber Line Interface Circuit)部150は、アナログ電話端末300から受信した音声信号を音声データRTPパケット生成部131に供給する。また、SLIC部150は、音声信号変換部132から供給された音声信号をアナログ電話端末300に送信する。   A SLIC (Subscriber Line Interface Circuit) unit 150 supplies a voice signal received from the analog telephone terminal 300 to the voice data RTP packet generation unit 131. In addition, the SLIC unit 150 transmits the audio signal supplied from the audio signal conversion unit 132 to the analog telephone terminal 300.

図2A〜2Cは送信時における非音声データRTPパケット挿入部でのRTPパケットのストリームの一例を表す図である。   2A to 2C are diagrams illustrating an example of a stream of RTP packets in the non-voice data RTP packet insertion unit at the time of transmission.

図2Aは非音声データRTPパケット挿入部112が音声データRTPパケット生成部131から受け取った音声データRTPパケットのストリームである。当該音声データRTPパケットのストリームは、アナログ電話端末300から送信された音声信号をSLIC部150が受信し、当該音声信号に基づいて音声データRTPパケット生成部131が生成したものである。非音声データRTPパケット挿入部112は音声データRTPパケットP1〜P5を音声データRTPパケット生成部131から順次、受け取る。   FIG. 2A shows a stream of voice data RTP packets received by the non-voice data RTP packet insertion unit 112 from the voice data RTP packet generation unit 131. The audio data RTP packet stream is generated by the audio data RTP packet generation unit 131 based on the audio signal received by the SLIC unit 150 from the audio signal transmitted from the analog telephone terminal 300. The non-voice data RTP packet insertion unit 112 sequentially receives the voice data RTP packets P1 to P5 from the voice data RTP packet generation unit 131.

図2Bは非音声データRTPパケット挿入部112が音声データRTPパケット生成部131から受け取った音声データRTPパケットP3を、非音声データRTPパケット生成部121から受け取った非音声データRTPパケットD3に置き換えるときの音声データRTPパケットのストリームである。このとき、非音声データRTPパケット挿入部112は音声データRTPパケットP3を破棄して、当該破棄した箇所に非音声データRTPパケットD3を挿入することによって非音声データRTPパケットD3に置き換える。非音声データRTPパケット挿入部112は、好ましいタイミングにて音声データRTPパケットを非音声データRTPパケットに置き換えれば良い。ここでは、音声データRTPパケットを1つだけ置き換えているが、本発明には音声データRTPパケットを置き換える個数にかかる制限は無く、非音声データRTPパケット生成部121が複数の非音声データRTPパケットを生成し、非音声データRTPパケット挿入部112がこれらと複数の音声データRTPパケットとを置き換えても良い。非音声データRTPパケットD3には非音声データRTPパケット生成部121により端末識別情報、端末使用状況情報及びサービス対応状況情報などの非音声データが含められている。非音声データRTPパケットD3のデータサイズは音声データRTPパケットP1、P2、P4、P5の各々のデータサイズと異なる。   FIG. 2B illustrates a case where the non-voice data RTP packet insertion unit 112 replaces the voice data RTP packet P3 received from the voice data RTP packet generation unit 131 with a non-voice data RTP packet D3 received from the non-voice data RTP packet generation unit 121. It is a stream of audio data RTP packets. At this time, the non-voice data RTP packet insertion unit 112 discards the voice data RTP packet P3 and replaces it with the non-voice data RTP packet D3 by inserting the non-voice data RTP packet D3 at the discarded location. The non-voice data RTP packet insertion unit 112 may replace the voice data RTP packet with a non-voice data RTP packet at a preferred timing. Here, only one voice data RTP packet is replaced, but the present invention has no limitation on the number of voice data RTP packets to be replaced, and the non-voice data RTP packet generation unit 121 replaces a plurality of voice data RTP packets. The non-voice data RTP packet insertion unit 112 may generate and replace these with a plurality of voice data RTP packets. The non-voice data RTP packet D3 includes non-voice data such as terminal identification information, terminal usage status information, and service response status information by the non-voice data RTP packet generator 121. The data size of the non-voice data RTP packet D3 is different from the data size of each of the voice data RTP packets P1, P2, P4, and P5.

図2Cは非音声データRTPパケット挿入部112が音声データRTPパケットP3を非音声データRTPパケットD3に置き換えた後の音声データRTPパケットのストリームである。非音声データRTPパケット挿入部112は音声データRTPパケットP1、P2、非音声データRTPパケットD3、音声データRTPパケットP4、P5をRTPパケット送受信部111に順次、供給する。RTPパケット送受信部111はこれらのRTPパケットを順次、WANポート140経由で通信ネットワーク200に送信する。   FIG. 2C is a stream of voice data RTP packets after the non-voice data RTP packet insertion unit 112 replaces the voice data RTP packet P3 with the non-voice data RTP packet D3. The non-voice data RTP packet insertion unit 112 sequentially supplies the voice data RTP packets P1 and P2, the non-voice data RTP packet D3, and the voice data RTP packets P4 and P5 to the RTP packet transmission / reception unit 111. The RTP packet transmitting / receiving unit 111 sequentially transmits these RTP packets to the communication network 200 via the WAN port 140.

上記したように音声データRTPパケットのストリーム送信において、RTPパケットでの非音声データの送信が可能となる。受信側の装置では非音声データRTPパケットD3を含む音声データRTPパケットのストリームを受信することにより、端末識別情報、端末使用状況情報及びサービス対応状況情報などの情報を得ることができる。   As described above, in the audio data RTP packet stream transmission, non-audio data can be transmitted in the RTP packet. By receiving the stream of the voice data RTP packet including the non-voice data RTP packet D3, the receiving apparatus can obtain information such as terminal identification information, terminal usage status information, and service response status information.

図3A及び3Bは受信時における非音声データRTPパケット抽出部でのRTPパケットのストリームの一例を表す図である。図3Cは受信時における音声信号変換部での音声データのストリームの一例を表す図である。   3A and 3B are diagrams illustrating an example of a stream of RTP packets in the non-voice data RTP packet extraction unit at the time of reception. FIG. 3C is a diagram illustrating an example of a stream of audio data in the audio signal conversion unit at the time of reception.

図3Aは非音声データRTPパケット抽出部113がRTPパケット送受信部111から受け取った音声データRTPパケットのストリームである。当該音声データRTPパケットのストリームは、RTPパケット送受信部111がWANポート140経由で通信ネットワーク200から受信したものであり、非音声データRTPパケットD3が含まれている。非音声データRTPパケットD3のデータサイズは音声データRTPパケットP1、P2、P4、P5の各々のデータサイズと異なる。非音声データRTPパケット抽出部113は音声データRTPパケットP1、P2、非音声データRTPパケットD3、音声データRTPパケットP4、P5をRTPパケット送受信部111から順次、受け取る。   FIG. 3A shows a stream of voice data RTP packets received by the non-voice data RTP packet extraction unit 113 from the RTP packet transmission / reception unit 111. The stream of the voice data RTP packet is received from the communication network 200 by the RTP packet transmission / reception unit 111 via the WAN port 140, and includes a non-voice data RTP packet D3. The data size of the non-voice data RTP packet D3 is different from the data size of each of the voice data RTP packets P1, P2, P4, and P5. The non-voice data RTP packet extraction unit 113 sequentially receives the voice data RTP packets P1 and P2, the non-voice data RTP packet D3, and the voice data RTP packets P4 and P5 from the RTP packet transmission / reception unit 111.

図3Bは非音声データRTPパケット抽出部113がRTPパケット送受信部111から受け取った非音声データRTPパケットD3を抽出するときの音声データRTPパケットのストリームである。このとき、非音声データRTPパケット抽出部113はパケットデータサイズに基づいて非音声データRTPパケットD3を抽出して、これを非音声データRTPパケット読取部122に供給する。非音声データRTPパケット抽出部113はRTPパケット送受信部111から音声データRTPパケットまたは非音声データRTPパケットを受け取る度に、当該受け取ったRTPパケットのヘッダ内に格納されているサイズ情報を参照するなどして、パケットのデータサイズを判別する。非音声データRTPパケット抽出部113は、当該判別したデータサイズ(例えば1400バイト)が予め記憶してある音声データRTPパケットの所定データサイズ(例えば1000バイト)と異なる場合に、受け取ったRTPパケットが非音声データRTPパケットであると判別して、これを抽出する。   FIG. 3B shows a stream of voice data RTP packets when the non-voice data RTP packet extraction unit 113 extracts the non-voice data RTP packet D3 received from the RTP packet transmission / reception unit 111. At this time, the non-voice data RTP packet extraction unit 113 extracts the non-voice data RTP packet D3 based on the packet data size and supplies it to the non-voice data RTP packet reading unit 122. Each time the non-voice data RTP packet extracting unit 113 receives a voice data RTP packet or a non-voice data RTP packet from the RTP packet transmitting / receiving unit 111, the non-voice data RTP packet extracting unit 113 refers to size information stored in the header of the received RTP packet. To determine the data size of the packet. The non-speech data RTP packet extraction unit 113 determines that the received RTP packet is non-successful when the determined data size (for example, 1400 bytes) is different from the predetermined data size (for example, 1000 bytes) of the stored sound data RTP packet. A voice data RTP packet is identified and extracted.

非音声データRTPパケットD3には例えば、端末識別情報、端末使用状況情報及びサービス対応状況情報などの非音声データが含められている。非音声データRTPパケット読取部122は供給された非音声データRTPパケットD3に含まれるこれらの情報を読み取ることができる。   The non-voice data RTP packet D3 includes, for example, non-voice data such as terminal identification information, terminal usage status information, and service response status information. The non-voice data RTP packet reading unit 122 can read the information included in the supplied non-voice data RTP packet D3.

非音声データRTPパケット抽出部113は、音声データRTPパケットP1、P2、P4及びP5を音声信号変換部132に順次、供給する。音声信号変換部132は、非音声データRTPパケット抽出部113から受け取った音声データRTPパケットP1、P2、P4及びP5を順次、音声データS1、S2、S4及びS5に変換する。   The non-voice data RTP packet extraction unit 113 sequentially supplies the voice data RTP packets P1, P2, P4, and P5 to the voice signal conversion unit 132. The audio signal converter 132 sequentially converts the audio data RTP packets P1, P2, P4, and P5 received from the non-audio data RTP packet extractor 113 into audio data S1, S2, S4, and S5.

図3Cは音声信号変換部132における音声データRTPパケットS1、S2、C3、S4及びS5のストリームを表す図である。音声信号変換部132はPLC(Packet Loss Concealment)などの補間機能を備えており、抽出された非音声データRTPパケットD3を穴埋めするための音声データC3を生成する。音声信号変換部132は、生成した音声データC3を含む音声データS1、S2、C3、S4、S5をSLIC部150に順次、供給する。また、SLIC部150は、音声信号変換部132から供給された音声データをアナログ電話端末300に送信する。   FIG. 3C is a diagram illustrating a stream of audio data RTP packets S1, S2, C3, S4, and S5 in the audio signal conversion unit 132. The audio signal conversion unit 132 has an interpolation function such as PLC (Packet Loss Concealment), and generates audio data C3 for filling the extracted non-audio data RTP packet D3. The audio signal conversion unit 132 sequentially supplies audio data S1, S2, C3, S4, and S5 including the generated audio data C3 to the SLIC unit 150. In addition, the SLIC unit 150 transmits the audio data supplied from the audio signal conversion unit 132 to the analog telephone terminal 300.

上記したように音声データRTPパケットのストリーム受信において、RTPパケットでの非音声データの受信が可能となる。非音声データRTPパケットD3には端末識別情報、端末使用状況情報及びサービス対応状況情報などの情報が含まれており、受信側の装置では非音声データRTPパケットD3を含む音声データRTPパケットのストリームを受信することにより、これらの情報を得ることができる。   As described above, in the stream reception of the voice data RTP packet, it is possible to receive the non-voice data by the RTP packet. The non-voice data RTP packet D3 includes information such as terminal identification information, terminal usage status information, and service response status information. The receiving-side apparatus receives a stream of voice data RTP packets including the non-voice data RTP packet D3. Such information can be obtained by receiving.

上記した如く本実施例によれば、音声データRTPパケットのストリーム送受信において、RTPパケットでの非音声データの送受信が可能となる。例えばVoIP通信装置100が非音声データRTPパケットに自身の識別情報を含めて送信すれば、受信側の装置において当該識別情報を受信することができる。なお、ここでの受信側の装置とは本発明によるVoIP通信装置でも良いし、他の装置でも良い。これにより、通信ネットワーク内にRTPとは異なるプロトコル(例えばRTCPなど)による通信を制限しているネットワークが存在した場合でも、識別情報の送受信が可能となる。受信側の装置は当該識別情報を送信側のVoIP通信装置の認証処理に利用することができる。また、送信側の端末(例えばアナログ電話端末300)の使用状況やファクシミリ及びTV電話などのサービスの対応の有無を表すデータを非音声データRTPパケットに含めて送信することにより、受信側の装置がこれらの情報を受信することができる。仮に受信側の装置が本発明によるVoIP通信装置ではない場合、非音声データRTPパケットは不完全なパケットと判別され、当該RTPパケットは破棄される。受信側の装置がPLCなどの補間機能を備えていれば、当該破棄されたRTPパケットに代えて音声データが補間されるため、聴感上の影響は最小限に止められる。   As described above, according to the present embodiment, in the stream transmission / reception of the voice data RTP packet, the transmission / reception of the non-voice data by the RTP packet becomes possible. For example, if the VoIP communication device 100 transmits the non-voice data RTP packet including its own identification information, the reception side device can receive the identification information. Note that the receiving-side device here may be a VoIP communication device according to the present invention or another device. As a result, even when there is a network that restricts communication using a protocol (for example, RTCP) different from RTP in the communication network, the identification information can be transmitted and received. The receiving apparatus can use the identification information for authentication processing of the transmitting VoIP communication apparatus. In addition, by transmitting the data indicating the usage status of the terminal on the transmitting side (for example, analog telephone terminal 300) and the availability of services such as facsimile and videophone in a non-voice data RTP packet, the receiving apparatus can transmit the data. These pieces of information can be received. If the receiving apparatus is not a VoIP communication apparatus according to the present invention, the non-voice data RTP packet is determined as an incomplete packet, and the RTP packet is discarded. If the receiving apparatus has an interpolating function such as PLC, the audio data is interpolated in place of the discarded RTP packet, so the influence on hearing is minimized.

図4はLANポート及び無線LANポートを含むVoIP通信装置を表すブロック図である。他のブロックは図1に示されるのと同様である。実施例1と同様にSLIC部150は、DSP部130を介して非音声データRTPパケット挿入部112及び非音声データRTPパケット抽出部113と音声データをやり取りする。それに対して、LANポート160及び無線LANポート170はDSP部130を介さずに非音声データRTPパケット挿入部112及び非音声データRTPパケット抽出部113とそれぞれ接続される。   FIG. 4 is a block diagram showing a VoIP communication apparatus including a LAN port and a wireless LAN port. The other blocks are the same as those shown in FIG. Similar to the first embodiment, the SLIC unit 150 exchanges voice data with the non-voice data RTP packet insertion unit 112 and the non-voice data RTP packet extraction unit 113 via the DSP unit 130. On the other hand, the LAN port 160 and the wireless LAN port 170 are connected to the non-voice data RTP packet insertion unit 112 and the non-voice data RTP packet extraction unit 113 without going through the DSP unit 130, respectively.

非音声データRTPパケット挿入部112は、LANポート160または無線LANポート170から受け取った音声データRTPパケットの内の少なくとも1つを、非音声データRTPパケット生成部121から受け取った非音声データRTPパケットに置き換える。非音声データRTPパケット挿入部112は、当該置き換えた非音声データRTPパケットを含む音声データRTPパケットのストリームをRTPパケット送受信部111に供給する。   The non-voice data RTP packet insertion unit 112 converts at least one of the voice data RTP packets received from the LAN port 160 or the wireless LAN port 170 into the non-voice data RTP packet received from the non-voice data RTP packet generation unit 121. replace. The non-voice data RTP packet insertion unit 112 supplies a stream of voice data RTP packets including the replaced non-voice data RTP packet to the RTP packet transmission / reception unit 111.

非音声データRTPパケット抽出部113は、RTPパケット送受信部111から受け取った音声データRTPパケットのストリームに含まれる非音声データRTPパケットを当該非音声データRTPパケットのデータサイズに基づいて抽出する。非音声データRTPパケット抽出部113は、当該抽出した非音声データRTPパケットを非音声データRTPパケット読取部122に供給する。また、非音声データRTPパケット抽出部113は、当該抽出した非音声データRTPパケット以外の音声データRTPパケットのストリームをLANポート160または無線LANポート170に供給する。   The non-voice data RTP packet extraction unit 113 extracts the non-voice data RTP packet included in the stream of voice data RTP packets received from the RTP packet transmission / reception unit 111 based on the data size of the non-voice data RTP packet. The non-voice data RTP packet extraction unit 113 supplies the extracted non-voice data RTP packet to the non-voice data RTP packet reading unit 122. Further, the non-voice data RTP packet extraction unit 113 supplies a stream of voice data RTP packets other than the extracted non-voice data RTP packet to the LAN port 160 or the wireless LAN port 170.

LANポート160は、IP電話端末400から音声データRTPパケットのストリームを受信する。LANポート160は、当該受信によって準備した音声データRTPパケットのストリームを非音声データRTPパケット挿入部112に供給する。また、LANポート160は、非音声データRTPパケット抽出部113から供給された音声データRTPパケットのストリームをIP電話端末400に送信する。   LAN port 160 receives a stream of voice data RTP packets from IP telephone terminal 400. The LAN port 160 supplies the stream of voice data RTP packets prepared by the reception to the non-voice data RTP packet insertion unit 112. Further, the LAN port 160 transmits a stream of voice data RTP packets supplied from the non-voice data RTP packet extraction unit 113 to the IP telephone terminal 400.

無線LANポート170は、無線IP電話端末500から音声データRTPパケットのストリームを受信する。無線LANポート170は、当該受信によって準備した音声データRTPパケットのストリームを非音声データRTPパケット挿入部112に供給する。また、無線LANポート170は、非音声データRTPパケット抽出部113から供給された音声データRTPパケットのストリームを無線IP電話端末500に送信する。   The wireless LAN port 170 receives a stream of voice data RTP packets from the wireless IP telephone terminal 500. The wireless LAN port 170 supplies the stream of voice data RTP packets prepared by the reception to the non-voice data RTP packet insertion unit 112. Further, the wireless LAN port 170 transmits a stream of voice data RTP packets supplied from the non-voice data RTP packet extraction unit 113 to the wireless IP telephone terminal 500.

再び図2A〜2Cを参照しつつ、IP電話端末400または無線IP電話端末500から受信した音声データRTPパケットのストリームを通信ネットワーク200へ送信する場合における非音声データRTPパケット挿入部112でのRTPパケットのストリームについて説明する。   2A to 2C again, the RTP packet in the non-voice data RTP packet insertion unit 112 when the voice data RTP packet stream received from the IP telephone terminal 400 or the wireless IP telephone terminal 500 is transmitted to the communication network 200. Will be described.

図2Aは非音声データRTPパケット挿入部112がLANポート160または無線LANポート170から受け取った音声データRTPパケットのストリームである。非音声データRTPパケット挿入部112は音声データRTPパケットP1〜P5をLANポート160または無線LANポート170から順次、受け取る。   FIG. 2A shows a stream of voice data RTP packets received from the LAN port 160 or the wireless LAN port 170 by the non-voice data RTP packet insertion unit 112. The non-voice data RTP packet insertion unit 112 sequentially receives voice data RTP packets P1 to P5 from the LAN port 160 or the wireless LAN port 170.

図2Bは非音声データRTPパケット挿入部112がLANポート160または無線LANポート170から受け取った音声データRTPパケットP3を、非音声データRTPパケット生成部121から受け取った非音声データRTPパケットD3に置き換えるときの音声データRTPパケットのストリームである。このとき、非音声データRTPパケット挿入部112は実施例1と同様に音声データRTPパケットP3を破棄して、当該破棄した箇所に非音声データRTPパケットD3を挿入することによって非音声データRTPパケットD3に置き換える。   FIG. 2B illustrates a case where the non-voice data RTP packet insertion unit 112 replaces the voice data RTP packet P3 received from the LAN port 160 or the wireless LAN port 170 with the non-voice data RTP packet D3 received from the non-voice data RTP packet generation unit 121. Is a stream of voice data RTP packets. At this time, the non-voice data RTP packet insertion unit 112 discards the voice data RTP packet P3 in the same manner as in the first embodiment, and inserts the non-voice data RTP packet D3 into the discarded portion, thereby causing the non-voice data RTP packet D3 to be discarded. Replace with

図2Cは非音声データRTPパケット挿入部112が音声データRTPパケットP3を非音声データRTPパケットD3に置き換えた後の音声データRTPパケットのストリームである。実施例1と同様に非音声データRTPパケット挿入部112は音声データRTPパケットP1、P2、非音声データRTPパケットD3、音声データRTPパケットP4、P5をRTPパケット送受信部111に順次、供給する。RTPパケット送受信部111はこれらのRTPパケットを受け取った順に順次、WANポート140経由で通信ネットワーク200に送信する。   FIG. 2C is a stream of voice data RTP packets after the non-voice data RTP packet insertion unit 112 replaces the voice data RTP packet P3 with the non-voice data RTP packet D3. As in the first embodiment, the non-voice data RTP packet insertion unit 112 sequentially supplies the voice data RTP packets P1 and P2, the non-voice data RTP packet D3, and the voice data RTP packets P4 and P5 to the RTP packet transmission / reception unit 111. The RTP packet transmission / reception unit 111 sequentially transmits these RTP packets to the communication network 200 via the WAN port 140 in the order received.

上記したようにIP電話端末400や無線IP電話端末500から受信した音声データRTPパケットの内の少なくとも1つを非音声データRTPパケットに置き換えて通信ネットワーク200へ送信することにより、RTPパケットでの非音声データの送信が可能となる。   As described above, at least one of the voice data RTP packets received from the IP telephone terminal 400 or the wireless IP telephone terminal 500 is replaced with a non-voice data RTP packet and transmitted to the communication network 200. Audio data can be transmitted.

再び図3A〜3Cを参照しつつ、通信ネットワーク200から受信した音声データRTPパケットのストリームをIP電話端末400または無線IP電話端末500へ向けて送信する場合における非音声データRTPパケット抽出部113でのRTPパケットのストリームについて説明する。   3A to 3C again, the non-voice data RTP packet extraction unit 113 in the case of transmitting the voice data RTP packet stream received from the communication network 200 to the IP telephone terminal 400 or the wireless IP telephone terminal 500. The RTP packet stream will be described.

実施例1と同様に非音声データRTPパケット抽出部113は、図3Aに示される如き音声データRTPパケットP1、P2、非音声データRTPパケットD3、音声データRTPパケットP4、P5をRTPパケット送受信部111から順次、受け取る。   As in the first embodiment, the non-voice data RTP packet extraction unit 113 converts the voice data RTP packets P1 and P2, the non-voice data RTP packet D3, and the voice data RTP packets P4 and P5 as shown in FIG. Receive sequentially.

実施例1と同様に非音声データRTPパケット抽出部113は、図3Bに示される如くRTPパケット送受信部111から受け取った非音声データRTPパケットD3を抽出し、これを非音声データRTPパケット読取部122に供給する。   As in the first embodiment, the non-voice data RTP packet extraction unit 113 extracts the non-voice data RTP packet D3 received from the RTP packet transmission / reception unit 111 as shown in FIG. To supply.

非音声データRTPパケット抽出部113は音声データRTPパケットP1、P2、P4及びP5をLANポート160または無線LANポート170に順次、供給する。LANポート160は、非音声データRTPパケット抽出部113から受け取った音声データRTPパケットを順次、IP電話端末400に送信する。また、無線LANポート170は非音声データRTPパケット抽出部113から受け取った音声データRTPパケットを順次、無線IP電話端末500に送信する。IP電話端末400または無線IP電話端末500は受信した音声データRTPパケットP1、P2、P4及びP5を順次、音声データS1、S2、S4及びS5に変換する。   The non-voice data RTP packet extraction unit 113 sequentially supplies the voice data RTP packets P1, P2, P4, and P5 to the LAN port 160 or the wireless LAN port 170. The LAN port 160 sequentially transmits the voice data RTP packets received from the non-voice data RTP packet extraction unit 113 to the IP telephone terminal 400. Further, the wireless LAN port 170 sequentially transmits the voice data RTP packets received from the non-voice data RTP packet extraction unit 113 to the wireless IP telephone terminal 500. IP telephone terminal 400 or wireless IP telephone terminal 500 sequentially converts received voice data RTP packets P1, P2, P4 and P5 into voice data S1, S2, S4 and S5.

図3CはIP電話端末400または無線IP電話端末500における音声データS1、S2、C3、S4及びS5に変換した後の音声データのストリームを表す図である。IP電話端末400及び無線IP電話端末500はPLCなどの補間機能によって、抽出された非音声データRTPパケットD3を穴埋めするための音声データC3を生成できる。IP電話端末400及び無線IP電話端末500は生成した音声データC3を含む音声データS1、S2、C3、S4及びS5を順次、音声出力する。   FIG. 3C is a diagram showing a stream of audio data after being converted into audio data S1, S2, C3, S4, and S5 in IP telephone terminal 400 or wireless IP telephone terminal 500. The IP telephone terminal 400 and the wireless IP telephone terminal 500 can generate voice data C3 for filling the extracted non-voice data RTP packet D3 by an interpolation function such as PLC. The IP telephone terminal 400 and the wireless IP telephone terminal 500 sequentially output voice data S1, S2, C3, S4 and S5 including the generated voice data C3.

上記したように通信ネットワーク200から受信した音声データRTPパケットの内の少なくとも1つを非音声データRTPパケットに置き換えてIP電話端末400や無線IP電話端末500へ送信することにより、RTPパケットでの非音声データの送信が可能となる。   As described above, at least one of the voice data RTP packets received from the communication network 200 is replaced with a non-voice data RTP packet and transmitted to the IP telephone terminal 400 or the wireless IP telephone terminal 500, so Audio data can be transmitted.

上記した如く本実施例によれば、音声データRTPパケットのストリームを受信し、当該音声データRTPパケットの内の少なくとも1つを非音声データRTPパケットに置き換えて送信することにより、RTPパケットでの非音声データの送信が可能となる。非音声データRTPパケットに端末識別情報、端末使用状況情報及びサービス対応状況情報などの非音声データを含めて送受信すれば、実施例1で述べたのと同様の効果を得ることができる。   As described above, according to the present embodiment, a stream of voice data RTP packets is received, and at least one of the voice data RTP packets is replaced with a non-voice data RTP packet and transmitted. Audio data can be transmitted. If non-voice data including non-voice data such as terminal identification information, terminal usage status information, and service response status information is transmitted and received in the non-voice data RTP packet, the same effect as described in the first embodiment can be obtained.

実施例1及び2ではアナログ電話端末300、IP電話端末400及び無線IP電話端末500の各々を各1台としたが、本発明にはかかる電話端末数の制限は無い。また、通常、アナログ電話端末300とSLIC部とはアナログ通信回線で、IP電話端末とLANポート160とはLAN網で、無線IP電話端末500と無線LANポート170とは無線LAN網で接続されるが、本発明にはかかる接続形態の制限は無い。   In the first and second embodiments, each of the analog telephone terminal 300, the IP telephone terminal 400, and the wireless IP telephone terminal 500 is one, but the present invention has no limitation on the number of telephone terminals. In general, the analog telephone terminal 300 and the SLIC unit are connected by an analog communication line, the IP telephone terminal and the LAN port 160 are connected by a LAN network, and the wireless IP telephone terminal 500 and the wireless LAN port 170 are connected by a wireless LAN network. However, there is no limitation on the connection form in the present invention.

実施例1及び2では、RTP制御部100、非音声データ読取生成部120及びDSP部130がそれぞれ独立した構成となっているが、例えば、音声データ及び非音声データRTPパケットの判別をDSP部130にて実施することも可能である。   In the first and second embodiments, the RTP control unit 100, the non-voice data reading / generating unit 120, and the DSP unit 130 are configured independently of each other. For example, the DSP unit 130 determines whether the voice data and the non-voice data RTP packet are discriminated. It is also possible to implement in.

非音声データRTPパケットのサイズは音声データRTPパケットのサイズより大きくても小さくても良く、また、サイズ自体にも特に制限は無い。   The size of the non-voice data RTP packet may be larger or smaller than the size of the voice data RTP packet, and the size itself is not particularly limited.

図5は識別無音データ管理部123を含むVoIP通信装置100を表すブロック図である。VoIP通信装置100が、非音声データRTPパケット生成部121、非音声データRTPパケット挿入部112及び非音声データRTPパケット抽出部113を含まず、識別無音データ管理部123を含む点が実施例1と異なる。以下、実施例1と異なる部分を主として説明する。   FIG. 5 is a block diagram showing the VoIP communication apparatus 100 including the identification silence data management unit 123. The point that the VoIP communication apparatus 100 does not include the non-voice data RTP packet generation unit 121, the non-voice data RTP packet insertion unit 112, and the non-voice data RTP packet extraction unit 113 but includes the identification silence data management unit 123 is the same as in the first embodiment. Different. Hereinafter, parts different from the first embodiment will be mainly described.

識別無音データ管理部123は、RTPパケットのペイロードに含めるべき識別無音データを管理している。ITU−Tの勧告により規定されているG.711符号化規格においては、データ0x7F及び0xFFは無音を示すデータとして定められている。識別無音データ管理部123は、例えばデータ0x7Fを論理値0、データ0xFFを論理値1に対応付けて管理する。この場合、識別無音データ管理部123は、例えば0x7F、0xFF、0x7F、0xFF、・・・に対応する識別無音データ0101・・・を記憶している。識別無音データ0101・・・は、例えば20msフレームであれば160bit分からなる。当該識別無音データは、受信側のVoIP通信装置100において非音声データRTPパケットを識別するために利用される。識別無音データ管理部123は、音声データRTPパケット生成部131へ識別無音データを適宜、与える。また、識別無音データ管理部123は、端末識別情報、端末使用状況情報及びサービス対応状況情報などの端末サービス情報を記憶しており、端末サービス情報を識別無音データと共に音声データRTPパケット生成部131へ与える。   The identification silence data management unit 123 manages identification silence data to be included in the payload of the RTP packet. The G.C. In the 711 coding standard, data 0x7F and 0xFF are defined as data indicating silence. The identification silence data management unit 123 manages data 0x7F in association with a logical value 0 and data 0xFF in association with a logical value 1, for example. In this case, the identification silence data management unit 123 stores identification silence data 0101... Corresponding to, for example, 0x7F, 0xFF, 0x7F, 0xFF,. The identification silence data 0101... Consists of 160 bits for a 20 ms frame, for example. The identification silence data is used to identify the non-voice data RTP packet in the VoIP communication apparatus 100 on the receiving side. The identification silence data management unit 123 appropriately provides the identification silence data to the voice data RTP packet generation unit 131. Further, the identification silence data management unit 123 stores terminal service information such as terminal identification information, terminal usage status information, and service response status information, and the terminal service information is transmitted to the voice data RTP packet generation unit 131 together with the identification silence data. give.

音声データRTPパケット生成部131は、SLIC部150からの音声信号をG.711符号化規格に従って変換して音声データRTPパケットを生成しつつ、識別無音データ管理部123から識別無音データを受け取った場合には、当該識別無音データを変換して得られた識別非音声データを含む非音声データRTPパケットを生成する。図6は識別非音声データを含むRTPパケットの例を表す図である。RTPヘッダ部分には図6に示されるように通常、ヘッダに含まれるべきデータが含まれていれば良い。RTPペイロードには、音声データRTPパケット生成部131が識別無音データ管理部123からの識別無音データをG.711符号化規格において無音を表すデータ0x7F及び0xFFに変換して得られた識別非音声データが含まれている。識別無音データ管理部123からの識別無音データが010・・・010であった場合、音声データRTPパケット生成部131は、論理値0をデータ0x7Fに、論理値1をデータ0xFFに、それぞれ変換して識別非音声データ0x7F、0xFF、0x7F、・・・、0x7F、0xFF、0x7Fを得て、これを図6に示される如くRTPペイロードに含む非音声データRTPパケットを生成する。このとき、音声データRTPパケット生成部131は、識別無音データと共に識別無音データ管理部123から受け取った端末サービス情報を当該非音声データRTPパケットに含める。音声データRTPパケット生成部131は、当該生成により得られた非音声データRTPパケットを含む音声データRTPパケットストリームをRTPパケット送受信部111へ与える。   The audio data RTP packet generation unit 131 receives the audio signal from the SLIC unit 150 as a G.D. When the identification silence data is received from the identification silence data management unit 123 while generating the voice data RTP packet by converting according to the 711 coding standard, the identification non-voice data obtained by converting the identification silence data is A non-voice data RTP packet is generated. FIG. 6 is a diagram illustrating an example of an RTP packet including identification non-voice data. As shown in FIG. 6, the RTP header portion usually only needs to include data to be included in the header. In the RTP payload, the voice data RTP packet generation unit 131 stores the identification silence data from the identification silence data management unit 123 in the G.G. The discriminating non-speech data obtained by converting data 0x7F and 0xFF representing silence in the 711 coding standard is included. When the identification silence data from the identification silence data management unit 123 is 010... 010, the voice data RTP packet generation unit 131 converts the logical value 0 into data 0x7F and the logical value 1 into data 0xFF. Thus, identification non-voice data 0x7F, 0xFF, 0x7F,..., 0x7F, 0xFF, 0x7F are obtained, and non-voice data RTP packets including this in the RTP payload are generated as shown in FIG. At this time, the voice data RTP packet generation unit 131 includes the terminal service information received from the identification silence data management unit 123 together with the identification silence data in the non-voice data RTP packet. The voice data RTP packet generation unit 131 provides the RTP packet transmission / reception unit 111 with the voice data RTP packet stream including the non-voice data RTP packet obtained by the generation.

RTPパケット送受信部111は、音声データRTPパケット生成部131からの非音声データRTPパケットを含む音声データRTPパケットストリームをWANポート140経由で通信ネットワーク200へ送信する。   The RTP packet transmission / reception unit 111 transmits the voice data RTP packet stream including the non-voice data RTP packet from the voice data RTP packet generation unit 131 to the communication network 200 via the WAN port 140.

音声信号変換部132は、RTPパケット送受信部111から非音声データRTPパケットを含む音声データRTPパケットのストリームを受け取り、当該音声データRTPパケットの各々についてRTPペイロードに識別非音声データが含まれているか否かを判別する。音声信号変換部132は、RTPペイロードに識別非音声データを含む音声データRTPパケットを非音声データRTPパケットと識別する。音声信号変換部132は、RTPペイロード部分に含まれているデータ0x7F及び0xFFをそれぞれ識別する機能を有しており、データ0x7Fを論理値0、データ0xFFを論理値1へそれぞれデコードする。   The audio signal conversion unit 132 receives a stream of audio data RTP packets including non-audio data RTP packets from the RTP packet transmission / reception unit 111, and whether or not identification non-audio data is included in the RTP payload for each of the audio data RTP packets. Is determined. The audio signal conversion unit 132 identifies the audio data RTP packet including the identified non-audio data in the RTP payload as the non-audio data RTP packet. The audio signal conversion unit 132 has a function of identifying the data 0x7F and 0xFF included in the RTP payload portion, and decodes the data 0x7F into a logical value 0 and the data 0xFF into a logical value 1, respectively.

音声信号変換部132は、送信側のVoIP通信装置100の識別無音データ管理部123において管理されている識別無音データと同一の識別無音データを予め記憶している。例えば、送信側のVoIP通信装置100の識別無音データ管理部123において管理されている識別無音データが0101・・・0101である場合、音声信号変換部132は、同じく識別無音データが0101・・・0101を予め記憶している。音声信号変換部132は、RTPパケット送受信部111からの音声データRTPパケットの各々についてRTPペイロードに含まれているデータをデコードし、当該デコードによって得られたデータ0101・・・0101が、自身が予め記憶している識別無音データ0101・・・0101と一致した場合に、当該音声データRTPパケットを非音声データRTPパケットと識別する。音声信号変換部132は、非音声データRTPパケットを非音声データRTPパケット読取部122へ与える。   The audio signal conversion unit 132 stores in advance the identification silence data that is the same as the identification silence data managed by the identification silence data management unit 123 of the transmission-side VoIP communication apparatus 100. For example, when the identification silence data managed by the identification silence data management unit 123 of the transmission-side VoIP communication apparatus 100 is 0101... 0101, the audio signal conversion unit 132 also has the identification silence data 0101. 0101 is stored in advance. The audio signal conversion unit 132 decodes the data included in the RTP payload for each of the audio data RTP packets from the RTP packet transmission / reception unit 111, and the data 0101... If it matches the stored identification silence data 0101... 0101, the voice data RTP packet is identified as a non-voice data RTP packet. The audio signal conversion unit 132 provides the non-audio data RTP packet to the non-audio data RTP packet reading unit 122.

非音声データRTPパケット読取部122は非音声データRTPパケットに含まれている端末識別情報、端末使用状況情報及びサービス対応状況情報などの端末サービス情報を読み取る。   The non-voice data RTP packet reading unit 122 reads terminal service information such as terminal identification information, terminal usage status information, and service response status information included in the non-voice data RTP packet.

図7は、音声データRTPパケットストリームの送信側及び受信側のVoIP通信装置100の動作を表すシーケンス図である。以下、図7を参照しつつ、音声データRTPパケットストリームの送信側及び受信側のVoIP通信装置100の動作について説明する。   FIG. 7 is a sequence diagram showing the operation of the VoIP communication apparatus 100 on the transmission side and reception side of the voice data RTP packet stream. Hereinafter, the operation of the VoIP communication apparatus 100 on the transmission side and reception side of the voice data RTP packet stream will be described with reference to FIG.

送信側のVoIP通信装置100は以下のように動作する。識別無音データ管理部123は、自身が管理している識別無音データ及び端末識別情報、端末使用状況情報及びサービス対応状況情報などの端末サービス情報を音声データRTPパケット生成部131へ適宜、与える(ステップS101)。   The transmitting-side VoIP communication apparatus 100 operates as follows. The identification silence data management unit 123 appropriately provides terminal service information such as identification silence data and terminal identification information, terminal usage status information, and service response status information managed by the identification silence data management unit 123 to the voice data RTP packet generation unit 131 (step). S101).

音声データRTPパケット生成部131は、SLIC部150からの音声信号をG.711符号化規格に従って変換して音声データRTPパケットを生成しつつ、識別無音データ管理部123から識別無音データを受け取った場合には、当該識別無音データを変換して得られた識別非音声データを含む非音声データRTPパケットを生成する(ステップS102)。当該非音声データRTPパケットのRTPペイロードには、例えば図6に示されるようにG.711規格において無音を表すデータ0x7F及び0xFFのからなる識別非音声データが含まれる。このとき、音声データRTPパケット生成部131は、識別無音データ管理部123からの端末サービス情報も併せて当該非音声データRTPパケットに含める。   The audio data RTP packet generation unit 131 receives the audio signal from the SLIC unit 150 as a G.D. When the identification silence data is received from the identification silence data management unit 123 while generating the voice data RTP packet by converting according to the 711 coding standard, the identification non-voice data obtained by converting the identification silence data is A non-voice data RTP packet including the same is generated (step S102). In the RTP payload of the non-voice data RTP packet, for example, as shown in FIG. In the 711 standard, identification non-speech data composed of data 0x7F and 0xFF representing silence is included. At this time, the voice data RTP packet generation unit 131 also includes the terminal service information from the identification silence data management unit 123 in the non-voice data RTP packet.

音声データRTPパケット生成部131は、当該生成により得られた非音声データRTPパケットを含む音声データRTPパケットストリームをRTPパケット送受信部111へ与える。RTPパケット送受信部111は、音声データRTPパケット生成部131からの非音声データRTPパケットを含む音声データRTPパケットストリームをWANポート140経由で通信ネットワーク200へ送信する(ステップS103)。   The voice data RTP packet generation unit 131 provides the RTP packet transmission / reception unit 111 with the voice data RTP packet stream including the non-voice data RTP packet obtained by the generation. The RTP packet transmission / reception unit 111 transmits the voice data RTP packet stream including the non-voice data RTP packet from the voice data RTP packet generation unit 131 to the communication network 200 via the WAN port 140 (step S103).

受信側のVoIP通信装置100は以下のように動作する。音声信号変換部132は、RTPパケット送受信部111から非音声データRTPパケットを含む音声データRTPパケットのストリームを受け取り(ステップS104)、RTPペイロードに識別非音声データが含まれている音声データRTPパケットを非音声データRTPパケットと識別する。このとき、音声信号変換部132は、RTPペイロード部分に含まれているデータ0x7Fを論理値0、データ0xFFを論理値1へそれぞれデコードして得られたデータ列と、自身が予め記憶している識別無音データと、が一致した場合に当該音声データRTPパケットを非音声データRTPパケットと識別する(ステップS105)。   The receiving-side VoIP communication apparatus 100 operates as follows. The audio signal conversion unit 132 receives a stream of audio data RTP packets including the non-audio data RTP packet from the RTP packet transmission / reception unit 111 (step S104), and receives the audio data RTP packet whose identification non-audio data is included in the RTP payload. It is identified as a non-voice data RTP packet. At this time, the audio signal conversion unit 132 stores in advance a data string obtained by decoding the data 0x7F included in the RTP payload portion into the logical value 0 and the data 0xFF into the logical value 1, respectively. If the identified silence data matches, the voice data RTP packet is identified as a non-voice data RTP packet (step S105).

音声信号変換部132は、非音声データRTPパケットを非音声データRTPパケット読取部122へ与える。非音声データRTPパケット読取部122は非音声データRTPパケットに含まれている端末識別情報、端末使用状況情報及びサービス対応状況情報などの端末サービス情報を読み取る(ステップS106)。   The audio signal conversion unit 132 provides the non-audio data RTP packet to the non-audio data RTP packet reading unit 122. The non-voice data RTP packet reading unit 122 reads terminal service information such as terminal identification information, terminal usage status information, and service response status information included in the non-voice data RTP packet (step S106).

上記したように本実施例による送信側のVoIP通信装置100は、G.711符号化規格において無音を表すデータ0x7F及び0xFFのデータ列からなる識別非音声データをRTPペイロードに含めて非音声データRTPパケットを生成し、これを音声データRTPパケットのストリームと共に送信する。当該非音声データRTPパケットには端末識別情報、端末使用状況情報及びサービス対応状況情報などの端末サービス情報も含められて送信される。受信側のVoIP通信装置100は、RTPペイロードに識別非音声データを含む音声データRTPパケットを非音声データRTPパケットであると識別し、当該非音声データRTPパケットに含まれている端末サービス情報を取得する。このように送信側のVoIP通信装置100は、G.711符号化規格に規定される無音データからなる識別非音声データをRTPパケットに含めて非音声データRTPパケットを生成する。受信側のVoIP通信装置100は、識別非音声データに基づいて非音声データRTPパケットを識別し、当該非音声データRTPパケットに含まれている端末識別情報、端末使用状況情報及びサービス対応状況情報などの情報を得ることができる。   As described above, the VoIP communication apparatus 100 on the transmission side according to this embodiment is a G. The non-voice data RTP packet is generated by including the identified non-voice data composed of the data strings of data 0x7F and 0xFF representing silence in the 711 coding standard in the RTP payload, and this is transmitted together with the stream of the voice data RTP packet. The non-voice data RTP packet is transmitted including terminal service information such as terminal identification information, terminal usage status information, and service response status information. The receiving-side VoIP communication apparatus 100 identifies the voice data RTP packet including the identified non-voice data in the RTP payload as the non-voice data RTP packet, and acquires the terminal service information included in the non-voice data RTP packet To do. Thus, the VoIP communication device 100 on the transmission side The non-voice data RTP packet is generated by including identification non-voice data consisting of silence data defined in the 711 coding standard in the RTP packet. The receiving-side VoIP communication apparatus 100 identifies a non-voice data RTP packet based on the identified non-voice data, and includes terminal identification information, terminal usage status information, service response status information, and the like included in the non-voice data RTP packet. Information can be obtained.

本実施例は0x7Fを論理値0に、0xFFを論理値1に、それぞれ対応させた例であるが、0x7F及び0xFFに対応させるべき値に制限は無い。また、本実施例においては図6に示されるような識別非音声データ0x7F、0xFF、0x7F、・・・、0x7F、0xFF、0x7Fとしたが、識別非音声データを構成するデータ0x7F及び0xFFの並び順には特に制限は無く、送信側及び受信側の各々のVoIP通信装置で共通の識別非音声データが設定されていれば良い。また、本実施例においては0x7F及び0xFFのデータ列全体で1つの識別用の識別非音声データを表したが、識別非音声データを構成する個々のデータに意味を持たせても良い。例えば、識別非音声データの、先頭のデータは機種を表すデータ、2番目のデータは機能1の有無を表すデータ、3番目のデータは機能2を表すデータ、・・・、などの意味を持たせる。このとき受信側のVoIP通信装置100は、識別非音声データを構成する個々のデータを読み取ることにより、機種及び機能の有無についての情報を得ることができる。   In this embodiment, 0x7F is associated with a logical value 0, and 0xFF is associated with a logical value 1, but there is no limitation on values that should be associated with 0x7F and 0xFF. In this embodiment, the identification non-speech data 0x7F, 0xFF, 0x7F,..., 0x7F, 0xFF, 0x7F as shown in FIG. There is no particular limitation on the order, and it is only necessary that identification non-voice data common to the VoIP communication apparatuses on the transmission side and the reception side is set. In this embodiment, one identification non-voice data for identification is represented by the entire data string of 0x7F and 0xFF. However, each piece of data constituting the identification non-voice data may have a meaning. For example, the identification non-speech data has the meaning that the top data is data representing the model, the second data is data representing the presence or absence of function 1, the third data is data representing function 2, and so on. Make it. At this time, the VoIP communication apparatus 100 on the receiving side can obtain information on the model and presence / absence of the function by reading individual data constituting the identification non-voice data.

本実施例によるVoIP通信装置100は図1に示される構成である。以下、実施例1と異なる部分を主として説明する。   The VoIP communication apparatus 100 according to the present embodiment has the configuration shown in FIG. Hereinafter, parts different from the first embodiment will be mainly described.

非音声データRTPパケット生成部121は、予め識別非音声データを記憶しており、当該識別非音声データを含む非音声データRTPパケットを生成する。当該識別非音声データは、例えば図6のRTPペイロードに示されるように0x7F及び0xFFのデータ列からなる0x7F、0xFF、0x7F、・・・、0x7F、0xFF、0x7Fなどのデータ列であり、受信側のVoIP通信装置100の非音声データRTPパケット抽出部113に設定されている識別非音声データと同一である。また、このとき、非音声データRTPパケット生成部121は、当該非音声データRTPパケットに端末識別情報、端末使用状況情報及びサービス対応状況情報などの端末サービス情報も含める。   The non-voice data RTP packet generation unit 121 stores identification non-voice data in advance and generates a non-voice data RTP packet including the identification non-voice data. The identification non-speech data is, for example, a data sequence such as 0x7F, 0xFF, 0x7F, ..., 0x7F, 0xFF, 0x7F composed of data sequences of 0x7F and 0xFF as shown in the RTP payload of FIG. This is the same as the identified non-voice data set in the non-voice data RTP packet extraction unit 113 of the VoIP communication apparatus 100 of the VoIP communication device 100. At this time, the non-voice data RTP packet generator 121 also includes terminal service information such as terminal identification information, terminal usage status information, and service response status information in the non-voice data RTP packet.

非音声データRTPパケット挿入部112は、SLIC部150からの音声信号をG.711符号化規格に従って変換して音声データRTPパケットを生成しつつ、識別無音データ管理部123から識別非音声データを含む非音声データRTPパケットを受け取った場合には、当該音声データRTPパケットの内の少なくとも1つを、当該非音声データRTPパケットに置き換え、当該非音声データRTPパケットを含む音声データRTPパケットのストリームをRTPパケット送受信部111に供給する。   The non-voice data RTP packet insertion unit 112 receives the voice signal from the SLIC unit 150 as a G.P. When the non-voice data RTP packet including the identified non-voice data is received from the identified silence data management unit 123 while generating the voice data RTP packet by converting according to the H.711 coding standard, At least one is replaced with the non-voice data RTP packet, and a stream of voice data RTP packets including the non-voice data RTP packet is supplied to the RTP packet transceiver 111.

非音声データRTPパケット抽出部113は、RTPパケット送受信部111から受け取った音声データRTPパケットのストリームに含まれる非音声データRTPパケットをRTPペイロードに含まれているデータに基づいて抽出する。非音声データRTPパケット抽出部113は、送信側のVoIP通信装置100の非音声データRTPパケット生成部121に設定されている識別非音声データと同一の識別非音声データを予め記憶しており、RTPペイロードに当該識別非音声データが含まれている音声データRTPパケットを非音声データRTPパケットであると識別してこれを抽出する。当該識別非音声データは例えば図6のRTPペイロードに示されるように0x7F及び0xFFのデータ列からなる0x7F、0xFF、0x7F、・・・、0x7F、0xFF、0x7Fなどのデータ列である。非音声データRTPパケット抽出部113は、当該非音声データRTPパケットを非音声データRTPパケット読取部122に与える。また、非音声データRTPパケット抽出部113は、当該抽出した非音声データRTPパケット以外の音声データRTPパケットのストリームを音声信号変換部132に供給するようにしても良い。   The non-voice data RTP packet extraction unit 113 extracts the non-voice data RTP packet included in the stream of voice data RTP packets received from the RTP packet transmission / reception unit 111 based on the data included in the RTP payload. The non-voice data RTP packet extraction unit 113 stores in advance the same identification non-voice data as the identification non-voice data set in the non-voice data RTP packet generation unit 121 of the transmission-side VoIP communication apparatus 100, and RTP The voice data RTP packet including the identified non-voice data in the payload is identified as a non-voice data RTP packet and extracted. The identification non-speech data is, for example, a data sequence such as 0x7F, 0xFF, 0x7F,..., 0x7F, 0xFF, 0x7F composed of data sequences of 0x7F and 0xFF as shown in the RTP payload of FIG. The non-voice data RTP packet extraction unit 113 provides the non-voice data RTP packet reading unit 122 with the non-voice data RTP packet. Further, the non-audio data RTP packet extraction unit 113 may supply the audio signal conversion unit 132 with a stream of audio data RTP packets other than the extracted non-audio data RTP packet.

図8は音声データRTPパケットストリームの送信側及び受信側のVoIP通信装置100の動作を表すシーケンス図である。以下、図8を参照しつつ、音声データRTPパケットストリームの送信側及び受信側のVoIP通信装置100の動作について説明する。   FIG. 8 is a sequence diagram showing the operation of the VoIP communication apparatus 100 on the transmission side and reception side of the voice data RTP packet stream. Hereinafter, the operation of the VoIP communication apparatus 100 on the transmission side and reception side of the voice data RTP packet stream will be described with reference to FIG.

送信側のVoIP通信装置100は以下のように動作する。非音声データRTPパケット生成部121は、予め識別非音声データを記憶しており、当該識別非音声データを含む非音声データRTPパケットを生成する(ステップS201)。なお、当該識別非音声データは、受信側のVoIP通信装置100の非音声データRTPパケット抽出部113に設定されている識別非音声データと同一である。また、このとき、非音声データRTPパケット生成部121は、当該非音声データRTPパケットに端末識別情報、端末使用状況情報及びサービス対応状況情報などの端末サービス情報も含める。   The transmitting-side VoIP communication apparatus 100 operates as follows. The non-voice data RTP packet generation unit 121 stores identification non-voice data in advance, and generates a non-voice data RTP packet including the identification non-voice data (step S201). The identified non-voice data is the same as the identified non-voice data set in the non-voice data RTP packet extraction unit 113 of the receiving-side VoIP communication apparatus 100. At this time, the non-voice data RTP packet generator 121 also includes terminal service information such as terminal identification information, terminal usage status information, and service response status information in the non-voice data RTP packet.

非音声データRTPパケット挿入部112は、SLIC部150からの音声信号をG.711符号化規格に従って変換して音声データRTPパケットを生成しつつ、識別無音データ管理部123から識別非音声データを含む非音声データRTPパケットを受け取った場合には、当該音声データRTPパケットの内の少なくとも1つを破棄し、当該非音声データRTPパケットを当該破棄の箇所に挿入する(ステップS202)。非音声データRTPパケット挿入部112は、当該非音声データRTPパケットを含む音声データRTPパケットのストリームをRTPパケット送受信部111に供給する。   The non-voice data RTP packet insertion unit 112 receives the voice signal from the SLIC unit 150 as a G.P. When the non-voice data RTP packet including the identified non-voice data is received from the identified silence data management unit 123 while generating the voice data RTP packet by converting according to the H.711 coding standard, At least one is discarded, and the non-voice data RTP packet is inserted at the discard location (step S202). The non-voice data RTP packet insertion unit 112 supplies a stream of voice data RTP packets including the non-voice data RTP packet to the RTP packet transmission / reception unit 111.

RTPパケット送受信部111は当該非音声データRTPパケットを含む音声データRTPパケットのストリームをWANポート140経由で通信ネットワーク200へ送信する(ステップS203)。   The RTP packet transmitting / receiving unit 111 transmits a stream of the voice data RTP packet including the non-voice data RTP packet to the communication network 200 via the WAN port 140 (step S203).

送信側のVoIP通信装置100は以下のように動作する。非音声データRTPパケット抽出部113は、RTPパケット送受信部111から音声データRTPパケットのストリームを受け取り(ステップS204)、当該ストリームに含まれる非音声データRTPパケットを、RTPペイロードに含まれているデータに基づいて抽出する(ステップS205)。非音声データRTPパケット抽出部113は、自身に予め設定されている識別非音声データと同一の識別非音声データRTPがペイロードに含まれている音声データRTPパケットを非音声データRTPパケットであると識別してこれを抽出する。非音声データRTPパケット抽出部113は、当該非音声データRTPパケットを非音声データRTPパケット読取部122に与える。このとき、非音声データRTPパケット抽出部113は、当該非音声データRTPパケットを音声信号変換部132にも供給するようにしても良い。   The transmitting-side VoIP communication apparatus 100 operates as follows. The non-voice data RTP packet extraction unit 113 receives a stream of voice data RTP packets from the RTP packet transmission / reception unit 111 (step S204), and converts the non-voice data RTP packets included in the stream into data included in the RTP payload. Based on the extraction (step S205). The non-voice data RTP packet extraction unit 113 identifies a voice data RTP packet that includes the same identified non-voice data RTP as the identified non-voice data set in the payload as a non-voice data RTP packet. And extract this. The non-voice data RTP packet extraction unit 113 provides the non-voice data RTP packet reading unit 122 with the non-voice data RTP packet. At this time, the non-voice data RTP packet extraction unit 113 may supply the non-voice data RTP packet to the voice signal conversion unit 132 as well.

非音声データRTPパケット読取部122は、非音声データRTPパケット抽出部113から供給された非音声データRTPパケットに含まれる端末識別情報、端末使用状況情報及びサービス対応状況情報などの端末サービス情報を読み取る(ステップS206)。VoIP通信装置100は、非音声データRTPパケット読取部122が読み取った端末識別情報に基づいて、送信側のVoIP通信装置の認証処理などを行うことができる。   The non-voice data RTP packet reading unit 122 reads terminal service information such as terminal identification information, terminal usage status information, and service response status information included in the non-voice data RTP packet supplied from the non-voice data RTP packet extraction unit 113. (Step S206). The VoIP communication apparatus 100 can perform authentication processing of the transmission-side VoIP communication apparatus based on the terminal identification information read by the non-voice data RTP packet reading unit 122.

音声信号変換部132は、非音声データRTPパケット抽出部113から供給された音声データRTPパケットのストリームを音声信号に変換してSLIC部150に供給する。音声信号変換部132は、PLCなどの補間機能を備えており、非音声データRTPパケット抽出部113によって抽出された非音声データRTPパケットを穴埋めするための音声データを生成し、当該抽出された箇所に挿入する。また、音声信号変換部132は、非音声データRTPパケット抽出部113から非音声データRTPパケットを受け取った場合には、当該非音声データRTPパケットを変換して得られた無音声信号をSLIC部150に供給する。このとき、アナログ電話端末300は、SLIC部150からの無音声信号に基づいて無音の音声を再生する。なお、無音となる時間は一瞬であるため、通話への影響は無い。   The audio signal converter 132 converts the audio data RTP packet stream supplied from the non-audio data RTP packet extractor 113 into an audio signal and supplies the audio signal to the SLIC unit 150. The audio signal conversion unit 132 has an interpolation function such as a PLC, generates audio data for filling the non-audio data RTP packet extracted by the non-audio data RTP packet extraction unit 113, and the extracted location Insert into. In addition, when receiving the non-voice data RTP packet from the non-voice data RTP packet extraction unit 113, the voice signal conversion unit 132 converts the non-voice signal obtained by converting the non-voice data RTP packet into the SLIC unit 150. To supply. At this time, the analog telephone terminal 300 reproduces silent sound based on the silent signal from the SLIC unit 150. Note that there is no effect on the call because the silent period is momentary.

上記したように本実施例による送信側のVoIP通信装置100は、G.711符号化規格において無音を表すデータ0x7F及び0xFFのデータ列からなる識別非音声データをRTPペイロードに含めて非音声データRTPパケットを生成する。VoIP通信装置100は、アナログ電話端末300からの音声信号をG.711符号化規格に従って変換して音声データRTPパケットを生成しつつ、当該音声データRTPパケットの内の少なくとも1つを破棄して当該非音声データRTPパケットを当該破棄の箇所に挿入し、これを音声データRTPパケットのストリームとして送信する。VoIP通信装置100は、当該非音声データRTPパケットに端末識別情報、端末使用状況情報及びサービス対応状況情報などの端末サービス情報も含めて送信する。受信側のVoIP通信装置100は、RTPペイロードに識別非音声データを含む音声データRTPパケットを非音声データRTPパケットであると識別し、当該非音声データRTPパケットに含まれている端末サービス情報を取得する。このように送信側のVoIP通信装置100は、G.711符号化規格に規定される無音データからなる識別非音声データをRTPパケットに含めて非音声データRTPパケットを生成する。受信側のVoIP通信装置100は、識別非音声データに基づいて非音声データRTPパケットを識別し、当該非音声データRTPパケットに含まれている端末識別情報、端末使用状況情報及びサービス対応状況情報などの情報を得ることができる。   As described above, the VoIP communication apparatus 100 on the transmission side according to this embodiment is a G. In the 711 encoding standard, non-voice data RTP packets are generated by including identification non-voice data consisting of data strings of data 0x7F and 0xFF representing silence in the RTP payload. The VoIP communication apparatus 100 receives a voice signal from the analog telephone terminal 300 as a G.D. While converting to generate a voice data RTP packet according to the 711 coding standard, at least one of the voice data RTP packets is discarded, and the non-voice data RTP packet is inserted into the discard location. Transmit as a stream of data RTP packets. The VoIP communication apparatus 100 transmits the non-voice data RTP packet including terminal service information such as terminal identification information, terminal usage status information, and service response status information. The receiving-side VoIP communication apparatus 100 identifies the voice data RTP packet including the identified non-voice data in the RTP payload as the non-voice data RTP packet, and acquires the terminal service information included in the non-voice data RTP packet To do. Thus, the VoIP communication device 100 on the transmission side The non-voice data RTP packet is generated by including identification non-voice data consisting of silence data defined in the 711 coding standard in the RTP packet. The receiving-side VoIP communication apparatus 100 identifies a non-voice data RTP packet based on the identified non-voice data, and includes terminal identification information, terminal usage status information, service response status information, and the like included in the non-voice data RTP packet. Information can be obtained.

VoIP通信装置を通信ネットワークと共に表すブロック図である。It is a block diagram showing a VoIP communication apparatus with a communication network. 送信時における非音声データRTPパケット挿入部でのRTPパケットのストリームの一例を表す図である。It is a figure showing an example of the stream of the RTP packet in the non audio | voice data RTP packet insertion part at the time of transmission. 送信時における非音声データRTPパケット挿入部でのRTPパケットのストリームの一例を表す図である。It is a figure showing an example of the stream of the RTP packet in the non audio | voice data RTP packet insertion part at the time of transmission. 送信時における非音声データRTPパケット挿入部でのRTPパケットのストリームの一例を表す図である。It is a figure showing an example of the stream of the RTP packet in the non audio | voice data RTP packet insertion part at the time of transmission. 受信時における非音声データRTPパケット抽出部でのRTPパケットのストリームの一例を表す図である。It is a figure showing an example of the stream of the RTP packet in the non audio | voice data RTP packet extraction part at the time of reception. 受信時における非音声データRTPパケット抽出部でのRTPパケットのストリームの一例を表す図である。It is a figure showing an example of the stream of the RTP packet in the non audio | voice data RTP packet extraction part at the time of reception. 受信時における音声信号変換部、IP電話端末及び無線IP電話端末のいずれかでの音声データのストリームの一例を表す図である。It is a figure showing an example of the stream of the audio | voice data in either the audio | voice signal conversion part at the time of reception, an IP telephone terminal, and a radio | wireless IP telephone terminal. LANポート及び無線LANポートを含むVoIP通信装置を表すブロック図である。It is a block diagram showing the VoIP communication apparatus containing a LAN port and a wireless LAN port. 実施例3におけるVoIP通信装置を通信ネットワークと共に表すブロック図である。It is a block diagram showing the VoIP communication apparatus in Example 3 with a communication network. 識別非音声データを含むRTPパケットの例を表す図である。It is a figure showing the example of the RTP packet containing identification non-voice data. 実施例3における音声データRTPパケットストリームの送信側及び受信側のVoIP通信装置の動作を表すシーケンス図である。FIG. 10 is a sequence diagram illustrating an operation of a VoIP communication device on a transmission side and a reception side of a voice data RTP packet stream in the third embodiment. 実施例4における音声データRTPパケットストリームの送信側及び受信側のVoIP通信装置の動作を表すシーケンス図である。FIG. 10 is a sequence diagram illustrating an operation of a VoIP communication device on a transmission side and a reception side of a voice data RTP packet stream in the fourth embodiment.

符号の説明Explanation of symbols

100 VoIP通信装置
110 RTP制御部
111 RTPパケット送受信部
112 非音声データRTPパケット挿入部
113 非音声データRTPパケット抽出部
120 非音声データ読取生成部
121 非音声データRTPパケット生成部
122 非音声データRTPパケット読取部
123 識別無音データ管理部
130 DSP部
131 音声データRTPパケット生成部
132 音声信号変換部
140 WANポート
150 SLIC部
160 LANポート
170 無線LANポート
200 通信ネットワーク
300 アナログ電話端末
400 IP電話端末
500 無線IP電話端末
100 VoIP communication apparatus 110 RTP control unit 111 RTP packet transmitting / receiving unit 112 non-voice data RTP packet inserting unit 113 non-voice data RTP packet extracting unit 120 non-voice data reading / generating unit 121 non-voice data RTP packet generating unit 122 non-voice data RTP packet Reading unit 123 Identification silent data management unit 130 DSP unit 131 Audio data RTP packet generation unit 132 Audio signal conversion unit 140 WAN port 150 SLIC unit 160 LAN port 170 Wireless LAN port 200 Communication network 300 Analog telephone terminal 400 IP telephone terminal 500 Wireless IP Phone terminal

Claims (6)

通信ネットワークを介して音声データRTPパケットのストリームを送受信するVoIP通信装置であって、
前記通信ネットワークへ送信すべき音声データRTPパケットのストリームを受信若しくは生成して準備する送信音声データRTPストリームパケット準備手段と、
当該準備した音声データRTPパケットのデータサイズと異なるデータサイズの非音声データRTPパケットを生成する非音声データRTPパケット生成部と、
当該準備した音声データRTPパケットの内の少なくとも1つを前記非音声データRTPパケットに置き換える非音声データRTPパケット挿入部と、
当該置き換えた非音声データRTPパケットを含む音声データRTPパケットのストリームを前記通信ネットワークに送信するRTPストリームパケット送信手段と、を含むことを特徴とするVoIP通信装置。
A VoIP communication device for transmitting and receiving a stream of voice data RTP packets via a communication network,
Transmission voice data RTP stream packet preparation means for receiving or generating and preparing a stream of voice data RTP packets to be transmitted to the communication network;
A non-voice data RTP packet generator that generates a non-voice data RTP packet having a data size different from the data size of the prepared voice data RTP packet;
A non-voice data RTP packet insertion unit that replaces at least one of the prepared voice data RTP packets with the non-voice data RTP packet;
VoIP communication apparatus comprising: RTP stream packet transmission means for transmitting a stream of voice data RTP packets including the replaced non-voice data RTP packet to the communication network.
通信ネットワークを介して音声データRTPパケットのストリームを送受信するVoIP通信装置であって、
前記通信ネットワークから受信した音声データRTPパケットのストリームに含まれる非音声データRTPパケットを当該非音声データRTPパケットのデータサイズに基づいて抽出する非音声データRTPパケット抽出部と、
当該抽出した非音声データRTPパケットに含まれる情報を読み取る非音声データRTPパケット読取部と、を含むことを特徴とするVoIP通信装置。
A VoIP communication device for transmitting and receiving a stream of voice data RTP packets via a communication network,
A non-voice data RTP packet extraction unit that extracts a non-voice data RTP packet included in a stream of voice data RTP packets received from the communication network based on a data size of the non-voice data RTP packet;
A VoIP communication apparatus comprising: a non-voice data RTP packet reading unit that reads information included in the extracted non-voice data RTP packet.
前記非音声データRTPパケットは、端末識別情報、端末使用状況情報及びサービス対応状況情報の内の少なくとも1つを含むことを特徴とする請求項1又は2に記載のVoIP通信装置。   The VoIP communication apparatus according to claim 1, wherein the non-voice data RTP packet includes at least one of terminal identification information, terminal usage status information, and service support status information. 前記非音声データRTPパケット生成部は、前記非音声データRTPパケットの生成に代えて識別非音声データを含めて生成したRTPパケットを前記非音声データRTPパケットとすることを特徴とする請求項1に記載のVoIP通信装置。   2. The non-voice data RTP packet generation unit uses the RTP packet generated including identification non-voice data instead of the generation of the non-voice data RTP packet as the non-voice data RTP packet. VoIP communication apparatus of description. 前記非音声データRTPパケット抽出部は、前記非音声データRTPパケットの抽出に代えて前記非音声データRTPパケットを当該非音声データRTPパケットに含まれている識別非音声データに基づいて抽出することを特徴とする請求項2に記載のVoIP通信装置。   The non-voice data RTP packet extraction unit extracts the non-voice data RTP packet based on the identified non-voice data included in the non-voice data RTP packet instead of extracting the non-voice data RTP packet. The VoIP communication apparatus according to claim 2, wherein the VoIP communication apparatus is characterized. 前記識別非音声データは、G.711符号化規格における無音データからなることを特徴とする請求項4又は5に記載のVoIP通信装置。   The identification non-speech data is G. The VoIP communication apparatus according to claim 4 or 5, wherein the VoIP communication apparatus comprises silence data in accordance with the H.711 coding standard.
JP2008034717A 2007-04-11 2008-02-15 VoIP communication device Active JP5211736B2 (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2008034717A JP5211736B2 (en) 2007-04-11 2008-02-15 VoIP communication device

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
JP2007103852 2007-04-11
JP2007103852 2007-04-11
JP2008034717A JP5211736B2 (en) 2007-04-11 2008-02-15 VoIP communication device

Publications (2)

Publication Number Publication Date
JP2008283667A true JP2008283667A (en) 2008-11-20
JP5211736B2 JP5211736B2 (en) 2013-06-12

Family

ID=40144071

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2008034717A Active JP5211736B2 (en) 2007-04-11 2008-02-15 VoIP communication device

Country Status (1)

Country Link
JP (1) JP5211736B2 (en)

Cited By (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2011188390A (en) * 2010-03-10 2011-09-22 Nakayo Telecommun Inc Communication system, communication terminal and non-stream data communication method
JP2012049617A (en) * 2010-08-24 2012-03-08 Oki Electric Ind Co Ltd Voice rtp communication transmission/reception method, and transmission/reception device
JP2012160832A (en) * 2011-01-31 2012-08-23 Oki Electric Ind Co Ltd Voice packet communication system
JP2013118578A (en) * 2011-12-05 2013-06-13 Oki Electric Ind Co Ltd Voice communication device and program
JP2015170990A (en) * 2014-03-07 2015-09-28 富士通テレコムネットワークス株式会社 Communication device and ip telephone system
JP2016165096A (en) * 2015-02-27 2016-09-08 沖電気工業株式会社 Radio communication device, communication terminal, communication system and program

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS6416043A (en) * 1987-07-09 1989-01-19 Nec Corp Packet communication system
JP2002351482A (en) * 2001-05-23 2002-12-06 Nec Eng Ltd Method and device for embedding signal
JP2003244238A (en) * 2002-02-15 2003-08-29 Kddi Corp Traffic monitoring device and method, and computer program
JP2006180515A (en) * 2004-12-23 2006-07-06 Lucent Technol Inc Method for identifying data and/or control packets in radio communication

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS6416043A (en) * 1987-07-09 1989-01-19 Nec Corp Packet communication system
JP2002351482A (en) * 2001-05-23 2002-12-06 Nec Eng Ltd Method and device for embedding signal
JP2003244238A (en) * 2002-02-15 2003-08-29 Kddi Corp Traffic monitoring device and method, and computer program
JP2006180515A (en) * 2004-12-23 2006-07-06 Lucent Technol Inc Method for identifying data and/or control packets in radio communication

Cited By (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2011188390A (en) * 2010-03-10 2011-09-22 Nakayo Telecommun Inc Communication system, communication terminal and non-stream data communication method
JP2012049617A (en) * 2010-08-24 2012-03-08 Oki Electric Ind Co Ltd Voice rtp communication transmission/reception method, and transmission/reception device
JP2012160832A (en) * 2011-01-31 2012-08-23 Oki Electric Ind Co Ltd Voice packet communication system
JP2013118578A (en) * 2011-12-05 2013-06-13 Oki Electric Ind Co Ltd Voice communication device and program
JP2015170990A (en) * 2014-03-07 2015-09-28 富士通テレコムネットワークス株式会社 Communication device and ip telephone system
JP2016165096A (en) * 2015-02-27 2016-09-08 沖電気工業株式会社 Radio communication device, communication terminal, communication system and program

Also Published As

Publication number Publication date
JP5211736B2 (en) 2013-06-12

Similar Documents

Publication Publication Date Title
US7885187B2 (en) System and method for providing unified messaging system service using voice over internet protocol
US7483400B2 (en) Managing a packet switched conference call
JP4870103B2 (en) Transmission of digital messages scattered throughout the compressed information signal
JP5211736B2 (en) VoIP communication device
US20060007916A1 (en) Method and apparatus for interleaving text and media in a real-time transport session
TWI442742B (en) Performance enhancement protocol, systems, methods and devices
KR20010084869A (en) Internet based telephone apparatus
TW524009B (en) VoIP gateway device and digital one-link tandem exchange method
JP4803538B2 (en) Terminal for call, method for establishing secret call, and program for establishing secret call
JP2013017233A (en) Signal watermarking in presence of encryption
JP4492516B2 (en) Voice IP packet switching device
US8331356B2 (en) Method, apparatus and system for transmitting a global text telephone signal
EP2359562B1 (en) Digital telecommunications system, program product for, and method of managing such a system
JP4836705B2 (en) IP telephone multi-party call system
JP2007228081A (en) Wireless communication apparatus, wireless communication method, and wireless access apparatus
KR101212628B1 (en) Method and receiving unit for synchronizing a packet-oriented reception with a calculated tone signal
JP4350273B2 (en) Telephone system, terminal adapter device, and telephone
JP5562765B2 (en) Voice RTP communication transmission / reception method and transmission / reception apparatus
JP2009200791A (en) Communication device, and speech communication log preserving apparatus
JP5459378B2 (en) Call log storage device and layer 3 network transfer device
JP4607028B2 (en) Telephone system
WO2011143954A2 (en) Data processing method, communication system and data processing gateway
JP2008092182A (en) Network connection apparatus
Lebl et al. Analysis of different methods for caller identification sending over internet
TW200818853A (en) Computer-related devices and techniques for facilitating an emergency call

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20100917

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20120327

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20120522

A521 Written amendment

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20120720

A02 Decision of refusal

Free format text: JAPANESE INTERMEDIATE CODE: A02

Effective date: 20120828

A521 Written amendment

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20121126

A911 Transfer to examiner for re-examination before appeal (zenchi)

Free format text: JAPANESE INTERMEDIATE CODE: A911

Effective date: 20121204

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20130129

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20130211

R150 Certificate of patent or registration of utility model

Ref document number: 5211736

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

Free format text: JAPANESE INTERMEDIATE CODE: R150

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20160308

Year of fee payment: 3