JP2004040200A - Voice communication apparatus and speech supporting method therefor - Google Patents

Voice communication apparatus and speech supporting method therefor Download PDF

Info

Publication number
JP2004040200A
JP2004040200A JP2002190751A JP2002190751A JP2004040200A JP 2004040200 A JP2004040200 A JP 2004040200A JP 2002190751 A JP2002190751 A JP 2002190751A JP 2002190751 A JP2002190751 A JP 2002190751A JP 2004040200 A JP2004040200 A JP 2004040200A
Authority
JP
Japan
Prior art keywords
voice
delay
voice communication
communication device
time
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Withdrawn
Application number
JP2002190751A
Other languages
Japanese (ja)
Inventor
Yasuhiko Numagami
沼上 泰彦
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Kyocera Corp
Original Assignee
Kyocera Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Kyocera Corp filed Critical Kyocera Corp
Priority to JP2002190751A priority Critical patent/JP2004040200A/en
Publication of JP2004040200A publication Critical patent/JP2004040200A/en
Withdrawn legal-status Critical Current

Links

Images

Landscapes

  • Data Exchanges In Wide-Area Networks (AREA)
  • Telephone Function (AREA)

Abstract

<P>PROBLEM TO BE SOLVED: To provide a voice communication apparatus capable of assisting a talker to recognize a voice delay so as to attain a smooth conversation in a voice speech employing packet communication. <P>SOLUTION: The voice communication apparatus is provided with a signal generating section 20 that detects and records a transmission voice, and outputs the recorded voice after the transmission voice to reproduce it as a received voice; and a delay measurement section 19 for measuring a round tip time between the apparatus and a communication terminal of a speech opposite party. The signal generating section 20 changes a duration time of reproduction of the recorded voice based on a measurement result of the round trip time. <P>COPYRIGHT: (C)2004,JPO

Description

【0001】
【発明の属する技術分野】
本発明は、VoIP(Voice over Internet Protocol)技術を用いたインターネット電話等に用いて好適な音声通信装置、及びその通話支援方法に関する。
【0002】
【従来の技術】
近年、VoIP技術を用いたインターネット電話(以下、IP電話と称する)が、通話料金の安さなどの理由から普及してきている。このIP電話は、音声をパケット化してインターネット等のインターネットプロトコル(IP;InternetProtocol)網を介して転送することにより実現される。そして、その音声パケット化機能を有する音声通信装置が実用化されている。
【0003】
【発明が解決しようとする課題】
しかし、IP電話ではIPパケットによりインターネットを介して音声情報を伝送するために、従来の有線電話に比べ音声パケット化時間やパケット伝送時間等により音声の遅延時間が大きくなる。この結果、通話中の相手からの返答の戻りに時間がかかり、話者間で会話が不自然になるという問題がある。特に、インターネット上のルーティング経路等によって遅延時間は変動し、1秒に達するような場合もある。このように大きな遅延があると、自分が話し終えた後、相手が黙っているのか、あるいは返答が戻ってくるのが遅延しているのかが判らず、対応に窮してしまう。このため、相手が返事しているにもかかわらず、返答を催促してしまうなどの不都合が生じ、スムーズな会話を行うことが難しい。
【0004】
本発明は、このような事情を考慮してなされたもので、その目的は、パケット通信による音声通話において、話者に音声の遅延を認識させてスムーズな会話が行われるよう手助けをすることができる音声通信装置、及びその通話支援方法を提供することにある。
【0005】
【課題を解決するための手段】
上記の課題を解決するために、請求項1に記載の音声通信装置は、IPパケットにより音声通話を行う音声通信装置において、送話音声の終了を検出する検出手段と、該検出手段が送話音声の終了を検出後、所定時間報知を行う報知手段と、を備えたことを特徴とする。
【0006】
請求項2に記載の音声通信装置においては、通話相手との間の遅延時間を測定する遅延測定手段を備え、前記遅延時間の測定結果に基づいて前記所定時間を設定することを特徴とする。
【0007】
請求項3に記載の音声通信装置においては、前記所定時間は前記測定された遅延時間を超えないよう設定することを特徴とする。
【0008】
請求項4に記載の音声通信装置においては、送話音声を記録する記録手段を備え、前記記録手段に記録された送話音声により前記報知を行うことを特徴とする。
【0009】
請求項5に記載の音声通信装置においては、前記記録された送話音声により報知を行う際は、通話相手からの音声の音量より小さく報知することを特徴とする。
【0010】
請求項6に記載の音声通信装置においては、前記記録された送話音声により報知を行う際は、該記録された送話音声を繰返し前記所定時間報知することを特徴とする。
【0011】
上記の課題を解決するために、請求項7に記載の通話支援方法は、IPパケットによる音声通話において、送話音声の終了を検出し、送話音声の終了を検出した後所定時間報知を行うことを特徴とする。
【0012】
【発明の実施の形態】
以下、図面を参照し、本発明の一実施形態について説明する。
図1は、本発明の一実施形態による音声通信装置を備えたIP電話端末により、IP電話を実現するシステムの構成例を示すブロック図である。この図1において、IP電話端末1a(1b)はIP電話用の通信端末であり、ローカルエリアネットワーク(LAN)3a(3b)に接続している。ルータ2a(2b)は、通信回線を介してインターネット4と接続し、LAN3a(3b)とインターネット4との間で相互にパケットの転送を行う。これにより、IP電話端末1aと1bは、インターネット4を介してパケット通信を行い、音声情報を相互に送受することができ、IP電話が実現される。
【0013】
図2にIP電話端末1a(1b)の構成例を示す。図2において、IP電話端末1a(1b)は、本発明の一実施形態による音声通信装置10と、話者が通話に使用するマイク31およびスピーカ32とから構成される。
【0014】
音声通信装置10において、A−D変換部11は、マイク31から入力されたアナログ音声信号をデジタル信号に変換して出力する。音声符号化部12は、A−D変換部11から入力されたデジタル音声信号を符号化して出力する。RTPパケット送信処理部13は、音声符号化部12から入力された音声符号化信号をRTP(Real−time Transport Protocol)に従いパケット化して出力する。
【0015】
UDP/IP処理部14は、UDP(User Datagram Protocol)及びIPに従ってパケットの送信及び受信の処理を行う。ネットワークインタフェース15は、LAN3a(3b)に接続するためのインタフェースであり、LAN3a(3b)と接続してパケットを入出力する。RTPパケット送信処理部13から出力されたRTPパケットは、UDP/IP処理部14によりIPパケットとしてネットワークインタフェース15に出力され、LAN3a(3b)へ出力される。
【0016】
LAN3a(3b)から入力されたIPパケットは、ネットワークインタフェース15を介してUDP/IP処理部14に入力される。UDP/IP処理部14は、入力されたIPパケットをUDP処理により分解してRTPパケット受信処理部16へ出力する。RTPパケット受信処理部16は、入力されたRTPパケットをRTPに従い分解して音声符号化信号を取得し、音声復号部17へ出力する。音声復号部17は、入力された音声符号化信号を復号してデジタル音声信号をD−A変換部18へ出力する。D−A変換部18は、入力されたデジタル音声信号をアナログ信号に変換して出力する。この出力されたアナログ音声信号はスピーカ32に入力され、音声に再生される。
音声符号化部12及び音声復号部17は、ITU−T(国際電気通信連合)勧告の「G.729」で規定されている音声符号化方式を使用する。
【0017】
上記図2の各部11〜18からなる構成は、IP電話端末で使用されている従来の音声通信装置の構成と同様である。本実施形態の音声通信装置10においては、従来の構成に加えて、話者の通話を支援する機能を実現するための構成をさらに備える。具体的には、図2の遅延測定部19と信号発生部20を備える。以下、遅延測定部19と信号発生部20について詳細に説明する。
【0018】
初めに、遅延測定部19について説明する。遅延測定部19は、通話相手のIP電話端末との間で、パケットが往復に要する時間(ラウンドトリップタイム)を測定する機能を有する。この測定には、ICMP(Internet Control MessageProtocol)で規定されているパケット(Echo要求パケット及びEcho要求返答パケット)を利用する。ICMPは、IP上で動作するプロトコルとして一般的に知られており、ネットワークの疎通を確認するために広く利用されている。遅延測定部19はこのICMPの機能のうち、少なくともEcho要求及びEcho要求返答機能を有する。
【0019】
次に、遅延測定部19の動作を説明する。遅延測定部19は、Echo要求パケットを、UDP/IP処理部14により通話相手のIP電話端末宛てに送信し、タイマーをスタートさせる。このEcho要求パケットは、インターネット4を介して通信相手のIP電話端末に転送される。
【0020】
Echo要求パケットを受信したIP電話端末では、音声通信装置10のUDP/IP処理部14が該Echo要求パケットを受信し、Echo要求返答パケットを返信する。このEcho要求返答パケットは、インターネット4を介しEcho要求パケット送信元のIP電話端末へ転送される。
【0021】
Echo要求パケット送信元のIP電話端末では、音声通信装置10の遅延測定部19が、UDP/IP処理部14を介してEcho要求返答パケットを受信すると、タイマーを停止してタイマー値を読み出す。そして、このタイマー値をメモリ(図示せず)に保存する。
【0022】
一般にパケットの往復に要する時間は一時的に大きく変動することが多いため、遅延測定部19は、上記ICMPパケット(Echo要求パケット及びEcho要求返答パケット)による測定を複数回実行し、これら測定結果のタイマー値が示す時間の移動平均値をラウンドトリップタイムの測定値とする。
【0023】
遅延測定部19は、上記ラウンドトリップタイムの測定を通話開始直前に実行してラウンドトリップタイムを信号発生部20に設定する。さらに、通話中に定期的に(例えば1秒おきに)実行し、信号発生部20に設定したラウンドトリップタイムを更新する。これにより、通話中のラウンドトリップタイムの変動に対応する。
【0024】
次に、信号発生部20について説明する。信号発生部20は、A−D変換部11から送話側のデジタル音声信号を入力し、このデジタル音声信号の中から話者の送話音声部分を検出し記録する機能と、送話の終了を検出する機能と、送話終了時点から「ラウンドトリップタイム*α」の期間だけ、記録したデジタル音声信号をD−A変換部18へ繰返し出力し再生させる機能と、を有する。上記αは繰返し再生される音声と、通話相手が返答した音声が衝突しないようにする安全係数であり、例えば0.9である。
【0025】
次に、図3を参照して信号発生部20の動作を説明する。図3は信号発生部20が行う処理の流れを示すフローチャートである。信号発生部20は、通話開始により図3の処理を開始する。図3において、信号発生部20は、A−D変換部11から入力されたデジタル音声信号を監視し、デジタル音声信号のレベルが第1の閾値以上の部分を送話音声部分として検出し、送話が終了するまでメモリに記録し続ける(ステップS1、S2)。この記録は第1の所定時間分(例えば1秒分)を順次上書きすることにより行う。これにより、送話音声部分が長時間連続した場合でも該送話音声部分の最後の第1の所定時間分(例えば1秒分)を記録するためメモリ量は一定でよく、メモリ量を節約できる。
【0026】
次いで、信号発生部20は、デジタル音声信号のレベルが第2の所定時間(例えば0.5秒)以上の間連続して第2の閾値以下となった場合に、この区間を無音区間と判定し、これにより送話終了と判断して送話音声の記録を停止する(ステップS3)。これにより、送話音声の最後の部分が略第1の所定時間分記録として残ることになる。
【0027】
次いで、再生時間の計測を開始すると共に、信号発生部20は、記録したデジタル音声信号をD−A変換部18へ出力し、受話音声としてスピーカ32により再生させる。これを再生時間が「ラウンドトリップタイム*α」となるまで繰り返す(ステップS4、S5)。ここで、D−A変換部18へは、記録したデジタル音声信号のうち、最初から第3の所定時間(例えば記録時間の半分の時間)分の有音部の音量レベルを三分の一に減衰させたものを出力する。これにより、再生された音声は、こだまのように、送話音声の最後の部分が繰り返すものとなる。
【0028】
次いで、再生時間が「ラウンドトリップタイム*α」となると、信号発生部20は再生を停止し、通話継続時にはステップS1へ戻り、終話時には処理を終了する(ステップS6、S7)。
【0029】
なお、信号発生部20は、記録音声の再生中においてもA−D変換部11から入力されたデジタル音声信号を監視し、送話音声部分検出時には再生を停止してステップS1へ処理を移行する(図3には図示せず)。
【0030】
図4に上述した実施形態による通話支援の例を示す。図4の例は、図1のIP電話システムにおいて、話者AがIP電話端末1aを、話者BがIP電話端末1bを使用し、通話する場合の一例である。図4において、話者Aが「もしもし」と言うと、この送話音声V1は遅延時間t1後に話者Bに聞こえる。また、話者Bが「はい」と言うと、この送話音声V2は遅延時間t2後に話者Aに聞こえる。これら遅延時間t1とt2の合計がラウンドトリップタイムに相当する。
【0031】
図4に示すように、本実施形態によれば、話者Aが、送話音声V1「もしもし」と言った後、話者Bから返答が帰ってくるまでの待ち時間の間、話者Aには自分の声がこだましたやまびこのように、「もしもしもし…」という記録再生音声E1が聞こえる。同様に、送話音声V3の後に、記録再生音声E3が聞こえる。これにより、話者Aは、通話音声に遅延があることを認識することができ、通話相手(話者B)との会話をスムーズに行うことが可能となる。
【0032】
また、話者Bにおいても、送話音声V2「はい」の後に「はいはいはい…」という記録再生音声E2が、同様に送話音声V4の後に記録再生音声E4が聞こえるので、通話音声に遅延があることを認識し、会話をスムーズに行える。
【0033】
なお、上記信号発生部20の記録音声再生機能は、話者の選択により無効にできるようにすることが好ましい。
【0034】
また、記録音声の再生の際に、音量レベルを通話相手の受話音声より小さくするようにしてもよい。このようにすれば、遅延報知中に通話相手の音声再生が始まり報知音声と重なったとしても、報知音声の方が音量が小さいので、報知音声が会話の邪魔にならず、好ましい。
【0035】
なお、上述した実施形態においては、話者に対して音声遅延を認識させるために、話者自身の送話音声を用いて遅延を報知するようにしたが、予め記録しておいたメッセージや楽曲、背景雑音などの音声信号を用いるようにしてもよい。
【0036】
また、記録音声を受話音声として再生するのではなく、受話再生用とは別のスピーカにより記録音声を再生するようにしてもよい。
【0037】
なお、遅延報知の仕方は音声出力に限定されない。例えば、ランプの点灯により遅延を報知するようにしてもよい。あるいは赤ランプ点灯で遅延を報知し、青ランプ点灯で遅延時間満了を報知するようにしてもよい。また、液晶表示装置により、「お待ちください」等のメッセージを表示して遅延を報知するようにしてもよい。
【0038】
なお、上述した実施形態においては、ラウンドトリップタイムに応じて遅延報知の持続時間を変えるようにしたが、送話終了後、ラウンドトリップタイムとは無関係に遅延を報知するようにしてもよい。例えば、一回だけ記録音声を再生するようにしてもよい。但し、話者にどのくらいの遅延時間があるのかを認識させて、よりスムーズな会話ができるようにするために、ラウンドトリップタイムに応じて遅延報知の持続時間を変えるのが好ましい。
【0039】
なお、本実施形態は、遅延の大きい衛星回線を利用した音声通信にも同様に適用可能である。例えば、中継回線に衛星回線を利用した衛星電話や、TVの衛星中継時の音声通信などにも同様に適用することができる。また、TV会議システムの音声通信にも適用可能である。
【0040】
なお、衛星回線利用の場合には、ICMPパケットのかわりに、遅延測定データを表すフレームを挿入することで遅延測定を行うことができる。また、利用する回線が固定されており、該回線の遅延時間が一定である場合は、事前に固定のラウンドトリップタイムを電話機に設定しておくことで、遅延測定を省略することも可能である。
なお、本実施例においては、ラウンドトリップタイムの測定、送話終了の判断、及び送話音声の記録・再生などをIP電話用の通話端末が行うよう記載しているが、ネットワーク上のノードがこれら処理のうち1つ又は複数の処理を行うことも可能である。
【0041】
以上、本発明の実施形態を図面を参照して詳述してきたが、具体的な構成はこの実施形態に限られるものではなく、本発明の要旨を逸脱しない範囲の設計変更等も含まれる。
【0042】
【発明の効果】
以上説明したように、本発明によれば、送話後の所定の報知により話者に対して音声の遅延を認識させることができる。これにより、話者は遅延を認識して会話をスムーズに行うことが可能となるので、スムーズな会話が行われるよう手助けをするという目的が達せられる。
【0043】
また、請求項2に記載の発明によれば、遅延時間に応じて遅延報知の持続時間を変化させることにより、話者にどのくらいの遅延時間があるのかを認識させることが可能となるので、よりスムーズな会話ができるようになるという効果が得られる。
【0044】
また、請求項3に記載の発明によれば、冗長な報知を防止することができる。また、請求項4に記載の発明によれば、通話中の話者自身の音声により報知することができる。
【0045】
また、請求項5に記載の発明によれば、遅延報知中に通話相手の音声再生が始まり報知音声と重なったとしても、報知音声の方が音量が小さいので、報知音声が会話の邪魔にならないという効果が得られる。
【0046】
また、請求項6に記載の発明によれば、話者に自分の声のやまびこを聞いているように感じさせることができ、音声遅延の認識が自然に行われるという効果が得られる。
【図面の簡単な説明】
【図1】本発明の一実施形態による音声通信装置を備えたIP電話端末1a,1bにより、IP電話を実現するシステムの構成例を示すブロック図である。
【図2】同実施形態による音声通信装置10の構成を示すブロック図である。
【図3】図2に示す信号発生部20が行う処理の流れを示すフローチャートである。
【図4】図2に示す音声通信装置10による通話支援の一例を説明するための図である。
【符号の説明】
1a,1b…IP電話端末、2a,2b…ルータ、3a,3b…LAN、4…インターネット、10…音声通信装置、11…A−D変換部、12…音声符号化部、13…RTPパケット送信処理部、14…UDP/IP処理部、15…ネットワークインタフェース、16…RTPパケット受信処理部、17…音声復号部、18…D−A変換部、19…遅延測定部、20…信号発生部、31…マイク、32…スピーカ
[0001]
TECHNICAL FIELD OF THE INVENTION
The present invention relates to a voice communication device suitable for use in an Internet telephone or the like using VoIP (Voice over Internet Protocol) technology, and a call support method therefor.
[0002]
[Prior art]
2. Description of the Related Art In recent years, Internet phones using VoIP technology (hereinafter, referred to as IP phones) have become widespread for reasons such as low call charges. The IP telephone is realized by packetizing voice and transferring the voice via an Internet Protocol (IP) network such as the Internet. A voice communication device having the voice packetizing function has been put to practical use.
[0003]
[Problems to be solved by the invention]
However, in the IP telephone, since voice information is transmitted via the Internet by IP packets, a voice delay time becomes longer due to a voice packetization time, a packet transmission time, and the like as compared with a conventional wired telephone. As a result, there is a problem that it takes time to return a reply from the other party during the call, and the conversation between the speakers becomes unnatural. In particular, the delay time fluctuates due to a routing path on the Internet or the like, and may reach one second. With such a large delay, after you have finished speaking, you do not know if the other party is silent or if it is delayed to return the answer, and you will be struggling with the response. For this reason, inconveniences such as prompting for a reply occur even though the other party answers, and it is difficult to have a smooth conversation.
[0004]
The present invention has been made in view of such circumstances, and an object of the present invention is to enable a speaker to recognize a delay in a voice in a voice communication by packet communication and to assist a smooth conversation. It is an object of the present invention to provide a voice communication device capable of performing the above and a call support method therefor.
[0005]
[Means for Solving the Problems]
In order to solve the above-mentioned problem, a voice communication device according to claim 1 is a voice communication device that performs a voice call using an IP packet. And a notifying means for notifying for a predetermined time after detecting the end of the voice.
[0006]
According to a second aspect of the present invention, there is provided the voice communication device, further comprising: delay measuring means for measuring a delay time between the caller and the other party, wherein the predetermined time is set based on a result of the measurement of the delay time.
[0007]
In the voice communication device according to the third aspect, the predetermined time is set so as not to exceed the measured delay time.
[0008]
According to a fourth aspect of the present invention, there is provided the voice communication device, further comprising a recording unit for recording the transmitted voice, wherein the notification is performed by the transmitted voice recorded in the recording unit.
[0009]
In the voice communication device according to the fifth aspect, when the notification is performed by the recorded transmission voice, the notification is performed at a volume lower than the volume of the voice from the communication partner.
[0010]
In the voice communication apparatus according to the sixth aspect, when the notification is performed by the recorded transmission voice, the recorded transmission voice is repeatedly notified for the predetermined time.
[0011]
In order to solve the above-mentioned problem, a call support method according to claim 7 detects end of a transmitted voice in a voice call using an IP packet, and notifies a predetermined time after detecting the end of the transmitted voice. It is characterized by the following.
[0012]
BEST MODE FOR CARRYING OUT THE INVENTION
Hereinafter, an embodiment of the present invention will be described with reference to the drawings.
FIG. 1 is a block diagram showing a configuration example of a system for realizing an IP telephone using an IP telephone terminal having a voice communication device according to an embodiment of the present invention. In FIG. 1, an IP telephone terminal 1a (1b) is a communication terminal for an IP telephone, and is connected to a local area network (LAN) 3a (3b). The router 2a (2b) is connected to the Internet 4 via a communication line, and mutually transfers packets between the LAN 3a (3b) and the Internet 4. As a result, the IP telephone terminals 1a and 1b can perform packet communication via the Internet 4 to transmit and receive voice information to and from each other, thereby realizing an IP telephone.
[0013]
FIG. 2 shows a configuration example of the IP telephone terminal 1a (1b). In FIG. 2, an IP telephone terminal 1a (1b) includes a voice communication device 10 according to an embodiment of the present invention, and a microphone 31 and a speaker 32 used by a speaker for talking.
[0014]
In the audio communication device 10, the A / D converter 11 converts an analog audio signal input from the microphone 31 into a digital signal and outputs the digital signal. The audio encoding unit 12 encodes and outputs the digital audio signal input from the A / D conversion unit 11. The RTP packet transmission processing unit 13 packetizes the coded speech signal input from the speech encoding unit 12 according to RTP (Real-time Transport Protocol) and outputs the packet.
[0015]
The UDP / IP processing unit 14 performs packet transmission and reception processing in accordance with UDP (User Datagram Protocol) and IP. The network interface 15 is an interface for connecting to the LAN 3a (3b), and inputs and outputs packets by connecting to the LAN 3a (3b). The RTP packet output from the RTP packet transmission processing unit 13 is output to the network interface 15 as an IP packet by the UDP / IP processing unit 14, and is output to the LAN 3a (3b).
[0016]
The IP packet input from the LAN 3a (3b) is input to the UDP / IP processing unit 14 via the network interface 15. The UDP / IP processing unit 14 decomposes the input IP packet by UDP processing and outputs the packet to the RTP packet reception processing unit 16. The RTP packet reception processing unit 16 decomposes the input RTP packet according to the RTP to obtain a speech coded signal, and outputs it to the speech decoding unit 17. The audio decoding unit 17 decodes the input encoded audio signal and outputs a digital audio signal to the DA conversion unit 18. The DA converter 18 converts the input digital audio signal into an analog signal and outputs the analog signal. The output analog audio signal is input to the speaker 32 and is reproduced as audio.
The audio encoding unit 12 and the audio decoding unit 17 use an audio encoding method defined in "G.729" recommended by ITU-T (International Telecommunication Union).
[0017]
The configuration of each unit 11 to 18 in FIG. 2 is the same as the configuration of the conventional voice communication device used in the IP telephone terminal. The voice communication device 10 according to the present embodiment further includes a configuration for realizing a function of supporting a call by a speaker, in addition to the conventional configuration. Specifically, it includes the delay measuring section 19 and the signal generating section 20 shown in FIG. Hereinafter, the delay measuring section 19 and the signal generating section 20 will be described in detail.
[0018]
First, the delay measuring unit 19 will be described. The delay measuring unit 19 has a function of measuring a time required for a packet to go round-trip (round-trip time) with an IP telephone terminal of a communication partner. For this measurement, a packet (an Echo request packet and an Echo request reply packet) specified by an ICMP (Internet Control Message Protocol) is used. ICMP is generally known as a protocol operating on IP, and is widely used for confirming network communication. The delay measuring unit 19 has at least an Echo request and an Echo request reply function among the ICMP functions.
[0019]
Next, the operation of the delay measuring unit 19 will be described. The delay measuring unit 19 transmits the Echo request packet to the destination IP telephone terminal by the UDP / IP processing unit 14 and starts the timer. This Echo request packet is transferred to the communication partner IP telephone terminal via the Internet 4.
[0020]
In the IP telephone terminal that has received the Echo request packet, the UDP / IP processing unit 14 of the voice communication device 10 receives the Echo request packet and returns an Echo request reply packet. This Echo request reply packet is transferred via the Internet 4 to the IP telephone terminal that has transmitted the Echo request packet.
[0021]
When the delay measuring unit 19 of the voice communication device 10 receives the Echo request reply packet via the UDP / IP processing unit 14 at the IP telephone terminal that has transmitted the Echo request packet, the timer stops and reads the timer value. Then, the timer value is stored in a memory (not shown).
[0022]
In general, the time required for packet round trip often fluctuates greatly temporarily. Therefore, the delay measurement unit 19 executes the measurement using the ICMP packet (Echo request packet and Echo request reply packet) a plurality of times, and obtains the measurement result. The moving average value of the time indicated by the timer value is used as the measured value of the round trip time.
[0023]
The delay measuring unit 19 sets the round trip time in the signal generating unit 20 by executing the round trip time measurement immediately before the start of a call. Further, it is executed periodically (for example, every one second) during a call, and the round trip time set in the signal generator 20 is updated. This responds to a change in round trip time during a call.
[0024]
Next, the signal generator 20 will be described. The signal generating unit 20 receives the digital voice signal on the transmitting side from the A / D converting unit 11, detects and records the voice transmitting portion of the speaker from the digital voice signal, and terminates the transmitting. And a function of repeatedly outputting the recorded digital audio signal to the DA converter 18 and reproducing the digital audio signal only for a period of “round trip time * α” from the end of the transmission. The above α is a safety coefficient for preventing the repeatedly reproduced voice from colliding with the voice replied by the other party, for example, 0.9.
[0025]
Next, the operation of the signal generator 20 will be described with reference to FIG. FIG. 3 is a flowchart showing the flow of the process performed by the signal generator 20. The signal generation unit 20 starts the processing in FIG. In FIG. 3, the signal generator 20 monitors the digital audio signal input from the A / D converter 11, detects a portion where the level of the digital audio signal is equal to or higher than the first threshold as a transmission audio portion, and transmits the signal. The recording is continued in the memory until the talk ends (steps S1 and S2). This recording is performed by sequentially overwriting a first predetermined time (for example, one second). Thus, even when the transmitted voice portion continues for a long time, the last predetermined time (for example, one second) of the transmitted voice portion is recorded, so that the memory amount can be constant, and the memory amount can be saved. .
[0026]
Next, when the level of the digital audio signal continuously falls below the second threshold for a second predetermined time (for example, 0.5 seconds) or more, the signal generation unit 20 determines that the section is a silent section. Then, it is determined that the transmission has ended, and the recording of the transmission voice is stopped (step S3). As a result, the last part of the transmitted voice remains as a record for approximately the first predetermined time.
[0027]
Next, while measuring the reproduction time, the signal generation unit 20 outputs the recorded digital audio signal to the DA conversion unit 18, and reproduces the received digital audio signal through the speaker 32. This is repeated until the reproduction time becomes “round trip time * α” (steps S4 and S5). Here, the volume level of the sound part for the third predetermined time (for example, half the recording time) from the beginning of the recorded digital audio signal is reduced to one third by the DA converter 18. Output the attenuated one. As a result, in the reproduced sound, the last part of the transmitted sound is repeated like an echo.
[0028]
Next, when the playback time reaches “round trip time * α”, the signal generation unit 20 stops the playback, returns to step S1 when the call is continued, and ends the process when the call ends (steps S6 and S7).
[0029]
The signal generation unit 20 monitors the digital audio signal input from the A / D conversion unit 11 even during the reproduction of the recorded audio, stops the reproduction when the transmission audio part is detected, and shifts the processing to step S1. (Not shown in FIG. 3).
[0030]
FIG. 4 shows an example of call support according to the above-described embodiment. The example of FIG. 4 is an example of a case where the talker A uses the IP telephone terminal 1a and the talker B uses the IP telephone terminal 1b in the IP telephone system of FIG. In FIG. 4, if the speaker A says "Hello", the transmitted voice V1 is heard by the speaker B after the delay time t1. If the speaker B says "yes", the transmitted voice V2 is heard by the speaker A after the delay time t2. The sum of these delay times t1 and t2 corresponds to a round trip time.
[0031]
As shown in FIG. 4, according to the present embodiment, after the speaker A says the transmitted voice V1 “Hello”, the speaker A waits for a response from the speaker B to return. As a result, his / her voice echoes, and the recording / reproducing sound E1 "Hello!" Similarly, after the transmission voice V3, the recording / reproduction voice E3 is heard. As a result, the speaker A can recognize that there is a delay in the call voice, and the conversation with the call partner (speaker B) can be smoothly performed.
[0032]
Also, in the case of the speaker B, the recording / reproducing voice E2 of “Yes, yes, yes ...” can be heard after the transmitting voice V2 “Yes”, and the recording / reproducing voice E4 can be heard after the transmitting voice V4. Recognize that there is a smooth conversation.
[0033]
It is preferable that the recording sound reproducing function of the signal generating section 20 can be disabled by a speaker's selection.
[0034]
Further, at the time of reproducing the recorded voice, the volume level may be lower than the received voice of the other party. With this configuration, even if the voice of the other party starts playing during the delay notification and overlaps with the notification voice, the notification voice does not hinder the conversation because the notification voice has a lower volume.
[0035]
In the above-described embodiment, the delay is notified using the transmission voice of the speaker in order to make the speaker recognize the voice delay. Alternatively, an audio signal such as background noise may be used.
[0036]
Further, instead of reproducing the recorded voice as the received voice, the recorded voice may be reproduced by a speaker different from that for the received voice reproduction.
[0037]
Note that the way of delay notification is not limited to audio output. For example, the delay may be notified by lighting a lamp. Alternatively, the delay may be notified by lighting the red lamp, and the expiration of the delay time may be notified by lighting the blue lamp. Further, a message such as "Please wait" may be displayed on the liquid crystal display device to notify the delay.
[0038]
In the above-described embodiment, the duration of the delay notification is changed according to the round trip time. However, the delay may be notified after the end of the transmission regardless of the round trip time. For example, the recorded sound may be reproduced only once. However, it is preferable to change the duration of the delay notification according to the round trip time in order to make the speaker recognize how much delay time is present and to make the conversation smoother.
[0039]
Note that the present embodiment can be similarly applied to voice communication using a satellite line having a large delay. For example, the present invention can be similarly applied to a satellite telephone using a satellite line as a relay line, voice communication at the time of TV satellite relay, and the like. Further, the present invention is also applicable to voice communication of a TV conference system.
[0040]
In the case of using a satellite link, delay measurement can be performed by inserting a frame representing delay measurement data instead of an ICMP packet. If the line to be used is fixed and the delay time of the line is constant, it is possible to omit the delay measurement by setting a fixed round trip time in the telephone in advance. .
In the present embodiment, it is described that the round trip time is measured, the transmission end is determined, and the transmission voice is recorded / reproduced by the telephone terminal for the IP telephone. It is also possible to perform one or more of these processes.
[0041]
As described above, the embodiment of the present invention has been described in detail with reference to the drawings. However, the specific configuration is not limited to this embodiment, and includes a design change or the like without departing from the gist of the present invention.
[0042]
【The invention's effect】
As described above, according to the present invention, it is possible to make a speaker recognize a voice delay by a predetermined notification after transmission. As a result, the speaker can recognize the delay and have a smooth conversation, so that the purpose of assisting the smooth conversation can be achieved.
[0043]
According to the second aspect of the present invention, by changing the duration of the delay notification according to the delay time, it is possible to make the speaker recognize how long the delay time is. The effect that a smooth conversation can be obtained is obtained.
[0044]
According to the third aspect of the present invention, redundant notification can be prevented. Further, according to the invention described in claim 4, the notification can be made by the voice of the speaker during the call.
[0045]
According to the fifth aspect of the present invention, even if the voice reproduction of the other party starts and overlaps with the notification voice during the delay notification, the notification voice does not disturb the conversation because the notification voice has a lower volume. The effect is obtained.
[0046]
According to the sixth aspect of the present invention, it is possible to make the speaker feel as if he or she is listening to his own voice, and the effect that the voice delay is recognized naturally is obtained.
[Brief description of the drawings]
FIG. 1 is a block diagram showing a configuration example of a system for realizing an IP telephone using IP telephone terminals 1a and 1b provided with a voice communication device according to an embodiment of the present invention.
FIG. 2 is a block diagram showing a configuration of the voice communication device 10 according to the embodiment.
FIG. 3 is a flowchart illustrating a flow of a process performed by a signal generation unit 20 illustrated in FIG. 2;
FIG. 4 is a diagram for explaining an example of call support by the voice communication device 10 shown in FIG.
[Explanation of symbols]
1a, 1b: IP telephone terminal, 2a, 2b: Router, 3a, 3b: LAN, 4: Internet, 10: Voice communication device, 11: A / D converter, 12: Voice encoder, 13: RTP packet transmission Processing unit, 14: UDP / IP processing unit, 15: network interface, 16: RTP packet reception processing unit, 17: voice decoding unit, 18: DA conversion unit, 19: delay measurement unit, 20: signal generation unit, 31 ... microphone, 32 ... speaker

Claims (7)

IPパケットにより音声通話を行う音声通信装置において、
送話音声の終了を検出する検出手段と、
該検出手段が送話音声の終了を検出後、所定時間報知を行う報知手段と、
を備えたことを特徴とする音声通信装置。
In a voice communication device that performs voice communication using IP packets,
Detecting means for detecting the end of the transmitted voice;
Notifying means for notifying for a predetermined time after the detecting means detects the end of the transmission voice,
A voice communication device comprising:
通話相手との間の遅延時間を測定する遅延測定手段を備え、前記遅延時間の測定結果に基づいて前記所定時間を設定することを特徴とする請求項1に記載の音声通信装置。2. The voice communication device according to claim 1, further comprising: delay measuring means for measuring a delay time between the caller and the other party, wherein the predetermined time is set based on a result of the measurement of the delay time. 前記所定時間は前記測定された遅延時間を超えないよう設定することを特徴とする請求項2に記載の音声通信装置。The voice communication device according to claim 2, wherein the predetermined time is set so as not to exceed the measured delay time. 送話音声を記録する記録手段を備え、
前記記録手段に記録された送話音声により前記報知を行うことを特徴とする請求項1乃至請求項3のいずれかの項に記載の音声通信装置。
Recording means for recording the transmitted voice,
The voice communication device according to claim 1, wherein the notification is performed by using a transmission voice recorded in the recording unit.
前記記録された送話音声により報知を行う際は、通話相手からの音声の音量より小さく報知することを特徴とする請求項4に記載の音声通信装置。5. The voice communication device according to claim 4, wherein when the notification is performed by the recorded transmission voice, the notification is performed at a volume lower than the volume of the voice from the other party. 前記記録された送話音声により報知を行う際は、該記録された送話音声を繰返し前記所定時間報知することを特徴とする請求項4に記載の音声通信装置。5. The voice communication device according to claim 4, wherein when the notification is made by the recorded transmission voice, the recorded transmission voice is repeatedly notified for the predetermined time. IPパケットによる音声通話において、
送話音声の終了を検出し、送話音声の終了を検出した後所定時間報知を行うことを特徴とする通話支援方法。
In voice communication using IP packets,
A call support method comprising: detecting the end of a transmitted voice, and performing notification for a predetermined time after detecting the end of the transmitted voice.
JP2002190751A 2002-06-28 2002-06-28 Voice communication apparatus and speech supporting method therefor Withdrawn JP2004040200A (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2002190751A JP2004040200A (en) 2002-06-28 2002-06-28 Voice communication apparatus and speech supporting method therefor

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2002190751A JP2004040200A (en) 2002-06-28 2002-06-28 Voice communication apparatus and speech supporting method therefor

Publications (1)

Publication Number Publication Date
JP2004040200A true JP2004040200A (en) 2004-02-05

Family

ID=31700591

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2002190751A Withdrawn JP2004040200A (en) 2002-06-28 2002-06-28 Voice communication apparatus and speech supporting method therefor

Country Status (1)

Country Link
JP (1) JP2004040200A (en)

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP5582259B2 (en) * 2011-11-09 2014-09-03 日本電気株式会社 Transmission voice monitoring method, voice input / output device, and transmission voice monitoring program
JP2015156550A (en) * 2014-02-20 2015-08-27 富士通株式会社 Voice communication apparatus and voice processing program
WO2020022167A1 (en) * 2018-07-27 2020-01-30 ソニー株式会社 Audio communication terminal, information processing method for audio communication terminal, program, distribution server, and information processing method for distribution server

Cited By (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP5582259B2 (en) * 2011-11-09 2014-09-03 日本電気株式会社 Transmission voice monitoring method, voice input / output device, and transmission voice monitoring program
JP2015156550A (en) * 2014-02-20 2015-08-27 富士通株式会社 Voice communication apparatus and voice processing program
WO2020022167A1 (en) * 2018-07-27 2020-01-30 ソニー株式会社 Audio communication terminal, information processing method for audio communication terminal, program, distribution server, and information processing method for distribution server
JPWO2020022167A1 (en) * 2018-07-27 2021-08-02 ソニーグループ株式会社 Information processing method of voice communication terminal, voice communication terminal, program, distribution server and information processing method of distribution server
US11563856B2 (en) 2018-07-27 2023-01-24 Sony Corporation Voice communication terminal, information processing method for voice communication terminal, distribution server, and information processing method for distribution server
JP7342867B2 (en) 2018-07-27 2023-09-12 ソニーグループ株式会社 Voice communication terminal, information processing method of voice communication terminal, information processing method of program and distribution server

Similar Documents

Publication Publication Date Title
US6853719B2 (en) Provision of media content to telephony callers on-hold
JP4074633B2 (en) VoIP terminal RTP media packet processing apparatus and processing method
US20120182379A1 (en) Method, Application Server and System for Privacy Protection in Video Call
JP2003101662A (en) Communication method, communication apparatus and communication terminal
US6961351B1 (en) Communication device and transit device having a call-hold function and a method for controlling the function
JP2004040200A (en) Voice communication apparatus and speech supporting method therefor
US6873604B1 (en) Method and apparatus for transitioning comfort noise in an IP-based telephony system
JP2005157045A (en) Voice transmission method
JP2010512075A (en) Method for call session, telephone system and telephone terminal
US7394892B2 (en) Content reproduction device
JP5696514B2 (en) Media communication apparatus, method and program, and media communication system
JP2005109673A (en) Voice communication system, communication apparatus used therein, cable modem, and method of controlling communication apparatus
US7502452B2 (en) Contents reproducing apparatus with telephone function
JP4667811B2 (en) Voice communication apparatus and voice communication method
JP2003124967A (en) Relay device, its control program, and communication method
JP4466631B2 (en) Telephone device, telephone control method, and program
US20100002691A1 (en) Method and apparatus for providing asynchronous audio messaging
JP5210788B2 (en) Speech signal communication system, speech synthesizer, speech synthesis processing method, speech synthesis processing program, and recording medium storing the program
JP2000253150A (en) Speech auxiliary device for speech system
JP2008060752A (en) Calling method of communication terminal
JP4684247B2 (en) Voice communication method and voice communication apparatus
JP2004015359A (en) Communication apparatus
JP3540780B2 (en) Internet communication control apparatus and communication terminal calling method
JP4079921B2 (en) Wireless IP telephone, wireless IP telephone system, and voice communication method thereof
JPH1132315A (en) Method for communicating video and voice and system therefor and storage medium storing video and voice communication program

Legal Events

Date Code Title Description
A300 Application deemed to be withdrawn because no request for examination was validly filed

Free format text: JAPANESE INTERMEDIATE CODE: A300

Effective date: 20050906