JP2003209600A - 通話システム、通話端末、方法、プログラム、及びコンピュータ読み取り可能な記憶媒体 - Google Patents

通話システム、通話端末、方法、プログラム、及びコンピュータ読み取り可能な記憶媒体

Info

Publication number
JP2003209600A
JP2003209600A JP2002005142A JP2002005142A JP2003209600A JP 2003209600 A JP2003209600 A JP 2003209600A JP 2002005142 A JP2002005142 A JP 2002005142A JP 2002005142 A JP2002005142 A JP 2002005142A JP 2003209600 A JP2003209600 A JP 2003209600A
Authority
JP
Japan
Prior art keywords
voice
call
information
party
terminal
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2002005142A
Other languages
English (en)
Inventor
Akiyoshi Hamanaka
章佳 浜中
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Canon Inc
Original Assignee
Canon Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Canon Inc filed Critical Canon Inc
Priority to JP2002005142A priority Critical patent/JP2003209600A/ja
Publication of JP2003209600A publication Critical patent/JP2003209600A/ja
Pending legal-status Critical Current

Links

Landscapes

  • Two-Way Televisions, Distribution Of Moving Picture Or The Like (AREA)
  • Telephone Function (AREA)

Abstract

(57)【要約】 【課題】 会話の意味(相手の意思)を明確に伝えるこ
とを可能とし、更には聴覚障害者等でも利用しやすいも
のとする。 【解決手段】 少なくとも二以上の通話端末201、2
02間で音声及び画像の双方向同時通信を可能とした通
話システムであって、相手の通話端末から送信された音
声情報を音声認識する音声認識手段と、音声認識の成否
を判断する判断手段と、音声認識が可能であったと判定
された場合に、音声認識された音声情報を文字情報に変
換する変換手段と、その変換された文字情報を相手の通
話端末から送信された画像情報に重畳してモニタTVに
表示する表示手段と、音声認識ができなかったと判定さ
れた場合に、音声情報に対して聴覚的な認識度の向上を
意図した処理(例えば、音圧を増大する処理)を行う処
理手段とを備えている。

Description

【発明の詳細な説明】
【0001】
【発明の属する技術分野】本発明は、音声及び画像の双
方向同時通信を可能とした通話システム、当該通話シス
テムに用いられる通話端末、方法、プログラム、及びコ
ンピュータ読み取り可能な記憶媒体に関する。
【0002】
【従来の技術】今日においては、音声及び画像の双方向
同時通信を可能とした通話システムが実現されるに至っ
ている。かかる通話システムでは、遠隔地のそれぞれに
マイク内蔵型カメラ及びスピーカ付きモニタTVを有す
る通話端末が備えられており、相手の画像を見ながら通
話するようなシステムとなっている。
【0003】
【発明が解決しようとする課題】上記のように音声及び
画像の双方向同時通信を可能とした通話システムでは、
音声に画像が加わることにより会話の理解が促進される
という利点があるが、それでもなお、周辺ノイズや話者
の不明瞭な発音により会話が聞き取り難いという場面で
は、会話の意味(相手の意志)が伝わらないことがあっ
た。
【0004】また、音声のみの通話システムと同様に、
聴覚障害者が利用することは相変わらず困難であるとい
う問題があった。
【0005】本発明は上記の点に鑑みてなされたもので
あり、音声及び画像の双方向同時通信を可能とした通話
システムにおいて会話の意味(相手の意思)を明確に伝
えることを可能とし、更には聴覚障害者等でも利用しや
すいものとすることを目的とする。
【0006】
【課題を解決するための手段】本発明の通話システム
は、少なくとも二以上の通話端末間で音声及び画像の双
方向同時通信を可能とした通話システムであって、相手
の通話端末から送信された音声情報を音声認識する音声
認識手段と、上記音声認識された音声情報を文字情報に
変換する変換手段と、上記文字情報を上記相手の通話端
末から送信された画像情報に重畳して表示装置に表示す
る表示手段とを備えた点に特徴を有する。
【0007】また、本発明の通話システムの他の特徴と
するところは、上記音声認識の成否を判断する判断手段
と、上記音声認識ができなかったと判定された場合に、
上記音声情報に対して聴覚的な認識度の向上を意図した
一又は複数の処理を行う処理手段とを備えた点にある。
更には、上記聴覚的な認識度の向上を意図した処理とし
て所望の処理を設定可能とした点にある。上記聴覚的な
認識度の向上を意図した処理としては、音圧増大処理、
周波数特性調整処理、騒音除去処理等を適用することが
できる。
【0008】また、本発明の通話システムの他の特徴と
するところは、上記相手の通話端末から送信された画像
情報を記憶するためのメモリ手段を備えた点にある。ま
た、本発明の通話システムの他の特徴とするところは、
上記相手の通話端末から送信された音声情報を記憶する
ためのメモリ手段を備えた点にある。
【0009】また、本発明の通話システムの他の特徴と
するところは、上記音声情報と上記画像情報との同期制
御を行う同期制御手段を備えた点にある。
【0010】また、本発明の通話システムの他の特徴と
するところは、少なくとも一の通話装置には文字入力端
末が備えられており、当該文字入力端末介して入力され
た文字情報を相手の通話装置に送信可能とした点にあ
る。また、本発明の通話システムの他の特徴とするとこ
ろは、少なくとも一の通話装置は、相手の通話端末から
送信された文字情報を、同時に送信された画像情報に重
畳して表示装置に表示する表示手段を備えた点にある。
【0011】本発明の通話端末は、少なくとも二以上の
通話端末間で音声及び画像の双方向同時通信を可能とし
た通話システムに用いられる通話端末であって、相手の
通話端末から送信された音声情報を音声認識する音声認
識手段と、上記音声認識された音声情報を文字情報に変
換する変換手段と、上記文字情報を上記相手の通話端末
から送信された画像情報に重畳して表示装置に表示する
表示手段とを備えた点に特徴を有する。
【0012】本発明の通話方法は、少なくとも二以上の
通話端末間で音声及び画像の双方向同時通信を可能とし
た通話システムを用いた通話方法であって、相手の通話
端末から送信された音声情報を音声認識する手順と、上
記音声認識された音声情報を文字情報に変換する手順
と、上記文字情報を上記相手の通話端末から送信された
画像情報に重畳して表示装置に表示する手順とを有する
点に特徴を有する。
【0013】本発明のプログラムは、少なくとも二以上
の通話端末間で音声及び画像の双方向同時通信を可能と
した通話システムに用いられる通話端末を制御するため
のプログラムであって、相手の通話端末から送信された
音声情報を音声認識する処理と、上記音声認識された音
声情報を文字情報に変換する処理と、上記文字情報を上
記相手の通話端末から送信された画像情報に重畳して表
示装置に表示する処理とを実行させる点に特徴を有す
る。
【0014】本発明のコンピュータプログラムは、上記
プログラムを格納した点に特徴を有する。
【0015】
【発明の実施の形態】以下、図面を参照して、本発明の
通話システム、通話端末、方法、プログラム、及びコン
ピュータ読み取り可能な記憶媒体の実施の形態について
説明する。
【0016】(第1の実施の形態)図1には、本実施の
形態の通話システムの構成を示す。同時送受話及び同時
送受像可能な通話端末201、202が伝送路を介して
接続されており、各端末201、202は、マイク内蔵
型カメラ203、207、スピーカ205、209を備
えたモニタTV204、208からなる。
【0017】同図において、212、214はモニタT
V204、208に表示された互いの通信相手の画像を
示し、211、213は後述するようにして互いの通信
相手から送信された音声信号(音声情報)を音声認識し
た結果のキャプションを示す。
【0018】215、216は互いの通信相手から送信
された音声信号出力(音波)を示し、218、219は
互いの通信相手から送信された音声信号(215、21
6)を音声認識した結果、音声認識不能な箇所があった
場合のキャプション例を示す。
【0019】図2は、上記通話端末201、202の構
成を示すブロック図である。同図(a)は音声及び画像
の送信のための構成を示す。101はビデオカメラ、1
04はマイクロフォンであり、図1でいうマイク内蔵型
カメラ203、207に相当する。102は画像用符号
化器である。103はマルチプレクサである。105は
マイクアンプである。106は音声用符号化器である。
107はバッファメモリである。
【0020】同図(b)は音声及び画像の受信のための
構成を示す。108はバッファメモリである。109は
デマルチプレクサである。110は画像用復号化器であ
る。111はフレームメモリである。112はモニタT
Vであり、図1でいうモニタTV204、208に相当
する。113は音声用復号化器である。114はバッフ
ァメモリである。115はアンプである。116はスピ
ーカであり、図1でいうスピーカ205、206、20
9、210に相当する。117は利得制御部である。1
18は音声認識部である。119は画像制御部である。
120は同期制御部である。
【0021】次に、本実施の形態の通話システムにおけ
る処理動作について説明する。図1に示したような通話
システムにおいては、具体的には図示しないが、例えば
モニタTV204、208に表示されるグラフィカルユ
ーザインタフェースにおいてダイヤル等の操作を行い、
その後はモニタTV204、208の前で通信相手の画
像を見ながら通話する。
【0022】図3のフローチャートには、音声及び画像
の送信に際して行われる処理動作を示す。ビデオカメラ
101で取り込まれた動画像信号は、画像用符号化器1
02にてAD変換及び所定の符号化(圧縮)処理された
後、マルチプレクサ103に入力される(ステップS3
01)。
【0023】同時に、マイクロフォン104で取り込ま
れた音声信号は、マイクアンプ105にて所定のレベル
に増幅された後、上記動画像信号と同様に音声用符号化
器106にてAD変換及び所定の符号化(圧縮)処理さ
れた後、マルチプレクサ103に入力される(ステップ
S301)。
【0024】マルチプレクサ103に入力された符号化
動画像信号及び符号化音声信号は、出力先である伝送路
や蓄積メディアに適合した形式のビットストリームを形
成するために多重化処理及び各種ヘッダ情報の付加処理
がなされて、バッファメモリ107に一時蓄積される
(ステップS302)。
【0025】上記バッファメモリ107に蓄積されたビ
ットストリームは、外部又は内部のレート制御部により
所定のビットレートで読み出される(ステップS30
3)。
【0026】図4のフローチャートには、音声及び画像
の受信に際して行われる処理動作を示す。相手の通話端
末から伝送されたビットストリームは、バッファメモリ
108に一時蓄積された後、後段の処理の処理能力に適
合したビットレートで読み出され、デマルチプレクサ1
09に入力される(ステップS401)。
【0027】デマルチプレクサ109に入力されたビッ
トストリームは、符号化動画像信号と符号化音声信号と
に分離され、符号化動画像信号は画像用復号化器110
へ、符号化音声信号は音声用復号化器113へそれぞれ
入力され、両者共に所定の復号化処理により、ディジタ
ル動画像信号及びディジタル音声信号、或いは、アナロ
グ動画像信号及びアナログ音声信号に復号される(ステ
ップS402)。
【0028】上記復号化された動画像信号はフレームメ
モリ111に記憶され、同期制御部120の制御によ
り、音声信号との同期をとりながら適宜読み出してモニ
タTV112に表示される。なお、この処理について
は、図4のフローチャートでは省略する。
【0029】また、上記複号化された音声信号はバッフ
ァメモリ114に記憶されると同時に、音声認識部11
8へ入力され、当該複号化された音声信号に対する音声
認識処理が行われる(ステップS403)。
【0030】音声認識可能であった場合は、その認識し
た音声情報を文字情報(テキスト情報)に変換し(ステ
ップS404)、そのテキスト情報とタイミング情報
(動画像との同期情報)とを画像制御部119に送出す
る。
【0031】画像制御部119では、音声認識部118
から送出されたタイミング情報に従って、フレームメモ
リ111に記憶されている上記複号化された動画像信号
の該当するフレーム内の任意の位置に、図2の211、
213に示したように、認識された音声に対応するテキ
スト情報をキャプションとして重畳表示する(ステップ
S405)。
【0032】なお、音声認識部118における音声認識
処理に要する時間に相当する遅延は、画像についてはフ
レームメモリ111にて、音声についてはバッファメモ
リ114にて吸収され、フレームメモリ111に記憶さ
れている動画像と、バッファメモリ114記憶されてい
る音声との同期は、同期制御部120にて管理される。
【0033】それに対して、音声信号認識不能であった
場合は、利得制御部117に利得制御信号を送出する。
利得制御信号を受けた利得制御部117は、アンプ11
5の利得を増大して、認識不可部分におけるスピーカ1
16からの音圧を増大する音声出力調整を行う(ステッ
プS406)。
【0034】なお、音声認識不能の場合について、フレ
ームメモリ111の容量やバッファメモリ114の容量
によっては、時間的に音声認識不能となる前の時点から
音声出力を増大するよう利得制御部117及び同期制御
部120をプログラムしておくことも可能である。
【0035】以上述べたように、音声認識して文字表示
することにより、音声による通話において生じやすい意
味不明や誤解の頻度を低減することができ、更には聴覚
障害者でも通話が可能になるという効果が期待できる。
【0036】また、音声認識不能である場合には、音声
信号に対して聴覚的な認識度の向上を意図した所定の処
理、本実施の形態では音圧を増大するようにしたので、
会話の認識率を向上させるといった効果が期待できる。
【0037】なお、上述した音声認識不能の場合に、図
5のフローチャートに示すように、聴覚的な認識度の向
上を意図した処理のバリエーションを設定してもよい。
すなわち、音声認識不能であった場合に、処理方法の選
択についてユーザによるリクエストがあるか否かを判定
し(ステップS501)、リクエストがない場合は、デ
フォルトの音声出力調整(音圧増大処理)のみを行う
(ステップS502)。
【0038】それに対して、リクエストがある場合は、
そのリクエストに応じて、明瞭度を高くするための周波
数特性調整(エンファシス)(ステップS503)、或
いは、暗騒音除去(フィルタ処理)(ステップS50
4)といった処理を行った後、音声出力調整を行う(ス
テップS502)。
【0039】これら選択可能な周波数特性調整(エンフ
ァシス)や暗騒音除去といった機能は、周波数特性調整
器及び暗騒音除去フィルタといったハードウェアを図2
に示したアンプ115等に装備しておくことにより可能
となる。
【0040】また、上記処理方法の選択は、通話端末2
01、203の入力機能を用いて予め用意されているフ
ァンクションを画面上のメニューから選択できるように
プログラミングしておくこと等により可能である。
【0041】(第2の実施の形態)図6には、本実施の
形態の通話システムの構成を示す。同時送受話及び同時
送受像可能な通話端末301、302が伝送路を介して
接続されており、各端末301、302は、マイク内蔵
型カメラ303、307、スピーカ305、309を備
えたモニタTV304、308からなる。また、通話端
末301には、手書き文字入力装置317、キーボード
318が接続されている。
【0042】同図において、311は手書き文字入力装
置317やキーボード318により入力された文字のモ
ニタ表示を示し、313、315はモニタTV304、
308に表示された互いの通信相手の画像を示し、31
2は後述するようにして互いの通信相手から送信された
音声信号を音声認識した結果のキャプションを示し、3
14は後述するようにして通信相手から送信されたテキ
スト信号をモニタ表示したキャプションを示し、316
は通信相手から送信された音声信号出力(音波)を示
す。
【0043】図7は、上記通話端末301、302の構
成を示すブロック図である。801はビデオカメラ、8
04はマイクロフォンであり、図6でいうマイク内蔵型
カメラ303、307に相当する。802は画像用符号
化器である。803はマルチプレクサである。805は
マイクアンプである。806は音声用符号化器である。
807、808はバッファメモリである。
【0044】809はデマルチプレクサである。810
は画像用復号化器である。811はフレームメモリであ
る。812はモニタTVであり、図6でいうモニタTV
304、308に相当する。
【0045】813は音声用復号化器である。814は
バッファメモリである。815はアンプである。816
はスピーカであり、図6でいうスピーカ305、30
6、309、310に相当する。
【0046】817は文字入力端末であり、図6でいう
手書き文字入力装置317やキーボード318に相当す
る。818はテキスト用符号化器である。823はテキ
スト用複号化器である。
【0047】819は利得制御部である。820は音声
認識部である。821は画像制御部である。822は同
期制御部である。
【0048】次に、本実施の形態の通話システムにおけ
る処理動作について説明する。図6に示したような通話
システムにおいては、具体的には図示しないが、例えば
モニタTV304、308に表示されるグラフィカルユ
ーザインタフェースにおいてダイヤル等の操作を行い、
その後はモニタTV304、308の前で通信相手の画
像を見ながら通話する。
【0049】図8のフローチャートには、音声及び画像
の送信に際して行われる処理動作を示す。ビデオカメラ
801で取り込まれた動画像信号は、画像用符号化器8
02にてAD変換及び所定の符号化(圧縮)処理された
後、マルチプレクサ803に入力される。
【0050】上記ビデオカメラ801から取り込まれた
画像信号と並行して、文字入力端末817(手書き文字
入力装置317やキーボード318)から文字が入力さ
れた場合、入力された文字信号(テキスト信号)は、フ
レームメモリ811、及び、テキスト用符号化器818
を介してマルチプレクサ803に入力される。入力され
た文字信号は、図6に示すように、自己の通話端末にモ
ニタ表示されるとともに(符号311参照)、後述する
ように相手の通話端末に送信されて画像に重畳してモニ
タTVに表示される(符号314参照)。
【0051】また、音声が入力された場合、マイクロフ
ォン804で取り込まれた音声信号は、マイクアンプ8
05にて所定のレベルに増幅された後、上記動画像信号
と同様に音声用符号化器806にてAD変換及び所定の
符号化(圧縮)処理された後、マルチプレクサ803に
入力される(ステップS801)。
【0052】マルチプレクサ803に入力された符号化
動画像信号、符号化音声信号、符号化テキスト信号は、
出力先である伝送路や蓄積メディアに適合した形式のビ
ットストリームを形成するために多重化処理及び各種ヘ
ッダ情報の付加処理がなされて、バッファメモリ807
に一時蓄積される(ステップS802)。
【0053】上記バッファメモリ807に蓄積されたビ
ットストリームは、外部又は内部のレート制御部により
所定のビットレートで読み出される(ステップS80
3)。
【0054】図9のフローチャートには、音声及び画像
の受信に際して行われる処理動作を示す。相手の通話端
末から伝送されたビットストリーム(ビデオ、オーディ
オ、テキストetc)は、バッファメモリ808に一時蓄
積された後、後段の処理の処理能力に適合したビットレ
ートで読み出され、デマルチプレクサ809に入力され
る(ステップS901)。
【0055】デマルチプレクサ809に入力されたビッ
トストリームは、符号化動画像信号と符号化音声信号と
符号化テキスト信号とに分離され、符号化動画像信号は
画像用復号化器810へ、符号化音声信号は音声用復号
化器813へ、符号化テキスト信号はテキスト用復号器
823へそれぞれ入力され、所定の復号化処理により、
ディジタル動画像信号及びディジタル音声信号、或い
は、アナログ動画像信号及びアナログ音声信号、及びテ
キスト信号に復号される(ステップS902)。
【0056】上記復号化された動画像信号とテキスト信
号とはフレームメモリ811に記憶される。また、テキ
スト信号は、動画像信号(フレーム)の任意の位置に記
憶(重畳)され、1つの動画像信号を形成する。そし
て、テキストが重畳された動画像は、同期制御部822
の制御により、音声信号との同期をとりながら適宜読み
出してモニタTV812に表示される。なお、この処理
については、図9のフローチャートでは省略する。
【0057】また、上記複号化された音声信号はバッフ
ァメモリ814に記憶されると同時に、音声認識部82
0へ入力され、当該複号化された音声信号に対する音声
認識処理が行われる(ステップS903)。
【0058】音声認識可能であった場合は、その認識し
た音声情報を文字情報(テキスト情報)に変換し(ステ
ップS904)、そのテキスト情報とタイミング情報
(動画像との同期情報)とを画像制御部821に送出す
る。
【0059】画像制御部821では、音声認識部820
から送出されたタイミング情報に従って、フレームメモ
リ811に記憶されている上記複号化された動画像信号
の該当するフレーム内の任意の位置に、図6の312に
示したように、認識された音声に対応するテキストをキ
ャプションとして画像に重畳表示する(ステップS90
5)。
【0060】すなわち、図6に示すように、端末302
に対して画像と文字入力で通信する場合は、上記のよう
に音声認識した結果のテキストに加えて(図6の通話端
末302において不図示)、端末301の文字入力端末
817から入力されたテキストもキャプションとして画
像に重畳表示される。
【0061】なお、音声信号認識不能であった場合の取
り扱いは(ステップS906)、上記第1の実施の形態
で述べたのと同様であり、ここではその説明は省略す
る。
【0062】以上述べたように、文字入力を可能とし、
その文字を通信相手の通話端末において表示するように
したので、例えば会話が困難な障害者等でも文字を使っ
た通話が可能になるという効果が期待できる。
【0063】(その他の実施の形態)上述した実施の形
態の機能を実現するべく各種のデバイスを動作させるよ
うに、該各種デバイスと接続された部或いはシステム内
のコンピュータに対し、上記実施の形態の機能を実現す
るためのソフトウェアのプログラムコードを供給し、そ
のシステム或いは部のコンピュータ(CPU或いはMP
U)に格納されたプログラムに従って上記各種デバイス
を動作させることによって実施したものも、本発明の範
疇に含まれる。
【0064】また、この場合、上記ソフトウェアのプロ
グラムコード自体が上述した実施の形態の機能を実現す
ることになり、そのプログラムコード自体は本発明を構
成する。そのプログラムコードの伝送媒体としては,プ
ログラム情報を搬送波として伝搬させて供給するための
コンピュータネットワーク(LAN、インターネット等
のWAN、無線通信ネットワーク等)システムにおける
通信媒体(光ファイバ等の有線回線や無線回線等)を用
いることができる。
【0065】さらに、上記プログラムコードをコンピュ
ータに供給するための手段、例えばかかるプログラムコ
ードを格納した記録媒体は本発明を構成する。かかるプ
ログラムコードを記憶する記録媒体としては、例えばフ
レキシブルディスク、ハードディスク、光ディスク、光
磁気ディスク、CD−ROM、磁気テープ、不揮発性の
メモリカード、ROM等を用いることができる。
【0066】また、コンピュータが供給されたプログラ
ムコードを実行することにより、上述の実施の形態の機
能が実現されるだけでなく、そのプログラムコードがコ
ンピュータにおいて稼働しているOS(オペレーティン
グシステム)或いは他のアプリケーションソフト等と共
同して上述の実施の形態の機能が実現される場合にもか
かるプログラムコードは本発明の実施の形態に含まれる
ことはいうまでもない。
【0067】さらに、供給されたプログラムコードがコ
ンピュータの機能拡張ボードやコンピュータに接続され
た機能拡張ユニットに備わるメモリに格納された後、そ
のプログラムコードの指示に基づいてその機能拡張ボー
ドや機能拡張ユニットに備わるCPU等が実際の処理の
一部又は全部を行い、その処理によって上述した実施の
形態の機能が実現される場合にも本発明に含まれること
はいうまでもない。
【0068】なお、上記実施の形態において示した各部
の形状及び構造は、何れも本発明を実施するにあたって
の具体化のほんの一例を示したものに過ぎず、これらに
よって本発明の技術的範囲が限定的に解釈されてはなら
ないものである。すなわち、本発明はその精神、又はそ
の主要な特徴から逸脱することなく、様々な形で実施す
ることができる。
【0069】
【発明の効果】以上述べたように本発明によれば、相手
の音声情報を音声認識して文字表示することにより、音
声による通話において生じやすい意味不明や誤解の頻度
を低減することができ、更には聴覚障害者でも通話が可
能になるという効果が期待できる。
【0070】また、音声認識不能である場合には、音声
信号に対して聴覚的な認識度の向上を意図した所定の処
理、例えば音圧を増大するようにしたので、会話の認識
率を向上させるといった効果が期待できる。
【図面の簡単な説明】
【図1】第1の実施の形態の通話システムの構成を示す
模式図である。
【図2】第1の実施の形態の通話端末の構成を示すブロ
ック図である。
【図3】第1の実施の形態において音声及び画像の送信
に際して行われる処理動作を示すフローチャートであ
る。
【図4】第1の実施の形態において音声及び画像の受信
に際して行われる処理動作を示すフローチャートであ
る。
【図5】聴覚的な認識度の向上を意図した処理のバリエ
ーションを設定した場合のフローチャートである。
【図6】第2の実施の形態の通話システムの構成を示す
模式図である。
【図7】第2の実施の形態の通話端末の構成を示すブロ
ック図である。
【図8】第2の実施の形態において音声及び画像の送信
に際して行われる処理動作を示すフローチャートであ
る。
【図9】第2の実施の形態において音声及び画像の受信
に際して行われる処理動作を示すフローチャートであ
る。
【符号の説明】
201、202、301、302 通話端末 203、207、303、307 マイク内蔵型カメ
ラ 205、209、305、309 スピーカ 204、208、304、308 モニタTV 317 文字入力装置 318 キーボード 101、801 ビデオカメラ 104、804 マイクロフォン 102、802 画像用符号化器 103、803 マルチプレクサ 105、805 マイクアンプ 106、806 音声用符号化器 107、108、807、809 バッファメモリ 109、809 デマルチプレクサ 110、810 画像用復号化器 111、811 フレームメモリ 112、812 モニタTV 113、813 音声用復号化器 114、814 バッファメモリ 115、815 アンプ 116、816 スピーカ 117、819 利得制御部 118、820 音声認識部 119、821 画像制御部 120、822 同期制御部 817 文字入力端末 818 テキスト用符号化
器 823 テキスト用復号化
───────────────────────────────────────────────────── フロントページの続き (51)Int.Cl.7 識別記号 FI テーマコート゛(参考) H04N 7/14 G10L 3/02 301G 3/00 561C

Claims (15)

    【特許請求の範囲】
  1. 【請求項1】 少なくとも二以上の通話端末間で音声及
    び画像の双方向同時通信を可能とした通話システムであ
    って、 相手の通話端末から送信された音声情報を音声認識する
    音声認識手段と、 上記音声認識された音声情報を文字情報に変換する変換
    手段と、 上記文字情報を上記相手の通話端末から送信された画像
    情報に重畳して表示装置に表示する表示手段とを備えた
    ことを特徴とする通話システム。
  2. 【請求項2】 上記音声認識の成否を判断する判断手段
    と、 上記音声認識ができなかったと判定された場合に、上記
    音声情報に対して聴覚的な認識度の向上を意図した一又
    は複数の処理を行う処理手段とを備えたことを特徴とす
    る請求項1に記載の通話システム。
  3. 【請求項3】 上記聴覚的な認識度の向上を意図した処
    理として所望の処理を設定可能としたことを特徴とする
    請求項2に記載の通話システム。
  4. 【請求項4】 上記聴覚的な認識度の向上を意図した処
    理は音圧増大処理であることを特徴とする請求項2又は
    3に記載の通話システム。
  5. 【請求項5】 上記聴覚的な認識度の向上を意図した処
    理は周波数特性調整処理であることを特徴とする請求項
    2又は3に記載の通話システム。
  6. 【請求項6】 上記聴覚的な認識度の向上を意図した処
    理は騒音除去処理であることを特徴とする請求項2又は
    3に記載の通話システム。
  7. 【請求項7】 上記相手の通話端末から送信された画像
    情報を記憶するためのメモリ手段を備えたことを特徴と
    する請求項1〜6のいずれか1項に記載の通話システ
    ム。
  8. 【請求項8】 上記相手の通話端末から送信された音声
    情報を記憶するためのメモリ手段を備えたことを特徴と
    する請求項1〜7のいずれか1項に記載の通話システ
    ム。
  9. 【請求項9】 上記音声情報と上記画像情報との同期制
    御を行う同期制御手段を備えたことを特徴とする請求項
    1〜8のいずれか1項に記載の通話システム。
  10. 【請求項10】 少なくとも一の通話装置には文字入力
    端末が備えられており、当該文字入力端末介して入力さ
    れた文字情報を相手の通話装置に送信可能としたことを
    特徴とする請求項1〜9のいずれか1項に記載の通話シ
    ステム。
  11. 【請求項11】 少なくとも一の通話装置は、相手の通
    話端末から送信された文字情報を、同時に送信された画
    像情報に重畳して表示装置に表示する表示手段を備えた
    ことを特徴とする請求項1〜10のいずれか1項に記載
    の通話システム。
  12. 【請求項12】 少なくとも二以上の通話端末間で音声
    及び画像の双方向同時通信を可能とした通話システムに
    用いられる通話端末であって、 相手の通話端末から送信された音声情報を音声認識する
    音声認識手段と、 上記音声認識された音声情報を文字情報に変換する変換
    手段と、 上記文字情報を上記相手の通話端末から送信された画像
    情報に重畳して表示装置に表示する表示手段とを備えた
    ことを特徴とする通話端末。
  13. 【請求項13】 少なくとも二以上の通話端末間で音声
    及び画像の双方向同時通信を可能とした通話システムを
    用いた通話方法であって、 相手の通話端末から送信された音声情報を音声認識する
    手順と、 上記音声認識された音声情報を文字情報に変換する手順
    と、 上記文字情報を上記相手の通話端末から送信された画像
    情報に重畳して表示装置に表示する手順とを有すること
    を特徴とする通話方法。
  14. 【請求項14】 少なくとも二以上の通話端末間で音声
    及び画像の双方向同時通信を可能とした通話システムに
    用いられる通話端末を制御するためのプログラムであっ
    て、 相手の通話端末から送信された音声情報を音声認識する
    処理と、 上記音声認識された音声情報を文字情報に変換する処理
    と、 上記文字情報を上記相手の通話端末から送信された画像
    情報に重畳して表示装置に表示する処理とを実行させる
    ことを特徴とするプログラム。
  15. 【請求項15】 請求項14に記載のプログラムを格納
    したことを特徴とするコンピュータ読み取り可能な記憶
    媒体。
JP2002005142A 2002-01-11 2002-01-11 通話システム、通話端末、方法、プログラム、及びコンピュータ読み取り可能な記憶媒体 Pending JP2003209600A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2002005142A JP2003209600A (ja) 2002-01-11 2002-01-11 通話システム、通話端末、方法、プログラム、及びコンピュータ読み取り可能な記憶媒体

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2002005142A JP2003209600A (ja) 2002-01-11 2002-01-11 通話システム、通話端末、方法、プログラム、及びコンピュータ読み取り可能な記憶媒体

Publications (1)

Publication Number Publication Date
JP2003209600A true JP2003209600A (ja) 2003-07-25

Family

ID=27644269

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2002005142A Pending JP2003209600A (ja) 2002-01-11 2002-01-11 通話システム、通話端末、方法、プログラム、及びコンピュータ読み取り可能な記憶媒体

Country Status (1)

Country Link
JP (1) JP2003209600A (ja)

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2014006648A (ja) * 2012-06-22 2014-01-16 Sharp Corp 情報処理装置、通信システム、通信方法、およびプログラム
JP2017097092A (ja) * 2015-11-20 2017-06-01 株式会社Jvcケンウッド 端末装置、通信方法
JP2017097093A (ja) * 2015-11-20 2017-06-01 株式会社Jvcケンウッド 端末装置、通信方法
JP2018151533A (ja) * 2017-03-14 2018-09-27 株式会社リコー 通信端末、通信プログラム及び通信方法

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2014006648A (ja) * 2012-06-22 2014-01-16 Sharp Corp 情報処理装置、通信システム、通信方法、およびプログラム
JP2017097092A (ja) * 2015-11-20 2017-06-01 株式会社Jvcケンウッド 端末装置、通信方法
JP2017097093A (ja) * 2015-11-20 2017-06-01 株式会社Jvcケンウッド 端末装置、通信方法
JP2018151533A (ja) * 2017-03-14 2018-09-27 株式会社リコー 通信端末、通信プログラム及び通信方法

Similar Documents

Publication Publication Date Title
KR100827802B1 (ko) 휴대 단말기의 화상 통화 장치 및 화상 통화 송수신방법
JP4367507B2 (ja) コミュニケーション端末装置およびコミュニケーション端末装置におけるミュート制御方法
JP2004304601A (ja) Tv電話装置、tv電話装置のデータ送受信方法
JP2008182463A (ja) テレビジョン受信装置
JP2006211268A (ja) テレビドアホン装置
US20050192050A1 (en) Method and apparatus for processing incoming call of wireless telephone having camera
JP2003209600A (ja) 通話システム、通話端末、方法、プログラム、及びコンピュータ読み取り可能な記憶媒体
JP3460625B2 (ja) テレビ電話装置およびテレビ電話装置における情報処理方法
US5900906A (en) Image communication apparatus having automatic answering and recording function
JP2006211570A (ja) 撮影装置
KR101232537B1 (ko) 화상통신 단말기 및 화상통신 단말기에서 화상통신 방법
JPH05328337A (ja) 画像通信端末装置
JP2006140596A (ja) 通信端末
JP2005294929A (ja) テレビドアホン装置
JPH06253305A (ja) テレビ会議システム
JP2007006085A (ja) 無線携帯端末、並びに、それを用いた撮像方法および通信方法
JP2006332968A (ja) テレビ電話装置
KR100397692B1 (ko) 청각 장애인이 사용가능한 화상을 이용한 전화기
JP3030019B2 (ja) 通信会議システム
JP3444905B2 (ja) 動画像通信方法
JP2001016558A (ja) 通信システム及び方法並びに端末装置
JP3031309B2 (ja) ビデオ会議装置
JPH07170505A (ja) 画像通信装置
JPH04109784A (ja) テレビ会議画像表示制御方法
JP2006101327A (ja) テレビドアホン装置