JPH07222129A - 映像通信装置 - Google Patents

映像通信装置

Info

Publication number
JPH07222129A
JPH07222129A JP6008133A JP813394A JPH07222129A JP H07222129 A JPH07222129 A JP H07222129A JP 6008133 A JP6008133 A JP 6008133A JP 813394 A JP813394 A JP 813394A JP H07222129 A JPH07222129 A JP H07222129A
Authority
JP
Japan
Prior art keywords
video
video communication
image
communication device
conversation
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP6008133A
Other languages
English (en)
Inventor
Itaru Mimura
到 三村
Toshiaki Suzuki
敏明 鈴木
Tatsuya Kameyama
達也 亀山
Taizo Kinoshita
泰三 木下
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Hitachi Ltd
Original Assignee
Hitachi Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Hitachi Ltd filed Critical Hitachi Ltd
Priority to JP6008133A priority Critical patent/JPH07222129A/ja
Publication of JPH07222129A publication Critical patent/JPH07222129A/ja
Pending legal-status Critical Current

Links

Landscapes

  • Two-Way Televisions, Distribution Of Moving Picture Or The Like (AREA)

Abstract

(57)【要約】 【構成】音声の中から動画モードと準動画モードの切替
を指示する言葉を検出する手段と、映像の中から動画モ
ードと準動画モードの切替を指示するジェスチャを検出
する手段とを備え、検出した指示に応じて符号生成量を
動画(大量)/準動画(小量)に切替え可能な符号化装
置6を備える。 【効果】会話を必要としない映像接続では準動画の伝送
のため通信コストの節約が図れ、会話が必要な場合には
高精細動画を用いた臨場感映像通信が可能となる。

Description

【発明の詳細な説明】
【0001】
【産業上の利用分野】本発明は、映像によりサテライト
オフィス間を接続する映像通信装置に関する。
【0002】
【従来の技術】従来より映像通信を利用して会議を行う
テレビ会議装置が実用に供している。テレビ会議装置で
は、カメラで撮影した映像信号をデジタル化し、さらに
この信号を圧縮して伝送している。このように画像を圧
縮する理由は以下の通りである。すなわち、テレビ解像
度の映像を完全な動画で伝送するには、100メガビッ
ト/秒を越える高速な映像伝送ネットワークを使用する
必要があり、このような高速回線の伝送コストは極めて
高価なためである。そこで、画像信号の持つ統計的特徴
を利用して冗長性を取り除く等の手法により100メガ
ビット/秒以上の映像データを、数十キロビット/秒か
ら数メガビット/秒に圧縮して伝送する手法が開発され
てきた。現在では、NTTのサービスするISDN回線
(Integrated Services on Digital Network:64キロ
ビット回線)に収容できるほど高効率に圧縮できる技術
が開発されてきている。しかし、今までに開発されてき
た画像圧縮手法といえども、回線容量内に符号量発生量
を抑えるため、駒落しや解像度低下が生じ、臨場感ある
映像通信は必ずしも可能とは言えない。また、最近で
は、さらに伝送容量を増したBISDN(Broadband IS
DN)と呼ばれる通信サービスも始まる予定ではあるが、
この回線を使用するとしても依然として回線使用量は高
く、映像通信サービスを普及させる障害となっている。
【0003】
【発明が解決しようとする課題】ところで、首都圏の地
価高騰を背景に事務所やオフィスを郊外に設置するよう
な形態(以後、サテライトオフィスと称する)が出現し
てきている。このサテライトオフィスでは、電話,ファ
ックス、またはコンピュータネットワークを使用してオ
フィス間を接続し、物理的な距離を感じさせずに作業が
可能な環境を提供しようとするもので、1993年時点
で幾つかの試行がある。これらの試行を通じてサテライ
トオフィスをより実用的なものとするには、上記に示し
た通信装置だけでなく、お互いのオフィスの映像を常時
表示して同一空間の共有感を創造する映像通信装置を利
用することが効果的であると指摘されている。この理由
は、相手地点の映像を常時表示することで同じ空間を共
有しているといった感覚を生じさせ、これにより遠隔地
のオフィスにいるといった疎外感を軽減することの効果
が考えられている。
【0004】ところが、上述のような常時接続する映像
通信に、これまでに普及しているテレビ会議装置や映像
伝送装置、さらにこれらを接続する回線としてISDN
回線やBISDN回線を使用すると、一定量の符号を常
に発生するため通信回線を常に占有することになる。従
って通信コストが高額になるといった問題がある。
【0005】
【課題を解決するための手段】そこで本発明では、通信
コストの上昇を抑制しつつ作業効率の向上が図れる臨場
感映像通信装置を提供するため、会話の開始と終了を検
出するための音声信号解析手段と、画像符号化特性を動
画と準動画に切替えられる映像符号化手段と、画像符号
化方式に応じて接続する回線を選択する回線接続手段と
を設ける。
【0006】
【作用】上記に示した画像符号化手段は、符号発生量は
多いが高精細で動きの滑らかな動画信号を発生するモー
ドと、動きに対しては追従性は劣るが符号発生量の少な
い符号化モードを備える。音声解析手段は、ユーザの発
する音声信号の内容を理解して、必要に応じて符号化特
性を切替える。例えば、映像表示画面の前に位置するユ
ーザが臨場感のある会話を行う場合、すなわち、高精細
動画モードを必要とする場合は、そのユーザが発生する
音声として、「もしもし」,「おーい」などといった言
葉を検出し、動画対応の符号化を行うように符号化装置
を制御する。この認識装置は、同時に使用する回線を選
択し、完全動画モードでは発生する大量のデータを伝送
可能な回線に接続するように動作する。一方、会話を終
了する際は、会話終了のキーとなる語を検出し、符号化
特性を準動画(符号発生量の少ないモード)となるよう
に制御する。これにより、会話時は動きの滑らかで臨場
感の高い映像通信が可能となり、また会話のない時は低
コストの映像通信が行える。
【0007】
【実施例】図1は本発明による映像通信装置の構成を示
したブロック図である。本装置は、音声入力装置1,撮
像装置2,画像表示装置3,音声解析装置4,音声符号
化装置5,画像符号化装置6,マルチプレクサ9,1
0、および回線接続装置11から構成される。この映像
通信装置は、通信ネットワークを介して遠方にある他の
通信装置と接続されている。なお本発明の装置は大容量
と少容量のデータを発生する画像符号化装置を備えてい
るため、図1の実施例ではそれぞれの容量に対応した二
系統のネットワークを使用することを前提に図を描いて
ある。もちろん回線容量が可変なネットワークでは、一
つの回線に異なるデータ量をもつ信号を接続できるの
で、二つの異なるネットワークに接続する必要がないこ
とは容易に理解できる。なお、この二系統のデータ発生
方法については後述する。
【0008】次に図1の装置の動作を説明する。図1の
映像通信装置は、撮像装置2で得た映像信号を画像符号
化装置6により符号化・圧縮する。映像と同時に収録さ
れた音声信号は音声符号化装置5により符号化し、マル
チプレクサ9,10により映像信号と合成する。音声信
号は、同時に音声解析装置4にも入力しておく。なおこ
の音声解析装置の動作についても後述する。
【0009】回線接続装置11はこの映像通信装置をネ
ットワークに接続するもので、先に述べた映像・音声信
号はネットワークを介して相手の映像通信装置へと送出
される。図1の実施例が、従来の映像通信装置と異なる
点は、画像符号化装置が二種類の異なるデータレートの
画像符号化装置を有し、発生するデータ量を状況に応じ
て制御する点である。データレートの異なる画像符号化
装置として、ここでは動画符号化装置7と準動画符号化
装置8を含む構成として記してある。すなわち、動画符
号化装置7は、駒落しすることなく動きの滑らかな映像
を再生するための符号化装置である。従って動画符号化
装置は、毎秒に符号化する映像フレーム数が多くなる。
そのため、必然的に生成データ量は多くなる。一方、準
動画符号化装置8は、駒落しを行うことでデータ発生量
の少ない画像符号化を行う装置である。この二系統の符
号化装置のいずれを使用するかの制御は音声解析装置4
が行う。この音声解析装置4は、同時に回線接続装置1
1も制御し、この二種類の装置を制御することで、回線
に送出する映像・音声データの量を制御する。
【0010】次に、この音声解析装置の動作を詳細に説
明する。音声解析装置4は、音声入力装置1からの音声
信号を解析し、会話の開始/終了を検出する。会話を開
始するなど、臨場感の高い動画符号化に対する要求があ
る場合は、動画像符号化装置7により符号化を行い、ま
た要求が無い場合は準動画による符号化を行うように画
像符号化装置6を制御する。またこの時、同時に回線接
続装置11をも制御し、発生符号量に応じた回線に接続
するように動作する。
【0011】図2は音声解析装置4の構成を詳細に示し
たブロック図である。本音声解析装置は音声照合装置2
1と登録語データベース22から構成する。この登録語
データベース22には動画モードを開始するためのキー
ワードを登録した動画開始予約語データベース22(図
中には動画開始予約語と記載)と動画モードを終了する
ためのキーワードを登録した動画終了予約語データベー
ス23(図中には動画終了予約語と記載)を備えてい
る。
【0012】信号入力端子20に入力された音声信号は
音声照合装置21に入力する。この音声信号は音声認識
によりその言葉を解釈する。この言葉(以後、語と記
す)は、動画開始予約語データベース23の予約語、動
画終了予約語データベースの予約語と照合する。
【0013】動画開始の予約語は、例えば「もしも
し」,「おーい」といった呼掛けの言葉や、その他、シ
ステムを使用する人名や、その人名に「さん」や肩書を
付加したものである。すなわち、会話を開始するために
通常良く使用する言葉である。このような語を動画モー
ドの開始予約語として登録しておき、この語を検出した
時点で会話状態フラグを会話に設定し、動画による符号
化を開始させる。
【0014】一方、動画終了予約語は、例えば、「さよ
なら」,「じゃー」,「では」,「ばいばい」といった
通常会話を終りにする際に使用する語である。このよう
な会話を終了する時に使用する語を登録しておき、この
語により会話終了を検出することで動画符合化モードを
終了して準動画モードへと移行するようなフラグ信号を
発生する。
【0015】このように会話の開始語と、会話の終了語
を用いて符号化モードを切替えることの効果を次に説明
する。通常、オフィスを映像で結んだ際には、会話が発
生していない時に動画を表示することと、駒数を減じた
準動画を表示することの差は少なく、動画を伝送してお
くことは回線コストがかかるが得られる効果は少ない。
従って、会話の無い時は準動画の伝送で十分である。こ
れに対し、通信相手と会話を行おうとする時に駒数の少
ない準動画では、動きがぎこちなくなり自然な会話が行
えない。そこでこの時は、駒数の豊富な動画信号を使用
するのが好ましい。
【0016】音声解析により得られる効果は、会話の開
始語と終了語の間にある期間を会話期間と解釈し、この
間は高画質な動画符号化により臨場感ある会話環境をサ
ポートし、それ以外の期間は低コストな映像伝送に切替
える制御を可能とする。
【0017】図3は画像符号化装置の変形例を表す図で
ある。図1の実施例では、動画符号化装置7と準動画符
号化装置8の二系統の符号化装置を用い、これらを音声
解析の結果に応じて切替えて使用する構成であったが、
図3の変形例では、可変符号化装置により動的に符号発
生量を制御するような構成にしてある。この構成によれ
ば、符号化器を二系統持つ必要がなくなり、回路規模の
削減が図れる。この可変符号化装置は、画像符号化装置
31、符号化レート制御装置32、レート監視装置33
から構成する。レート監視装置33は、音声解析装置4
の解析結果に応じて、発生する符号量を決定する。先に
も述べたように音声解析装置4は符号生成量を制御する
が、それには、レート監視装置33に対して会話開始/
終了を指示する会話状態フラグ入力して制御する。
【0018】図4は、図1の実施例の変形を表す図であ
る。図1の実施例と図4の実施例の大きく異なる点は画
像解析装置40を設けた点である。この画像解析装置4
0によって画像符号化装置43、および回線接続装置4
1を制御する点が新規な点である。図3の画像解析装置
40を設けた目的は、音声認識装置4を用いるのと同様
であり、会話の開始/終了を検出するためである。その
ため、画像解析装置は撮像した映像の中から、会話の開
始を意味する動作(以下、ジェスチャと記す)を検出
し、このジェスチャに基づいて画像符号化装置43と回
線接続装置41を制御する。制御方法は先ほどの音声解
析の場合と同様に、会話期間は高画質の動画を伝送する
ように、また会話の終了以後は符号量の少ない準動画を
伝送するように制御する。
【0019】図5は画像解析装置40の構成を示した実
施例である。画像解析装置40は画像照合装置52とジ
ェスチャデータベース52から構成する。このジェスチ
ャデータベース52は動画開始予約データベース53と
動画終了データベース54からなる。この動画開始予約
データベースには、会話の開始を意味するジェスチャと
して、「手を振る」,「画面を見つめる」,「指で指
す」,「手招きをする」などの動作を登録しておく。こ
のように登録したジェスチャにより会話の開始を検出
し、会話が始まった場合には会話の開始を表すフラグ信
号を発生する。また、動画終了予約ジェスチャには、
「手を振る」,「背を向ける」などのジェスチャを登録
しておき、このようなジェスチャを認識した時に会話の
終了を表す終了フラグを発生する。
【0020】なお、ジェスチャの照合方式は本発明の趣
旨とは直接関係ないので、ここでの詳細な説明は省略す
るが、例えば「手を振る」動作を認識するには、手の形
のテンプレートをデータベースに用意しておき、このテ
ンプレートとのパターンマッチングにより手を認識し、
さらにこの手の動きベクトルを検査することで、「手を
振る」といった動作が解析できる。なお、この説明はジ
ェスチャ認識のほんの一例であり、どのような認識方法
であっても本発明の趣旨が満足されることは容易に理解
できる。
【0021】また、図5の実施例では、会話の開始と終
了と共に「手を振る」動作が含まれているが、これはト
グル操作の意味であり、始めに「手を振る」動作が会話
の開始、次の「手を振る」動作が会話の終了といったよ
うに解釈すればよい。
【0022】さらに、本装置による使い勝手を向上させ
るために、図2の音声解析装置のキーワードや、図5の
画像解析装置のキーとなるジェスチャはユーザが登録可
能な構成にしておくことが好ましい。すなわち、通常良
く使用する言葉やジェスチャを必要に応じて登録するこ
とで、会話の開始/終了の照合をより確実とすることが
可能となる。
【0023】本実施例によれば音声信号、あるいは表示
画面の前に立った人物のジェスチャを解析することで会
話の始めと終りを検出し、会話が行われている期間だけ
画像符号化装置を高画質な動画モードで動作させる。一
方、会話の行われていない期間は、駒数を減じてデータ
発生量の少ない準動画符号化とする。
【0024】
【発明の効果】本発明によれば、ユーザが画面に写った
相手オフィスの映像に呼掛けを行なった時だけコストの
かかる伝送路を使用し、その他の場合には通信コストの
低い回線を使用する。その結果として会話の時の臨場感
を確保しつつ、通信コストの少ない映像通信が可能とな
る。
【図面の簡単な説明】
【図1】本発明による映像通信装置のブロック図。
【図2】音声解析装置のブロック図。
【図3】映像符合化装置の変形例のブロック図。
【図4】ジェスチャ解析装置を含む映像通信装置のブロ
ック図。
【図5】ジェスチャ解析装置のブロック図。
【符号の説明】
1…音声入力装置、2…撮像装置、3…表示装置、4…
音声解析装置、5…音声符号化装置、6…画像符号化装
置、7…動画符号化装置、8…準動画符号化装置、9、
10…マルチプレクサ、11、14…回線接続装置、1
2…高速ネットワーク、13…低速ネットワーク、15
…対向サイト。
───────────────────────────────────────────────────── フロントページの続き (72)発明者 木下 泰三 東京都国分寺市東恋ケ窪1丁目280番地 株式会社日立製作所中央研究所内

Claims (9)

    【特許請求の範囲】
  1. 【請求項1】映像入力手段と、映像表示手段と、映像符
    号化伝送手段とを含む映像通信装置をネットワークで接
    続して映像通信を行う装置において、音声入力手段と、
    前記音声入力手段により入力した音声信号を解析する手
    段と、前記音声信号の解析手段によって制御される映像
    符号化手段を備えたことを特徴とする映像通信装置。
  2. 【請求項2】映像入力手段と、映像表示手段と、映像符
    号化伝送手段とを含む映像通信装置をネットワークに接
    続して映像通信を行う装置において、画像解析手段と、
    前記画像解析手段により解析した画像信号の特徴に応じ
    て符号生成量が制御される画像符号化手段とを備えたこ
    とを特徴とする映像通信装置。
  3. 【請求項3】映像入力手段と、映像表示手段と、映像符
    号化伝送手段とを含む映像通信装置をネットワークに接
    続して映像通信を行う装置において、音声解析手段と、
    画像解析手段と、前記音声解析手段と前記画像解析手段
    とによって符号生成量を制御される画像符号化手段とを
    備えたことを特徴とする映像通信装置。
  4. 【請求項4】請求項1において、前記音声信号を解析す
    る手段が認識する音声信号は、「もしもし」,「おー
    い」,「すみません」,「誰かいませんか」,「応答し
    て下さい」,「やあ」,「さよなら」,「ばいばい」,
    「ではまた」,「じゃー」からなる呼掛けに使用する言
    葉である映像通信装置。
  5. 【請求項5】請求項1において、前記音声信号を解析す
    る手段が認識する音声信号は、前記映像通信装置の使用
    者の姓、もしくは名、もしくは姓名、もしくは前記姓名
    にさん付けしたもの、もしくは役職名を付加したもので
    ある映像通信装置。
  6. 【請求項6】請求項1において、前記映像信号を解析す
    る手段が解析する画像信号が人間の動作である映像通信
    装置。
  7. 【請求項7】請求項6において、前記人間の動作が「手
    を振る」,「指を指す」,「画面を見つめる」,「背を
    向ける」である映像通信装置。
  8. 【請求項8】請求項1において、解析すべき前記音声信
    号を登録可能な映像通信装置。
  9. 【請求項9】請求項2において、解析すべき前記映像信
    号の特徴を登録可能な映像通信装置。
JP6008133A 1994-01-28 1994-01-28 映像通信装置 Pending JPH07222129A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP6008133A JPH07222129A (ja) 1994-01-28 1994-01-28 映像通信装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP6008133A JPH07222129A (ja) 1994-01-28 1994-01-28 映像通信装置

Publications (1)

Publication Number Publication Date
JPH07222129A true JPH07222129A (ja) 1995-08-18

Family

ID=11684797

Family Applications (1)

Application Number Title Priority Date Filing Date
JP6008133A Pending JPH07222129A (ja) 1994-01-28 1994-01-28 映像通信装置

Country Status (1)

Country Link
JP (1) JPH07222129A (ja)

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP1732323A1 (en) * 2004-03-25 2006-12-13 NEC Corporation Multi-point conference system and multi-point conference device
JP2009177759A (ja) * 2008-01-24 2009-08-06 Yasuhiro Tsunemitsu 空間接続窓装置システム
JP2013037688A (ja) * 2011-08-05 2013-02-21 Samsung Electronics Co Ltd 電子装置及びその制御方法
JP2015531197A (ja) * 2012-08-03 2015-10-29 アルカテル−ルーセント ビデオ会議中の参加者の映像ミュートを可能にするための方法および装置

Cited By (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP1732323A1 (en) * 2004-03-25 2006-12-13 NEC Corporation Multi-point conference system and multi-point conference device
EP1732323A4 (en) * 2004-03-25 2007-06-06 Nec Corp MULTIPOINT CONFERENCE SYSTEM AND MULTIPOINT CONFERENCE DEVICE
US7667729B2 (en) 2004-03-25 2010-02-23 Nec Corporation Multi-point conference system and multi-point conference device
JP2009177759A (ja) * 2008-01-24 2009-08-06 Yasuhiro Tsunemitsu 空間接続窓装置システム
JP2013037688A (ja) * 2011-08-05 2013-02-21 Samsung Electronics Co Ltd 電子装置及びその制御方法
JP2015531197A (ja) * 2012-08-03 2015-10-29 アルカテル−ルーセント ビデオ会議中の参加者の映像ミュートを可能にするための方法および装置

Similar Documents

Publication Publication Date Title
US8593505B2 (en) Videcoconferencing method and system for connecting a host with a plurality of participants
US7508413B2 (en) Video conference data transmission device and data transmission method adapted for small display of mobile terminals
KR100790619B1 (ko) 통신 제어 장치, 통신 장치, 통신 시스템 및 그 방법
US5061992A (en) Tv phone communication system and apparatus therefor
US20060001737A1 (en) Video conference arrangement
JPH07222129A (ja) 映像通信装置
CN207802173U (zh) 一种视联网设备
JP2932027B2 (ja) テレビ電話装置
JPH07298235A (ja) テレビ会議装置及びそのポインティングカーソル表示制御方法
JP3787568B2 (ja) 表示制御装置及び表示制御方法
JPH099230A (ja) 解像度制御装置
KR20060088579A (ko) 이동통신 단말기에서 화면을 분할하여 선택영역을확대하기 위한 방법
JPH08251566A (ja) テレビ会議装置
JPH098938A (ja) 発呼者識別デコーディング特性を含む対話型マルチメディア装置
JPH06189301A (ja) 映像伝送処理装置
JPH09179907A (ja) 遠隔窓口システムの運用方法
JP3589702B2 (ja) 通信端末装置
AU677052B2 (en) Videoconference system
JPH05328337A (ja) 画像通信端末装置
KR100238491B1 (ko) 동화상전화기의자기영상표시방법
JP3032602B2 (ja) 通信システム
JPH07123390A (ja) テレビ会議システムおよび画像入力装置のための制御装置
JPH11275267A (ja) Isdn情報提供システムならびに情報端末装置
CN115209212A (zh) 一种***芯片、电子设备及电子设备的投屏方法
JP2004320796A (ja) 通信端末装置