JP3033622B2 - TV conference system - Google Patents

TV conference system

Info

Publication number
JP3033622B2
JP3033622B2 JP3313432A JP31343291A JP3033622B2 JP 3033622 B2 JP3033622 B2 JP 3033622B2 JP 3313432 A JP3313432 A JP 3313432A JP 31343291 A JP31343291 A JP 31343291A JP 3033622 B2 JP3033622 B2 JP 3033622B2
Authority
JP
Japan
Prior art keywords
encoding
image
speaker
types
signal
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Lifetime
Application number
JP3313432A
Other languages
Japanese (ja)
Other versions
JPH05130603A (en
Inventor
幸男 遠藤
貞晴 平塚
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
NEC Corp
Original Assignee
NEC Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by NEC Corp filed Critical NEC Corp
Priority to JP3313432A priority Critical patent/JP3033622B2/en
Publication of JPH05130603A publication Critical patent/JPH05130603A/en
Application granted granted Critical
Publication of JP3033622B2 publication Critical patent/JP3033622B2/en
Anticipated expiration legal-status Critical
Expired - Lifetime legal-status Critical Current

Links

Landscapes

  • Interconnected Communication Systems, Intercoms, And Interphones (AREA)
  • Two-Way Televisions, Distribution Of Moving Picture Or The Like (AREA)

Description

【発明の詳細な説明】DETAILED DESCRIPTION OF THE INVENTION

【0001】[0001]

【技術分野】本発明はTV会議システムに関し、特に会
議者をテレビカメラで撮影してこの撮影画像を高能率符
号化して低ビットレートで伝送する画像符号化伝送装置
を有するTV会議システムに関する。
BACKGROUND OF THE INVENTION 1. Field of the Invention The present invention relates to a TV conference system, and more particularly, to a TV conference system having an image encoding and transmitting apparatus for photographing a conferee with a television camera, encoding the photographed image with high efficiency, and transmitting the image at a low bit rate.

【0002】[0002]

【従来技術】従来のTV会議システムに使用される画像
符号化伝送装置は、画像信号を高能率符号化する場合
に、画像の動きや絵柄によって発生する情報量の大小に
応じて複数種類用意された量子化器等による符号化パラ
メータを、画像信号の1フレーム(1画面)単位に適応
的に切替える方式となっている。
2. Description of the Related Art A plurality of types of image encoding transmission devices used in a conventional TV conference system are prepared according to the amount of information generated by the movement or picture of an image when encoding an image signal with high efficiency. In this method, the encoding parameters by the quantizer and the like are adaptively switched in units of one frame (one screen) of the image signal.

【0003】この様な従来の方式では、会議中の参加者
が激しく動いたり、また会議室の照明や色彩等によって
発生する情報量が多くなると、逆に情報量の発生を抑え
るように量子化が粗い情報量の少ない量子化器に切替わ
るようになっている。
In such a conventional method, when a participant in a conference moves violently, or when the amount of information generated by the illumination or color of the conference room increases, the quantization is performed so as to suppress the generation of the amount of information. Is switched to a quantizer with a small amount of information.

【0004】そのために、テレビモニタ上の画像は量子
化雑音が増加し、ジャーキネス、はりつき、偽輪郭等の
劣化が目立ち、発言者を鮮明な画像でテレビモニタ上に
写し出すことができないという欠点を有している。
[0004] For this reason, the image on the television monitor has the disadvantage that the quantization noise increases, deterioration of jerkiness, sticking, false contours and the like is conspicuous, and the speaker cannot be displayed on the television monitor in a clear image. doing.

【0005】[0005]

【発明の目的】本発明の目的は、発言者をテレビモニタ
上で常に鮮明に写し出すことが可能なTV会議システム
を提供することである。
SUMMARY OF THE INVENTION It is an object of the present invention to provide a TV conference system in which a speaker can always be clearly displayed on a television monitor.

【0006】[0006]

【発明の構成】本発明によるTV会議システムは、N個
のマイクロホンと、これ等各マイクロホンを使用する会
議者の各全景を撮影するテレビカメラと、前記マイクロ
ホンの各出力により現在の話者を検出する話者検出手段
と、前記テレビカメラによる画像出力を入力として複数
種類の符号化パラメータを出力する高能率符号化手段
と、前記画像出力の走査線の時間軸をN分割してN人の
会議者に夫々割当てたとき外部制御信号に応じて前記複
数種類の符号化パラメータを夫々選択してN分割された
時間軸領域に挿入する手段と、前記話者検出手段により
検出された会議者に対応する時間軸領域に対して、前記
複数種類の符号化パラメータのうち最も鮮明に画像がモ
ニタに写し出されるような符号化パラメータを挿入指示
するための前記外部制御信号を発生する手段とを含むこ
とを特徴とする。
A TV conference system according to the present invention detects N speakers, a television camera for photographing the whole view of a conferee using these microphones, and a current speaker based on each output of the microphones. Speaker detection means, high-efficiency coding means for outputting a plurality of types of coding parameters with an image output from the television camera as an input, and a conference of N persons by dividing the time axis of the scan line of the image output into N parts. Means for selecting each of the plurality of types of coding parameters in accordance with an external control signal when each is assigned to a speaker, and inserting the selected coding parameters into N-divided time axis regions, and corresponding to the conferee detected by the speaker detecting means. The external parameter for instructing insertion of a coding parameter such that an image is most clearly displayed on the monitor among the plurality of types of coding parameters for the time axis region Characterized in that it comprises a means for generating a control signal.

【0007】[0007]

【実施例】本発明の実施例について図面を参照して説明
する。
Embodiments of the present invention will be described with reference to the drawings.

【0008】図1は本発明の一実施例を示すブロック図
であり、図2は図1の予測符号化回路62の詳細ブロッ
ク図である。本実施例では、説明の簡略化を図るために
マイクロホンの数Nを3として説明するが、N=3に限
定されるものではない。
FIG. 1 is a block diagram showing one embodiment of the present invention, and FIG. 2 is a detailed block diagram of the predictive encoding circuit 62 of FIG. In the present embodiment, the number N of microphones will be described as 3 in order to simplify the description, but the number is not limited to N = 3.

【0009】図1においてマイクロホン1〜3から出力
する音声信号は話者検出回路4へ入力される。話者検出
回路4は検出制御情報aを画像符号化伝送装置6へ出力
する。
In FIG. 1, audio signals output from the microphones 1 to 3 are input to a speaker detection circuit 4. The speaker detection circuit 4 outputs the detection control information a to the image encoding and transmitting device 6.

【0010】テレビカメラ5はアナログ画像信号を画像
符号化伝送装置6へ出力する。画像符号化伝送装置6の
A/D変換器61ではテレビカメラ5からのアナログ画
像信号を入力とし、ディジタル画像信号cに変換して予
測符号化回路62へ出力する。
[0010] The television camera 5 outputs an analog image signal to the image encoding transmission device 6. The A / D converter 61 of the image encoding and transmitting apparatus 6 receives the analog image signal from the television camera 5 as input, converts it into a digital image signal c, and outputs it to the predictive encoding circuit 62.

【0011】また、制御回路64では話者検出回路4か
らの検出制御情報aを入力とし、領域指定信号bを予測
符号化回路62へ出力する。予測符号化回路62では高
能率符号化されたデータをバッファメモリ63へ出力す
る。バッファメモリ63では符号化データを一旦記憶し
た後、一定の伝送速度で出力端子7へ送出すると共に、
バッファメモリ占有量dを予測符号化回路62へ出力す
る。
The control circuit 64 receives the detection control information a from the speaker detection circuit 4 and outputs a region designation signal b to the predictive encoding circuit 62. The predictive encoding circuit 62 outputs the highly efficient encoded data to the buffer memory 63. The buffer memory 63 temporarily stores the encoded data, and then sends the encoded data to the output terminal 7 at a constant transmission rate.
The buffer memory occupation amount d is output to the prediction encoding circuit 62.

【0012】次に、動作について説明する。マイクロホ
ン1〜3からの音声信号は話者検出回路4へ入力され、
音声信号の各レベルから音声信号の有無を検出し、有と
検出した中のレベルの高いものから例えば2つ以下の音
声信号を選択し、その2つ以下の音声信号に対応する検
出制御情報aを画像符号化伝送装置6の制御回路64へ
出力する。
Next, the operation will be described. Voice signals from the microphones 1 to 3 are input to the speaker detection circuit 4,
The presence or absence of an audio signal is detected from each level of the audio signal, and, for example, two or less audio signals are selected from among the high-level ones detected as being present, and detection control information a corresponding to the two or less audio signals is selected. Is output to the control circuit 64 of the image encoding / transmission apparatus 6.

【0013】テレビカメラ5はマイクロホン1〜3を使
用する会議者(3名)の全景を撮影してアナログ画像信
号を画像符号化伝送装置6のA/D変換器61へ出力す
る。この時、テレビカメラ5の設定は3名の会議者が、
図3に示す如くテレビモニタ上を水平方向に3分割した
領域に夫々写し出されるように設定する。
The television camera 5 captures the whole view of the conferees (three persons) using the microphones 1 to 3 and outputs an analog image signal to the A / D converter 61 of the image encoding and transmitting apparatus 6. At this time, the setting of the TV camera 5 is performed by three conferees.
As shown in FIG. 3, the setting is made such that the image is respectively projected on a region divided into three in the horizontal direction on the television monitor.

【0014】A/D変換器61ではアナログ画像信号を
ディジタル画像信号cに変換して予測符号化回路62へ
出力する。予測符号化回路62ではディジタル画像信号
cの走査線の時間軸上を3分割した領域のうち領域指定
信号bにより指定された領域に予め定められた符号化パ
ラメータを割当てると同時に、指定されない領域にはバ
ッファメモリ63からのバッファメモリ占有量dに応じ
て符号化パラメータが切替えられ、符号化データをバッ
ファメモリ63へ出力する。
An A / D converter 61 converts an analog image signal into a digital image signal c and outputs the digital image signal c to a predictive encoding circuit 62. The predictive coding circuit 62 assigns a predetermined coding parameter to a region specified by the region specifying signal b among the three regions on the time axis of the scanning line of the digital image signal c, and simultaneously assigns a predetermined coding parameter to a region not specified. The encoding parameter is switched according to the buffer memory occupation amount d from the buffer memory 63, and the encoded data is output to the buffer memory 63.

【0015】図2は予測符号化回路62の詳細ブロック
図である。ディジタル画像信号cは減算器621 へ入力さ
れる。減算器621 ではフレーム間予測誤差が計算され、
複数の量子化器622 〜624 へ接続される。量子化器622
〜624 では各々の量子化特性で量子化され選択器625 へ
出力される。
FIG. 2 is a detailed block diagram of the predictive encoding circuit 62. The digital image signal c is input to the subtractor 621. The subtractor 621 calculates the inter-frame prediction error,
It is connected to a plurality of quantizers 622-624. Quantizer 622
At 624 624, they are quantized by the respective quantization characteristics and output to the selector 625.

【0016】本例では、量子化器622 〜624 は量子化の
細かいものから粗いもの(Q1〜Q3)までの3種の量
子化器を用意しており、選択器625 では領域指定信号b
により指定される符号化領域に量子化器622 〜624 の3
種の出力のうち量子化の細かい量子化器622 の出力が選
択され、他の符号化領域にはバッファメモリ占有量dに
応じて量子化器622 〜624 の何れかの出力が選択されバ
ッファメモリ63へ出力される。この時、各符号化領域
には量子化器の選択番号が付加される。
In this embodiment, the quantizers 622 to 624 are provided with three types of quantizers, from fine to coarse (Q1 to Q3).
In the coding area specified by
The output of the quantizer 622 with the fine quantization is selected from among the kinds of outputs, and any of the outputs of the quantizers 622 to 624 is selected in the other coding area according to the buffer memory occupation amount d. 63. At this time, a selection number of a quantizer is added to each coding region.

【0017】また、選択器625 の出力は加算器626 へ接
続され、加算器626 ではフレームメモリ627 からのフレ
ーム間予測値を加え局部復号信号を得る。加算器626 に
より得られた局部復号信号はフレームメモリ627 へ入力
され、1フレーム分遅延されて次のフレームの予測値と
して減算器621 へ出力される。
The output of the selector 625 is connected to an adder 626. The adder 626 adds the inter-frame prediction value from the frame memory 627 to obtain a local decoded signal. The local decoded signal obtained by the adder 626 is input to the frame memory 627, delayed by one frame, and output to the subtractor 621 as a predicted value of the next frame.

【0018】図3は検出制御情報aと領域指定信号bと
の関係を、また領域指定信号bにより選択される量子化
器(Q1)に対応したテレビモニタ上に写る画像の領域
を示した図である。
FIG. 3 is a diagram showing the relationship between the detection control information a and the region designation signal b, and the region of the image shown on the television monitor corresponding to the quantizer (Q1) selected by the region designation signal b. It is.

【0019】ここで、会議に参加しているA者、B者、
C者の3者の中でB者が発言したと仮定すると、B者に
対応した検出制御情報aのみがHレベルとなり他はLレ
ベルとなる。領域指定信号bは予め設定されたテレビモ
ニタ上の発言者の写る領域に量子化器(Q1)を選択す
る信号となり、領域指定信号bを1走査線でみた場合、
0の区間は細かい量子化特性(Q1)を有する量子化器
622 が選択され、1の区間はバッファメモリ占有量に応
じて量子化器622 〜624 の何れかが選択されることにな
る。
Here, A person, B person participating in the conference,
Assuming that the person B among the three persons C speaks, only the detection control information a corresponding to the person B is at the H level and the others are at the L level. The area specifying signal b is a signal for selecting the quantizer (Q1) in a predetermined area on the television monitor where the speaker appears, and when the area specifying signal b is viewed by one scanning line,
In the interval of 0, a quantizer having fine quantization characteristics (Q1)
622 is selected, and in one section, one of the quantizers 622 to 624 is selected according to the buffer memory occupancy.

【0020】[0020]

【発明の効果】以上説明したように本発明は、会議の発
言者の音声を検出して、その発言者がテレビモニタ上に
写る画像の領域に対応した画像信号を符号化する符号化
パラメータを選択して伝送することを可能としたため、
発言者を鮮明な画像でテレビモニタ上に写し出すことが
できる効果がある。
As described above, according to the present invention, the speech parameters of the speaker of a conference are detected, and the encoding parameters for encoding an image signal corresponding to the area of the image displayed on the television monitor by the speaker are determined. Because it is possible to select and transmit
There is an effect that the speaker can be displayed on the television monitor in a clear image.

【図面の簡単な説明】[Brief description of the drawings]

【図1】本発明の実施例のシステムブロック図である。FIG. 1 is a system block diagram of an embodiment of the present invention.

【図2】図1の予測符号化回路6の具体例を示すブロッ
ク図である。
FIG. 2 is a block diagram showing a specific example of a predictive coding circuit 6 in FIG.

【図3】本発明の実施例における各部信号波形例と、そ
れに対応してテレビモニタ上に写る画像の領域を示した
図である。
FIG. 3 is a diagram showing an example of a signal waveform of each part in the embodiment of the present invention, and a corresponding area of an image displayed on a television monitor.

【符号の説明】[Explanation of symbols]

1〜3 マイクロホン 4 話者検出回路 5 テレビカメラ 6 画像符号化伝送装置 61 A/D変換器 62 予測符号化回路 63 バッファメモリ 64 制御回路 622 〜624 量子化器 625 選択器 1-3 microphone 4 speaker detection circuit 5 television camera 6 image coding / transmission device 61 A / D converter 62 predictive coding circuit 63 buffer memory 64 control circuit 622-624 quantizer 625 selector

フロントページの続き (56)参考文献 特開 平2−117290(JP,A) 特開 平2−44885(JP,A) 特開 平1−141479(JP,A) 特開 平1−221989(JP,A) 特開 平4−22273(JP,A) 特開 昭52−55815(JP,A) (58)調査した分野(Int.Cl.7,DB名) H04N 7/10 H04N 7/14 - 7/173 H04N 7/20 - 7/22 Continuation of front page (56) References JP-A-2-117290 (JP, A) JP-A-2-44885 (JP, A) JP-A-1-141479 (JP, A) JP-A 1-2221989 (JP) , A) JP-A-4-22273 (JP, A) JP-A-52-55815 (JP, A) (58) Fields investigated (Int. Cl. 7 , DB name) H04N 7/10 H04N 7/ 14- 7/173 H04N 7/20-7/22

Claims (1)

(57)【特許請求の範囲】(57) [Claims] 【請求項1】 N個のマイクロホンと、これ等各マイク
ロホンを使用する会議者の各全景を撮影するテレビカメ
ラと、前記マイクロホンの各出力により現在の話者を検
出する話者検出手段と、前記テレビカメラによる画像出
力を入力として複数種類の符号化パラメータを出力する
高能率符号化手段と、前記画像出力の走査線の時間軸を
N分割してN人の会議者に夫々割当てたとき外部制御信
号に応じて前記複数種類の符号化パラメータを夫々選択
してN分割された時間軸領域に挿入する手段と、前記話
者検出手段により検出された会議者に対応する時間軸領
域に対して、前記複数種類の符号化パラメータのうち最
も鮮明に画像がモニタに写し出されるような符号化パラ
メータを挿入指示するための前記外部制御信号を発生す
る手段とを含むことを特徴とするTV会議システム。
An N microphone, a television camera for photographing a whole view of a conferee using each of the microphones, speaker detecting means for detecting a current speaker based on each output of the microphone, High-efficiency encoding means for outputting a plurality of types of encoding parameters with an image output from a television camera as input, and external control when a time axis of the image output scan line is divided into N and assigned to N conferees, respectively. Means for selecting the plurality of types of encoding parameters in accordance with the signals and inserting the selected parameters into the N-divided time-axis area, and a time-axis area corresponding to the conferees detected by the speaker detection means, Means for generating the external control signal for instructing insertion of an encoding parameter such that an image is most clearly displayed on the monitor among the plurality of types of encoding parameters. TV conference system characterized by the above-mentioned.
JP3313432A 1991-10-31 1991-10-31 TV conference system Expired - Lifetime JP3033622B2 (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP3313432A JP3033622B2 (en) 1991-10-31 1991-10-31 TV conference system

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP3313432A JP3033622B2 (en) 1991-10-31 1991-10-31 TV conference system

Publications (2)

Publication Number Publication Date
JPH05130603A JPH05130603A (en) 1993-05-25
JP3033622B2 true JP3033622B2 (en) 2000-04-17

Family

ID=18041227

Family Applications (1)

Application Number Title Priority Date Filing Date
JP3313432A Expired - Lifetime JP3033622B2 (en) 1991-10-31 1991-10-31 TV conference system

Country Status (1)

Country Link
JP (1) JP3033622B2 (en)

Families Citing this family (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5512939A (en) * 1994-04-06 1996-04-30 At&T Corp. Low bit rate audio-visual communication system having integrated perceptual speech and video coding
JP3086396B2 (en) * 1995-03-10 2000-09-11 シャープ株式会社 Image encoding device and image decoding device
US6473114B1 (en) * 2000-04-14 2002-10-29 Koninklijke Philips Electronics N.V. Method and system for indicating change of speaker in a videoconference application
US7130446B2 (en) * 2001-12-03 2006-10-31 Microsoft Corporation Automatic detection and tracking of multiple individuals using multiple cues
KR100709682B1 (en) * 2004-12-31 2007-04-19 네오뷰코오롱 주식회사 Blue luminescent organic compound and organic light-emitting diode including the same
JP5978878B2 (en) * 2012-09-18 2016-08-24 株式会社リコー Conference terminal, conference system

Also Published As

Publication number Publication date
JPH05130603A (en) 1993-05-25

Similar Documents

Publication Publication Date Title
US5335013A (en) Method and apparatus for video camera image film simulation
JP2005521340A5 (en)
JP7334470B2 (en) VIDEO PROCESSING DEVICE, VIDEO CONFERENCE SYSTEM, VIDEO PROCESSING METHOD, AND PROGRAM
JP3033622B2 (en) TV conference system
JP3526057B2 (en) Video transmission equipment
US20190306462A1 (en) Image processing apparatus, videoconference system, image processing method, and recording medium
JP2002176503A (en) Multipoint videoconference controller, voice switching method, and recording medium with recorded program thereof
JP2008005349A (en) Video encoder, video transmission apparatus, video encoding method, and video transmission method
JP2573177B2 (en) Graphic display device in electronic conference system
JP2011055103A (en) Condominium intercom system
JP2730452B2 (en) Video conference system
JPH02241285A (en) Highly efficient encoder for moving image signal
JP2021117981A (en) Image processing apparatus, image processing method, video transmission and reception system, and program
JPH0564184A (en) Screen configuration system for video conference system
JP2833909B2 (en) Video encoding device
JPH0244885A (en) Method and device for picture transmission
JPH0451690A (en) Television conference recording controlling system
US6366324B1 (en) Transmitting sequentially scanned images through a channel intended for interlaced images
JPH06105306A (en) Video conference system
JPH02117290A (en) Picture encoding device
JP2586299B2 (en) Television telephone equipment
JPH05300506A (en) Image/voice communication terminal equipment
JPH0927950A (en) Video scramble method and video scrambler
JPH06121306A (en) Video conference device
JPS62200886A (en) Electronic conference system