JPH024095A - 話者判定装置 - Google Patents
話者判定装置Info
- Publication number
- JPH024095A JPH024095A JP15238588A JP15238588A JPH024095A JP H024095 A JPH024095 A JP H024095A JP 15238588 A JP15238588 A JP 15238588A JP 15238588 A JP15238588 A JP 15238588A JP H024095 A JPH024095 A JP H024095A
- Authority
- JP
- Japan
- Prior art keywords
- speaker
- voice
- talker
- input
- silence
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 238000000034 method Methods 0.000 claims description 6
- 206010019133 Hangover Diseases 0.000 description 4
- 238000007796 conventional method Methods 0.000 description 2
- 238000010586 diagram Methods 0.000 description 2
- 230000000694 effects Effects 0.000 description 2
Abstract
(57)【要約】本公報は電子出願前の出願データであるた
め要約のデータは記録されません。
め要約のデータは記録されません。
Description
【発明の詳細な説明】
(発明の属する技術分野)
本発明は多地点間テレビ会議において複数地点の中から
、音声レベルの検出により、話者対地に自動的に切り換
える話者判定方式に関するものである。
、音声レベルの検出により、話者対地に自動的に切り換
える話者判定方式に関するものである。
(従来の技術)
従来、この種の多地点間映像会議システムにおける話者
判定としては、各地点の音声入力毎に音声検出器に設け
、該音声検出器により有音が無音かの検出を行い、有音
が検出された場合、その有音の継続時間に応じたハング
オーバ時間を有音判定に付加して有音情報として出方し
、このハングオーバ時間についた有音情報を音声入力毎
に設けた話者判定器に入力し、同判定器で一定入方毎に
、このハングオーバ時間についた有音情報に対し、話者
判定しきい値時間によって、話者/非話者を判定してい
た。
判定としては、各地点の音声入力毎に音声検出器に設け
、該音声検出器により有音が無音かの検出を行い、有音
が検出された場合、その有音の継続時間に応じたハング
オーバ時間を有音判定に付加して有音情報として出方し
、このハングオーバ時間についた有音情報を音声入力毎
に設けた話者判定器に入力し、同判定器で一定入方毎に
、このハングオーバ時間についた有音情報に対し、話者
判定しきい値時間によって、話者/非話者を判定してい
た。
この方法では一定時間間隔で話者/非話者の判定を行う
ので、話者/非話者判定開始時刻と有音判定開始時刻が
非同期となり、話者判定に要する時間がばらつく欠点が
ある。また、制御すべき時間パラメータとして有音の継
続時間、ハングオーバ時間、話者判定しきい値時間、一
定時間の話者/非話者判定間隔と制御パラメータの個数
(4個)が多く、回路が複雑になる欠点があった。
ので、話者/非話者判定開始時刻と有音判定開始時刻が
非同期となり、話者判定に要する時間がばらつく欠点が
ある。また、制御すべき時間パラメータとして有音の継
続時間、ハングオーバ時間、話者判定しきい値時間、一
定時間の話者/非話者判定間隔と制御パラメータの個数
(4個)が多く、回路が複雑になる欠点があった。
(発明の目的)
本発明は上述した従来の欠点を解消し、制御するパラメ
ータの個数を従来に比べて半分に減少させて制御回路の
簡単化と制御を容易にすることを目的とする。
ータの個数を従来に比べて半分に減少させて制御回路の
簡単化と制御を容易にすることを目的とする。
(発明の構成)
(発明の特徴と従来技術との差異)
本発明は話者識別画面切替制御のため、有音/無音判定
器と前方、後方保護回路およびセットリセット型フリッ
プフロップにより構成され、前記前方、後方保護回路に
よる話者/非話者判定に要する時間を一定の値として話
者/非話者判定をすることを特徴とする。
器と前方、後方保護回路およびセットリセット型フリッ
プフロップにより構成され、前記前方、後方保護回路に
よる話者/非話者判定に要する時間を一定の値として話
者/非話者判定をすることを特徴とする。
従来技術では一定時間間隔で話者/非話者の判定を行な
い判定に要する時間がばらつくが、本発明は話者/非話
者判定に要する時間を一定の値として判定を安定化した
点が異なる。
い判定に要する時間がばらつくが、本発明は話者/非話
者判定に要する時間を一定の値として判定を安定化した
点が異なる。
(実施例)
図は本発明方式の一実施例の構成ブロック図であり、こ
れは、複数テレビ会議室を映像回路と音声回線で結び多
地点間テレビ会議を行なうシステムにおける話者識別画
面切替制御の構成例である。
れは、複数テレビ会議室を映像回路と音声回線で結び多
地点間テレビ会議を行なうシステムにおける話者識別画
面切替制御の構成例である。
1は音声入力、2は有音/無音判定器、3は有音判定出
力、4は無音判定出力、5は前方保護回路としてのN1
進カウンタ、6は後方保護回路としてのN2進カウンタ
、7はN0進カウンタ出力、8はN2進カウンタ出力、
9はNよ進カウンタ5のリセット入力、10はN2進カ
ウンタ6のリセット入力、11はセット・リセット形フ
リップフロップ13のセット入力、12は同フリップフ
ロップのリセット入力、14は話者判定出力、15は非
話者判定出力である。
力、4は無音判定出力、5は前方保護回路としてのN1
進カウンタ、6は後方保護回路としてのN2進カウンタ
、7はN0進カウンタ出力、8はN2進カウンタ出力、
9はNよ進カウンタ5のリセット入力、10はN2進カ
ウンタ6のリセット入力、11はセット・リセット形フ
リップフロップ13のセット入力、12は同フリップフ
ロップのリセット入力、14は話者判定出力、15は非
話者判定出力である。
これは有音を検出してもただちに話者と判定せずに、有
音回数が一定の値(前方保護段数)を越えた場合に話者
と判定し、一度無音と判定されたらただちに非話者と判
定せず、無音回数が一定の値(後方保護段数)を越えた
時、初めて非話者と判定することが可能となる。以下こ
れについて説明する。
音回数が一定の値(前方保護段数)を越えた場合に話者
と判定し、一度無音と判定されたらただちに非話者と判
定せず、無音回数が一定の値(後方保護段数)を越えた
時、初めて非話者と判定することが可能となる。以下こ
れについて説明する。
いま音声人力1に発言者の音声が入力するものとする。
発言者の音声は有音/無音判定器2において、一定周期
で音声電力を計算し、振幅方向で設定された音声しきい
値レベルによって、有音/無音を判定し、有音であれば
有音判定出力3にII I I+パルス、無音であれば
、無音判定出力4にIt I I+パルスを夫々出力す
る。
で音声電力を計算し、振幅方向で設定された音声しきい
値レベルによって、有音/無音を判定し、有音であれば
有音判定出力3にII I I+パルス、無音であれば
、無音判定出力4にIt I I+パルスを夫々出力す
る。
ここで発言中は、有音判定出力3は、l/ I IIパ
ルスの連続となり、無音判定出力4はこの期間“0”が
連続する。従って、N L aカウンタ5にN1個のi
t 1 +1パルスが入力して初めてカウントオーバし
セットリセット形フリップフロップ13のセット入力端
子11にII 1 +1パルスが入力すると共にN2進
カウンタ6をリセットする。
ルスの連続となり、無音判定出力4はこの期間“0”が
連続する。従って、N L aカウンタ5にN1個のi
t 1 +1パルスが入力して初めてカウントオーバし
セットリセット形フリップフロップ13のセット入力端
子11にII 1 +1パルスが入力すると共にN2進
カウンタ6をリセットする。
一方、無音判定出力4はパ0″′が連続するため、N2
進カウンタ6はカウントアツプ進まず、従ってセットリ
セット形フリップフロップ13のリセット入力端子12
は、110 J+が持続し、話者判定出力14は、′1
”即ち話者出力となる。この過程において音声人力1に
ノイズのように短い音声が入力する場合には、N□進カ
ウンタ5はカウンタ段数に到達しないため、N0進カウ
ンタ5をカウントオーバできない。従って、セット人力
11を“1″にすることができず、話者判定とならない
。
進カウンタ6はカウントアツプ進まず、従ってセットリ
セット形フリップフロップ13のリセット入力端子12
は、110 J+が持続し、話者判定出力14は、′1
”即ち話者出力となる。この過程において音声人力1に
ノイズのように短い音声が入力する場合には、N□進カ
ウンタ5はカウンタ段数に到達しないため、N0進カウ
ンタ5をカウントオーバできない。従って、セット人力
11を“1″にすることができず、話者判定とならない
。
また、一度話者状態になった状態で、無音となると、N
2進カウンタ6に1′113パルスが連続して入力する
ので、N2進カウンタ6はカウントアツプし、その個数
がN2個に到達した時、カウントオーバし、初めてリセ
ット入力12が“1″となり、セットリセット形フリッ
プフロップ13がリセットされ、非話者判定出力15と
なる。従って、無音時間が短い場合にはN2進カウンタ
6はカウントオーバせず、非話者判定とならない。
2進カウンタ6に1′113パルスが連続して入力する
ので、N2進カウンタ6はカウントアツプし、その個数
がN2個に到達した時、カウントオーバし、初めてリセ
ット入力12が“1″となり、セットリセット形フリッ
プフロップ13がリセットされ、非話者判定出力15と
なる。従って、無音時間が短い場合にはN2進カウンタ
6はカウントオーバせず、非話者判定とならない。
(発明の効果)
以上説明したように、本発明によれば、複数地点の画面
切替において、上記話者/無話者判定出力をもとに、単
独の地点から話者が生じた場合には、該当地点に画面を
切替、複数地点から話者が生じた場合あるいは、どの地
点からも話者が生じない場合はそれまで映していた地点
の画面を話者地点画面として、継続表示する方法をとる
話者画面切替力において、前方保護時間(N工)を所定
の値に選ぶことにより、短時間のノイズは話者とならな
いから、他からの短いノイズによる誤切替が生じず、ま
た後方保護時間(Nよ)を所定の値に選ぶことにより、
発言者のいる地点が話者画面として選択されている時に
、その発言者の話の切れ目を非話者と判定しない回路を
実現できる。上述の効果は従来技術で得られる効果と、
同一であるが。
切替において、上記話者/無話者判定出力をもとに、単
独の地点から話者が生じた場合には、該当地点に画面を
切替、複数地点から話者が生じた場合あるいは、どの地
点からも話者が生じない場合はそれまで映していた地点
の画面を話者地点画面として、継続表示する方法をとる
話者画面切替力において、前方保護時間(N工)を所定
の値に選ぶことにより、短時間のノイズは話者とならな
いから、他からの短いノイズによる誤切替が生じず、ま
た後方保護時間(Nよ)を所定の値に選ぶことにより、
発言者のいる地点が話者画面として選択されている時に
、その発言者の話の切れ目を非話者と判定しない回路を
実現できる。上述の効果は従来技術で得られる効果と、
同一であるが。
制御パラメータの個数を従来の4個から有音、無音判定
出力の制御パラメータの2個に減少するので、より簡単
な回路構成となる。
出力の制御パラメータの2個に減少するので、より簡単
な回路構成となる。
図は、本発明の一実施例の構成を示すブロック図である
。 1 ・・・音声入力、2 ・・・有音/無音判定器、3
・・・有音判定出力、 4 ・・・無音判定出力、5
・・・N、進カウンタ(前方保護回路)。 6 ・・・N2進カウンタ(後方保護回路)。 7・・・N1進カウンタ出力、 8 ・・・N2進カウ
ンタ出力、 9 ・・・N1進カウンタリセット入力、
10・・・ N2進カウンタリセット入力、 11・
・・セット・リセット形フリップフロップセット入力、
12・・・セット・リセット形フリップフロップ リセ
ット入力、 13・・・セット・リセット形フリップフ
ロップ、14・・・話者判定出力、15・・・非話者判
定出力。 特許出願人 日本電信電話株式会社
。 1 ・・・音声入力、2 ・・・有音/無音判定器、3
・・・有音判定出力、 4 ・・・無音判定出力、5
・・・N、進カウンタ(前方保護回路)。 6 ・・・N2進カウンタ(後方保護回路)。 7・・・N1進カウンタ出力、 8 ・・・N2進カウ
ンタ出力、 9 ・・・N1進カウンタリセット入力、
10・・・ N2進カウンタリセット入力、 11・
・・セット・リセット形フリップフロップセット入力、
12・・・セット・リセット形フリップフロップ リセ
ット入力、 13・・・セット・リセット形フリップフ
ロップ、14・・・話者判定出力、15・・・非話者判
定出力。 特許出願人 日本電信電話株式会社
Claims (1)
- 複数テレビ会議室を映像回線と音声回線で結び多地点間
テレビ会議を行うシステムにおいて、各地点の音声入力
対応に音声検出器を設けて、該当の音声入力毎に有音、
無音の検出を行い、前記有音情報を多重変換装置で用い
られるフレーム同期回路の前方保護回路に入力し、また
前記無音情報を同じく後方保護回路に入力し、この2つ
の保護回路の出力でフリップフロップを制御することに
より、有音を検出してもただちに話者と判定せずに、有
音情報が一定の値である前方保護段数を越えた場合に話
者と判定し、一度話者と判定したら無音を検出してもた
だちに非話者と判定せず、無音回数が一定の値である後
方保護段数を越えた時、初めて非話者と判定することを
特徴とする多地点間映像会議システムにおける話者判定
方式。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP63152385A JP2760804B2 (ja) | 1988-06-22 | 1988-06-22 | 話者判定装置 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP63152385A JP2760804B2 (ja) | 1988-06-22 | 1988-06-22 | 話者判定装置 |
Publications (2)
Publication Number | Publication Date |
---|---|
JPH024095A true JPH024095A (ja) | 1990-01-09 |
JP2760804B2 JP2760804B2 (ja) | 1998-06-04 |
Family
ID=15539366
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP63152385A Expired - Fee Related JP2760804B2 (ja) | 1988-06-22 | 1988-06-22 | 話者判定装置 |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP2760804B2 (ja) |
Cited By (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH0423588A (ja) * | 1990-05-17 | 1992-01-27 | Fujitsu Ltd | 多地点会議システム |
JP2008005028A (ja) * | 2006-06-20 | 2008-01-10 | Nippon Telegr & Teleph Corp <Ntt> | 映像音声会議システムおよび端末装置 |
JP2008056204A (ja) * | 2006-09-04 | 2008-03-13 | Advics:Kk | 車両用ブレーキ装置 |
JP2008141505A (ja) * | 2006-12-01 | 2008-06-19 | Nippon Telegr & Teleph Corp <Ntt> | 話者選択装置、話者選択方法、話者選択プログラムおよびこれを記録した記録媒体 |
Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPS4857522A (ja) * | 1971-11-19 | 1973-08-13 | ||
JPS4924021A (ja) * | 1972-06-23 | 1974-03-04 |
-
1988
- 1988-06-22 JP JP63152385A patent/JP2760804B2/ja not_active Expired - Fee Related
Patent Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPS4857522A (ja) * | 1971-11-19 | 1973-08-13 | ||
JPS4924021A (ja) * | 1972-06-23 | 1974-03-04 |
Cited By (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH0423588A (ja) * | 1990-05-17 | 1992-01-27 | Fujitsu Ltd | 多地点会議システム |
JP2008005028A (ja) * | 2006-06-20 | 2008-01-10 | Nippon Telegr & Teleph Corp <Ntt> | 映像音声会議システムおよび端末装置 |
JP4531013B2 (ja) * | 2006-06-20 | 2010-08-25 | 日本電信電話株式会社 | 映像音声会議システムおよび端末装置 |
JP2008056204A (ja) * | 2006-09-04 | 2008-03-13 | Advics:Kk | 車両用ブレーキ装置 |
JP2008141505A (ja) * | 2006-12-01 | 2008-06-19 | Nippon Telegr & Teleph Corp <Ntt> | 話者選択装置、話者選択方法、話者選択プログラムおよびこれを記録した記録媒体 |
Also Published As
Publication number | Publication date |
---|---|
JP2760804B2 (ja) | 1998-06-04 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US8463600B2 (en) | System and method for adjusting floor controls based on conversational characteristics of participants | |
US7698141B2 (en) | Methods, apparatus, and products for automatically managing conversational floors in computer-mediated communications | |
US7020257B2 (en) | Voice activity identiftication for speaker tracking in a packet based conferencing system with distributed processing | |
JP2835483B2 (ja) | 音声判別装置と音響再生装置 | |
JP2586827B2 (ja) | 受信装置 | |
JPH024095A (ja) | 話者判定装置 | |
JPH05111020A (ja) | テレビ会議用画面切替制御装置 | |
JP2910417B2 (ja) | 音声音楽判別装置 | |
JP2822897B2 (ja) | テレビ会議システム話者判別装置 | |
JP2001056696A (ja) | 音声蓄積再生方法および音声蓄積再生装置 | |
JP2007096555A (ja) | 音声会議システム、端末装置及びそれに用いる話者優先レベル制御方法並びにそのプログラム | |
JP2009027239A (ja) | 通信会議装置 | |
EP1453287B1 (en) | Automatic management of conversational groups | |
JP2666317B2 (ja) | 多地点間映像会議システムの映像画面切替え方法 | |
JP2990051B2 (ja) | 音声認識装置 | |
JP2005086363A (ja) | 通話装置 | |
JP3047259B2 (ja) | 電子会議システムの発言者自動選択装置 | |
JPH1188513A (ja) | 多地点間通信制御装置の音声処理装置 | |
JP2003060792A (ja) | 複数音声録音再生装置 | |
JPH07226930A (ja) | 通信会議システム | |
JP2962343B2 (ja) | 音声信号レベル制御機能付会議通話方式 | |
JP2000049948A5 (ja) | 音声通話装置、音声通話システム、および音声通話方法 | |
JP2010050512A (ja) | 音声ミキシング装置及びプログラム | |
Sakamoto et al. | Effect of speed difference between time-expanded speech and talker2s moving image on word or sentence intelligibility. | |
KR100329145B1 (ko) | 호출음시간자동변경방법 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
LAPS | Cancellation because of no payment of annual fees |