JPH07306694A - Sound input device - Google Patents

Sound input device

Info

Publication number
JPH07306694A
JPH07306694A JP6119724A JP11972494A JPH07306694A JP H07306694 A JPH07306694 A JP H07306694A JP 6119724 A JP6119724 A JP 6119724A JP 11972494 A JP11972494 A JP 11972494A JP H07306694 A JPH07306694 A JP H07306694A
Authority
JP
Japan
Prior art keywords
signal
input
audio
nth
memory
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP6119724A
Other languages
Japanese (ja)
Inventor
Satoshi Tsukada
聡 塚田
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
NEC Corp
Original Assignee
NEC Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by NEC Corp filed Critical NEC Corp
Priority to JP6119724A priority Critical patent/JPH07306694A/en
Publication of JPH07306694A publication Critical patent/JPH07306694A/en
Pending legal-status Critical Current

Links

Abstract

PURPOSE:To provide a sound input device which can save a memory by equipping it with a function to select optimum input level. CONSTITUTION:In each input circuit 1', input sound signals V are amplified with different amplification factors, and A/D conversion is performed, and the signals from the start of input to time T are stored as front sound signals F in a front memory 30'. A gain selection control circuit 2' selects a signal that it judges to be on optimum level out of front sound selection signals F1-Fn, and informs it by a gain selection signal S. A selection signal 4 selects one out of sound digital signals D1-Dn by the selection signal S, and stores the signal from after passage of time T to the finish of sound input as a rear sound signal B in a rear memory 5. A feature abstracting part 3' selects one out of front sound signals F1-Fn, and adds a rear sound signal stored in the rear memory 5 to the rear of this selected front memory signal so as to abstract features.

Description

【発明の詳細な説明】Detailed Description of the Invention

【0001】[0001]

【産業上の利用分野】この発明は、最適な入力レベルを
選択する機能を備えた音声入力装置に関するものであ
る。
BACKGROUND OF THE INVENTION 1. Field of the Invention The present invention relates to a voice input device having a function of selecting an optimum input level.

【0002】[0002]

【従来の技術】一般に、音声入力装置における入力音声
レベルは、発声者の特質や発声時の環境などの種々の要
因により変動する。これに対して、従来の音声入力装置
では、入力音声レベルに対して最適な利得(増幅率)で
入力を行うために、例えば、異なる増幅率の増幅回路に
音声を入力し、入力終了後に最適な入力レベルの音声を
選択する方法が採用されている。従来の音声入力装置の
要部の構成を図2(A)に示す。同図において、1(1
−1〜1−n)は入力回路、2はゲイン選択制御回路、
3は特徴抽出部である。入力回路1は、図2(B)に示
すように、増幅回路10,A/D変換回路20,メモリ
30を備えている。入力回路1−1〜1−nにおいてそ
の増幅回路10の増幅率はそれぞれ異なっている。
2. Description of the Related Art Generally, an input voice level in a voice input device varies depending on various factors such as the characteristics of a speaker and the environment at the time of vocalization. On the other hand, in a conventional voice input device, in order to perform input with an optimum gain (amplification factor) for the input voice level, for example, voice is input to an amplifier circuit with a different amplification factor, and the optimum input is made after the input is completed. A method of selecting a voice with a different input level is adopted. FIG. 2A shows the configuration of the main part of a conventional voice input device. In the figure, 1 (1
-1 to 1-n) are input circuits, 2 is a gain selection control circuit,
3 is a feature extraction unit. As shown in FIG. 2B, the input circuit 1 includes an amplification circuit 10, an A / D conversion circuit 20, and a memory 30. The amplification factors of the amplifier circuits 10 in the input circuits 1-1 to 1-n are different from each other.

【0003】この音声入力装置において、入力音声信号
Vは、入力回路1−1〜1−nへ与えられる。入力回路
1−1〜1−nでは、その増幅回路10によって、入力
音声信号Vを予め定められた増幅率で増幅し、増幅音声
信号Aとする。そして、A/D変換回路20によって、
増幅回路10からの増幅音声信号Aをアナログ/ディジ
タル変換し、音声ディジタル信号Dとする。そして、こ
の音声ディジタル信号Dをメモリ30へ記憶する。この
場合、メモリ30に記憶される音声ディジタル信号D
は、音声入力が開始されてから終了するまでの入力音声
の全区間にわたる。ゲイン選択制御回路2は、入力回路
1−1〜1−nのメモリ30に記憶された音声ディジタ
ル信号D1〜Dnの中から最適な入力レベルと判断され
る信号を選択し、どの信号を選択したかをゲイン選択信
号Sによって特徴抽出部3へ通知する。特徴抽出部3
は、入力回路1−1〜1−nのメモリ30に記憶されて
いる音声ディジタル信号D1〜Dnの中から、ゲイン選
択信号Sで指定される音声ディジタル信号を最適入力レ
ベルの音声ディジタル信号として選択し、この選択した
音声ディジタル信号から特徴抽出を行う(特公平1−3
6640号、特開昭62−272300号、特開昭63
−316097号参照)。
In this voice input device, the input voice signal V is given to the input circuits 1-1 to 1-n. In each of the input circuits 1-1 to 1-n, the amplifier circuit 10 amplifies the input audio signal V at a predetermined amplification factor to obtain an amplified audio signal A. Then, by the A / D conversion circuit 20,
The amplified audio signal A from the amplifier circuit 10 is analog-to-digital converted into an audio digital signal D. Then, the audio digital signal D is stored in the memory 30. In this case, the audio digital signal D stored in the memory 30
Over the entire section of the input voice from the start to the end of voice input. The gain selection control circuit 2 selects a signal judged to be an optimum input level from the audio digital signals D1 to Dn stored in the memory 30 of the input circuits 1-1 to 1-n, and selects which signal. This is notified to the feature extraction unit 3 by the gain selection signal S. Feature extraction unit 3
Selects the audio digital signal designated by the gain selection signal S as the audio digital signal of the optimum input level from the audio digital signals D1 to Dn stored in the memory 30 of the input circuits 1-1 to 1-n. Then, feature extraction is performed from the selected audio digital signal (Japanese Patent Publication No. 1-3.
6640, JP-A-62-272300, JP-A-63.
316097).

【0004】[0004]

【発明が解決しようとする課題】しかしながら、このよ
うな従来の音声入力装置によると、入力音声の全区間に
わたる音声ディジタル信号Dをメモリ30に記憶させ、
このメモリ30に記憶された入力回路1−1〜1−nの
音声ディジタル信号D1〜Dnに基づいて、そのうちの
一つを最適入力レベルの音声ディジタル信号として選択
するようにしているため、メモリを過大に必要とすると
いう問題があった。
However, according to such a conventional voice input device, the voice digital signal D over the entire section of the input voice is stored in the memory 30,
Based on the audio digital signals D1 to Dn of the input circuits 1-1 to 1-n stored in the memory 30, one of them is selected as the audio digital signal of the optimum input level. There was a problem of needing too much.

【0005】本発明はこのような課題を解決するために
なされたもので、その目的とするところは、メモリを節
約することのできる音声入力装置を提供することにあ
る。
The present invention has been made to solve the above problems, and an object of the present invention is to provide a voice input device capable of saving memory.

【0006】[0006]

【課題を解決するための手段】このような目的を達成す
るために、その第1発明(請求項1に係る発明)は、入
力音声信号を第1〜第Nの増幅手段によってそれぞれ異
なる増幅率で増幅し、この第1〜第Nの増幅手段により
増幅された入力音声信号を第1〜第NのA/D変換手段
によってディジタル信号に変換し音声ディジタル信号と
して出力し、この第1〜第NのA/D変換手段の出力す
る音声ディジタル信号の入力開始から予め定められた時
間Tまでの間の信号を前部音声信号として第1〜第Nの
前部メモリ手段に記憶ささ、この第1〜第Nの前部メモ
リ手段に記憶された前部音声信号に基づいて第1〜第N
のA/D変換手段の出力する音声ディジタル信号のうち
何れか一つを最適入力レベルの音声ディジタル信号と定
めるようにしたものである。また、その第2発明(請求
項2に係る発明)は、入力音声信号を第1〜第Nの増幅
手段によってそれぞれ異なる増幅率で増幅し、この第1
〜第Nの増幅手段により増幅された入力音声信号を第1
〜第NのA/D変換手段によってディジタル信号に変換
し音声ディジタル信号として出力し、この第1〜第Nの
A/D変換手段の出力する音声ディジタル信号の入力開
始から予め定められた時間Tまでの間の信号を前部音声
信号として第1〜第Nの前部メモリ手段に記憶させ、こ
の第1〜第Nの前部メモリ手段に記憶された前部音声信
号から最適な入力レベルの信号を選択しどの信号を選択
したかを通知手段より通知するものとし、この通知手段
からの通知に基づいて第1〜第NのA/D変換手段の出
力する音声ディジタル信号のうち何れか一つを選択し、
この選択した音声ディジタル信号の上記時間Tの経過後
から音声入力が終了するまでを後部音声信号として選択
手段より出力するものとし、この選択手段より出力され
る後部音声信号を後部メモリ手段に記憶させ、上記通知
手段からの通知に基づいて第1〜第Nの前部メモリ手段
の記憶されている前部音声信号のうち何れか一つを選択
し、この選択した前部音声信号の後に後部メモリ手段に
記憶されている後部音声信号を加えて最適入力レベルの
音声ディジタル信号とするようにしたものである。ま
た、その第3発明(請求項3に係る発明)は、入力音声
信号を増幅する増幅回路と、この増幅回路により増幅さ
れた入力音声信号をディジタル信号に変換し音声ディジ
タル信号として出力するA/D変換回路と、このA/D
変換回路の出力する音声ディジタル信号の入力開始から
予め定められた時間Tまでの間の信号を前部音声信号と
して記憶する前部メモリとによって第1〜第Nの入力回
路を構成し(各入力回路の増幅回路の増幅率はそれぞれ
異なる)、この第1〜第Nの入力回路の前部メモリに記
憶された前部音声信号から最適な入力レベルの信号を選
択しどの信号を選択したかをゲイン選択信号としてゲイ
ン選択制御回路より出力するものとし、このゲイン選択
制御回路から出力されるゲイン選択信号に基づいて第1
〜第Nの入力回路のA/D変換回路の出力する音声ディ
ジタル信号のうち何れか一つを選択し、この選択した音
声ディジタル信号の上記時間Tの経過後から音声入力が
終了するまでを後部音声信号として選択回路より出力す
るものとし、この選択回路の出力する後部音声信号を後
部メモリに記憶させ、ゲイン選択制御回路からのゲイン
選択信号に基づいて第1〜第Nの入力回路の前部メモリ
に記憶されている前部音声信号のうち何れか一つを選択
し、この選択した前部メモリ信号の後に後部メモリの記
憶している後部音声信号を加えて最適入力レベルの音声
ディジタル信号とし、この最適入力レベルの音声ディジ
タル信号から特徴抽出を行うようにしたものである。
In order to achieve such an object, the first invention (the invention according to claim 1) of the present invention is that the input audio signal has different amplification factors depending on the first to Nth amplification means. The input audio signal amplified by the first to Nth amplifying means is converted into a digital signal by the first to Nth A / D converting means and output as a digital audio signal. A signal from the start of input of the audio digital signal output from the N A / D conversion means to a predetermined time T is stored as a front audio signal in the first to Nth front memory means, and 1st to Nth based on the front audio signals stored in the 1st to Nth front memory means
One of the audio digital signals output from the A / D conversion means is determined as the audio digital signal of the optimum input level. The second invention (the invention according to claim 2) amplifies the input audio signal by different amplification factors by the first to Nth amplifying means, and
~ The first input voice signal amplified by the Nth amplifying means
A predetermined time T from the start of the input of the audio digital signal output from the first to Nth A / D converting means, which is converted into a digital signal by the Nth A / D converting means and output as a digital audio signal. The signals between 1 to N are stored in the first to Nth front memory means as front voice signals, and the optimum input level of the front voice signals stored in the first to Nth front memory means is stored. A signal is selected, and which signal is selected is notified from the notifying means, and one of the audio digital signals output from the first to Nth A / D converting means based on the notification from the notifying means. Choose one,
After the time T of the selected audio digital signal has elapsed and until the audio input is completed, the selecting means outputs the rear audio signal, and the rear audio signal output from the selecting means is stored in the rear memory means. , Any one of the front audio signals stored in the first to Nth front memory means is selected based on the notification from the notification means, and the rear memory is selected after the selected front audio signal. The rear audio signal stored in the means is added to obtain an audio digital signal having an optimum input level. A third invention (the invention according to claim 3) is an A / A circuit for amplifying an input audio signal, and an A / A which outputs an audio digital signal by converting the input audio signal amplified by the amplifier circuit into a digital signal. D conversion circuit and this A / D
The first to Nth input circuits are configured by a front memory that stores a signal from the start of input of the audio digital signal output from the conversion circuit to a predetermined time T as a front audio signal (each input The amplification factor of each of the amplifier circuits of the circuit is different), and a signal having an optimum input level is selected from the front audio signals stored in the front memories of the first to Nth input circuits, and which signal is selected. It is assumed that the gain selection signal is output from the gain selection control circuit, and the first selection is performed based on the gain selection signal output from the gain selection control circuit.
-Selecting any one of the audio digital signals output from the A / D conversion circuit of the Nth input circuit, the rear part from the lapse of the time T of the selected audio digital signal to the end of the audio input. The audio signal is output from the selection circuit, the rear audio signal output from the selection circuit is stored in the rear memory, and the front parts of the first to Nth input circuits are stored based on the gain selection signal from the gain selection control circuit. Select one of the front audio signals stored in the memory and add the selected rear memory signal to the rear audio signal stored in the rear memory to obtain the audio digital signal of the optimum input level. The feature extraction is performed from the audio digital signal of the optimum input level.

【0007】[0007]

【作用】したがってこの発明によれば、その第1発明で
は、第1〜第NのA/D変換手段の出力する音声ディジ
タル信号の入力開始から時間Tまでの間の信号が前部音
声信号として第1〜第Nの前部メモリ手段に記憶され、
これら記憶された前部音声信号に基づいて最適入力レベ
ルの音声ディジタル信号が定められる。また、その第2
発明では、第1〜第NのA/D変換手段の出力する音声
ディジタル信号の入力開始から時間Tまでの間の信号が
前部音声信号として第1〜第Nの前部メモリ手段に記憶
され、これら記憶された前部音声信号から最適な入力レ
ベルの信号が選択され、どの信号を選択したかが通知さ
れ、この通知に基づいて第1〜第NのA/D変換手段の
出力する音声ディジタル信号のうち何れか一つが選択さ
れ、この選択された信号の上記時間Tの経過後から音声
入力が終了するまでが後部音声信号として後部メモリ手
段に記憶され、選択された前部メモリ手段の記憶する前
部音声信号の後に後部メモリ手段の記憶する後部音声信
号が加えられて最適入力レベルの音声ディジタル信号と
される。また、その第3発明では、第1〜第Nの入力回
路のA/D変換回路の出力する音声ディジタル信号の入
力開始から時間Tまでの間の信号が前部音声信号として
第1〜第Nの入力回路の前部メモリに記憶され、これら
記憶された前部音声信号から最適な入力レベルの信号が
選択され、どの信号を選択したかがゲイン選択信号とし
て出力され、このゲイン選択信号に基づいて第1〜第N
の入力回路のA/D変換回路の出力する音声ディジタル
信号のうち何れか一つが選択され、この選択された音声
ディジタル信号の上記時間Tの経過後から音声入力が終
了するまでが後部音声信号として後部メモリに記憶さ
れ、選択された前部メモリの記憶する前部音声信号の後
に後部メモリの記憶する後部音声信号が加えられてて最
適入力レベルの音声ディジタル信号とされ、この最適入
力レベルの音声ディジタル信号から特徴抽出が行われ
る。
According to the present invention, therefore, in the first invention, the signal from the start of input of the audio digital signals output from the first to Nth A / D conversion means to time T is the front audio signal. Stored in first to Nth front memory means,
An audio digital signal having an optimum input level is determined based on these stored front audio signals. Also, the second
In the invention, the signals from the start of the input of the audio digital signals output by the first to Nth A / D conversion means to the time T are stored in the first to Nth front memory means as the front audio signals. , A signal having an optimum input level is selected from the stored front audio signals, and which signal is selected is notified, and based on this notification, the audio output from the first to Nth A / D conversion means is output. One of the digital signals is selected, and after the time T of the selected signal elapses until the voice input is completed, it is stored in the rear memory means as a rear voice signal, and the selected front memory means is stored. After the front audio signal to be stored, the rear audio signal stored in the rear memory means is added to obtain the audio digital signal of the optimum input level. In the third aspect of the invention, a signal from the start of input of the audio digital signal output from the A / D conversion circuit of the first to Nth input circuits to time T is the first to Nth audio signals. Is stored in the front memory of the input circuit of, the signal of the optimum input level is selected from these stored front audio signals, and which signal is selected is output as a gain selection signal. 1st to Nth
Any one of the audio digital signals output from the A / D conversion circuit of the input circuit is selected, and after the time T of the selected audio digital signal elapses until the audio input is completed is the rear audio signal. The audio signal of the optimum input level is obtained by adding the rear audio signal stored in the rear memory to the audio signal of the optimum input level after adding the rear audio signal stored in the rear memory to the audio signal of the optimum input level stored in the rear memory. Feature extraction is performed from the digital signal.

【0008】[0008]

【実施例】以下、本発明を実施例に基づき詳細に説明す
る。図1(A)はこの発明の一実施例を示す音声入力装
置の要部の構成図である。同図において、1’(1’−
1〜1’−n)は入力回路、2’はゲイン選択制御回
路、3’は特徴抽出部、4は選択回路、5は後部メモリ
である。入力回路1’は、図1(B)に示すように、増
幅回路10,A/D変換回路20,前部メモリ30’を
備えている。入力回路1’−1〜1’−nにおいてその
増幅回路10の増幅率はそれぞれ異なっている。
EXAMPLES The present invention will now be described in detail based on examples. FIG. 1A is a configuration diagram of a main part of a voice input device showing an embodiment of the present invention. In the figure, 1 '(1'-
1 to 1'-n) is an input circuit, 2'is a gain selection control circuit, 3'is a feature extraction unit, 4 is a selection circuit, and 5 is a rear memory. As shown in FIG. 1B, the input circuit 1'includes an amplifier circuit 10, an A / D conversion circuit 20, and a front memory 30 '. The amplification factors of the amplifier circuit 10 in the input circuits 1'-1 to 1'-n are different from each other.

【0009】この音声入力装置において、入力音声信号
Vは、入力回路1’−1〜1’−nへ与えられる。入力
回路1’−1〜1’−nでは、その増幅回路10によっ
て、入力音声信号Vを予め定められた増幅率で増幅し、
増幅音声信号Aとする。そして、A/D変換回路20に
よって、帯域制限を行った後、増幅回路10からの増幅
音声信号Aをアナログ/ディジタル変換し、音声ディジ
タル信号Dとする。この音声ディジタル信号Dは、入力
開始から予め定められた時間Tまでの間の信号が、前部
音声信号Fとして前部メモリ30’へ記憶される。
In this voice input device, the input voice signal V is given to the input circuits 1'-1 to 1'-n. In the input circuits 1′-1 to 1′-n, the amplifier circuit 10 amplifies the input audio signal V at a predetermined amplification factor,
The amplified audio signal A is used. Then, after band limitation is performed by the A / D conversion circuit 20, the amplified audio signal A from the amplifier circuit 10 is subjected to analog / digital conversion to be an audio digital signal D. As the audio digital signal D, a signal from the start of input to a predetermined time T is stored as a front audio signal F in the front memory 30 '.

【0010】ここで、入力開始の判定(始端検出)は、
音声入力装置が発声者に発声を促すために指示を出すタ
イミング、あるいは、発声者が発声を開始する前に発声
者自身がスイッチ等で音声入力装置に入力開始を指示す
るタイミングなどを用いることができる。また、時間T
は、後述の最適入力レベルの音声ディジタル信号の決定
において、入力開始から時間Tの間の音声ディジタル信
号に基づくため、入力音声全体として最適なレベルかど
うかを決定できるだけの長さとしておく必要がある。時
間Tの一例としては、1音節分の音声が入力できるだけ
の長さなどがある。この時間Tは、入力開始を検出して
からのタイマ(図示せず)でのカウント時間として定め
る。
Here, the input start determination (start edge detection) is
It is possible to use the timing at which the voice input device gives an instruction to the speaker to prompt the user to speak, or the timing at which the speaker itself instructs the voice input device to start input by a switch etc. before the speaker starts speaking. it can. Also, time T
Is based on the voice digital signal from the start of input to the time T in the determination of the voice digital signal of the optimum input level, which will be described later, and therefore it must be long enough to determine whether it is the optimum level for the entire input voice. . An example of the time T is a length such that one syllable voice can be input. This time T is set as a count time by a timer (not shown) after the input start is detected.

【0011】ゲイン選択制御回路2’は、入力回路1’
−1〜1’−nの前部メモリ30’に記憶された前部音
声信号F1〜Fnの中から最適な入力レベルと判断され
る信号をどれか1つ選択し、どの信号を選択したかをゲ
イン選択信号Sによって選択回路4へ通知する。ここ
で、最適な入力レベルを選択するとは、後述の特徴抽出
部3’において特徴抽出を最適な状態で行い誤差の少な
い特徴データが得られるようにすることである。最適な
入力レベルを選択する方法の一例として、それぞれの増
幅率による音声パワーのピーク値が所定の閾値(例え
ば、±5V)を越えないでかつ最大のものを選択するよ
うな方法をとることが考えられる。このとき、予め入力
開始から時間Tの間の音声パワーと入力音声の全区間で
の最適入力レベルとの関係を調べておくことにより、所
定の閾値を設定すれば、入力開始から時間Tの間の音声
パワーのピーク値に基づいて、入力音声全体での最適な
増幅率となっているものを選択することができる。
The gain selection control circuit 2'includes an input circuit 1 '.
-1 to 1'-n, which one of the signals judged as the optimum input level is selected from the front audio signals F1 to Fn stored in the front memory 30 ', and which signal is selected Is notified to the selection circuit 4 by the gain selection signal S. Here, selecting the optimum input level is to perform feature extraction in a feature extraction unit 3'described later so as to obtain feature data with a small error. As an example of a method of selecting an optimum input level, a method of selecting a maximum value so that the peak value of audio power due to each amplification factor does not exceed a predetermined threshold value (for example, ± 5 V) Conceivable. At this time, if a predetermined threshold value is set by checking the relationship between the voice power from the input start and the time T and the optimum input level in all the sections of the input voice in advance, the period from the input start to the time T Based on the peak value of the voice power of, it is possible to select the one that has the optimum amplification factor for the entire input voice.

【0012】選択回路4は、ゲイン選択制御回路2’か
らのゲイン選択信号Sにより、入力回路1’−1〜1’
−nのA/D変換回路20の出力する音声ディジタル信
号D1〜Dnのうち何れか一つを選択し、すなわち音声
ディジタル信号D1〜Dnのうち何れか一つを最適入力
レベルの音声ディジタル信号と定め、この選択した音声
ディジタル信号の時間Tの経過後から音声入力が終了す
るまでを後部音声信号Bとして出力する。選択回路4の
出力する後部音声信号Bは後部メモリ5に記憶される。
選択回路4での音声ディジタル信号の選択方法として次
のような,の方式が考えられる。 ゲイン選択制御回路2’で選択された信号を出力する
入力回路からの音声ディジタル信号を選択する。 ゲイン選択制御回路2’で選択された信号に基づいて
予め作成された対応テーブル(前音声と後音声との関
係,用途に応じた対応テーブル)から最適な入力回路か
らの音声ディジタル信号を選択する。
The selection circuit 4 is responsive to the gain selection signal S from the gain selection control circuit 2'for input circuits 1'-1 to 1 '.
Select any one of the audio digital signals D1 to Dn output from the -n A / D conversion circuit 20, that is, select any one of the audio digital signals D1 to Dn as the audio digital signal of the optimum input level. After the lapse of the time T of the selected audio digital signal until the end of the audio input, the audio signal B is output as the rear audio signal B. The rear audio signal B output from the selection circuit 4 is stored in the rear memory 5.
The following method can be considered as a method of selecting the audio digital signal in the selection circuit 4. The audio digital signal from the input circuit that outputs the signal selected by the gain selection control circuit 2'is selected. The optimum audio digital signal from the input circuit is selected from the correspondence table (the correspondence table according to the relationship between the front voice and the rear voice and the application) created in advance based on the signal selected by the gain selection control circuit 2 '. .

【0013】一方、ゲイン選択制御回路2’の出力する
ゲイン選択信号Sは、特徴抽出部3’へも与えられる。
特徴抽出部3’は、ゲイン選択制御回路2’からのゲイ
ン選択信号Sにより、入力回路1’−1〜1’−nの前
部メモリ30’の記憶している前部音声信号F1〜Fn
のうち何れか一つを選択し、この選択した前部メモリ信
号の後に後部メモリ5の記憶している後部音声信号を加
えて最適入力レベルの音声ディジタル信号とし、この最
適入力レベルの音声ディジタル信号から特徴抽出を行
う。これにより、本実施例によれば、入力開始から時間
Tの経過後は最適入力レベルの音声ディジタル信号のみ
を記憶すればよく、入力回路1’−1〜1’−nのA/
D変換回路20からの音声ディジタル信号の各々を入力
音声の全区間にわたり記憶する方法に比べ、メモリを大
幅に節約することができるようになる。なお、特徴抽出
の方法の一例としては、文献「音声認識(新美康永著、
共立出版発行)」の38ページ〜52ページに記載のケ
プストラム分析や線形予測分析などを用いることができ
る。
On the other hand, the gain selection signal S output from the gain selection control circuit 2'is also given to the feature extraction section 3 '.
The feature extraction unit 3 ′ uses the gain selection signal S from the gain selection control circuit 2 ′ to output the front audio signals F1 to Fn stored in the front memory 30 ′ of the input circuits 1′-1 to 1′-n.
One of the selected front memory signals is added to the rear audio signal stored in the rear memory 5 after the selected front memory signal to obtain an optimum input level audio digital signal. Feature extraction from. Thus, according to the present embodiment, after the time T has elapsed from the start of input, only the audio digital signal of the optimum input level needs to be stored, and A / A of the input circuits 1'-1 to 1'-n is stored.
Compared with the method of storing each of the audio digital signals from the D conversion circuit 20 over the entire section of the input audio, the memory can be saved significantly. In addition, as an example of the feature extraction method, there is a document “Voice recognition (by Yasunaga Niimi,
Kyoritsu Publishing ”), pages 38 to 52, and the cepstrum analysis and linear prediction analysis can be used.

【0014】[0014]

【発明の効果】以上説明したことから明らかなように本
発明によれば、その第1発明では、第1〜第NのA/D
変換手段の出力する音声ディジタル信号の入力開始から
時間Tまでの間の信号が前部音声信号として第1〜第N
の前部メモリ手段に記憶され、これら記憶された前部音
声信号に基づいて最適入力レベルの音声ディジタル信号
が定められるので、時間Tの経過後は最適入力レベルの
音声ディジタル信号のみを記憶するようになすことによ
り、第1〜第NのA/D変換手段からの音声ディジタル
信号の各々を入力音声の全区間にわたり記憶する方法に
比べ、メモリを大幅に節約することが可能となる。ま
た、その第2発明では、第1〜第NのA/D変換手段の
出力する音声ディジタル信号の入力開始から時間Tまで
の間の信号が前部音声信号として第1〜第Nの前部メモ
リ手段に記憶され、これら記憶された前部音声信号から
最適な入力レベルの信号が選択され、どの信号を選択し
たかが通知され、この通知に基づいて第1〜第NのA/
D変換手段の出力する音声ディジタル信号のうち何れか
一つが選択され、この選択された信号の上記時間Tの経
過後から音声入力が終了するまでが後部音声信号として
後部メモリ手段に記憶され、選択された前部メモリ手段
の記憶する前部音声信号の後に後部メモリ手段の記憶す
る後部音声信号が加えられて最適入力レベルの音声ディ
ジタル信号とされるので、第1〜第NのA/D変換手段
からの音声ディジタル信号の各々を入力音声の全区間に
わたり記憶する方法に比べ、メモリを大幅に節約するこ
とができる。また、その第3発明では、第1〜第Nの入
力回路のA/D変換回路の出力する音声ディジタル信号
の入力開始から時間Tまでの間の信号が前部音声信号と
して第1〜第Nの入力回路の前部メモリに記憶され、こ
れら記憶された前部音声信号から最適な入力レベルの信
号が選択され、どの信号を選択したかがゲイン選択信号
として出力され、このゲイン選択信号に基づいて第1〜
第Nの入力回路のA/D変換回路の出力する音声ディジ
タル信号のうち何れか一つが選択され、この選択された
音声ディジタル信号の上記時間Tの経過後から音声入力
が終了するまでが後部音声信号として後部メモリに記憶
され、選択された前部メモリの記憶する前部音声信号の
後に後部メモリの記憶する後部音声信号が加えられてて
最適入力レベルの音声ディジタル信号とされ、この最適
入力レベルの音声ディジタル信号から特徴抽出が行われ
るので、第1〜第NのA/D変換回路からの音声ディジ
タル信号の各々を入力音声の全区間にわたり記憶する方
法に比べメモリを大幅に節約したうえ、特徴抽出を行う
ことができる。
As is apparent from the above description, according to the present invention, in the first invention, the first to Nth A / Ds are used.
The signals from the start of the input of the audio digital signal output by the converting means to the time T are the first to Nth audio signals as front audio signals.
The audio digital signal of the optimum input level is stored in the front memory means and the audio digital signal of the optimum input level is determined based on these stored front audio signals. Therefore, after the time T, only the audio digital signal of the optimum input level is stored. By doing so, it is possible to significantly save the memory as compared with the method of storing each of the audio digital signals from the first to Nth A / D converting means over the entire section of the input audio. In the second aspect of the invention, the signals from the start of input of the audio digital signals output from the first to Nth A / D conversion means to the time T are the first audio signals to the first to Nth audio signals. A signal having an optimum input level is selected from the front audio signals stored in the memory means, and which signal is selected is notified. Based on this notification, the first to Nth A /
Any one of the audio digital signals output by the D conversion means is selected, and after the elapse of the time T of the selected signal until the audio input is completed, it is stored in the rear memory means as the rear audio signal and selected. The rear audio signal stored in the rear memory means is added to the front audio signal stored in the front memory means to be an audio digital signal of the optimum input level. Therefore, the first to Nth A / D conversions are performed. Memory can be saved significantly compared to a method in which each of the audio digital signals from the means is stored over the entire duration of the input audio. In the third aspect of the invention, a signal from the start of input of the audio digital signal output from the A / D conversion circuit of the first to Nth input circuits to time T is the first to Nth audio signals. Is stored in the front memory of the input circuit of, the signal of the optimum input level is selected from these stored front audio signals, and which signal is selected is output as a gain selection signal. 1st
Any one of the audio digital signals output from the A / D conversion circuit of the Nth input circuit is selected, and the rear audio is output after the time T of the selected audio digital signal elapses until the audio input is completed. The signal is stored in the rear memory as a signal, and the rear audio signal stored in the rear memory is added after the front audio signal stored in the selected front memory to obtain an audio digital signal of the optimum input level. Since the feature extraction is performed from the audio digital signal of, the memory is significantly saved as compared with the method of storing each of the audio digital signals from the first to Nth A / D conversion circuits over the entire section of the input audio. Feature extraction can be performed.

【図面の簡単な説明】[Brief description of drawings]

【図1】 本発明に係る音声入力装置の要部の構成を示
す図である。
FIG. 1 is a diagram showing a configuration of a main part of a voice input device according to the present invention.

【図2】 従来の音声入力装置の要部の構成を示す図で
ある。
FIG. 2 is a diagram showing a configuration of a main part of a conventional voice input device.

【符号の説明】[Explanation of symbols]

1’(1’−1〜1’−n)…入力回路、2’…ゲイン
選択制御回路、3’…特徴抽出部、4…選択回路、5…
後部メモリ、10…増幅回路、20…A/D変換回路、
30’…前部メモリ。
1 '(1'-1 to 1'-n) ... Input circuit, 2' ... Gain selection control circuit, 3 '... Feature extraction unit, 4 ... Selection circuit, 5 ...
Rear memory, 10 ... Amplifying circuit, 20 ... A / D converting circuit,
30 '... front memory.

Claims (3)

【特許請求の範囲】[Claims] 【請求項1】 入力音声信号をそれぞれ異なる増幅率で
増幅する第1〜第Nの増幅手段と、 この第1〜第Nの増幅手段により増幅された入力音声信
号をディジタル信号に変換し音声ディジタル信号として
出力する第1〜第NのA/D変換手段と、 この第1〜第NのA/D変換手段の出力する音声ディジ
タル信号の入力開始から予め定められた時間Tまでの間
の信号を前部音声信号として記憶する第1〜第Nの前部
メモリ手段と、 この第1〜第Nの前部メモリ手段に記憶された前部音声
信号に基づいて前記第1〜第NのA/D変換手段の出力
する音声ディジタル信号のうち何れか一つを最適入力レ
ベルの音声ディジタル信号と定める手段とを備えたこと
を特徴とする音声入力装置。
1. A first to Nth amplifying means for amplifying an input sound signal with different amplification factors respectively, and an input sound signal amplified by the first to Nth amplifying means is converted into a digital signal and a sound digital signal. First to Nth A / D conversion means for outputting as signals, and signals from the start of input of the audio digital signals output by the first to Nth A / D conversion means to a predetermined time T Based on the front audio signals stored in the first to N-th front memory means, and the first to N-th A A voice input device comprising means for determining any one of the voice digital signals output by the D / D conversion means as a voice digital signal of an optimum input level.
【請求項2】 入力音声信号をそれぞれ異なる増幅率で
増幅する第1〜第Nの増幅手段と、 この第1〜第Nの増幅手段により増幅された入力音声信
号をディジタル信号に変換し音声ディジタル信号として
出力する第1〜第NのA/D変換手段と、 この第1〜第NのA/D変換手段の出力する音声ディジ
タル信号の入力開始から予め定められた時間Tまでの間
の信号を前部音声信号として記憶する第1〜第Nの前部
メモリ手段と、 この第1〜第Nの前部メモリ手段に記憶された前部音声
信号から最適な入力レベルの信号を選択しどの信号を選
択したかを通知する通知手段と、 この通知手段からの通知に基づいて前記第1〜第NのA
/D変換手段の出力する音声ディジタル信号のうち何れ
か一つを選択し、この選択した音声ディジタル信号の前
記時間Tの経過後から音声入力が終了するまでを後部音
声信号として出力する選択手段と、 この選択手段の出力する後部音声信号を記憶する後部メ
モリ手段と、 前記通知手段からの通知に基づいて前記第1〜第Nの前
部メモリ手段の記憶している前部音声信号のうち何れか
一つを選択し、この選択した前部音声信号の後に前記後
部メモリ手段の記憶している後部音声信号を加えて最適
入力レベルの音声ディジタル信号とする手段とを備えた
ことを特徴とする音声入力装置。
2. A first to Nth amplifying means for amplifying an input audio signal with different amplification factors respectively, and an input audio signal amplified by the first to Nth amplifying means is converted into a digital signal and an audio digital signal. First to Nth A / D conversion means for outputting as signals, and signals from the start of input of the audio digital signals output by the first to Nth A / D conversion means to a predetermined time T Are stored as front audio signals, and a signal having an optimum input level is selected from the front audio signals stored in the first to Nth front memory means. Notifying means for notifying whether the signal is selected, and the first to Nth A's based on the notification from the notifying means.
Selecting means for selecting any one of the audio digital signals output from the D / D conversion means, and outputting as a rear audio signal from the time T of the selected audio digital signal to the end of the audio input. Which of the rear memory means for storing the rear audio signal output by the selecting means and the front audio signal stored in the first to Nth front memory means based on the notification from the notification means Means for selecting one of them and adding the rear audio signal stored in the rear memory means to the selected front audio signal to obtain an audio digital signal of an optimum input level. Voice input device.
【請求項3】 入力音声信号を増幅する増幅回路と、こ
の増幅回路により増幅された入力音声信号をディジタル
信号に変換し音声ディジタル信号として出力するA/D
変換回路と、このA/D変換回路の出力する音声ディジ
タル信号の入力開始から予め定められた時間Tまでの間
の信号を前部音声信号として記憶する前部メモリとを備
え、前記増幅回路の増幅率がそれぞれ異なる第1〜第N
の入力回路と、 この第1〜第Nの入力回路の前部メモリに記憶された前
部音声信号から最適な入力レベルの信号を選択しどの信
号を選択したかをゲイン選択信号として出力するゲイン
選択制御回路と、 このゲイン選択制御回路から出力されるゲイン選択信号
に基づいて前記第1〜第Nの入力回路のA/D変換回路
の出力する音声ディジタル信号のうち何れか一つを選択
し、この選択した音声ディジタル信号の前記時間Tの経
過後から音声入力が終了するまでを後部音声信号として
出力する選択回路と、 この選択回路の出力する後部音声信号を記憶する後部メ
モリと、 前記ゲイン選択制御回路からのゲイン選択信号に基づい
て前記第1〜第Nの入力回路の前部メモリの記憶してい
る前部音声信号のうち何れか一つを選択し、この選択し
た前部メモリ信号の後に前記後部メモリの記憶している
後部音声信号を加えて最適入力レベルの音声ディジタル
信号とし、この最適入力レベルの音声ディジタル信号か
ら特徴抽出を行う特徴抽出部とを備えたことを特徴とす
る音声入力装置。
3. An amplifier circuit for amplifying an input audio signal, and an A / D for converting the input audio signal amplified by this amplifier circuit into a digital signal and outputting it as an audio digital signal.
The amplifier circuit includes a conversion circuit and a front memory for storing a signal from the start of input of the audio digital signal output from the A / D conversion circuit to a predetermined time T as a front audio signal. 1st to Nth with different amplification factors
Of the input circuit and the front audio signal stored in the front memories of the first to Nth input circuits, and a gain for outputting a signal having an optimum input level selected as a gain selection signal. A selection control circuit and one of the audio digital signals output from the A / D conversion circuits of the first to Nth input circuits are selected based on the gain selection signal output from the gain selection control circuit. A selection circuit that outputs a rear audio signal from the time T of the selected audio digital signal until the end of audio input, a rear memory that stores the rear audio signal output by the selection circuit, and the gain Based on the gain selection signal from the selection control circuit, one of the front audio signals stored in the front memory of the first to Nth input circuits is selected, and the selected front audio signal is selected. A rear voice signal stored in the rear memory after the memory signal is added to form a voice digital signal having an optimum input level, and a feature extraction unit for performing feature extraction from the voice digital signal having the optimum input level is provided. And a voice input device.
JP6119724A 1994-05-10 1994-05-10 Sound input device Pending JPH07306694A (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP6119724A JPH07306694A (en) 1994-05-10 1994-05-10 Sound input device

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP6119724A JPH07306694A (en) 1994-05-10 1994-05-10 Sound input device

Publications (1)

Publication Number Publication Date
JPH07306694A true JPH07306694A (en) 1995-11-21

Family

ID=14768559

Family Applications (1)

Application Number Title Priority Date Filing Date
JP6119724A Pending JPH07306694A (en) 1994-05-10 1994-05-10 Sound input device

Country Status (1)

Country Link
JP (1) JPH07306694A (en)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2018186716A1 (en) * 2017-04-06 2018-10-11 김금철 Apparatus for collecting sounds in wide area without loss of sounds, and use method therefor
KR20200000414A (en) * 2019-12-24 2020-01-02 김금철 System and method for collecting sound

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS62272300A (en) * 1986-05-20 1987-11-26 日本電気株式会社 Voice recognition equipment
JPS63223696A (en) * 1987-03-12 1988-09-19 株式会社リコー Voice pattern generation system

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS62272300A (en) * 1986-05-20 1987-11-26 日本電気株式会社 Voice recognition equipment
JPS63223696A (en) * 1987-03-12 1988-09-19 株式会社リコー Voice pattern generation system

Cited By (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2018186716A1 (en) * 2017-04-06 2018-10-11 김금철 Apparatus for collecting sounds in wide area without loss of sounds, and use method therefor
CN110520926A (en) * 2017-04-06 2019-11-29 金金哲 Device and its application method of the sound without losing sound are collected in wide area
JP2020517204A (en) * 2017-04-06 2020-06-11 キム, クム チョルKIM, Geum Cheol Device and method for collecting sound in large area without loss
US11176920B2 (en) 2017-04-06 2021-11-16 Geum Cheol KIM Apparatus for collecting sounds in wide area without loss of sounds, and use method therefor
KR20200000414A (en) * 2019-12-24 2020-01-02 김금철 System and method for collecting sound

Similar Documents

Publication Publication Date Title
JPH0226240B2 (en)
US5018427A (en) Input apparatus of electronic system for extracting pitch data from compressed input waveform signal
JPH10257596A (en) Speech speed conversion method and its device
US20020173957A1 (en) Speech recognizer, method for recognizing speech and speech recognition program
JPH07306694A (en) Sound input device
US7219061B1 (en) Method for detecting the time sequences of a fundamental frequency of an audio response unit to be synthesized
JP2008048342A (en) Sound acquisition apparatus
JPS6257040B2 (en)
JPH0916193A (en) Speech-rate conversion device
JP3284968B2 (en) Hearing aid with speech speed conversion function
JPH0548475A (en) Squelch circuit
WO2002047067A3 (en) Improved speech transformation system and apparatus
JP2005064745A (en) Hearing aid device
JP2500761Y2 (en) Voice recognition device
JP4134844B2 (en) Hearing aids
JP2870421B2 (en) Hearing aid with speech speed conversion function
JP4882818B2 (en) Dynamics control device
JPH0894731A (en) Method and device for detecting direction of sound source
KR940005044B1 (en) Voice recognizing apparatus and voice recording method
JP3298193B2 (en) Effect adding device
BE1017236A3 (en) Delayed play back of voice sounds, used to prevent stuttering, comprises storing digitalized recorded sound fragment and converting into analogue signal for playing back with delay
JPS63223795A (en) Voice input device
JPH08180582A (en) Audio level controller
JPS6332595A (en) Echo muting apparatus
JP2020118913A (en) Electronic device