JP6123503B2 - 音声補正装置、音声補正プログラム、および、音声補正方法 - Google Patents

音声補正装置、音声補正プログラム、および、音声補正方法 Download PDF

Info

Publication number
JP6123503B2
JP6123503B2 JP2013121166A JP2013121166A JP6123503B2 JP 6123503 B2 JP6123503 B2 JP 6123503B2 JP 2013121166 A JP2013121166 A JP 2013121166A JP 2013121166 A JP2013121166 A JP 2013121166A JP 6123503 B2 JP6123503 B2 JP 6123503B2
Authority
JP
Japan
Prior art keywords
sound
conduction sound
correction
bone
air
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
JP2013121166A
Other languages
English (en)
Other versions
JP2014239346A (ja
Inventor
遠藤 香緒里
香緒里 遠藤
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Fujitsu Ltd
Original Assignee
Fujitsu Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Fujitsu Ltd filed Critical Fujitsu Ltd
Priority to JP2013121166A priority Critical patent/JP6123503B2/ja
Priority to EP14170645.7A priority patent/EP2811485A1/en
Priority to US14/291,850 priority patent/US20140363020A1/en
Publication of JP2014239346A publication Critical patent/JP2014239346A/ja
Application granted granted Critical
Publication of JP6123503B2 publication Critical patent/JP6123503B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04RLOUDSPEAKERS, MICROPHONES, GRAMOPHONE PICK-UPS OR LIKE ACOUSTIC ELECTROMECHANICAL TRANSDUCERS; DEAF-AID SETS; PUBLIC ADDRESS SYSTEMS
    • H04R3/00Circuits for transducers, loudspeakers or microphones
    • H04R3/04Circuits for transducers, loudspeakers or microphones for correcting frequency response
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L21/00Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
    • G10L21/02Speech enhancement, e.g. noise reduction or echo cancellation
    • G10L21/0208Noise filtering
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04RLOUDSPEAKERS, MICROPHONES, GRAMOPHONE PICK-UPS OR LIKE ACOUSTIC ELECTROMECHANICAL TRANSDUCERS; DEAF-AID SETS; PUBLIC ADDRESS SYSTEMS
    • H04R1/00Details of transducers, loudspeakers or microphones
    • H04R1/08Mouthpieces; Microphones; Attachments therefor

Landscapes

  • Engineering & Computer Science (AREA)
  • Signal Processing (AREA)
  • Physics & Mathematics (AREA)
  • Acoustics & Sound (AREA)
  • Computational Linguistics (AREA)
  • Quality & Reliability (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Multimedia (AREA)
  • Circuit For Audible Band Transducer (AREA)
  • Telephone Function (AREA)

Description

本発明は、装置に入力された音声の補正方法に関する。
周囲が騒がしい場所でユーザAが電話機などを用いてユーザBと通話した場合、気導マイクから入力されたユーザAの声に周囲の音が混入する。この場合、ユーザBは、使用している端末に届いた音声からユーザAの声を聞き取りづらい。そこで、気導マイクから入力された信号中の騒音を低減するための試みがされてきているが、Signal to Noise Ratio(SNR)が劣化している条件では、騒音だけでなくユーザの音声成分の強度まで下げてしまい、結果的に音声品質を劣化させてしまうことがある。骨導マイクを用いてユーザの音声を入力することも行われているが、骨導マイクでは、高域の音声の感度が低いので音声がこもって聞こえてしまう。さらに、骨導マイクがユーザに接触していない場合は、骨導マイクから音声が入力できないので、骨道マイクが搭載されている端末であっても、ユーザの持ち方などによっては骨導マイクからの入力ができない場合もあり得る。
そこで、気導マイクと骨導マイクを併用することも検討されてきている。例えば、気導マイクによって収音された音声信号、骨導マイクによって収音された音声信号、受話信号に基づいて周囲騒音レベルを求め、周囲騒音レベルに基づいて、気導マイクと骨導マイクのいずれかを選択する通信装置が知られている(例えば、特許文献1)。さらに、気導マイクから得られた気導出力成分と骨導マイクから得られた骨導出力成分を合成するマイクロホン装置も知られている。このマイクロホン装置は、外部騒音レベルが小さいときには骨導出力成分に対する気導出力成分の割合を大きくし、外部騒音レベルが大きいときには骨導出力成分に対する気導出力成分の割合を小さくする(例えば、特許文献2)。さらに、骨導マイクの出力レベルが気導マイクの出力レベルを超えたときに送話増幅回路を動作モードにする送受話装置も考案されている(例えば、特許文献3)。
特開平8−70344号公報 特開平8−214391号公報 特開2000−354284号公報
気導マイクと骨導マイクを併用しても、騒音が大きいなどの理由によりSNR値が低いときには、骨導マイクから出力された音声信号がユーザの音声として使用される。しかし、骨導マイクは高域の音声に対する感度が低いため、骨導マイクを用いると、こもったような聞きづらい音声になる。従って、SNR値が低い場合には、骨導マイクを使用してもユーザの音声が聞きづらくなってしまう。
本発明は、1つの側面では、騒音を低減した聞き取りやすい音声信号を生成することを目的とする。
実施形態に係る音声補正装置は、気導マイク、骨導マイク、算出部、記憶部、補正部、生成部を備える。気導マイクは、空気の振動を用いて気導音を収音する。骨導マイクは、ユーザの骨の振動を用いて骨導音を収音する。算出部は、前記気導音での前記ユーザの音声の雑音に対する比率を算出する。記憶部は、前記骨導音の周波数スペクトルを、前記比率が第1の閾値以上のときの気導音中の周波数スペクトルに一致させるための補正係数を記憶する。補正部は、前記骨導音を、前記補正係数を用いて補正する。生成部は、前記比率が第2の閾値より小さくなると、補正後の骨導音から出力信号を生成する。
騒音を低減し、聞き取りやすい音声信号を生成できる。
信号の種類を選択する方法の例を示すフローチャートである。 音声補正装置の構成の例を示す図である。 音声補正装置のハードウェア構成の例を示す図である。 第1の実施形態で行われる処理の例を示すフローチャートである。 フレームの生成方法の例と周波数スペクトルの生成例を示す図である。 補正係数データの例を示すテーブルである。 気導音と骨導音の強度の時間変化の例を示す図である。 接触検出部の処理の例を示すフローチャートである。 出力する音声の選択方法の例を示すテーブルである。 入力された音の種類の判断方法の例を説明する図である。 種別判定部の動作の例を説明するフローチャートである。 SNR算出部の動作の例を説明するフローチャートである。 骨導音補正部での補正の方法の例を説明する図である。 変動させた補正係数を用いて補正した骨導音の例を示す図である。 骨導音補正部が補正係数を変動させる方法の例を示すグラフである。 骨導音補正部が補正係数を変動させるときの処理の例を説明するフローチャートである。 出力する音声の選択方法の例を示すテーブルである。 第3の実施形態で行われる処理の例を説明するフローチャートである。
図1は、信号の種類を選択する方法の例を示す。実施形態にかかる音声補正装置は、気導マイクと骨導マイクの両方を備えているものとする。音声補正装置は、予め、雑音の影響が無視できる環境下で入力された音声を用いて、骨導マイクからの入力信号の周波数スペクトルを気導マイクからの入力信号の周波数スペクトルに一致させるための補正係数を保持している。例えば、気導マイクで得られた信号の強度を骨導マイクから得られた信号の強度で割った値が補正係数として用いられる。ここで、補正係数は、予め決められた幅の周波数帯域ごとに決定される。なお、以下の記載では、気導マイクからの入力信号を「気導音」、骨導マイクからの入力信号を「骨導音」と記載することがある。
音声補正装置に内蔵されている気導マイクからの入力があると、音声補正装置は、骨導マイクからの入力信号の大きさを用いて、骨導マイクがユーザに接触しているかを判定する(ステップS1)。骨導マイクがユーザに接触している場合、音声補正装置は、入力されている音声信号を所定の時間ごとのフレームに区切る。音声補正装置は、フレームごとに、入力信号が非定常騒音であるかを判定する(ステップS2)。ここで、「非定常騒音」は、音声補正装置に音声が入力されている期間中に定常的に発生していない雑音であり、音声の入力が行われている期間中にレベルが大幅に変化するものとする。非定常騒音は、例えば、アナウンスの音や電車などの発着により発生する雑音、乗用車のクラクションの音などを含む。なお、以下の説明では、音声補正装置に音声が入力されている期間中に定常的に発生している雑音のことを、「定常騒音」と記載することがある。収音された音が非定常騒音であるかの判定方法については、後で詳しく述べる。非定常騒音が含まれているフレームであると判定すると、音声補正装置は、骨導マイクからの入力信号を、記憶している補正係数を用いて補正する(ステップS2でYes)。この補正により、骨導音は、雑音が無視できる場合の気導音のスペクトルに近づけるように補正される(ステップS4)。音声補正装置は、補正後の骨導音を出力する(ステップS5)。
非定常騒音が含まれていないフレームであると判定すると、音声補正装置は、処理対象とするフレームでのSNRの値が閾値よりも小さいかを判定する(ステップS2でNo、ステップS3)。処理対象とするフレームでのSNRの値が閾値よりも小さい場合、音声補正装置は、ステップS4、S5の処理により、雑音が無視できる場合の気導音のスペクトルに近づけるように補正された骨導音を、得られた音声として出力する。
一方、SNRの値が閾値以上である場合は、音声補正装置は、騒音の低減処理を施した気導音を、得られた音声として出力する(ステップS3でNo、ステップS6)。また、骨導マイクがユーザに接触していない場合にも、音声補正装置は、騒音の低減処理を施した気導音を、得られた音声として出力する(ステップS1でNo、ステップS6)。
このように、実施形態にかかる音声補正装置は、非定常騒音がある場合やSNRが閾値未満である場合など、気導マイクから入力された音声での雑音の影響が大きいと予測される場合は、出力する音声を補正後の骨導音から生成する。このとき、骨導音は、雑音が無視できる場合の気導音に近づけるように補正される。このため、音声補正装置は、骨導音を用いて雑音を除去しつつ、骨導音での高域の周波数の感度を気導音に合わせて修正できる。従って、音声補正装置は、骨導音を用いる場合でも、高周波数の音声の強度を補正し、聞き取り易い音声を出力できる。
<装置構成>
図2は、音声補正装置10の構成の例を示す。音声補正装置10は、気導マイク20、骨導マイク25、記憶部30、音声処理部40を備える。音声処理部40は、フレーム生成部50、接触検出部41、種別判定部42、骨導音補正部43、SNR算出部44、騒音低減部45、生成部46を有する。フレーム生成部50は、分割部51と変換部52を有する。
気導マイク20は、気導マイク20の周辺で生じた空気の振動を用いて、音声を収音する。このため、気導マイク20は、音声補正装置10のユーザが発した音声を収音する他、音声補正装置10の周辺の定常騒音や非定常騒音も収音してしまう。骨導マイク25は、音声補正装置10のユーザの骨の振動を用いて収音するため、ユーザが発した音声を収音するが、定常騒音や非定常騒音は収音しない。
分割部51は、気導マイク20と骨導マイク25のそれぞれで収音された音声データを、フレームごとに分割する。ここで、「フレーム」は、音声補正装置10から出力する音声データを生成するための所定の時間単位である。音声補正装置10は、フレーム毎に、音声補正装置10の出力として使用する音声を気導音と骨導音のいずれに基づいて生成するかを決定する。各フレームには、フレームの順序を特定するための番号が付されているものとする。さらに、各フレームの番号は、そのフレームが示す期間の出力信号を生成するために使用可能な気導音の信号と骨導音の信号に対応付けられるものとする。変換部52は、各フレームについて、得られた気導音と骨導音のデータをフーリエ変換し、周波数スペクトルを生成する。各周波数スペクトルには、スペクトルの計算に使用されたデータが気導音と骨導音のいずれであるかと、周波数スペクトルの計算に用いられたデータが含まれるフレームの番号が対応付けられる。変換部52は、フレーム毎に得られた周波数スペクトルを接触検出部41に出力する。
接触検出部41は、フレーム毎に骨導マイク25がユーザに接触しているかを判定する。接触検出部41で骨導マイク25がユーザに接触していることが検出されたフレームでは、骨導マイク25で骨導音が収音されている。接触検出部41は、フレーム毎に、骨導音と気導音の間で入力信号の強度を比較することにより、ユーザが骨導マイク25に接触しているかを判定する。ここで、接触検出部41は、処理対象のフレームでの気導音の周波数スペクトルから各周波数帯域でのパワーを積算することにより、処理対象のフレームでの気導音の強度を得るものとする。接触検出部41は、骨導音についても同様に音声の強度を計算する。接触検出部41は、骨導マイク25がユーザに接触していないと判定すると、処理対象のフレームについて、騒音低減部45に気導音中の騒音の低減を要求し、さらに、騒音低減部45からの出力を音声補正装置10から出力する音声とすることを、生成部46に要求する。一方、接触検出部41は、骨導マイク25が接触していると判定したフレームについては、処理対象とした周波数スペクトルを、気導音と骨導音の両方について、種別判定部42に出力する。
種別判定部42は、フレーム毎に、気導音がユーザの音声、定常騒音、非定常騒音のいずれを主な要素として収音しているかを判定する。種別判定部42は、判定の際に、処理対象とするフレームについて、気導音と骨導音の間での入力信号の強度の差を用いる。なお、種別判定部42も、接触検出部41と同様に、周波数スペクトルから各フレームでの音声の強度を計算するものとする。種別判定部42で行われる判定の例については後述する。種別判定部42は、気導音に非定常騒音が収音されていると判定したフレームについて、骨導音補正部43に骨導音の補正を要求するとともに、骨導音補正部43からの出力を音声補正装置10から出力する音声とすることを、生成部46に要求する。一方、気導音として主にユーザの音声が収音されていると判定したフレームに対しては、種別判定部42は、SNR算出部44に気導音でのSNRの算出を要求する。なお、種別判定部42は、SNR算出部44が定常騒音の大きさの平均を算出することができるように、定常騒音が収音されているフレームで得られた気導音の周波数スペクトルを、SNR算出部44に出力する。
骨導音補正部43は、種別判定部42やSNR算出部44からの要求に応じて、骨導音を補正する。このとき、骨導音補正部43は、種別判定部42から骨導音の周波数スペクトルを取得するものとする。さらに、骨導音補正部43は、補正係数データ31を用いる。骨導音の補正方法の例については後述する。骨導音補正部43は、補正後の骨導音の周波数スペクトルを生成部46に出力する。
SNR算出部44は、種別判定部42からの要求に応じて、気導音について、フレームごとのSNR値を計算する。このとき、SNR算出部44は、接触検出部41や種別判定部42と同様に、周波数スペクトルから各フレームでの音声の強度を計算し、定常騒音区間のフレームについて音声強度の平均値を求める。SNR算出部44は、SNR値を求める対象の音声区間のフレームから得られた気導音の音声の強度を、定常騒音区間のフレームでの音声強度の平均値で割ることにより、音声区間内のフレームと判定された気導音の各フレームについて、SNR値を求める。SNR算出部44は、各フレームについて得られたSNR値を閾値と比較する。SNR値が閾値以上の場合、SNR算出部44は、処理対象のフレームについては、騒音低減部45に対して気導音中の騒音の低減を要求するとともに、騒音低減部45からの出力を音声補正装置10から出力する音声とすることを、生成部46に要求する。一方、SNR値が閾値未満の場合、SNR算出部44は、処理対象のフレームについて、骨導音補正部43に骨導音の補正を要求するとともに、骨導音補正部43からの出力を音声補正装置10から出力する音声とすることを、生成部46に要求する。
騒音低減部45は、フレーム毎に、気導音中の定常騒音を低減するための処理を行う。例えば、騒音低減部45は、スペクトルサブトラクション法、ウィーナーフィルタリング法など、既知の任意の処理を用いて定常騒音を軽減することができるものとする。騒音低減部45は、雑音を低減した後の気導音の周波数スペクトルを生成部46に出力する。
生成部46は、騒音低減部45および骨導音補正部43から入力されたデータから、フレーム毎に、そのフレームで得られたデータとして採用する音声についての周波数スペクトルを取得する。生成部46は、得られたスペクトルを逆フーリエ変換することにより、時間領域のデータを生成する。生成部46は、得られた時間領域のデータを音声補正装置10から出力する音声として取り扱う。例えば、音声補正装置10が携帯電話端末などの通信装置である場合、生成部46は、処理により得られた時間領域の音声データを、通信装置から送信する対象として、音声符号化などの処理を行うプロセッサなどに出力することができる。
記憶部30は、骨導音の補正に使用する補正係数データ31や、骨導音の補正に使用するデータを保持する。さらに、記憶部30は、音声処理部40の処理に用いられるデータ、および、音声処理部40の処理により得られたデータを格納できる。
図3は、音声補正装置10のハードウェア構成の例を示す図である。音声補正装置10は、プロセッサ6、メモリ9、気導マイク20、骨導マイク25を含む。音声補正装置10は、さらにオプションとして、アンテナ1、無線処理回路2、digital to analog(D/A)コンバータ3、Analog-to-digital(A/D)コンバータ7(7a〜7c)、アンプ8(8a、8b)を備えても良い。図3に示すように音声補正装置10がアンテナ1や無線処理回路2などを備える場合、音声補正装置10は、携帯端末装置などの無線通信に対応した通信装置である。
プロセッサ6は、音声処理部40として動作する。なお、音声補正装置10が無線通信を行う装置である場合、プロセッサ6は、さらに、ベースバンド信号の処理や、音声符号化などの処理も行う。無線処理回路2は、アンテナ1を介して受信したRF信号を復変調する。D/Aコンバータ3は、入力されたアナログ信号をデジタル信号に変換する。メモリ9は、記憶部30として動作し、プロセッサ6の処理に使用するデータや、プロセッサ6の処理で得られたデータを保持する。さらに、メモリ9は、音声補正装置10で動作するプログラムを格納することもできる。プロセッサ6は、メモリ9に格納されているプログラムを読み込んで動作することにより、音声処理部40として動作する。
アンプ8aは、気導マイク20から入力されたアナログ信号を増幅して、A/Dコンバータ7aに出力する。A/Dコンバータ7aは、アンプ8aから入力された信号を音声処理部40に出力する。アンプ8bは、骨導マイク25から入力されたアナログ信号を増幅して、A/Dコンバータ7bに出力する。A/Dコンバータ7bは、アンプ8bから入力された信号を音声処理部40に出力する。
<第1の実施形態>
図4は、第1の実施形態で行われる処理の例を示すフローチャートである。まず、分割部51は、気導マイク20と骨導マイク25から入力信号を取得し、フレームに分割する(ステップS11)。接触検出部41は、処理対象フレームについて、気導マイク20と骨導マイク25の各々からの入力信号を取得する(ステップS12、S13)。接触検出部41は、処理対象フレームで、骨導マイク25がユーザに接触しているかを判定する(ステップS14)。骨導マイク25がユーザに接触している場合、種別判定部42は、処理対象フレームにおいて、気導音に非定常騒音が含まれているかを判定する(ステップS14でYes、ステップS15)。非定常騒音が含まれていないと判定されたフレームについては、SNR算出部44がSNR値を計算し、SNR値が閾値未満であるかを判定する(ステップS15でNo、ステップS16)。SNR値が閾値未満である場合、生成部46は、処理対象フレームでの音声の出力を、補正後の骨導音の信号とする(ステップS16でYes、ステップS17)。一方、SNR値が閾値以上である場合、生成部46は、処理対象フレームでの音声の出力を、騒音を低減した後の気導音の信号とする(ステップS16でNo、ステップS18)。さらに、処理フレームに非定常騒音が含まれていると判定された場合、生成部46は、処理対象フレームでの音声の出力を、補正後の骨導音の信号とする(ステップS15でYes、ステップS17)。なお、骨導マイク25がユーザに接触していない場合、生成部46は、処理対象フレームでの音声の出力を、騒音を低減した後の気導音の信号とする(ステップS14でNo、ステップS18)。
以下、第1の実施形態を、補正係数の算出、出力音声の選択、骨導音の補正に分けて、音声補正装置10で行われる処理の例を詳しく説明する。
〔補正係数の算出〕
第1の実施形態に係る音声補正装置10は、予め、雑音が無視できる環境下で気導音と骨導音を観測し、骨導音の周波数スペクトルを雑音が無視できる環境下での気導音の周波数スペクトルに一致させるための補正係数データ31を求めている。ここで、雑音が無視できるとは、気導音についてのSNR値が所定の閾値を上回っていることを指すものとする。音声補正装置10は、例えば、初期化されたときや、ユーザから補正係数データ31の計算が要求された場合に、補正係数を求める。なお、ユーザは、例えば、音声補正装置10に備えられた入力デバイス(図示せず)を用いて、音声補正装置10に補正係数データ31の計算を要求することができるものとする。
図5は、フレームの生成方法の例と周波数スペクトルの生成例を示す。例えば、分割部51に、図5のグラフG1に示す気導マイク20からの出力信号の時間変化と、グラフG2に示す骨導マイク25からの出力信号の時間変化が入力されたとする。分割部51は、気導音と骨導音の時間変化を、予め決められた長さのフレームに分割する。1つのフレームの長さは実装に応じて設定され、例えば、20m秒程度に設定される。図5中の長方形Aは、1つのフレームに含まれるデータの例である。各フレームには、気導音と骨導音のそれぞれについて、各フレームの期間と同じ期間の情報が対応付けられる。分割部51は分割した個々のデータに、気導音と骨導音のいずれのデータであるかを示すデータの種類と、フレームの番号に対応付けて変換部52に出力する。例えば、図5のAに示す長方形に含まれているデータは、t番目のフレームの気導音または骨導音として、変換部52に出力される。
変換部52は、フレーム毎に、気導音のデータをフーリエ変換し、1つのフレームの気導音のデータから1つの周波数スペクトルを求める。変換部52は、骨導音のデータについても同様に、フレーム毎にフーリエ変換し、周波数スペクトルを求める。補正係数の算出中は、変換部52は、得られた周波数スペクトルを骨導音補正部43に出力するものとする。このとき、変換部52は、個々の周波数スペクトルについて、スペクトルの生成に用いたデータを含むフレームの番号と、データの種類を関連付けて、骨導音補正部43に通知するものとする。
骨導音補正部43は、予め決められた数の気導音の周波数スペクトルを平均することにより、気導音の平均振幅スペクトルを計算する。図5中のグラフG3は、平均振幅スペクトルの例であり、グラフG3の実線は、気導音の平均振幅スペクトルの例である。例えば、気導音や骨導音が観測される周波数帯域を、フーリエ変換のポイント数の半分の数の帯域に分けたとする。このとき、i番目の周波数帯域での気導音の平均振幅(Fave_a(i))は次式で求められる。
Figure 0006123503
骨導音補正部43は、骨導音についても同様の処理を行うことにより、平均振幅スペクトルを計算する。骨導音の平均振幅スペクトルの例をグラフG3の破線で示す。また、i番目の周波数帯域での骨導音の平均振幅(Fave_b(i))は次式で求められる。
Figure 0006123503
骨導音補正部43は、同じ周波数帯域での気導音の平均振幅と骨導音の平均振幅に対する比を、その周波数帯域での補正係数とする。例えば、i番目の周波数帯域の補正係数(coef_f(i))は、次式で表される。
Figure 0006123503
骨導音補正部43は、得られた補正係数データ31を記憶部30に記録する。図6は、補正係数データ31の例を示すテーブルである。音声補正装置10は、補正係数を再計算するまで、記憶部30に記憶されている補正係数データ31を用いて骨導音の補正を行う。
なお、ここでは、一例として、音声補正装置10が補正係数を計算して記憶するケースを説明したが、補正係数の算出は、音声補正装置10以外の装置で行うこともできる。他の装置で補正係数が計算された場合、音声補正装置10は、補正係数を求めた装置から補正係数を取得し、記憶部30に記憶する。補正係数の取得は、無線通信を含む任意の方法で行われるものとする。
〔出力音声の選択〕
次に、音声補正装置10が出力する音声を選択する方法について説明する。
図7は、気導音と骨導音の強度の時間変化の例を示す。図7のPaは、アンプ8aおよびA/Dコンバータ7aを介して得られた気導音の強度の時間変化の例を表すものとする。一方、Pbは、アンプ8bおよびA/Dコンバータ7bを介して得られた骨導音の強度の時間変化の例を表す。骨導マイク25がユーザに接触していない場合は、気導マイク20にユーザからの音声が入力されても、骨導マイク25には音声が入力されない。このため、骨導マイク25がユーザに接触していない場合は、図7の時刻T1以前に示すように、気導音の強度に比べて骨導音の強度が著しく小さくなる。そこで、接触検出部41は、フレーム毎に、気導音の強度に対する骨導音の強度の差を計算することにより、骨導マイク25がユーザに接触していることを検出する。
以下、各フレームについて、骨導マイク25がユーザに接触しているかが判定されるときの処理の例を説明する。補正係数の算出以外の場合も、気導マイク20や骨導マイク25から出力された音声信号は、分割部51でフレームに合わせて分割され、変換部52でフレームごとの周波数スペクトルに変換される。変換部52は、得られた周波数スペクトルを、フレームの番号とデータの種類を示す情報とともに、接触検出部41に出力する。
接触検出部41は、処理対象のフレームでの気導音の周波数スペクトルから各周波数帯域でのパワーを積算することにより、処理対象のフレームでの気導音の強度を計算する。接触検出部41は、骨導音についても同様に音声の強度を計算する。接触検出部41は、気導音の強度と骨導音の強度の比を求める。接触検出部41は、得られた比が閾値Tht未満であるフレームについては、骨導マイク25がユーザに接触していると判定する。なお、気導音の強度と骨導音の強度のいずれもデシベル単位で求めた場合、接触検出部41は、気導音の強度と骨導音の強度の差を閾値Thtと比較しても良い。ここで、閾値Thtは、骨導音が気導音よりも十分に小さいと判定できる任意の値である。なお、閾値Thtは、分割部51に入力される気導音と骨導音の強度に合わせて設定されるので、気導マイク20に接続されているアンプ8aのゲインや、骨導マイク25に接続されているアンプ8bのゲインも考慮されている。例えば、閾値Thtは30dB程度に設定されても良い。
図8は、接触検出部41の処理の例を示すフローチャートである。なお、ステップS21とS22の順序は変更されても良い。接触検出部41は、変換部52から、t番目のフレームについての気導音の周波数スペクトルを取得し、t番目のフレームでの気導音の強度Pa(dB)を求める(ステップS21)。次に、接触検出部41は、変換部52から、t番目のフレームでの骨導音の周波数スペクトルを取得し、t番目のフレームでの骨導音の強度Pb(dB)を求める(ステップS22)。接触検出部41は、デシベル単位で表した気導音の強度と骨導音の強度の差を求め、得られた値を閾値Thtと比較する(ステップS23)。デシベル単位で表した気導音の強度と骨導音の強度の差が閾値Thtよりも大きい場合、接触検出部41は、骨導マイク25がユーザに接触していないと判定する(ステップS23でYes、ステップS24)。接触検出部41は、骨導マイク25がユーザに接触していないと判定したフレームについて、気導音の周波数スペクトルを騒音低減部45に出力する(ステップS25)。さらに、接触検出部41は、骨導マイク25がユーザに接触していないと判定したフレームの番号を生成部46に通知し、その番号のフレームについては、騒音低減部45から得られた信号を音声信号の生成に使用することを要求する(ステップS26)。
一方、デシベル単位で表した気導音の強度と骨導音の強度の差が閾値Tht以下である場合、接触検出部41は、骨導マイク25がユーザに接触しており、骨導マイク25からの入力が検出されていると判定する(ステップS23でNo、ステップS27)。接触検出部41は、骨導マイク25がユーザに接触していると判定したフレームについては、気導音と骨導音の両方について、周波数スペクトルを種別判定部42に出力する。
図9は、出力する音声の選択方法の例を示す。接触検出部41により、骨導マイク25がユーザに接触していないと判定されると、非定常騒音の有無やSNRの値の大きさに係らず、騒音の低減処理後の気導音が音声補正装置10から出力される。一方、接触検出部41によって、骨導マイク25がユーザに接触していると判定されると、種別判定部42により、フレーム中に非定常騒音が含まれているかが判定される。
図10は、入力された音の種類の判断方法の例を示す。図10中のグラフG4は、骨導マイク25がユーザに接触している状況下で非定常騒音が発生したときについての、気導音と骨導音の強度変化の例を示す。ここで、グラフG4は、音声補正装置10のユーザが時刻T4より前は音声補正装置10に音声を入力しておらず、時刻T4以降に音声を音声補正装置10に入力している場合を示している。また、時刻T2〜T3と、時刻T5〜T6では、非定常騒音が発生している。グラフG4の時刻T4以降のように、ユーザの音声が音声補正装置10に入力された場合は、気導マイク20と骨導マイク25のいずれにも音声が入力されるので、気導マイク20からの出力も骨導マイク25からの出力も大きくなる。
非定常騒音は、定常騒音よりも大きな音であることが多い。このため、気導マイク20が非定常騒音を収音すると、Paについての時刻T2〜T3や時刻T5〜T6での変化のように、気導マイク20からの出力は大きくなると考えられる。しかし、非定常騒音は骨導マイク25では収音されない。このため、Pbについての時刻T2〜T3や時刻T5〜T6では大きな変化が見られないように、非定常騒音が音声補正装置10に入力されても骨導マイク25からの出力には影響がない。
ユーザが音声補正装置10を使用している場所で発生している定常騒音も、骨導マイク25では収音されない。このため、時刻T4までに定常騒音が音声補正装置10に入力されても、時刻T4までの骨導マイク25からの出力は小さいままである。定常騒音はユーザの音声に比べても小さいため、気導マイク20が定常騒音を収音しても、時刻T2以前や時刻T3〜T4でのPaの変化から読み取れるように、気導マイク20からの出力は小さいままである。
従って、種別判定部42は、図10のテーブルTa1に示す基準を用いて、接触検出部41から入力されたフレームに収音された音声の種類を判定できる。例えば、種別判定部42は、n番目のフレームの気導音と骨導音のいずれでも音声の大きさが大きい場合は、n番目のフレームにはユーザの音声が収音されていると判定する。一方、m番目のフレームの気導音と骨導音のいずれでも音声の大きさが小さい場合、種別判定部42は、m番目のフレームでは定常騒音が収音されていると判定する。さらに、p番目のフレームにおいて、気導音は大きいが骨導音の大きさが小さい場合、種別判定部42は、p番目のフレームでは非定常騒音が収音されていると判定する。
図11は、種別判定部42の動作の例を説明するフローチャートである。図11において、ステップS39とS40の順序は互いに入れ替えられても良く、ステップS42とS43も互いに順序が入れ替えられても良い。さらに、図11に示す例では、種別判定部42は、音声の種類を判定するために、音声判定閾値(Thav)と差分閾値(Thv)を用いる。音声判定閾値(Thav)は、定常騒音とみなす気導音の大きさの最大値を表す。音声判定閾値Thavは、例えば、−46dBovとすることができる。なお、dBovはデジタル信号のレベルの大きさを表す単位であり、音声信号をデジタル化したときにオーバーロードが生じる最初の信号レベルが0dBovとなる。差分閾値(Thv)は、骨導マイク25にユーザからの音声が入力されていると判定できる範囲の、気導音と骨導音の差分の最大値である。例えば、差分閾値Thvは、30dB程度に設定することができる。
処理を開始するときに種別判定部42は、変数tを0に設定する(ステップS31)。種別判定部42は、t番目のフレームについて気導音の周波数スペクトルを取得し、取得したスペクトルから求めた気導音の音声強度(Pa)を、音声判定閾値(Thav)と比較する(ステップS32、S33)。気導音のフレームの音声強度が、音声判定閾値Thav以下の場合、種別判定部42は、処理対象のフレームは定常騒音が収音されたものであると判定する(ステップS33でNo、ステップS34)。種別判定部42は、定常騒音が記録されていると判定したフレームの周波数スペクトルを、定常騒音区間のフレームであることを示す情報と対応付けてSNR算出部44に出力する(ステップS35)。
一方、処理対象のフレームにおいて、気導音の音声強度が閾値Thavを超えている場合、種別判定部42は、処理対象のフレームでの骨導音の周波数スペクトルを取得し、骨導音の音声強度(Pb)を求める(ステップS33でYes、ステップS36)。さらに、種別判定部42は、処理対象のフレームについての気導音と骨導音の強度の差(Pa−Pb)を閾値Thvと比較する(ステップS37)。なお、気導音の強度と骨導音の強度は、いずれもデシベル単位で求められているものとする。音声強度の差が閾値Thvより大きい場合、種別判定部42は、気導音に非定常騒音が含まれていると判定する(ステップS37でYes、ステップS38)。すると、種別判定部42は、処理対象のフレームでの骨導音の周波数スペクトルを、非定常騒音区間のフレームに含まれているデータから得られたスペクトルであることと、フレームの番号に対応づけて、骨導音補正部43に出力する(ステップS39)。さらに、種別判定部42は、t番目のフレームの期間についての出力信号の生成に、骨導音を補正することによって得られた音声を用いることを、生成部46に要求する(ステップS40)。
ステップS37において、音声強度の差が差分閾値Thv以下と判定された場合、種別判定部42は、処理対象のフレームについて、ユーザの音声が収音されていると判定する(ステップS37でNo、ステップS41)。種別判定部42は、処理対象のフレームにおける気導音のスペクトルを、音声区間であることを表す情報と、フレームの番号に対応づけて、SNR算出部44に出力する(ステップS42)。種別判定部42は、処理対象のフレームにおける骨導音の周波数スペクトルを、音声区間のフレームであることを表す情報と、フレームの番号に対応づけて、骨導音補正部43に出力する(ステップS43)。
ステップS35、S40、S43のいずれかの処理が終わると、種別判定部42は、変数tを、分割部51によって生成されたフレームの総数tmaxと比較する(ステップS44)。変数tの値がtmax未満の場合、種別判定部42は、変数tを1つインクリメントしてステップS32以降の処理を繰り返す(ステップS44でNo、ステップS45)。一方、変数tの値がtmax以上の場合、種別判定部42は、全てのフレームを処理したと判断して処理を終了する。(ステップS44でYes)。
図11のステップS40に示すように、種別判定部42は、非定常騒音区間であると判定されたフレームでは、生成部46に、骨導音補正部43で得られた音声を音声補正装置10の出力とするように要求する。ここで、種別判定部42は、非定常騒音が含まれているフレームでは、SNRの値の大きさに係らず、補正後の骨導音を音声補正装置10から出力される音声とすることを生成部46に要求する。このため、種別判定部42で非定常騒音が含まれていると判定されたフレームについては、図9に示すように、音声補正装置10は、補正後の骨導音を出力する。
図12は、SNR算出部44の動作の例を説明するフローチャートである。以下の説明では、SNR算出部44は、予め、閾値Thsを記憶しているものとする。閾値Thsは、SNRが良好な値であるかを判定するときの基準となる値であり、実装に応じて決定される。
SNR算出部44は、種別判定部42から、音声区間と判定されたフレームの気導音のスペクトルを取得したかを判定する(ステップS51)。音声区間の気導音のスペクトルを取得した場合、SNR算出部44は、種別判定部42から音声区間のフレームとして入力されたスペクトルを用いて、音声区間の気導音の平均パワーPv(dBov)を求める(ステップS51でYes、ステップS52)。例えば、t番目のフレームについての音声区間の気導音の平均パワーPv(t)は次式から計算できる。
Figure 0006123503
ここで、P(t)は、t番目のフレームについての気導音のパワーである。Pv(t―1)は、t−1番目のフレームについての音声区間の気導音の平均パワーであり、αは、t番目のフレームが音声区間の気導音の平均パワーに寄与する大きさを表す寄与係数である。寄与係数は実装に応じて、0≦α≦1を満たすように設定される。なお、SNR算出部44は、予め寄与係数αを記憶しているものとする。
一方、音声区間の気導音のスペクトルを取得していない場合、SNR算出部44は、取得した気導音のスペクトルは定常騒音区間のフレーム中のものかを判定する(ステップS51でNo、ステップS53)。入力されたスペクトルが定常騒音区間のフレームのデータから得られたスペクトルではない場合、SNR算出部44は処理を終了する(ステップS53でNo)。定常騒音区間のスペクトルが入力されたと判定すると、SNR算出部44は、定常騒音区間の平均パワーPn(dBov)を計算する(ステップS53でYes、ステップS54)。定常騒音区間の平均パワーPnは、例えば、次式で計算される。
Figure 0006123503
ここで、βは、t番目のフレームが定常騒音区間の気導音の平均パワーに寄与する大きさを表す寄与係数である。また、P(t)は、t番目のフレームについての気導音のパワーである。寄与係数は実装に応じて、0≦β≦1を満たすように設定される。SNR算出部44は、予め寄与係数βも記憶しているものとする。
SNR算出部44は、音声区間の気導音の平均パワーPvと定常騒音区間の平均パワーPnを用いて、SNRを計算する(ステップS55)。ここでは、音声区間の気導音の平均パワーPvと定常騒音区間の平均パワーPnのいずれもdBov単位で計算されているので、SNR=Pv−Pnとなる。
SNR算出部44は、得られたSNRの値を、予め記憶している閾値Thsと比較する(ステップS56)。SNRが閾値Thsよりも大きい場合、SNR算出部44は、SNRが良好であると判定し、種別判定部42から取得した気導音のスペクトルを騒音低減部45に出力する(ステップS57)。さらに、SNR算出部44は、騒音低減部45に出力したスペクトルに対応付けられたフレームの番号を生成部46に通知し、そのフレームでは騒音低減部45から得られた音声を、音声補正装置10から出力する音声とすることを要求する(ステップS58)。一方、SNRが閾値Ths以下の場合、SNR算出部44は、骨導音補正部43から得られた音声を、音声補正装置10から出力する音声とすることを、生成部46に要求する(ステップS59)。なお、ステップS59においても、SNR算出部44は、種別判定部42から取得したフレームの番号を、骨導音補正部43から得られた値を用いるフレームを特定する情報として、生成部46に通知するものとする。
図12のステップS57〜S58に示すように、SNR算出部44は、SNRが良好なフレームでは、生成部46に、騒音低減部45で得られた音声を音声補正装置10の出力とするように要求する。このため、図9に示すように、音声区間のフレームのうち、SNRの値が高いフレームでは、騒音低減後の気導音が音声補正装置10から出力される音声となる。図12のステップS59に示すように、SNR算出部44は、SNRが低いフレームに対しては、骨導音補正部43で得られた音声を音声補正装置10の出力とすることを、生成部46に要求する。SNR算出部44には、骨導音から得られたフレームは入力されていないが、図11を参照しながら説明したステップS43において、音声区間と判定された場合の骨導音のフレームは骨導音補正部43に出力されている。骨導音補正部43は、骨導音のスペクトルを、雑音が無視できるときの気導音のスペクトルに近づける補正をした後で、得られたデータを生成部46に出力する。このため、図9に示すように、音声区間のフレームのうち、SNRの値が低ければ、補正後の骨導音が音声補正装置10から出力される音声となる。
〔骨導音の補正〕
図13は、骨導音補正部43での補正の方法の例を説明する図である。t番目のフレームでの骨導音の周波数スペクトルは、図13のAに示すとおりであるとする。骨導音補正部43は、入力された周波数スペクトルを、予め保持している補正係数を求めるときに使用した周波数帯域に合わせて分割し、個々の周波数帯域についての振幅値を取得する。図13には、例として、x番目、y番目、z番目の周波数帯域とその振幅値を示す。以下では、周波数帯域の番号とフレームの番号を、括弧内に対にして記載する。例えば、図13に示す骨導音の周波数スペクトルはt番目のフレームから得られているので、x番目の周波数帯域を(x,t)と示す。同様に、t番目のフレームから得た周波数スペクトルのy番目の周波数帯域を(y,t)、t番目のフレームから得た周波数スペクトルのz番目の周波数帯域を(z,t)と記載する。
骨導音補正部43は、個々の周波数帯域について、次式を用いて補正後の骨導音の振幅を求める。
Figure 0006123503
なお、Fbmod(i,t)は、t番目のフレームから得た周波数スペクトルのi番目の周波数帯域について得られた振幅の補正値である。Fb(i,t)は、t番目のフレームから得た周波数スペクトルのi番目の周波数帯域での補正前の振幅値である。coef_f(i)は、i番目の周波数帯域についての補正係数である。骨導音補正部43が補正により得た値をプロットすると図13のBに示すグラフのようになる。
骨導マイク25は気導マイク20に比べて高周波数領域の振幅が小さいため、補正前の骨導音はこもったような音になる。しかし、周波数帯域ごとに補正係数を求めて補正することにより、高周波数の領域では低周波数の領域に比べて大きな値の補正係数を用いることができる。例えば、図13の例でx番目、y番目、z番目の周波数帯域について補正係数の値を比べると、
coef_f(x)≒coef_f(y)<coef_f(z)
となっている。このため、x番目やy番目の周波数帯域に比べて、z番目の周波数帯域では補正により振幅が増大する割合が大きくなっている。
骨導音補正部43は、骨導音の補正が終わると、得られたフレームを生成部46に出力する。生成部46は、種別判定部42かSNR算出部44から補正後の骨導音を音声補正装置10からの出力として使用することが要求されている場合は、骨導音補正部43から得られたフレームを音声補正装置10からの出力として使用する。生成部46は、各フレームについて使用する音声信号が決定すると、各フレームについて得られた周波数スペクトルを逆フーリエ変換することにより、時間の関数に変換する。生成部46は、逆フーリエ変換によって得られた信号を、ユーザから音声補正装置10に入力された音声の信号として扱う。
このように、実施形態にかかる音声補正装置は、非定常騒音がある場合やSNRが閾値未満である場合など、気導マイクから入力された音声への雑音の影響が大きい場合は、骨導音をSNRが良好な場合の気導音に近づけるように補正した音声を出力する。このとき、骨導音補正部43は、周波数スペクトルを複数の周波数領域に分けて求めた補正係数データ31を使用するので、骨導マイク25の特性により高周波数帯域の音が弱くならないように補正できる。このため、補正後の骨導音の音声は、ユーザや音声補正装置10の通信先のユーザなどに聞き取りやすい音声になる。
また、音声補正装置10は、骨導マイク25への入力の有無、非定常騒音の有無やSNRの値に応じて、出力する音声の種類をフレーム毎に変動させることができるので、騒音をきめ細かく除去することができる。
<第2の実施形態>
第2の実施形態では、リアルタイムに補正係数を変動させる場合の音声補正装置10の動作を説明する。
SNR算出部44は、第2の実施形態でも第1の実施形態と同様に、音声区間のフレームについての気導音のスペクトルが入力されるとフレームごとのSNRを求める。さらに、SNR算出部44は、SNR値が閾値Ths以下の場合には、周波数スペクトルを複数の周波数帯域に分割した上で、個々の周波数帯域についてSNR値を求める。以下、個々の周波数帯域についてSNR値の求め方を説明する。
第2の実施形態では、SNR算出部44は、定常騒音の周波数スペクトルを種別判定部42から取得すると、定常騒音の平均スペクトルを計算する。定常騒音の平均スペクトルの例を、図14のAに示す。SNR算出部44は、定常騒音の平均スペクトルを複数の周波数帯域に分け、周波数帯域ごとに定常騒音の強度の平均値を求める。
SNR算出部44は、フレーム全体としてはSNR値が閾値Ths以下であったフレームの気導音の周波数スペクトルについて、定常騒音のスペクトルと同様に周波数帯域ごとに強度を特定し、その帯域の定常騒音の強度の平均値で割る。例えば、SNR算出部44は、図14のBに示すような周波数スペクトルを音声区間中のフレームの気導音のスペクトルとして取得すると、周波数帯域ごとにSNR値を計算する。SNR算出部44は算出したSNR値を、SNR値が計算された周波数帯域に対応付けて、骨導音補正部43に通知する。以下、t番目のフレーム中のi番目の周波数帯域について得られたSNR値をSNR(i,t)と表す。骨導音補正部43は、得られたSNR値を用いて、周波数帯域ごとに補正係数を変動させる。
図15は、骨導音補正部43が補正係数を変動させる方法の例を示すグラフである。ここで、第2の実施形態にかかる音声補正装置10は、閾値SNRBlおよび閾値SNRBhの2つを記憶しているものとする。閾値SNRBlは、気導音の周波数スペクトルを用いてリアルタイムに補正係数を変動させることができる気導音のSNR値の最小値である。一方、閾値SNRBhは、リアルタイムに補正係数を変動させるときに、補正係数データ31を使用しないでも良いと判定できるSNR値の最小値である。骨導音補正部43は、周波数帯域ごとにSNR値を、閾値SNRBlおよび閾値SNRBhと比較する。
処理対象の周波数帯域についてのSNR値が閾値SNRBl以下であると、骨導音補正部43は、補正係数を補正せずに、補正係数データ31に含まれている値を補正係数として用いる。処理対象の周波数帯域についてのSNR値が閾値SNRBlと閾値SNRBhの間である場合、骨導音補正部43は、次式を用いて補正係数を修正する。
Figure 0006123503
ここで、coef_r(i,t)は、t番目のフレームについてのi番目の周波数帯域についての修正後の補正係数である。一方、coef_f(i)は、i番目の周波数帯域についての補正係数データ31に含まれている補正係数である。
さらに、処理対象の周波数帯域についてのSNR値が閾値SNRBh以上であると、骨導音補正部43は、補正係数データ31を使用せずに、処理対象の周波数帯域での気導音の強度を処理対象の周波数帯域での骨導音の強度に対する比を補正係数として用いる。
図14のCは、音声区間と判定されたフレームでの骨導音の周波数スペクトルの例である。図14のDは、図15で示す方法を用いて得られた修正後の補正係数により補正された骨導音のスペクトルである。図14の実線の矢印で示す区間では、周波数帯域ごとのSNR値が比較的良好である。このため、図14の実線の矢印で示す区間では、骨導音の強度が気導音の強度に近づくように修正されている。一方、図14の破線の矢印で示す区間では、周波数帯域ごとのSNR値が比較的悪い。このため、図14の破線の矢印で示す区間では、骨導音の強度が気導音の強度と一致するように補正されず、予め求められた補正係数データ31に基づいて補正されている。従って、SNR値が悪い区間では、気導音での雑音の影響が抑えられている一方、SNR値が良好な区間では、気導音に近づくように骨導音が修正される。このため、骨導音は、ユーザが聞き易くなるように補正される。
図16は、骨導音補正部が補正係数を変動させるときの処理の例を説明するフローチャートである。SNR算出部44は、定常騒音と判定されたフレームでの気導音の周波数スペクトルを用いて、定常騒音の平均振幅スペクトルを算出する(ステップS61)。SNR算出部44は、種別判定部42から、音声区間内と判定されたフレームについての気導音のスペクトルを取得する(ステップS62)。SNR算出部44は、種別判定部42から入力された気導音のスペクトルと定常騒音の平均周波数スペクトルを用いて、処理対象のフレームの気導音について、周波数帯域ごとのSNR値を算出する(ステップS63)。骨導音補正部43は、SNR算出部44から通知されたSNR値を用いて、周波数帯域ごとに補正係数を求め、得られた補正係数を用いて骨導音を補正する(ステップS64)。
第2の実施形態にかかる音声補正装置10では、フレーム中の周波数帯域ごとに補正係数を変動させることができるため、SNR値が良い周波数帯域ほど、骨導音の強度を気導音の強度に近づけることができる。さらに、SNR値が所定の値よりも悪い周波数帯域では、予め求めた補正係数データ31を用いた処理が行われる。このため、SNR値が低下しても骨導音の修正には影響が及ばない。このため、第2の実施形態では、リアルタイムにきめ細かな補正を骨導音に加えることができる。結果として、音声補正装置10から出力される音声は、騒音が抑えられた上に、ユーザまたはユーザの通信先にとって聞きやすく明瞭な音声にすることができる。
<第3の実施形態>
第3の実施形態では、音声信号の周波数帯域を低域と高域の2つに分けて処理することができる音声補正装置10の動作を説明する。
図17は、出力する音声の選択方法の例を示すテーブルである。第3の実施形態では、定常騒音下での音声を収音し、かつ、フレーム中でのSNR値が小さい場合については、低域では補正した骨導音を用い、高域では騒音を低減した気導音を用いる。音声補正装置10は、予め閾値となる周波数の値Thfrを記憶しており、閾値Thfrよりも低い周波数を低域、閾値Thfr以上の周波数を高域とするものとする。すなわち、生成部46は、定常騒音下での音声を収音し、さらにフレーム中でのSNR値が小さいフレームについては、低域の周波数成分の強度が補正後の骨導音と同じで、高域の周波数成分の強度が気導音と同じ値の合成信号を生成する。生成部46は、生成した合成信号をフーリエ変換することにより、時間領域の音声信号を、音声補正装置10からの出力として生成する。
なお、骨導マイク25がユーザに接触していないフレーム、非定常騒音が含まれているフレーム、フレーム全体においてSNR値が大きいフレームについて、生成部46が出力音声を生成するときに使用する対象は、第1および第2の実施形態と同様である。
図18は、第3の実施形態で行われる処理の例を説明するフローチャートである。なお、ステップS71とS72は順序を互いに変更することができる。
接触検出部41は、変換部52から処理対象のフレームについての気導音の周波数スペクトルと骨導音の周波数スペクトルを取得する(ステップS71、S72)。接触検出部41は、気導音と骨導音の周波数スペクトルの各々について積算処理を行うことにより、気導音と骨導音の強度を計算する(ステップS73)。骨導マイク25がユーザに接触していないと判定すると、接触検出部41は、生成部46に対し、出力信号を騒音低減処理後の気導音から生成することを要求する(ステップS74でNo、ステップS75)。
一方、骨導マイク25がユーザに接触している場合、種別判定部42は、処理対象のフレームに非定常騒音が収音されているかを判定する(ステップS74でYes、ステップS76)。非定常騒音が収音されている場合、骨導音補正部43は、対象フレームについて骨導音を補正する(ステップS77でYes、ステップS78)。種別判定部42は、非定常騒音が収音されていると判定すると、生成部46に対し、出力信号を補正後の骨導音とすることを要求し、生成部46は補正後の骨導音を出力対象とする(ステップS79)。
非定常騒音が収音されていない場合、SNR算出部44は、対象フレームについてSNR値を求め、SNR値が閾値Thsより大きいかを判定する(ステップS80、S81)。SNR値が閾値Thsより大きい場合、SNR算出部44は、生成部46に対し、出力信号を騒音低減処理後の気導音から生成することを要求する(ステップS81でYes、ステップS82)。
一方、SNR値が閾値Ths以下の場合、生成部46は、騒音低減部45から得られた騒音低減処理後の気導音を低域と高域に分け、高域分を出力信号として使用する(ステップS81でNo、ステップS83)。骨導音補正部43は、対象フレームについて骨導音を補正し、生成部46に出力する(ステップS84)。生成部46は、骨導音補正部43から得られた補正後の骨導音を低域と高域に分け、低域分を出力信号として使用する(ステップS85)。生成部46は、ステップS83〜S85で得られた信号を合せて逆フーリエ変換することにより、時間領域の音声信号を生成する(ステップS86)。
なお、第3の実施形態に係る音声補正装置10に含まれている骨導音補正部43は、第1および第2の実施形態のいずれの方法で骨導音を補正しても良い。
第3の実施形態では、骨導音では不明瞭になりやすい高周波数成分については騒音を低減した後の気導音を使用することにより、聞き取りやすく自然な音声を生成することができる。
<その他>
なお、本発明は上記の実施形態に限られるものではなく、様々に変形可能である。以下にその例をいくつか述べる。
例えば、分割部51は、フレームの番号の変わりに、そのフレームに含まれているデータの取得期間を示す情報を、分割した個々のデータに関連付けても良い。
さらに、以上の説明で使用したテーブルやデータは一例であり、実装に応じて任意に変更されることがあるものとする。
上述の各実施形態に対し、さらに以下の付記を開示する。
(付記1)
空気の振動を用いて気導音を収音する気導マイクと、
ユーザの骨の振動を用いて骨導音を収音する骨導マイクと、
前記気導音での前記ユーザの音声の雑音に対する比率を算出する算出部と、
前記骨導音の周波数スペクトルを、前記比率が第1の閾値以上のときの気導音中の周波数スペクトルに一致させるための補正係数を記憶する記憶部と、
前記骨導音を、前記補正係数を用いて補正する補正部と、
前記比率が第2の閾値より小さくなると、補正後の骨導音から出力信号を生成する生成部
を備えることを特徴とする音声補正装置。
(付記2)
収音が行われた期間を複数のフレームに分割するとともに、前記骨導音と前記気導音を前記複数のフレームに合わせて分割する分割部と、
処理対象のフレームである対象フレームに合わせて分割された気導音の大きさと、前記対象フレームに合わせて分割された骨導音の大きさの差が第3の閾値以上であると、前記対象フレームで非定常的に発生した騒音が収音されたと判定する判定部
を備え、
前記生成部は、前記対象フレームに非定常的な騒音が収音された場合、前記補正後の骨導音から前記対象フレームに対応する音声信号を生成する
ことを特徴とする付記1に記載の音声補正装置。
(付記3)
前記算出部は、
前記対象フレームに非定常的な騒音が収音されていないと判定された場合、前記対象フレームの気導音についての前記比率を求め、
前記対象フレームの気導音についての前記比率が前記第2の閾値以上である場合、前記生成部に、前記対象フレームの気導音のデータを用いて前記対象フレームに対応する音声信号を生成することを要求する
ことを特徴とする付記2に記載の音声補正装置。
(付記4)
前記生成部は、前記対象フレームに非定常的な騒音が収音されていないと判定され、かつ、前記対象フレームの気導音についての前記比率が前記第2の閾値未満である場合、補正後の骨導音と気導音から合成信号を生成し、
前記合成信号は、所定の周波数よりも低い周波数成分の強度が前記補正後の骨導音と同じ値であり、前記所定の周波数以上の周波数成分の強度が前記気導音と同じ値であり、
前記生成部は、前記合成信号から前記対象フレームに対応する音声信号を生成する
ことを特徴とする付記2または3に記載の音声補正装置。
(付記5)
前記対象フレームでの気導音を第1の周波数スペクトルに変換するとともに、前記対象フレームでの骨導音を第2の周波数スペクトルに変換する変換部をさらに備え、
前記算出部は、前記複数のフレームのうちで気導音の強度が第4の閾値以下のフレームを定常的な騒音が収音されたフレームとして、前記定常的な騒音の周波数スペクトルである騒音スペクトルを求め、
前記補正部は、
前記第1の周波数スペクトル、前記第2の周波数スペクトル、前記騒音スペクトルの各々を複数の帯域に分割し、
前記第1の周波数スペクトルの値が前記騒音スペクトルより第5の閾値以上大きい第1の帯域では、前記第1の帯域についての補正係数を、前記第1の帯域での前記第1の周波数スペクトルの値と前記第1の帯域での前記第2の周波数スペクトルの値の比に近づけた修正値を求め、
前記第2の周波数スペクトルの前記第1の帯域の値を、前記修正値を用いて補正し、
前記騒音スペクトルの値と第5の閾値の和よりも前記第1の周波数スペクトルの値が小さい第2の帯域では、前記第2の周波数スペクトルの前記第2の帯域の値を、前記第2の帯域についての補正係数を用いて補正する
ことを特徴とする付記2〜4のいずれか1項に記載の音声補正装置。
(付記6)
空気の振動を用いて気導音を収音する気導マイクと、
ユーザの骨の振動を用いて骨導音を収音する骨導マイクと、
前記気導音と骨導音を処理するプロセッサと、
前記プロセッサが使用するデータを記憶するメモリ
を備え、
前記プロセッサは、前記気導音での前記ユーザの音声の雑音に対する比率を算出し、
前記メモリは、前記骨導音の周波数スペクトルを、前記比率が第1の閾値以上のときの気導音中の周波数スペクトルに一致させるための補正係数を記憶し、
前記プロセッサは、
前記骨導音を、前記補正係数を用いて補正し、
前記比率が第2の閾値より小さくなると、補正後の骨導音から出力信号を生成する
ことを特徴とする音声補正装置。
(付記7)
空気の振動を用いて気導音を収音する気導マイクと、ユーザの骨の振動を用いて骨導音を収音する骨導マイクを備える音声補正装置に、
前記気導音での前記ユーザの音声の雑音に対する比率を算出し、
前記骨導音の周波数スペクトルを、前記比率が第1の閾値以上のときの気導音中の周波数スペクトルに一致させるための補正係数を取得し、
前記骨導音を、前記補正係数を用いて補正し、
前記比率が第2の閾値より小さくなると、補正後の骨導音から出力信号を生成する
処理を行わせることを特徴とする音声補正プログラム。
(付記8)
収音が行われた期間を複数のフレームに分割し、
前記骨導音と前記気導音を前記複数のフレームに合わせて分割し、
処理対象のフレームである対象フレームに合わせて分割された気導音の大きさと、前記対象フレームに合わせて分割された骨導音の大きさの差が第3の閾値以上であると、前記対象フレームで非定常的に発生した騒音が収音されたと判定し、
前記対象フレームに非定常的な騒音が収音された場合、前記補正後の骨導音から前記対象フレームに対応する音声信号を生成する
ことを特徴とする付記7に記載の音声補正プログラム。
(付記9)
前記対象フレームに非定常的な騒音が収音されていない場合、前記対象フレームの気導音についての前記比率を求め、
前記対象フレームの気導音についての前記比率が前記第2の閾値以上である場合、前記対象フレームの気導音のデータを用いて前記対象フレームに対応する音声信号を生成する
ことを特徴とする付記8に記載の音声補正プログラム。
(付記10)
前記対象フレームに非定常的な騒音が収音されておらず、かつ、前記対象フレームの気導音についての前記比率が前記第2の閾値未満である場合、補正後の骨導音と気導音から合成信号を生成し、
前記合成信号は、所定の周波数よりも低い周波数成分の強度が前記補正後の骨導音と同じ値であり、前記所定の周波数以上の周波数成分の強度が前記気導音と同じ値であり、
前記合成信号から前記対象フレームに対応する音声信号を生成する
ことを特徴とする付記8または9に記載の音声補正プログラム。
(付記11)
前記対象フレームでの気導音を第1の周波数スペクトルに変換し、
前記対象フレームでの骨導音を第2の周波数スペクトルに変換し、
前記複数のフレームのうちで気導音の強度が第4の閾値以下のフレームを定常的な騒音が収音されたフレームとして扱うことにより、前記定常的な騒音の周波数スペクトルである騒音スペクトルを求め、
前記第1の周波数スペクトル、前記第2の周波数スペクトル、前記騒音スペクトルの各々を複数の帯域に分割し、
前記第1の周波数スペクトルの値が前記騒音スペクトルより第5の閾値以上大きい第1の帯域では、前記第1の帯域についての補正係数を、前記第1の帯域での前記第1の周波数スペクトルの値と前記第1の帯域での前記第2の周波数スペクトルの値の比に近づけた修正値を求め、
前記第2の周波数スペクトルの前記第1の帯域の値を、前記修正値を用いて補正し、
前記騒音スペクトルの値と第5の閾値の和よりも前記第1の周波数スペクトルの値が小さい第2の帯域では、前記第2の周波数スペクトルの前記第2の帯域の値を、前記第2の帯域についての補正係数を用いて補正する
ことを特徴とする付記8〜10のいずれか1項に記載の音声補正プログラム。
(付記12)
空気の振動を用いて気導音を収音する気導マイクと、ユーザの骨の振動を用いて骨導音を収音する骨導マイクを備える音声補正装置に、
前記気導音での前記ユーザの音声の雑音に対する比率を算出し、
前記骨導音の周波数スペクトルを、前記比率が第1の閾値以上のときの気導音中の周波数スペクトルに一致させるための補正係数を取得し、
前記骨導音を、前記補正係数を用いて補正し、
前記比率が第2の閾値より小さくなると、補正後の骨導音から出力信号を生成する
処理を行わせることを特徴とする音声補正方法。
1 アンテナ
2 無線処理回路
3 D/Aコンバータ
6 プロセッサ
7 A/Dコンバータ
8 アンプ
9 メモリ
10 音声補正装置
20 気導マイク
25 骨導マイク
30 記憶部
31 補正係数データ
40 音声処理部
41 接触検出部
42 種別判定部
43 骨導音補正部
44 SNR算出部
45 騒音低減部
46 生成部
50 フレーム生成部
51 分割部
52 変換部

Claims (7)

  1. 空気の振動を用いて気導音を収音する気導マイクと、
    ユーザの骨の振動を用いて骨導音を収音する骨導マイクと、
    前記気導音での前記ユーザの音声の雑音に対する比率を算出する算出部と、
    前記骨導音の周波数スペクトルを、前記比率が第1の閾値以上のときの気導音中の周波数スペクトルに一致させるための補正係数を記憶する記憶部と、
    前記骨導音を、前記補正係数を用いて補正する補正部と、
    前記比率が第2の閾値より小さくなると、補正後の骨導音から出力信号を生成する生成部
    を備えることを特徴とする音声補正装置。
  2. 収音が行われた期間を複数のフレームに分割するとともに、前記骨導音と前記気導音を前記複数のフレームに合わせて分割する分割部と、
    処理対象のフレームである対象フレームに合わせて分割された気導音の大きさと、前記対象フレームに合わせて分割された骨導音の大きさの差が第3の閾値以上であると、前記対象フレームで非定常的に発生した騒音が収音されたと判定する判定部
    を備え、
    前記生成部は、前記対象フレームに非定常的な騒音が収音された場合、前記補正後の骨導音から前記対象フレームに対応する音声信号を生成する
    ことを特徴とする請求項1に記載の音声補正装置。
  3. 前記算出部は、
    前記対象フレームに非定常的な騒音が収音されていないと判定された場合、前記対象フレームの気導音についての前記比率を求め、
    前記対象フレームの気導音についての前記比率が前記第2の閾値以上である場合、前記生成部に、前記対象フレームの気導音のデータを用いて前記対象フレームに対応する音声信号を生成することを要求する
    ことを特徴とする請求項2に記載の音声補正装置。
  4. 前記生成部は、前記対象フレームに非定常的な騒音が収音されていないと判定され、かつ、前記対象フレームの気導音についての前記比率が前記第2の閾値未満である場合、補正後の骨導音と気導音から合成信号を生成し、
    前記合成信号は、所定の周波数よりも低い周波数成分の強度が前記補正後の骨導音と同じ値であり、前記所定の周波数以上の周波数成分の強度が前記気導音と同じ値であり、
    前記生成部は、前記合成信号から前記対象フレームに対応する音声信号を生成する
    ことを特徴とする請求項2または3に記載の音声補正装置。
  5. 前記対象フレームでの気導音を第1の周波数スペクトルに変換するとともに、前記対象フレームでの骨導音を第2の周波数スペクトルに変換する変換部をさらに備え、
    前記算出部は、前記複数のフレームのうちで気導音の強度が第4の閾値以下のフレームを定常的な騒音が収音されたフレームとして、前記定常的な騒音の周波数スペクトルである騒音スペクトルを求め、
    前記補正部は、
    前記第1の周波数スペクトル、前記第2の周波数スペクトル、前記騒音スペクトルの各々を複数の帯域に分割し、
    前記第1の周波数スペクトルの値が前記騒音スペクトルより第5の閾値以上大きい第1の帯域では、前記第1の帯域についての補正係数を、前記第1の帯域での前記第1の周波数スペクトルの値と前記第1の帯域での前記第2の周波数スペクトルの値の比に近づけた修正値を求め、
    前記第2の周波数スペクトルの前記第1の帯域の値を、前記修正値を用いて補正し、
    前記騒音スペクトルの値と第5の閾値の和よりも前記第1の周波数スペクトルの値が小さい第2の帯域では、前記第2の周波数スペクトルの前記第2の帯域の値を、前記第2の帯域についての補正係数を用いて補正する
    ことを特徴とする請求項2〜4のいずれか1項に記載の音声補正装置。
  6. 空気の振動を用いて気導音を収音する気導マイクと、ユーザの骨の振動を用いて骨導音を収音する骨導マイクを備える音声補正装置に、
    前記気導音での前記ユーザの音声の雑音に対する比率を算出し、
    前記骨導音の周波数スペクトルを、前記比率が第1の閾値以上のときの気導音中の周波数スペクトルに一致させるための補正係数を取得し、
    前記骨導音を、前記補正係数を用いて補正し、
    前記比率が第2の閾値より小さくなると、補正後の骨導音から出力信号を生成する
    処理を行わせることを特徴とする音声補正プログラム。
  7. 空気の振動を用いて気導音を収音する気導マイクと、ユーザの骨の振動を用いて骨導音を収音する骨導マイクを備える音声補正装置に、
    前記気導音での前記ユーザの音声の雑音に対する比率を算出し、
    前記骨導音の周波数スペクトルを、前記比率が第1の閾値以上のときの気導音中の周波数スペクトルに一致させるための補正係数を取得し、
    前記骨導音を、前記補正係数を用いて補正し、
    前記比率が第2の閾値より小さくなると、補正後の骨導音から出力信号を生成する
    処理を行わせることを特徴とする音声補正方法。
JP2013121166A 2013-06-07 2013-06-07 音声補正装置、音声補正プログラム、および、音声補正方法 Active JP6123503B2 (ja)

Priority Applications (3)

Application Number Priority Date Filing Date Title
JP2013121166A JP6123503B2 (ja) 2013-06-07 2013-06-07 音声補正装置、音声補正プログラム、および、音声補正方法
EP14170645.7A EP2811485A1 (en) 2013-06-07 2014-05-30 Sound correcting apparatus, sound correcting program, and sound correcting method
US14/291,850 US20140363020A1 (en) 2013-06-07 2014-05-30 Sound correcting apparatus and sound correcting method

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2013121166A JP6123503B2 (ja) 2013-06-07 2013-06-07 音声補正装置、音声補正プログラム、および、音声補正方法

Publications (2)

Publication Number Publication Date
JP2014239346A JP2014239346A (ja) 2014-12-18
JP6123503B2 true JP6123503B2 (ja) 2017-05-10

Family

ID=50819689

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2013121166A Active JP6123503B2 (ja) 2013-06-07 2013-06-07 音声補正装置、音声補正プログラム、および、音声補正方法

Country Status (3)

Country Link
US (1) US20140363020A1 (ja)
EP (1) EP2811485A1 (ja)
JP (1) JP6123503B2 (ja)

Families Citing this family (22)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US9781522B2 (en) * 2013-07-23 2017-10-03 Advanced Bionics Ag Systems and methods for detecting degradation of a microphone included in an auditory prosthesis system
US9635257B2 (en) * 2014-05-12 2017-04-25 Gopro, Inc. Dual-microphone camera
JP2016158212A (ja) * 2015-02-26 2016-09-01 京セラ株式会社 測定システム及び測定方法
EP3188507A1 (en) 2015-12-30 2017-07-05 GN Resound A/S A head-wearable hearing device
US10535364B1 (en) * 2016-09-08 2020-01-14 Amazon Technologies, Inc. Voice activity detection using air conduction and bone conduction microphones
GB201713946D0 (en) 2017-06-16 2017-10-18 Cirrus Logic Int Semiconductor Ltd Earbud speech estimation
US10847173B2 (en) * 2018-02-13 2020-11-24 Intel Corporation Selection between signal sources based upon calculated signal to noise ratio
CN109640234A (zh) * 2018-10-31 2019-04-16 深圳市伊声声学科技有限公司 一种双骨导传声器及噪音去除实现方法
US10861484B2 (en) 2018-12-10 2020-12-08 Cirrus Logic, Inc. Methods and systems for speech detection
CN109660899B (zh) * 2018-12-28 2020-06-05 广东思派康电子科技有限公司 计算机可读存储介质和应用该介质的骨声纹检测耳机
CN112312280B (zh) * 2019-07-31 2022-03-01 北京地平线机器人技术研发有限公司 一种车内声音播放方法及装置
CN114822566A (zh) * 2019-09-12 2022-07-29 深圳市韶音科技有限公司 音频信号生成方法及***、非暂时性计算机可读介质
BR112022004158A2 (pt) * 2019-09-12 2022-05-31 Shenzhen Shokz Co Ltd Sistemas e métodos para geração de sinal de áudio
US11026013B2 (en) 2019-10-02 2021-06-01 Mobilus Labs Limited Bone conduction communication system and method of operation
CN111009253B (zh) * 2019-11-29 2022-10-21 联想(北京)有限公司 一种数据处理方法和装置
CN113129916B (zh) * 2019-12-30 2024-04-12 华为技术有限公司 一种音频采集方法、***及相关装置
KR20230098287A (ko) * 2020-12-31 2023-07-03 썬전 샥 컴퍼니 리미티드 오디오 생성 방법 및 시스템
US11751232B2 (en) * 2021-01-27 2023-09-05 Charter Communications Operating, Llc Communication system and wireless interference management
WO2022193327A1 (zh) * 2021-03-19 2022-09-22 深圳市韶音科技有限公司 信号处理***、方法、装置及存储介质
CN113421580B (zh) * 2021-08-23 2021-11-05 深圳市中科蓝讯科技股份有限公司 降噪方法、存储介质、芯片及电子设备
CN113421583B (zh) * 2021-08-23 2021-11-05 深圳市中科蓝讯科技股份有限公司 降噪方法、存储介质、芯片及电子设备
CN117676434A (zh) * 2022-08-31 2024-03-08 华为技术有限公司 一种声音信号的处理设备、方法以及相关设备

Family Cites Families (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP3082825B2 (ja) * 1994-08-29 2000-08-28 日本電信電話株式会社 通信装置
JP2835009B2 (ja) 1995-02-03 1998-12-14 岩崎通信機株式会社 骨導気導複合型イヤーマイクロホン装置
JP2000354284A (ja) 1999-06-10 2000-12-19 Iwatsu Electric Co Ltd 送受一体形電気音響変換器を用いる送受話装置
JP2004279768A (ja) * 2003-03-17 2004-10-07 Mitsubishi Heavy Ind Ltd 気導音推定装置及び気導音推定方法
US8315583B2 (en) * 2006-08-23 2012-11-20 Quellan, Inc. Pre-configuration and control of radio frequency noise cancellation
US7406303B2 (en) * 2005-07-05 2008-07-29 Microsoft Corporation Multi-sensory speech enhancement using synthesized sensor signal
KR100800725B1 (ko) * 2005-09-07 2008-02-01 삼성전자주식회사 이동통신 단말의 오디오 재생시 주변 잡음에 적응하는 자동음량 조절 방법 및 장치
JP2010171880A (ja) * 2009-01-26 2010-08-05 Sanyo Electric Co Ltd 音声信号処理装置
FR2974655B1 (fr) * 2011-04-26 2013-12-20 Parrot Combine audio micro/casque comprenant des moyens de debruitage d'un signal de parole proche, notamment pour un systeme de telephonie "mains libres".

Also Published As

Publication number Publication date
JP2014239346A (ja) 2014-12-18
EP2811485A1 (en) 2014-12-10
US20140363020A1 (en) 2014-12-11

Similar Documents

Publication Publication Date Title
JP6123503B2 (ja) 音声補正装置、音声補正プログラム、および、音声補正方法
JP4649546B2 (ja) 補聴器
US8538052B2 (en) Generation of probe noise in a feedback cancellation system
US8903097B2 (en) Information processing device and method and program
KR102502521B1 (ko) 라우드니스 레벨을 제어하는 오디오 신호 처리 방법 및 장치
US9854368B2 (en) Method of operating a hearing aid system and a hearing aid system
WO2007040884A2 (en) Method and system for suppressing receiver audio regeneration
JP6135106B2 (ja) 音声強調装置、音声強調方法及び音声強調用コンピュータプログラム
JP6073456B2 (ja) 音声強調装置
JP2009020291A (ja) 音声処理装置および通信端末装置
JP5903921B2 (ja) ノイズ低減装置、音声入力装置、無線通信装置、ノイズ低減方法、およびノイズ低減プログラム
CN112019967A (zh) 一种耳机降噪方法、装置、耳机设备及存储介质
KR101253708B1 (ko) 보청장치의 외부 소음을 차폐하는 방법
US8954322B2 (en) Acoustic shock protection device and method thereof
JP2010109624A (ja) 音声処理回路、音声処理装置及び音声処理方法
JP5126145B2 (ja) 帯域拡張装置、方法及びプログラム、並びに、電話端末
JP6197367B2 (ja) 通話装置及びマスキング音生成プログラム
JP2001188599A (ja) オーディオ信号復号装置
CN110610714B (zh) 一种音频信号增强处理的方法和相关装置
US8948429B2 (en) Amplification of a speech signal in dependence on the input level
JP5531988B2 (ja) 音量制御装置、音量制御方法、および音量制御プログラム
US20220240026A1 (en) Hearing device comprising a noise reduction system
JP2010092057A (ja) 受話音声処理装置及び受話音声再生装置
JP2007184820A (ja) 受信装置及び受信音声信号の補正方法
JP6541588B2 (ja) 音声信号処理装置、方法及びプログラム

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20160310

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20170224

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20170307

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20170320

R150 Certificate of patent or registration of utility model

Ref document number: 6123503

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150