JP6878137B2 - 音声処理装置、音声処理方法およびプログラム - Google Patents

音声処理装置、音声処理方法およびプログラム Download PDF

Info

Publication number
JP6878137B2
JP6878137B2 JP2017099887A JP2017099887A JP6878137B2 JP 6878137 B2 JP6878137 B2 JP 6878137B2 JP 2017099887 A JP2017099887 A JP 2017099887A JP 2017099887 A JP2017099887 A JP 2017099887A JP 6878137 B2 JP6878137 B2 JP 6878137B2
Authority
JP
Japan
Prior art keywords
low
pass filter
output signal
channel audio
audio signal
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
JP2017099887A
Other languages
English (en)
Other versions
JP2018196048A (ja
JP2018196048A5 (ja
Inventor
勝美 齊藤
勝美 齊藤
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Canon Inc
Original Assignee
Canon Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Canon Inc filed Critical Canon Inc
Priority to JP2017099887A priority Critical patent/JP6878137B2/ja
Priority to US15/979,017 priority patent/US10313824B2/en
Publication of JP2018196048A publication Critical patent/JP2018196048A/ja
Publication of JP2018196048A5 publication Critical patent/JP2018196048A5/ja
Application granted granted Critical
Publication of JP6878137B2 publication Critical patent/JP6878137B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04SSTEREOPHONIC SYSTEMS 
    • H04S7/00Indicating arrangements; Control arrangements, e.g. balance control
    • H04S7/30Control circuits for electronic adaptation of the sound field
    • H04S7/307Frequency adjustment, e.g. tone control
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04RLOUDSPEAKERS, MICROPHONES, GRAMOPHONE PICK-UPS OR LIKE ACOUSTIC ELECTROMECHANICAL TRANSDUCERS; DEAF-AID SETS; PUBLIC ADDRESS SYSTEMS
    • H04R1/00Details of transducers, loudspeakers or microphones
    • H04R1/20Arrangements for obtaining desired frequency or directional characteristics
    • H04R1/22Arrangements for obtaining desired frequency or directional characteristics for obtaining desired frequency characteristic only 
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04RLOUDSPEAKERS, MICROPHONES, GRAMOPHONE PICK-UPS OR LIKE ACOUSTIC ELECTROMECHANICAL TRANSDUCERS; DEAF-AID SETS; PUBLIC ADDRESS SYSTEMS
    • H04R5/00Stereophonic arrangements
    • H04R5/04Circuit arrangements, e.g. for selective connection of amplifier inputs/outputs to loudspeakers, for loudspeaker detection, or for adaptation of settings to personal preferences or hearing impairments
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04RLOUDSPEAKERS, MICROPHONES, GRAMOPHONE PICK-UPS OR LIKE ACOUSTIC ELECTROMECHANICAL TRANSDUCERS; DEAF-AID SETS; PUBLIC ADDRESS SYSTEMS
    • H04R2430/00Signal processing covered by H04R, not provided for in its groups
    • H04R2430/01Aspects of volume control, not necessarily automatic, in sound systems
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04SSTEREOPHONIC SYSTEMS 
    • H04S1/00Two-channel systems
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04SSTEREOPHONIC SYSTEMS 
    • H04S2400/00Details of stereophonic systems covered by H04S but not provided for in its groups
    • H04S2400/15Aspects of sound capture and related signal processing for recording or reproduction

Landscapes

  • Physics & Mathematics (AREA)
  • Engineering & Computer Science (AREA)
  • Acoustics & Sound (AREA)
  • Signal Processing (AREA)
  • Health & Medical Sciences (AREA)
  • Otolaryngology (AREA)
  • Stereophonic System (AREA)

Description

本発明は、音声処理装置、音声処理方法およびプログラムに関する。
装置の左右方向に指向特性を持たせた2チャンネルのステレオ音声を集音する装置が知られている。この指向特性を得る方法は、指向性マイクロホンを用いた集音を行う方法と、複数の無指向性マイクロホンで集音した音声信号からステレオ感強調処理によって指向特性を生成する方法とに大別される。指向性マイクロホンを用いた方法としては、2つの単一指向性マイクロホンを指向性を持たせたい各々の方向に向けて配置して集音する方法や、1つの双指向性マイクロホンによって2つの対向する方向に対して集音する方法などがある。指向性マイクロホンは、音響的に指向性が得られるというメリットがある一方で、振動によるノイズを生成してしまいやすい特徴がある。そのため、ビデオカメラなどの携帯型の装置においては、無指向性マイクロホンを搭載して、集音した音声信号のステレオ感を信号処理によって強調する方法が採用されている(特許文献1参照)。
特開2001−189999号公報
しかしながら、特許文献1においては、ステレオ感の強調処理を行うと、低域成分が高域成分に対して大きく減衰してしまうという課題がある。そのため、低域成分のレベルを調整すると、今度は、低域成分であるフロアノイズなどの雑音が増加するという課題がある。
本発明の目的は、ステレオ感が強調された音声信号を得ることができると共に、フロアノイズなどの低域の雑音を低減することができる音声処理装置、音声処理方法およびプログラムを提供することである。
本発明の音声処理装置は、第1の右チャンネル音声信号の低域成分を出力する第1のローパスフィルタ手段と、第1の左チャンネル音声信号の低域成分を出力する第2のローパスフィルタ手段と、前記第1の右チャンネル音声信号から前記第2のローパスフィルタ手段の出力信号を減算し、第2の右チャンネル音声信号を出力する第1の減算手段と、前記第1の左チャンネル音声信号から前記第1のローパスフィルタ手段の出力信号を減算し、第2の左チャンネル音声信号を出力する第2の減算手段と、前記第1の右チャンネル音声信号と前記第1の左チャンネル音声信号を加算する第1の加算手段と、前記第1の加算手段の出力信号の低域成分を出力する第3のローパスフィルタ手段と、前記第3のローパスフィルタ手段の出力信号を増幅する第1の増幅手段と、前記第2の右チャンネル音声信号と前記第2の左チャンネル音声信号とに基づいて前記第1の増幅手段の増幅率を制御する制御手段と、前記第2の右チャンネル音声信号と前記第1の増幅手段の出力信号を加算する第2の加算手段と、前記第2の左チャンネル音声信号と前記第1の増幅手段の出力信号を加算する第3の加算手段とを有する。
本発明によれば、ステレオ感が強調された音声信号を得ることができると共に、フロアノイズなどの低域の雑音を低減することができる。
第1の実施形態に係る集音装置の構成例を示すブロック図である。 第1の実施形態に係る音声処理部の構成例を示す図である。 感度とノイズフロアレベルの周波数特性を示すグラフである。 イコライザの増幅率の周波数特性を示すグラフである。 感度とノイズフロアレベルの周波数特性を示すグラフである。 感度とノイズフロアレベルの周波数特性を示すグラフである。 低域成分判定部404の処理を示すフローチャートである。 感度とノイズフロアレベルの周波数特性を示すグラフである。 第2の実施形態に係る音声処理部の構成例を示す図である。
(第1の実施形態)
図1は、本発明の第1の実施形態に係る集音装置10の構成例を示す図である。集音装置10は、内部バス1を介して互いに接続されたCPU(中央演算装置)2、プログラムROM3、メモリ4、ディスプレイ5、操作部6、集音部7、音声処理部8、および記録部9を有する。なお、集音装置10は、その他、電池や記録媒体ドライブ等を有する。
内部バス1は、各種データ、制御信号、指示信号などを集音装置10の各ブロックに入出力するための汎用バスである。CPU2は、集音装置10の動作を制御する演算処理装置である。CPU2は、操作部6を介して使用者からの指示を入力し、後述する各種プログラムを実行すると共に、ディスプレイ5の表示制御を行う。プログラムROM3は、データや、CPU2の動作処理手順のプログラム(例えば集音装置10の起動処理や基本入出力処理、後述する各処理等のプログラム)を記憶する。メモリ4は、CPU2のワークエリアとして使用される。
ディスプレイ5は、グラフィックユーザインターフェース(GUI)を提供するための表示部である。操作部6は、集音装置10の筺体に配された複数の操作子や、ディスプレイ5の表面上に配置された抵抗膜方式や静電容量方式によるタッチパネルである。タッチパネルは、ディスプレイ5の表示画像とタッチパネルの検出領域とを組み合わせることによって、CPU2に様々な操作入力を指示することができる。
集音部7は、内蔵されたマイクロホンにより、集音装置10の周囲の音声を集音し、集音したアナログ音声信号をデジタル信号に変換して音声処理部8に出力する。音声処理部8は、音声処理装置であり、下記の処理のプログラムを実行するマイクロコンピュータであり、音声の記録再生に必要な処理を実行する。また、音声処理部8は、CPU2がプログラムを実行することにより、下記の処理を実行するものであってもよい。音声処理部8は、集音部が出力したデジタル音声信号を一時的にメモリに記憶し、ステレオ感強調処理を行う。また、音声処理部8は、他に、音声に特殊効果を付与するエフェクト処理やレベルの適正化処理や雑音低減処理等の音声に関する処理を行う。
CPU2は、音声処理部8により処理された音声信号を、記録のために記録部9へ出力し、再生出力やモニタ音声出力のために不図示の出力部へ出力する。記録部9は、音声信号を記録に適したデータ形式に変換し、データテープ、光ディスク、フラッシュメモリ等の記録媒体に対してデータの書き込みを行う。また、記録部9は、記録媒体に格納されているデータの読み出しを行う。
図2は、音声処理部8の機能構成例を示す図である。音声処理部8は、ステレオ感強調部100と、低域モノラル生成部200と、低域音量調整部300と、低域成分選択部400と、帯域合成部500とを有し、ステレオ感強調処理を行う。音声処理部8は、集音部7により得られた右チャンネル音声信号と左チャンネル音声信号をそれぞれ入力1と入力2として入力する。集音部7は、複数の無指向性マイクロホンを備える。そして、音声処理部8は、不図示の処理ブロックによって、集音部7により得られた音声信号に対して信号レベルの増幅処理や、風雑音の低減処理などを行い、右チャンネル音声信号(入力1)と左チャンネル音声信号(入力2)を入力する。
ステレオ感強調部100は、ローパスフィルタ(以下、LPFという)101,102と、減衰器103,104と、減算器105,106とを有する。LPF101は、右チャンネル音声信号(入力1)に対してローパスフィルタ処理を行い、右チャンネル音声信号の低域成分を出力する。LPF102は、左チャンネル音声信号(入力2)に対してローパスフィルタ処理を行い、左チャンネル音声信号の低域成分を出力する。減衰器103は、LPF101の出力信号を所定のレベルに減衰する。減衰器104は、LPF102の出力信号を所定のレベルに減衰する。減算器105は、右チャンネル音声信号(入力1)から減衰器104の出力信号を減算し、ステレオ感が強調された右チャンネル音声信号を出力する。減算器106は、左チャンネル音声信号(入力2)から減衰器103の出力信号を減算し、ステレオ感が強調された左チャンネル音声信号を出力する。
なお、LPF101および102の代わりに、ディレイ素子を設けてもよい。また、2つの無指向性マイクロホンの間の距離と、それぞれのLPF101および102のカットオフ周波数と減衰器103および104の減衰率の設定によって、ステレオ感の強調度合が変化する。
ステレオ感強調部100の処理によって、2つのチャンネルの音声信号間で位相差の小さかった信号が大きく減衰することになる。ある定められた2点間の音声信号においては、周波数が低いほど、位相差が小さくなる。そのため、ステレオ感強調部100は、前述のように、低域成分が高域成分に対して大きく減衰した信号を出力する。
図3は、減算器105の出力信号の感度701とノイズフロアレベル702の周波数特性の一例を表すグラフである。減算器105の出力信号を例に説明するが、減算器106の出力信号も同様である。感度701は、横軸に周波数、縦軸に入力信号に対する出力信号の感度の高低を表している。ノイズフロアレベル702は、横軸に周波数、縦軸にノイズフロアレベルを表している。感度701は、低域の感度が低く、反対に高域の感度が高く、またその間の約500Hz〜2kHzの区間に変化傾斜を持っていることが分かる。一方、ノイズフロアレベル702は、中域のノイズレベルが相対的に大きく、低域のノイズレベルが、高域のノイズレベルと同等程度であることが分かる。
図2において、低域音量調整部300は、イコライザ(以下、EQという)301,302と、増幅器303〜305とを有する。EQ301は、減算器105の出力信号を入力し、感度701に現れる帯域間の感度差を補正する。EQ302は、減算器106の出力信号を入力し、感度701に現れる帯域間の感度差を補正する。増幅器303は、EQ301の出力信号を増幅する。増幅器304は、EQ302の出力信号を増幅する。
図4は、EQ301の増幅率の周波数特性を示すグラフである。EQ301の例を説明するが、EQ302も同様である。EQ301の増幅率の周波数特性は、例えば、図3の感度701の周波数特性の変化傾斜を逆にしたような、約500Hz〜2kHzに増幅率の変化特性を持ち、低域の増幅率が高く、高域の増幅率が低くなるような特性である。EQ301は、減算器105の出力信号に対して高域成分より低域成分の方が大きい増幅率で増幅する。EQ302は、減算器106の出力信号に対して高域成分より低域成分の方が大きい増幅率で増幅する。
なお、EQ301は、デジタル信号処理する際には、増幅後のデータがデジタルのフルスケールを超過することを防ぐために、増幅率の高い側の増幅率を1とし、増幅率の低い側を減衰させるようにすることが好ましい。しかし、この結果、ステレオ感強調処理で減衰した低域の信号レベルを基準にして、高域を減衰させることになるため、全帯域の信号レベルが低くなってしまう。そこで、増幅器303は、EQ301の出力信号に対して、全帯域の周波数特性を保ったまま適正レベルまで増幅をすることで、帯域間のバランスを調整する。増幅器304は、EQ302の出力信号に対して、全帯域の周波数特性を保ったまま適正レベルまで増幅をすることで、帯域間のバランスを調整する。
図5は、増幅器303の出力信号の感度901とノイズフロアレベル902の周波数特性を示すグラフである。感度901は、感度701に比べ、低域と高域の差が縮小している。なお、増幅器303および304の後段に、カットオフ周波数が高いLPFをそれぞれ設けることにより、さらに全帯域をフラットにする調整を行ってもよい。一方、ノイズフロアレベル902は、低域側が大きい状態である。これは、EQ301が減衰した低域信号を持ち上げる増幅をしたことにより、ノイズフロアレベル902も同様に持ち上がってしまったためである。
ノイズフロアレベル902が示すフロアノイズは、マイクロホンで集音する音声が大きい時には、その集音音声に埋もれて聞こえにくくなるために、気になりにくい。一方、マイクロホンで集音する音声が小さい時には、フロアノイズが聞こえやすくなってしまう。また、低域のフロアノイズは、高域のそれよりも耳に付きやすいため、よりノイズを大きく感じる印象を与えてしまう。
そこで、帯域合成部500は、ステレオ感が強調されながら、フロアノイズが目立つことが無いように音声信号を処理する。本実施形態では、ノイズフロアレベルの低い低域成分を生成し、これを活用する。低域モノラル生成部200は、加算器201と、LPF202とを有する。加算器201は、右チャンネル音声信号(入力1)と左チャンネル音声信号(入力2)を加算し、モノラル信号を出力する。加算器201の出力信号は、単純な加算によるモノラル信号であるために、特に低域成分が減衰せず、フロアノイズであるホワイトノイズ成分が数dB減衰する。これによって、加算器201は、ノイズフロアレベルが低く、信号対雑音比が良い信号を得ることができる。LPF202は、加算器201が出力するモノラル信号に対して、所定のカットオフ周波数で、ローパスフィルタ処理し、モノラル信号の低域成分を出力する。増幅器305は、低域成分選択部400により設定された増幅率で、LPF202の出力信号を増幅する。
図6は、LPF202の出力信号の感度601とノイズフロアレベル602の周波数特性を示すグラフである。感度601およびノイズフロアレベル602は、LPF202が出力する低域成分のモノラル信号の感度およびノイズフロアレベルを示す。なお、加算器201の演算結果のオーバーフローが心配される場合には、加算器201の前段にビットシフト等のレベル変換器を設けてもよい。これは、その他の加算器でも同様である。
ここで、前述したように、マイクロホンで集音する音声が大きい時には、EQ301および302の補正によって低域のフロアノイズが持ち上げられていても、その集音音声に埋もれて聞こえにくくなるため、ノイズは気になりにくい。このときは、低域の音声にもステレオ感を感じられる方が好ましいため、この状態で問題は無い。
一方、マイクロホンで集音する音声が小さくなった時は、フロアノイズが聞こえやすくなるので、前述のノイズフロアレベルが低く、信号対雑音比が良いモノラル信号に置き換えたい。そのため、本実施形態では、入力音声の状態を検出して、その結果から、ステレオ感が得られる音声とノイズフロアレベルを低減させた音声の処理を切り替えるため、低域成分選択部400を設ける。
低域成分選択部400は、LPF401,402と、レベル検出部403と、低域成分判定部404と、減算器405と、絶対値取得部(ABS)406とを有する。LPF401は、減算器105の出力信号をローパスフィルタ処理し、減算器105の出力信号の低域成分を出力する。LPF402は、減算器106の出力信号をローパスフィルタ処理し、減算器106の出力信号の低域成分を出力する。レベル検出部403は、LPF401および402の出力信号のうちの大きい方の信号レベルを低域成分判定部404に出力する。減算器405は、LPF401の出力信号からLPF402の出力信号を減算する。絶対値取得部406は、減算器405の出力信号の絶対値を取得し、その絶対値を低域成分判定部404に出力する。すなわち、絶対値取得部406は、LPF401および402の出力信号の差分を低域成分判定部404に出力する。
低域成分判定部404は、レベル検出部403が出力する信号レベルと、絶対値取得部406が出力する絶対値とに基づいて、左右チャンネルの音声信号に対して多重する低域モノラル成分の量を決定する。そして、低域成分判定部404は、その決定した低域モノラル成分の量に応じて、増幅器303〜305の増幅率およびEQ301,302の増幅率を設定する。ここでは、低域成分判定部404は、ステレオ感強調処理をした2つの信号の低域成分のレベルと、その2つの信号のレベル差とによって判定を行う例を示す。
帯域合成部500は、加算器501と、加算器502とを有する。加算器501は、増幅器303の出力信号と増幅器305の出力信号を加算し、ステレオ感が強調された右チャンネル音声信号(出力1)を出力する。加算器502は、増幅器304の出力信号と増幅器305の出力信号を加算し、ステレオ感が強調された左チャンネル音声信号(出力2)を出力する。
図7は、低域成分判定部404の処理を示すフローチャートである。低域成分判定部404は、ステレオ感強調処理信号に低域モノラル信号を加算する量を決定する。まず、ステップS11では、低域成分判定部404は、レベル検出部403が出力する信号レベルが第1の所定値より小さいか否かを判定する。低域成分判定部404は、信号レベルが第1の所定値より小さいと判定した場合には、ステップS12に処理を進め、信号レベルが第1の所定値より小さくないと判定した場合には、ステップS16に処理を進める。
ステップS12では、低域成分判定部404は、レベル検出部403が出力する信号レベルが第2の所定値より小さいか否かを判定する。第2の所定値は、第1の所定値より小さい。低域成分判定部404は、信号レベルが第2の所定値より小さいと判定した場合には、ステップS13に処理を進め、信号レベルが第2の所定値より小さくないと判定した場合には、ステップS14に処理を進める。
ここで、第1の所定値は、マイクロホンで集音する音声が80dBsplに相当するレベルである。第2の所定値は、マイクロホンで集音する音声が40dBsplに相当するレベルである。これらの値は、一例であり、ステレオ感強調処理をした低域成分のノイズフロアレベルなどを加味して、好適な値が設定される。
ステップS16では、低域成分判定部404は、絶対値取得部406が出力する絶対値が第1の所定値より小さいか否かを判定する。低域成分判定部404は、絶対値が第1の所定値より小さいと判定した場合には、ステップS15に処理を進め、絶対値が第1の所定値より小さくないと判定した場合には、ステップS17に処理を進める。
ステップS14では、低域成分判定部404は、絶対値取得部406が出力する絶対値が第2の所定値より小さいか否かを判定する。低域成分判定部404は、絶対値が第2の所定値より小さいと判定した場合には、ステップS13に処理を進め、絶対値が第2の所定値より小さくないと判定した場合には、ステップS15に処理を進める。
ステップS13では、低域成分判定部404は、低音成分の信号レベルが最も小さいと判定し、左右チャンネルの音声信号に対して、多重する低域モノラル信号の量が大きくなるように、EQ301,302および増幅器303〜305の増幅率を設定する。増幅器305の増幅率が大きくなる。例えば、EQ301および302は、低域の減衰した信号を補正せずに出力する。増幅器303〜305は、EQ301および302が出力する低域の減衰分を、LPF202が出力するモノラル成分で補うように、帯域間のバランスを調整する。このとき、加算器501は、増幅器303が出力する図3の特性の信号と、増幅器305が出力する図6の特性の信号を加算し、図8の特性の信号を出力する。
図8は、加算器501の出力信号の感度801とノイズフロアレベル802の周波数特性を示すグラフである。加算器502の出力信号も加算器501の出力信号と同様である。加算器501は、増幅器303の出力信号と増幅器305の出力信号を加算する。感度801は、図5の感度901に比べ、高域と低域の感度バランスが改善する。ノイズフロアレベル802は、図5のノイズフロアレベル902に比べ、低域のノイズフロアレベルが低い状態に保たれる。
ステップS17では、低域成分判定部404は、左右チャンネルの音声信号に対して、多重する低域モノラル信号の量が0になるように、EQ301,302および増幅器303〜305の増幅率を設定する。増幅器305の増幅率が0になる。加算器501および502は、それぞれ、増幅器303および304の出力信号に対して、増幅器305が出力する低域モノラル信号を多重せずに、ステレオ感強調処理を行った成分だけを出力する。
ステップS15では、低域成分判定部404は、ステレオ感が乏しいと判定し、左右チャンネルの音声信号に対して、多重する低域モノラル信号の量が中位になるように、EQ301,302および増幅器303〜305の増幅率を設定する。増幅器305の増幅率が中位に設定される。加算器501および502は、それぞれ、増幅器303および304が出力する左右チャンネルの音声信号に対して、増幅器305が出力する低域モノラル信号を多重し、ノイズ感を低減する。
なお、前述のように、ステップS14およびS16の判定条件を省略することができる。例えば、ステップS11では、低域成分判定部404は、レベル検出部403が出力する信号レベルが第1の所定値より小さくないと判定した場合には、ステップS17に処理を進める。ステップS12では、低域成分判定部404は、レベル検出部403が出力する信号レベルが第2の所定値より小さくないと判定した場合には、ステップS15に処理を進める。この場合、低域成分判定部404は、レベル検出403が出力する信号レベルに応じて、EQ301,302および増幅器303〜305の増幅率を設定する。
低域成分判定部404は、レベル検出部403が出力する信号レベルが小さいほど、増幅器305の増幅率を大きくし、増幅器303の増幅率と増幅器304の増幅率を共に小さくするように、増幅器303〜305の増幅率を制御する。
低域成分判定部404は、絶対値取得部406の出力信号を判定条件に加えることで、低域にステレオ感強調された信号を用いることの効果を、より細かく判定することができる。ただし、絶対値取得部406の出力信号の判定条件は、集音音声とフロアノイズのどちらが聞こえやすいかという点においては、レベル検出部403が出力する信号レベルの判定条件ほどには影響をしない。そのため、絶対値取得部406の出力信号の判定条件を省略したとしても、相応の効果を得ることは期待できる。
また、低域成分判定部404は、レベル検出部403の出力信号の代わりに、LPF202の出力信号を用いてもよい。その場合、低域成分判定部404は、LPF202の出力信号と絶対値取得部406の出力信号とに基づいて、増幅器303〜305の増幅率およびEQ301,302の増幅率を設定する。すなわち、低域成分判定部404は、LPF202が出力するモノラル信号の低域成分と、LPF401および402の出力信号の差分とを基に、増幅器303〜305の増幅率およびEQ301,302の増幅率を設定する。
また、低域成分判定部404は、ステップS14およびS16を省略し、LPF202の出力信号に基づいて、増幅器303〜305の増幅率およびEQ301,302の増幅率を設定してもよい。すなわち、低域成分判定部404は、LPF202が出力するモノラル信号の低域成分を基に、増幅器303〜305の増幅率およびEQ301,302の増幅率を設定してもよい。
低域成分判定部404は、LPF202の出力信号のレベルが小さいほど、増幅器305の増幅率を大きくし、増幅器303の増幅率と増幅器304の増幅率を共に小さくするように、増幅器303〜305の増幅率を制御する。
なお、ステップS17では、低域成分判定部404は、多重する低域モノラル成分の量を0に設定したが、多重する低域モノラル成分の量をステップS15の量より小さくなるように設定してもよい。
なお、信号レベルと比較する所定値および絶対値と比較する所定値は、更にその数を多く設けることで、多重される低域モノラル信号の量を、より細かいステップで制御することができる。また、逆に、信号レベルと比較する所定値および絶対値と比較する所定値は、その数を少なくすることで、限定的な状態の場合にのみ、多重される低域モノラル信号の量を可変するようにすることもできる。例えば、ステップS16では、第1の所定値を0にする。この場合、信号レベルが第1の所定値よりも大きい場合には、必ず、ステップS17に進み、加算器501および502は、低域モノラル信号を多重せずに、ステレオ感強調処理を行った成分だけを出力することができる。
なお、加算器501および502は、ステレオ感強調処理をした低域成分と低域モノラル信号の両方をミックスする場合には、低域成分判定部404は、多重される低域モノラル信号の量に応じて、EQ301および302の増幅率も調整する。つまり、多重される低域モノラル信号の量が大きい時には、低域成分判定部404は、EQ301および302の増幅率を小さくして、フロアノイズが持ち上がることを抑制する。また、EQ301および302の増幅率を変更すると、EQ301および302の出力レベルも変わってくるため、その変化に合わせて、増幅器303および304の増幅率も調整する。
また、増幅器303〜305は、各信号の出力量を調整するためのボリュームに見立てることができる。そこで、多重される低域モノラル信号の量を変更する際に、増幅器303〜305の出力レベルの変化に時定数を持たせて、ステレオ成分とモノラル成分をクロスフェードするように変化させることで、ノイズフロアや指向特性の急激な変化を和らげることができる。
加算器501は、増幅器303の出力信号と増幅器305の出力信号を加算し、ステレオ感が強調された右チャンネル音声信号(出力1)を出力する。加算器502は、増幅器304の出力信号と増幅器305の出力信号を加算し、ステレオ感が強調された左チャンネル音声信号(出力2)を出力する。
本実施形態によれば、音声処理部8は、マイクロホンで集音する音声が小さい時には、低域のフロアノイズを抑制した音声を出力し、マイクロホンで集音する音声が大きい時には、低域にもステレオ感を強調した音声が出力することができる。
(第2の実施形態)
図9は、本発明の第2の実施形態に係る音声処理部8の機能構成例を示す図である。第1の実施形態の図2の音声処理部8は、EQ301および302を有するが、第2の実施形態の図9の音声処理部8は、EQ301および302を有しない。図9の音声処理部8は、図2の音声処理部8に対して、ステレオ感強調部100、低域モノラル生成部200、および低域成分選択部400が同様であり、低域音量調整部300および帯域合成部500が異なる。以下、本実施形態が第1の実施形態と異なる点を説明する。
低域音量調整部300は、ハイパスフィルタ(以下、HPFという)311,313と、LPF312,314と、増幅器315〜319と、加算器320,321とを有する。HPF311は、減算器105の出力信号に対して、所定のカットオフ周波数でハイパスフィルタ処理を行い、減算器105の出力信号の高域成分を出力する。HPF313は、減算器106の出力信号に対して、所定のカットオフ周波数でハイパスフィルタ処理を行い、減算器106の出力信号の高域成分を出力する。LPF312は、減算器105の出力信号に対して、所定のカットオフ周波数でローパスフィルタ処理を行い、減算器105の出力信号の低域成分を出力する。LPF314は、減算器106の出力信号に対して、所定のカットオフ周波数でローパスフィルタ処理を行い、減算器106の出力信号の低域成分を出力する。
HPF311、313及びLPF312、314それぞれのカットオフ周波数は、低域モノラル信号を多重した際にステレオ感を残したい帯域や、帯域合成部500よりも後段で周波数特性を調整する場合には、その調整の行いやすさなどを考慮して設定する。減算器105および106の出力信号が、図4に示す周波数特性である場合には、500〜2kHzの間にカットオフ周波数を設定するのが好適である。ただし、前述の考慮点を踏まえたときに、それ以外の周波数が好適であるならば、カットオフ周波数は、その設定でもよい。また、LPF202のカットオフ周波数を、LPF312および314のカットオフ周波数と同じにしておくと、各々のLPFを通して同等の帯域の低域成分が得られる。
増幅器315は、HPF311の出力信号を増幅する。増幅器316は、LPF312の出力信号を増幅する。増幅器317は、HPF313の出力信号を増幅する。増幅器318は、LPF314の出力信号を増幅する。増幅器319は、LPF202の出力信号を増幅する。増幅器315および317は、高域成分の信号を増幅するため、低域モノラル信号の多重量に左右されることなく、増幅率が固定である。一方、増幅器316、318および319は、低域モノラル信号の多重量によって、増幅率を変更する。
低域成分判定部404は、図7のフローチャートの処理と同様に、低域モノラル信号の多重量を決定し、増幅器316、318および319の増幅率を設定する。低域成分判定部404は、増幅器319の増幅率を大きくする時は、増幅器316および318の増幅率を小さくし、増幅器319の増幅率を小さくする時は、増幅器316および318の増幅率を大きくする。このとき、各増幅器316、318および319の増幅率の変化に時定数を持たせて、ステレオ成分とモノラル成分をクロスフェードするように変化させることで、ノイズフロアや指向特性の急激な変化を和らげることができる。
加算器320は、増幅器316の出力信号と増幅器319の出力信号を加算し、右チャンネル音声信号の低域成分を出力する。加算器321は、増幅器318の出力信号と増幅器319の出力信号を加算し、左チャンネル音声信号の低域成分を出力する。
帯域合成部500は、加算器511と、加算器512とを有する。加算器511は、増幅器315の出力信号と加算器320の出力信号を加算し、全帯域の右チャンネル音声信号(出力1)を出力する。加算器512は、増幅器317の出力信号と加算器321の出力信号を加算し、全帯域の左チャンネル音声信号(出力2)を出力する。加算器511および512の出力信号は、図8に示す感度801とノイズフロアレベル802の周波数特性を有する。
なお、低域成分選択部400において、レベル検出部403のレベル検出および減算器405の減算の対象となる低域成分の信号は、増幅器316および増幅器318がゲイン調整を行いたい信号と同じである。そのため、低域成分選択部400において、レベル検出部403および減算器405は、LPF312およびLPF314の出力信号を基に、レベル検出および減算をそれぞれ行うことができる。この場合、LPF401およびLPF402を省略することができる。
(その他の実施形態)
本発明は、上述の実施形態の1以上の機能を実現するプログラムを、ネットワーク又は記憶媒体を介してシステム又は装置に供給し、そのシステム又は装置のコンピュータにおける1つ以上のプロセッサがプログラムを読み出し実行する処理でも実現可能である。また、1以上の機能を実現する回路(例えば、ASIC)によっても実現可能である。
なお、上記実施形態は、何れも本発明を実施するにあたっての具体化の例を示したものに過ぎず、これらによって本発明の技術的範囲が限定的に解釈されてはならないものである。すなわち、本発明はその技術思想、又はその主要な特徴から逸脱することなく、様々な形で実施することができる。
101,102,202 LPF、105,106 減算器、201,501,502 加算器、303〜305 増幅器

Claims (16)

  1. 第1の右チャンネル音声信号の低域成分を出力する第1のローパスフィルタ手段と、
    第1の左チャンネル音声信号の低域成分を出力する第2のローパスフィルタ手段と、
    前記第1の右チャンネル音声信号から前記第2のローパスフィルタ手段の出力信号を減算し、第2の右チャンネル音声信号を出力する第1の減算手段と、
    前記第1の左チャンネル音声信号から前記第1のローパスフィルタ手段の出力信号を減算し、第2の左チャンネル音声信号を出力する第2の減算手段と、
    前記第1の右チャンネル音声信号と前記第1の左チャンネル音声信号を加算する第1の加算手段と、
    前記第1の加算手段の出力信号の低域成分を出力する第3のローパスフィルタ手段と、
    前記第3のローパスフィルタ手段の出力信号を増幅する第1の増幅手段と、
    前記第2の右チャンネル音声信号と前記第2の左チャンネル音声信号とに基づいて前記第1の増幅手段の増幅率を制御する制御手段と、
    前記第2の右チャンネル音声信号と前記第1の増幅手段の出力信号を加算する第2の加算手段と、
    前記第2の左チャンネル音声信号と前記第1の増幅手段の出力信号を加算する第3の加算手段と
    を有することを特徴とする音声処理装置。
  2. 前記制御手段は、前記第2の右チャンネル音声信号および前記第2の左チャンネル音声信号の低域成分のレベルが小さいほど、前記第1の増幅手段の増幅率を大きくすることを特徴とする請求項1に記載の音声処理装置。
  3. 前記制御手段は、前記第2の右チャンネル音声信号の低域成分を出力する第4のローパスフィルタ手段と、
    前記第2の左チャンネル音声信号の低域成分を出力する第5のローパスフィルタ手段とを有し、
    前記第4のローパスフィルタ手段の出力信号のレベルと前記第5のローパスフィルタ手段の出力信号のレベルのうちの大きい方のレベルに応じて、前記第1の増幅手段の増幅率を決めることを特徴とする請求項1または2に記載の音声処理装置。
  4. 前記制御手段は、前記第4のローパスフィルタ手段の出力信号のレベルと前記第5のローパスフィルタ手段の出力信号のレベルのうちの大きい方のレベルと、前記第4のローパスフィルタ手段および前記第5のローパスフィルタ手段の出力信号の差分とに応じて、前記第1の増幅手段の増幅率を決めることを特徴とする請求項3に記載の音声処理装置。
  5. 第1の右チャンネル音声信号の低域成分を出力する第1のローパスフィルタ手段と、
    第1の左チャンネル音声信号の低域成分を出力する第2のローパスフィルタ手段と、
    前記第1の右チャンネル音声信号から前記第2のローパスフィルタ手段の出力信号を減算し、第2の右チャンネル音声信号を出力する第1の減算手段と、
    前記第1の左チャンネル音声信号から前記第1のローパスフィルタ手段の出力信号を減算し、第2の左チャンネル音声信号を出力する第2の減算手段と、
    前記第1の右チャンネル音声信号と前記第1の左チャンネル音声信号を加算する第1の加算手段と、
    前記第1の加算手段の出力信号の低域成分を出力する第3のローパスフィルタ手段と、
    前記第3のローパスフィルタ手段の出力信号を増幅する第1の増幅手段と、
    前記第3のローパスフィルタ手段の出力信号のレベルに応じて前記第1の増幅手段の増幅率を制御する制御手段と、
    前記第2の右チャンネル音声信号と前記第1の増幅手段の出力信号を加算する第2の加算手段と、
    前記第2の左チャンネル音声信号と前記第1の増幅手段の出力信号を加算する第3の加算手段と
    を有することを特徴とする音声処理装置。
  6. 前記制御手段は、前記第2の右チャンネル音声信号の低域成分を出力する第4のローパスフィルタ手段と、
    前記第2の左チャンネル音声信号の低域成分を出力する第5のローパスフィルタ手段とを有し、
    前記第3のローパスフィルタ手段の出力信号のレベルと、前記第4のローパスフィルタ手段および前記第5のローパスフィルタ手段の出力信号の差分とに応じて、前記第1の増幅手段の増幅率を制御することを特徴とする請求項5に記載の音声処理装置。
  7. 前記制御手段は、前記第3のローパスフィルタ手段の出力信号のレベルが小さいほど、前記第1の増幅手段の増幅率を大きくすることを特徴とする請求項5または6に記載の音声処理装置。
  8. さらに、前記第2の右チャンネル音声信号に対して高域成分より低域成分の方が大きい増幅率で増幅する第1のイコライザ手段と、
    前記第2の左チャンネル音声信号に対して高域成分より低域成分の方が大きい増幅率で増幅する第2のイコライザ手段とを有し、
    前記第2の加算手段は、前記第1のイコライザ手段の出力信号と前記第1の増幅手段の出力信号を加算し、
    前記第3の加算手段は、前記第2のイコライザ手段の出力信号と前記第1の増幅手段の出力信号を加算することを特徴とする請求項1〜7のいずれか1項に記載の音声処理装置。
  9. さらに、前記第1のイコライザ手段の出力信号を増幅する第2の増幅手段と、
    前記第2のイコライザ手段の出力信号を増幅する第3の増幅手段とを有し、
    前記第2の加算手段は、前記第2の増幅手段の出力信号と前記第1の増幅手段の出力信号を加算し、
    前記第3の加算手段は、前記第3の増幅手段の出力信号と前記第1の増幅手段の出力信号を加算することを特徴とする請求項8に記載の音声処理装置。
  10. 前記制御手段は、前記第1の増幅手段の増幅率を大きくするほど、前記第2の増幅手段の増幅率と前記第3の増幅手段の増幅率を共に小さくするように、前記第2の増幅手段の増幅率と前記第3の増幅手段の増幅率とを制御することを特徴とする請求項9に記載の音声処理装置。
  11. さらに、前記第2の右チャンネル音声信号の高域成分を出力する第1のハイパスフィルタ手段と、
    前記第2の左チャンネル音声信号の高域成分を出力する第2のハイパスフィルタ手段と、
    前記第2の右チャンネル音声信号の低域成分を出力する第6のローパスフィルタ手段と、
    前記第2の左チャンネル音声信号の低域成分を出力する第7のローパスフィルタ手段とを有し、
    前記第2の加算手段は、
    前記第6のローパスフィルタ手段の出力信号と前記第1の増幅手段の出力信号を加算する第4の加算手段と、
    前記第1のハイパスフィルタ手段の出力信号と前記第4の加算手段の出力信号を加算する第5の加算手段とを有し、
    前記第3の加算手段は、
    前記第7のローパスフィルタ手段の出力信号と前記第1の増幅手段の出力信号を加算する第6の加算手段と、
    前記第2のハイパスフィルタ手段の出力信号と前記第6の加算手段の出力信号を加算する第7の加算手段とを有することを特徴とする請求項1〜6のいずれか1項に記載の音声処理装置。
  12. さらに、前記第1のハイパスフィルタ手段の出力信号を増幅する第2の増幅手段と、
    前記第6のローパスフィルタ手段の出力信号を増幅する第3の増幅手段と、
    前記第2のハイパスフィルタ手段の出力信号を増幅する第4の増幅手段と、
    前記第7のローパスフィルタ手段の出力信号を増幅する第5の増幅手段とを有し、
    前記第4の加算手段は、前記第3の増幅手段の出力信号と前記第1の増幅手段の出力信号を加算し、
    前記第5の加算手段は、前記第2の増幅手段の出力信号と前記第4の加算手段の出力信号を加算し、
    前記第6の加算手段は、前記第5の増幅手段の出力信号と前記第1の増幅手段の出力信号を加算し、
    前記第7の加算手段は、前記第4の増幅手段の出力信号と前記第6の加算手段の出力信号を加算することを特徴とする請求項11に記載の音声処理装置。
  13. さらに、前記第1のローパスフィルタ手段の出力信号を減衰する第1の減衰手段と、
    前記第2のローパスフィルタ手段の出力信号を減衰する第2の減衰手段とを有し、
    前記第1の減算手段は、前記第1の右チャンネル音声信号から前記第2の減衰手段の出力信号を減算し、
    前記第2の減算手段は、前記第1の左チャンネル音声信号から前記第1の減衰手段の出力信号を減算することを特徴とする請求項1〜12のいずれか1項に記載の音声処理装置。
  14. 第1のローパスフィルタ手段により、第1の右チャンネル音声信号の低域成分を出力する第1のローパスフィルタステップと、
    第2のローパスフィルタ手段により、第1の左チャンネル音声信号の低域成分を出力する第2のローパスフィルタステップと、
    第1の減算手段により、前記第1の右チャンネル音声信号から前記第2のローパスフィルタ手段の出力信号を減算し、第2の右チャンネル音声信号を出力する第1の減算ステップと、
    第2の減算手段により、前記第1の左チャンネル音声信号から前記第1のローパスフィルタ手段の出力信号を減算し、第2の左チャンネル音声信号を出力する第2の減算ステップと、
    第1の加算手段により、前記第1の右チャンネル音声信号と前記第1の左チャンネル音声信号を加算する第1の加算ステップと、
    第3のローパスフィルタ手段により、前記第1の加算手段の出力信号の低域成分を出力する第3のローパスフィルタステップと、
    第1の増幅手段により、前記第3のローパスフィルタ手段の出力信号を増幅する第1の増幅ステップと、
    制御手段により、前記第2の右チャンネル音声信号と前記第2の左チャンネル音声信号とに基づいて前記第1の増幅手段の増幅率を制御する制御ステップと、
    第2の加算手段により、前記第2の右チャンネル音声信号と前記第1の増幅手段の出力信号を加算する第2の加算ステップと、
    第3の加算手段により、前記第2の左チャンネル音声信号と前記第1の増幅手段の出力信号を加算する第3の加算ステップと
    を有することを特徴とする音声処理方法。
  15. 第1のローパスフィルタ手段により、第1の右チャンネル音声信号の低域成分を出力する第1のローパスフィルタステップと、
    第2のローパスフィルタ手段により、第1の左チャンネル音声信号の低域成分を出力する第2のローパスフィルタステップと、
    第1の減算手段により、前記第1の右チャンネル音声信号から前記第2のローパスフィルタ手段の出力信号を減算し、第2の右チャンネル音声信号を出力する第1の減算ステップと、
    第2の減算手段により、前記第1の左チャンネル音声信号から前記第1のローパスフィルタ手段の出力信号を減算し、第2の左チャンネル音声信号を出力する第2の減算ステップと、
    第1の加算手段により、前記第1の右チャンネル音声信号と前記第1の左チャンネル音声信号を加算する第1の加算ステップと、
    第3のローパスフィルタ手段により、前記第1の加算手段の出力信号の低域成分を出力する第3のローパスフィルタステップと、
    第1の増幅手段により、前記第3のローパスフィルタ手段の出力信号を増幅する第1の増幅ステップと、
    制御手段により、前記第3のローパスフィルタ手段の出力信号のレベルに応じて前記第1の増幅手段の増幅率を制御する制御ステップと、
    第2の加算手段により、前記第2の右チャンネル音声信号と前記第1の増幅手段の出力信号を加算する第2の加算ステップと、
    第3の加算手段により、前記第2の左チャンネル音声信号と前記第1の増幅手段の出力信号を加算する第3の加算ステップと
    を有することを特徴とする音声処理方法。
  16. コンピュータを、請求項1〜13のいずれか1項に記載された音声処理装置の各手段として機能させるためのプログラム。
JP2017099887A 2017-05-19 2017-05-19 音声処理装置、音声処理方法およびプログラム Active JP6878137B2 (ja)

Priority Applications (2)

Application Number Priority Date Filing Date Title
JP2017099887A JP6878137B2 (ja) 2017-05-19 2017-05-19 音声処理装置、音声処理方法およびプログラム
US15/979,017 US10313824B2 (en) 2017-05-19 2018-05-14 Audio processing device for processing audio, audio processing method, and program

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2017099887A JP6878137B2 (ja) 2017-05-19 2017-05-19 音声処理装置、音声処理方法およびプログラム

Publications (3)

Publication Number Publication Date
JP2018196048A JP2018196048A (ja) 2018-12-06
JP2018196048A5 JP2018196048A5 (ja) 2020-07-02
JP6878137B2 true JP6878137B2 (ja) 2021-05-26

Family

ID=64272700

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2017099887A Active JP6878137B2 (ja) 2017-05-19 2017-05-19 音声処理装置、音声処理方法およびプログラム

Country Status (2)

Country Link
US (1) US10313824B2 (ja)
JP (1) JP6878137B2 (ja)

Family Cites Families (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2001189999A (ja) 1999-12-28 2001-07-10 Asahi Kasei Microsystems Kk ステレオ感強調装置およびステレオ感強調方法
JP4403429B2 (ja) * 2007-03-08 2010-01-27 ソニー株式会社 信号処理装置、信号処理方法、プログラム
NO328622B1 (no) 2008-06-30 2010-04-06 Tandberg Telecom As Anordning og fremgangsmate for reduksjon av tastaturstoy i konferanseutstyr
JP6105929B2 (ja) 2012-12-27 2017-03-29 キヤノン株式会社 音声処理装置及びその制御方法

Also Published As

Publication number Publication date
JP2018196048A (ja) 2018-12-06
US20180338216A1 (en) 2018-11-22
US10313824B2 (en) 2019-06-04

Similar Documents

Publication Publication Date Title
JP4356670B2 (ja) 雑音低減装置及び雑音低減方法並びに雑音低減プログラムとその電子機器用収音装置
US20110002467A1 (en) Dynamic enhancement of audio signals
JP5295238B2 (ja) 音響処理装置
JP6652978B2 (ja) 状況認識を備えたスポーツヘッドフォン
JP3505085B2 (ja) オーディオ装置
JP2006340328A (ja) 音質調整装置
JP2773656B2 (ja) ハウリング防止装置
JP2012151767A (ja) オーディオ信号処理装置およびオーディオアンプ
JP5682539B2 (ja) 音響再生装置
JP6637926B2 (ja) 音声処理装置及びその制御方法
JP2002218583A (ja) 音場合成演算方法及び装置
JP2009130854A (ja) 音声信号処理装置、音声信号処理方法及び撮像装置
JP5052460B2 (ja) 音量制御装置
JPWO2006093256A1 (ja) 音声再生装置及び方法、並びに、コンピュータプログラム
JP6878137B2 (ja) 音声処理装置、音声処理方法およびプログラム
JP2006237816A (ja) 演算装置、収音装置、及び、信号処理プログラム
JP6155132B2 (ja) 低域補完装置および低域補完方法
JP2001352594A (ja) 風音低減方法及び装置
JP4803193B2 (ja) オーディオ信号の利得制御装置および利得制御方法
JP5928262B2 (ja) 音声再生装置、調整方法及びプログラム
JP5645373B2 (ja) 音声処理装置、音声処理方法
JP4415775B2 (ja) 音声信号処理装置およびその方法、音声信号記録再生装置ならびにプログラム
JP4942555B2 (ja) ノイズキャンセルヘッドホン
JP2019016851A (ja) 音声処理装置、音声処理方法、及びプログラム
JP6226166B2 (ja) 音響再生装置

Legal Events

Date Code Title Description
A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20200515

A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20200515

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20210217

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20210330

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20210428

R151 Written notification of patent or utility model registration

Ref document number: 6878137

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R151