JP2011257656A - 音声信号処理装置および音声信号処理方法 - Google Patents

音声信号処理装置および音声信号処理方法 Download PDF

Info

Publication number
JP2011257656A
JP2011257656A JP2010133349A JP2010133349A JP2011257656A JP 2011257656 A JP2011257656 A JP 2011257656A JP 2010133349 A JP2010133349 A JP 2010133349A JP 2010133349 A JP2010133349 A JP 2010133349A JP 2011257656 A JP2011257656 A JP 2011257656A
Authority
JP
Japan
Prior art keywords
noise
sound
driving
audio signal
processing
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP2010133349A
Other languages
English (en)
Other versions
JP5529635B2 (ja
Inventor
Masashi Kimura
正史 木村
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Canon Inc
Original Assignee
Canon Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Canon Inc filed Critical Canon Inc
Priority to JP2010133349A priority Critical patent/JP5529635B2/ja
Priority to EP11166474.4A priority patent/EP2395774B1/en
Priority to US13/116,743 priority patent/US9386369B2/en
Priority to KR1020110055420A priority patent/KR101377470B1/ko
Priority to CN2011101567947A priority patent/CN102280108B/zh
Publication of JP2011257656A publication Critical patent/JP2011257656A/ja
Application granted granted Critical
Publication of JP5529635B2 publication Critical patent/JP5529635B2/ja
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04RLOUDSPEAKERS, MICROPHONES, GRAMOPHONE PICK-UPS OR LIKE ACOUSTIC ELECTROMECHANICAL TRANSDUCERS; DEAF-AID SETS; PUBLIC ADDRESS SYSTEMS
    • H04R3/00Circuits for transducers, loudspeakers or microphones
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N23/00Cameras or camera modules comprising electronic image sensors; Control thereof
    • GPHYSICS
    • G03PHOTOGRAPHY; CINEMATOGRAPHY; ANALOGOUS TECHNIQUES USING WAVES OTHER THAN OPTICAL WAVES; ELECTROGRAPHY; HOLOGRAPHY
    • G03BAPPARATUS OR ARRANGEMENTS FOR TAKING PHOTOGRAPHS OR FOR PROJECTING OR VIEWING THEM; APPARATUS OR ARRANGEMENTS EMPLOYING ANALOGOUS TECHNIQUES USING WAVES OTHER THAN OPTICAL WAVES; ACCESSORIES THEREFOR
    • G03B31/00Associated working of cameras or projectors with sound-recording or sound-reproducing means
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L21/00Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
    • G10L21/02Speech enhancement, e.g. noise reduction or echo cancellation
    • G10L21/0208Noise filtering
    • GPHYSICS
    • G11INFORMATION STORAGE
    • G11BINFORMATION STORAGE BASED ON RELATIVE MOVEMENT BETWEEN RECORD CARRIER AND TRANSDUCER
    • G11B20/00Signal processing not specific to the method of recording or reproducing; Circuits therefor
    • G11B20/24Signal processing not specific to the method of recording or reproducing; Circuits therefor for reducing noise
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04RLOUDSPEAKERS, MICROPHONES, GRAMOPHONE PICK-UPS OR LIKE ACOUSTIC ELECTROMECHANICAL TRANSDUCERS; DEAF-AID SETS; PUBLIC ADDRESS SYSTEMS
    • H04R3/00Circuits for transducers, loudspeakers or microphones
    • H04R3/04Circuits for transducers, loudspeakers or microphones for correcting frequency response
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04RLOUDSPEAKERS, MICROPHONES, GRAMOPHONE PICK-UPS OR LIKE ACOUSTIC ELECTROMECHANICAL TRANSDUCERS; DEAF-AID SETS; PUBLIC ADDRESS SYSTEMS
    • H04R2499/00Aspects covered by H04R or H04S not otherwise provided for in their subgroups
    • H04R2499/10General applications
    • H04R2499/11Transducers incorporated or for use in hand-held devices, e.g. mobile phones, PDA's, camera's

Landscapes

  • Engineering & Computer Science (AREA)
  • Signal Processing (AREA)
  • Physics & Mathematics (AREA)
  • Acoustics & Sound (AREA)
  • Multimedia (AREA)
  • General Physics & Mathematics (AREA)
  • Computational Linguistics (AREA)
  • Quality & Reliability (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Studio Devices (AREA)
  • Soundproofing, Sound Blocking, And Sound Damping (AREA)
  • Circuit For Audible Band Transducer (AREA)
  • Noise Elimination (AREA)

Abstract

【課題】予測処理以外の処理を一度実行して、ある程度の雑音を低減してから予測処理を実行することで、適正に雑音が低減できる音声信号処理技術の実現。
【解決手段】複数の駆動部を有する音声信号処理装置であって、装置周囲の音声を集音して音声信号を取得する集音手段7と、複数の駆動部の駆動を制御する駆動制御手段41と、複数の駆動部の駆動に伴う駆動音が発生したタイミングである雑音区間の隣接する前および後の少なくともいずれかの所定の区間の音声信号から算出した信号を、雑音区間の音声信号と置換することにより、複数の駆動部の駆動に伴う駆動音成分を低減する第1の雑音低減手段44e、44fと、雑音区間の隣接する前および後の少なくともいずれかの所定の区間の音声信号を使用せずに、複数の駆動部の駆動に伴う駆動音成分を低減する第2の雑音低減手段44b、44cとを有する。
【選択図】図3

Description

本発明は音声信号処理技術に関する。
近年音声信号処理装置として動画撮影可能なカメラが知られている。装置の内部駆動部の駆動による駆動音(雑音)の影響を受けないこと等が望まれる。前述の特性を得るために様々な撮影装置が提案されている。
例えば、特許文献1では雑音源の種類に応じて、適切なフィルタ(雑音低減手段)を選択することが開示されている。特許文献2では雑音の発生時間に応じて、複数の雑音低減手段を使い分けることが開示されている。特許文献3では、雑音発生期間の音声信号を、雑音発生期間の前後の音声信号に基づいて算出した算出信号に置換する(予測処理)技術により、ハードディスクの駆動雑音を低減することが開示されている。
特開平04−233873号公報 特開2006−203376号公報 特開2006−262241号公報
しかしながら、上記の特許文献1,2に開示された技術では、複数の雑音低減手段から適当な手段を択一的に選択することは可能であるが、複数の雑音低減手段の長所を保ちつつ双方を利用することはできない。また、限られたリソースで複数の雑音低減処理を行う場合には、処理時間や処理能力などが問題になる。特に複数の雑音が発生する場合に、特許文献3のように全ての雑音を雑音発生期間の前後の音声信号に基づいて算出した算出信号に置換する予測処理により処理しようとすると演算負荷が増大し、コスト増加の一因となってしまう。
本発明は、上記課題に鑑みてなされ、その目的は、予測処理以外の処理を一度実行して、ある程度の雑音を低減してから予測処理を実行することで、適正に雑音が低減できる音声信号処理技術を実現することである。
上記課題を解決し、目的を達成するために、本発明の音声信号処理装置は、複数の駆動部を有する音声信号処理装置であって、前記装置周囲の音声を集音して音声信号を取得する集音手段と、前記複数の駆動部の駆動を制御する駆動制御手段と、前記複数の駆動部の駆動に伴う駆動音が発生したタイミングである雑音区間の隣接する前および後の少なくともいずれかの所定の区間の音声信号から算出した信号を、前記雑音区間の音声信号と置換することにより、前記複数の駆動部の駆動に伴う駆動音成分を低減する第1の雑音低減手段と、前記雑音区間の隣接する前および後の少なくともいずれかの所定の区間の音声信号を使用せずに、前記複数の駆動部の駆動に伴う駆動音成分を低減する第2の雑音低減手段と、前記複数の駆動部のうちの2つ以上が予め決められた期間以上の間を開けずに駆動した場合は、前記集音手段により取得された音声信号を前記第2の雑音低減手段により前記駆動音成分を低減した後に、前記第1の雑音低減手段により、前記駆動音成分を低減する制御手段とを有する。
本発明によれば、予測処理以外の処理を一度実行して、ある程度の雑音を低減してから予測処理を実行することで、装置の演算負荷低減しつつも効果的な雑音低減が実現できる。
本発明に係る実施形態の撮影装置の斜視図(a)および側断面図(b)。 撮影装置のブロック図。 音声信号処理回路のブロック図。 SS処理回路のブロック図(a)、フィルタ処理回路のブロック図(b)、(c)。 音圧処理の説明図。 LPC処理の説明図。 予測処理の説明図。 近接する雑音に対する予測処理の説明図。 雑音とフィルタの特性を示す図。 フィルタ処理回路のブロック図。 フィルタ処理の説明図。 ミュート処理の説明図。 PLC処理の説明図。 ブレ補正駆動回路が発生する音を例示する図。 レンズの種類と雑音の特徴を例示する図。 SS処理開始タイミングおよび複数の雑音処理の説明図。 SS処理のフレームと減算ゲインの説明図。 SS処理後に予測処理を実行した場合を例示する図。 SS処理および予測処理による音声信号を例示する図。 SS処理前に予測処理を実行した場合を例示する図。 SS処理の強度およびタイミングが不適切な場合を例示する図。
以下に、添付図面を参照して本発明を実施するための形態について詳細に説明する。尚、以下に説明する実施の形態は、本発明を実現するための一例であり、本発明が適用される装置の構成や各種条件によって適宜修正又は変更されるべきものであり、本発明は以下の実施の形態に限定されるものではない。
[実施形態1]以下、図1乃至図4を参照して、本発明の音声信号処理装置を撮影装置に適用した実施形態1について説明する。
図1において、1は撮影装置、2は撮影装置1に装着された撮影レンズ、3は撮影光学系、4はレンズの光軸、5はレンズ鏡筒、6は撮像素子、7は撮影装置1に設けられ、装置周囲の音声を集音するマイク、8は撮影装置1の背面に設けられた表示装置である。9は撮影光学系3の調整のための光学系駆動部、10は撮影装置1と撮影レンズ2を接続する接点、11はいわゆるクイックリターンミラー機構、12はAF(オートフォーカス)センサを含む焦点検出部、14は装置1のブレを検出するブレセンサである。31は操作ボタン、32は装置1に設けられたマイク7の複数の開口部である。本実施形態の撮影装置は画像の取得と同時に、マイク7により音声を取得/記録することができる。30はレリーズボタンである。本実施形態では、撮影レンズを着脱することができる撮影装置について説明するが、この撮影レンズは、着脱可能でなくてもよい。
なお、マイク7の開口部32は、図1(b)には投影されない箇所に設けられているが、マイク7とマイク開口部32の位置を明確にするために、図1(b)ではこれを模式的にマイク7およびマイク開口部32として示している。
ここで、静止画の撮影動作について説明する。撮影装置1は撮影レンズ2と焦点検出部12および不図示の露出検出部を用いて、焦点/露出検出を行うとともに、撮影光学系3の一部を駆動/調整することによって被写体像を撮像素子6の受光面近傍に結像させる。さらに、適正な露光になるように絞りを調整する。更にユーザによるレリーズボタン30の操作に従い撮影の各種条件を設定し、レリーズボタンの操作と同期させて、撮像素子6により光電変換された被写体の画像情報を取得して図2に示すメモリ24へ記録する。
次に、動画の撮影動作について説明する。動画の撮影に先立って、不図示のライブビューボタンを押すことで、撮像素子6で撮像された画像が表示装置8に表示される。ライブビューは、撮像素子6で撮像された画像情報を、表示装置8にリアルタイムで表示することである。撮影装置1は不図示の動画撮影ボタンの操作と同期させて、撮像素子6から画像情報を予め設定されたフレームレートで取得するとともに、マイク7から音声情報を取得して、これらを同期させてメモリ24へ記録する。動画撮影中において、撮影光学系3の調整が必要となった場合は、適宜光学系駆動部9により調整を行う。そして、動画撮影ボタンの操作と同期させて撮影動作を終了する。また、撮影装置1は動画撮影中であっても、レリーズボタン30の操作により任意のタイミングで静止画撮影が可能である。
次に、図2を参照して、撮影装置1としてのデジタルカメラと撮影レンズ2の構成について説明する。図2において、撮影装置1は主として、撮像系、画像処理系、音声処理系、記録再生系、制御系を有する。撮像系は、撮影光学系3および撮像素子6を含み、画像処理系は、A/D変換回路20および画像処理回路21を含み、音声処理系はマイク7および音声信号処理回路26を含む。記録再生系は、記録処理回路23およびメモリ24を含む。制御系は、カメラシステム制御回路25、焦点検出部(AFセンサ含む)12、露出検出部(AEセンサ含む)13、ブレセンサ14、操作検出回路27、およびレンズシステム制御回路28、レリーズボタン30、光学系駆動部9を含む。光学系駆動部9は、焦点レンズ駆動回路9a、ブレ補正駆動回路9b、絞り駆動回路9cなどから構成される。
撮像系は、被写体からの光を、撮影光学系3を介して撮像素子6の撮像面に結像する光学処理を行う。エイミングなどの撮影予備動作中は、クイックリターンミラー機構11に設けられたミラーを介して、焦点検出部12にも光束の一部が導かれる。また後述するように制御系によって適切に撮影光学系3が調整されることで、適正な光量の被写体光を撮像素子6に露光するとともに、撮像素子6の近傍で被写体像が結像する。画像処理回路21は、A/D変換回路20を介して撮像素子6から取り込んだ画像信号の処理を行う、ホワイトバランス回路、ガンマ補正回路、補間演算による高解像度化を行う補間演算回路等を有する。
音声処理系は、マイク7からの音声信号に音声信号処理回路26によって適切な処理を施して録音用音声信号を生成する。録音用音声信号は、動画撮影時においては、後述する記録処理回路23により撮影画像と関連付けして圧縮処理される。記録処理回路23は、メモリ24へ画像信号を出力するとともに、表示部22へ出力する表示信号を生成/保存する。また、記録処理回路23は、予め決められた方法を用いて静止画、動画、音声などの関連付け/圧縮を行う。音声信号処理回路26の機能は、例えば、音声処理専用のチップにより実現されていても良いし、カメラ全体を制御するCPUとメモリにより実現されても良い。
カメラシステム制御回路25は、撮像時のタイミング信号などを生成して撮像素子6へ出力する。焦点検出部12は撮影光学系3の合焦状態を検出する。静止画撮影では露出検出部13が直接検出し、動画撮影では撮像素子6からの画像信号を処理することで被写体の輝度を検出する。レンズシステム制御回路28はカメラシステム制御回路25からの制御信号に応じて適切にレンズ2を駆動させて撮影光学系3の調整を行う。本実施形態では、交換レンズタイプのカメラを前提にしており、交換レンズの駆動をレンズシステム制御回路28により制御する例を説明している。交換レンズタイプでない場合は、レンズシステム制御回路28の機能を、カメラシステム制御回路25が代わりに実行しても良い。カメラシステム制御回路25の機能は、撮像装置の全体を制御するためのメインCPUとメモリの組み合わせにより実現されても良いし、全体を制御するマイクロコンピュータチップにより実現されても良い。
さらに、制御系は、ユーザの操作に応動して撮像系、画像処理系、記録再生系をそれぞれ制御する。例えば、レリーズボタン30の押下を操作検出回路27が検出して、撮像素子6の駆動、画像処理回路21の動作、記録処理回路23の圧縮処理などを制御する。さらに表示部22によって光学ファインダー、液晶モニタ等に情報の表示を行うため表示部22の各セグメントの状態を制御する。
ここで、上記制御系での撮影光学系の調整動作について説明する。カメラシステム制御回路25には焦点検出部12および露出検出部13が接続されており、静止画撮影においてはこれらの信号を元に適切な焦点位置、絞り位置を求める。カメラシステム制御回路25は、電気接点10を介してレンズシステム制御回路28に指令を出し、レンズシステム制御回路28は焦点レンズ駆動回路9aおよび絞り駆動回路9cを適切に制御する。一方、動画撮影においては、焦点レンズ駆動回路9aにより焦点レンズを微動させるとともに、撮像素子6の信号を解析し、信号のコントラストから焦点位置を求める。さらに撮像素子6の信号レベルから絞り位置を求める。
さらにレンズシステム制御回路28にはブレセンサ14が接続されており、静止画撮影において手ブレ補正を行うモードでは、ブレセンサ14からの検出信号を元にブレ補正駆動回路9bを適切に駆動制御する。一方、動画撮影おいて手ブレ補正を行うモードでは、静止画撮影と同様にブレ補正駆動回路9bを駆動可能であり、ブレセンサ14の検出信号を元に撮像素子6の読み出し位置を変更するいわゆる電子防振を行うことも可能である。ブレセンサ14は、例えば加速度検出センサであって、撮像装置の振動を検出するものである。
ここで、動画撮影などの音声記録を伴う撮影動作について説明する。音声記録を伴う撮影動作では、カメラ本体およびレンズなどの機械的な駆動に伴う音(以下、機械駆動音)は不要な音であり雑音となる。本明細書において雑音とは、ホワイトノイズのような背景雑音ではなく前述した機械駆動音を指すものとする。
図3を参照して、音声信号処理回路26と雑音処理部について説明する。図3において、41はゲイン調整部、42はフィルタ、43はA/Dコンバータ、44は雑音処理部、45はフィルタである。マイク7から得られた信号はゲイン調整部41に出力される。ゲイン調整部41はA/Dコンバータ43のダイナミックレンジが十分に活用できるようにマイク7の信号レベルを調整する。つまり、マイク7の信号レベルが小さいときはゲインアップして信号を増幅し、マイク7の信号レベルが大きいときはゲインを下げて飽和を防ぐ。
フィルタ42はA/Dコンバータ43のサンプリング周波数を考慮して適切なカットオフ周波数をもつ低域通過フィルタなどで構成される。マイク7が特定の周波数を発する素子の近傍にある場合などは前述の低域通過フィルタに加えて適当なノッチフィルタを含む場合もある。A/Dコンバータ43はゲイン調整部41およびフィルタ42で処理された信号をデジタル変換する。
雑音処理部44は複数の雑音処理手段で構成されている。図3の例ではSS処理44a、フィルタ処理44b、ミュート処理44c、音圧処理44d、PLC処理44e、LPC処理44fから構成されている。SS処理とはスペクトルの減算(Spectral Subtraction)に基づく処理であり、本明細書ではスペクトル減算による手法を便宜的にSS法、SS法による処理をSS処理と呼ぶが、正式な名称ではない。フィルタ処理44bは低域通過や帯域通過などの適当な帯域を遮断/通過させる処理である。ミュート処理44cは雑音成分の信号を無音に置換することによって雑音成分を除去する。音圧処理44dは音声信号の包絡線を平滑化する処理である。PLC処理44eは、ITU−T Recommendation G.711 − Appendix Iに定められているパケットロス隠蔽(PLC = Packet Loss Concealment)に基づく処理である。LPC処理44fは、線形予測係数(LPC = Linear Predictive Coefficient)を利用した線形予測フィルタに基づく処理である。各雑音処理手法の詳細については後述する。カメラシステム制御回路25からの指令に応じて、複数の雑音処理手段を選択的にまたは組み合わせて動作させることができる。フィルタ45は雑音処理を行った後に必要であれば適当なフィルタ処理を施すためのフィルタである。不要であれば雑音処理を行わずスルーまたは適当な遅延のみ行うこともできる。これらの雑音処理手段はカメラシステム制御回路25から動作が制御されている。
本実施形態では、予測に基づく雑音低減処理(予測処理)であるPLC処理44eおよびLPC処理44fが第1の雑音低減手段、SS処理44a、フィルタ処理44b、ミュート処理44cおよび音圧処理44dが第2の雑音低減手段となる。また、第2の雑音低減手段は必要に応じて複数用いても良い。
ここで、各雑音低減手段による雑音処理方法について説明する。SS法はその名のとおりスペクトルの減算を行う処理である。予め雑音スペクトル(本明細書では、雑音をフーリエ変換するなどして得たスペクトルを雑音スペクトルと呼ぶ。)を用意しておき、取得した音声スペクトルから減算する。本実施形態では雑音スペクトルは、予め同定して撮影装置1のメモリ24に格納されているものとする。他の雑音スペクトルの取得方法としては、近傍の無音区間と思われる区間のスペクトルを用いることもできる。但し、本明細書で対象とする雑音は機械駆動音成分であり、これらのスペクトルは予め求めることが可能であるために、撮影装置1のメモリ24に格納されているものとした。
SS法は雑音が加算的に被写体音に混入していると仮定しており、これを式で表すと、
Figure 2011257656
となる。但し、x(t)は取得した音声を、s(t)は被写体音を、n(t)は雑音を、tは時間をそれぞれ示している。数1をフーリエ変換すると、
Figure 2011257656
となる。但し、X(ω)、S(ω)、N(ω)は、それぞれx(t)、s(t)、n(t)をフーリエ変換したものであり、ωは周波数である。撮影装置1においては、適当な窓関数を適用して音声信号をフレーム分割して、順次処理を行うが、ここでは簡略化のため、特定のフレームに着目して説明を行う。数2を見ると明らかなように、S(ω)を求めるにはX(ω)からN(ω)を減算すればよい。そこで、
Figure 2011257656
但し、N’(ω)はN(ω)の推定値、S’(ω)はN’(ω)を用いて求めたS(ω)の推定値、βはフロアリング係数である。∠は複素数の偏角を求める演算を示している。数3から分かるように、スペクトルは予め求められた雑音スペクトルを利用して減算するとともに、位相はX(ω)の値をそのまま用いる。また、フロアリング係数βはSS法による音声のひずみを抑制するために導入される係数である(オリジナルのSS法はβ=0である。)。数1で示したようにSS法においては、ノイズは加算的に作用していると仮定している。しかしながら、実際には位相が反転して加算され取得音声では弱めあっている場合も有る。このため、X(ω)からN’(ω)を減算した差分値が負になることがある。そこで、SS法ではβよりも小さいときはβとなる様に処理する。
最後に、S’(ω)を逆フーリエ変換してs’(t)を得てこれをSS処理後の音声とする。
上述したSS処理を図4(a)に模式的に示している。図4(a)において、FFTは窓関数処理を含めた高速フーリエ変換処理を、IFFTは高速逆フーリエ変換を、S’(ω)推定は数3の処理をそれぞれ示している。図4(a)から明らかなようにSS法は、単一チャンネル信号(モノラル音声)にも適用可能な手法である。一方で、事前に何らかの方法でN’(ω)を与える必要がある。
フィルタ処理は適当なスペクトル領域を遮断する処理である。ノイズのモデルはSS法と同じく雑音が加算的に被写体音に混入していると仮定している。ここで数2の両辺にフィルタを適用すると、
Figure 2011257656
となる。但し、S’(ω)はS(ω)の推定値、F(ω)はフィルタの周波数特性を示す値である。ここで、
Figure 2011257656
Figure 2011257656
を満たすようにF(ω)を決めることができれば、数4から明らかなようにF(ω)X(ω)はS(ω)と概略等しくなる。数5および数6は周波数領域で、被写体音が存在する領域と、雑音の存在する領域が分かれており、F(ω)は雑音の存在する領域を遮断するように設計されていることを意味する。最後に、S’(ω)を逆フーリエ変換してs’(t)を得てこれをフィルタ処理後の音声とする。
実際の装置では、フーリエ変換を省くために、時間領域でフィルタを適用することも多く行われている。時間領域で数7を計算している。
Figure 2011257656
但し、数7において*は畳み込み積分を、s’(t)は被写体信号の推定値を示している。f(t)はF(ω)とほぼ等価な周波数特性をもつ時間領域のフィルタであり、REMEZ法などのデジタルフィルタ設計法によって設計することが可能である。
フィルタ処理を周波数領域で行うか、時間領域で行うかは設計時に適当なものを選択している。フィルタ特性や性能を得るための時間領域フィルタの次数などを勘案して決定される。
フィルタ処理を周波数領域で行う場合を図4(b)に模式的に示している。図4(b)において、FFTは窓関数処理を含めた高速フーリエ変換処理を、IFFTは高速逆フーリエ変換を、S’(ω)推定は数4の処理をそれぞれ示している。フィルタ処理を時間領域で行う場合を図4(c)に模式的に示している。図4(c)において、畳み込み積分は数7の処理を示している。図4(b)および(c)からも明らかなようにフィルタは、単一チャンネル信号(モノラル音声)にも適用可能な手法である。一方で、事前に何らかの方法でF(ω)またはf(t)を与える必要がある。
ミュート処理は前述したように雑音成分の信号を無音に置換する処理のことである。つまり雑音が発生していると想定される時間において、
Figure 2011257656
とする。但し、数8においてs’(t)は被写体信号の推定値を示している。
ここで図5を参照して、音圧処理44dについて説明する。図5において、(a)は音圧処理前の音声信号を、(b)は(a)に示した信号の包絡線検出出力を、(c)は音圧処理後の音声信号をそれぞれ示している。図5(a)〜(c)の横軸は時間であり、時間位置は揃っている。図5(a)〜(c)を貫く縦の破線は同じ時間を模式的に示す線である。図5(a)〜(c)の縦軸は各信号のレベルを示している。
図5(a)において、46は雑音発生前の音声信号を、47は雑音発生中の音声信号を、48は雑音発生後の音声信号をそれぞれ示している。音声信号46および48は被写体音または暗騒音からなっており、音声信号47は被写体音に騒音が重畳している。このため後述する包絡線検出をしたときに突出した値を持つ。
図5(b)において、46a,47a,48aはそれぞれ音声信号46,47,48の包絡線検出出力である。47bは音圧処理によって得られた、雑音発生区間の処理後の包絡線出力である。音圧処理においては、まず入力信号の包絡線検出を行い、図5(a)の信号から図5(b)の信号を得る。次に、雑音発生区間前後の音声信号のレベルを検出する。これは46aおよび48aの雑音発生区間近傍の信号を見ればよい。雑音発生区間前後の音声信号のレベルが平滑に繋がるような包絡線を生成する。例えば、図5(b)の包絡線検出出力47bのように、直線で補間すればよい。
最後に雑音区間の包絡線が、47aから47bになるように雑音発生中の音声信号47を適当な区間に区切りながら信号のレベル制御を行う。このようにして得られた信号が図5(c)の音声信号47cである。上述した音圧処理では、雑音区間の被写体音のレベルに影響が出るが、雑音の影響を低減することができる。
また音圧処理においては、先行してフィルタ処理を施すことも都合がよい。フィルタ処理によって被写体音があまり存在しない帯域の雑音を低減した後に上述の音圧処理を実行することで、適正に機械駆動音成分を低減することができる。
次に図13を参照して、PLC処理44eについて説明する。図13はITU−T Recommendation G.711 − Appendix IのFigure I.1からの抜粋である。図13において横軸は時間であり、縦軸は音声信号のレベルを示している。図13の4つの波形は上から、入力信号、10ms分の信号を補正した信号、隠蔽処理が完了した信号、元信号である。ITU−T Recommendation G.711でのフレームサイズは10msであり、図13では2フレーム=20msの情報に欠落が起きた場合を示している。PLC処理44eではパケットロスが起きた箇所(図13のInput波形において、破線で囲まれた箇所)を前後の情報で隠蔽する。欠落が発生した時に、バッファに蓄えられた信号の正規化自己相関を計算する。正規化自己相関が最大となるピッチを当該信号の基本周波数とみなして、求めたピッチ分信号をずらしてコピーする。同時にコピー信号を挿入した箇所とその前方の信号が不連続とならないように、バッファに蓄えられた信号に対しても、コピー信号を延長して滑らかに加算する。一方パケットの欠落状態から回復して正常な通信が復帰したときには、同様に現在の信号からピッチを検出し、バッファに蓄えられた信号にピッチ分ずらして滑らかに加算する。このような操作を行うことで、図13の隠蔽処理が完了した信号を得ることができる。
ITU−T Recommendation G.711 − Appendix Iでは音声の通信について定められているので、パケットの欠落とその隠蔽を考えている。撮影装置1に適用する場合には、パケットの欠落タイミング=機械駆動音の発生タイミング、とすれば前述のPLC処理44eをそのまま適用することができる。PLCという用語はパケットロスから命名されているので、機械駆動音の発生タイミングに合わせて隠蔽処理を行うことをPLCと呼ぶのは正確ではない。しかしながら、PLCと同様の処理を施すという意味で本明細書では撮影装置に適用する場合であってもPLC処理と称して説明を行う。すなわち、雑音が発生すると思われるタイミングで、カメラシステム制御回路25は適当な通信方法で、音声信号処理回路26にPLC処理44eを指示する。
PLCは前述したように近傍の信号を参照しながら、適当に近傍信号を複写するような手法である。また複写に際して雑音発生時の音声信号を破棄するので、雑音の大きさは問題にならないという特徴と持つ。一方で、PLC処理区間は短いほうが良いという特徴を持っている。
次に図6を参照して、LPC処理44fについて説明する。図6において、横軸は時間であり、縦軸はマイク7の出力電圧を示し、(a)は処理前の音声信号を、(b)は(a)の信号をLPC処理をする途中の段階での音声信号を、(c)は(a)の信号をLPC処理した後の音声信号をそれぞれ示している。
LPC処理44fでは、まず図6(b)に示すに機械駆動音が存在する区間の信号を破棄する。次に後述するように、学習動作と予測動作を行い、予測動作により求めた信号で雑音が存在する区間(=予測区間)の信号を埋める(図6(c)参照)。
LPC処理44fは、予測区間の信号を捨てる前後の学習区間から予測して信号を生成する、という特徴を持つ。このため、PLC処理44eと同様に、雑音の大きさは問題にならない、予測区間は短いほうが性能がよいという特徴を持っている。
ここで本実施形態の音声予測に用いる、線形予測係数の導出(学習動作)と線形予測係数を用いた信号の予測(予測動作)について説明する。
線形予測を用いるにあたっては、現在の信号とこれに隣接する有限個(ここではp個とおく)の標本値との間に次のような線形1次結合関係を仮定する。
Figure 2011257656
但し、数9において、εtは平均値0、分散σ2の互いに無相関な確率変数である。ここでxtが過去の値から予測されるように式を変形すると、
Figure 2011257656
数10においてx’tはxtの推定値である。数10よると、εtが十分に小さければ、近傍p個の線形和によって現在の値が表現される。xtを上記の予測によって求めた後、さらにその近似が十分によければxt+1も同じく近傍p個の線形和によって求められる。このようにεtを十分に小さくすることができれば順次値を予測して信号を求めることができる。そこでεtを最小にするようなαiの求め方を考える。本実施形態ではεtを最小にするようなαiを求める動作を学習動作と呼ぶ。
前述した学習区間においてεtの2乗和を最小化すればよい。学習の開始時間をt0、終了時間をt1とすると、
Figure 2011257656
但し、α0=1である。ここで式を簡単にするために、
Figure 2011257656
とおく。数11を最小化するようにαiを決めるためには、数11のαj(j=1,2,・・・,p)に関する偏微分を0として解けばよい。
Figure 2011257656
数13はp個の線形連立1次方程式を解けばαiを決定できることを示している。数5のうちcijはxt-1(i=1,2,・・・,p)から求めることができる。すなわち数13からαiを求めることができる。
数13に従ってαiを決定した場合、εtの2乗和は最小化されている。このとき、数10よりxtの値はx’tで良い近似を与えることができる。この近似が十分に良いものであれば、xtの代わりにx’tを予測信号として用いることができる。さらにxt+1についても同様に近傍のp−1個と予測によって求めた信号から近似値を得ることができる。これを順次繰り返すことで予測区間の信号を生成することができる。本実施形態では、求められたαiから予測区間の近似を求める動作を予測動作と呼ぶ。
ここで好適な学習動作と予測動作について述べる。図6に示すように学習動作を行うにあたっては予測区間近傍の信号を用いる。これは音声信号が短時間の領域に着目すると比較的繰り返し性が高い性質を利用している。図6のように、雑音が存在する区間よりも前の時間に学習区間1を、雑音が存在する区間よりも後の時間に学習区間2を設ける。学習動作および予測動作においては、学習区間1、学習区間2の信号に対してそれぞれ独立に計算を行う。学習区間1で学習動作を行った後に予測区間の信号を生成することを前方からの予測と呼び、学習区間2で学習動作を行った後に予測区間の信号を生成することを後方からの予測と呼ぶことにする。予測区間の信号は、学習区間1に近い場合には前方からの予測による値の重みを重く、学習区間2に近い場合には後方からの予測による値の重みを重くなるように適当な演算を行って求めると良い。
上述したPLC処理44eおよびLPC処理44fは予測処理であり、各処理について説明したように、雑音発生時の音声信号を破棄する、雑音の大きさに影響を受けない、短いほうが好適であるという共通した特徴を持つ。本発明はこれらの特徴に着目したものである。以下に予測処理の特徴を生かした音声処理について詳述する。なお、PLCおよびLPCは正式な名称ではなく、本明細書において便宜的に使用している用語である。
まず本実施形態において対象とする雑音源について説明する。雑音源の第1の例は図2に示す絞り駆動回路9cである。絞り駆動回路9cは、その基準線が光軸4と一致するようにレンズ2内に設けられている。絞り駆動回路9cは、不図示の駆動源に通電することで、絞り羽根を光路に進入させる絞込み動作を行う。
絞り羽根が光路に進入していない状態(開放状態)では、光線は絞り羽根以外の部分で規制される。一方、絞り羽根が光路に進入した状態(絞込み状態)では絞り羽根によって光線が規制される。
上記駆動源はステッピングモータであり、適切に励磁状態を制御することで、比較的簡単に位置決めを実現できる。つまり、適切な制御を行うことで絞り羽根の光路への進入量を調整可能である。その結果、撮像素子6での光量の調整を行うことが可能である。
次に雑音源としての絞り駆動回路9cが発生する音について説明する。前述した絞込み動作は比較的短時間で動作する。例えば、20〜40ms程度である。レリーズから露光までのタイムラグ短縮や連写速度向上のために、この程度高速にする必要がある。一方、絞込み動作に伴って発生する雑音は、ギアの衝突音や、絞り羽根の擦れる音などであり広帯域の雑音が発生する。
雑音源の第2の例は操作ボタン31のクリック感発生部である。クリック感発生部はホイールを有し、ホイールは操作ボタン31などと一体となって、ユーザの操作によって回転中心周りに回転する。このときホイール上の突起によってボールが押される。このため、ユーザは回転時に力を感じるとともに、ボールが突起の溝部に落ちるときに“カチッ”という感触を感じる。突起の形状等を適切に設計することで、いわゆるクリック感が生まれる。
次に雑音源としてのクリック感発生部が発生する音について説明する。上記突起の山部から溝部にボールが落下するときに衝突が発生するために、短時間に広帯域の雑音が発生する。
上述した雑音の特徴は、短時間かつ広帯域の雑音である。このような特徴を持つ雑音であれば、上記2つの例に関わらず、本発明を適用可能である。また、上述したように短時間かつ広帯域の雑音は予測処理との相性が良いため、予測処理を適切に行うことが可能である。
図7は短時間かつ広帯域の雑音と予測処理時間との関係を例示している。図7において、横軸は時間を、縦軸は音声信号のレベルを、71a、71b,71cは被写体音または暗騒音のみが存在する区間の音声信号を、72a,72bは雑音が発生する区間の音声信号を、73a,73bは予測処理後の音声信号をそれぞれ示している。図7では2箇所に雑音を含む音声信号72aおよび72bが存在している。また図7において、(a)はマイク7によって取得される信号を、(b)は1つ目の雑音を含む音声信号72aを処理した後の音声信号を、(c)は続いて2つ目の雑音を含む音声信号72b処理した後の音声信号をそれぞれ示している。
第1の雑音低減手段は、PLC処理44eおよびLPC処理44fで説明したように、予測処理には一定の処理時間が必要である。これを図7では予測処理時間として示している。図7の例では1つ目の雑音を含む音声信号72aの処理後、2つ目の雑音を含む音声信号72bを処理するまでに、予測処理時間よりも長い時間があるため、予測処理が適正に実行される。1つ目の雑音を含む音声信号72aは予測処理後の音声信号73aに、2つ目の雑音を含む音声信号72bは予測処理後の音声信号73bにそれぞれ適正に処理される。被写体音または暗騒音のみが存在する区間の音声信号71a、71b、71cは特に処理する必要がないので、そのまま出力される。最終的に、図7(c)のように、適正に雑音が低減された音声信号が得られる。
次に図8を参照して、本発明が着目した課題が発生する場面について説明する。図8は、図7と同様に2箇所に雑音を含む音声信号72aおよび72bが存在する例である。図8において図7と同様の信号には同じ符号を付して示し、横軸は時間を、縦軸は音声信号のレベルをそれぞれ示している。また図8において、(a)はマイク7によって取得される信号を、(b)は1つ目の雑音を含む音声信号72aを処理した後の音声信号をそれぞれ示している。
図8の例では1つ目の雑音を含む音声信号72aの処理後、2つ目の雑音を含む音声信号72bを処理するまでの期間が予測処理時間よりも短い。つまり、複数の駆動部のうちの2つ以上が予め決められた期間以上の間を開けずに駆動した場合、2つ目の雑音を含む音声信号72bが適正に処理されない。その結果、図8(b)のように2つ目の雑音72bが低減されない。その上、仮に2つ目の雑音が予測処理に必要な学習区間に含まれてしまうと、1つ目の雑音に対して予測処理が実行されたとしても2つ目の雑音の影響を受けた音声によって置換されてしまうことになる。
図8にて説明した音声信号を、例えば、撮影装置1をモニタにケーブルを介して接続して、撮影装置1を再生装置として動画を再生した場合、雑音72bが被写体音に影響を与えてしまい、品位の低い音声となってしまう。すなわち、再生される音声の品位が低下してしまうおそれがある。
図9乃至図12を参照して、本発明の要部について説明する。以下では、第2の雑音低減手段としてフィルタ処理44bおよびミュート処理44cを例に説明するが、SS処理44a、音圧処理44dなどを単独または組み合わせても良い。
図9は雑音のスペクトルとフィルタの特性を説明する図であり、図7と同様の信号には同じ符号を付して示している。また図9(a)の横軸は時間、縦軸はマイク出力を示している。図9(b)の横軸は周波数、縦軸はパワースペクトルを示している。図9(c)の横軸は周波数、縦軸はフィルタのゲインを示している。図9(b)と図9(c)の横軸は一致しており、図9(b)と図9(c)を貫いて延びる一点鎖線は同じ周波数であることを示している。図9(b)において、80は被写体音のレベルを、82は雑音を含む音声信号72a,72bのパワースペクトルを、82a,82bはフィルタ適用後のパワースペクトルをそれぞれ示している。また、被写体音が主に存在する周波数帯域を、被写体音帯域として示した。図9(c)において、83はフィルタの特性を示している。第1の例や第2の例として説明した雑音は、広帯域の雑音なので、被写体音帯域を含む広い領域で高いパワースペクトルを持つ。図9の例では特に低周波側に強いパワーを持つように描いたが、高周波側に強いパワーを持っても良い。
図9(c)に模式的に示したように、フィルタ処理44bは、被写体音帯域を通過させ(=0dB)その他の帯域は遮断する(=低いゲイン)ように設計されている。前述したフィルタを、雑音を含む音声信号72a,72bに適用することで、図9(b)の82a,82bで示したようなパワースペクトルに変化する。被写体音帯域ではフィルタ特性が0dBなので、フィルタ適用前のパワースペクトル82に一致している。その結果、被写体音帯域では機械駆動音成分が遮断されないが、その他の帯域では雑音が遮断される。これは完全ではないが、機械駆動音成分を低減できていることを意味する。
図10はフィルタ処理44bの具体的な構成を例示しており、トランスバーサルフィルタと呼ばれる形式のフィルタである。図10において、81は入力部を、82は単位遅延器を、83はフィルタ係数保持部を、84は遅延器を、85はスイッチを、86は出力部をそれぞれ示している。図10の回路は、数7で示した畳み込み積分を行うことは明らかである(数7のf(t)と図10のhが対応している)。つまり入力部81に入った信号はフィルタ処理44bで適切にフィルタ処理される。一方、遅延器84はフィルタ処理44bと等価な遅延を与える。フィルタ処理44bによる遅延はフィルタ係数によって異なるが、フィルタ次数の半分程度遅延することが一般的である。
スイッチ85は雑音の発生に連動して切り替わる。図10の例は雑音が発生していないときを示している。このときは、入力部81に入った信号を単に遅延させた信号を得ている。雑音が発生すると、スイッチ85が切り替わりフィルタ処理44bの出力側に接続される。このときは、入力部81に入った信号をフィルタ処理した信号を得ている。その結果、出力部86では適切にフィルタ処理された信号が得られる。
図10のようなフィルタは容易にハード化することが可能であり、リアルタイムで処理することが可能である。つまり、図9で説明したように効果は限定的であるが、処理時間は予測処理に比べて非常に高速である。この特徴を利用する。
次に図11を参照して、フィルタ処理44bによる雑音処理について説明する。図11において図7と同様の信号には同じ符号を付して示し、横軸は時間を、縦軸は音声信号のレベルを、74a、74bはフィルタ処理によって処理された音声信号を、75aはフィルタ処理後に予測処理された音声信号をそれぞれ示している。また、図11において、(a)はマイク7によって取得される信号を、(b)はフィルタ処理された信号を、(c)は1つ目のフィルタ処理後の音声信号74aを予測処理した音声信号をそれぞれ示している。
図11の例は、図8に示した例と同じく1つ目の雑音を含む音声信号72aの処理後、2つ目の雑音を含む音声信号72bを処理するまでに、予測処理時間よりも短い時間しかない場合を想定している。
本実施形態の音声信号処理装置では、まず雑音の発生に連動して、第2の雑音低減手段としてのフィルタ処理44bを動作させる。その結果、雑音を含む音声信号72a、72bは、フィルタ処理された音声信号74a、74bのようになる。図9で説明したように、フィルタを適用することで、ある程度機械駆動音成分を低減できる。これを図11(b)では模式的に振幅で示している。
次に、前段に存在するフィルタ処理された音声信号74aに予測処理を施す。ここで、予測処理は元の音声信号を破棄するので、フィルタ処理を施したとしても影響がない(つまり悪影響が生じない)。
図11の例では音声信号74aの処理後、音声信号74bを処理するまでに、予測処理時間よりも短い時間しかない。音声信号74bの箇所は予測処理がされない。その結果、図11(c)の信号が記録される。しかしながら、図8の例と見比べると、2つめの雑音を含む音声信号72bに対してフィルタ処理がなされているので、機械駆動音成分を低減できていることが分かる。上述した撮影装置1を再生装置として動画を再生した場合、雑音72bの影響が低減されており、音声の品位が向上する。
別の例としては、図17のように予測処理が行われない箇所が発生したときは、その情報を所定の領域に記録しておいても良い。この場合は、撮影とは非同期に(撮影後の適当なタイミングに)予測処理を実行することができる。また、撮影装置1内部で適当なタイミングで処理することも可能である。
また、撮影装置1をパーソナルコンピュータ(PC)にケーブルを介して接続し、動画および前述の情報を送出し、適切なアプリケーションソフトによって処理することも可能である。その結果、より品位の高い音声を得ることができる。
またミュート処理44cは、図10の入力部81、スイッチ85、出力部86から構成されていて、単に信号を0にするだけなので非常に簡易な構成である。これは、リアルタイムで処理することが可能である。
次に図12を参照して、ミュート処理44cによる雑音処理について説明する。図12において図7と同様の信号には同じ符号を付して示し、横軸は時間を、縦軸は音声信号のレベル、76a、76bはミュート処理によって処理された音声信号を、75aはミュート処理後に予測処理された音声信号をそれぞれ示している。また、図12において、(a)はマイク7によって取得される音声信号を、(b)はミュート処理された信号を、(c)は1つ目のミュート処理後の音声信号76aを予測処理した音声信号をそれぞれ示している。
ミュート処理では、当然ながら機械駆動音を完全に除去できる。一方で、被写体音も完全に除去されてしまう。被写体音が小さい場合には、ミュート処理により機械駆動音を除去して適正な音声を得ることができる。被写体音が大きい場合には、被写体音途切れてしまい違和感を与えてしまう。適切に処理できる場面が限られるという意味で、ミュート処理の効果は限定的である。
図12の例においても、本発明を適用することで、図11の場合と同様の効果が得られることは明らかである。つまり、予測処理を行う際に、予測処理で除去できない雑音に対して、予測処理前に予測処理以外の処理を実行しておくことで適正に雑音を低減している。
また、図12においても予測処理後の音声信号に図11と同様に75aを付しているが、これはミュート処理やフィルタ処理された信号の影響を受けずに、同じ信号が生成されることを意味している。
以上のように、予測処理において予測信号を算出することに使用する音声信号に雑音の影響の高い信号が含まれていると、予測信号自体にも雑音の影響が大きく出てしまう。これに対して、本実施形態のように、予測信号を算出するための雑音期間に隣接する雑音期間前後の区間(「学習区間」)の音声信号に対して予めある程度の雑音処理を実行しておくことで、予測信号への雑音の影響を低減した、雑音低減ができる。
特に、第2の雑音低減手段(SS処理、フィルタ処理、ミュート処理および音圧処理)を実行した後に、第1の雑音区間を包含するように予測処理による第1の雑音低減手段(PLC処理およびLPC処理)を実行することで、演算負荷を低減しつつ、効果的な雑音低減ができる。
[実施形態2]次に、実施形態2について説明する。本実施形態の雑音処理部44は、図3の構成のうち、SS処理44a、フィルタ処理44b、PLC処理44e、LPC処理44fから構成されており、その動作および機能は前述した通りである。
次に、本実施形態の雑音発生メカニズムについて説明する。雑音源であるブレ補正駆動回路9bは、2軸方向に駆動可能な補正光学系(レンズ)を有し、ブレセンサ14の検出信号に応じて駆動部(コイル)により補正光学系を偏心させることで、手ブレを補正する。本実施形態のブレ補正駆動回路9bは、コイルに電流を供給しないときは重力方向に補正光学系が偏心してしまう。このような状態で光学ファインダーを見ると、品位の低下した像が見えてしまう。これを防止するためには、手ぶれ補正を行わないときには、補正光学系を光軸中心に保持することが望ましい。しかし、カメラのような携帯機器では省電力化が求められるので、補正光学系を光軸中心に常に保持することは困難である。
そこで、ブレ補正駆動回路9bには、フォトインタラプタなどを備えたロック機構が設けられており、フォトインタラプタへの信号が遮断されることでロック状態にあることを検知することができる。ロック状態では、補正光学系をほぼ光軸中心に保持する。ロック状態からアンロック状態に移行する場合には、ロック位置からステッピングモータを所定方向に所定量回転させる。アンロック状態では、ブレ補正駆動回路9bにより補正光学系を動作させることで、手ブレを補正できる。
ここで雑音源であるブレ補正駆動回路9bが発生する音について説明する。前述したロック機構のロック状態とアンロック状態の遷移時には短時間で大きな音が発生する一方、ブレ補正動作中はブレ補正駆動に伴い定常的で小さな音が発生する。
図14はブレ補正駆動回路9bが発生する音声信号を例示しており、(a)の横軸は時間を、縦軸はマイク7の出力を示している。また、図14(b)は図14(a)のいくつかの区間の音声信号をフーリエ変換した結果であり、横軸は周波数を、縦軸はパワースペクトルを示している。図14(a)において、91はいわゆる暗騒音区間を、92はロック機構の動作音を、93はブレ補正に伴う定常音をそれぞれ示している。図14(b)において、91a,92a,93aはそれぞれ、91、92、93の箇所をフーリエ変換した結果を示している。94aはある周波数f[Hz]における93aと91aの差を示している。暗騒音区間91は音声信号のレベルが小さく、パワースペクトル91aも他の区間に比べて相対的に小さい。ロック機構の動作音を含む区間92では、短時間に大きな第1の雑音(第1の駆動音成分)が発生する。また、衝突などが発生するために広い周波数帯域でノイズが発生する。このためパワースペクトル92a広い範囲で大きな値を示す。ブレ補正区間93では、第1の雑音より長時間続く定常的な第2の雑音(第2の駆動音成分)が発生する。またブレ補正駆動回路9bの種類に応じた特異な周波数帯のノイズが大きくなる。このためパワースペクトル93aは、いくつかのピークを持った形をしている。
図14において、SS法を適用する場合には、94aで示したブレ補正区間でのパワースペクトル93aと暗騒音のパワースペクトル91aの差を周波数ごとに記憶しておく。SS処理時には前述したように、カメラシステム制御回路25が記憶したパワースペクトルの差94aを与えればよい。
図15を参照して、レンズの種類と雑音の特徴および雑音処理手法の選択方法について述べる。図15はいくつかのレンズにおいて、ブレ補正中の雑音をフーリエ変換した結果であり、横軸は周波数を、縦軸はパワースペクトルを示している。また図15に示すように、被写体音は適当な帯域に主な成分を持っているとする(図15では被写体音帯域として図示した。)図15において、93a、93b、93cはそれぞれ異なるレンズのパワースペクトルを、95は被写体音のレベルを示している。
ブレ補正駆動回路9bが93aのようなパワースペクトルを持つ雑音を発生する場合を考える。このとき、被写体音帯域で被写体音のレベル95に対して、ブレ補正駆動回路9bのパワースペクトル93aは被写体音に影響を与えるほどレベルが大きい。フィルタは帯域によって、被写体音と雑音を分離する方法なので、この場合はフィルタでの処理は困難である。
一方、ブレ補正駆動回路9bが93bまたは93cのようなパワースペクトルをもつ雑音を発生する場合を考える。このとき、被写体音帯域ではない箇所では、被写体音のレベル95に対して、ブレ補正駆動回路9bのパワースペクトル93aは影響を与えるほどに大きい箇所があるものの、被写体音帯域では被写体音が支配的であると考えられる。このような場合はフィルタでの処理が適しているといえる。
すなわち、93bのような雑音が発生する場合には、適当な高域通過フィルタを、93cのような雑音が発生する場合には、適当な低域通過フィルタを用いればよい。これは、数5および数6を満たすようなフィルタを設定することと等価である。フィルタ処理時には前述したように、事前に雑音源のスペクトルを推定し、適当なフィルタをカメラシステム制御回路25が与えればよい。
SS処理44aは被写体音に歪みをもたらす可能性があるが、帯域での分離が困難な雑音にも適用可能である。一方で、フィルタ処理44bは帯域で分離可能であれば被写体音への影響を低減して雑音を低減できる。つまり、雑音源のパワースペクトルに着目して適宜SS処理44a、フィルタ処理44bを切り替えて使用すればよい。
SS処理44a、フィルタ処理44bの説明においては、角速度ωで説明した。一方、図14および図15の横軸は周波数であるが、これらは、2πf=ω[rad/s]として換算すればよい。
本発明の音声信号処理装置および音声信号処理装置を備えた撮影装置においては、前段の雑音処理としてフィルタ処理44bやSS処理44aなどが考えられるが、以下の説明ではSS処理44aを用いる場合について説明をする。
図16を参照して、SS処理開始のタイミング合わせおよび複数の雑音処理の問題について説明する。図16において、1つの枠は適当な時間の音声信号の塊を表している(例えば、1つの枠が10msの音声信号などに対応する)。また横方向は時間を示している。図16には凡例も示したが、101は被写体音または暗騒音のみが存在する区間の音声信号を、102はロック解除音が発生する区間の音声信号を、103はブレ補正駆動音が発生する区間の音声信号をそれぞれ示している。これは、図14の91,92,93に対応する。図16において、104はロック音発生区間をSS処理した音声信号を、105はブレ補正駆動音発生区間をSS処理した音声信号を、106は被写体音または暗騒音のみの区間をSS処理した音声信号をそれぞれ示している。図16(a)は、SS処理を行う前の音声信号を、図16(b)はロック解除のタイミングに合わせてSS処理を開始したときの音声信号を、図16(c)はロック解除よりも早いタイミングでSS処理を開始した音声信号をそれぞれ示している。また、図16(d)はロック解除よりも遅れたタイミングでSS処理を開始した音声信号を示している。
図16(b)において、ブレ補正駆動音発生区間をSS処理した音声信号105は適正にSS処理されているので、ブレ補正駆動に伴う雑音が適切に低減されている。一方で、ロック音発生区間をSS処理した音声信号104は、図14にて説明したように、ロック音は発生時間こそ短いが、広帯域に強いパワーを持つ。そのため、ブレ補正動作のパワースペクトルを用いてSS処理を行っても十分に雑音を低減することができない。図14の例では92aと93aの差がSS処理を行った後も残留することになる。これは、SS処理が定常的な雑音であるブレ補正駆動に伴う雑音の低減を目的としているためである。
図16(c)において、被写体音または暗騒音のみの区間をSS処理した音声信号106は被写体音が存在する場合には歪みが生じてしまう。SS処理は数3のように、推定雑音スペクトルを用いてスペクトルの減算を行うが、音声信号106の区間にはもともと雑音が存在しないために過剰に減算してしまう。その結果、被写体音に歪みが生じるのである。
図16(d)では、ロック音の先頭部分は何ら処理されずに残留する。一般的に衝突現象と伴うような雑音では図14に示した例の様に、大きな音が発生した後に減衰するような形状を示す。この場合、先頭部分の大きな雑音がそのまま、被写体音に重畳してしまう。
SS処理の開始タイミングと雑音発生タイミングを完全に同期させることができれば、図16(b)の音声信号を得ることが出来る。しかしながら、撮影装置1においては、電気接点10を介して撮影レンズ2に指令を送って光学系の調整を行うので、通信や割り込みのタイミングなどにより遅れが生じる。このためタイミングを完全に同期させてSS処理を行うことは容易ではない。SS処理のタイミングがずれた場合は、図16(c)および図16(d)で説明したように、被写体音の歪みや、大きな雑音の重畳が生じてしまう。
図17を参照して、SS処理のフレームと減算ゲインの問題について説明する。図17は図16と同様に、1つの枠は適当な時間の音声信号の塊を表し、横方向は時間を示し、図14と同様の信号には同じ符号を付して示している。図17において、101aは被写体音または暗騒音のみの区間をSS処理した音声信号を、105a、107はブレ補正駆動音発生区間をSS処理した音声信号をそれぞれ示している。詳細な違いについては後述する。また図17において縦に伸ばした点線は、SS処理において一度にFFTを行う信号の区切りを示している(以下、SS処理のフレームと呼ぶ)。SS処理においては、前述したようにFFT、スペクトル減算、IFFTを行う。このときFFTは2の累乗のデータ数で有る必要があるので、適当なフレームで区切って処理を進める。図17の例では3つのフレームが有り、時間順にフレーム1、フレーム2、フレーム3と呼ぶことにする。
図17(a)は、SS処理を行う前の音声信号を、図17(b)はブレ補正駆動音発生区間103の処理が適正になるようにSS処理を実行ときの音声信号を示している。図17(c)は被写体音または暗騒音のみの区間91の処理が適正になるようにSS処理したときの音声信号を示している。
図17の例において、フレーム1はSS処理を実行する必要はなく、フレーム3はカメラシステム制御回路25において付加される、SS処理が未処理であることを示す情報を判別してSS処理を実行すればよい。問題になるのはフレーム2の処理である。以下にフレーム2の処理とその問題点について説明する。
図17(b)では、ブレ補正駆動音発生区間103の処理が適正になるようにSS処理されている。そのため、フレーム2に存在するブレ補正駆動音発生区間をSS処理した音声信号105aは適正にSS処理され、ブレ補正駆動に伴う雑音が適切に低減されている。一方で、被写体音または暗騒音のみの区間をSS処理した音声信号106は、図12と同様に過剰に減算され被写体音に歪みが生じている。
図17(c)では、被写体音または暗騒音のみの区間101の処理が適正になるようにSS処理されている。そのため、フレーム2に存在する被写体音または暗騒音のみの区間をSS処理した音声信号101aは適正に処理され被写体音のひずみは小さい。一方で、ブレ補正駆動音発生区間をSS処理した音声信号107は減算が過小のため、雑音が十分に低減されない。
この問題を解決するために特許文献3では、雑音区間に対する雑音の混合比率を用いて、適当にスペクトル減算することが提案されている。しかしながら、雑音発生タイミングを正確に検知することは容易ではない。また、前述の混合比率を用いても図17の101a,105aに相当する音声信号を正確にSS処理を行うことはできない(図17の説明の中間的な結果しか得ることができない)。
図16および図17にて説明したように、複数の雑音が発生する場合には、1つの雑音処理では十分な効果を得ることが難しい、雑音処理のタイミングを合わせることが難しい、処理の開始時点での強度を決定することが難しいという問題があった。本発明はこれらの問題に対して、複数の異なる雑音処理手法を用いるとともに、その順序を適切に規定することにより、解決を試みるものである。
図6、図16乃至図19を参照して、本発明の要部について説明する。
本実施形態によると、第2の雑音低減手段としてのSS処理44aまたはフィルタ処理44bの後に、第1の雑音低減手段としてのPLC処理44eやLPC処理44fを実行する。例えば、SS処理44aを行った場合には図16(b)、(c)、(d)や図17(b)、(c)のような音声信号が得られる。図18に、SS処理44aを行った区間を包含するように予測区間を設定して予測処理を実行する例を示している。図18において図16および図17と同様の信号には同じ符号を付して示し、108は予測生成された音声信号を示している。
図16および図17で説明したように被写体音または暗騒音のみが存在する区間の音声信号101は雑音の影響がなく、ブレ補正駆動音発生区間をSS処理した音声信号105は適正に雑音が低減されている。一方その中間にある音声信号は十分に雑音が低減されていない可能性がある(例えば、図16の音声信号102、106または図17の音声信号107が該当する)。しかしながら、図6のように予測処理では元の信号を破棄する。そのため、雑音が低減されていない可能性が有る音声信号が破棄される。さらに、予測によって生成される信号は音声信号101および音声信号105から生成されるので機械駆動音成分を低減できている。
図19は上述したSS処理および予測処理による音声信号を示しており、横軸は時間を、縦軸はマイク7の出力を示している。図19において、(a)は処理前の音声信号を、(b)はロック解除よりも早いタイミングでSS処理を開始した音声信号を、(c)はロック解除よりも遅れたタイミングでSS処理を開始した音声信号をそれぞれ示している。また、(d)は予測処理中の音声信号を、(e)は予測処理後の音声信号をそれぞれ示している。図19では雑音の状況を明確にするために被写体音がない場合の波形を示しており、被写体音が存在するときでも処理方法や効果に変わりはない。
図19において、111は被写体音または暗騒音のみが存在する区間の音声信号を、112はロック解除音が発生する区間の音声信号を、113はブレ補正駆動音が発生する区間の音声信号をそれぞれ示している。114はロック音発生区間をSS処理した音声信号を、115はブレ補正駆動音発生区間をSS処理した音声信号を、116は被写体音または暗騒音のみの区間をSS処理した音声信号をそれぞれ示している。118aは予測処理において信号を破棄した状態を、118は予測処理後の音声信号をそれぞれ示している。図19の111から116は図16の101から106にそれぞれ対応する。また118は図18の108に対応する。図19(d)においては、信号の破棄を当該箇所の信号をゼロにすることで表現している。
図19から明らかなように、被写体音に歪みが生じた音声信号116、十分に雑音が低減されていない音声信号112が存在しても、それらの信号を破棄し、予測生成された適当な音声信号118が得られていることが分かる。
図19では図16に対応させて説明をしたが、図17の問題に関しても解決できることは明らかである。すなわち図17のフレーム2を包含するように予測区間を設定することで、被写体音に歪みが生じた音声信号112、十分に雑音が低減されていない音声信号107が破棄され適当な音声信号を得ることができる。
最後に、予測処理とそれ以外の雑音処理の順番を反対にした場合について説明し、本発明のように順序を規定することの効果について明らかにする。
図20は、SS処理前に予測処理を実行した場合を模式的に示しており、図16および図17と同様の信号には同じ符号を付して示している。図20において、109は予測処理により生成された音声信号を示している。
ここで問題になるのは、ブレ補正駆動音発生区間の音声信号103を用いて生成された音声信号109である。つまり、この音声信号109にどの程度の雑音が残留しているかが明確ではないため、SS処理やフィルタ処理を実行する際にその強度が不明確となる。
もう1つの問題は、音声信号109において次第に雑音の影響が大きくなっていると仮定すると、SS処理やフィルタ処理をどの時点で開始するかという問題である。
これらの問題について図21を参照して説明する。図21の横軸は時間を、縦軸はマイク7の出力をそれぞれ示し、図19と同様の信号には同じ符号を付して示している。図21において、(a)は予測処理前の音声信号を、(b)は予測処理中の音声信号を、(c)は予測処理後の音声信号を、(d)はSS処理の強度が不適切な場合の音声信号を、(e)はSS処理のタイミングが不適切な場合の音声信号をそれぞれ示している。
図21において、119aは予測処理において信号を破棄した状態を、119は予測処理後の音声信号を、120aは過剰なスペクトル減算により歪んだ音声信号を、120bは雑音が残留した音声信号を、121はSS処理後の音声信号をそれぞれ示している。111〜115は図16の信号101〜105に、119は図20の信号109に対応している。
先に予測処理を行った場合、図21(c)の信号が得られる。図21の例では、予測処理で生成された音声信号119は、前後からの予測信号を適切にオーバーラップ加算して生成されているが、図21のように当該箇所における雑音の影響が不明確となっている。
音声信号115にSS処理を施すと図21(d)のような信号が生成される。すなわち、音声信号119のうち、雑音の影響が音声信号115と同程度の箇所は適正に処理されて音声信号121が得られる。一方で、音声信号119のうち、雑音の影響が音声信号115よりも小さい箇所は過剰にSS処理が施されて、被写体音に歪みがある音声信号120aが得られる。
別の方法として、音声信号119のうち、雑音の影響が音声信号115と同程度の箇所からSS処理を施すと図21(e)のような信号が得られる。この場合、雑音が残留した音声信号120bが得られる。
本実施形態では、雑音源としてブレ補正駆動回路9bを取り上げたが、本発明は、焦点レンズ駆動回路9aなどの別の駆動部にも適用でき、この場合、焦点レンズ駆動回路9aで可動する部分が機械的にストッパに衝突することを考えればよい。焦点レンズ駆動回路9aの可動部分の駆動中はモータやギアなどにより定常的な雑音が発生しており、ストッパに衝突する時は短時間に大きい雑音が発生する。
以上のように、本実施形態によれば、第2の雑音低減手段としてのSS処理44aやフィルタ処理44bの後に、第1の雑音低減手段としてのPLC処理44eやLPC処理44fを実行するので、適正に雑音を低減した音声信号を得ることができる。その結果、ユーザの利便性向上に貢献する。
上述した各実施形態においては、本発明をデジタル(ビデオ)カメラに適用した場合を例に説明したが、これに限定されず、雑音源を持ち音声を録音する装置であれば適用可能である。
[他の実施形態]また、本発明は、以下の処理を実行することによっても実現される。即ち、上記実施形態の機能を実現するソフトウェア(プログラム)をネットワーク又は各種記憶媒体を介してシステム或いは装置に供給し、そのシステム或いは装置のコンピュータ(又はCPUやMPU等)がプログラムコードを読み出して実行する処理である。この場合、そのプログラム、および該プログラムを記憶した記憶媒体は本発明を構成することになる。

Claims (10)

  1. 複数の駆動部を有する音声信号処理装置であって、
    前記装置周囲の音声を集音して音声信号を取得する集音手段と、
    前記複数の駆動部の駆動を制御する駆動制御手段と、
    前記複数の駆動部の駆動に伴う駆動音が発生したタイミングである雑音区間の隣接する前および後の少なくともいずれかの所定の区間の音声信号から算出した信号を、前記雑音区間の音声信号と置換することにより、前記複数の駆動部の駆動に伴う駆動音成分を低減する第1の雑音低減手段と、
    前記雑音区間の隣接する前および後の少なくともいずれかの所定の区間の音声信号を使用せずに、前記複数の駆動部の駆動に伴う駆動音成分を低減する第2の雑音低減手段と、
    前記複数の駆動部のうちの2つ以上が予め決められた期間以上の間を開けずに駆動した場合は、前記集音手段により取得された音声信号を前記第2の雑音低減手段により前記駆動音成分を低減した後に、前記第1の雑音低減手段により、前記駆動音成分を低減する制御手段とを有することを特徴とする音声信号処理装置。
  2. 前記第2の雑音低減手段は、前記集音手段により取得された音声信号から得られた音声スペクトルから雑音スペクトルを減算する処理を行うことを特徴とする請求項1に記載の音声信号処理装置。
  3. 前記第2の雑音低減手段は、前記集音手段により取得された音声信号について周波数又は時間を用いたフィルタ処理を行うことを特徴とする請求項1または2に記載の音声信号処理装置。
  4. 前記第2の雑音低減手段は、前記駆動音成分を無音に置き換える処理を行うことを特徴とする請求項1乃至3のいずれか1項に記載の音声信号処理装置。
  5. 前記第2の雑音低減手段は、前記集音手段により取得された音声信号について包絡線検出を行うことにより、信号レベルを制御することを特徴とする請求項1乃至3のいずれか1項に記載の音声信号処理装置。
  6. 前記第1の雑音低減手段は、線形予測により算出した信号で前記雑音区間の音声信号を置換することを特徴とする請求項1乃至5のいずれか1項に記載の音声信号処理装置。
  7. 前記第1の雑音低減手段は、前記集音手段により取得された音声信号に欠落が発生した場合に、その近傍信号を複写する処理を行うことを特徴とする請求項1乃至5のいずれか1項に記載の音声信号処理装置。
  8. 前記駆動音が、第1の駆動音と、当該第1の駆動音より信号レベルが小さく且つ長時間続く第2の駆動音を含む場合、前記制御手段は、前記第2の雑音低減手段により前記第2の駆動音成分を低減した後に、前記第1の雑音低減手段により前記第1の駆動音成分を低減することを特徴とする請求項1乃至7のいずれか1項に記載の音声信号処理装置。
  9. 前記駆動部としての撮影光学系を通して結像される被写体の光を取り込んで光電変換する撮像手段と、
    前記撮像手段により生成された画像信号に信号処理を施す画像処理手段と、
    前記画像処理手段により信号処理された画像信号と、前記音声信号処理装置により雑音が除去された音声信号とを関連付けして記録する記録処理手段と、を更に有することを特徴とする請求項1乃至8のいずれか1項に記載の音声信号処理装置。
  10. 複数の駆動部と、前記装置周囲の音声を集音して音声信号を取得する集音手段と、前記複数の駆動部の駆動を制御する駆動制御手段と、前記複数の駆動部の駆動に伴う駆動音成分を低減する第1および第2の雑音低減手段と、前記第1および第2の雑音低減手段の動作を制御する制御手段とを有する音声信号処理装置における音声信号処理方法であって、
    前記第1の雑音低減手段が、前記複数の駆動部の駆動に伴う駆動音が発生したタイミングである雑音区間の隣接する前および後の少なくともいずれかの所定の区間の音声信号から算出した信号を、前記雑音区間の音声信号と置換することにより、前記複数の駆動部の駆動に伴う駆動音成分を低減する第1の雑音低減工程と、
    前記第2の雑音低減手段が、前記雑音区間の隣接する前および後の少なくともいずれかの所定の区間の音声信号を使用せずに、前記複数の駆動部の駆動に伴う駆動音成分を低減する第2の雑音低減工程と、
    前記制御手段が、前記複数の駆動部のうちの2つ以上が予め決められた期間以上の間を開けずに駆動した場合は、前記集音手段により取得された音声信号を前記第2の雑音低減手段により前記駆動音成分を低減した後に、前記第1の雑音低減手段により、前記駆動音成分を低減する制御工程とを有することを特徴とする音声信号処理方法。
JP2010133349A 2010-06-10 2010-06-10 音声信号処理装置および音声信号処理方法 Expired - Fee Related JP5529635B2 (ja)

Priority Applications (5)

Application Number Priority Date Filing Date Title
JP2010133349A JP5529635B2 (ja) 2010-06-10 2010-06-10 音声信号処理装置および音声信号処理方法
EP11166474.4A EP2395774B1 (en) 2010-06-10 2011-05-18 Audio signal processing apparatus and method of controlling the same
US13/116,743 US9386369B2 (en) 2010-06-10 2011-05-26 Audio signal processing apparatus and method of controlling the same
KR1020110055420A KR101377470B1 (ko) 2010-06-10 2011-06-09 음성신호처리장치 및 그 제어 방법
CN2011101567947A CN102280108B (zh) 2010-06-10 2011-06-10 音频信号处理设备及其控制方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2010133349A JP5529635B2 (ja) 2010-06-10 2010-06-10 音声信号処理装置および音声信号処理方法

Publications (2)

Publication Number Publication Date
JP2011257656A true JP2011257656A (ja) 2011-12-22
JP5529635B2 JP5529635B2 (ja) 2014-06-25

Family

ID=44475145

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2010133349A Expired - Fee Related JP5529635B2 (ja) 2010-06-10 2010-06-10 音声信号処理装置および音声信号処理方法

Country Status (5)

Country Link
US (1) US9386369B2 (ja)
EP (1) EP2395774B1 (ja)
JP (1) JP5529635B2 (ja)
KR (1) KR101377470B1 (ja)
CN (1) CN102280108B (ja)

Cited By (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2013182185A (ja) * 2012-03-02 2013-09-12 Canon Inc 音声処理装置
WO2014017371A1 (ja) * 2012-07-25 2014-01-30 株式会社ニコン 信号処理装置、撮像装置、及び、プログラム
JP2014044313A (ja) * 2012-08-27 2014-03-13 Xacti Corp 雑音低減装置
JP2016054462A (ja) * 2014-09-04 2016-04-14 キヤノン株式会社 電子機器及び制御方法
JP2017220913A (ja) * 2016-06-10 2017-12-14 キヤノン株式会社 撮像装置及びその制御方法

Families Citing this family (16)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP5589323B2 (ja) * 2009-08-27 2014-09-17 ヤマハ株式会社 音信号処理装置
JP2012032648A (ja) * 2010-07-30 2012-02-16 Sony Corp 機械音抑圧装置、機械音抑圧方法、プログラムおよび撮像装置
JP2012203040A (ja) * 2011-03-23 2012-10-22 Canon Inc 音声信号処理装置、及びその制御方法
CN103077703B (zh) * 2012-12-25 2014-12-24 桂林电子科技大学 一种动态噪声的抑制方法和装置
JP6144945B2 (ja) * 2013-03-29 2017-06-07 キヤノン株式会社 信号処理装置及び方法
KR102094011B1 (ko) 2013-06-13 2020-03-26 삼성전자주식회사 전자 장치에서 노이즈를 제거하기 위한 장치 및 방법
US20150179181A1 (en) * 2013-12-20 2015-06-25 Microsoft Corporation Adapting audio based upon detected environmental accoustics
US9721580B2 (en) * 2014-03-31 2017-08-01 Google Inc. Situation dependent transient suppression
NO2780522T3 (ja) 2014-05-15 2018-06-09
CN105321523A (zh) * 2014-07-23 2016-02-10 中兴通讯股份有限公司 噪音抑制方法和装置
CN107112025A (zh) * 2014-09-12 2017-08-29 美商楼氏电子有限公司 用于恢复语音分量的***和方法
CN107112012B (zh) * 2015-01-07 2020-11-20 美商楼氏电子有限公司 用于音频处理的方法和***及计算机可读存储介质
US10001966B1 (en) * 2016-01-20 2018-06-19 Rockwell Collins, Inc. Systems and methods for sequencing audio communications
US9838737B2 (en) * 2016-05-05 2017-12-05 Google Inc. Filtering wind noises in video content
CN111049596B (zh) * 2019-12-18 2022-04-26 公安部第三研究所 一种对讲终端音频激活声压的测试方法及测试***
CN111092668B (zh) * 2019-12-18 2022-07-15 公安部第三研究所 一种对讲终端环境噪音抑制特性的测试方法及***

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS5294713A (en) * 1976-02-05 1977-08-09 Victor Co Of Japan Ltd Pulse noise signal reduction system
JP2003317368A (ja) * 2002-04-25 2003-11-07 Digion Inc パルス性ノイズのデジタル信号処理による検出および除去方法
WO2006080149A1 (ja) * 2005-01-25 2006-08-03 Matsushita Electric Industrial Co., Ltd. 音復元装置および音復元方法
JP2008053802A (ja) * 2006-08-22 2008-03-06 Sony Corp 記録装置、ノイズ除去方法、ノイズ除去装置

Family Cites Families (17)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH04233873A (ja) 1990-12-28 1992-08-21 Minolta Camera Co Ltd レンズ交換可能なビデオカメラ
JP2839815B2 (ja) * 1993-02-26 1998-12-16 松下電器産業株式会社 ビデオカメラ用収音装置
JPH11327063A (ja) * 1998-05-14 1999-11-26 Olympus Optical Co Ltd 音声記録可能なカメラ
JP4327402B2 (ja) * 2002-02-08 2009-09-09 富士フイルム株式会社 録音装置
US20040032509A1 (en) * 2002-08-15 2004-02-19 Owens James W. Camera having audio noise attenuation capability
JP2006186451A (ja) 2004-12-27 2006-07-13 Casio Comput Co Ltd 電子カメラ、ノイズ低減装置、ノイズ低減制御プログラム及びノイズ低減方法
JP4466384B2 (ja) 2005-01-19 2010-05-26 カシオ計算機株式会社 電子カメラ、ノイズ低減装置及びノイズ低減方法
JP4910293B2 (ja) * 2005-02-16 2012-04-04 カシオ計算機株式会社 電子カメラ、ノイズ低減装置及びノイズ低減制御プログラム
JP2006262241A (ja) 2005-03-18 2006-09-28 Casio Comput Co Ltd 電子カメラ、ノイズ低減装置及びノイズ低減制御プログラム
JP2006270591A (ja) 2005-03-24 2006-10-05 Nikon Corp 電子カメラ、データ再生装置およびプログラム
JP4639907B2 (ja) * 2005-03-31 2011-02-23 カシオ計算機株式会社 撮像装置、音声記録方法及びプログラム
US7596231B2 (en) * 2005-05-23 2009-09-29 Hewlett-Packard Development Company, L.P. Reducing noise in an audio signal
JP4193814B2 (ja) * 2005-05-27 2008-12-10 ソニー株式会社 信号処理回路および信号処理方法、音声信号処理回路および音声信号処理方法、撮像装置および撮像装置の音声信号処理方法、記録装置および記録方法、並びに、再生装置および再生方法
JP2008077707A (ja) * 2006-09-19 2008-04-03 Sony Corp 記録装置、ノイズ除去方法、ノイズ除去装置
NO328622B1 (no) * 2008-06-30 2010-04-06 Tandberg Telecom As Anordning og fremgangsmate for reduksjon av tastaturstoy i konferanseutstyr
US8392181B2 (en) * 2008-09-10 2013-03-05 Texas Instruments Incorporated Subtraction of a shaped component of a noise reduction spectrum from a combined signal
KR20100053192A (ko) * 2008-11-12 2010-05-20 삼성전자주식회사 디지털 영상 처리장치

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS5294713A (en) * 1976-02-05 1977-08-09 Victor Co Of Japan Ltd Pulse noise signal reduction system
JP2003317368A (ja) * 2002-04-25 2003-11-07 Digion Inc パルス性ノイズのデジタル信号処理による検出および除去方法
WO2006080149A1 (ja) * 2005-01-25 2006-08-03 Matsushita Electric Industrial Co., Ltd. 音復元装置および音復元方法
JP2008053802A (ja) * 2006-08-22 2008-03-06 Sony Corp 記録装置、ノイズ除去方法、ノイズ除去装置

Cited By (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2013182185A (ja) * 2012-03-02 2013-09-12 Canon Inc 音声処理装置
WO2014017371A1 (ja) * 2012-07-25 2014-01-30 株式会社ニコン 信号処理装置、撮像装置、及び、プログラム
JP2014044313A (ja) * 2012-08-27 2014-03-13 Xacti Corp 雑音低減装置
JP2016054462A (ja) * 2014-09-04 2016-04-14 キヤノン株式会社 電子機器及び制御方法
JP2017220913A (ja) * 2016-06-10 2017-12-14 キヤノン株式会社 撮像装置及びその制御方法
US10551730B2 (en) 2016-06-10 2020-02-04 Canon Kabushiki Kaisha Image capturing apparatus and method of controlling the same

Also Published As

Publication number Publication date
KR20110135343A (ko) 2011-12-16
EP2395774B1 (en) 2018-04-04
EP2395774A2 (en) 2011-12-14
KR101377470B1 (ko) 2014-04-01
CN102280108B (zh) 2013-04-03
US9386369B2 (en) 2016-07-05
EP2395774A3 (en) 2016-08-10
US20110305351A1 (en) 2011-12-15
JP5529635B2 (ja) 2014-06-25
CN102280108A (zh) 2011-12-14

Similar Documents

Publication Publication Date Title
JP5529635B2 (ja) 音声信号処理装置および音声信号処理方法
JP2006270591A (ja) 電子カメラ、データ再生装置およびプログラム
JP6610725B2 (ja) 音処理装置および音処理プログラム
US8860822B2 (en) Imaging device
JP5361398B2 (ja) 撮像装置
JP5998483B2 (ja) 音声信号処理装置、音声信号処理方法、プログラム及び記録媒体
US9160460B2 (en) Noise cancelling device
JP2012114842A (ja) 撮像装置及び駆動雑音除去装置
JP5063489B2 (ja) 判定装置及びそれを備えた電子機器並びに判定方法
US8855482B2 (en) Imaging apparatus and sound processing apparatus
KR101399986B1 (ko) 음성신호 처리장치
US8600070B2 (en) Signal processing apparatus and imaging apparatus
US9294835B2 (en) Image capturing apparatus, signal processing apparatus and method
JP5018860B2 (ja) 信号処理装置及び撮像装置
JP5473786B2 (ja) 音声信号処理装置、及びその制御方法
JP5548529B2 (ja) 音声信号処理装置および撮影装置
JP5736839B2 (ja) 信号処理装置、撮像装置、及びプログラム
JP2012165219A (ja) 撮像装置
JP5246134B2 (ja) 信号処理装置及び撮像装置
JP2022148507A (ja) 音声処理装置、制御方法、およびプログラム
JP2014232267A (ja) 信号処理装置、撮像装置、およびプログラム
JP2011035708A (ja) 音響信号処理装置、及び撮像装置
JP2016082580A (ja) 撮像装置

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20130610

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20131224

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20140106

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20140228

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20140320

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20140417

R151 Written notification of patent or utility model registration

Ref document number: 5529635

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R151

LAPS Cancellation because of no payment of annual fees