JP2021081533A - 音信号変換プログラム、音信号変換方法、及び、音信号変換装置 - Google Patents

音信号変換プログラム、音信号変換方法、及び、音信号変換装置 Download PDF

Info

Publication number
JP2021081533A
JP2021081533A JP2019207622A JP2019207622A JP2021081533A JP 2021081533 A JP2021081533 A JP 2021081533A JP 2019207622 A JP2019207622 A JP 2019207622A JP 2019207622 A JP2019207622 A JP 2019207622A JP 2021081533 A JP2021081533 A JP 2021081533A
Authority
JP
Japan
Prior art keywords
channel
sound signal
signal
phase
sound
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2019207622A
Other languages
English (en)
Inventor
洋平 岸
Yohei Kishi
洋平 岸
鈴木 政直
Masanao Suzuki
政直 鈴木
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Fujitsu Ltd
Original Assignee
Fujitsu Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Fujitsu Ltd filed Critical Fujitsu Ltd
Priority to JP2019207622A priority Critical patent/JP2021081533A/ja
Priority to US17/062,122 priority patent/US11463806B2/en
Publication of JP2021081533A publication Critical patent/JP2021081533A/ja
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L17/00Speaker identification or verification techniques
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04RLOUDSPEAKERS, MICROPHONES, GRAMOPHONE PICK-UPS OR LIKE ACOUSTIC ELECTROMECHANICAL TRANSDUCERS; DEAF-AID SETS; PUBLIC ADDRESS SYSTEMS
    • H04R5/00Stereophonic arrangements
    • H04R5/027Spatial or constructional arrangements of microphones, e.g. in dummy heads
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L25/00Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
    • G10L25/48Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 specially adapted for particular use
    • G10L25/51Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 specially adapted for particular use for comparison or discrimination
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04RLOUDSPEAKERS, MICROPHONES, GRAMOPHONE PICK-UPS OR LIKE ACOUSTIC ELECTROMECHANICAL TRANSDUCERS; DEAF-AID SETS; PUBLIC ADDRESS SYSTEMS
    • H04R1/00Details of transducers, loudspeakers or microphones
    • H04R1/20Arrangements for obtaining desired frequency or directional characteristics
    • H04R1/32Arrangements for obtaining desired frequency or directional characteristics for obtaining desired directional characteristic only
    • H04R1/326Arrangements for obtaining desired frequency or directional characteristics for obtaining desired directional characteristic only for microphones
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04RLOUDSPEAKERS, MICROPHONES, GRAMOPHONE PICK-UPS OR LIKE ACOUSTIC ELECTROMECHANICAL TRANSDUCERS; DEAF-AID SETS; PUBLIC ADDRESS SYSTEMS
    • H04R1/00Details of transducers, loudspeakers or microphones
    • H04R1/20Arrangements for obtaining desired frequency or directional characteristics
    • H04R1/32Arrangements for obtaining desired frequency or directional characteristics for obtaining desired directional characteristic only
    • H04R1/34Arrangements for obtaining desired frequency or directional characteristics for obtaining desired directional characteristic only by using a single transducer with sound reflecting, diffracting, directing or guiding means
    • H04R1/38Arrangements for obtaining desired frequency or directional characteristics for obtaining desired directional characteristic only by using a single transducer with sound reflecting, diffracting, directing or guiding means in which sound waves act upon both sides of a diaphragm and incorporating acoustic phase-shifting means, e.g. pressure-gradient microphone
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04RLOUDSPEAKERS, MICROPHONES, GRAMOPHONE PICK-UPS OR LIKE ACOUSTIC ELECTROMECHANICAL TRANSDUCERS; DEAF-AID SETS; PUBLIC ADDRESS SYSTEMS
    • H04R25/00Deaf-aid sets, i.e. electro-acoustic or electro-mechanical hearing aids; Electric tinnitus maskers providing an auditory perception
    • H04R25/40Arrangements for obtaining a desired directivity characteristic
    • H04R25/405Arrangements for obtaining a desired directivity characteristic by combining a plurality of transducers
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04RLOUDSPEAKERS, MICROPHONES, GRAMOPHONE PICK-UPS OR LIKE ACOUSTIC ELECTROMECHANICAL TRANSDUCERS; DEAF-AID SETS; PUBLIC ADDRESS SYSTEMS
    • H04R25/00Deaf-aid sets, i.e. electro-acoustic or electro-mechanical hearing aids; Electric tinnitus maskers providing an auditory perception
    • H04R25/40Arrangements for obtaining a desired directivity characteristic
    • H04R25/407Circuits for combining signals of a plurality of transducers
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04RLOUDSPEAKERS, MICROPHONES, GRAMOPHONE PICK-UPS OR LIKE ACOUSTIC ELECTROMECHANICAL TRANSDUCERS; DEAF-AID SETS; PUBLIC ADDRESS SYSTEMS
    • H04R3/00Circuits for transducers, loudspeakers or microphones
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04RLOUDSPEAKERS, MICROPHONES, GRAMOPHONE PICK-UPS OR LIKE ACOUSTIC ELECTROMECHANICAL TRANSDUCERS; DEAF-AID SETS; PUBLIC ADDRESS SYSTEMS
    • H04R3/00Circuits for transducers, loudspeakers or microphones
    • H04R3/005Circuits for transducers, loudspeakers or microphones for combining the signals of two or more microphones
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04SSTEREOPHONIC SYSTEMS 
    • H04S1/00Two-channel systems
    • H04S1/002Non-adaptive circuits, e.g. manually adjustable or static, for enhancing the sound image or the spatial distribution

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Acoustics & Sound (AREA)
  • Signal Processing (AREA)
  • Health & Medical Sciences (AREA)
  • Otolaryngology (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Multimedia (AREA)
  • General Health & Medical Sciences (AREA)
  • Circuit For Audible Band Transducer (AREA)
  • Obtaining Desirable Characteristics In Audible-Bandwidth Transducers (AREA)

Abstract

【課題】MS方式マイクロフォンによって収音した音の音源方向の判定精度を向上させることを可能とすることを目的とする。【解決手段】MS方式マイクのMチャネルの音信号の位相、または、MS方式マイクのSチャネルの正チャネルの音信号の位相とSチャネルの負チャネルの音信号の位相とに基づいて、Mチャネル及び正チャネルへの音の到達距離の差による位相差を解消する第1シフト信号、及びMチャネル及び負チャネルへの音の到達距離の差による位相差を解消する第2シフト信号を生成する。第1シフト信号または第2シフト信号を、XY方式マイクのLチャネル及びRチャネル信号に近似変換する。【選択図】図6

Description

本発明は、音信号変換プログラム、音信号変換方法、及び、音信号変換装置に関する。
医療現場で音声翻訳システムを利用する場合、医療者の両手が塞がっている状態である場合が多く、例えば、手を使用するボタン操作などを行うことは困難であるため、音声で操作を行う機能が求められている。音声で操作を行う機能では、音声に基づいて、医療者と患者との何れが発話しているのか判別し、発話部分の検出、切り出し、及び音声翻訳が自動で行われることが所望される。
音声の入力にチャネルを複数もつマイクロフォンを使用することで、どの話者が発話しているのか判別することが可能となる。チャネルを複数もつマイクロフォンには、例えば、MS方式マイクロフォンが存在する。
しかしながら、MS方式マイクロフォンを使用する場合、MS方式マイクロフォンと音源との間の仰角によって音源方向の判定が適切に行えない場合がある。
本発明は、1つの側面として、MS方式マイクロフォンによって収音した音の音源方向の判定精度を向上させることを可能とすることを目的とする。
1つの実施形態では、MS方式マイクのMチャネルの音信号の位相、または、MS方式マイクのSチャネルの正チャネルの音信号の位相とSチャネルの負チャネルの音信号の位相とに基づいて、第1シフト信号及び第2シフト信号を生成する。第1シフト信号は、Mチャネル及び正チャネルへの音の到達距離の差による位相差を解消し、第2シフト信号は、Mチャネル及び負チャネルへの音の到達距離の差による位相差を解消する。第1シフト信号または第2シフト信号を、XY方式マイクのLチャネル及びRチャネル信号に近似変換する。
本発明は、1つの側面として、MS方式マイクロフォンによって収音した音の音源方向の判定精度を向上させることを可能とする。
本実施形態の音声認識システムのハードウェア構成図の一例である。 MS方式マイクロフォンの機能を説明するための概念図の一例である。 XY方式マイクロフォンの機能を説明するための概念図の一例である。 MチャネルマイクロフォンとSチャネルマイクロフォンとの音信号の位相差を説明するための概念図の一例である。 MチャネルマイクロフォンとSチャネルマイクロフォンとの音信号の位相差を説明するための概念図の一例である。 MS方式マイクロフォンに対する音源からの仰角を例示するための概念図の一例である。 MS方式マイクロフォンに対する音源からの仰角と音の判定方向との関係を例示する概念図の一例である。 MS方式マイクロフォンに対する音源の位置と、MチャネルマイクロフォンとSチャネルマイクロフォンとの音信号の位相差との関係を説明するための概念図の一例である。 MS方式マイクロフォンに対する音源からの仰角及び水平角と、MチャネルマイクロフォンとSチャネルマイクロフォンとの音信号の位相差との関係を説明するための概念図の一例である。 MS方式マイクロフォンに対する音源からの水平角と、MチャネルマイクロフォンとSチャネルマイクロフォンとの音信号の位相差との関係を説明するための概念図の一例である。 MS方式マイクロフォンに対する音源からの水平角と、MチャネルマイクロフォンとSチャネルマイクロフォンとの音信号の位相差との関係を説明するための概念図の一例である。 MS方式マイクロフォンに対する音源からの仰角と、MチャネルマイクロフォンとSチャネルマイクロフォンとの音信号の位相差との関係を説明するための概念図の一例である。 MS方式マイクロフォンに対する音源からの仰角と、MチャネルマイクロフォンとSチャネルマイクロフォンとの音信号の位相差との関係を説明するための概念図の一例である。 Mチャネルマイクロフォンの音信号とSチャネル及び−Sチャネルの音信号との類似について説明するための概念図の一例である。 本実施形態の音信号変換装置の補正部のハードウェア構成図の一例である。 Mチャネルマイクロフォンの音信号の位相の補正を説明するための概念図の一例である。 MS方式マイクロフォンに対する音源からの仰角及び水平角によるMチャネルマイクロフォンの音信号の位相の遅延を説明するための概念図の一例である。 Mチャネル及びSチャネルの音信号を使用して近似変換されたLチャネル及びRチャネルの音信号を表す概念図の一例である。 MS方式マイクロフォンに対する音源からの仰角及び水平角によるMチャネルマイクロフォンの音信号の位相の遅延の補正を説明するための概念図の一例である。 Mチャネル及びSチャネルの音信号を使用して近似変換されたLチャネル及びRチャネルの音信号を表す概念図の一例である。 MS方式マイクロフォンに対する音源からの仰角と音の判定方向との関係を例示する概念図の一例である。 本実施形態の音信号変換装置のハードウェア構成図の一例である。 第1実施形態の音信号変換処理の流れを示すフローチャートの一例である。 Mチャネルマイクロフォンの音信号の位相の補正を説明するための概念図の一例である。 Mチャネルマイクロフォンの音信号の位相の補正を説明するための概念図の一例である。 Mチャネルマイクロフォンの音信号の位相の補正を説明するための概念図の一例である。 Mチャネルマイクロフォンの音信号の位相の補正を説明するための概念図の一例である。 第2実施形態の音信号変換処理の流れを示すフローチャートの一例である。 Mチャネルマイクロフォンの音信号とSチャネルマイクロフォンの音信号との位相差と仰角との関係を説明するための概念図の一例である。 Mチャネルマイクロフォンの音信号とSチャネルマイクロフォンの音信号との位相差と仰角との関係を説明するための概念図の一例である。 第2実施形態の音信号変換処理の流れを示すフローチャートの一例である。
[第1実施形態]
以下、図面を参照して第1実施形態の一例を詳細に説明する。
図1に例示する音声認識システム1は、MチャネルとSチャネルとを含むMS方式マイクロフォン(Mid-Side Microphone、以下、MSマイクという。また、マイクロフォンをマイクという。)10、音信号変換装置20、音声処理装置30、及び音声認識装置40を含む。
MSマイクは、図2に例示するように、正面方向MOの指向性を有する単一指向性マイクであるMチャネルマイクと、左右方向SPO及びSNOの指向性を有する双指向性マイクであるSチャネルマイクと、を含み、正面方向の音と左右方向の音とを収音する。双指向性マイクは、左右2つの方向から収音するマイクであり、一方の方向からの音信号は正相、他方の方向からの音信号は逆相である。ここでは、正相の音信号を収音する方を正チャネルと呼び、逆相の音信号を収音する方を負チャネルと呼ぶ。
音信号変換装置20は、生成部及び選択部の一例である補正部21及び変換部22を含む。補正部21は、Mチャネル及びSチャネルで収音した音の音信号の何れか一方の位相を他方の位相に合わせるように補正する。変換部22は、補正部21で補正された音信号を使用して、Mチャネル及びSチャネルで収音された音の音信号をLチャネル及びRチャネルで収音された音の音信号に近似変換する。Lチャネルとは、XY方式マイクの正面左側の音を収音するチャネルであり、Rチャネルとは、XY方式マイクの正面右側の音を収音するチャネルである。
音声処理装置30は、バッファ31、音圧差算出部32、方向判定部33、発話検出部34L及び34R、及び音声処理部35を含む。バッファ31は、音信号変換装置20から受信したLチャネル及びRチャネルの音信号を一時的に記憶し、音圧差算出部32、発話検出部34L及び34Rに送信する。
音圧差算出部32は、Lチャネルの音信号とRチャネルの音信号との音圧差を算出し、方向判定部33は、音圧差算出部32から受信した音圧差に基づいて音源が存在する方向を判定する。発話検出部34Lは、Lチャネルの音信号における発話区間を検出し、発話検出部34Rは、Rチャネルの音信号における発話区間を検出する。音声処理部35は、方向判定部33により判定された音源、即ち、話者が存在する方向と、発話検出部34Lまたは34Rで検出された発話区間を使用して、認識する音声の切り出しを行う。例えば、話者が存在する方向がMSマイク10の正面右側である場合、Rチャネルの音信号だけを音声認識装置40に送信する。
音声認識装置40は、音声処理装置30から受信した音声及び情報を使用して、音声認識を行う。例えば、話者が存在する方向がMSマイク10の正面右側であれば、音声を第1言語として認識し、話者が存在する方向がMSマイク10の正面左側であれば、音声を第2言語として認識する。第1言語は、例えば、英語であってよく、第2言語は、例えば、日本語であってよい。
次に、音信号変換装置20の動作を説明する。XY方式マイク(以下、XYマイクという。)は、図3に例示するように、左方向LOの指向性を有する単一指向性マイクであるLチャネルマイクと、右方向ROの指向性を有する単一指向性マイクであるRチャネルマイクと、を含む。XYマイクは、左方向の音と右方向の音とを収音する。
(1)式を使用して、MSマイクのMチャネルで収音された音の音信号V、及び、Sチャネルで収音された音の音信号Vを、Lチャネルで収音された音の音信号V、及びRチャネルで収音された音の音信号Vに近似的に変換することができる。変換の際に、Sチャネルで収音された音の音信号Vの係数kを調整することで音の広がり感を調整する。係数kが大きいほど、広がり感が生じる。
=(V+kV)/2
=(V−kV)/2 …(1)
Mチャネルの音信号のスペクトルF及びSチャネルの音信号のスペクトルFは、(2)式を使用して表すことができる。
=VMre+iVMim
=VSre+iVSim …(2)
Mreは音信号Vの実数部を表す実数であり、VMimは音信号Vの虚数部を表す実数であり、VSreは音信号Vの実数部を表す実数であり、VSimは音信号Vの虚数部を表す実数である。
Lチャネルの音圧|V|及びRチャネルの音圧|V|は、(3)式を使用して算出することができる。
|V|=10log10{(VMre+kVSre+(VMim+kVSim
=10log10{(VMre +VMim )+k(VSre +VSim
+2k(VMreSre+VMimSim)}
|V|=10log10{(VMre−kVSre+(VMim−kVSim
=10log10{(VMre +VMim )+k(VSre +VSim
+2k(VMre・(−VSre)+VMim・(−VSim))} …(3)
即ち、Lチャネルの音圧は、Mチャネルの音圧VMre +VMim 、Sチャネルの音圧VSre +VSim 、及び、Mチャネルの音とSの正チャネルの音の内積VMreSre+VMimSimの合計で近似される。一方、Rチャネルの音圧は、Mチャネルの音圧VMre +VMim 、Sチャネルの音圧VSre +VSim 、及び、Mチャネルの音とSの負チャネルの音の内積VMre・(−VSre)+VMim・(−VSim)の合計で近似される。
したがって、Mチャネルの音信号とSの正チャネルの音信号の内積VMreSre+VMimSimが大きいほど、即ち、Mチャネルの音信号とSの正チャネルの音信号とが類似していると、Lチャネルの音圧が大きくなる。一方、Mチャネルの音信号とSの負チャネルの音信号の内積VMre・(−VSre)+VMim・(−VSim)が大きいほど、即ち、Mチャネルの音信号とSの負チャネルの音信号とが類似していると、Rチャネルの音圧が大きくなる。
図4に例示するように、MSマイクの正面右側に音源SSが存在する場合、MチャネルとSの負チャネル(以下、−Sチャネルともいう。)とで類似した音が収音される。しかしながら、音源SSとMSマイクまでの距離がMチャネルではDM1であり、−SチャネルではDS1であるため、Mチャネルの音信号と−Sチャネルの音信号とは位相が異なる。即ち、Mチャネルの音信号は、距離|DM1−DS1|の分だけ位相が遅延する。
但し、距離|DM1−DS1|は短い。したがって、図5に例示するように、遅延量D1も小さいため、Mチャネルの音信号と−Sチャネルの音信号との類似度は、Mチャネルの音信号と−Sチャネルの音信号を反転した音信号であるSチャネルの音信号との類似度よりも大きい。したがって、Mチャネルの音信号及び−Sチャネルの音信号から算出されるRチャネルの音圧は大きく、Mチャネルの音信号及びSチャネルの音信号から算出されるLチャネルの音圧は小さいため、音源SSがMSマイクの正面右側に存在する、と判定される。なお、図5では、動作の理解を容易にするため、音信号を正弦波で表している。
MSマイクを使用する場合に、図6に例示する仰角EAが大きくなると、音圧差の算出精度が低下し、音源が存在する方向の判定が困難となる。仰角とは、MSマイクを含む水平面とMSマイクと音源とをつなぐ直線とがなす角度であり、音源がユーザである場合、ユーザの背の高さ、及び、ユーザとMSマイクとの距離によって変動する。
図7に、音源の位置をMSマイクの正面左側90°、45°、正面即ち0°、正面右側45°、90°に設定し、各々で、音源の位置を仰角が0°(EA0)及び90°(EA90)とし、音源から同じ音を発生させて音圧差を測定した結果を示す。音源がMSマイクの正面左側90°、正面、及び、正面右側90°の位置に存在する場合は、仰角が0°(EA0)であっても、90°(EA90)であっても、音源の位置が適切に判定されている。
また、音源がMSマイクの正面左側45°及び正面右側45°に存在する場合、仰角が0°(EA0)であれば、音源の位置は適切に判定されている。しかしながら、音源がMSマイクの正面左側45°及び正面右側45°に存在する場合、仰角が90°(EA90)であると、音源の方向が適切に判定されていない。
図8に例示するように、MチャネルマイクがSチャネルマイクの上に配置されている場合に、仰角の角度が大きいと、仰角によっても距離|DM2−DS2|の分だけ音信号の位相差が発生する。MチャネルマイクとSチャネルマイクとを左右に配置する場合、水平角によって同様の問題が発生する。
図9に例示するように、水平角による位相の遅延D1と、仰角による位相の遅延D2の合計が音源からの音信号の半波長に近付くと、Mチャネルの音信号と、−Sチャネルの反転信号であるSチャネルの音信号との類似度が大きくなる。これにより、Lチャネルの音圧が大きくなり、MSマイクの左側に音源が存在すると誤判定される。一方、−Sチャネルの音信号とMチャネルの音信号との類似度は、Mチャネルの音信号の遅延により低くなり、Rチャネルの音圧は小さくなる。
なお、図10及び図11に例示するように、上方向から見た場合、MチャネルマイクとSチャネルマイクとは中心位置が近い。したがって、左右のずれ、即ち、水平角θの大きさに拘わらず、音源SSとMチャネルマイクとの距離Dと、音源SSとSチャネルマイクとの距離Dと、の差|D−D|は小さい。
一方、図12及び図13に例示するように、横方向から見た場合、上方向から見た場合と比較して、Mチャネルマイクの中心位置とSチャネルマイクの中心位置とは遠い。したがって、音源SSとMチャネルマイクとの距離Dと、音源SSとSチャネルマイクとの距離Dと、の差|D−D|は大きい。差|D−D|は、仰角θが大きくなるほど大きくなるため、通常、大きい仰角でのMSマイクの使用は推奨されない。
例えば、図14の例では、MSマイクの正面右側に音源があり、Mチャネルの音信号と−Sチャネルの音信号とが類似している。例えば、Mチャネルの極値PMと−Sチャネルの極値PS2とが対応し、Sチャネルの極値PS1は、極値PS2を反転した値をもつ。しかしながら、Mチャネルの音信号は遅延しているため、Mチャネルの音信号と−Sチャネルの音信号から近似されるRチャネルの音圧は小さくなる。一方、破線BLで示すように、極大値だけを比較すると、Mチャネルの音信号とSチャネルの音信号とは見かけ上類似し、Mチャネルの音信号とSチャネルの音信号から近似されるLチャネルの音圧が大きくなる。
図15に例示するように、補正部21は、反転部51、位相シフト部53、類似度算出部54、及び信号選択部55を含む。本実施例では、適切なチャネルの音圧が大きくなるように、Sチャネルの音信号及び−Sチャネルの音信号の位相を基準としてMチャネルの音信号の位相を補正する。反転部51は、Sチャネルの音信号を反転して−Sチャネルの音信号を生成する。
位相シフト部53は、Mチャネルの音信号の位相を第1所定量ずつシフトする。類似度算出部54は、シフトしたMチャネルの音信号と、Sチャネル及び−Sチャネルの音信号との類似度を算出する。信号選択部55は、類似度が最大となる補正シフト量を選択し、Sチャネル及び−Sチャネルのうち、類似度が最大となるチャネルを選択する。図16に、Mチャネルの音信号の位相を進み方向にシフトしたシフト信号VM+及び遅れ方向にシフトしたシフト信号VM−を例示する。
(4)式は、音信号Vの位相、ここでは、デジタル信号である音信号Vにおけるサンプルをシフトした信号であるシフト信号VMHを示す。VMH(t,p)はサンプルtの信号Vの位相をpサンプル分シフトした信号であり、tは何番目のサンプルであるかを表し、pはシフトするサンプル数を表す。シフトするサンプル数の範囲は、例えば、−nn≦p≦nnであってよく、nnは、例えば、7であってよい。
MH(t,p)=V(t+p) …(4)
対話音声を認識する場合、音声の取得にタブレットなどの小型端末を使用することが多い。タブレットで使用されるMSマイクは小型であるため、MチャネルマイクとSチャネルマイクとの間の距離は、一般に5cmよりも短い。マイク間の音の到達時間差は、例えば、(5)式で算出される。
マイク間の音の到達時間差=最大マイク間距離/音速 …(5)
マイク間の距離を5cmであると仮定すると、音信号の位相差は、例えば、(6)式で算出されるように、7.25サンプルとなる。
マイク間の到達時間差=5[cm]/331[m/s]
=0.05[m]/331[m/s]
=1.51×10−4[s] …(6)
サンプリング周波数が48[kHz]である場合、位相差サンプル数は、例えば、(7)式で算出される。
位相差[サンプル]=48000×1.51×10−4≒7.25[サンプル]
…(7)
類似度算出部54は、類似度として、例えば、音信号VMHとVとの2信号間の相互相関係数及び音信号VMHとV−Sとの2信号間の相互相関係数を算出する。音信号VMHとVとの2信号間の相互相関係数は、例えば、(8)式を使用して算出することができ、相互相関係数は、2信号が類似している程度を表す。相互相関係数が1に近いほど2信号は類似しており、0に近いほど2信号は類似していない。
Figure 2021081533
は音信号VMHとVとの相互相関係数であり、C(p,t)はシフトするサンプル数がpであり、サンプル時点がtである場合の相互相関係数であり、VMHは位相シフトした音信号Vである。Nは相互相関の計算範囲長さであり、VMHバーは、信号VMH(t−n,p)のn=0〜N−1における平均値であり、Vバーは、信号V(t−n)のn=0〜N−1における平均値である。sd(VMH)は、信号VMH(t−n,p)のn=0〜N−1における標準偏差であり、sd(V)は、信号V(t−n)のn=0〜N−1における標準偏差である。
Nは、例えば、0.1秒に相当するサンプル数であってよい。C(p,t)=−C(p,t)であり、C(p,t)は、シフトするサンプル数がpであるサンプル時点tにおける音信号VMHとV−Sとの相互相関係数である。
信号選択部55は、算出した相互相関係数C(p,t)及びC(p,t)のうち、最大の値を選択し、最大の値の相互相関係数に応じて、Sチャネルまたは−Sチャネルの何れかを選択信号として選択し、Mチャネルの音信号をシフトするサンプル数を選択する。(9)式に例示するように、ppサンプル分シフトしたMチャネルの音信号VMHと、選択されたSチャネルまたは−Sチャネルの音信号とを、近似的にLチャネルの音信号とRチャネルの音信号とに変換する。
=(VMH+kV)/2
=(VMH−kV)/2 …(9)
ここでは、音の広がり感を調整しなくてよいため、左右の違いが最も顕著となるようにk=1.0であってよい。
図17では、音信号の波形が正弦波であると仮定する。この場合、Mチャネルの音信号がD1+D2分遅延した状態でLチャネルの音信号とRチャネルの音信号とに近似変換すると、図18に例示するように、Lチャネル及びRチャネル共に音圧が小さくなる。一方、図19に例示するように、Mチャネルの音信号の位相を類似度が大きい方のチャネルと合うように補正した後、即ち、−Sチャネルとの位相差が0となるように補正した後、Lチャネルの音信号とRチャネルの音信号とに近似変換する。この場合、図20に例示するように、Rチャネルの音圧が大きくなり、一方、Lチャネルの音圧は小さくなる。Mチャネルの音信号と−Sチャネルの音信号とが同相となり、Mチャネルの音信号とSチャネルの音信号とが逆相となるためである。
Mチャネルの音信号VとSチャネルの音信号Vとが、違いが位相差のみである正弦波であると仮定すると、Mチャネルの音信号VとSチャネルの音信号Vは、(10)式で表される。音信号Vの振幅をA、音信号Vの振幅をAとし、ωは角周波数を表し、tは時間を表し、dは位相の遅延量を表す。
=Acosωt
=Acosω(t−d) …(10)
k=1とした場合、音信号V及びVは(11)式で算出される。(11)式において、ψ及びψは、(12)式を満たす角度である。
Figure 2021081533
(11)式で表されるように、音信号V及びVの角周波数は元の音信号V及びVと同様であり、位相及び振幅が変化する。音信号Vの位相がVの位相に合うように補正し、振幅の差が最大となるV及びVは、(13)式で算出される(d=0)。
=(A+A)/2cos(ωt)
=(A−A)/2cos(ωt) …(13)
音信号V−Sの位相がVの位相に合うように補正し、振幅の差が最大となるV及びVは、(14)式で算出される(d=π/ω)。
=(A−A)/2cos(ωt)
=(A+A)/2cos(ωt) …(14)
(13)式及び(14)式で表されるように、位相差を補正することで、Lチャネルの音信号とRチャネルの音信号との音圧差が適切に現れるようになる。図21に例示するように、音源がMSマイクの正面右側45°、仰角が90°であって、位相差を補正しない場合、音源が右側に存在することを適切に判定していない(EA90RA)。しかしながら、位相差を補正すると、音源が右側に存在することを、仰角が0°である場合(EA0)と同程度に適切に判定する(EA90(TA))。
なお、類似度は、相互相関係数でなくてもよい。例えば、Mチャネルの音信号、Sチャネル、及び−Sチャネルの音信号を各々周波数領域信号に変換する。Mチャネルの周波数領域信号とSチャネルの周波数領域信号とから算出される位相差、及び、Mチャネルの周波数領域信号と−Sチャネル信号の周波数領域信号とから算出される位相差、を類似度として使用してもよい。
音信号変換装置10は、一例として、図22に示すように、CPU(Central Processing Unit)61、一次記憶部62、二次記憶部63、及び、外部インターフェイス64を含む。CPU61は、ハードウェアであるプロセッサの一例である。CPU61、一次記憶部62、二次記憶部63、及び、外部インターフェイス64は、バス69を介して相互に接続されている。
一次記憶部62は、例えば、RAM(Random Access Memory)などの揮発性のメモリである。二次記憶部63は、例えば、HDD(Hard Disk Drive)、又はSSD(Solid State Drive)などの不揮発性のメモリである。
二次記憶部63は、プログラム格納領域63A及びデータ格納領域63Bを含む。プログラム格納領域63Aは、一例として、音信号変換プログラムなどのプログラムを記憶している。データ格納領域63Bは、一例として、MSマイク10で収音される音に対応する音信号及び音信号変換プログラムを実行している間に生成される中間データなどを記憶する。
CPU61は、プログラム格納領域63Aから音信号変換プログラムを読み出して一次記憶部62に展開する。CPU61は、音信号変換プログラムをロードして実行することで、図1の補正部21及び変換部22として動作する。詳細には、CPU61は、図15の反転部51、位相シフト部53、類似度算出部54及び信号選択部55として動作する。
なお、音信号変換プログラムなどのプログラムは、外部サーバに記憶され、ネットワークを介して、一次記憶部62に展開されてもよい。また、音信号変換プログラムなどのプログラムは、DVD(Digital Versatile Disc)などの非一時的記録媒体に記憶され、記録媒体読込装置を介して、一次記憶部62に展開されてもよい。
外部インターフェイス64には外部装置が接続され、外部インターフェイス64は、外部装置とCPU61との間の各種情報の送受信を司る。図22では、外部インターフェイス64に、MSマイク10及び音声処理装置30が接続され、音声処理装置30に音声認識装置40が接続されている例を示している。
しかしながら、MSマイク10、音声処理装置30及び音声認識装置40は、音信号変換装置20に内蔵されていてもよい。また、MSマイク10、音声処理装置30及び音声認識装置40の1つまたは2つが、音信号変換装置20に内蔵されていてもよい。
また、音信号変換装置20は、例えば、専用装置であってもよいし、ワークステーション、パーソナルコンピュータ、またはタブレットであってもよい。MSマイク10、音信号変換装置20、音声処理装置30及び音声認識装置40は、無線または有線で接続されていてもよい。また、音信号変換装置20は、クラウド上に存在していてもよい。
次に、音信号変換処理の作用の概要を説明する。図23は、音信号変換処理の流れを例示する。CPU61は、ステップ101で、MSマイク10で収音された音に対応する音信号を取得し、ステップ102で、Sチャネルで取得された音に対応する音信号を反転して−Sチャネルの音信号を生成する。
CPU61は、ステップ103で、変数pに−nnを設定する。nnは、例えば、7であってよい。CPU61は、ステップ104で、Mチャネルの音信号Vの位相を変数pの値のサンプル分シフトする。CPU61は、ステップ105で、シフトしたMチャネルの音信号VとSチャネルの音信号Vとの類似度及び音信号Vと−Sチャネルの音信号V−Sとの類似度を算出する。
CPU61は、ステップ106で、変数pに1を加算し、ステップ107で、変数pの値がnnを超えたか否か判定する。変数pに加算される値は、第1所定量の一例であるサンプル数であり、1に限定されず、例えば、2であってもよい。ステップ107の判定が否定された場合、CPU61はステップ104に戻る。
ステップ107の判定が肯定されると、CPU61は、ステップ108で、Sチャネル及び−Sチャネルのうち、算出した類似度のうち最大の類似度に対応するチャネルを、音変換に使用する音信号として選択する。また、CPU61は、最大の類似度に対応するサンプル分位相をシフトした音信号Vを、音変換に使用する音信号として選択する。CPU61は、ステップ109で、選択した音信号を使用して、Lチャネル及びRチャネルの音信号への近似変換を行う。
本実施形態では、MS方式マイクロフォンのMチャネル及び正チャネルへの音の到達距離の差による位相差を解消する第1シフト信号、及びMチャネル及び負チャネルへの音の到達距離の差による位相差を解消する第2シフト信号を生成する。第1シフト信号及び第2シフト信号の生成は、Mチャネルの音信号の位相、または、MSマイクのSチャネルの正チャネルの音信号の位相とSチャネルの負チャネルの音信号の位相とに基づいて行われる。
第1シフト信号及び第2シフト信号の各々が正チャネル及び負チャネルの音信号の位相に基づいて生成される場合、第1シフト信号との類似度及び第2シフト信号との類似度のうち、類似度が大きい方のチャネルの音信号を第1選択信号として選択する。かつ、第1シフト信号及び第2シフト信号がMチャネルの位相に基づいて生成される場合、第1シフト信号及び第2シフト信号のうち、Mチャネルの音信号との類似度が大きい方のシフト信号を第2選択信号として選択する。
第1及び第2シフト信号の各々が正チャネル及び負チャネルの音信号の位相に基づいて生成され、第1選択信号が正チャネルの音信号である場合、第1シフト信号と第1選択信号とを、XY方式マイクロフォンのLチャネル及びRチャネルの音信号に近似変換する。XY方式マイクロフォンは、以下、XYマイクという。第1選択信号が負チャネルの音信号である場合、第2シフト信号と第1選択信号とを、XYマイクのLチャネル及びRチャネルの音信号に近似変換する。第1シフト信号及び第2シフト信号がMチャネルの音信号の位相に基づいて生成される場合、Mチャネルの音信号と第2選択信号とを、XYマイクのLチャネル及びRチャネル信号に近似変換する。
本実施形態では、Mチャネルの音信号と、位相を所定範囲内で第1所定量ずつシフトした位相毎に正チャネルの音信号との類似度を算出し、類似度が最大となる位相の位相量だけ正チャネルの音信号をシフトさせて、第1シフト信号を生成する。または、Mチャネルの音信号と、位相を所定範囲内で第1所定量ずつシフトした位相毎に負チャネルの音信号との類似度を算出し、類似度が最大となる位相量だけ負チャネルの音信号をシフトさせて、第2シフト信号を生成する。また、正チャネルの音信号と、位相を所定範囲内で第1所定量ずつシフトした位相毎にMチャネルの音信号との類似度を算出する。類似度が最大となる位相量だけMチャネルの音信号をシフトさせて、第1シフト信号を生成する。負チャネルの音信号と、位相を所定範囲内で第1所定量ずつシフトした位相毎にMチャネルの音信号との類似度を算出し、類似度が最大となる位相量だけMチャネルの音信号をシフトさせて、第2シフト信号を生成する。
本実施形態によれば、MS方式マイクロフォンに対する音源の仰角が大きい場合であっても、MS方式マイクロフォンによって収音した音の音源方向の判定精度を向上させることを可能とする。
本実施形態によれば、MS方式マイクロフォンによって取得した音の音源方向の判定精度を向上させることを可能とする。
[第2実施形態]
以下、図面を参照して第2実施形態の一例を詳細に説明する。第1実施形態と同様の構成及び作用については、説明を省略する。
第2実施形態では、まず、Mチャネルの音信号Vの位相を微小シフトさせて、Sチャネルの正チャネルの音信号V及び負チャネルの音信号V−Sとの類似度を算出する。これにより、類似度に基づいて音信号Vの適切なシフト方向を判定し、適切な方向に音信号Vの位相をシフトさせることで計算量を削減する。
図24に例示するように、第2実施形態では、まず、例えば、(15)式を使用して、音信号Vの位相を微小量ddシフトした信号VM+’、VM−’を生成する。微小量ddは、第2所定量の一例であり、例えば、1サンプルであってよい。
M+’(t)=V(t−dd)
M−’(t)=V(t+dd) …(15)
図25に例示するように、Vの微小量シフト信号であるVM+’とSチャネルの音信号Vとの類似度C1(t)、及び、VM+’と−Sチャネルの音信号V−Sとの類似度C2(t)を算出する。また、Vの微小量シフト信号であるVM−’と音信号Vとの類似度C3(t)、及びVM−’と音信号V−Sとの類似度C4(t)を算出する。類似度は、上記相互相関係数であってよい。
C1(t)〜C4(t)の中で最大である類似度に対応する音信号Vのシフト方向を判定し、当該類似度がSチャネルに対応するか−Sチャネルに対応するかを判定する。類似度C1(t)またはC2(t)が最大である場合、位相を進み方向にシフトし、類似度C3(t)またはC4(t)が最大である場合、位相を遅れ方向にシフトさせる。また、類似度C1(t)またはC3(t)が最大である場合、Sチャネルを選択し、類似度C2(t)またはC4(t)が最大である場合、−Sチャネルを選択する。
図26に例示するように、選択した方向、ここでは、遅れ方向へ音信号Vの位相を所定サンプル数ずつシフトする。所定サンプル数は1であってよい。図27に例示するようにシフト信号と−Sチャネルの音信号との類似度が値MVの極大点EPをとる際にシフトしたサンプル数を補正シフト量SHとし、音信号Vの位相を当該補正シフト量SHシフトしたシフト信号を生成する。図25の例では、シフト信号VM−’と−Sチャネルの音信号の類似度であるC4が最も大きいため、音信号Vの位相を遅らせる方向に少しずつシフトする。生成したシフト信号及び−Sチャネルの音信号を使用して、Lチャネル及びRチャネルの音信号に変換する。
次に、音信号変換処理の作用の概要を説明する。図28は、音信号変換処理の流れを例示する。ステップ101及びステップ102は、図23のステップ101及び102と同様であるため、説明を省略する。
CPU61は、ステップ141で、Mチャネルの音信号Vの位相を進める方向と位相を遅らせる方向とに微小量シフトし、ステップ142で、シフトした音信号VM+’及びVM−’とSチャネル及び−Sチャネルの音信号との類似度C1〜C4を算出する。CPU61は、ステップ143で、類似度C1〜C4のうち最大の類似度に対応するように、音信号Vの位相をシフトするシフト方向を決定し、Sチャネルの音信号を使用するか、−Sチャネルの音信号を使用するかを決定する。
CPU61は、ステップ144で、変数ppに1を設定する。CPU61は、ステップ145で、Mチャネルの音信号Vの位相を変数ppの値のサンプル分、シフト方向にシフトする。CPU61は、ステップ146で、シフトしたMチャネルの音信号VMHとSチャネルの音信号Vとの類似度、または、音信号VMHと−Sチャネルの音信号V−Sとの類似度を算出する。何れの類似度を算出するかは、ステップ143の決定に従う。
本実施形態では、ステップ147で、類似度が極大値であると判定した場合、即ち、1つ前の位相のシフトから類似度が低下した場合、ステップ149に進み、変数ppから1を減算し、ステップ150に進む。1つ前の補正シフト量が、類似度が極大値を示す補正シフト量であるためである。CPU61は、ステップ150で、Sチャネル及び−Sチャネルのうち、ステップ143で決定されたチャネルを、音変換に使用する選択信号として選択する。CPU61は、変数ppの値に対応するサンプル分位相を、ステップ143で決定された方向にシフトした音信号VMHを、音変換に使用する選択信号として選択する。
ステップ145の判定が否定された場合、CPU61は、ステップ145に戻る。ステップ109は、図23のステップ109と同様であるため、説明を省略する。なお、本実施形態では、類似度の極大値を検出した時点で、ステップ149に進むようにしているが、変数ppの値が所定値を超えても極大値が検出できない場合、エラーとして処理を中止するようにしてもよい。また、変数ppの値が所定値を超えたときに、類似度のうち、最大値を極大値としてもよい。
本実施形態では、Mチャネルの音信号と位相を進み方向に第2所定量シフトした正チャネルの音信号との類似度、及び、Mチャネルの音信号と位相を遅れ方向に第2所定量シフトした正チャネルの音信号との類似度を算出する。類似度が大きい方向に正チャネルの音信号を第1所定量ずつシフトさせる。また、Mチャネルの音信号と位相を進み方向に第2所定量シフトした負チャネルの音信号との類似度、及び、Mチャネルの音信号と位相を遅れ方向に第2所定量シフトした負チャネルの音信号との類似度を算出する。類似度が大きい方向に負チャネルの音信号を第1所定量ずつシフトさせる。もしくは、正チャネルの音信号と位相を進み方向に第2所定量シフトしたMチャネルの音信号との類似度、及び、正チャネルの音信号と位相を遅れ方向に第2所定量シフトしたMチャネルの音信号との類似度を算出する。類似度が大きい方向にMチャネルの音信号を第1所定量ずつシフトさせる。また、負チャネルの音信号と位相を進み方向に第2所定量シフトしたMチャネルの音信号との類似度、及び、負チャネルの音信号と位相を遅れ方向に第2所定量シフトしたMチャネルの音信号との類似度を算出する。類似度が大きい方向にMチャネルの音信号を第1所定量ずつシフトさせる。
第2実施形態では、位相のシフト方向を決定することで、計算回数を低減し、処理の負荷を低減することが可能となる。
[第3実施形態]
以下、図面を参照して第3実施形態の一例を詳細に説明する。第1実施形態及び第2実施形態と同様の構成及び作用については、説明を省略する。
第3実施形態では、音信号の位相の補正シフト量から音源のMSマイクに対する仰角を推定し、仰角が所定角度以内である場合のみ、音信号の位相の補正を行う。
図29に例示するように、Mチャネルマイクの位置をP、Sチャネルマイクの位置をP、音源の位置をP、MSマイクの中心位置をPとする。Pから直線Pに降ろした垂線との交点をPS’、Pから直線Pの延長線上に降ろした垂線との交点をPM’とする。
仰角θは、例えば、(16)式で算出される。
θ=arcsin[p×vs/{FS×(Δs+Δm)}] …(16)
ここで、pは、音信号VとVまたは音信号VとV−Sの位相を一致させるために、シフトした位相のサンプル数である補正シフト量であり、FSはサンプリング周波数「Hz]である。Δsは予め測定した距離|P|であり、Δmは予め測定した距離|P|でありvsは音速[m/sec]である。
通常、MチャネルマイクとSチャネルマイクとの間の距離|P|よりもMSマイクと音源SSとの間の距離|P|の方が長いため、θ及びθは微小となる。θ及びθは微小なため、cosθ≒1、cosθ≒1であり、(17)式で示すように近似することができる。
|PS’|=|P|cosθ≒|P
|PM’|=|P|cosθ≒|P| …(17)
Mチャネルマイクと音源SSとの距離と、Sチャネルマイクと音源SSとの距離と、の差は、(18)式で算出される。
|P|−|P|≒|PM’|−|PS’
=|PM’|+|PS’
=Δmsinθ+Δssinθ
=(Δm+Δs)sinθ …(18)
Mチャネルマイクと音源SSとの距離と、Sチャネルマイクと音源SSとの距離と、の差と、補正シフト量pとの関係は、(19)式で表される。
=(|P|−|P|)×FS/vs
=(Δm+Δs)sinθ×FS/vs …(19)
本実施形態では、MチャネルマイクとSチャネルマイクとが上下に配置されている場合に、仰角が予め定めた範囲内であるか否かを判定する。仰角が予め定めた範囲内である場合に、音信号変換に、Sチャネルまたは−Sチャネルの音信号の位相と合うように、位相をシフトして補正したMチャネルの音信号VMHを使用する。即ち、MチャネルマイクとSチャネルマイクとが上下に配置され、かつ、仰角が所定範囲内である場合、音信号VMH及びSチャネルのうち選択された正チャネルまたは負チャネルの音信号を使用して、Lチャネル及びRチャネルの音信号への近似変換を行う。一方、仰角が所定範囲外である場合、補正していない元の音信号V及び、V及びV−Sを使用して、Lチャネル及びRチャネルの音信号への近似変換を行う。
音声以外の雑音が大きい場合などに、Mチャネルの音信号の補正シフト量を適切に決定できない場合があり得る。MSマイクの使用方法で仰角が取り得る範囲を予め知ることができるので、取り得る範囲から仰角が外れている場合は、補正シフト量が誤っていると判断し、補正していない信号を使用する。
例えば、図30に例示するハンズフリー音声翻訳の場合、MSマイク10の高さHT1が100cm、MSマイク10から話者までの距離DPが30cm〜100cm、話者の口までの高さHT2が100cm〜200cmであるとする。この場合、仰角が取り得る範囲は、0°〜73°である。0°は話者の口までの高さHT2が100cmである場合、73°は、MSマイク10から話者までの距離DPが30cmであり、かつ、話者の口までの高さHT2が200cmである場合である。
図30に示す例では、仰角が0°〜73°の範囲内である場合、音信号VMH及びSチャネルのうち選択された正チャネルまたは負チャネルの音信号を使用して、Lチャネル及びRチャネルの音信号への近似変換を行う。一方、仰角が0°〜73°の範囲内ではない場合、補正していないMチャネル及びSチャネルの音信号V、V及びV−Sを使用して、Lチャネル及びRチャネルの音信号に変換する。
次に、音信号変換処理の作用の概要を説明する。図31は、音信号変換処理の流れを例示する。ステップ101〜ステップ109は、図23のステップ101〜109と同様であるため、説明を省略する。CPU61は、ステップ121で、補正シフト量を使用して仰角を推定する。
CPU61は、ステップ122で、推定された仰角が所定範囲内であるか否か判定する。ステップ122の判定が肯定された場合、即ち、仰角が所定範囲内である場合、補正シフト量は適切であると判定し、Lチャネル及びRチャネルの音信号に近似変換するために位相が補正された音信号を使用する。ステップ122の判定が否定された場合、即ち、仰角が所定範囲内でない場合、補正シフト量は適切でないと判定し、Lチャネル及びRチャネルの音信号に近似変換するために補正されていない元の音信号を使用する。
第3実施形態では、推定された仰角が所定範囲内でない場合、音信号の位相の補正シフト量の決定が適切に行われなかったと判定し、音信号の位相の補正を行わない。これにより、誤った位相の補正が行われた音信号で、不適切な音源方向の判定が行われることを防ぐことができる。
なお、第1〜第3実施形態では、Sチャネル及び−Sチャネルの音信号の位相に対してMチャネルの音信号の位相をシフトする例について説明したが、Mチャネルの音信号の位相に対してSチャネル及び−Sチャネルの音信号の位相をシフトするようにしてもよい。
本実施形態では、第1実施形態に適用する例について説明したが、本実施形態は、第2実施形態に適用されてもよい。図23、28及び31のフローチャートは、例示であり、処理の順序は適宜入れ替えることができる。
以上の各実施形態に関し、更に以下の付記を開示する。
(付記1)
MS方式マイクのMチャネルの音信号の位相、または、前記MS方式マイクのSチャネルの正チャネルの音信号の位相と前記Sチャネルの負チャネルの音信号の位相とに基づいて、前記Mチャネル及び前記正チャネルへの音の到達距離の差による位相差を解消する第1シフト信号、及び前記Mチャネル及び前記負チャネルへの音の到達距離の差による位相差を解消する第2シフト信号を生成し、
前記第1シフト信号または前記第2シフト信号を、XY方式マイクのLチャネル及びRチャネル信号に近似変換する、
音信号変換処理をコンピュータに実行させるプログラム。
(付記2)
前記第1シフト信号及び前記第2シフト信号の各々が前記正チャネルの音信号の位相及び前記負チャネルの音信号の位相に基づいて生成される場合、前記第1シフト信号との類似度及び前記第2シフト信号との類似度のうち、類似度が大きい方のチャネルの音信号を第1選択信号として選択し、
前記第1選択信号が前記正チャネルの音信号である場合、前記第1シフト信号と前記第1選択信号とを、XY方式マイクのLチャネル及びRチャネルの音信号に近似変換し、
前記第1選択信号が前記負チャネルの音信号である場合、前記第2シフト信号と前記第1選択信号とを、XY方式マイクのLチャネル及びRチャネルの音信号に近似変換し、
前記第1シフト信号及び前記第2シフト信号が前記Mチャネルの位相に基づいて生成される場合、前記第1シフト信号及び前記第2シフト信号のうち、前記Mチャネルの音信号との類似度が大きい方のシフト信号を第2選択信号として選択し、
前記Mチャネルの音信号と前記第2選択信号とを、前記XY方式マイクのLチャネル及びRチャネル信号に近似変換する、
付記1のプログラム。
(付記3)
前記Mチャネルの音信号と、位相を所定範囲内で第1所定量ずつシフトした位相毎に前記正チャネルの音信号との類似度を算出し、前記類似度が最大となる位相の位相量だけ前記正チャネルの音信号をシフトさせて、前記第1シフト信号を生成し、前記Mチャネルの音信号と、前記位相を前記所定範囲内で前記第1所定量ずつシフトした位相毎に前記負チャネルの音信号との類似度を算出し、前記類似度が最大となる位相量だけ前記負チャネルの音信号をシフトさせて、前記第2シフト信号を生成するか、
前記正チャネルの音信号と、位相を前記所定範囲内で第1所定量ずつシフトした位相毎に前記Mチャネルの音信号との類似度を算出し、前記類似度が最大となる位相量だけ前記Mチャネルの音信号をシフトさせて、前記第1シフト信号を生成し、前記負チャネルの音信号と、前記位相を前記所定範囲内で第1所定量ずつシフトした位相毎に前記Mチャネルの音信号との類似度を算出し、前記類似度が最大となる位相量だけ前記Mチャネルの音信号をシフトさせて、前記第2シフト信号を生成する、
付記2のプログラム。
(付記4)
前記Mチャネルの音信号と位相を進み方向に第2所定量シフトした前記正チャネルの音信号との類似度、及び、前記Mチャネルの音信号と位相を遅れ方向に前記第2所定量シフトした前記正チャネルの音信号との類似度を算出し、前記類似度が大きい方向に前記正チャネルの音信号を前記第1所定量ずつシフトさせ、前記Mチャネルの音信号と位相を進み方向に第2所定量シフトした前記負チャネルの音信号との類似度、及び、前記Mチャネルの音信号と位相を遅れ方向に前記第2所定量シフトした前記負チャネルの音信号との類似度を算出し、前記類似度が大きい方向に前記負チャネルの音信号を前記第1所定量ずつシフトさせるか、
前記正チャネルの音信号と位相を進み方向に前記第2所定量シフトした前記Mチャネルの音信号との類似度、及び、前記正チャネルの音信号と位相を遅れ方向に前記第2所定量シフトした前記Mチャネルの音信号との類似度を算出し、前記類似度が大きい方向に前記Mチャネルの音信号を前記第1所定量ずつシフトさせ、前記負チャネルの音信号と位相を進み方向に前記第2所定量シフトした前記Mチャネルの音信号との類似度、及び、前記負チャネルの音信号と位相を遅れ方向に前記第2所定量シフトした前記Mチャネルの音信号との類似度を算出し、前記類似度が大きい方向に前記Mチャネルの音信号を前記第1所定量ずつシフトさせる、
付記3のプログラム。
(付記5)
前記類似度は、相互相関係数である、付記2〜付記4の何れかのプログラム。
(付記6)
前記第1シフト信号及び第2シフト信号を生成する際の位相のシフト量から推定される、前記MS方式マイクに対する音源の仰角が所定範囲内である場合に前記近似変換を行う、
付記2〜付記5の何れかのプログラム。
(付記7)
コンピュータが、
MS方式マイクのMチャネルの音信号の位相、または、前記MS方式マイクのSチャネルの正チャネルの音信号の位相と前記Sチャネルの負チャネルの音信号の位相とに基づいて、前記Mチャネル及び前記正チャネルへの音の到達距離の差による位相差を解消する第1シフト信号、及び前記Mチャネル及び前記負チャネルへの音の到達距離の差による位相差を解消する第2シフト信号を生成し、
前記第1シフト信号または前記第2シフト信号を、XY方式マイクのLチャネル及びRチャネル信号に近似変換する、
音信号変換方法。
(付記8)
前記第1シフト信号及び前記第2シフト信号の各々が前記正チャネルの音信号の位相及び前記負チャネルの音信号の位相に基づいて生成される場合、前記第1シフト信号との類似度及び前記第2シフト信号との類似度のうち、類似度が大きい方のチャネルの音信号を第1選択信号として選択し、
前記第1選択信号が前記正チャネルの音信号である場合、前記第1シフト信号と前記第1選択信号とを、XY方式マイクのLチャネル及びRチャネルの音信号に近似変換し、
前記第1選択信号が前記負チャネルの音信号である場合、前記第2シフト信号と前記第1選択信号とを、XY方式マイクのLチャネル及びRチャネルの音信号に近似変換し、
前記第1シフト信号及び前記第2シフト信号が前記Mチャネルの位相に基づいて生成される場合、前記第1シフト信号及び前記第2シフト信号のうち、前記Mチャネルの音信号との類似度が大きい方のシフト信号を第2選択信号として選択し、
前記Mチャネルの音信号と前記第2選択信号とを、前記XY方式マイクのLチャネル及びRチャネル信号に近似変換する、
付記7の音声信号変換方法。
(付記9)
前記Mチャネルの音信号と、位相を所定範囲内で第1所定量ずつシフトした位相毎に前記正チャネルの音信号との類似度を算出し、前記類似度が最大となる位相の位相量だけ前記正チャネルの音信号をシフトさせて、前記第1シフト信号を生成し、前記Mチャネルの音信号と、前記位相を前記所定範囲内で前記第1所定量ずつシフトした位相毎に前記負チャネルの音信号との類似度を算出し、前記類似度が最大となる位相量だけ前記負チャネルの音信号をシフトさせて、前記第2シフト信号を生成するか、
前記正チャネルの音信号と、位相を前記所定範囲内で第1所定量ずつシフトした位相毎に前記Mチャネルの音信号との類似度を算出し、前記類似度が最大となる位相量だけ前記Mチャネルの音信号をシフトさせて、前記第1シフト信号を生成し、前記負チャネルの音信号と、前記位相を前記所定範囲内で第1所定量ずつシフトした位相毎に前記Mチャネルの音信号との類似度を算出し、前記類似度が最大となる位相量だけ前記Mチャネルの音信号をシフトさせて、前記第2シフト信号を生成する、
付記8の音信号変換方法。
(付記10)
前記Mチャネルの音信号と位相を進み方向に第2所定量シフトした前記正チャネルの音信号との類似度、及び、前記Mチャネルの音信号と位相を遅れ方向に前記第2所定量シフトした前記正チャネルの音信号との類似度を算出し、前記類似度が大きい方向に前記正チャネルの音信号を前記第1所定量ずつシフトさせ、前記Mチャネルの音信号と位相を進み方向に第2所定量シフトした前記負チャネルの音信号との類似度、及び、前記Mチャネルの音信号と位相を遅れ方向に前記第2所定量シフトした前記負チャネルの音信号との類似度を算出し、前記類似度が大きい方向に前記負チャネルの音信号を前記第1所定量ずつシフトさせるか、
前記正チャネルの音信号と位相を進み方向に前記第2所定量シフトした前記Mチャネルの音信号との類似度、及び、前記正チャネルの音信号と位相を遅れ方向に前記第2所定量シフトした前記Mチャネルの音信号との類似度を算出し、前記類似度が大きい方向に前記Mチャネルの音信号を前記第1所定量ずつシフトさせ、前記負チャネルの音信号と位相を進み方向に前記第2所定量シフトした前記Mチャネルの音信号との類似度、及び、前記負チャネルの音信号と位相を遅れ方向に前記第2所定量シフトした前記Mチャネルの音信号との類似度を算出し、前記類似度が大きい方向に前記Mチャネルの音信号を前記第1所定量ずつシフトさせる、
付記9の音信号変換方法。
(付記11)
前記類似度は、相互相関係数である、付記8〜付記10の何れかの音信号変換方法。
(付記12)
前記第1シフト信号及び第2シフト信号を生成する際の位相のシフト量から推定される、前記MS方式マイクに対する音源の仰角が所定範囲内である場合に前記近似変換を行う、
付記8〜付記11の何れかの音信号変換方法。
(付記13)
MS方式マイクのMチャネルの音信号の位相、または、前記MS方式マイクのSチャネルの正チャネルの音信号の位相と前記Sチャネルの負チャネルの音信号の位相とに基づいて、前記Mチャネル及び前記正チャネルへの音の到達距離の差による位相差を解消する第1シフト信号、及び前記Mチャネル及び前記負チャネルへの音の到達距離の差による位相差を解消する第2シフト信号を生成する生成部と、
前記第1シフト信号または前記第2シフト信号を、XY方式マイクのLチャネル及びRチャネル信号に近似変換する変換部と、
を含む音信号変換装置。
(付記14)
選択部をさらに含み、
前記選択部は、前記第1シフト信号及び前記第2シフト信号の各々が前記正チャネルの音信号の位相及び前記負チャネルの音信号の位相に基づいて生成される場合、前記第1シフト信号との類似度及び前記第2シフト信号との類似度のうち、類似度が大きい方のチャネルの音信号を第1選択信号として選択し、
前記変換部は、前記第1選択信号が前記正チャネルの音信号である場合、前記第1シフト信号と前記第1選択信号とを、XY方式マイクのLチャネル及びRチャネルの音信号に近似変換し、前記第1選択信号が前記負チャネルの音信号である場合、前記第2シフト信号と前記第1選択信号とを、XY方式マイクのLチャネル及びRチャネルの音信号に近似変換し、
前記選択部は、前記第1シフト信号及び前記第2シフト信号が前記Mチャネルの位相に基づいて生成される場合、前記第1シフト信号及び前記第2シフト信号のうち、前記Mチャネルの音信号との類似度が大きい方のシフト信号を第2選択信号として選択し、
前記変換部は、前記Mチャネルの音信号と前記第2選択信号とを、前記XY方式マイクのLチャネル及びRチャネル信号に近似変換する、
付記13の音声信号変換装置。
(付記15)
前記生成部は、
前記Mチャネルの音信号と、位相を所定範囲内で第1所定量ずつシフトした位相毎に前記正チャネルの音信号との類似度を算出し、前記類似度が最大となる位相の位相量だけ前記正チャネルの音信号をシフトさせて、前記第1シフト信号を生成し、前記Mチャネルの音信号と、前記位相を前記所定範囲内で前記第1所定量ずつシフトした位相毎に前記負チャネルの音信号との類似度を算出し、前記類似度が最大となる位相量だけ前記負チャネルの音信号をシフトさせて、前記第2シフト信号を生成するか、
前記正チャネルの音信号と、位相を前記所定範囲内で第1所定量ずつシフトした位相毎に前記Mチャネルの音信号との類似度を算出し、前記類似度が最大となる位相量だけ前記Mチャネルの音信号をシフトさせて、前記第1シフト信号を生成し、前記負チャネルの音信号と、前記位相を前記所定範囲内で第1所定量ずつシフトした位相毎に前記Mチャネルの音信号との類似度を算出し、前記類似度が最大となる位相量だけ前記Mチャネルの音信号をシフトさせて、前記第2シフト信号を生成する、
付記14の音信号変換装置。
(付記16)
前記生成部は、
前記Mチャネルの音信号と位相を進み方向に第2所定量シフトした前記正チャネルの音信号との類似度、及び、前記Mチャネルの音信号と位相を遅れ方向に前記第2所定量シフトした前記正チャネルの音信号との類似度を算出し、前記類似度が大きい方向に前記正チャネルの音信号を前記第1所定量ずつシフトさせ、前記Mチャネルの音信号と位相を進み方向に第2所定量シフトした前記負チャネルの音信号との類似度、及び、前記Mチャネルの音信号と位相を遅れ方向に前記第2所定量シフトした前記負チャネルの音信号との類似度を算出し、前記類似度が大きい方向に前記負チャネルの音信号を前記第1所定量ずつシフトさせるか、
前記正チャネルの音信号と位相を進み方向に前記第2所定量シフトした前記Mチャネルの音信号との類似度、及び、前記正チャネルの音信号と位相を遅れ方向に前記第2所定量シフトした前記Mチャネルの音信号との類似度を算出し、前記類似度が大きい方向に前記Mチャネルの音信号を前記第1所定量ずつシフトさせ、前記負チャネルの音信号と位相を進み方向に前記第2所定量シフトした前記Mチャネルの音信号との類似度、及び、前記負チャネルの音信号と位相を遅れ方向に前記第2所定量シフトした前記Mチャネルの音信号との類似度を算出し、前記類似度が大きい方向に前記Mチャネルの音信号を前記第1所定量ずつシフトさせる、
付記15に記載の音信号変換装置。
(付記17)
前記類似度は、相互相関係数である、付記14〜付記16の何れかの音信号変換装置。
(付記18)
前記変換部は、
前記第1シフト信号及び第2シフト信号を生成する際の位相のシフト量から推定される、前記MS方式マイクに対する音源の仰角が所定範囲内である場合に前記近似変換を行う、
付記14〜付記17の何れかの音信号変換装置。
10 MS方式マイクロフォン
20 音信号変換装置
21 補正部
22 変換部
53 位相シフト部
54 類似度算出部
55 信号選択部
61 CPU
62 一次記憶部
63 二次記憶部

Claims (8)

  1. MS方式マイクのMチャネルの音信号の位相、または、前記MS方式マイクのSチャネルの正チャネルの音信号の位相と前記Sチャネルの負チャネルの音信号の位相とに基づいて、前記Mチャネル及び前記正チャネルへの音の到達距離の差による位相差を解消する第1シフト信号、及び前記Mチャネル及び前記負チャネルへの音の到達距離の差による位相差を解消する第2シフト信号を生成し、
    前記第1シフト信号または前記第2シフト信号を、XY方式マイクのLチャネル及びRチャネル信号に近似変換する、
    音信号変換処理をコンピュータに実行させるプログラム。
  2. 前記第1シフト信号及び前記第2シフト信号の各々が前記正チャネルの音信号の位相及び前記負チャネルの音信号の位相に基づいて生成される場合、前記第1シフト信号との類似度及び前記第2シフト信号との類似度のうち、類似度が大きい方のチャネルの音信号を第1選択信号として選択し、
    前記第1選択信号が前記正チャネルの音信号である場合、前記第1シフト信号と前記第1選択信号とを、XY方式マイクのLチャネル及びRチャネルの音信号に近似変換し、
    前記第1選択信号が前記負チャネルの音信号である場合、前記第2シフト信号と前記第1選択信号とを、XY方式マイクのLチャネル及びRチャネルの音信号に近似変換し、
    前記第1シフト信号及び前記第2シフト信号が前記Mチャネルの位相に基づいて生成される場合、前記第1シフト信号及び前記第2シフト信号のうち、前記Mチャネルの音信号との類似度が大きい方のシフト信号を第2選択信号として選択し、
    前記Mチャネルの音信号と前記第2選択信号とを、前記XY方式マイクのLチャネル及びRチャネル信号に近似変換する、
    請求項1に記載のプログラム。
  3. 前記Mチャネルの音信号と、位相を所定範囲内で第1所定量ずつシフトした位相毎に前記正チャネルの音信号との類似度を算出し、前記類似度が最大となる位相の位相量だけ前記正チャネルの音信号をシフトさせて、前記第1シフト信号を生成し、前記Mチャネルの音信号と、前記位相を前記所定範囲内で前記第1所定量ずつシフトした位相毎に前記負チャネルの音信号との類似度を算出し、前記類似度が最大となる位相量だけ前記負チャネルの音信号をシフトさせて、前記第2シフト信号を生成するか、
    前記正チャネルの音信号と、位相を前記所定範囲内で第1所定量ずつシフトした位相毎に前記Mチャネルの音信号との類似度を算出し、前記類似度が最大となる位相量だけ前記Mチャネルの音信号をシフトさせて、前記第1シフト信号を生成し、前記負チャネルの音信号と、前記位相を前記所定範囲内で第1所定量ずつシフトした位相毎に前記Mチャネルの音信号との類似度を算出し、前記類似度が最大となる位相量だけ前記Mチャネルの音信号をシフトさせて、前記第2シフト信号を生成する、
    請求項2に記載のプログラム。
  4. 前記Mチャネルの音信号と位相を進み方向に第2所定量シフトした前記正チャネルの音信号との類似度、及び、前記Mチャネルの音信号と位相を遅れ方向に前記第2所定量シフトした前記正チャネルの音信号との類似度を算出し、前記類似度が大きい方向に前記正チャネルの音信号を前記第1所定量ずつシフトさせ、前記Mチャネルの音信号と位相を進み方向に第2所定量シフトした前記負チャネルの音信号との類似度、及び、前記Mチャネルの音信号と位相を遅れ方向に前記第2所定量シフトした前記負チャネルの音信号との類似度を算出し、前記類似度が大きい方向に前記負チャネルの音信号を前記第1所定量ずつシフトさせるか、
    前記正チャネルの音信号と位相を進み方向に前記第2所定量シフトした前記Mチャネルの音信号との類似度、及び、前記正チャネルの音信号と位相を遅れ方向に前記第2所定量シフトした前記Mチャネルの音信号との類似度を算出し、前記類似度が大きい方向に前記Mチャネルの音信号を前記第1所定量ずつシフトさせ、前記負チャネルの音信号と位相を進み方向に前記第2所定量シフトした前記Mチャネルの音信号との類似度、及び、前記負チャネルの音信号と位相を遅れ方向に前記第2所定量シフトした前記Mチャネルの音信号との類似度を算出し、前記類似度が大きい方向に前記Mチャネルの音信号を前記第1所定量ずつシフトさせる、
    請求項3に記載のプログラム。
  5. 前記類似度は、相互相関係数である、請求項2〜請求項4の何れか1項に記載のプログラム。
  6. 前記第1シフト信号及び第2シフト信号を生成する際の位相のシフト量から推定される、前記MS方式マイクに対する音源の仰角が所定範囲内である場合に前記近似変換を行う、
    請求項2〜請求項5の何れか1項に記載のプログラム。
  7. コンピュータが、
    MS方式マイクのMチャネルの音信号の位相、または、前記MS方式マイクのSチャネルの正チャネルの音信号の位相と前記Sチャネルの負チャネルの音信号の位相とに基づいて、前記Mチャネル及び前記正チャネルへの音の到達距離の差による位相差を解消する第1シフト信号、及び前記Mチャネル及び前記負チャネルへの音の到達距離の差による位相差を解消する第2シフト信号を生成し、
    前記第1シフト信号または第2シフト信号を、XY方式マイクのLチャネル及びRチャネルの音信号に近似変換する、
    音信号変換方法。
  8. MS方式マイクのMチャネルの音信号の位相、または、前記MS方式マイクのSチャネルの正チャネルの音信号の位相と前記Sチャネルの負チャネルの音信号の位相とに基づいて、前記Mチャネル及び前記正チャネルへの音の到達距離の差による位相差を解消する第1シフト信号、及び前記Mチャネル及び前記負チャネルへの音の到達距離の差による位相差を解消する第2シフト信号を生成する生成部と、
    前記第1シフト信号または第2シフト信号を、XY方式マイクのLチャネル及びRチャネルの音信号に近似変換する変換部と、
    を含む音信号変換装置。
JP2019207622A 2019-11-18 2019-11-18 音信号変換プログラム、音信号変換方法、及び、音信号変換装置 Pending JP2021081533A (ja)

Priority Applications (2)

Application Number Priority Date Filing Date Title
JP2019207622A JP2021081533A (ja) 2019-11-18 2019-11-18 音信号変換プログラム、音信号変換方法、及び、音信号変換装置
US17/062,122 US11463806B2 (en) 2019-11-18 2020-10-02 Non-transitory computer-readable storage medium for storing sound signal conversion program, method of converting sound signal, and sound signal conversion device

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2019207622A JP2021081533A (ja) 2019-11-18 2019-11-18 音信号変換プログラム、音信号変換方法、及び、音信号変換装置

Publications (1)

Publication Number Publication Date
JP2021081533A true JP2021081533A (ja) 2021-05-27

Family

ID=75909806

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2019207622A Pending JP2021081533A (ja) 2019-11-18 2019-11-18 音信号変換プログラム、音信号変換方法、及び、音信号変換装置

Country Status (2)

Country Link
US (1) US11463806B2 (ja)
JP (1) JP2021081533A (ja)

Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2002171590A (ja) * 2000-11-30 2002-06-14 Aiwa Co Ltd Ms方式のステレオマイクロホン

Family Cites Families (11)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS5434225A (en) * 1977-08-22 1979-03-13 Sony Corp Microphone device
ATE230917T1 (de) * 1999-10-07 2003-01-15 Zlatan Ribic Verfahren und anordnung zur aufnahme von schallsignalen
JP3598932B2 (ja) 2000-02-23 2004-12-08 日本電気株式会社 話者方向検出回路及びそれに用いる話者方向検出方法
FI20055260A0 (fi) * 2005-05-27 2005-05-27 Midas Studios Avoin Yhtioe Laite, järjestelmä ja menetelmä akustisten signaalien vastaanottamista tai toistamista varten
JP2007214913A (ja) * 2006-02-09 2007-08-23 Yamaha Corp 収音装置
JP4332753B2 (ja) * 2007-06-13 2009-09-16 ソニー株式会社 音声レコーダ
JP5092864B2 (ja) 2008-04-17 2012-12-05 ヤマハ株式会社 音処理装置およびプログラム
JP5646146B2 (ja) * 2009-03-18 2014-12-24 株式会社東芝 音声入力装置、音声認識システム及び音声認識方法
US20100331048A1 (en) * 2009-06-25 2010-12-30 Qualcomm Incorporated M-s stereo reproduction at a device
CN102403022A (zh) * 2010-09-13 2012-04-04 三洋电机株式会社 录音装置、录音条件设定方法以及录音条件设定程序
US9456289B2 (en) * 2010-11-19 2016-09-27 Nokia Technologies Oy Converting multi-microphone captured signals to shifted signals useful for binaural signal processing and use thereof

Patent Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2002171590A (ja) * 2000-11-30 2002-06-14 Aiwa Co Ltd Ms方式のステレオマイクロホン

Also Published As

Publication number Publication date
US11463806B2 (en) 2022-10-04
US20210152927A1 (en) 2021-05-20

Similar Documents

Publication Publication Date Title
JP4912036B2 (ja) 指向性集音装置、指向性集音方法、及びコンピュータプログラム
US6525993B2 (en) Speaker direction detection circuit and speaker direction detection method used in this circuit
JP5817366B2 (ja) 音声信号処理装置、方法及びプログラム
US9269367B2 (en) Processing audio signals during a communication event
US11659349B2 (en) Audio distance estimation for spatial audio processing
EP1887831A2 (en) Method, apparatus and program for estimating the direction of a sound source
US20140270231A1 (en) System and method of mixing accelerometer and microphone signals to improve voice quality in a mobile device
JP5493611B2 (ja) 情報処理装置、情報処理方法およびプログラム
US8693287B2 (en) Sound direction estimation apparatus and sound direction estimation method
US20090232318A1 (en) Output correcting device and method, and loudspeaker output correcting device and method
JP2010124370A (ja) 信号処理装置、信号処理方法、および信号処理プログラム
US20080120100A1 (en) Method For Detecting Target Sound, Method For Detecting Delay Time In Signal Input, And Sound Signal Processor
JP5459220B2 (ja) 発話音声検出装置
JP6436180B2 (ja) 収音装置、プログラム及び方法
Archer-Boyd et al. Biomimetic direction of arrival estimation for resolving front-back confusions in hearing aids
JP2021081533A (ja) 音信号変換プログラム、音信号変換方法、及び、音信号変換装置
US10951978B2 (en) Output control of sounds from sources respectively positioned in priority and nonpriority directions
JP2018032931A (ja) 音響信号処理装置、プログラム及び方法
US10360922B2 (en) Noise reduction device and method for reducing noise
US11276388B2 (en) Beamforming system based on delay distribution model using high frequency phase difference
JP2019197179A (ja) 発声方向判定プログラム、発声方向判定方法、及び、発声方向判定装置
US11915681B2 (en) Information processing device and control method
JP2020201370A (ja) 話者方向判定プログラム、話者方向判定方法、及び話者方向判定装置
JPH02178699A (ja) 音声認識装置
JP6128547B2 (ja) 音源分離方法、装置及びプログラム

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20220708

RD03 Notification of appointment of power of attorney

Free format text: JAPANESE INTERMEDIATE CODE: A7423

Effective date: 20230206

RD04 Notification of resignation of power of attorney

Free format text: JAPANESE INTERMEDIATE CODE: A7424

Effective date: 20230206

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20230530

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20230606

A02 Decision of refusal

Free format text: JAPANESE INTERMEDIATE CODE: A02

Effective date: 20231128