JP2021081533A - 音信号変換プログラム、音信号変換方法、及び、音信号変換装置 - Google Patents
音信号変換プログラム、音信号変換方法、及び、音信号変換装置 Download PDFInfo
- Publication number
- JP2021081533A JP2021081533A JP2019207622A JP2019207622A JP2021081533A JP 2021081533 A JP2021081533 A JP 2021081533A JP 2019207622 A JP2019207622 A JP 2019207622A JP 2019207622 A JP2019207622 A JP 2019207622A JP 2021081533 A JP2021081533 A JP 2021081533A
- Authority
- JP
- Japan
- Prior art keywords
- channel
- sound signal
- signal
- phase
- sound
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 230000005236 sound signal Effects 0.000 title claims abstract description 488
- 238000006243 chemical reaction Methods 0.000 title claims description 67
- 238000000034 method Methods 0.000 title claims description 18
- 238000012545 processing Methods 0.000 claims description 18
- 230000010363 phase shift Effects 0.000 claims description 10
- 238000010586 diagram Methods 0.000 description 28
- 238000012937 correction Methods 0.000 description 27
- 238000004364 calculation method Methods 0.000 description 13
- 238000001514 detection method Methods 0.000 description 5
- 230000003111 delayed effect Effects 0.000 description 4
- 230000006870 function Effects 0.000 description 4
- 238000013519 translation Methods 0.000 description 3
- 230000002457 bidirectional effect Effects 0.000 description 2
- 238000013500 data storage Methods 0.000 description 2
- 238000005070 sampling Methods 0.000 description 2
- 238000001228 spectrum Methods 0.000 description 2
- 239000008186 active pharmaceutical agent Substances 0.000 description 1
- 238000013459 approach Methods 0.000 description 1
- 230000005540 biological transmission Effects 0.000 description 1
- 230000007423 decrease Effects 0.000 description 1
- 239000007787 solid Substances 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L17/00—Speaker identification or verification techniques
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04R—LOUDSPEAKERS, MICROPHONES, GRAMOPHONE PICK-UPS OR LIKE ACOUSTIC ELECTROMECHANICAL TRANSDUCERS; DEAF-AID SETS; PUBLIC ADDRESS SYSTEMS
- H04R5/00—Stereophonic arrangements
- H04R5/027—Spatial or constructional arrangements of microphones, e.g. in dummy heads
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L25/00—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
- G10L25/48—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 specially adapted for particular use
- G10L25/51—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 specially adapted for particular use for comparison or discrimination
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04R—LOUDSPEAKERS, MICROPHONES, GRAMOPHONE PICK-UPS OR LIKE ACOUSTIC ELECTROMECHANICAL TRANSDUCERS; DEAF-AID SETS; PUBLIC ADDRESS SYSTEMS
- H04R1/00—Details of transducers, loudspeakers or microphones
- H04R1/20—Arrangements for obtaining desired frequency or directional characteristics
- H04R1/32—Arrangements for obtaining desired frequency or directional characteristics for obtaining desired directional characteristic only
- H04R1/326—Arrangements for obtaining desired frequency or directional characteristics for obtaining desired directional characteristic only for microphones
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04R—LOUDSPEAKERS, MICROPHONES, GRAMOPHONE PICK-UPS OR LIKE ACOUSTIC ELECTROMECHANICAL TRANSDUCERS; DEAF-AID SETS; PUBLIC ADDRESS SYSTEMS
- H04R1/00—Details of transducers, loudspeakers or microphones
- H04R1/20—Arrangements for obtaining desired frequency or directional characteristics
- H04R1/32—Arrangements for obtaining desired frequency or directional characteristics for obtaining desired directional characteristic only
- H04R1/34—Arrangements for obtaining desired frequency or directional characteristics for obtaining desired directional characteristic only by using a single transducer with sound reflecting, diffracting, directing or guiding means
- H04R1/38—Arrangements for obtaining desired frequency or directional characteristics for obtaining desired directional characteristic only by using a single transducer with sound reflecting, diffracting, directing or guiding means in which sound waves act upon both sides of a diaphragm and incorporating acoustic phase-shifting means, e.g. pressure-gradient microphone
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04R—LOUDSPEAKERS, MICROPHONES, GRAMOPHONE PICK-UPS OR LIKE ACOUSTIC ELECTROMECHANICAL TRANSDUCERS; DEAF-AID SETS; PUBLIC ADDRESS SYSTEMS
- H04R25/00—Deaf-aid sets, i.e. electro-acoustic or electro-mechanical hearing aids; Electric tinnitus maskers providing an auditory perception
- H04R25/40—Arrangements for obtaining a desired directivity characteristic
- H04R25/405—Arrangements for obtaining a desired directivity characteristic by combining a plurality of transducers
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04R—LOUDSPEAKERS, MICROPHONES, GRAMOPHONE PICK-UPS OR LIKE ACOUSTIC ELECTROMECHANICAL TRANSDUCERS; DEAF-AID SETS; PUBLIC ADDRESS SYSTEMS
- H04R25/00—Deaf-aid sets, i.e. electro-acoustic or electro-mechanical hearing aids; Electric tinnitus maskers providing an auditory perception
- H04R25/40—Arrangements for obtaining a desired directivity characteristic
- H04R25/407—Circuits for combining signals of a plurality of transducers
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04R—LOUDSPEAKERS, MICROPHONES, GRAMOPHONE PICK-UPS OR LIKE ACOUSTIC ELECTROMECHANICAL TRANSDUCERS; DEAF-AID SETS; PUBLIC ADDRESS SYSTEMS
- H04R3/00—Circuits for transducers, loudspeakers or microphones
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04R—LOUDSPEAKERS, MICROPHONES, GRAMOPHONE PICK-UPS OR LIKE ACOUSTIC ELECTROMECHANICAL TRANSDUCERS; DEAF-AID SETS; PUBLIC ADDRESS SYSTEMS
- H04R3/00—Circuits for transducers, loudspeakers or microphones
- H04R3/005—Circuits for transducers, loudspeakers or microphones for combining the signals of two or more microphones
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04S—STEREOPHONIC SYSTEMS
- H04S1/00—Two-channel systems
- H04S1/002—Non-adaptive circuits, e.g. manually adjustable or static, for enhancing the sound image or the spatial distribution
Landscapes
- Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- Acoustics & Sound (AREA)
- Signal Processing (AREA)
- Health & Medical Sciences (AREA)
- Otolaryngology (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Human Computer Interaction (AREA)
- Multimedia (AREA)
- General Health & Medical Sciences (AREA)
- Circuit For Audible Band Transducer (AREA)
- Obtaining Desirable Characteristics In Audible-Bandwidth Transducers (AREA)
Abstract
Description
以下、図面を参照して第1実施形態の一例を詳細に説明する。
VL=(VM+kVS)/2
VR=(VM−kVS)/2 …(1)
FM=VMre+iVMim
FS=VSre+iVSim …(2)
|VL|=10log10{(VMre+kVSre)2+(VMim+kVSim)2}
=10log10{(VMre 2+VMim 2)+k2(VSre 2+VSim 2)
+2k(VMreVSre+VMimVSim)}
|VR|=10log10{(VMre−kVSre)2+(VMim−kVSim)2}
=10log10{(VMre 2+VMim 2)+k2(VSre 2+VSim 2)
+2k(VMre・(−VSre)+VMim・(−VSim))} …(3)
VMH(t,p)=VM(t+p) …(4)
マイク間の音の到達時間差=最大マイク間距離/音速 …(5)
マイク間の到達時間差=5[cm]/331[m/s]
=0.05[m]/331[m/s]
=1.51×10−4[s] …(6)
位相差[サンプル]=48000×1.51×10−4≒7.25[サンプル]
…(7)
VL=(VMH+kVS)/2
VR=(VMH−kVS)/2 …(9)
ここでは、音の広がり感を調整しなくてよいため、左右の違いが最も顕著となるようにk=1.0であってよい。
VM=AMcosωt
VS=AScosω(t−d) …(10)
VL=(AM+AS)/2cos(ωt)
VR=(AM−AS)/2cos(ωt) …(13)
VL=(AM−AS)/2cos(ωt)
VR=(AM+AS)/2cos(ωt) …(14)
以下、図面を参照して第2実施形態の一例を詳細に説明する。第1実施形態と同様の構成及び作用については、説明を省略する。
VM+’(t)=VM(t−dd)
VM−’(t)=VM(t+dd) …(15)
以下、図面を参照して第3実施形態の一例を詳細に説明する。第1実施形態及び第2実施形態と同様の構成及び作用については、説明を省略する。
θE=arcsin[pD×vs/{FS×(Δs+Δm)}] …(16)
ここで、pDは、音信号VMとVSまたは音信号VMとV−Sの位相を一致させるために、シフトした位相のサンプル数である補正シフト量であり、FSはサンプリング周波数「Hz]である。Δsは予め測定した距離|PSPO|であり、Δmは予め測定した距離|PMPO|でありvsは音速[m/sec]である。
|PAPS’|=|PAPS|cosθS≒|PAPS|
|PAPM’|=|PAPM|cosθM≒|PAPM| …(17)
|PAPM|−|PAPS|≒|PAPM’|−|PAPS’|
=|PM’PO|+|PS’PO|
=ΔmsinθE+ΔssinθE
=(Δm+Δs)sinθE …(18)
pD=(|PAPM|−|PAPS|)×FS/vs
=(Δm+Δs)sinθE×FS/vs …(19)
MS方式マイクのMチャネルの音信号の位相、または、前記MS方式マイクのSチャネルの正チャネルの音信号の位相と前記Sチャネルの負チャネルの音信号の位相とに基づいて、前記Mチャネル及び前記正チャネルへの音の到達距離の差による位相差を解消する第1シフト信号、及び前記Mチャネル及び前記負チャネルへの音の到達距離の差による位相差を解消する第2シフト信号を生成し、
前記第1シフト信号または前記第2シフト信号を、XY方式マイクのLチャネル及びRチャネル信号に近似変換する、
音信号変換処理をコンピュータに実行させるプログラム。
(付記2)
前記第1シフト信号及び前記第2シフト信号の各々が前記正チャネルの音信号の位相及び前記負チャネルの音信号の位相に基づいて生成される場合、前記第1シフト信号との類似度及び前記第2シフト信号との類似度のうち、類似度が大きい方のチャネルの音信号を第1選択信号として選択し、
前記第1選択信号が前記正チャネルの音信号である場合、前記第1シフト信号と前記第1選択信号とを、XY方式マイクのLチャネル及びRチャネルの音信号に近似変換し、
前記第1選択信号が前記負チャネルの音信号である場合、前記第2シフト信号と前記第1選択信号とを、XY方式マイクのLチャネル及びRチャネルの音信号に近似変換し、
前記第1シフト信号及び前記第2シフト信号が前記Mチャネルの位相に基づいて生成される場合、前記第1シフト信号及び前記第2シフト信号のうち、前記Mチャネルの音信号との類似度が大きい方のシフト信号を第2選択信号として選択し、
前記Mチャネルの音信号と前記第2選択信号とを、前記XY方式マイクのLチャネル及びRチャネル信号に近似変換する、
付記1のプログラム。
(付記3)
前記Mチャネルの音信号と、位相を所定範囲内で第1所定量ずつシフトした位相毎に前記正チャネルの音信号との類似度を算出し、前記類似度が最大となる位相の位相量だけ前記正チャネルの音信号をシフトさせて、前記第1シフト信号を生成し、前記Mチャネルの音信号と、前記位相を前記所定範囲内で前記第1所定量ずつシフトした位相毎に前記負チャネルの音信号との類似度を算出し、前記類似度が最大となる位相量だけ前記負チャネルの音信号をシフトさせて、前記第2シフト信号を生成するか、
前記正チャネルの音信号と、位相を前記所定範囲内で第1所定量ずつシフトした位相毎に前記Mチャネルの音信号との類似度を算出し、前記類似度が最大となる位相量だけ前記Mチャネルの音信号をシフトさせて、前記第1シフト信号を生成し、前記負チャネルの音信号と、前記位相を前記所定範囲内で第1所定量ずつシフトした位相毎に前記Mチャネルの音信号との類似度を算出し、前記類似度が最大となる位相量だけ前記Mチャネルの音信号をシフトさせて、前記第2シフト信号を生成する、
付記2のプログラム。
(付記4)
前記Mチャネルの音信号と位相を進み方向に第2所定量シフトした前記正チャネルの音信号との類似度、及び、前記Mチャネルの音信号と位相を遅れ方向に前記第2所定量シフトした前記正チャネルの音信号との類似度を算出し、前記類似度が大きい方向に前記正チャネルの音信号を前記第1所定量ずつシフトさせ、前記Mチャネルの音信号と位相を進み方向に第2所定量シフトした前記負チャネルの音信号との類似度、及び、前記Mチャネルの音信号と位相を遅れ方向に前記第2所定量シフトした前記負チャネルの音信号との類似度を算出し、前記類似度が大きい方向に前記負チャネルの音信号を前記第1所定量ずつシフトさせるか、
前記正チャネルの音信号と位相を進み方向に前記第2所定量シフトした前記Mチャネルの音信号との類似度、及び、前記正チャネルの音信号と位相を遅れ方向に前記第2所定量シフトした前記Mチャネルの音信号との類似度を算出し、前記類似度が大きい方向に前記Mチャネルの音信号を前記第1所定量ずつシフトさせ、前記負チャネルの音信号と位相を進み方向に前記第2所定量シフトした前記Mチャネルの音信号との類似度、及び、前記負チャネルの音信号と位相を遅れ方向に前記第2所定量シフトした前記Mチャネルの音信号との類似度を算出し、前記類似度が大きい方向に前記Mチャネルの音信号を前記第1所定量ずつシフトさせる、
付記3のプログラム。
(付記5)
前記類似度は、相互相関係数である、付記2〜付記4の何れかのプログラム。
(付記6)
前記第1シフト信号及び第2シフト信号を生成する際の位相のシフト量から推定される、前記MS方式マイクに対する音源の仰角が所定範囲内である場合に前記近似変換を行う、
付記2〜付記5の何れかのプログラム。
(付記7)
コンピュータが、
MS方式マイクのMチャネルの音信号の位相、または、前記MS方式マイクのSチャネルの正チャネルの音信号の位相と前記Sチャネルの負チャネルの音信号の位相とに基づいて、前記Mチャネル及び前記正チャネルへの音の到達距離の差による位相差を解消する第1シフト信号、及び前記Mチャネル及び前記負チャネルへの音の到達距離の差による位相差を解消する第2シフト信号を生成し、
前記第1シフト信号または前記第2シフト信号を、XY方式マイクのLチャネル及びRチャネル信号に近似変換する、
音信号変換方法。
(付記8)
前記第1シフト信号及び前記第2シフト信号の各々が前記正チャネルの音信号の位相及び前記負チャネルの音信号の位相に基づいて生成される場合、前記第1シフト信号との類似度及び前記第2シフト信号との類似度のうち、類似度が大きい方のチャネルの音信号を第1選択信号として選択し、
前記第1選択信号が前記正チャネルの音信号である場合、前記第1シフト信号と前記第1選択信号とを、XY方式マイクのLチャネル及びRチャネルの音信号に近似変換し、
前記第1選択信号が前記負チャネルの音信号である場合、前記第2シフト信号と前記第1選択信号とを、XY方式マイクのLチャネル及びRチャネルの音信号に近似変換し、
前記第1シフト信号及び前記第2シフト信号が前記Mチャネルの位相に基づいて生成される場合、前記第1シフト信号及び前記第2シフト信号のうち、前記Mチャネルの音信号との類似度が大きい方のシフト信号を第2選択信号として選択し、
前記Mチャネルの音信号と前記第2選択信号とを、前記XY方式マイクのLチャネル及びRチャネル信号に近似変換する、
付記7の音声信号変換方法。
(付記9)
前記Mチャネルの音信号と、位相を所定範囲内で第1所定量ずつシフトした位相毎に前記正チャネルの音信号との類似度を算出し、前記類似度が最大となる位相の位相量だけ前記正チャネルの音信号をシフトさせて、前記第1シフト信号を生成し、前記Mチャネルの音信号と、前記位相を前記所定範囲内で前記第1所定量ずつシフトした位相毎に前記負チャネルの音信号との類似度を算出し、前記類似度が最大となる位相量だけ前記負チャネルの音信号をシフトさせて、前記第2シフト信号を生成するか、
前記正チャネルの音信号と、位相を前記所定範囲内で第1所定量ずつシフトした位相毎に前記Mチャネルの音信号との類似度を算出し、前記類似度が最大となる位相量だけ前記Mチャネルの音信号をシフトさせて、前記第1シフト信号を生成し、前記負チャネルの音信号と、前記位相を前記所定範囲内で第1所定量ずつシフトした位相毎に前記Mチャネルの音信号との類似度を算出し、前記類似度が最大となる位相量だけ前記Mチャネルの音信号をシフトさせて、前記第2シフト信号を生成する、
付記8の音信号変換方法。
(付記10)
前記Mチャネルの音信号と位相を進み方向に第2所定量シフトした前記正チャネルの音信号との類似度、及び、前記Mチャネルの音信号と位相を遅れ方向に前記第2所定量シフトした前記正チャネルの音信号との類似度を算出し、前記類似度が大きい方向に前記正チャネルの音信号を前記第1所定量ずつシフトさせ、前記Mチャネルの音信号と位相を進み方向に第2所定量シフトした前記負チャネルの音信号との類似度、及び、前記Mチャネルの音信号と位相を遅れ方向に前記第2所定量シフトした前記負チャネルの音信号との類似度を算出し、前記類似度が大きい方向に前記負チャネルの音信号を前記第1所定量ずつシフトさせるか、
前記正チャネルの音信号と位相を進み方向に前記第2所定量シフトした前記Mチャネルの音信号との類似度、及び、前記正チャネルの音信号と位相を遅れ方向に前記第2所定量シフトした前記Mチャネルの音信号との類似度を算出し、前記類似度が大きい方向に前記Mチャネルの音信号を前記第1所定量ずつシフトさせ、前記負チャネルの音信号と位相を進み方向に前記第2所定量シフトした前記Mチャネルの音信号との類似度、及び、前記負チャネルの音信号と位相を遅れ方向に前記第2所定量シフトした前記Mチャネルの音信号との類似度を算出し、前記類似度が大きい方向に前記Mチャネルの音信号を前記第1所定量ずつシフトさせる、
付記9の音信号変換方法。
(付記11)
前記類似度は、相互相関係数である、付記8〜付記10の何れかの音信号変換方法。
(付記12)
前記第1シフト信号及び第2シフト信号を生成する際の位相のシフト量から推定される、前記MS方式マイクに対する音源の仰角が所定範囲内である場合に前記近似変換を行う、
付記8〜付記11の何れかの音信号変換方法。
(付記13)
MS方式マイクのMチャネルの音信号の位相、または、前記MS方式マイクのSチャネルの正チャネルの音信号の位相と前記Sチャネルの負チャネルの音信号の位相とに基づいて、前記Mチャネル及び前記正チャネルへの音の到達距離の差による位相差を解消する第1シフト信号、及び前記Mチャネル及び前記負チャネルへの音の到達距離の差による位相差を解消する第2シフト信号を生成する生成部と、
前記第1シフト信号または前記第2シフト信号を、XY方式マイクのLチャネル及びRチャネル信号に近似変換する変換部と、
を含む音信号変換装置。
(付記14)
選択部をさらに含み、
前記選択部は、前記第1シフト信号及び前記第2シフト信号の各々が前記正チャネルの音信号の位相及び前記負チャネルの音信号の位相に基づいて生成される場合、前記第1シフト信号との類似度及び前記第2シフト信号との類似度のうち、類似度が大きい方のチャネルの音信号を第1選択信号として選択し、
前記変換部は、前記第1選択信号が前記正チャネルの音信号である場合、前記第1シフト信号と前記第1選択信号とを、XY方式マイクのLチャネル及びRチャネルの音信号に近似変換し、前記第1選択信号が前記負チャネルの音信号である場合、前記第2シフト信号と前記第1選択信号とを、XY方式マイクのLチャネル及びRチャネルの音信号に近似変換し、
前記選択部は、前記第1シフト信号及び前記第2シフト信号が前記Mチャネルの位相に基づいて生成される場合、前記第1シフト信号及び前記第2シフト信号のうち、前記Mチャネルの音信号との類似度が大きい方のシフト信号を第2選択信号として選択し、
前記変換部は、前記Mチャネルの音信号と前記第2選択信号とを、前記XY方式マイクのLチャネル及びRチャネル信号に近似変換する、
付記13の音声信号変換装置。
(付記15)
前記生成部は、
前記Mチャネルの音信号と、位相を所定範囲内で第1所定量ずつシフトした位相毎に前記正チャネルの音信号との類似度を算出し、前記類似度が最大となる位相の位相量だけ前記正チャネルの音信号をシフトさせて、前記第1シフト信号を生成し、前記Mチャネルの音信号と、前記位相を前記所定範囲内で前記第1所定量ずつシフトした位相毎に前記負チャネルの音信号との類似度を算出し、前記類似度が最大となる位相量だけ前記負チャネルの音信号をシフトさせて、前記第2シフト信号を生成するか、
前記正チャネルの音信号と、位相を前記所定範囲内で第1所定量ずつシフトした位相毎に前記Mチャネルの音信号との類似度を算出し、前記類似度が最大となる位相量だけ前記Mチャネルの音信号をシフトさせて、前記第1シフト信号を生成し、前記負チャネルの音信号と、前記位相を前記所定範囲内で第1所定量ずつシフトした位相毎に前記Mチャネルの音信号との類似度を算出し、前記類似度が最大となる位相量だけ前記Mチャネルの音信号をシフトさせて、前記第2シフト信号を生成する、
付記14の音信号変換装置。
(付記16)
前記生成部は、
前記Mチャネルの音信号と位相を進み方向に第2所定量シフトした前記正チャネルの音信号との類似度、及び、前記Mチャネルの音信号と位相を遅れ方向に前記第2所定量シフトした前記正チャネルの音信号との類似度を算出し、前記類似度が大きい方向に前記正チャネルの音信号を前記第1所定量ずつシフトさせ、前記Mチャネルの音信号と位相を進み方向に第2所定量シフトした前記負チャネルの音信号との類似度、及び、前記Mチャネルの音信号と位相を遅れ方向に前記第2所定量シフトした前記負チャネルの音信号との類似度を算出し、前記類似度が大きい方向に前記負チャネルの音信号を前記第1所定量ずつシフトさせるか、
前記正チャネルの音信号と位相を進み方向に前記第2所定量シフトした前記Mチャネルの音信号との類似度、及び、前記正チャネルの音信号と位相を遅れ方向に前記第2所定量シフトした前記Mチャネルの音信号との類似度を算出し、前記類似度が大きい方向に前記Mチャネルの音信号を前記第1所定量ずつシフトさせ、前記負チャネルの音信号と位相を進み方向に前記第2所定量シフトした前記Mチャネルの音信号との類似度、及び、前記負チャネルの音信号と位相を遅れ方向に前記第2所定量シフトした前記Mチャネルの音信号との類似度を算出し、前記類似度が大きい方向に前記Mチャネルの音信号を前記第1所定量ずつシフトさせる、
付記15に記載の音信号変換装置。
(付記17)
前記類似度は、相互相関係数である、付記14〜付記16の何れかの音信号変換装置。
(付記18)
前記変換部は、
前記第1シフト信号及び第2シフト信号を生成する際の位相のシフト量から推定される、前記MS方式マイクに対する音源の仰角が所定範囲内である場合に前記近似変換を行う、
付記14〜付記17の何れかの音信号変換装置。
20 音信号変換装置
21 補正部
22 変換部
53 位相シフト部
54 類似度算出部
55 信号選択部
61 CPU
62 一次記憶部
63 二次記憶部
Claims (8)
- MS方式マイクのMチャネルの音信号の位相、または、前記MS方式マイクのSチャネルの正チャネルの音信号の位相と前記Sチャネルの負チャネルの音信号の位相とに基づいて、前記Mチャネル及び前記正チャネルへの音の到達距離の差による位相差を解消する第1シフト信号、及び前記Mチャネル及び前記負チャネルへの音の到達距離の差による位相差を解消する第2シフト信号を生成し、
前記第1シフト信号または前記第2シフト信号を、XY方式マイクのLチャネル及びRチャネル信号に近似変換する、
音信号変換処理をコンピュータに実行させるプログラム。 - 前記第1シフト信号及び前記第2シフト信号の各々が前記正チャネルの音信号の位相及び前記負チャネルの音信号の位相に基づいて生成される場合、前記第1シフト信号との類似度及び前記第2シフト信号との類似度のうち、類似度が大きい方のチャネルの音信号を第1選択信号として選択し、
前記第1選択信号が前記正チャネルの音信号である場合、前記第1シフト信号と前記第1選択信号とを、XY方式マイクのLチャネル及びRチャネルの音信号に近似変換し、
前記第1選択信号が前記負チャネルの音信号である場合、前記第2シフト信号と前記第1選択信号とを、XY方式マイクのLチャネル及びRチャネルの音信号に近似変換し、
前記第1シフト信号及び前記第2シフト信号が前記Mチャネルの位相に基づいて生成される場合、前記第1シフト信号及び前記第2シフト信号のうち、前記Mチャネルの音信号との類似度が大きい方のシフト信号を第2選択信号として選択し、
前記Mチャネルの音信号と前記第2選択信号とを、前記XY方式マイクのLチャネル及びRチャネル信号に近似変換する、
請求項1に記載のプログラム。 - 前記Mチャネルの音信号と、位相を所定範囲内で第1所定量ずつシフトした位相毎に前記正チャネルの音信号との類似度を算出し、前記類似度が最大となる位相の位相量だけ前記正チャネルの音信号をシフトさせて、前記第1シフト信号を生成し、前記Mチャネルの音信号と、前記位相を前記所定範囲内で前記第1所定量ずつシフトした位相毎に前記負チャネルの音信号との類似度を算出し、前記類似度が最大となる位相量だけ前記負チャネルの音信号をシフトさせて、前記第2シフト信号を生成するか、
前記正チャネルの音信号と、位相を前記所定範囲内で第1所定量ずつシフトした位相毎に前記Mチャネルの音信号との類似度を算出し、前記類似度が最大となる位相量だけ前記Mチャネルの音信号をシフトさせて、前記第1シフト信号を生成し、前記負チャネルの音信号と、前記位相を前記所定範囲内で第1所定量ずつシフトした位相毎に前記Mチャネルの音信号との類似度を算出し、前記類似度が最大となる位相量だけ前記Mチャネルの音信号をシフトさせて、前記第2シフト信号を生成する、
請求項2に記載のプログラム。 - 前記Mチャネルの音信号と位相を進み方向に第2所定量シフトした前記正チャネルの音信号との類似度、及び、前記Mチャネルの音信号と位相を遅れ方向に前記第2所定量シフトした前記正チャネルの音信号との類似度を算出し、前記類似度が大きい方向に前記正チャネルの音信号を前記第1所定量ずつシフトさせ、前記Mチャネルの音信号と位相を進み方向に第2所定量シフトした前記負チャネルの音信号との類似度、及び、前記Mチャネルの音信号と位相を遅れ方向に前記第2所定量シフトした前記負チャネルの音信号との類似度を算出し、前記類似度が大きい方向に前記負チャネルの音信号を前記第1所定量ずつシフトさせるか、
前記正チャネルの音信号と位相を進み方向に前記第2所定量シフトした前記Mチャネルの音信号との類似度、及び、前記正チャネルの音信号と位相を遅れ方向に前記第2所定量シフトした前記Mチャネルの音信号との類似度を算出し、前記類似度が大きい方向に前記Mチャネルの音信号を前記第1所定量ずつシフトさせ、前記負チャネルの音信号と位相を進み方向に前記第2所定量シフトした前記Mチャネルの音信号との類似度、及び、前記負チャネルの音信号と位相を遅れ方向に前記第2所定量シフトした前記Mチャネルの音信号との類似度を算出し、前記類似度が大きい方向に前記Mチャネルの音信号を前記第1所定量ずつシフトさせる、
請求項3に記載のプログラム。 - 前記類似度は、相互相関係数である、請求項2〜請求項4の何れか1項に記載のプログラム。
- 前記第1シフト信号及び第2シフト信号を生成する際の位相のシフト量から推定される、前記MS方式マイクに対する音源の仰角が所定範囲内である場合に前記近似変換を行う、
請求項2〜請求項5の何れか1項に記載のプログラム。 - コンピュータが、
MS方式マイクのMチャネルの音信号の位相、または、前記MS方式マイクのSチャネルの正チャネルの音信号の位相と前記Sチャネルの負チャネルの音信号の位相とに基づいて、前記Mチャネル及び前記正チャネルへの音の到達距離の差による位相差を解消する第1シフト信号、及び前記Mチャネル及び前記負チャネルへの音の到達距離の差による位相差を解消する第2シフト信号を生成し、
前記第1シフト信号または第2シフト信号を、XY方式マイクのLチャネル及びRチャネルの音信号に近似変換する、
音信号変換方法。 - MS方式マイクのMチャネルの音信号の位相、または、前記MS方式マイクのSチャネルの正チャネルの音信号の位相と前記Sチャネルの負チャネルの音信号の位相とに基づいて、前記Mチャネル及び前記正チャネルへの音の到達距離の差による位相差を解消する第1シフト信号、及び前記Mチャネル及び前記負チャネルへの音の到達距離の差による位相差を解消する第2シフト信号を生成する生成部と、
前記第1シフト信号または第2シフト信号を、XY方式マイクのLチャネル及びRチャネルの音信号に近似変換する変換部と、
を含む音信号変換装置。
Priority Applications (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2019207622A JP2021081533A (ja) | 2019-11-18 | 2019-11-18 | 音信号変換プログラム、音信号変換方法、及び、音信号変換装置 |
US17/062,122 US11463806B2 (en) | 2019-11-18 | 2020-10-02 | Non-transitory computer-readable storage medium for storing sound signal conversion program, method of converting sound signal, and sound signal conversion device |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2019207622A JP2021081533A (ja) | 2019-11-18 | 2019-11-18 | 音信号変換プログラム、音信号変換方法、及び、音信号変換装置 |
Publications (1)
Publication Number | Publication Date |
---|---|
JP2021081533A true JP2021081533A (ja) | 2021-05-27 |
Family
ID=75909806
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2019207622A Pending JP2021081533A (ja) | 2019-11-18 | 2019-11-18 | 音信号変換プログラム、音信号変換方法、及び、音信号変換装置 |
Country Status (2)
Country | Link |
---|---|
US (1) | US11463806B2 (ja) |
JP (1) | JP2021081533A (ja) |
Citations (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2002171590A (ja) * | 2000-11-30 | 2002-06-14 | Aiwa Co Ltd | Ms方式のステレオマイクロホン |
Family Cites Families (11)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPS5434225A (en) * | 1977-08-22 | 1979-03-13 | Sony Corp | Microphone device |
ATE230917T1 (de) * | 1999-10-07 | 2003-01-15 | Zlatan Ribic | Verfahren und anordnung zur aufnahme von schallsignalen |
JP3598932B2 (ja) | 2000-02-23 | 2004-12-08 | 日本電気株式会社 | 話者方向検出回路及びそれに用いる話者方向検出方法 |
FI20055260A0 (fi) * | 2005-05-27 | 2005-05-27 | Midas Studios Avoin Yhtioe | Laite, järjestelmä ja menetelmä akustisten signaalien vastaanottamista tai toistamista varten |
JP2007214913A (ja) * | 2006-02-09 | 2007-08-23 | Yamaha Corp | 収音装置 |
JP4332753B2 (ja) * | 2007-06-13 | 2009-09-16 | ソニー株式会社 | 音声レコーダ |
JP5092864B2 (ja) | 2008-04-17 | 2012-12-05 | ヤマハ株式会社 | 音処理装置およびプログラム |
JP5646146B2 (ja) * | 2009-03-18 | 2014-12-24 | 株式会社東芝 | 音声入力装置、音声認識システム及び音声認識方法 |
US20100331048A1 (en) * | 2009-06-25 | 2010-12-30 | Qualcomm Incorporated | M-s stereo reproduction at a device |
CN102403022A (zh) * | 2010-09-13 | 2012-04-04 | 三洋电机株式会社 | 录音装置、录音条件设定方法以及录音条件设定程序 |
US9456289B2 (en) * | 2010-11-19 | 2016-09-27 | Nokia Technologies Oy | Converting multi-microphone captured signals to shifted signals useful for binaural signal processing and use thereof |
-
2019
- 2019-11-18 JP JP2019207622A patent/JP2021081533A/ja active Pending
-
2020
- 2020-10-02 US US17/062,122 patent/US11463806B2/en active Active
Patent Citations (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2002171590A (ja) * | 2000-11-30 | 2002-06-14 | Aiwa Co Ltd | Ms方式のステレオマイクロホン |
Also Published As
Publication number | Publication date |
---|---|
US11463806B2 (en) | 2022-10-04 |
US20210152927A1 (en) | 2021-05-20 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP4912036B2 (ja) | 指向性集音装置、指向性集音方法、及びコンピュータプログラム | |
US6525993B2 (en) | Speaker direction detection circuit and speaker direction detection method used in this circuit | |
JP5817366B2 (ja) | 音声信号処理装置、方法及びプログラム | |
US9269367B2 (en) | Processing audio signals during a communication event | |
US11659349B2 (en) | Audio distance estimation for spatial audio processing | |
EP1887831A2 (en) | Method, apparatus and program for estimating the direction of a sound source | |
US20140270231A1 (en) | System and method of mixing accelerometer and microphone signals to improve voice quality in a mobile device | |
JP5493611B2 (ja) | 情報処理装置、情報処理方法およびプログラム | |
US8693287B2 (en) | Sound direction estimation apparatus and sound direction estimation method | |
US20090232318A1 (en) | Output correcting device and method, and loudspeaker output correcting device and method | |
JP2010124370A (ja) | 信号処理装置、信号処理方法、および信号処理プログラム | |
US20080120100A1 (en) | Method For Detecting Target Sound, Method For Detecting Delay Time In Signal Input, And Sound Signal Processor | |
JP5459220B2 (ja) | 発話音声検出装置 | |
JP6436180B2 (ja) | 収音装置、プログラム及び方法 | |
Archer-Boyd et al. | Biomimetic direction of arrival estimation for resolving front-back confusions in hearing aids | |
JP2021081533A (ja) | 音信号変換プログラム、音信号変換方法、及び、音信号変換装置 | |
US10951978B2 (en) | Output control of sounds from sources respectively positioned in priority and nonpriority directions | |
JP2018032931A (ja) | 音響信号処理装置、プログラム及び方法 | |
US10360922B2 (en) | Noise reduction device and method for reducing noise | |
US11276388B2 (en) | Beamforming system based on delay distribution model using high frequency phase difference | |
JP2019197179A (ja) | 発声方向判定プログラム、発声方向判定方法、及び、発声方向判定装置 | |
US11915681B2 (en) | Information processing device and control method | |
JP2020201370A (ja) | 話者方向判定プログラム、話者方向判定方法、及び話者方向判定装置 | |
JPH02178699A (ja) | 音声認識装置 | |
JP6128547B2 (ja) | 音源分離方法、装置及びプログラム |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20220708 |
|
RD03 | Notification of appointment of power of attorney |
Free format text: JAPANESE INTERMEDIATE CODE: A7423 Effective date: 20230206 |
|
RD04 | Notification of resignation of power of attorney |
Free format text: JAPANESE INTERMEDIATE CODE: A7424 Effective date: 20230206 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20230530 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20230606 |
|
A02 | Decision of refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A02 Effective date: 20231128 |