WO2019097598A1 - 収音再生装置並びにプログラム及び記録媒体 - Google Patents

収音再生装置並びにプログラム及び記録媒体 Download PDF

Info

Publication number
WO2019097598A1
WO2019097598A1 PCT/JP2017/041052 JP2017041052W WO2019097598A1 WO 2019097598 A1 WO2019097598 A1 WO 2019097598A1 JP 2017041052 W JP2017041052 W JP 2017041052W WO 2019097598 A1 WO2019097598 A1 WO 2019097598A1
Authority
WO
WIPO (PCT)
Prior art keywords
signal
signals
axis
microphone
microphones
Prior art date
Application number
PCT/JP2017/041052
Other languages
English (en)
French (fr)
Inventor
智治 粟野
木村 勝
訓 古田
仁 平野
敦仁 矢野
信秋 田中
Original Assignee
三菱電機株式会社
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 三菱電機株式会社 filed Critical 三菱電機株式会社
Priority to US16/643,654 priority Critical patent/US11245981B2/en
Priority to PCT/JP2017/041052 priority patent/WO2019097598A1/ja
Priority to JP2019554088A priority patent/JP6742535B2/ja
Publication of WO2019097598A1 publication Critical patent/WO2019097598A1/ja

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04RLOUDSPEAKERS, MICROPHONES, GRAMOPHONE PICK-UPS OR LIKE ACOUSTIC ELECTROMECHANICAL TRANSDUCERS; DEAF-AID SETS; PUBLIC ADDRESS SYSTEMS
    • H04R1/00Details of transducers, loudspeakers or microphones
    • H04R1/20Arrangements for obtaining desired frequency or directional characteristics
    • H04R1/32Arrangements for obtaining desired frequency or directional characteristics for obtaining desired directional characteristic only
    • H04R1/40Arrangements for obtaining desired frequency or directional characteristics for obtaining desired directional characteristic only by combining a number of identical transducers
    • H04R1/406Arrangements for obtaining desired frequency or directional characteristics for obtaining desired directional characteristic only by combining a number of identical transducers microphones
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10KSOUND-PRODUCING DEVICES; METHODS OR DEVICES FOR PROTECTING AGAINST, OR FOR DAMPING, NOISE OR OTHER ACOUSTIC WAVES IN GENERAL; ACOUSTICS NOT OTHERWISE PROVIDED FOR
    • G10K11/00Methods or devices for transmitting, conducting or directing sound in general; Methods or devices for protecting against, or for damping, noise or other acoustic waves in general
    • G10K11/18Methods or devices for transmitting, conducting or directing sound
    • G10K11/26Sound-focusing or directing, e.g. scanning
    • G10K11/34Sound-focusing or directing, e.g. scanning using electrical steering of transducer arrays, e.g. beam steering
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04RLOUDSPEAKERS, MICROPHONES, GRAMOPHONE PICK-UPS OR LIKE ACOUSTIC ELECTROMECHANICAL TRANSDUCERS; DEAF-AID SETS; PUBLIC ADDRESS SYSTEMS
    • H04R3/00Circuits for transducers, loudspeakers or microphones
    • H04R3/005Circuits for transducers, loudspeakers or microphones for combining the signals of two or more microphones
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04RLOUDSPEAKERS, MICROPHONES, GRAMOPHONE PICK-UPS OR LIKE ACOUSTIC ELECTROMECHANICAL TRANSDUCERS; DEAF-AID SETS; PUBLIC ADDRESS SYSTEMS
    • H04R2201/00Details of transducers, loudspeakers or microphones covered by H04R1/00 but not provided for in any of its subgroups
    • H04R2201/40Details of arrangements for obtaining desired directional characteristic by combining a number of identical transducers covered by H04R1/40 but not provided for in any of its subgroups
    • H04R2201/4012D or 3D arrays of transducers
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04RLOUDSPEAKERS, MICROPHONES, GRAMOPHONE PICK-UPS OR LIKE ACOUSTIC ELECTROMECHANICAL TRANSDUCERS; DEAF-AID SETS; PUBLIC ADDRESS SYSTEMS
    • H04R2430/00Signal processing covered by H04R, not provided for in its groups
    • H04R2430/20Processing of the output signals of the acoustic transducers of an array for obtaining a desired directivity characteristic
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04SSTEREOPHONIC SYSTEMS 
    • H04S2400/00Details of stereophonic systems covered by H04S but not provided for in its groups
    • H04S2400/15Aspects of sound capture and related signal processing for recording or reproduction
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04SSTEREOPHONIC SYSTEMS 
    • H04S2420/00Techniques used stereophonic systems covered by H04S but not provided for in its groups
    • H04S2420/11Application of ambisonics in stereophonic audio systems
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04SSTEREOPHONIC SYSTEMS 
    • H04S3/00Systems employing more than two channels, e.g. quadraphonic
    • H04S3/008Systems employing more than two channels, e.g. quadraphonic in which the audio signals are in digital form, i.e. employing more than two discrete digital channels

Definitions

  • the present invention relates to a sound collection and reproduction apparatus.
  • the present invention generates, for example, bi-directional signals and omni-directional signals in a plurality of mutually different orthogonal directions from audio signals obtained by sound collection by a plurality of omnidirectional microphones, and reproduces a sound field.
  • a sound collecting and reproducing apparatus for Bidirectional components in different directions are used, for example, as X, Y, Z components of the ambisonic B-format, and omnidirectional components are used, for example, as the W component of the ambisonic B-format.
  • the present invention also relates to a program for causing a computer to execute processing of sound collection reproduction in a sound collection reproduction apparatus, and a recording medium recording the program.
  • the sound collection and reproduction apparatus is a technology for specifying the direction of arrival of sound and reproducing the sound according to the direction of arrival of sound.
  • Such a sound collection and reproduction apparatus is used, for example, to reproduce a change in the sound field when the listener's head rotates. For example, when a listener watching a sport on television rotates his head, the reproduced sound from the speaker is changed to reproduce a change in the direction of arrival of the sound accompanying the rotation.
  • Ambisonics is known as one of such three-dimensional sound techniques.
  • an Ambisonic A-format signal is generally acquired using a special microphone called an Ambisonics microphone, and then converted into an Ambisonic B-format signal (Non-Patent Document 1).
  • Examples of ambisonic microphones include TetraMic (Core Sound) and SPS 200 (SoundField).
  • Non-Patent Document 1 In order to carry out the method of Non-Patent Document 1, a special microphone is required, which is expensive. In addition, there is a problem that there is no freedom in the arrangement of the microphones.
  • the invention is capable of producing a plurality of different orthogonally directed bi-directional and omni-directional signals without the use of special microphones and without undue restrictions on the placement of the microphones. It aims at providing a reproduction device.
  • the sound pickup and reproduction apparatus is A microphone array, a processing circuit, and an audio output unit;
  • the microphone array includes first and second microphones disposed on the first of the first, second and third axes orthogonal to one another, and the first and second microphones being stretched on the first and second axes.
  • a third microphone disposed at a position other than the first axis and a position on the third axis other than the plane stretched by the first and second axes.
  • a fourth microphone and The processing circuit Based on the signals obtained by the first to fourth microphones, bi-directional signals in first, second and third directions orthogonal to each other and omnidirectional signals are generated.
  • the sound pickup and reproduction apparatus is A microphone array, a processing circuit, and an audio output unit;
  • the microphone array extends on a horizontal plane, and the first and second microphones disposed on the first of the first and second axes orthogonal to each other, and the microphone on the horizontal plane And a third microphone disposed at a position other than the first axis,
  • the processing circuit Bi-directional signals in first and second directions parallel to the horizontal plane and orthogonal to each other based on signals obtained by the first, second and third microphones, and omnidirectional Generate sexual signals and
  • a drive signal is generated from the generated bi-directional signal and the omnidirectional signal, and the audio output unit is driven by the drive signal.
  • the present invention it is possible to generate a plurality of mutually different orthogonally directed bi-directional and omni-directional signals without using special microphones and without excessive restriction on the arrangement of the microphones. .
  • FIG. 2 is a diagram showing an example of arrangement of a plurality of microphones constituting a microphone array used in the sound collection and reproduction apparatus according to the first embodiment.
  • FIG. 5 is a diagram showing a microphone used for generating a bi-directional signal in the x-axis direction and a bi-directional signal in the y-axis direction among the microphones shown in FIG. 3.
  • FIG. 3 is a diagram showing a microphone used for generating a bi-directional signal in the x-axis direction and a bi-directional signal in the y-axis direction among the microphones shown in FIG. 3.
  • FIG. 5 is a diagram showing a microphone used for generating a bi-directional signal in the z-axis direction among the microphones shown in FIG. 3. It is a figure which shows the bi-directionality which X signal of ambisonic B-format has. It is a figure which shows the bi-directionality which the Y signal of ambisonic B-format has. It is a figure which shows the bi-directionality which Z signal of ambisonic B-format has. It is a figure which shows the omnidirectionality which W signal of ambisonic B-format has. It is a block diagram which shows the structural example of the processing circuit of FIG. It is a block diagram which shows the structural example of the format conversion part of FIG.
  • FIG. 16 is a block diagram showing an example of configuration of a processing circuit of a sound collection and reproduction apparatus according to a third embodiment. It is a block diagram which shows the structural example of the format conversion part of FIG.
  • FIG. 18 is a block diagram showing an example of configuration of a processing circuit of a sound collection and reproduction apparatus according to a fourth embodiment.
  • (A) And (b) is a flowchart which shows the procedure of the process in the processing circuit of the sound collection reproducing apparatus of Embodiment 4.
  • FIG. 1 shows a configuration example of a sound collection and reproduction apparatus according to a first embodiment of the present invention.
  • the illustrated sound collection and reproduction apparatus has a microphone array 2, a processing circuit 4, a storage device 6, and an audio output unit 8.
  • the functions of the processing circuit 4 of FIG. 1 can be realized not only by hardware but also by using software.
  • a configuration example of the sound collection and reproduction apparatus in the case of software implementation is shown in FIG.
  • the processing circuit 4 of FIG. 1 is configured by the processor 401 and the program memory 402 of FIG. 2, and the processor 401 operates as the processing circuit 4 of FIG. 1 by performing operations according to the program stored in the program memory 402. Do.
  • the storage device 6 may be configured by an HDD (hard disk drive), an SSD (solid state drive), or the like.
  • the storage device 6 may be directly connected to the processing circuit 4 or may be connected via a network. .
  • voice is picked up by the microphone array 2, and a voice signal (pickup signal) outputted from the microphone array 2 is inputted to the processing circuit 4.
  • the processing circuit 4 performs signal processing on the input collected sound signal to convert it into a plurality of bi-directional signals and omni-directional signals.
  • the plurality of bi-directional signals are bi-directional signals in directions orthogonal to each other.
  • the processing circuit 4 records the signal (conversion signal) generated by the conversion.
  • the processing circuit 4 generates an audio signal (drive signal) suitable for the audio output unit 8 from the recorded conversion signal, and supplies the audio signal to the audio output unit 8.
  • the audio output unit 8 outputs an audio based on the supplied drive signal.
  • FIG. 3 shows an example of the arrangement of a plurality of microphones constituting the microphone array 2 in the present embodiment.
  • the microphone array 2 comprises four nondirectional microphones Ma to Md.
  • These microphones Ma to Md are arranged as follows. First, in a space in which the microphones Ma to Md are arranged, three axes orthogonal to one another are defined as an x axis, a y axis, and a z axis. These three axes form an xyz coordinate system whose origin is the intersection of these three axes. Of these axes, the x-axis and y-axis are horizontal axes, and the z-axis is a vertical axis.
  • two microphones Ma and Mb are disposed on one of the horizontal axes, for example, the x-axis.
  • one microphone Mc is disposed at a position other than the x axis on a plane (xy plane) stretched by the x axis and the y axis.
  • one microphone Md is disposed at a position other than the xy plane on the z axis.
  • the microphones Ma to Md being arranged in this manner, the microphones Ma, Mb and Mc are located on the xy plane as shown in FIG. 4 and the microphones Ma, Mb and Md are shown on FIG. , Will be located on the xz plane.
  • Voices are picked up by the microphones Ma to Md arranged in this way, and voice signals (pickup signals) Aa to Ad obtained by picking up the sound are inputted to the processing circuit 4.
  • the processing circuit 4 generates bi-directional signals in different directions and omnidirectional signals based on the input sound pickup signals Aa to Ad. These signals are sometimes referred to as converted signals for convenience. Bidirectional signals in different directions are used as, for example, X signals, Y signals and Z signals in ambisonic B-format, and omnidirectional signals are used as W signals in ambisonic B-format, for example. .
  • FIGS. 6, 7 and 8 show the bi-directionality of X signals, Y signals and Z signals of Ambisonic B-format.
  • FIG. 9 shows the omnidirectionality of the W signal of Ambisonic B-format.
  • the processing circuit 4 of FIG. 1 includes an input processing unit 10, a format conversion unit 20, a writing unit 30, a reading unit 40, and a reproduction processing unit 50.
  • the input processing unit 10 receives the audio signals Aa to Ad from the microphones Ma to Md of the microphone array 2 and performs processing such as amplification and A / D conversion, and as a result of these processing, corresponds to the signals Aa to Ad, respectively.
  • Signal (signal after input processing) Ba to Bd are generated and output.
  • the signal Aa and the signal Ba are both audio signals obtained by sound collection with the microphone Ma.
  • both the signal Ab and the signal Bb are audio signals obtained by sound collection by the microphone Mb.
  • both the signal Ac and the signal Bc are audio signals obtained by sound collection by the microphone Mc.
  • the signal Ad and the signal Bd are both audio signals obtained by sound collection by the microphone Md.
  • the format conversion unit 20 includes a bi-directionality generation unit 22 and an omnidirectionality generation unit 24.
  • Bidirectional generator 22 uses bi-directional signals (X signal) Cx in the x-axis direction and bi-directional signals in the y-axis direction using signals Ba to Bd obtained by sound collection by microphones Ma to Md.
  • X signal Cx in the x-axis direction
  • Y signal Cy
  • Z signal a bi-directional signal
  • the bi-directional X signal Cx in the x-axis direction may be generated using the signals Ba, Bb, and Bd obtained by sound collection by the microphones Ma, Mb, and Md located on the xz plane.
  • a bi-directional signal in the direction of a certain axis may be generated using a sound collection signal obtained by sound collection by a microphone located on a plane including the axis.
  • bi-directional signals are generated in the direction of the axis located on the plane. . If the microphone arrangement is arranged at the vertex of a regular tetrahedron, for example, it is impossible to generate bi-directional signals in directions orthogonal to each other.
  • the generation of the X signal Cx, the Y signal Cy and the Z signal Cz can be performed by beam forming.
  • the beamformer output when the beam direction is directed to the x-axis in beamforming is used as the X signal Cx
  • the beam is directed to the y-axis in beamforming
  • the output of the former is used as the Y signal Cy
  • the output of the beam former when the direction of the beam is directed to the z-axis in beam forming is used as the Z signal Cz.
  • the X signal Cx, the Y signal Cy, and the Z signal Cz obtained as described above are used as an X signal, an Y signal, and a Z signal in the ambisonic-B format, respectively.
  • the algorithm of the beamforming process may be any.
  • the method described in Non-Patent Document 2 may be used.
  • Non-Patent Document 2 shows that the coefficients of the filter at the time of beamforming may be determined according to equation (3.2) on page 12.
  • the direction of bi-directionality can be freely determined in the plane in which the three microphones are arranged, for example, two directions orthogonal to each other (for example, in the plane) Bi-directional signals can be generated with each of the x direction and the y direction) as the main axis direction. Two microphones can generate bi-directional signals, but only in one direction.
  • the omnidirectionality generation unit 24 uses any one of the signals Ba to Bd obtained by the sound collection by the four microphones Ma to Md, or a combination of two or more of the signals Ba to Bd. To generate an omnidirectional signal (W signal) Cw (FIG. 15). When any one of the signals Ba to Bd is used, the signal can be used as the W signal Cw as it is. When a combination of two or more of the signals Ba to Bd is used, for example, the output of the beamformer when the omnidirectionality is generated by the beamforming process using a combination of these signals can be used as the W signal Cw.
  • the W signal Cw obtained as described above is used as a W signal of ambisonic-B format.
  • the writing unit 30 records the X signal Cx, the Y signal Cy, the Z signal Cz, and the W signal Cw generated by the format conversion unit 20 in the storage device 6.
  • the storage unit 6 stores the recorded signal.
  • the recorded signals Cx, Cy, Cz and Cw are read out, and an audio signal (drive signal) suitable for the audio output unit 8 is generated.
  • the reading unit 40 reads the signals Cx, Cy, Cz and Cw stored in the storage device 6.
  • the reproduction processing unit 50 generates and outputs signals (drive signals) Da, Db, Dc,... Of a format suitable for the audio output unit 8 based on the read signals Cx, Cy, Cz and Cw.
  • the conversion into drive signals Da, Db, Dc,... Can be performed, for example, according to the general Ambisonic B-format reproduction method described in Non-Patent Document 1.
  • the signals Cx, Cy, Cz and Cw are used as X signals, Y signals, Z signals and W signals of Ambisonic B-format, respectively.
  • a signal used to drive each speaker is generated.
  • driving signals are generated by multiplying coefficients Cx, Cy, Cz and Cw of Ambisonic B-format X, Y, Z and W, and adding them to generate a driving signal, which is used for driving each speaker.
  • the X signal, Y signal, Z signal and W signal (conversion signal) Cx, Cy, Cz, Cw are generated and stored, and at the time of reproduction, the drive signal is generated from the stored conversion signal.
  • conversion signal conversion signal
  • step ST101 the microphones Ma to Md perform sound collection, and the sound collection signals Aa to Ad are supplied to the processing circuit 4.
  • step ST102 the processing circuit 4 performs an input process on the collected sound signals Aa to Ad, and generates signals Ba to Bd after the input process.
  • step ST103 the processing circuit 4 generates an X signal Cx, a Y signal Cy and a Z signal Cz from the signals Ba to Bd.
  • step ST104 the processing circuit 4 generates the W signal Cw from any one of the signals Ba to Bd or from a combination of two or more of the signals Ba to Bd.
  • step ST105 the processing circuit 4 writes the signals (conversion signals) Cx, Cy, Cz and Cw generated at steps ST103 and ST104 to the storage device 6 and stores them.
  • the processing circuit 4 reads the converted signals Cx, Cy, Cz and Cw stored in the storage device 6.
  • the processing circuit 4 generates drive signals Da, Db, Dc,... Using the read conversion signals Cx, Cy, Cz and Cw.
  • the processing circuit 4 drives the speaker of the audio output unit 8 with the generated drive signals Da, Db, Dc,.
  • the x axis and the y axis are axes in the horizontal direction
  • the z axis is an axis in the vertical direction
  • the microphones Ma and Mb are arranged on the x axis.
  • the microphone Mc is disposed at a position other than the x-axis
  • the microphone Md is disposed on the z-axis to form a bi-directional signal in the x-axis direction, the y-axis direction, and the z-axis direction.
  • the above x-axis, y-axis and z-axis can be interchanged.
  • the first and second microphones Ma and Mb are arranged on a first axis (for example, the x-axis) of the first, second and third axes (x-axis, y-axis and z-axis) orthogonal to each other.
  • the third microphone Mc is disposed at a position other than the first axis (x axis) on a plane (xy plane) stretched by the first and second axes (for example, y axis).
  • the fourth microphone Md may be disposed on the axis (z axis) of
  • a bi-directional signal in a first direction (x direction) and a second direction signals in the y direction) are generated, and audio signals obtained by sound collection by the first, second and fourth microphones Ma, Mb and Md are used to generate dual signals in the third direction (z direction). It is sufficient if directional signals are generated.
  • the axis on which the plurality of microphones are arranged may not coincide with the direction of the formed bi-directionality.
  • the axes used as the reference in the arrangement of the microphones are the first, second and third axes (f, g and h axes), and the direction of the formed bi-directionality is the first, second and third directions (the Assuming that x, y and z directions), the arrangement of the microphones and the microphones used to generate bi-directionality in each direction may satisfy the following relationship.
  • the first and second microphones (Ma and Mb) are disposed on the first axis (for example, the f axis) of the three axes (f, g and h axes) orthogonal to one another.
  • the third microphone (Mc) is disposed at a position other than the first axis (f axis) on a plane (fg plane) stretched by the second axis (for example, the f and g axes), and the third axis
  • the fourth microphone (Md) is disposed at a position on the h axis) and outside the plane (fg plane) stretched by the first and second axes.
  • A2 First, second, and third directions (for example, x, y, and z) orthogonal to one another by using audio signals obtained by collecting sound by the first to fourth microphones (Ma to Md) Bi-directional signals are generated.
  • one of the first, second, and third axes (f, g, and h axes) (for example, the h axis) is an axis in the vertical direction, and the first, second, and third directions
  • One of the (x, y and z directions) (for example, the z direction) is the vertical direction.
  • the third axis (h axis) is an axis in the vertical direction
  • the third direction (z direction) is the vertical direction. Therefore, the first and second axes (f and g axes) are axes extending on a horizontal plane, and the first and second directions (x and y directions) are parallel to the horizontal plane.
  • bi-directional signals in three directions orthogonal to each other can be generated by a combination of inexpensive nondirectional microphones.
  • the microphone arrangement only needs to satisfy the above conditions, and there is no restriction on the distance between the microphones. Therefore, it can be a compact microphone set, and can be attached to a small device (mobile phone, smart phone, wearable device, etc.).
  • the second embodiment is different from the first embodiment in the configuration of the microphone array and the configuration of the processing circuit. That is, in the second embodiment, the microphone array 2b shown in FIG. 17 is used instead of the microphone array 2 of the first embodiment, and the processing circuit 4b of FIG. 18 is used instead of the processing circuit 4 of the first embodiment. Is used.
  • FIG. 17 shows the arrangement of microphones constituting the microphone array 2b of the sound collection and reproduction apparatus of the second embodiment
  • FIG. 18 shows the processing circuit 4b of the sound collection and reproduction apparatus of the second embodiment.
  • FIGS. 17 and 18 the same reference numerals as in FIGS. 1 and 3 denote the same.
  • the microphone array 2b includes five microphones Ma to Me. Among them, the microphones Ma to Md are arranged as in the first embodiment.
  • the microphone Me is disposed at the intersection of the x axis, the y axis and the z axis, that is, at the origin of the xyz coordinate system, and is a nondirectional microphone like the microphones Ma to Md.
  • the processing circuit 4b used in the second embodiment has an input processing unit 10b, a format conversion unit 20b, a writing unit 30, a reading unit 40, and a reproduction processing unit 50, as shown in FIG.
  • the writing unit 30, the reading unit 40, and the reproduction processing unit 50 are the same as those described in the first embodiment.
  • the input processing unit 10b receives the collected sound signals Aa to Ae from the microphones Ma to Me of the microphone array 2b, performs processing such as amplification and A / D conversion, and as a result of these processing, the signals Aa to Ae are generated.
  • the corresponding signals Ba to Be after input processing are generated and output.
  • the signals Ba to Be after the input processing can also be said to be signals obtained by sound collection with the microphones Ma to Me as in the first embodiment.
  • the format conversion unit 20b includes a bi-directionality generation unit 22b and an omnidirectionality generation unit 24b.
  • the bi-directionality generation unit 22b uses the signals Ba, Bb, Bc, and Be obtained by sound collection with the microphones Ma, Mb, Mc, and Me (FIG. 17) to generate an X signal Cx (FIG. 12) and a Y signal Cy. (FIG. 13) is generated, and the signals Ba, Bb, Bd and Be obtained by the microphones Ma, Mb, Md and Me (FIG. 17) are used to generate the Z signal Cz (FIG. 14). Since the bi-directional signal is generated also using the microphone Me arranged at the origin, a sharper directional signal can be generated.
  • the omnidirectionality generation unit 24b outputs a signal Be obtained by sound collection by the microphone Me as a W signal Cw. Since the signal Be obtained by sound collection by the microphone Me disposed at the origin is used as it is as the W signal Cw, signal deterioration due to processing such as beam forming can be avoided.
  • the writing unit 30 b records the X signal Cx, the Y signal Cy, the Z signal Cz, and the W signal Cw generated by the format conversion unit 20 b in the storage device 6.
  • the storage device 6 stores the recorded X signal Cx, Y signal Cy, Z signal Cz and W signal Cw.
  • the process of reproducing the recorded sound is the same as that described in the first embodiment.
  • the x-axis, the y-axis and the z-axis can be interchanged.
  • the first and second microphones Ma and Mb are arranged on a first axis (for example, the x-axis) of the first, second and third axes (x-axis, y-axis and z-axis) orthogonal to each other.
  • the third microphone Mc is disposed at a position other than the first axis (x axis) on a plane (xy plane) stretched by the first and second axes (for example, y axis).
  • the fourth microphone Md may be disposed on the axis (z axis) of and the fourth microphone may be disposed at the intersection of the first, second, and third axes.
  • a bi-directional signal in the first direction (x direction) and A bi-directional signal in the second direction (y direction) is generated, and an audio signal obtained by collecting sound by the first, second, fourth and fifth microphones Ma, Mb, Md and Me is used.
  • a bi-directional signal in the third direction (z direction) may be generated.
  • the axis on which the plurality of microphones are arranged may not be the same as the direction of the bi-directionality to be formed.
  • the axes used as the reference in the arrangement of the microphones are the first, second and third axes (f, g and h axes), and the direction of the formed bi-directionality is the first, second and third directions (the Assuming that x, y and z directions), the arrangement of the microphones and the microphones used to generate bi-directionality in each direction may satisfy the following relationship.
  • the first and second microphones (Ma and Mb) are disposed on a first axis (for example, the f axis) of three axes (f, g and h axes) orthogonal to one another.
  • the third microphone (Mc) is disposed at a position other than the first axis (f axis) on a plane (fg plane) stretched by the second axis (for example, the f and g axes), and the third axis
  • the fourth microphone (Md) is disposed at a position on the h axis) and outside the plane (fg plane) stretched by the first and second axes, and the first, second and third microphones
  • a fifth microphone (Me) is arranged at the intersection of the axes.
  • B2 First, second, and third directions (for example, x, y, and z) orthogonal to one another by using audio signals obtained by the first to fifth microphones (Ma to Me). Bi-directional signals are generated.
  • the first and second directions are detected using the audio signals obtained by the first, second, third and fifth microphones (Ma, Mb, Mc and Me). And y) bi-directional signals are generated.
  • B2b Using the audio signal obtained by the first, second, fourth and fifth microphones (Ma, Mb, Md and Me) to pick up, the bi-directional in the third direction (z direction) Sexual signals are generated.
  • first, second, and third axes (f, g, and h axes) (for example, the h axis) is an axis in the vertical direction, and the first, second, and third directions (x , Y and z directions) (for example, the z direction) is the vertical direction.
  • the third axis (h axis) is an axis in the vertical direction
  • the third direction (z direction) is the vertical direction. Therefore, the first and second axes (f and g axes) are axes extending on a horizontal plane, and the first and second directions (x and y directions) are parallel to the horizontal plane.
  • the third embodiment is different from the first embodiment in the configuration of the microphone array and the configuration of the processing circuit. That is, in the third embodiment, the microphone array 2c shown in FIG. 20 is used instead of the microphone array 2 of the first embodiment, and the processing circuit 4c of FIG. 21 is used instead of the processing circuit 4 of the first embodiment. Is used.
  • FIG. 20 shows the arrangement of the microphones constituting the microphone array 2 of the sound collection and reproduction apparatus of the third embodiment, and FIG. 21 shows the processing circuit 4c of the sound collection and reproduction apparatus of the second embodiment.
  • FIGS. 20 and 21 the same reference numerals as in FIGS. 1 and 3 indicate the same.
  • the microphone array 2c includes three microphones Ma, Mb and Mc, and the microphone Md of the first embodiment is not used.
  • the x axis and the y axis are axes extending in the horizontal direction, and accordingly, the plane stretched by the x axis and the y axis is a horizontal plane.
  • Microphones Ma, Mb and Mc are arranged in the same manner as in the first embodiment. That is, two microphones Ma and Mb are disposed on the x-axis (FIG. 20). Also, one microphone Mc is disposed at a position other than the x-axis on the xy plane.
  • the processing circuit 4c used in the third embodiment has an input processing unit 10c, a format conversion unit 20c, a writing unit 30c, a reading unit 40c, and a reproduction processing unit 50c.
  • the input processing unit 10c receives the collected sound signals Aa to Ac from the microphones Ma to Mc of the microphone array 2c, performs processing such as amplification and A / D conversion, and as a result of these processing, the signals Aa to Ac are respectively generated. It generates and outputs the corresponding post-input processing signals Ba to Bc.
  • the format conversion unit 20c includes a bi-directionality generation unit 22c and an omnidirectionality generation unit 24c.
  • the bi-directionality generation unit 22c uses the signals Ba, Bb, Bc and Be obtained by the sound collection by the microphones Ma, Mb and Mc (FIG. 20) to generate an X signal Cx (FIG. 12) and a Y signal Cy (figure 13) Generate.
  • the omnidirectionality generation unit 24 c uses any one of the signals Ba, Bb, and Bc obtained by the sound collection by the three microphones Ma, Mb, and Mc, or uses one of the signals Ba, Bb, and Bc.
  • the W signal Cw is generated using two or more combinations of (1) (FIG. 15).
  • the signal can be used as it is as the W signal Cw.
  • the output of the beamformer when the omnidirectionality is generated by the beamforming process using the combination of signals can be used as the W signal Cw.
  • the Z signal Cz is not generated.
  • the writing unit 30 c records the X signal Cx, the Y signal Cy, and the W signal Cw generated by the format conversion unit 20 c in the storage device 6.
  • the storage unit 6 stores the recorded signal.
  • the recorded signals Cx, Cy and Cw are read out, and an audio signal (drive signal) suitable for the audio output unit 8 is generated.
  • the reading unit 40 reads the signals Cx, Cy and Cw stored in the storage device 6.
  • the reproduction processing unit 50 converts the read signals Cx, Cy and Cw into signals (drive signals) Da, Db, Dc,... Of a format suitable for the audio output unit 8 and outputs the signals.
  • the conversion into drive signals Da, Db, Dc,... Can be performed, for example, by the general Ambisonic B-format reproduction method described in Non-Patent Document 1.
  • the signals Cx, Cy and Cw are used as X signals, Y signals and W signals of the ambisonic B-format, respectively. Also, calculation is performed with Z signal of ambisonic B-format being zero.
  • a signal used to drive each speaker is generated.
  • a drive signal is generated by multiplying coefficients X, Y and W signals Cx, Cy and Cw of Ambisonic B-format and adding them, and used to drive each speaker.
  • a bi-directional signal in the vertical direction is not generated.
  • localization in the vertical direction can not be performed, and localization only in the azimuth direction is possible.
  • the configuration of the third embodiment can be used in such a case.
  • the third embodiment has the advantage that the microphone array is relatively small.
  • the x axis and the y axis are horizontal axes
  • the microphones Ma and Mb are arranged on the x axis
  • the microphone Mc is at a position other than the x axis on the xy plane. They are arranged to form bi-directional signals in the x-axis and y-axis directions.
  • the above x-axis and y-axis can be interchanged.
  • the first and second microphones Ma and Mb are disposed on the first axis (for example, the x-axis) of the first and second axes (x-axis and y-axis) orthogonal to each other.
  • the third microphone Mc may be disposed at a position other than the first axis (x axis) on a plane (xy plane) stretched by the second axis (for example, y axis).
  • the x axis and the y axis are axes extending in the horizontal direction.
  • the axis on which the plurality of microphones are arranged may not coincide with the direction of the bi-directionality to be formed.
  • the reference axes in the arrangement of the microphones are the first and second axes (f and g axes)
  • the directions of the formed bidirectivity are the first and second directions (x and y directions).
  • the arrangement of the microphones and the microphones used to generate bi-directionality in each direction may satisfy the following relationship.
  • the first and second microphones (Ma, Mb) are provided on a first axis (for example, the f-axis) of two axes (f-axis and g-axis) extending on a horizontal plane and orthogonal to each other
  • the third microphone (Mc) is disposed at a position other than the first axis (f axis) on the horizontal plane (fg plane).
  • C2 Using an audio signal obtained by sound collection by the first, second and third microphones (Ma, Mb and Mc), parallel to the horizontal plane on the horizontal plane (fg plane) and orthogonal to each other Bi-directional signals in first and second directions (e.g., x and y directions) are generated.
  • the microphone array may include the microphone (Me) disposed at the intersection of two axes.
  • an audio signal obtained by sound collection by the microphone (Me) arranged at the above intersection is also used to generate the bi-directionality in the first and second directions.
  • an audio signal obtained by sound collection by the microphone (Me) disposed at the intersection may be used as it is as the W signal Cw.
  • the X signal Cx, the Y signal Cy, the Z signal Cz, and the W signal Cw are generated at the time of sound collection and stored until the time of reproduction, but these signals may be generated at the time of reproduction.
  • the signals Ba to Bd obtained by sound collection are recorded, and at the time of reproduction, the X signal Cx, the Y signal Cy, the Z signal Cz and the W signal are extracted from the read out signals Ba to Bd.
  • Cw is generated, and drive signals Da, Db, Dc,... Are generated from these signals Cx, Cy, Cz and Cw.
  • FIG. 23 a configuration of processing circuit 4d shown in FIG. 23 is shown in FIG. 23 instead of processing circuit 4 of the first embodiment.
  • the processing circuit 4d shown in FIG. 23 includes an input processing unit 10, a writing unit 30d, a reading unit 40d, a format conversion unit 20, and a reproduction processing unit 50.
  • the same reference numerals as in FIG. 1 denote the same components.
  • the input processing unit 10 receives the audio signals Aa to Ad from the microphones Ma to Md of the microphone array 2 and performs processes such as amplification and A / D conversion, and the results of these processes. It generates and outputs signals (signals after input processing) Ba to Bd corresponding to the signals Aa to Ad, respectively.
  • the writing unit 30 d records the audio signals Ba to Bd from the input processing unit 10 in the storage device 6.
  • the storage unit 6 stores the recorded signals Ba to Bd.
  • the recorded signals Ba to Bd are read out, and an audio signal (drive signal) suitable for the audio output unit 8 is generated based on these signals.
  • the reading unit 40 d reads the signals Ba to Bd stored in the storage device 6.
  • the format converter 20 converts the read signals Ba to Bd into an X signal Cx, a Y signal Cy, a Z signal Cz, and a W signal Cw.
  • the internal configuration of the format conversion unit 20 is the same as that of the first embodiment.
  • the reproduction processing unit 50 converts the X signal Cx, the Y signal Cy, the Z signal Cz and the W signal Cw into signals (drive signals) Da, Db, Dc,... Of a format suitable for the audio output unit 8 and outputs them. .
  • step ST101 the microphones Ma to Md perform sound collection, and the sound collection signals Aa to Ad are supplied to the processing circuit 4d.
  • step ST102 the processing circuit 4d performs an input process on the collected sound signals Aa to Ad, and generates signals Ba to Bd after the input process.
  • step ST105 the processing circuit 4d writes and stores the signals Ba to Bd after the input processing in the storage device 6.
  • step ST201 the processing circuit 4d reads the signals Ba to Bd stored in the storage device 6.
  • step ST103 the processing circuit 4d generates an X signal Cx, a Y signal Cy and a Z signal Cz from the signals Ba to Bd.
  • step ST104 the processing circuit 4d generates the W signal Cw from any one of the signals Ba to Bd or from a combination of two or more of the signals Ba to Bd.
  • step ST202 the process of step ST202 is performed.
  • step ST202 the processing circuit 4d generates drive signals Da, Db, Dc,... Using the signals Cx, Cy, Cz and Cw generated at steps ST103 and ST104.
  • step ST203 the processing circuit 4d drives the speaker of the audio output unit 8 with the generated drive signals Da, Db, Dc,.
  • the processing circuit of the first embodiment can be configured by software, that is, a programmed computer, with reference to FIG. 2, the processing circuits of the second, third and fourth embodiments are also , I.e. on a programmed computer. Therefore, a program for causing a computer to execute part or all of the configuration of the sound collection and reproduction apparatus and a computer readable recording medium storing the program also form part of the present invention.

Landscapes

  • Physics & Mathematics (AREA)
  • Engineering & Computer Science (AREA)
  • Acoustics & Sound (AREA)
  • Health & Medical Sciences (AREA)
  • Otolaryngology (AREA)
  • Signal Processing (AREA)
  • Multimedia (AREA)
  • General Health & Medical Sciences (AREA)
  • Obtaining Desirable Characteristics In Audible-Bandwidth Transducers (AREA)
  • Circuit For Audible Band Transducer (AREA)

Abstract

マイクロホンアレイが、第1の軸(f)上に配置された第1及び第2のマイクロホン(Ma、Mb)と、第1及び第2の軸(g)で張られる平面(fg)上の、第1の軸以外の位置に配置された第3のマイクロホン(Mc)と、第3の軸(h)上であって、第1及び第2の軸で張られる平面以外の位置に配置された第4のマイクロホン(Md)とを有し、処理回路が、第1乃至第4のマイクロホンでの収音で得られた信号(Ba~Bd)に基づいて、互いに直交する第1、第2及び第3の方向(x、y、z)の双指向性の信号(Cx、Cy、Cz)と、全指向性の信号(Cw)とを生成する。特殊なマイクロホンを用いることなく、またマイクロホンの配置に関し過度の制約なしに、互いに異なる直交する方向の双指向性の信号及び全指向性の信号を生成することができる。

Description

収音再生装置並びにプログラム及び記録媒体
 本発明は、収音再生装置に関する。本発明は例えば、複数の無指向性のマイクロホンによる収音で得られた音声信号から、複数の互いに異なる直交する方向の双指向性の信号及び全指向性の信号を生成し、音場の再現を行う収音再生装置に関する。異なる方向の双指向性成分は、例えば、アンビソニックB-フォーマットのX、Y、Z成分として用いられ、全指向性成分は例えば、アンビソニックB-フォーマットのW成分として用いられる。本発明はまた、収音再生装置における収音再生の処理をコンピュータに実行させるためのプログラム及び該プログラムを記録した記録媒体に関する。
 仮想現実(VR:Virtual Reality)技術の普及に伴い、VR映像に連携した収音再生装置のニーズが高まっている。収音再生装置は、音の到来方向の特定を行い、音の到来方向に応じた音の再現を行うための技術である。このような収音再生装置は、例えば、聴取者の頭が回転した際の音場の変化を再現する場合に用いられる。例えば、テレビでスポーツ観戦をしている聴取者が頭を回転させると、この回転に伴う、音の到来方向の変化を再現するために、スピーカからの再生音を変化させる。そのような立体音響技術の一つとして、アンビソニックスが知られている。
 アンビソニックスにおいては、一般には、アンビソニックスマイクロホンと呼ばれる特殊なマイクロホンを用いてアンビソニックA-フォーマットの信号を取得した後、アンビソニックB-フォーマットの信号に変換する(非特許文献1)。アンビソニックマイクロホンの例としてTetraMic(Core Sound)、SPS200(SoundField)等がある。
西村竜一「アンビソニックス」、映像情報メディア学会誌、Vol.68、No.8、p.616-620(2014)。 Barry D. Van Veen他, "Beamforming: A versatile Approach to Spatial Filtering" IEEE ASSP MAGAZINE APRIL 1988
 非特許文献1の方法を実施するには、マイクロホンとして、特殊なものが必要であり、高価である。また、マイクロホンの配置に自由度がないという問題がある。
 本発明は、特殊なマイクロホンを用いることなく、またマイクロホンの配置に関し過度の制約なしに、複数の互いに異なる直交する方向の双指向性の信号及び全指向性の信号を生成することができる収音再生装置を提供することを目的とする。
 本発明の一つの態様の収音再生装置は、
 マイクロホンアレイと、処理回路と、音声出力部とを備え、
 前記マイクロホンアレイは、互いに直交する第1、第2及び第3の軸のうちの前記第1の軸上に配置された第1及び第2のマイクロホンと、前記第1及び第2の軸で張られる平面上の、前記第1の軸以外の位置に配置された第3のマイクロホンと、前記第3の軸上であって、前記第1及び第2の軸で張られる平面以外の位置に配置された第4のマイクロホンとを有し、
 前記処理回路は、
 前記第1乃至第4のマイクロホンでの収音で得られた信号に基づいて、互いに直交する第1、第2及び第3の方向の双指向性の信号と、全指向性の信号とを生成し、
 前記生成した前記双指向性の信号及び前記全指向性の信号から、駆動信号を生成し、前記駆動信号で前記音声出力部を駆動する。
 本発明の他の態様の収音再生装置は、
 マイクロホンアレイと、処理回路と、音声出力部とを備え、
 前記マイクロホンアレイは、水平面上に延在し、互いに直交する第1及び第2の軸のうちの前記第1の軸上に配置された第1及び第2のマイクロホンと、前記水平面上の、前記第1の軸以外の位置に配置された第3のマイクロホンとを有し、
 前記処理回路は、
 前記第1、第2及び第3のマイクロホンでの収音で得られた信号に基づいて、前記水平面に平行で、互いに直交する第1及び第2の方向の双指向性の信号と、全指向性の信号とを生成し、
 前記生成した前記双指向性の信号及び前記全指向性の信号から、駆動信号を生成し、前記駆動信号で前記音声出力部を駆動する。
 本発明によれば、特殊なマイクロホンを用いることなく、またマイクロホンの配置に関し過度の制約なしに、複数の互いに異なる直交する方向の双指向性の信号及び全指向性の信号を生成することができる。
本発明の実施の形態1の収音再生装置の構成例を示すブロック図である。 図1の処理回路をソフトウェアで実現する場合の、収音再生装置の構成を示すブロック図である。 実施の形態1の収音再生装置で用いられるマイクロホンアレイを構成する複数のマイクロホンの配置の例を示す図である。 図3に示されるマイクロホンのうち、x軸方向の双指向性の信号及びy軸方向の双指向性の信号の生成に用いられるマイクロホンを示す図である。 図3に示されるマイクロホンのうち、z軸方向の双指向性の信号の生成に用いられるマイクロホンを示す図である。 アンビソニックB-フォーマットのX信号が持つ双指向性を示す図である。 アンビソニックB-フォーマットのY信号が持つ双指向性を示す図である。 アンビソニックB-フォーマットのZ信号が持つ双指向性を示す図である。 アンビソニックB-フォーマットのW信号が持つ全指向性を示す図である。 図1の処理回路の構成例を示すブロック図である。 図10のフォーマット変換部の構成例を示すブロック図である。 図11のフォーマット変換部で生成されるX信号の指向性を示す図である。 図11のフォーマット変換部で生成されるY信号の指向性を示す図である。 図11のフォーマット変換部で生成されるZ信号の指向性を示す図である。 図11のフォーマット変換部で生成されるW信号の指向性を示す図である。 (a)及び(b)は、実施の形態1の収音再生装置の処理回路における処理の手順を示すフローチャートである。 本発明の実施の形態2の収音再生装置のマイクロホンアレイを構成する複数のマイクロホンの配置を示す図である。 本発明の実施の形態2の収音再生装置の処理回路の構成例を示すブロック図である。 図18のフォーマット変換部の構成例を示すブロック図である。 本発明の実施の形態3の収音再生装置のマイクロホンアレイを構成する複数のマイクロホンの配置を示す図である。 実施の形態3の収音再生装置の処理回路の構成例を示すブロック図である。 図20のフォーマット変換部の構成例を示すブロック図である。 実施の形態4の収音再生装置の処理回路の構成例を示すブロック図である。 (a)及び(b)は、実施の形態4の収音再生装置の処理回路における処理の手順を示すフローチャートである。
実施の形態1. 
 図1は、本発明の実施の形態1の収音再生装置の構成例を示す。
 図示の収音再生装置は、マイクロホンアレイ2と、処理回路4と、記憶装置6と、音声出力部8とを有する。
 図1の処理回路4の機能は、ハードウェアで実現することもできるが、ソフトウェアを用いて実現することもできる。ソフトウェアで実現する場合の収音再生装置の構成例を図2に示す。図2のプロセッサ401とプログラムメモリ402とで、図1の処理回路4が構成されており、プロセッサ401がプログラムメモリ402に記憶されたプログラムに従って動作を行うことで、図1の処理回路4として動作する。
 記憶装置6は、HDD(ハードディスクドライブ)、SSD(ソリッドステートドライブ)等で構成されていても良く、例えば処理回路4に直接接続されていても良く、ネットワークを経由して接続されていても良い。
 図1において、音声はマイクロホンアレイ2で収音されて、マイクロホンアレイ2から出力される音声信号(収音信号)が、処理回路4に入力される。処理回路4は、入力された収音信号に対して信号処理を行って、複数の双指向性の信号及び全指向性の信号に変換する。複数の双指向性の信号は、互いに直交する方向の双指向性の信号である。処理回路4は、変換により生成された信号(変換信号)を記録する。再生時には、処理回路4は、記録されている変換信号から、音声出力部8に適した音声信号(駆動信号)を生成して、音声出力部8に供給する。音声出力部8は、供給された駆動信号に基づいて音声を出力する。
 図3に本実施の形態でのマイクロホンアレイ2を構成する複数のマイクロホンの配置の例を示す。図示の例では、マイクロホンアレイ2は4つの無指向性マイクロホンMa~Mdから成る。これらのマイクロホンMa~Mdは、以下のように配置されている。
 まず、マイクロホンMa~Mdが配置される空間内に、互いに直交する3つの軸がx軸、y軸、z軸として定義される。これらの3つの軸は、これらの3つの軸の交点を原点とするxyz座標系を形成する。
 これらの軸のうち、x軸及びy軸は水平方向の軸であり、z軸は上下方向の軸である。
 そして、水平方向の軸のうちのいずれか、例えば、x軸上に2個のマイクロホンMa及びMbが配置されている。また、x軸及びy軸で張られる平面(xy平面)上のx軸上以外の位置に1個のマイクロホンMcが配置されている。さらに、z軸上で、かつxy平面以外の位置に1個のマイクロホンMdが配置されている。
 マイクロホンMa~Mdがこのように配置されている結果、マイクロホンMa、Mb及びMcは、図4に示すように、xy平面上に位置し、マイクロホンMa、Mb及びMdは、図5に示すように、xz平面上に位置することになる。
 このように配置したマイクロホンMa~Mdで音声を収音し、収音により得られた音声信号(収音信号)Aa~Adを処理回路4に入力する。処理回路4は、入力された収音信号Aa~Adに基づいて、互いに異なる方向の双指向性の信号と、全指向性の信号とを生成する。これらの信号を便宜上、変換信号と言うことがある。互いに異なる方向の双指向性の信号は、例えば、アンビソニックB-フォーマットのX信号、Y信号及びZ信号として用いられ、全指向性の信号は、例えばアンビソニックB-フォーマットのW信号として用いられる。
 図6、図7及び図8に、アンビソニックB-フォーマットのX信号、Y信号及びZ信号の双指向性を示す。図9にアンビソニックB-フォーマットのW信号が持つ全指向性を示す。
 図1の処理回路4は、図10に示すように、入力処理部10と、フォーマット変換部20と、書込み部30と、読出し部40と、再生処理部50とを有する。
 入力処理部10は、マイクロホンアレイ2のマイクロホンMa~Mdからの音声信号Aa~Adを受けて、増幅、A/D変換等の処理を行い、これらの処理の結果、それぞれ信号Aa~Adに対応する信号(入力処理後の信号)Ba~Bdを生成して、出力する。
 信号Aa及び信号Baはともに、マイクロホンMaでの収音で得られた音声信号である。同様に、信号Ab及び信号Bbはともに、マイクロホンMbでの収音で得られた音声信号である。同様に、信号Ac及び信号Bcはともに、マイクロホンMcでの収音で得られた音声信号である。同様に、信号Ad及び信号Bdはともに、マイクロホンMdでの収音で得られた音声信号である。
 フォーマット変換部20は、図11に示すように、双指向性生成部22と、全指向性生成部24とを備えている。
 双指向性生成部22は、マイクロホンMa~Mdでの収音で得られた信号Ba~Bdを用いて、x軸方向の双指向性の信号(X信号)Cx、y軸方向の双指向性の信号(Y信号)Cy及びz軸方向の双指向性の信号(Z信号)Czを生成する。
 具体的には、図4に示されるように、xy平面上に位置するマイクロホンMa、Mb及びMcでの収音で得られた信号Ba、Bb及びBcを用いて、x軸方向の双指向性のX信号(図12)Cx及びy軸方向の双指向性のY信号Cy(図13)を生成し、図5に示されるように、xz平面上に位置するマイクロホンMa、Mb及びMdでの収音で得られた信号Ba、Bb及びBdを用いてz軸方向の双指向性のZ信号Cz(図14)を生成する。
 なお、xz平面上に位置するマイクロホンMa、Mb及びMdでの収音で得られた信号Ba、Bb及びBdを用いてx軸方向の双指向性のX信号Cxを生成することとしても良い。
 要するに、ある軸の方向の双指向性の信号を、当該軸を含む平面上に位置するマイクロホンでの収音で得られた収音信号を用いて生成することとすれば良い。
 以上のように、本実施の形態では、同一平面上にある3つのマイクロホンでの収音で得られた信号から、当該平面上に位置する軸の方向に双指向性の信号を生成している。
 なお、マイクロホン配置を例えば正四面体の頂点に配置すると、互いに直交する方向の双指向性の信号を生成することはできない。
 上記のX信号Cx、Y信号Cy及びZ信号Czの生成は、ビームフォーミングにより行い得る。具体的には、ビームフォーミングにおいてビームの方向をx軸の方向に向けたときのビームフォーマの出力を、X信号Cxとして用い、ビームフォーミングにおいてビームの方向をy軸の方向に向けたときのビームフォーマの出力を、Y信号Cyとして用い、ビームフォーミングにおいてビームの方向をz軸の方向に向けたときのビームフォーマの出力を、Z信号Czとして用いる。
 上記のようにして得られるX信号Cx、Y信号Cy及びZ信号Czは、それぞれアンビソニック-BフォーマットのX信号、Y信号及びZ信号として用いられる。
 ビームフォーミング処理のアルゴリズムは如何なるものであっても良い。例えば、非特許文献2に記載の方法を用いても良い。非特許文献2には、ビームフォーミングを行う際のフィルタの係数を第12頁の式(3.2)に従って定めれば良いことが示されている。非特許文献2の式(3.2)において、rは所望の指向性であり、双指向性は、
 r=cos(θ)
 で表される。
 上記の式で、θは双方向性の主軸の方向に対する角度である。
 マイクロホンの数を3つ以上とすることで、双指向性の方向を当該3つのマイクロホンが配置された平面内で自由に定めることができ、例えば上記平面内の、互いに直交する2つの方向(例えばx方向及びy方向)の各々を主軸の方向とする双指向性の信号を生成することができる。マイクロホンの数が2つであると、双指向性の信号を生成することができるが、一方向のみとなる。
 全指向性生成部24は、4つのマイクロホンMa~Mdでの収音で得られた信号Ba~Bdのうちのいずれか一つを用いて、或いは信号Ba~Bdのうちの2つ以上の組合せを用いて、全指向性の信号(W信号)Cwを生成する(図15)。
 信号Ba~Bdのうちのいずれか一つを用いる場合、当該信号をそのままW信号Cwとして用いることができる。信号Ba~Bdのうち2つ以上の組合せを用いる場合、例えばこれらの信号の組合せを用いてビームフォーミング処理で全指向性を生成したときのビームフォーマの出力をW信号Cwとして用いることができる。
 上記のようにして得られるW信号Cwは、アンビソニック-BフォーマットのW信号として用いられる。
 書込み部30は、フォーマット変換部20で生成されたX信号Cx、Y信号Cy、Z信号Cz及びW信号Cwを記憶装置6に記録する。
 記憶装置6は、記録された信号を保存する。
 立体音響実現のための再生に当たっては、記録されたこれらの信号Cx、Cy、Cz及びCwが読み出され、音声出力部8に適した音声信号(駆動信号)が生成される。
 具体的には、読出し部40は、記憶装置6に保存されている信号Cx、Cy、Cz及びCwを読み出す。
 再生処理部50は、読み出された信号Cx、Cy、Cz及びCwに基づいて、音声出力部8に適したフォーマットの信号(駆動信号)Da、Db、Dc、…を生成して出力する。駆動信号Da、Db、Dc、…への変換は、例えば、非特許文献1に記載の、一般的なアンビソニックB-フォーマットの再生方法により行い得る。この場合、信号Cx、Cy、Cz及びCwをそれぞれアンビソニックB-フォーマットのX信号、Y信号、Z信号及びW信号として用いる。
 例えば、音声出力部8を構成する複数のスピーカの配置に応じて、各スピーカの駆動に用いる信号を生成する。例えば、アンビソニックB-フォーマットのX、Y、Z及びWの信号Cx、Cy、Cz及びCwに対して係数を掛けて加算することで駆動信号を生成して、各スピーカの駆動に用いる。
 以上のように、収音時に、X信号、Y信号、Z信号及びW信号(変換信号)Cx、Cy、Cz、Cwを生成して保存し、再生時に、保存された変換信号から、駆動信号を生成する場合の処理の手順を、図16(a)及び(b)のフローチャートを参照して説明する。
 録音時には図16(a)の処理が行われる。
 ステップST101では、マイクロホンMa~Mdで収音が行われ、収音信号Aa~Adが処理回路4に供給される。
 次にステップST102では、処理回路4が、収音信号Aa~Adに対して入力処理を行って、入力処理後の信号Ba~Bdを生成する。
 次のステップST103及びST104の処理は互いに平行して行い得る。
 ステップST103では、処理回路4が、信号Ba~Bdから、X信号Cx、Y信号Cy及びZ信号Czを生成する。
 ステップST104では、処理回路4が、信号Ba~Bdのうちのいずれか1つから、又は信号Ba~Bdのうちの2つ以上の組合せから、W信号Cwを生成する。
 ステップST103及びST104の次にステップST105の処理が行われる。
 ステップST105では、処理回路4が、ステップST103及びST104で生成された信号(変換信号)Cx、Cy、Cz及びCwを記憶装置6に書込み、保存させる。
 再生時には、図16(b)の処理が行われる。
 ステップST201では、処理回路4が、記憶装置6に保存されている変換信号Cx、Cy、Cz及びCwを読み出す。
 ステップST202では、処理回路4が、読み出した変換信号Cx、Cy、Cz及びCwを用いて、駆動信号Da、Db、Dc、…を生成する。
 ステップST203では、処理回路4が、生成した駆動信号Da、Db、Dc、…で、音声出力部8のスピーカを駆動する。
 以上のように、実施の形態1では、x軸及びy軸は水平方向の軸であり、z軸は上下方向の軸であり、x軸上にマイクロホンMa及びMbが配置され、xy平面上のx軸上以外の位置にマイクロホンMcが配置され、z軸上にマイクロホンMdが配置されており、x軸方向、y軸方向及びz軸方向の双指向性の信号を形成する。しかしながら、上記のx軸、y軸及びz軸は入れ替え可能である。要するに、互いに直交する第1、第2及び第3の軸(x軸、y軸及びz軸)のうちの、第1の軸(例えばx軸)上に第1及び第2のマイクロホンMa及びMbが配置され、第1及び第2の軸(例えばy軸)で張られる平面(xy平面)上の第1の軸(x軸)上以外の位置に第3のマイクロホンMcが配置され、第3の軸(z軸)上に第4のマイクロホンMdが配置されていれば良い。
 そして、第1、第2及び第3のマイクロホンMa、Mb及びMcでの収音で得られる音声信号を用いて、第1の方向(x方向)の双指向性の信号及び第2の方向(y方向)の双指向性の信号が生成され、第1、第2及び第4マイクロホンMa、Mb及びMdでの収音で得られる音声信号を用いて、第3の方向(z方向)の双指向性の信号が生成されれば良い。
 また、複数のマイクロホンが配置される軸と、形成される双指向性の方向とは一致しなくても良い。マイクロホンの配置において基準となる軸を、第1、第2及び第3の軸(f、g及びh軸)とし、形成される双指向性の方向を第1、第2及び第3の方向(x、y及びz方向)とすると、マイクロホンの配置及び各方向の双指向性の生成に用いられるマイクロホンとが以下の関係を満たせば良い。
(a1) 互いに直交する3つの軸(f、g及びh軸)のうちの第1の軸(例えばf軸)上に第1及び第2のマイクロホン(Ma及びMb)が配置され、第1及び第2の軸(例えばf及びg軸)で張られる平面(fg平面)上の、第1の軸(f軸)以外の位置に第3のマイクロホン(Mc)が配置され、第3の軸(例えばh軸)上の、かつ上記第1及び第2の軸で張られる平面(fg平面)外の位置に、第4のマイクロホン(Md)が配置されている。
(a2) 第1乃至第4のマイクロホン(Ma~Md)での収音で得られた音声信号を用いて、互いに直交する第1、第2及び第3の方向(例えば、x、y及びz方向)の双指向性の信号が生成される。
 より具体的には、
(a2a) 第1、第2及び第3のマイクロホン(Ma、Mb及びMc)での収音で得られた音声信号を用いて、第1及び第2の方向(例えば、x方向及びy方向)の双指向性の信号が生成される。
(a2b) 第1、第2及び第4のマイクロホン(Ma、Mb及びMd)での収音で得られた音声信号を用いて、第3の方向(z方向)の双指向性の信号が生成される。
 例えば、上記第1、第2及び第3の軸(f、g及びh軸)のうちのいずれか(例えばh軸)が上下方向の軸であり、上記第1、第2及び第3の方向(x、y及びz方向)のうちのいずれか(例えばz方向)が上下方向である。
 上記の実施の形態1では、上記第3の軸(h軸)が上下方向の軸であり、上記第3の方向(z方向)が上下方向である。従って、上記第1及び第2の軸(f及びg軸)が水平面上に延在する軸であり、上記第1及び第2の方向(x方向y方向)が水平面に平行な方向である。
 本実施の形態により、安価な無指向性マイクロホンの組み合わせで互いに直交する3つの方向の双指向性の信号を生成することができる。また、マイクロホン配置は上記の条件を満たしていれば良く、マイクロホン間距離についての制約が無い。従って、コンパクトなマイクロホンセットとすることができ、小型デバイス(携帯電話、スマートフォン、ウェアラブルデバイス等)に取り付けることができる。
実施の形態2.

 実施の形態2は、実施の形態1に対し、マイクロホンアレイの構成及び処理回路の構成が異なる。即ち、実施の形態2では、実施の形態1のマイクロホンアレイ2の代わりに、図17に示されるマイクロホンアレイ2bが用いられ、実施の形態1の処理回路4の代わりに、図18の処理回路4bが用いられる。
 図17は、実施の形態2の収音再生装置の、マイクロホンアレイ2bを構成するマイクロホンの配置を示し、図18は、実施の形態2の収音再生装置の処理回路4bを示す。
 図17及び図18で、図1及び図3と同じ符号は同様のものを示す。
 図17に示されるように実施の形態2では、マイクロホンアレイ2bが5つのマイクロホンMa~Meから成る。このうち、マイクロホンMa~Mdは、実施の形態1と同様に配置されている。
 マイクロホンMeは、x軸、y軸及びz軸の交点、即ちxyz座標系の原点に配置されており、マイクロホンMa~Mdと同じく無指向性のマイクロホンである。
 実施の形態2で用いられる処理回路4bは、図18に示すように、入力処理部10bと、フォーマット変換部20bと、書込み部30と、読出し部40と、再生処理部50とを有する。
 書込み部30、読出し部40及び再生処理部50は、実施の形態1で説明したのと同様のものである。
 入力処理部10bは、マイクロホンアレイ2bのマイクロホンMa~Meからの収音信号Aa~Aeを受けて、増幅、A/D変換等の処理を行い、これらの処理の結果、それぞれ信号Aa~Aeに対応する、入力処理後の信号Ba~Beを生成して、出力する。入力処理後の信号Ba~Beも、実施の形態1と同様にマイクロホンMa~Meでの収音で得られた信号と言うことができる。
 フォーマット変換部20bは、図19に示すように、双指向性生成部22bと、全指向性生成部24bを備えている。
 双指向性生成部22bは、マイクロホンMa、Mb、Mc及びMe(図17)での収音で得られた信号Ba、Bb、Bc及びBeを用いてX信号Cx(図12)及びY信号Cy(図13)を生成し、マイクロホンMa、Mb、Md及びMe(図17)での収音で得られた信号Ba、Bb、Bd及びBeを用いてZ信号Cz(図14)を生成する。
 原点に配置したマイクロホンMeをも利用して双指向性の信号を生成するので、より鋭い指向性の信号を生成することができる。
 全指向性生成部24bは、マイクロホンMeでの収音で得られた信号Beを、W信号Cwとして出力する。
 原点に配置したマイクロホンMeでの収音で得られた信号Beを、そのままW信号Cwとして用いるので、ビームフォーミング等の処理による信号劣化を避けることができる。
 書込み部30bは、フォーマット変換部20bで生成された生成されたX信号Cx、Y信号Cy、Z信号Cz及びW信号Cwを、記憶装置6に記録する。
 記憶装置6は、記録されたX信号Cx、Y信号Cy、Z信号Cz及びW信号Cwを保存する。
 記録された音声の再生の処理は、実施の形態1で説明したのと同様である。
 実施の形態1と同様に、実施の形態2でも、上記のx軸、y軸及びz軸は入れ替え可能である。要するに、互いに直交する第1、第2及び第3の軸(x軸、y軸及びz軸)のうちの、第1の軸(例えばx軸)上に第1及び第2のマイクロホンMa及びMbが配置され、第1及び第2の軸(例えばy軸)で張られる平面(xy平面)上の第1の軸(x軸)上以外の位置に第3のマイクロホンMcが配置され、第3の軸(z軸)上に第4のマイクロホンMdが配置され、第1、第2及び第3の軸の交点に、第4のマイクロホンが配置されていれば良い。
 そして、第1、第2、第3及び第5のマイクロホンMa、Mb及びMc及びMeでの収音で得られる音声信号を用いて、第1の方向(x方向)の双指向性の信号及び第2の方向(y方向)の双指向性の信号が生成され、第1、第2、第4及び第5のマイクロホンMa、Mb、Md及びMeでの収音で得られる音声信号を用いて、第3の方向(z方向)の双指向性の信号が生成されれば良い。
 また、実施の形態1と同様に、複数のマイクロホンが配置される軸と、形成される双指向性の方向とは一致しなくても良い。マイクロホンの配置において基準となる軸を、第1、第2及び第3の軸(f、g及びh軸)とし、形成される双指向性の方向を第1、第2及び第3の方向(x、y及びz方向)とすると、マイクロホンの配置及び各方向の双指向性の生成に用いられるマイクロホンとが以下の関係を満たせば良い。
(b1) 互いに直交する3つの軸(f、g及びh軸)のうちの第1の軸(例えばf軸)上に第1及び第2のマイクロホン(Ma及びMb)が配置され、第1及び第2の軸(例えばf及びg軸)で張られる平面(fg平面)上の、第1の軸(f軸)以外の位置に第3のマイクロホン(Mc)が配置され、第3の軸(例えばh軸)上の、かつ上記第1及び第2の軸で張られる平面(fg平面)外の位置に、第4のマイクロホン(Md)が配置され、上記第1、第2及び第3の軸の交点に第5のマイクロホン(Me)が配置されている。
(b2) 第1乃至第5のマイクロホン(Ma~Me)での収音で得られた音声信号を用いて、互いに直交する第1、第2及び第3の方向(例えば、x、y及びz方向)の双指向性の信号が生成される。
 より具体的には、
(b2a) 第1、第2、第3及び第5のマイクロホン(Ma、Mb、Mc及びMe)での収音で得られた音声信号を用いて、第1及び第2の方向(例えば、x及びy方向)の双指向性の信号が生成される。
(b2b) 第1、第2、第4及び第5のマイクロホン(Ma、Mb、Md及びMe)での収音で得られた音声信号を用いて、第3の方向(z方向)の双指向性の信号が生成される。
 上記第1、第2及び第3の軸(f、g及びh軸)のうちのいずれか(例えばh軸)が上下方向の軸であり、上記第1、第2及び第3の方向(x、y及びz方向)のうちのいずれか(例えばz方向)が上下方向である。
 上記の実施の形態2では、実施の形態1と同様に、上記第3の軸(h軸)が上下方向の軸であり、上記第3の方向(z方向)が上下方向である。従って、上記第1及び第2の軸(f及びg軸)が水平面上に延在する軸であり、上記第1及び第2の方向(x方向y方向)が水平面に平行な方向である。
実施の形態3. 
 実施の形態3は、実施の形態1に対し、マイクロホンアレイの構成及び処理回路の構成が異なる。即ち、実施の形態3では、実施の形態1のマイクロホンアレイ2の代わりに、図20に示されるマイクロホンアレイ2cが用いられ、実施の形態1の処理回路4の代わりに、図21の処理回路4cが用いられる。
 図20は、実施の形態3の収音再生装置の、マイクロホンアレイ2を構成するマイクロホンの配置を示し、図21は、実施の形態2の収音再生装置の処理回路4cを示す。
 図20及び図21で、図1及び図3と同じ符号は同様のものを示す。
 図20に示されるように、実施の形態3ではマイクロホンアレイ2cが3つのマイクロホンMa、Mb及びMcから成り、実施の形態1のマイクロホンMdは用いられていない。
 また、実施の形態3では、x軸及びy軸が水平方向に延在する軸であり、従って、x軸及びy軸で張られる平面が水平面である。マイクロホンMa、Mb及びMcは、実施の形態1と同様に配置されている。即ち、x軸上に2個のマイクロホンMa及びMbが配置されている(図20)。また、xy平面上のx軸上以外の位置に1個のマイクロホンMcが配置されている。
 実施の形態3で用いられる処理回路4cは、図21に示すように、入力処理部10cと、フォーマット変換部20cと、書込み部30cと、読出し部40cと、再生処理部50cとを有する。
 入力処理部10cは、マイクロホンアレイ2cのマイクロホンMa~Mcからの収音信号Aa~Acを受けて、増幅、A/D変換等の処理を行い、これらの処理の結果、それぞれ信号Aa~Acに対応する、入力処理後の信号Ba~Bcを生成して、出力する。
 フォーマット変換部20cは、図22に示すように、双指向性生成部22cと、全指向性生成部24cとを備えている。
 双指向性生成部22cは、マイクロホンMa、Mb及びMc(図20)での収音で得られた信号Ba、Bb、Bc及びBeを用いてX信号Cx(図12)及びY信号Cy(図13)を生成する。
 全指向性生成部24cは、3つのマイクロホンMa、Mb及びMcでの収音で得られた信号Ba、Bb及びBcのうちのいずれか一つを用いて、或いは信号Ba、Bb及びBcのうちの2つ以上の組合せを用いて、W信号Cwを生成する(図15)。
 信号Ba、Bb及びBcのうちのいずれか一つを用いる場合、当該信号をそのままW信号Cwとして用いることができる。信号Ba、Bb及びBcのうち2つ以上の組合せを用いる場合、例えば信号の組合せを用いてビームフォーミング処理で全指向性を生成したときのビームフォーマの出力をW信号Cwとして用いることができる。
 実施の形態3では、Z信号Czを生成しない。
 書込み部30cは、フォーマット変換部20cで生成されたX信号Cx、Y信号Cy及びW信号Cwを記憶装置6に記録する。
 記憶装置6は、記録された信号を保存する。
 立体音響実現のための再生に当たっては、記録されたこれらの信号Cx、Cy及びCwが読み出され、音声出力部8に適した音声信号(駆動信号)が生成される。
 具体的には、読出し部40は、記憶装置6に保存されている信号Cx、Cy及びCwを読み出す。
 再生処理部50は、読み出された信号Cx、Cy及びCwを、音声出力部8に適したフォーマットの信号(駆動信号)Da、Db、Dc、…に変換して出力する。駆動信号Da、Db、Dc、…への変換は、例えば非特許文献1に記載の、一般的なアンビソニックB-フォーマット再生方法により行い得る。この場合、信号Cx、Cy及びCwをそれぞれアンビソニックB-フォーマットのX信号、Y信号及びW信号として用いる。また、アンビソニックB-フォーマットのZ信号をゼロであるとして計算を行う。
 例えば、音声出力部8を構成する複数のスピーカの配置に応じて、各スピーカの駆動に用いる信号を生成する。例えば、アンビソニックB-フォーマットのX、Y及びWの信号Cx、Cy及びCwに対して係数を掛けて加算することで駆動信号を生成して、各スピーカの駆動に用いる。
 以上のように、実施の形態3では、上下方向の双指向性の信号を生成しない。その結果、再生音からは、上下方向の定位はできず、方位方向の定位のみが可能である。用途によっては、上下方向の定位ができなくても良い場合があるので、そのような場合に実施の形態3の構成を用いることができる。実施の形態3は、マイクロホンアレイが比較的小さいと言う利点がある。
 以上のように、実施の形態3では、x軸及びy軸は水平方向の軸であり、x軸上にマイクロホンMa及びMbが配置され、xy平面上のx軸上以外の位置にマイクロホンMcが配置されており、x軸方向及びy軸方向の双指向性の信号を形成する。しかしながら、上記のx軸及びy軸は入れ替え可能である。要するに、互いに直交する第1及び第2の軸(x軸及びy軸)のうちの、第1の軸(例えばx軸)上に第1及び第2のマイクロホンMa及びMbが配置され、第1及び第2の軸(例えばy軸)で張られる平面(xy平面)上の第1の軸(x軸)上以外の位置に第3のマイクロホンMcが配置されていれば良い。但し、x軸及びy軸は水平方向に延在する軸である。
 そして、第1、第2及び第3のマイクロホンMa、Mb及びMcでの収音で得られる音声信号を用いて、第1の方向(x方向)の双指向性の信号及び第2の方向(y方向)の双指向性の信号が生成されれば良い。
 また実施の形態1及び2と同様に、複数のマイクロホンが配置される軸と、形成される双指向性の方向とは一致しなくても良い。マイクロホンの配置において基準となる軸を第1及び第2の軸(f軸及びg軸)とし、形成される双指向性の方向を第1及び第2の方向(x方向及びy方向)とすると、マイクロホンの配置及び各方向の双指向性の生成に用いられるマイクロホンとが以下の関係を満たせば良い。
(c1) 水平面上に延在し、互いに直交する2つの軸(f軸及びg軸)のうちの第1の軸(例えばf軸)上に第1及び第2のマイクロホン(Ma、Mb)が配置され、上記水平面(fg平面)上の、第1の軸(f軸)以外の位置に第3のマイクロホン(Mc)が配置されている。
(c2) 第1、第2及び第3のマイクロホン(Ma、Mb及びMc)での収音で得られた音声信号を用いて、水平面(fg平面)上の、上記水平面に平行で、互いに直交する第1及び第2の方向(例えば、x方向及びy方向)の双指向性の信号が生成される。
 なお、実施の形態3でも、実施の形態2と同様に、マイクロホンアレイが、2つの軸の交点に配置されたマイクロホン(Me)を含んでいても良い。
 この場合には、上記の交点に配置されたマイクロホン(Me)での収音で得られた音声信号も、上記第1及び第2の方向の双指向性の生成に利用される。
 また、実施の形態2と同様に、上記の交点に配置されたマイクロホン(Me)での収音で得られた音声信号を、そのままW信号Cwとして用いても良い。
実施の形態4.
 実施の形態1では、収音時にX信号Cx、Y信号Cy、Z信号Cz及びW信号Cwを生成し、再生時まで保存しているが、これらの信号の生成を再生時に行っても良い。
 再生時に行う場合には、収音で得られた信号Ba~Bdを記録しておき、再生時に、読み出された信号Ba~Bdから、X信号Cx、Y信号Cy、Z信号Cz及びW信号Cwを生成し、さらにこれらの信号Cx、Cy、Cz及びCwから駆動信号Da、Db、Dc、…を生成する。
 この場合には、実施の形態1の処理回路4の代わりに、図23に示される処理回路4dの構成を図23に示す。
 図23に示される処理回路4dは、入力処理部10と、書込み部30dと、読出し部40dと、フォーマット変換部20と、再生処理部50とを有する。
 図23で、図1と同じ符号は同様のものを示す。
 入力処理部10は、実施の形態1と同様に、マイクロホンアレイ2のマイクロホンMa~Mdからの音声信号Aa~Adを受けて、増幅、A/D変換等の処理を行い、これらの処理の結果、それぞれ信号Aa~Adに対応する信号(入力処理後の信号)Ba~Bdを生成して、出力する。
 書込み部30dは、入力処理部10からの音声信号Ba~Bdを記憶装置6に記録する。
 記憶装置6は、記録された信号Ba~Bdを保存する。
 立体音響実現のための再生に当たっては、記録されたこれらの信号Ba~Bdが読み出され、これらの信号に基づいて音声出力部8に適した音声信号(駆動信号)が生成される。
 具体的には、読出し部40dは、記憶装置6に保存されている信号Ba~Bdを読み出す。
 フォーマット変換部20は、読み出された信号Ba~BdをX信号Cx、Y信号Cy、Z信号Cz及びW信号Cwに変換する。
 フォーマット変換部20の内部構成は、実施の形態1と同様である。
 再生処理部50は、X信号Cx、Y信号Cy、Z信号Cz及びW信号Cwを、音声出力部8に適したフォーマットの信号(駆動信号)Da、Db、Dc、…に変換して出力する。
 この場合の処理の手順を、図24(a)及び(b)のフローチャートを参照して説明する。
 録音時には、図24(a)の処理が行われる。
 ステップST101では、マイクロホンMa~Mdで収音が行われ、収音信号Aa~Adが処理回路4dに供給される。
 ステップST102では、処理回路4dが、収音信号Aa~Adに対して入力処理を行って、入力処理後の信号Ba~Bdを生成する。
 ステップST105では、処理回路4dが、入力処理後の信号Ba~Bdを記憶装置6に書込み、保存させる。
 再生時には、図24(b)の処理が行われる。
 まず、ステップST201では、処理回路4dが、記憶装置6に保存されている信号Ba~Bdを読み出す。
 ステップST201の次にステップST103及びステップST104の処理が行われる。
 ステップST103では、処理回路4dが、信号Ba~Bdから、X信号Cx、Y信号Cy及びZ信号Czを生成する。
 ステップST104では、処理回路4dが、信号Ba~Bdのうちのいずれか1つから、又は信号Ba~Bdのうちの2つ以上の組合せから、W信号Cwを生成する。
 ステップST103~ST104の次にステップST202の処理が行われる。
 ステップST202では、処理回路4dが、ステップST103及びST104で生成された信号Cx、Cy、Cz及びCwを用いて、駆動信号Da、Db、Dc、…を生成する。
 ステップST203では、処理回路4dが、生成した駆動信号Da、Db、Dc、…で、音声出力部8のスピーカを駆動する。
 以上、X信号Cx、Y信号Cy、Z信号Cz及びW信号Cwへの変換を、再生時に行う構成を、実施の形態1に対する変形例として説明したが、実施の形態2及び実施の形態3についても同様の変形を加えることができる。
 図2を参照して実施の形態1の処理回路をソフトウェアで、即ちプログラムされたコンピュータ構成することが可能であると説明したが、実施の形態2、3及び4の処理回路も同様に、ソフトウェアで、即ちプログラムされたコンピュータで実現することができる。従って、コンピュータに上記の収音再生装置の構成の一部又は全部を実行させるためのプログラム及び該プログラムを記録した、コンピュータで読み取り可能な記録媒体もまた本発明の一部を成す。
 2 マイクロホンアレイ、 4、4b、4c 処理回路、 6 記憶装置、 8 音声出力部、 10、10b、10c 入力処理部、 20、20b、20c フォーマット変換部、 22、22b、22c 双指向性生成部、 24、24b、24c 全指向性生成部、 30、30c、30d 書込み部、 40、40c、40d 読出し部、 50、50c 再生処理部、 401 プロセッサ、 402 プログラムメモリ。

Claims (16)

  1.  マイクロホンアレイと、処理回路と、音声出力部とを備え、
     前記マイクロホンアレイは、互いに直交する第1、第2及び第3の軸のうちの前記第1の軸上に配置された第1及び第2のマイクロホンと、前記第1及び第2の軸で張られる平面上の、前記第1の軸以外の位置に配置された第3のマイクロホンと、前記第3の軸上であって、前記第1及び第2の軸で張られる平面以外の位置に配置された第4のマイクロホンとを有し、
     前記処理回路は、
     前記第1乃至第4のマイクロホンでの収音で得られた信号に基づいて、互いに直交する第1、第2及び第3の方向の双指向性の信号と、全指向性の信号とを生成し、
     前記生成した前記双指向性の信号及び前記全指向性の信号から、駆動信号を生成し、前記駆動信号で前記音声出力部を駆動する
     収音再生装置。
  2.  前記処理回路は、
     前記第1、第2及び第3のマイクロホンでの収音で得られた音声信号を用いて、前記第1及び第2の方向の双指向性の信号を生成し、
     前記第1、第2及び第4のマイクロホンでの収音で得られた音声信号を用いて、前記第3の方向の双指向性の信号を生成する
     請求項1に記載の収音再生装置。
  3.  前記マイクロホンアレイは、前記第1、第2及び第3の軸の交点に配置された第5のマイクロホンをさらに有し、
     前記処理回路は、
     前記第5のマイクロホンでの収音で得られた音声信号をも用いて、前記第1、第2及び第3の方向の双指向性の信号を生成する
     請求項1又は2に記載の収音再生装置。
  4.  前記処理回路は、
     前記第5のマイクロホンでの収音で得られた信号を前記全指向性の信号として出力する請求項3に記載の収音再生装置。
  5.  前記第1、第2及び第3の軸のうちのいずれかが上下方向の軸であり、
     前記第1、第2及び第3の方向のうちのいずれかが上下方向である
     請求項1から4のいずれか1項に記載の収音再生装置。
  6.  前記第3の軸が上下方向の軸であり、
     前記第3の方向が上下方向である
     請求項5に記載の収音再生装置。
  7.  前記第1の方向が前記第1の軸の方向であり、前記第2の方向が前記第2の軸の方向である請求項6に記載の収音再生装置。
  8.  前記第1、第2及び第3の方向の双指向性の信号をアンビソニックB-フォーマットのX信号、Y信号、Z信号として用い、
     前記全指向性の信号をアンビソニックB-フォーマットのW信号として用いる
     請求項1から7のいずれか1項に記載の収音再生装置。
  9.  前記処理回路は、ビームフォーミングを行うことで、前記双指向性の信号を生成する請求項1から8のいずれか1項に記載の収音再生装置。
  10.  マイクロホンアレイと、処理回路と、音声出力部とを備え、
     前記マイクロホンアレイは、水平面上に延在し、互いに直交する第1及び第2の軸のうちの前記第1の軸上に配置された第1及び第2のマイクロホンと、前記水平面上の、前記第1の軸以外の位置に配置された第3のマイクロホンとを有し、
     前記処理回路は、
     前記第1、第2及び第3のマイクロホンでの収音で得られた信号に基づいて、前記水平面に平行で、互いに直交する第1及び第2の方向の双指向性の信号と、全指向性の信号とを生成し、
     前記生成した前記双指向性の信号及び前記全指向性の信号から、駆動信号を生成し、前記駆動信号で前記音声出力部を駆動する
     収音再生装置。
  11.  前記マイクロホンアレイは、前記第1及び第2の軸の交点に配置された第4のマイクロホンをさらに有し、
     前記処理回路は、
     前記第4のマイクロホンでの収音で得られた音声信号をも用いて、前記第1及び第2の方向の双指向性の信号を生成する
     請求項10に記載の収音再生装置。
  12.  前記処理回路は、
     前記第4のマイクロホンでの収音で得られた信号を前記全指向性の信号として出力する請求項11に記載の収音再生装置。
  13.  前記第1の方向が前記第1の軸の方向であり、前記第2の方向が前記第2の軸の方向である請求項10から12のいずれか1項に記載の収音再生装置。
  14.  前記処理回路は、ビームフォーミングを行うことで、前記双指向性の信号を生成する請求項10から13のいずれか1項に記載の収音再生装置。
  15.  請求項1から14のいずれか1項に記載の収音再生装置における処理をコンピュータに実行させるためのプログラム。
  16.  請求項15に記載のプログラムを記録した、コンピュータで読み取り可能な記録媒体。
PCT/JP2017/041052 2017-11-15 2017-11-15 収音再生装置並びにプログラム及び記録媒体 WO2019097598A1 (ja)

Priority Applications (3)

Application Number Priority Date Filing Date Title
US16/643,654 US11245981B2 (en) 2017-11-15 2017-11-15 Sound collection and playback apparatus, and recording medium
PCT/JP2017/041052 WO2019097598A1 (ja) 2017-11-15 2017-11-15 収音再生装置並びにプログラム及び記録媒体
JP2019554088A JP6742535B2 (ja) 2017-11-15 2017-11-15 収音再生装置並びにプログラム及び記録媒体

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
PCT/JP2017/041052 WO2019097598A1 (ja) 2017-11-15 2017-11-15 収音再生装置並びにプログラム及び記録媒体

Publications (1)

Publication Number Publication Date
WO2019097598A1 true WO2019097598A1 (ja) 2019-05-23

Family

ID=66539401

Family Applications (1)

Application Number Title Priority Date Filing Date
PCT/JP2017/041052 WO2019097598A1 (ja) 2017-11-15 2017-11-15 収音再生装置並びにプログラム及び記録媒体

Country Status (3)

Country Link
US (1) US11245981B2 (ja)
JP (1) JP6742535B2 (ja)
WO (1) WO2019097598A1 (ja)

Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2000197177A (ja) * 1998-12-24 2000-07-14 Victor Co Of Japan Ltd マイクロホン装置及び指向性制御装置
JP2008160588A (ja) * 2006-12-25 2008-07-10 Sony Corp 音声信号処理装置、音声信号処理方法及び撮像装置
JP2012004708A (ja) * 2010-06-15 2012-01-05 Yamaha Corp 音響処理装置
JP2013520858A (ja) * 2010-02-23 2013-06-06 コーニンクレッカ フィリップス エレクトロニクス エヌ ヴィ 音源位置決め
JP2015213328A (ja) * 2010-10-25 2015-11-26 クゥアルコム・インコーポレイテッドQualcomm Incorporated マルチマイクロフォンを用いた3次元サウンド獲得及び再生
JP2017028557A (ja) * 2015-07-24 2017-02-02 株式会社オーディオテクニカ マイクロホン装置

Family Cites Families (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP3175267B2 (ja) 1992-03-10 2001-06-11 松下電器産業株式会社 音場の方向情報抽出方法
JP2002232988A (ja) 2001-01-30 2002-08-16 Matsushita Electric Ind Co Ltd マルチチャンネル収音装置
JP2008154130A (ja) 2006-12-20 2008-07-03 Matsushita Electric Ind Co Ltd 音場測定装置
WO2011076290A1 (en) * 2009-12-24 2011-06-30 Nokia Corporation An apparatus
EP2375779A3 (en) * 2010-03-31 2012-01-18 Fraunhofer-Gesellschaft zur Förderung der Angewandten Forschung e.V. Apparatus and method for measuring a plurality of loudspeakers and microphone array
JP6666276B2 (ja) 2017-01-23 2020-03-13 日本電信電話株式会社 音声信号変換装置、その方法、及びプログラム

Patent Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2000197177A (ja) * 1998-12-24 2000-07-14 Victor Co Of Japan Ltd マイクロホン装置及び指向性制御装置
JP2008160588A (ja) * 2006-12-25 2008-07-10 Sony Corp 音声信号処理装置、音声信号処理方法及び撮像装置
JP2013520858A (ja) * 2010-02-23 2013-06-06 コーニンクレッカ フィリップス エレクトロニクス エヌ ヴィ 音源位置決め
JP2012004708A (ja) * 2010-06-15 2012-01-05 Yamaha Corp 音響処理装置
JP2015213328A (ja) * 2010-10-25 2015-11-26 クゥアルコム・インコーポレイテッドQualcomm Incorporated マルチマイクロフォンを用いた3次元サウンド獲得及び再生
JP2017028557A (ja) * 2015-07-24 2017-02-02 株式会社オーディオテクニカ マイクロホン装置

Also Published As

Publication number Publication date
JPWO2019097598A1 (ja) 2020-02-27
JP6742535B2 (ja) 2020-08-19
US20200245064A1 (en) 2020-07-30
US11245981B2 (en) 2022-02-08

Similar Documents

Publication Publication Date Title
US11838707B2 (en) Capturing sound
US20200053457A1 (en) Merging Audio Signals with Spatial Metadata
US10356514B2 (en) Spatial encoding directional microphone array
CN103181192B (zh) 利用多麦克风的三维声音捕获和再现
US10659873B2 (en) Spatial encoding directional microphone array
JP3232608B2 (ja) 収音装置、再生装置、収音方法および再生方法、および、音信号処理装置
US20070291949A1 (en) Sound image control apparatus and sound image control method
JP5679304B2 (ja) 多重極スピーカ群とその配置方法と、音響信号出力装置とその方法と、その方法を用いたアクティブノイズコントロール装置と音場再生装置と、それらの方法とプログラム
TW201536065A (zh) 增進多聲道之再生
WO2016080204A1 (ja) 信号処理装置、信号処理方法、およびプログラム
CN114173256B (zh) 一种还原声场空间及姿态追踪的方法、装置和设备
WO2019097598A1 (ja) 収音再生装置並びにプログラム及び記録媒体
US11076257B1 (en) Converting ambisonic audio to binaural audio
US11310616B2 (en) Method for outputting audio signal using scene orientation information in an audio decoder, and apparatus for outputting audio signal using the same
JP2018120007A (ja) 音声信号変換装置、その方法、及びプログラム
JP2011120028A (ja) 音声再生装置、及びその制御方法
EP4115626A1 (en) Sound field microphones
WO2018211984A1 (ja) スピーカアレイ、および信号処理装置
JP2000287295A (ja) 信号処理装置
US11546687B1 (en) Head-tracked spatial audio
US10659902B2 (en) Method and system of broadcasting a 360° audio signal
TWI840740B (zh) 麥克風、用以記錄聲學信號的方法、用於聲學信號的再現設備或用以再現聲學信號的方法
WO2021038782A1 (ja) 信号処理装置、信号処理方法および信号処理プログラム
JP2001086588A (ja) 音声信号処理装置及び方法、並びに電子機器
CN115226005A (zh) 捡拾信号的声重放方法、装置、计算机设备及存储介质

Legal Events

Date Code Title Description
121 Ep: the epo has been informed by wipo that ep was designated in this application

Ref document number: 17932370

Country of ref document: EP

Kind code of ref document: A1

ENP Entry into the national phase

Ref document number: 2019554088

Country of ref document: JP

Kind code of ref document: A

NENP Non-entry into the national phase

Ref country code: DE

122 Ep: pct application non-entry in european phase

Ref document number: 17932370

Country of ref document: EP

Kind code of ref document: A1