JP2004264292A - Device and method for discriminating sound source - Google Patents

Device and method for discriminating sound source Download PDF

Info

Publication number
JP2004264292A
JP2004264292A JP2004011660A JP2004011660A JP2004264292A JP 2004264292 A JP2004264292 A JP 2004264292A JP 2004011660 A JP2004011660 A JP 2004011660A JP 2004011660 A JP2004011660 A JP 2004011660A JP 2004264292 A JP2004264292 A JP 2004264292A
Authority
JP
Japan
Prior art keywords
sound
sound source
cause
waveform
similarity
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP2004011660A
Other languages
Japanese (ja)
Other versions
JP4127211B2 (en
JP2004264292A5 (en
Inventor
Koji Udagawa
浩二 宇田川
Yumiko Kurosawa
由美子 黒澤
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Fujifilm Business Innovation Corp
Original Assignee
Fuji Xerox Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Fuji Xerox Co Ltd filed Critical Fuji Xerox Co Ltd
Priority to JP2004011660A priority Critical patent/JP4127211B2/en
Publication of JP2004264292A publication Critical patent/JP2004264292A/en
Publication of JP2004264292A5 publication Critical patent/JP2004264292A5/ja
Application granted granted Critical
Publication of JP4127211B2 publication Critical patent/JP4127211B2/en
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Images

Landscapes

  • Measurement Of Mechanical Vibrations Or Ultrasonic Waves (AREA)

Abstract

<P>PROBLEM TO BE SOLVED: To provide a device and method for discriminating sound sources which can appropriately distinguish the cause of generation of sounds (mainly, impulsive sounds) from a sound source, even when the sound source, having an unstable and changing property due to several causes in the generated sound is existed as the sound source to be distinguished, consisting of unknown sound generation causes. <P>SOLUTION: The sound source discrimination device comprises a sound collecting part which collects the sound from the sound source as a sound signal; a sound segmentation part which divides the sound signals of sounds to be distinguished into plural pieces from the collected sound signal; a similarity operation part which calculates an index indicating a waveform similarity among plural segmented sound signals; on the calculated similarity index of the waveform, a discriminating part discriminates the cause of generation of the sound source to be distinguished, in comparison with a discrimination threshold which is determined, based on the waveform similarity index in each sound signal for each generation cause on the sound source which is clearly known in the generation cause previously. <P>COPYRIGHT: (C)2004,JPO&NCIPI

Description

本発明は、発生原因が不明な音源の発生原因を判別するための音源判別装置及びその判別方法に係り、特に、筐体を通して外部に放射される機械騒音に含まれる複数種の音の発生原因を推定して判別するに有効な音源判別装置及びその判別方法に関するものである。   The present invention relates to a sound source discriminating apparatus and a discriminating method thereof for discriminating the cause of a sound source whose source is unknown, and more particularly to the cause of a plurality of types of sound contained in mechanical noise radiated outside through a housing. The present invention relates to a sound source discriminating apparatus effective for estimating and discriminating a sound source and a discriminating method thereof.

近年、オフィスにおける快適性や知的生産性の向上を支援するためにオフィス環境の向上が求められている。このような動きを受けて、例えばオフィスで使用される複写機、プリンタ等の画像形成装置についてもその装置から発せられる騒音を低減することが求められている。   2. Description of the Related Art In recent years, there has been a demand for an improved office environment to support the improvement of office comfort and intellectual productivity. In response to such a movement, it is required to reduce noise generated from the image forming apparatus such as a copying machine and a printer used in an office, for example.

図6は、一般的な電子写真方式を利用したプリンタが稼動中に発生する騒音の時間波形を示したものである。この図に示されるように、騒音の音圧が経時的に変動していることがわかる。図中の丸印で示した波形部分は、数10〜数100ミリ秒程度の短時間の高い音圧からなる音、いわゆる衝撃音が発生している部分を示している。このような衝撃音とも呼ばれる音は、部品どうしの衝突、用紙と部品と衝突などにより発生するものであり、具体的には、ソレノイド、電磁クラッチ、モータ等に代表される可動部品の動作時や、用紙位置合わせ部における用紙先端と位置合わせ部材との衝突時などで発生する。   FIG. 6 shows a time waveform of noise generated while a general electrophotographic printer operates. As shown in this figure, it can be seen that the sound pressure of the noise fluctuates with time. The waveform portions indicated by circles in the figure indicate portions where a short time high sound pressure of several tens to several hundreds of milliseconds, that is, a so-called impact sound is generated. Such a sound, also referred to as an impact sound, is generated by a collision between parts, a collision between a sheet and a part, and more specifically, when operating a movable part represented by a solenoid, an electromagnetic clutch, a motor, or the like. This occurs at the time of collision between the leading edge of the sheet and the positioning member in the sheet positioning unit.

そして、この衝撃音のような音は、一般に短時間に大きな音圧変動を示すことから、騒音のなかでも特に人に認知されやすく不快感を与えやすい。   A sound such as the impact sound generally shows a large fluctuation in sound pressure in a short time.

このため、騒音対策を必要とする製品開発時においては、衝撃音のような音の低減に注力した研究開発を行うことが多い。しかし、前記した画像形成装置のような音源対象物の一部のものについては、かかる衝撃音の発生原因を特定することが非常に難しいとされている。   For this reason, when developing products that require noise countermeasures, research and development that focuses on reducing noise such as impact noise are often performed. However, it is very difficult to identify the cause of the impact sound for a part of the sound source target such as the image forming apparatus described above.

これは、複写機、プリンタ等の画像形成装置のような音源対象物では、一般の家電製品や機械構造物などと比べて可動部品やそれと関連する部品の点数が桁違いに多く、しかもその可動部品等が種々のタイミングで動作することにより、様々な音源から様々なタイミングで音が発生することとなり、複数種の衝撃音が混在しているという特徴によるものである。また、かかる画像形成装置では、その小型化や高機能化が進むにつれて、その構成部品どうしが非常に接近した位置関係で配置されるようになるという特徴や、部品自体が更に小さくなるとともに新たな部品が追加されるようにもなるという特徴によるものである。   This is because, in the case of sound source objects such as image forming apparatuses such as copiers and printers, the number of movable parts and related parts is orders of magnitude higher than that of general home appliances and mechanical structures, and moreover, When components and the like operate at various timings, sounds are generated from various sound sources at various timings, and this is due to the feature that a plurality of types of impact sounds are mixed. Further, in such an image forming apparatus, as the miniaturization and the sophistication of the image forming apparatus progress, the components thereof are arranged in a very close positional relationship. This is due to the feature that components are added.

そこで、本出願人は、このような多くの音源からランダムに発せられる音の発生原因を短時間でかつ正確に判断するための信号判断装置に関する提案を行っている(特許文献1、2)。   Therefore, the present applicant has proposed a signal determination device for determining, in a short time and accurately, the cause of generation of sounds randomly emitted from such many sound sources (Patent Documents 1 and 2).

この信号判断装置は、例えば、発生原因が明らかな音源からの複数種の音を収音して得られる音響信号に関する波形ベクトルを既知波形ベクトル(基準空間)として用意する一方で、判断対象となる発生原因が不明な音源の音を収音して得られる音響信号に関する波形ベクトルを判断対象波形ベクトルとして取り込み、それについて前記既知波形ベクトルとの間の距離測度(例えばマハラノビス距離)を算出する。そして、その判断対象波形ベクトルの距離測度を、既知波形ベクトルの原因別の距離測度データに基づいて設定する判別用の閾値と比較することにより、かかる判断対象の波形ベクトルがどの既知波形ベクトルの音源群に含まれるものであるかを推定して判断するものである。   This signal determination apparatus prepares, for example, a waveform vector related to an acoustic signal obtained by collecting a plurality of types of sounds from a sound source whose generation cause is apparent as a known waveform vector (reference space), and is a determination target. A waveform vector relating to an acoustic signal obtained by collecting sound of a sound source whose source is unknown is taken in as a determination target waveform vector, and a distance measure (for example, Mahalanobis distance) between the waveform vector and the known waveform vector is calculated. Then, by comparing the distance measure of the determination target waveform vector with a threshold for determination set based on distance measure data for each cause of the known waveform vector, the sound source of which known waveform vector It is to judge by estimating whether or not it is included in the group.

特開2002−323370号公報JP-A-2002-323370 特開2002−318155号公報JP-A-2002-318155 特開平9−81180号公報JP-A-9-81180

しかしながら、このような信号判断装置にあっては、次のような課題がある。   However, such a signal determination device has the following problems.

すなわち、判断対象となる音源の音響信号に関する距離測度がその音源の発生原因ごとに異なった特定の数値領域にそれぞれ規則的に分布する場合であれば、前記した閾値との比較により発生原因を正確に判断することが可能である。ところが、その距離測度が発生原因の異なる音源の数値領域の一部に入り込むように分布する特性をもつ音源が存在する場合には、当該音源とその他の音源との距離測度どうしが逆転した大小関係となる(総合すると、一部の数値領域で重なり合った状態で分布することになる)ため、それら音源の発生原因を前記閾値との比較によって判別することができなくなる。   In other words, if the distance measure related to the sound signal of the sound source to be determined is regularly distributed in a specific numerical region that differs for each cause of the sound source, the cause of the occurrence can be accurately determined by comparison with the above-described threshold. It is possible to judge. However, if there is a sound source whose characteristics are distributed so that the distance measure enters a part of the numerical range of the sound source having a different cause, the magnitude relationship in which the distance measures between the sound source and the other sound sources are reversed (Collectively, they are distributed in a state of being overlapped in some numerical regions), so that it is impossible to determine the cause of generation of these sound sources by comparison with the threshold.

図11は、前記信号判断装置により画像形成装置の音源判別を行った場合における各音源の距離測度(マハラノビス距離)の計測結果を示すものである。この図に示すように、発生原因が明らかな、金属部材の衝突音、プラスチック部材の衝突音および用紙音(用紙先端部衝突音と用紙後端部はね音)という3つの音源の各距離測度は、そのいずれのサンプルについてもほぼ同じ数値領域に規則的に繰り返して分布する。これに対して、その用紙音のうち特に用紙の搬送方向後端部のはね音の距離測度について見ると、そのサンプルによってはときどき用紙先端部衝突音の距離測度の数値領域に入り込む(逆転する)ように分布することがある。このため、用紙先端部衝突音と用紙後端部はね音については、一定の閾値を用いて単純に判別することができない場合が発生するのである。   FIG. 11 shows a measurement result of a distance measure (Maharanobis distance) of each sound source when the sound source determination of the image forming apparatus is performed by the signal determination device. As shown in this figure, the distance measures of three sound sources, the sound of collision of a metal member, the sound of collision of a plastic member, and the sound of paper (the sound of collision of the paper front end and the sound of the rear end of paper), for which the causes are apparent. Are regularly and repeatedly distributed in substantially the same numerical range for any of the samples. In contrast, looking at the distance measure of the spring sound at the rear end of the paper in the transport direction of the paper sound, depending on the sample, it sometimes enters the numerical range of the distance measure of the paper front end collision sound (reversed). ). For this reason, the paper front end collision sound and the paper rear end bounce may not be simply discriminated using a certain threshold value.

なお、従来においては、音源の周波数成分の識別に加えて音源の継続時間の差異を測定する音源認識装置に関する提案がある(特許文献3)。この認識装置は、音源(例えば短いクラクションと長いクラクション)をその音信号の継続時間の違いによっても認識できるようにしたものである。継続時間とは、音信号がある電圧レベルを超えてそれ以下になるまでの経過時間を示している。   In addition, conventionally, there is a proposal regarding a sound source recognition device that measures a difference in duration of a sound source in addition to identification of a frequency component of the sound source (Patent Document 3). This recognition device is capable of recognizing a sound source (for example, a short horn and a long horn) based on a difference in duration of a sound signal. The duration indicates an elapsed time from the time when the sound signal exceeds a certain voltage level to the time when the sound signal becomes lower than the voltage level.

しかし、この認識装置であっても、前述したような距離測度がランダムに分布するような音源の判別を行うことは困難である。つまり、衝撃音のような音は、例えば衝突する部材の条件(表面硬度など)が異なると、その音圧の振幅の立ち上がり曲線や減衰極性などの過渡的な特性に大きな差異があることが知られており、その音信号の継続時間を単に計測しただけでは時間経過に伴う特性に現われる特徴を総合的に判断して判別できないのである。   However, even with this recognition device, it is difficult to determine a sound source in which the distance measures are randomly distributed as described above. In other words, it is known that a sound such as an impact sound has a large difference in a transient characteristic such as a rising curve of the amplitude of the sound pressure or an attenuation polarity when the conditions (surface hardness and the like) of the colliding member are different. Therefore, simply measuring the duration of the sound signal cannot comprehensively judge the characteristics appearing in the characteristics with the passage of time.

本発明は、このような事情に鑑みてなされたものであり、その主な目的とするところは、発生原因が不明な判別対象の音源として、その発生音が種々の要因で安定せず異なってしまうような特性を示す音源が存在する場合であっても、かかる音源からの音(主に衝撃音)の発生原因についても適切に判別することができる音源判別装置と音源判別方法を提供することにある。   The present invention has been made in view of such circumstances, and a main object thereof is that, as a sound source to be determined whose source of occurrence is unknown, the generated sound is different due to various factors without being stabilized. Provided is a sound source discriminating apparatus and a sound source discriminating method capable of appropriately discriminating a cause of generation of a sound (mainly an impulsive sound) from a sound source even when a sound source exhibiting such characteristics exists. It is in.

本発明の音源判別装置は、音源からの音を収音して音響信号として取り込む収音部と、この取り込んだ音響信号から判別対象となる音部分の音響信号を複数個分切り出す音切り出し部と、この切り出した複数個の音響信号どうしの波形の類似性を示す指標を演算する類似性演算部と、この演算された波形の類似性指標について、予め発生原因が明らかな音源の発生原因別の各音響信号に関する波形の類似性指標に基づいて設定された判別用の閾値と比較して判別対象の音源の発生原因を判断する判断部とを有することを特徴とするものである。   A sound source discriminating apparatus of the present invention includes a sound pickup unit that picks up sound from a sound source and takes in the sound signal as a sound signal, and a sound cutout unit that cuts out a plurality of sound signals of a sound portion to be determined from the taken sound signal. A similarity calculation unit that calculates an index indicating the similarity of the waveforms of the plurality of cut-out sound signals, and a similarity index of the calculated waveform, for each of the causes of the sound source whose cause is apparent in advance. A determination unit configured to determine a cause of generation of a sound source to be determined by comparing with a threshold for determination set based on a similarity index of a waveform regarding each acoustic signal.

収音部は、例えば、所定の音源から発せられる音を電気信号からなる音響信号として捕捉することが可能なマイクロフォンにて構成できる。収音部は、マイクロフォンに加えて、マイクロフォンで取り込んだ音響信号を記憶・格納することが可能なデータ記憶部とで構成することも可能である。このように構成した場合には、音の収録だけを先に実施し、その後で収録した音響波形の分析や演算に関する処理を一括してオフライン処理することができる。データ記憶部としては、音響信号をアナログ/デジタル(A/D)交換器にて変換し、デジタル信号として記憶・格納することが可能なDAT(Digital Audio Taperecorder)やHD(Hard Disc)装置やMD(Mini Disc)レコーダなどを採用するとよい。収音する音は、判断対象となる発生原因が不明な音源からの音や、発生原因が明らかな音源からの音である。   The sound collection unit can be configured by, for example, a microphone that can capture a sound emitted from a predetermined sound source as an acoustic signal composed of an electric signal. The sound collection unit may be configured by a data storage unit capable of storing and storing an acoustic signal captured by the microphone, in addition to the microphone. In the case of such a configuration, only the recording of the sound can be performed first, and then the processing related to the analysis and calculation of the recorded acoustic waveform can be collectively performed off-line. As a data storage unit, a DAT (Digital Audio Taperecorder), an HD (Hard Disc) device, or an MD capable of converting an audio signal by an analog / digital (A / D) exchanger and storing / storing it as a digital signal. (Mini Disc) Recorder should be used. The sound to be picked up is a sound from a sound source whose generation cause to be determined is unknown or a sound from a sound source whose generation cause is clear.

音切り出し部は、収音部で取り込んだ音響信号から判別対象となる音部分の音響信号を複数個分繰り返して切り出すが、その切り出しは音響信号における波形の立ち上がり部や振幅最大部などとなる時間軸上の波形特徴部分を基準に設定される所定の範囲に対して行われる。この切り出す個数は、判別対象となる音部分の類似性を算出することが可能な数量であればよく、2個でも構わないが、少なくとも3個以上であることが好ましい。このような音切り出し部は、例えば、PC(パーソナルコンピュータ)に取り込む音響解析用ソフトウェアや、トリガー機能を備えたデータロガーなどにより構成することができる。   The sound cutout unit repeatedly cuts out a plurality of sound signals of the sound portion to be determined from the sound signal captured by the sound pickup unit, and the cutout is performed at a time when a rising portion or a maximum amplitude portion of the waveform of the sound signal is obtained. This is performed for a predetermined range set based on the waveform feature on the axis. The number of cutouts may be any number as long as the similarity of the sound part to be determined can be calculated, and may be two, but is preferably at least three or more. Such a sound extraction unit can be configured by, for example, software for acoustic analysis to be loaded into a PC (personal computer), a data logger having a trigger function, and the like.

判別対象の音部分は、本発明による判別方式により発生原因の判別ができるものであればよく、主に衝撃音である。衝撃音としては、その音響持続時間が1秒(sec)以下、好ましくは100m秒(msec)以下となる音である。この判別対象の音部分を切り出すためには、上記収音部において当該音部分が少なくとも所定の個数分だけ含まれる量の音を(繰り返して発生させて)予め取り込んでおく必要があることはいうまでもない。   The sound portion to be discriminated is only required to be capable of discriminating the cause of occurrence by the discrimination method according to the present invention, and is mainly an impact sound. The impact sound is a sound having a sound duration of 1 second (sec) or less, preferably 100 msec (msec) or less. In order to cut out the sound part to be discriminated, it is necessary to preliminarily capture (by repeatedly generating) sounds of at least a predetermined number of the sound parts in the sound collection unit. Not even.

また、音切り出し部は、上記切り出しを行う前に取り込んだ音響信号を所定の補正フィルタにより聴感補正する聴感補正部を備えたものでもよい。その補正フィルタとしては、低周波の暗騒音成分を除去するためのハイパスフィルタや、他の独自に定める特性フィルタを使用することもできるが、一般的に人の聴覚に近いといわれているA特性フィルタを用いることが好ましい。さらに、切り出した音響信号については、その時間波形の振幅の最大値や最小値が所定の大きさとなるように振幅を基準化するように構成するとよい。   Further, the sound clipping section may be provided with an audibility correction section that corrects the audibility of the audio signal captured before performing the clipping with a predetermined correction filter. As the correction filter, a high-pass filter for removing a low-frequency background noise component or another characteristic filter uniquely determined can be used, but the A characteristic which is generally said to be close to human hearing is used. Preferably, a filter is used. Further, the cut-out sound signal may be configured so that the amplitude is normalized so that the maximum value or the minimum value of the amplitude of the time waveform becomes a predetermined value.

類似性演算部は、判別対象の音部分について切り出した複数個の音響信号どうしの波形に関する類似性を示す指標を演算するが、その波形類似性については音響信号の波形特性(経時的な音圧変動特性または周波数変動特性など)を互いに対比してその類似する度合いを分析するようにすればよい。この類似性演算部では、発生原因が明らかな音源から収音して得る複数個分の音響信号どうしの波形に関する類似性の指標についても演算する。   The similarity calculation unit calculates an index indicating the similarity between the waveforms of the plurality of audio signals cut out from the sound part to be determined, and determines the waveform similarity based on the waveform characteristics of the audio signal (sound pressure over time). Variation characteristics or frequency variation characteristics) may be compared with each other and the degree of similarity may be analyzed. The similarity calculation unit also calculates a similarity index related to waveforms of a plurality of acoustic signals obtained by collecting sounds from a sound source whose occurrence is apparent.

音圧変動特性については、一般的な音響解析装置、音響波形解析ソフトウェア等の分析手段を用いて演算することができる。一方、周波数変動特性については、FFT解析、ウエーブレット解析、一般化調和解析などの一般的な周波数分析手段を用いて演算することができる。また、周波数変動特性により類似性を分析する場合には、その分析対象となる時間波形に対してハニングウインドウ、ハミングウインドウ、フラットトップウインドウ等の窓関数による窓関数処理を施すように構成してもよい。このような処理を施すことにより、折り返し誤差や漏れ誤差等の周波数分析上の問題を軽減し、実状に即した周波数特性の演算を行うことができるようになる。   The sound pressure fluctuation characteristics can be calculated using analysis means such as a general acoustic analysis device and acoustic waveform analysis software. On the other hand, the frequency fluctuation characteristics can be calculated using general frequency analysis means such as FFT analysis, wavelet analysis, and generalized harmonic analysis. Further, when the similarity is analyzed based on the frequency fluctuation characteristics, a window function process using a window function such as a Hanning window, a Hamming window, or a flat top window may be performed on the time waveform to be analyzed. Good. By performing such processing, problems in frequency analysis such as aliasing errors and leakage errors can be reduced, and calculation of frequency characteristics in accordance with actual conditions can be performed.

上記波形の類似性については、一般的な相関係数や統計学上の空間距離などを指標として用いることで算出される。   The similarity of the waveforms is calculated by using a general correlation coefficient, a statistical spatial distance, or the like as an index.

類似性を示す指標として相関係数を用いる場合には、収音して得る各音響信号の複数分のデータ(デジタル信号:演算処理するためのデータとして表現される数値列や数値行列)についての平均、共分散、標準偏差などを予め求めた後に相関係数を算出し、その相関係数の値を音響信号(変量)どうしの類似性の有無やその度合いの判断基準とする。つまり、相関係数が0に近い値になるほど音響信号どうしの相関がなく、類似性の度合いが低い傾向にあることがわかり、また相関係数が1に近い値になるほど音響信号どうしの相関があり、類似性の度合いが高い傾向にあることがわかる。   When a correlation coefficient is used as an index indicating similarity, a plurality of pieces of data (digital signal: a numerical sequence or a numerical matrix expressed as data for arithmetic processing) of each acoustic signal obtained and collected are used. A correlation coefficient is calculated after calculating an average, a covariance, a standard deviation, and the like in advance, and the value of the correlation coefficient is used as a criterion for determining whether or not there is similarity between acoustic signals (variates) and the degree thereof. In other words, it can be seen that the closer the correlation coefficient is to a value of 0, the less the correlation between the audio signals is, and the lower the degree of similarity is. The closer the correlation coefficient is to a value of 1, the more the correlation between the audio signals is. It can be seen that the degree of similarity tends to be high.

空間距離を演算するための距離の測度としては、統計学上の判別分析やクラスター分析で用いられる一般的な距離測度、例えば、ユークリッドの距離、標準化ユークリッドの距離、ミンコフスキーの距離、マハラノビスの距離等を用いることができる。例えば、類似性を示す指標としてマハラノビスの距離を使用する場合、収音して得る各音響信号の複数個分のデータについての平均、分散、共分散などを予め求めた後にマハラノビス距離を算出し、そのマハラノビス距離の値を音響信号(変量)どうしの相関の程度を表す指標として利用して類似性の有無やその度合いの判断基準とする。   As the distance measure for calculating the spatial distance, general distance measures used in statistical discriminant analysis and cluster analysis, for example, Euclidean distance, standardized Euclidean distance, Minkowski distance, Mahalanobis distance, etc. Can be used. For example, when Mahalanobis distance is used as an index indicating similarity, the average, variance, covariance, etc., of a plurality of data of each acoustic signal obtained by sound collection are calculated in advance, and then the Mahalanobis distance is calculated. The value of the Mahalanobis distance is used as an index indicating the degree of correlation between acoustic signals (variates), and is used as a criterion for determining the presence or absence of similarity and the degree.

判断部は、判断対象の音源の発生原因を判断する前処理として、予め発生原因が明らかな音源の音に関する波形の類似性指標が求められる。この発生原因が明らかな音源とは、判断対象の音源から放射される可能性のある発生原因別の音(可動部品やその動作に関連する部品などを要因とする音)を前記収音部においてそれぞれ収音して音響信号として複数個分採取し、その発生原因ごとの音響信号どうしの波形類似性を示す指標が前記類似性演算部にて算出されて用意される。この採取する音の個数は、判別対象の音源から採取する音の個数と同数であっても、あるいはそれよりも少ない数であってもよい。このようにして得られる発生原因別の音源の波形類似性指標に関する全データに基づいて、その発生原因別の音源について区別するに適当な指標値を判別用の閾値として適宜設定する。例えば、類似性指標として相関係数などを使用した場合には、相関係数が互いに近い値を示す発生原因が異なる音どうしの両相関係数の中間値を閾値として設定することができる。   As a pre-process for determining the cause of the sound source to be determined, the determination unit obtains in advance a similarity index of a waveform related to the sound of the sound source whose cause is apparent. The sound source of which the cause is apparent is a sound generated by the cause that may be emitted from the sound source to be determined (a sound caused by a movable part or a part related to its operation) in the sound collection unit. A plurality of sound signals are collected and collected as a plurality of sound signals, and an index indicating a waveform similarity between the sound signals for each cause of occurrence is calculated and prepared by the similarity calculation unit. The number of sounds to be collected may be the same as or smaller than the number of sounds to be collected from the sound source to be determined. On the basis of all data on the waveform similarity index of the sound source of each occurrence cause obtained in this way, an index value suitable for distinguishing the sound source of each occurrence cause is appropriately set as a threshold for determination. For example, when a correlation coefficient or the like is used as the similarity index, an intermediate value between both correlation coefficients of sounds having different correlations and having different causes can be set as the threshold.

そして、判断部では、類似性演算部で演算された判断対象の音源の波形に関する類似性指標を予め用意した上記判別用の閾値と比較することで、その判断対象の音源の発生原因を推定して判断する。   Then, the determining unit estimates the cause of occurrence of the sound source to be determined by comparing the similarity index calculated by the similarity calculating unit with respect to the waveform of the sound source to be determined with the prepared threshold for determination. To judge.

一方、本発明の音源判別方法は、音源からの音を収音して音響信号として取り込む収音工程と、この取り込んだ音響信号から判別対象となる音部分の音響信号を複数個分切り出す音切り出し工程と、この切り出した複数個の音響信号どうしの波形の類似性を示す指標を演算する類似性演算工程と、この演算された波形の類似性指標について、予め発生原因が明らかな音源の発生原因別の各音響信号に関する波形の類似性指標に基づいて設定された判別用の閾値と比較して判別対象の音源の発生原因を判断する判断工程とを有することを特徴とするものである。   On the other hand, the sound source discrimination method of the present invention includes a sound collecting step of collecting sound from a sound source and taking it as an acoustic signal, and a sound cutout for cutting out a plurality of sound signals of a sound portion to be determined from the taken sound signal. A process and a similarity calculating step of calculating an index indicating the similarity of the waveforms of the plurality of cut-out sound signals; and a cause of generation of the sound source whose cause is apparent in advance with respect to the calculated similarity index of the waveform. A determination step of determining the cause of generation of a sound source to be determined by comparing with a threshold for determination set based on a similarity index of a waveform for each of the other audio signals.

この判別方法における各工程は、前記した音源判別装置における各機能部(収音部、音切り取り部、類似性演算部、判別部)の動作によって実現することができる。   Each step in this determination method can be realized by the operation of each functional unit (sound collection unit, sound cutout unit, similarity calculation unit, determination unit) in the above-described sound source determination device.

本発明の音源判別装置およびその判別方法は、発生原因が不明な複数種の音源を有する音源のうち、特にその発生音が種々の要因で安定せず異なってしまうような特性を示す音源を含む音源の発生原因判別時に適用すると有効である。発生音が種々の要因で安定せず異なる特性の音源を含む音源とは、例えば、同じ発生原因の音源であるにもかかわらず、その発生音が繰り返して発生させた場合に安定せず異なるような音源である。このような特殊な音源を含む音源としては、発生原因が不明な音源が筐体の内部に存在する複数種の音源が挙げられ、具体的には例えば前記した画像形成装置が挙げられる。画像形成装置に対する音源判別を行う場合には、特にその画像形成に使用する用紙に関連する音(用紙先端部の衝突音、用紙後端部のはね音など)を正確に判別すること可能となる。   The sound source discriminating apparatus and the discriminating method of the present invention include, among sound sources having a plurality of types of sound sources whose causes are unknown, particularly sound sources that exhibit characteristics such that the generated sound is not stable due to various factors and differs. This is effective when applied when determining the cause of the sound source. A sound source that is not stable due to various factors and includes a sound source having a different characteristic is, for example, a sound source that has the same cause but does not stabilize when the generated sound is repeatedly generated. Sound source. Examples of the sound source including such a special sound source include a plurality of types of sound sources in which a sound source whose occurrence is unknown is present inside the housing, and specifically, for example, the above-described image forming apparatus. In the case of performing a sound source determination for an image forming apparatus, it is possible to accurately determine a sound (a collision sound at a leading edge of a sheet, a splashing sound at a trailing edge of a sheet, and the like) particularly related to a sheet used for the image formation. Become.

このような音源判別装置およびその判別方法によれば、発生原因が不明な音源の音(衝撃音など)を繰り返して発生させて複数個分採取し、その繰り返した各音の音響信号どうし間における波形の類似性から当該音源の発生原因が判別される。このように発生原因が不明な音源の音について、その時間に対する波形特性(音圧変動特性や周波数特性など)そのものではなく、かかる波形特性の繰り返し間での類似性を指標として発生原因を判別することなる。   According to such a sound source discriminating apparatus and its discriminating method, a sound (an impact sound or the like) of a sound source whose generation source is unknown is repeatedly generated, a plurality of sounds are collected, and a sound signal of each of the repeated sounds is generated. The cause of the sound source is determined from the similarity of the waveforms. For the sound of the sound source whose origin is unknown as described above, the cause of occurrence is determined based on the similarity between repetitions of the waveform characteristics, not the waveform characteristics itself (sound pressure fluctuation characteristics, frequency characteristics, etc.) over time. Different.

これにより、発生音が種々の要因で安定せず異なってしまうような特性の音源を含む音源の判別を行う場合であっても、音源の繰り返し発生時における波形の類似特性を基準に行う比較的簡易な波形比較処理により精度の高い音源判別が可能になる。   Accordingly, even when a sound source including a sound source having a characteristic in which a generated sound is not stable due to various factors and is different is determined, a relatively similar sound waveform generated when a sound source is repeatedly generated is used as a reference. A simple waveform comparison process enables highly accurate sound source discrimination.

図8〜図10は、本発明の判別装置および方法を適用し、複写機から放射される3種の音を2回ずつ繰り返して測定した時間−音圧波形を示すものである。図8はソレノイドの動作音の波形、図9は用紙先端部の衝突音の波形、図10は用紙後端部のはね音の波形をそれぞれ示す。また、各図の欄外には波形どうしの類似性を示す指標として相関係数rを併記している。これらの図からわかるように、ソレノイドの動作音はその2つの波形の類似性が高い(r=0.76)のに対し、用紙後端部のはね音はその波形の類似性が低く(r=0.43)、用紙先端部の衝突音はその波形の類似性が両音の類似性を基準にしてみると中間的なレベルにある(r=0.62)ことが明らかである。このような違いが発生するのは以下の理由によるものと推考される。   FIGS. 8 to 10 show time-sound pressure waveforms obtained by applying the discriminating apparatus and the method of the present invention and measuring three kinds of sounds emitted from the copying machine by repeating twice. 8 shows the waveform of the operating sound of the solenoid, FIG. 9 shows the waveform of the collision sound at the leading end of the sheet, and FIG. 10 shows the waveform of the splashing sound at the trailing end of the sheet. In addition, a correlation coefficient r is also written in the margin of each figure as an index indicating the similarity between waveforms. As can be seen from these figures, the operation sound of the solenoid has a high similarity between the two waveforms (r = 0.76), whereas the spring sound at the rear end of the paper has a low similarity in the waveforms (r = 0.76). r = 0.43), it is clear that the similarity of the waveform of the impact sound at the leading edge of the sheet is at an intermediate level (r = 0.62) when the similarity between the two sounds is used as a reference. It is inferred that such a difference occurs for the following reasons.

すなわち、ソレノイド等の可動部品の動作音は、その構成部品が金属やプラスチックなどの比較的剛性の高い材料で主に構成されているため可動時に構成部品どうしの衝突状態などが毎回安定し、その結果、構成部品どうしが衝突等することで発生する音も毎回ほぼ安定して再現される傾向にあるためと考えられる。これに対し、用紙に関連する音は、用紙そのものの剛性が低いため音が発生する際の用紙の変形状態や振動状態などが安定せず、その結果、音発生時毎に生じる音も異なって発生する傾向にあるためと考えられる。   In other words, the operating noise of a movable part such as a solenoid is stable because the components are mainly composed of a relatively rigid material such as metal or plastic. As a result, it is considered that the sound generated by the collision of the components tends to be reproduced almost stably every time. On the other hand, the sound related to the paper is not stable due to the low rigidity of the paper itself, and the deformation state and the vibration state of the paper when the sound is generated are unstable. As a result, the sound generated each time the sound is generated differs. This is probably due to the tendency to occur.

また、用紙に関連する音どうしについては、まず用紙先端部の衝突音は、単に用紙の位置合わせ部品等との衝突現象により紙自身が紙面方向に振動することで発生するものであり、後述するはね音のように用紙自体が大きく変形することで発生するものでないため比較的似通った音として発生する傾向にあるためと考えられる。これに対し、用紙後端部のはね音は、例えばその後端部が数mm〜数十mm程度変形しながら段差部などを乗り上げて通過するときに弾かれるような挙動現象により発生するものであり、その変形度合いの違いに応じて発生する音の波形も変化してしまう傾向にあるためと考えられる。実際、複写機内を搬送される用紙の後端部がはねる様子を観察したところ、その用紙後端部の変形状態が画像形成サイクル毎に変化することが確認されている。   In addition, regarding the sounds related to the paper, first, the collision sound of the leading end of the paper is generated by the paper itself vibrating in the direction of the paper surface due to a collision phenomenon with a paper positioning component or the like, and will be described later. This is probably because the sound itself does not occur due to the large deformation of the sheet itself as in the case of a splash sound, and tends to occur as a relatively similar sound. On the other hand, the sound of the trailing edge of the paper is generated by a behavior phenomenon that the trailing edge is repelled when riding over a stepped portion while passing over a stepped portion while being deformed by several mm to several tens of mm. This is considered to be because the waveform of the generated sound tends to change according to the difference in the degree of deformation. In fact, by observing the manner in which the trailing edge of the paper conveyed in the copying machine flies, it has been confirmed that the deformation state of the trailing edge of the paper changes every image forming cycle.

このような事実からも見ても、判別対象の音源からの音を複数回繰り返して発生させ、その複数回分の音(音響信号)どうしの波形の類似性を調べて対比すれば、その音源の発生原因を推定して判別できることが明らかである。   In view of this fact, the sound from the sound source to be determined is repeatedly generated a plurality of times, and the similarity of the waveforms of the sounds (acoustic signals) for the plurality of times is examined and compared. It is clear that the cause of occurrence can be estimated and determined.

以上説明したように、本発明の音源判別装置および判別方法によれば、発生原因が不明な判別対象の音源として、その発生音が種々の要因で安定せず異なってしまうような特性を示す音源が存在する場合であっても、かかる音源からの音の発生原因についても適切に判別することができる。例えば、画像形成装置において発生する用紙後端部のはね音のような音源が存在しても、そのはね音と用紙先端部の衝突音との発生原因の判別を適正に行うことが可能となる。   As described above, according to the sound source discriminating apparatus and the discriminating method of the present invention, as a sound source of a discrimination target whose generation cause is unknown, a sound source whose sound is not stable due to various factors and has different characteristics , The cause of the sound from such a sound source can be properly determined. For example, even if there is a sound source such as a back sound at the rear end of the paper generated in the image forming apparatus, it is possible to appropriately determine the cause of the occurrence of the bounce and the collision sound at the front end of the paper. It becomes.

《実施の形態1》
図1は、本発明の実施例に係る音源判別システム100の構成を説明するものである。この音源判別システム100が判別する対象とする音源は、複写機Tから放射される騒音である。
<< Embodiment 1 >>
FIG. 1 illustrates a configuration of a sound source discrimination system 100 according to an embodiment of the present invention. The sound source to be determined by the sound source determination system 100 is noise radiated from the copying machine T.

そして、この判別システム100は、その騒音の原因が原因(1):可動部品(ソレノイド)の動作音、原因(2):記録用紙の搬送方向先端部の衝突音、原因(3):記録用紙の搬送方向後端部のはね音のいずれであるかを判断するものである。このような発生原因の音の判別を行うのは以下の観点から決定したものである。まず、メーカーや機種が異なる20種類の既存の複写機やプリンタを対象に、これらの画像形成装置から放射される約100種類の衝撃音の発生原因を入念に調べたところ、上記原因(1)に該当する音が「42」、原因(2)に該当する音が「18」、原因(3)に該当する音が「25」という割合で比較的多く発生することが判明した。このため、かかる画像形成装置の騒音中における衝撃音の発生が問題になった際に、その3種類の音のいずれに該当する音なのかが明らかになれば、その騒音対策を講じる上で非常に有用であるからである。   In this discrimination system 100, the cause of the noise is cause (1): operation sound of a movable part (solenoid), cause (2): collision sound at the leading end of the recording paper in the transport direction, cause (3): recording paper This is to judge which of the bounces is at the rear end in the transport direction. The determination of the sound of such a cause is made from the following viewpoints. First, the cause of about 100 types of impulsive sounds radiated from these image forming apparatuses was carefully examined for 20 types of existing copiers and printers of different manufacturers and models. It has been found that the sound corresponding to the cause "42", the sound corresponding to the cause (2) is "18", and the sound corresponding to the cause (3) is "25" relatively frequently. For this reason, when the generation of an impact sound in the noise of such an image forming apparatus becomes a problem, if it is clear which of the three types of sounds corresponds, it is very important to take measures against the noise. It is useful for

信号判断システム100の全体は、複写機Tからの騒音を収音する収音手段としてのマイクロフォン1と、マイクロフォン1に接続されるDAT2と、DAT2に接続されるパーソナルコンピュータシステムCとから構成される。さらにこのパーソナルコンピュータシステムCは、コンピュータ本体3と、入力手段としてのキーボード4a、マウス4b、出力手段としてのディスプレイ装置5などを備えている。   The entire signal determination system 100 includes a microphone 1 as sound collecting means for collecting noise from the copying machine T, a DAT 2 connected to the microphone 1, and a personal computer system C connected to the DAT 2. . Further, the personal computer system C includes a computer main body 3, a keyboard 4a and a mouse 4b as input means, a display device 5 as output means, and the like.

このコンピュータ本体3内のハードウェア資源としては、演算制御手段としてのCPU、主記憶手段としてのRAM、補助記憶手段としてのハードディスク、入出力制御装置など(いずれも図示せず)を有し、コンピュータ本体3内のソフトウェア資源としては、オペレーティングシステム、音響波形解析ソフトウェア、数値解析ソフトウェアなど(いずれも図示せず)を有している。このハードウェア資源とソフトウェア資源との共同作業により、次の図2に示す波形切り出し部30、波形類似性演算部40および判断部50の各機能を実現している。   The hardware resources in the computer main body 3 include a CPU as operation control means, a RAM as main storage means, a hard disk as auxiliary storage means, an input / output control device (all not shown), and the like. The software resources in the main body 3 include an operating system, acoustic waveform analysis software, numerical analysis software, and the like (all not shown). By the joint work of the hardware resources and the software resources, the functions of the waveform cutout unit 30, the waveform similarity calculation unit 40, and the determination unit 50 shown in FIG. 2 are realized.

図2は、この判別システム100の基本的な機能ブロック図である。この判別システム100における基本的な機能は、処理の流れに沿って順に、マイクロフォン1等で構成される収音部10と、DATレコーダ2で構成されるデータ記憶部20と、コンピュータ本体3で構成される波形切り出し部30、波形類似性演算部40および判断部50と、ディスプレイ装置5で構成される表示部60とである。これらの機能ブロックどうしで入出力される信号は、アナログ電気信号AS、デジタル信号DS、判断結果Rである。   FIG. 2 is a basic functional block diagram of the determination system 100. The basic functions of the discrimination system 100 are, in order, along a processing flow, a sound collection unit 10 including a microphone 1, a data storage unit 20 including a DAT recorder 2, and a computer main unit 3. A waveform cutout unit 30, a waveform similarity calculation unit 40 and a determination unit 50, and a display unit 60 configured by the display device 5. Signals input and output between these functional blocks are an analog electric signal AS, a digital signal DS, and a determination result R.

図3は図2に示した波形切り出し部30の構成を、図4は図2に示した類似性演算部40の構成をそれぞれより詳細に示した機能ブロック図である。   FIG. 3 is a functional block diagram showing the configuration of the waveform cutout unit 30 shown in FIG. 2, and FIG. 4 is a functional block diagram showing the configuration of the similarity calculation unit 40 shown in FIG. 2 in more detail.

波形切り出し部30は、図3に示すように、聴感補正部31、繰り返し音検出部32、繰り返し波形切り出し部33および振幅基準化部34を備えている。類似性演算部40は、図4に示すように、繰り返し波形のベクトルを生成する波形ベクトル演算部41と、その波形ベクトルについての平均値、分散、標準偏差等を算出して、波形の類似性指標としての相関係数rを演算する相関係数演算部42とを備えている。波形切り出し部30および類似性演算部40の各機能ブロックどうしで入出力される信号はいずれも、デジタル信号(具体的にはPC内の内部データとして表現される数値列)である。   As shown in FIG. 3, the waveform cutout unit 30 includes an audibility correction unit 31, a repeated sound detection unit 32, a repeated waveform cutout unit 33, and an amplitude standardization unit 34. As shown in FIG. 4, the similarity calculator 40 calculates a mean value, a variance, a standard deviation, and the like of the waveform vector, and calculates the similarity of the waveforms. A correlation coefficient calculator 42 for calculating a correlation coefficient r as an index. The signals input and output between the functional blocks of the waveform cutout unit 30 and the similarity calculation unit 40 are all digital signals (specifically, a numerical sequence represented as internal data in a PC).

判断部50は、判別対象の音に関して演算した相関係数r(の平均値)と、予め用意して記憶されている判別用の閾値との比較を行い、どの発生原因の音源であるか否かを判断する。閾値は、予め発生原因が明らかな音源の発生原因別の繰り返し波形に関する類似性指標としての相関係数r(の平均値)を求め、その発生原因別の各平均相関係数に基づいて適宜設定され、判断部に記憶されている。   The determination unit 50 compares the correlation coefficient r (the average value) calculated for the sound to be determined with a threshold for determination that is prepared and stored in advance, and determines whether the sound source is the sound source that caused the sound. Judge. The threshold value is set in advance based on a correlation coefficient r (average value) as a similarity index related to a repetitive waveform for each cause of the sound source whose cause is apparent and is appropriately set based on each average correlation coefficient for each cause. And stored in the determination unit.

次に、この音源判別システム100の基本的な動作について説明する。   Next, a basic operation of the sound source determination system 100 will be described.

まず、図5に示すように、音源判別システム100の使用に先立って、予め前処理がなされる(ステップS1)。   First, as shown in FIG. 5, prior to using the sound source determination system 100, preprocessing is performed in advance (step S1).

この前処理では、発生原因が明らかな各発生原因(1)〜(n)別の音を波形ベクトルとして所定の繰り返し数量分(m個)だけ得て、その各原因(1)〜(n)毎に、しかも繰り返し単位毎に平均ベクトルμ(1)〜(n)、共分散ベクトルs(1)〜(n)、標準偏差ベクトルσ(1)〜(n)をそれぞれ演算した後、同じ発生原因の音の各繰り返し単位間おける相関係数r(1)〜(n)を求め、その結果を判断部50に記憶する。ここで上記相関係数は、データ列(xi,yi)の相関係数rxyとして表した場合、rxy=sxy/(σx・σy)となる。また、判別部50には、その各原因別の相関係数r(1)〜(n)の各平均値(r´)に基づいて近接する平均相関係数r´どうし間における中間値を閾値THとしてそれぞれ設定して記憶保持しておく。 In this pre-processing, each of the causes (1) to (n) having a clear cause is obtained as a waveform vector for a predetermined repetition quantity (m), and each of the causes (1) to (n) is obtained. After calculating the average vector μ (1) to (n), the covariance vector s (1) to (n), and the standard deviation vector σ (1) to (n) for each repetition unit, The correlation coefficients r (1) to (n) between the respective repetition units of the sound of the cause are obtained, and the results are stored in the determination unit 50. Here, when the correlation coefficient is expressed as a correlation coefficient r xy of the data sequence (x i , y i ), r xy = s xy / (σ x · σ y ). Further, the discriminating unit 50 sets an intermediate value between adjacent average correlation coefficients r ′ based on the average value (r ′) of the correlation coefficients r (1) to (n) for each cause as a threshold value. TH is set and stored.

本実施例では、前記した原因(1)、原因(2)および原因(3)からなる3種類の発生原因を判別するものであるためn=3である。また、ひとつの原因に対して10回のサンプル音響信号を取り込んだためm=10である。発生原因が明らかな上記原因(1)〜(3)ごとの音は次のように発生させた。原因(1)については、サイズや駆動力が異なる複数のソレノイドを様々な条件で順次動作させることにより発生させた。原因(2)については、坪量やサイズが異なる種々の用紙をその用紙搬送速度を変えて平板やロール周面の一側面(軸方向に沿う面)に用紙先端部から衝突させることにより発生させた。原因(3)については、坪量やサイズが異なる種々の用紙をその用紙搬送速度を変えて様々な曲率や段差を有する用紙搬送路を通過させて用紙後端部のはね音を発生させた。   In the present embodiment, n = 3 because three types of occurrence causes, which are the cause (1), cause (2), and cause (3), are determined. Further, m = 10 because ten sampled sound signals were taken in for one cause. The sound for each of the above causes (1) to (3), for which the cause of occurrence is clear, was generated as follows. The cause (1) was generated by sequentially operating a plurality of solenoids having different sizes and driving forces under various conditions. The cause (2) is caused by causing various types of paper having different basis weights or sizes to collide with one side surface (surface along the axial direction) of a flat plate or a roll peripheral surface from the leading end of the paper while changing the paper conveyance speed. Was. Regarding the cause (3), various papers having different basis weights and sizes were caused to pass through a paper transport path having various curvatures and steps by changing the paper transport speed, thereby generating a backlash at the rear end of the paper. .

そして、この各原因別の音は、上記各条件を種々変えることで計100通りの条件下の音として発生させた。そして、その各音を前記繰り返し数量分だけ収音した。また、その原因別の各音の相関係数を求めるまでの各演算は類似性演算部40において行う。各発生原因の音の相関係数は、その発生原因ごとに収音した100通りの音の相関係数を発生原因ごとに平均したものである。   The sounds for each cause were generated as sounds under a total of 100 conditions by variously changing the above conditions. Then, the respective sounds were picked up by the repetition quantity. Further, each calculation until the correlation coefficient of each sound for each cause is obtained is performed by the similarity calculation unit 40. The correlation coefficient of the sound of each occurrence cause is obtained by averaging the correlation coefficient of 100 kinds of sounds collected for each occurrence cause for each occurrence cause.

前処理(ステップS1)が終了すると、発生原因の不明な音源、即ち複写機から放射される騒音の発生原因の判別が行われる(図5のステップS2〜S6)。   When the preprocessing (step S1) is completed, a sound source whose generation cause is unknown, that is, a generation cause of noise radiated from the copying machine is determined (steps S2 to S6 in FIG. 5).

まず、マイクロフォン1により、判断対象となる(発生原因の不明な)音響信号が収音される(ステップS2)。本実施例では複写機Tに近接して(複写機の筐体である外装カバーから10cmだけ離れた位置に)設置されるマイクロフォン1により複写機Tからの騒音が計測される。この収音は、複写機Tの1サイクルのコピー動作が複数回実行されるときに発生する音を収音するように行っている。マイクロフォン1で収音される音は、電気信号に変換されてアナログの音響信号ASとしてDAT2に取り込まれる。   First, the microphone 1 picks up a sound signal to be determined (the cause of which is unknown) (step S2). In this embodiment, the noise from the copying machine T is measured by the microphone 1 installed close to the copying machine T (at a position 10 cm away from the outer cover which is the housing of the copying machine). This sound pickup is performed so that a sound generated when the copying operation of one cycle of the copying machine T is executed a plurality of times is collected. The sound picked up by the microphone 1 is converted into an electric signal and taken into the DAT 2 as an analog sound signal AS.

アナログ信号ASは、DAT2に内蔵されているA/D変換回路によりデジタル信号DSに変換される(ステップS3)。このときのデジタル信号はDAT2のカセット式磁気テープに一旦記録される。図6は、このDAT2に記録されたデジタル信号DSを示すグラフである。本実施例ではDAT2のA/D変換回路の分解能(サンプリング周波数)は48kHzであるため、得られるデジタル信号DSは1秒間に48000点のサンプリングデータとして得られる。ここで、複写機のような画像形成装置を収音する場合、そのサンプリング周波数としては、少なくとも10kHz以上、好ましくは20kHz以上のものを適用することが望ましい。   The analog signal AS is converted into a digital signal DS by an A / D conversion circuit built in DAT2 (step S3). The digital signal at this time is once recorded on a DAT2 cassette type magnetic tape. FIG. 6 is a graph showing the digital signal DS recorded on the DAT2. In this embodiment, since the resolution (sampling frequency) of the A / D conversion circuit of DAT2 is 48 kHz, the obtained digital signal DS is obtained as 48,000 sampling data per second. Here, when picking up an image forming apparatus such as a copying machine, it is desirable to apply a sampling frequency of at least 10 kHz or more, preferably 20 kHz or more.

次に、波形切り取り部30において、DAT2に記録されたデジタル信号DSがパーソナルコンピュータCの本体3(ハードディスク)に対して取り込まれた後、判別対象となる音部分(衝撃音)の切り出しが行われる(ステップS4)。   Next, after the digital signal DS recorded in the DAT 2 is taken into the main body 3 (hard disk) of the personal computer C in the waveform cutting section 30, a sound portion (shock sound) to be determined is cut out. (Step S4).

まず、聴感補正部31により、取り込んだデジタル信号DSの聴感補正を行う。この実施例では、暗騒音に多く含まれる数10kHz以下の低周波数成分の信号をカットするため人の聴感に近いA特性フィルタにより補正を行った。   First, the audibility correction unit 31 performs audibility correction of the captured digital signal DS. In this embodiment, the correction is performed by an A-characteristic filter that is close to the audibility of humans in order to cut low frequency component signals of several tens of kHz or less that are included in the background noise.

続いて、この聴感補正された新たなデジタル信号DS’は、繰り返し音検出部32により、判別対象となる衝撃音の波形が検出されるとともに、繰り返し波形切り出し部33によりその衝撃音の波形データが所定の繰り返し数m個分だけ切り出される。この実施例では、音圧値Pが最大値(MAX)なる時間軸上の位置を基準にし、その前方側に存在する32点のデータと、その後方側に存在する31点のデータとからなる計64点からなる波形データを1単位)を所定の繰り返し数m個分、同様にして抽出している。図7は、その切り出された1個のデジタル信号ΔDS'を示すグラフである。このグラフの縦軸は音圧を、横軸はサンプル番号をそれぞれ示している。   Subsequently, the repetitive sound detector 32 detects the waveform of the impulsive sound to be discriminated from the new digital signal DS ′ whose audibility has been corrected, and the repetitive waveform cutout unit 33 converts the impulsive sound waveform data. A predetermined repetition number m is cut out. In this embodiment, based on the position on the time axis at which the sound pressure value P is the maximum value (MAX), it is composed of 32 points of data existing on the front side and 31 points of data existing on the rear side. The waveform data consisting of a total of 64 points (one unit) is similarly extracted for a predetermined number m of repetitions. FIG. 7 is a graph showing one cut-out digital signal ΔDS ′. The vertical axis of this graph indicates sound pressure, and the horizontal axis indicates sample numbers.

続いて、この切り出されたm個分の波形データは、振幅基準化部34により、その各波形の振幅の最大値が一定値となるように基準化される。これは、予め基準化部34に設定されている基準値Sとデジタル信号ΔDS'に含まれる音圧の絶対値の最大値P(MAX)とに基づいてデジタル信号ΔDS'を基準化し、基準化済みのデジタル信号Sm1,Sm2,・・・,Smkを得る(図3参照)。ここで、「Smk」におけるmは前記した繰り返し回数であり、その繰り返しm個目の波形の信号であることを示す。kは発生原因ごとにおいて選定した設定条件の数を示す。この例ではk=64とした。 Subsequently, the m pieces of the extracted waveform data are normalized by the amplitude standardizing unit 34 such that the maximum value of the amplitude of each waveform becomes a constant value. That is, the digital signal ΔDS ′ is normalized based on the reference value S set in advance in the standardization unit 34 and the maximum value P (MAX) of the absolute value of the sound pressure included in the digital signal ΔDS ′. The obtained digital signals S m1 , S m2 ,..., S mk are obtained (see FIG. 3). Here, m in “S mk ” is the number of repetitions described above, and indicates that the signal has the m-th repetition waveform. k indicates the number of setting conditions selected for each cause of occurrence. In this example, k = 64.

次に、このように切り出されたデジタル信号Sm1,Sm2,・・・,Sm64は類似性演算部40に出力され(図3)、その繰り返し波形間の類似性指標について演算される(ステップS5)。まず、デジタル信号Sm1,Sm2,・・・,Sm64は波形ベクトル演算部41において64行×m列の繰り返し波形ベクトルに変換される。この例では、繰り返し数mをm=4とすることで、波形ベクトルを64行×4列の数値行列とした。 Next, the digital signals S m1 , S m2 ,..., S m64 cut out in this way are output to the similarity calculation unit 40 (FIG. 3), and the similarity index between the repetitive waveforms is calculated (FIG. 3). Step S5). First, the digital signals S m1 , S m2 ,..., S m64 are converted by the waveform vector calculator 41 into a repetitive waveform vector of 64 rows × m columns. In this example, the number of repetitions m is set to m = 4, so that the waveform vector is a numerical matrix of 64 rows × 4 columns.

続いて、この波形ベクトルのデータに基づいて相関係数演算部42において、その波形ベクトルの繰り返し単位ごとに平均ベクトルμ、共分散ベクトルs、標準偏差ベクトルσが演算されて、その繰り返し単位間における相関係数行列Aが演算された後、その行列Aから相関係数rの平均値(平均相関係数)r´が類似性指標として求められる。この演算された平均相関係数r´は、判別対象の音源ごとに判別部50に出力される。   Subsequently, the correlation coefficient calculator 42 calculates an average vector μ, a covariance vector s, and a standard deviation vector σ for each repetition unit of the waveform vector based on the data of the waveform vector, and calculates After the correlation coefficient matrix A is calculated, an average value (average correlation coefficient) r ′ of the correlation coefficient r is obtained from the matrix A as a similarity index. The calculated average correlation coefficient r ′ is output to the discrimination unit 50 for each sound source to be discriminated.

次に、判断部50においては、類似性演算部40から出力された判別対象の音源に関する平均相関係数r´を、予め設定されている閾値THと比較する。この比較結果により、判別対象の音源が前記した3つの発生原因(1)〜(3)のいずれに該当するものであるかを判別する。この判断部50により、判断対象となる音源の発生原因が判断され、その発生原因に関する判断結果Rを得る(ステップS6)。   Next, the determination unit 50 compares the average correlation coefficient r ′ regarding the sound source to be determined, output from the similarity calculation unit 40, with a preset threshold TH. Based on the comparison result, it is determined which of the above three causes (1) to (3) the sound source to be determined corresponds to. The determination unit 50 determines the cause of the sound source to be determined, and obtains a determination result R regarding the cause (step S6).

この実施形態では、前記前処理において発生原因(1)〜(3)ごとの音に関する平均相関係数r´を算出した結果が原因(1)ではr1´=0.64、原因(2)ではr2´=0.48、原因(3)ではr3´=0.32であった。閾値THについては、各発生原因の平均相関係数の中間値[(r1´+r2´)/2、(r2´+r3´)/2]]を第1閾値TH1、第2閾値TH2としてそれぞれ設定した。すなわち、第1閾値TH1は(0.64+0.48)/2=0.56、第2閾値TH2は(0.48+0.32)/2=0.40とした。 In this embodiment, the result of calculating the average correlation coefficient r ′ for the sound for each of the occurrence causes (1) to (3) in the preprocessing is r 1 ′ = 0.64 for cause (1) and cause (2). In this case, r 2 ′ = 0.48, and in cause (3), r 3 ′ = 0.32. Regarding the threshold value TH, the median value of the average correlation coefficient of each occurrence cause [(r 1 ′ + r 2 ′) / 2, (r 2 ′ + r 3 ′) / 2] is defined as a first threshold value TH1 and a second threshold value TH2. Was set as each. That is, the first threshold value TH1 was (0.64 + 0.48) /2=0.56, and the second threshold value TH2 was (0.48 + 0.32) /2=0.40.

続いて、判断部50において、波形類似性演算部40から入力される判別対象の音源の平均相関係数r´が第1閾値TH1よりも大きい場合にはその音源が原因(1)の音であると判別し、その平均相関係数rが第1閾値TH1〜第2閾値TH2の間(0.40〜0.56)である場合にはその音源が原因(2)の音であると判別し、その平均相関係数rが第2閾値TH2よりも小さい場合にはその音源が原因(3)の音であると判別することになる。   Subsequently, when the average correlation coefficient r ′ of the sound source to be determined input from the waveform similarity calculation unit 40 is larger than the first threshold value TH1, the determination unit 50 determines that the sound source is the sound of cause (1). If the average correlation coefficient r is between the first threshold TH1 and the second threshold TH2 (0.40 to 0.56), it is determined that the sound source is the sound of the cause (2). If the average correlation coefficient r is smaller than the second threshold value TH2, it is determined that the sound source is the sound of the cause (3).

そして最後に、ディスプレイ装置5により、原因判断結果Rが表示される(ステップS7)。例えば、判断対象となる音源は、前記原因(1)の「可動部品の動作音」である場合には、その旨がディスプレイ装置5の画面に表示される(図2参照)。しかる後、次の音源判別が必要であれば上記工程(S2〜S7)が同様に繰り返されるが、その後の音源判別がなければ終了する(ステップS8)。   Finally, the cause determination result R is displayed on the display device 5 (step S7). For example, when the sound source to be determined is the cause (1) “movable part operation sound”, the fact is displayed on the screen of the display device 5 (see FIG. 2). Thereafter, if the next sound source determination is necessary, the above steps (S2 to S7) are repeated in the same manner, but if there is no subsequent sound source determination, the process ends (step S8).

以下、この実施の形態1に係る音源判別システム100の判別能力を調べた結果について説明する。   Hereinafter, the result of examining the discrimination ability of the sound source discrimination system 100 according to the first embodiment will be described.

まず音源判別システム100により、前記した原因(1)〜(3)に該当する音を複写機の騒音の中から10種類ずつ選定して収音し、その各音の4回分の繰り返し音をそれぞれ切り出して各繰り返し波形間の相関係数の平均値r´をそれぞれ求めた。しかる後、その各平均相関係数r´を前記第1閾値TH1、第2閾値TH2と比較することにより、各音の発生原因について判別した。   First, the sound source discriminating system 100 selects and collects 10 types of sounds corresponding to the causes (1) to (3) from the noise of the copying machine, and collects four repetitive sounds of each of the sounds. The slices were cut out, and the average value r ′ of the correlation coefficient between the repetitive waveforms was obtained. Thereafter, the cause of each sound was determined by comparing the average correlation coefficient r 'with the first threshold TH1 and the second threshold TH2.

このときの判別結果を表1に示す。表1は、例えば最上欄を例にして説明すると、発生原因(1)に該当する音(全10種類)の判別結果として正しく原因(1)と判別した出力数(正解数)が「8」であり、誤って原因(2)と判別した出力数が「1」、誤って原因(3)と判別した出力数が「1」であることを示している。   Table 1 shows the result of this determination. In Table 1, for example, taking the top column as an example, the number of outputs (the number of correct answers) correctly determined as the cause (1) as the result of the determination of the sounds (all 10 types) corresponding to the cause (1) is “8”. This indicates that the number of outputs erroneously determined as cause (2) is “1”, and the number of outputs erroneously determined as cause (3) is “1”.

Figure 2004264292
Figure 2004264292

この判別結果の再現率および精度について調べたところ、表2に示すような結果が得られた。   When the recall and accuracy of the discrimination results were examined, the results shown in Table 2 were obtained.

Figure 2004264292
Figure 2004264292

再現率は、正しく判別した場合(正解)の見落としの少なさを示すものである。例えば表2において発生原因(1)の再現率は、「原因(1)と正しく判別された出力数(正解数)/原因(1)に該当する音の総数(全正解数)」の百分率で示されている。   The recall indicates the degree of oversight when correctly discriminated (correct answer). For example, in Table 2, the recall of occurrence cause (1) is a percentage of “the number of outputs (number of correct answers) correctly determined as cause (1) / the total number of sounds corresponding to cause (1) (total number of correct answers)”. It is shown.

一方、精度は、出力結果中の誤りの少なさを示すものである。例えば表2において発生原因(1)の精度は「原因(1)と正しく判別された出力数(正解数)/原因(1)と判別した出力総数(8+1+0)」の百分率で、発生原因(2)の精度は「原因(2)と正しく判別された出力数(正解数)/原因(2)と判別した出力総数(1+7+3)」の百分率でそれぞれ示されている。   On the other hand, the accuracy indicates a small number of errors in the output result. For example, in Table 2, the accuracy of the cause of occurrence (1) is a percentage of “the number of outputs (the number of correct answers) correctly determined as cause (1) / the total number of outputs (8 + 1 + 0) determined as cause (1)”. ) Is shown as a percentage of “the number of outputs (number of correct answers) correctly determined as cause (2) / the total number of outputs (1 + 7 + 3) determined as cause (2)”.

表2に示す結果から、発生原因の違いにかかわらず、再現率が70%、精度が60%をそれぞれ超えるものとなり、十分な判別能力があることが確認された。特に、従来判別しにくかった用紙先端部の衝突音と用紙後端部のはね音との判別が適切にできることが判明した。   From the results shown in Table 2, it was confirmed that the recall was more than 70% and the accuracy was more than 60%, regardless of the cause of occurrence, and that the discrimination ability was sufficient. In particular, it has been found that it is possible to appropriately discriminate between the collision sound at the leading end of the sheet and the splashing sound at the trailing end of the sheet, which were conventionally difficult to distinguish.

《実施の形態2》
実施の形態2に係る音源判別システムは、波形の類似性指標として、前記実施の形態1で使用した相関係数に代えて空間距離(例えばマハラノビスの距離)を使用した以外は実施の形態1に係る音源判別システム100と同じ構成からなるものである。
<< Embodiment 2 >>
The sound source discrimination system according to the second embodiment is similar to the first embodiment except that a spatial distance (eg, Mahalanobis distance) is used as a waveform similarity index instead of the correlation coefficient used in the first embodiment. It has the same configuration as the sound source discrimination system 100.

すなわち、この実施の形態に係る音源判別システム100は、実施の形態1で説明した波形類似性演算部40(図2)における相関係数演算部42(図4)を、図12に示すように空間距離演算部43に変更したものである。空間距離演算部43では、波形類似性演算部40の波形ベルトル演算部41から得られる波形ベクトルについて、後述するようにその波形の類似性指標としての空間距離を演算する。   That is, in the sound source discrimination system 100 according to the present embodiment, the correlation coefficient calculation unit 42 (FIG. 4) in the waveform similarity calculation unit 40 (FIG. 2) described in the first embodiment is configured as shown in FIG. This is a modification to the spatial distance calculation unit 43. The spatial distance calculation unit 43 calculates a spatial distance as a similarity index of the waveform of the waveform vector obtained from the waveform vector calculation unit 41 of the waveform similarity calculation unit 40, as described later.

次に、この音源判別システム100の基本的な動作について説明する。なお、その動作については、基本的に、実施の形態1に係るシステムの場合と同様であるため(例えば図5に示すステップS4まで)、以下、その異なる部分について主に説明する。   Next, a basic operation of the sound source determination system 100 will be described. The operation is basically the same as that of the system according to the first embodiment (for example, up to step S4 shown in FIG. 5), and therefore, different portions will be mainly described below.

はじめに、実施の形態1の場合と同様に、前述したようなステップS1〜S4を経ることにより、最終的に波形切り出し部30において切り出される基準済みのデジタル信号Sm1,Sm2,・・・,Sm64が類似性演算部40に入力される。そして、この類似性演算部40に入力される上記デジタル信号は、その繰り返し波形間の類似性指標について演算される(ステップS5)。 First, similarly to the case of the first embodiment, the reference digital signals S m1 , S m2 ,..., Which are finally cut out by the waveform cut-out unit 30 through steps S1 to S4 as described above. S m64 is input to the similarity calculation unit 40. Then, the digital signal input to the similarity calculation unit 40 is calculated for a similarity index between the repetitive waveforms (step S5).

まず、そのデジタル信号Sm1,Sm2,・・・,Sm64は、波形ベクトル演算部41において64行×m列の繰り返し波形ベクトルに変換される。この例では、繰り返し数mをm=4とすることで、波形ベクトルを64行×4列の数値行列とした。 First, the digital signals S m1 , S m2 ,..., S m64 are converted into a repetitive waveform vector of 64 rows × m columns by the waveform vector calculation unit 41. In this example, the number of repetitions m is set to m = 4, so that the waveform vector is a numerical matrix of 64 rows × 4 columns.

続いて、この波形ベクトルのデータに基づいて空間距離演算部43において、その波形ベクトルの繰り返し単位ごとに平均ベクトルμ、共分散ベクトルs、標準偏差ベクトルσが演算されて、その繰り返し単位ごとに空間距離としてマハラノビスの距離:D2(i)がi=1〜m個分だけ演算され、そのばらつき幅:DR(空間距離値の最大値と最小値の比)が類似性指標として求められる。この演算された空間距離のばらつき幅:DRは、判別対象の音源ごとに判別部50に出力される。 Subsequently, based on the data of the waveform vector, the spatial distance calculator 43 calculates an average vector μ, a covariance vector s, and a standard deviation vector σ for each repetition unit of the waveform vector, and calculates a spatial Mahalanobis distance: D 2 (i) is calculated for i = 1 to m as a distance, and a variation width: DR (ratio of maximum value to minimum value of spatial distance value) is obtained as a similarity index. The calculated variation width of the spatial distance: DR is output to the determination unit 50 for each sound source to be determined.

上記空間距離の演算としては、以下に示すようなマハラノビス汎距離演算を用いた。この空間距離を演算するためには、その算出をする基準となる基準空間が必要であるが、これを次のようにあらかじめ設定しておく。   The following Mahalanobis generalized distance calculation was used as the calculation of the spatial distance. In order to calculate this spatial distance, a reference space as a reference for the calculation is required, and this is set in advance as follows.

まず、基準空間とする、前記発生原因が明らかな原因(1)の音(可動部品の動作音)を100音収録し、その各音の音圧値Pが最大値(MAX)なる時間軸上の位置を基準にし、その前方側に存在する32点のデータと、その後方側に存在する31点のデータとからなる計64点からなる波形データをSi1,Si2,・・・,Si64(i=1〜100)を作成する。 First, as a reference space, 100 sounds of the cause (1) (moving parts operating sound) whose cause is apparent are recorded, and the sound pressure value P of each sound is on the time axis at which the maximum value (MAX) is reached. , And a total of 64 waveform data consisting of 32 points of data existing on the front side and 31 points of data on the rear side of the position are referred to as S i1 , S i2 ,..., S i64 (i = 1 to 100) is created.

次いで、この波形データを高速フーリエ変換により周波数分析して32点の周波数波形データyi1,yi2,・・・,yi32を得る。これを必要なデータ数i=100音分だけ同様に実行することで周波数波形データとしてy=(yi1,yi2,・・・,yi32)を得る。そして、この周波数波形データy(=yi1,yi2,・・・,yi32)は、i=100個のデータから正規化される。正規化は、以下の式1に基づいて行う。式中、iは1〜32の整数、σは標準偏差を示す。 Next, this waveform data is subjected to frequency analysis by fast Fourier transform to obtain 32 points of frequency waveform data y i1 , y i2 ,..., Y i32 . By repeating this for the required number of data i = 100 sounds, y = (y i1 , y i2 ,..., Y i32 ) is obtained as frequency waveform data. Then, the frequency waveform data y (= y i1 , y i2 ,..., Y i32 ) is normalized from i = 100 data. The normalization is performed based on the following Expression 1. In the formula, i represents an integer of 1 to 32, and σ represents a standard deviation.

Figure 2004264292
Figure 2004264292

続いて、相関係数行列Aの算出と、その相関係数行列Aの逆行列R-1の算出を行う。相関係数行列を求めるために、相関係数rを算出する。相関係数rは以下の式2により算出した。式中において、上付きバーで表示したyはyの平均値、p、qはいずれも1〜32の整数を示す。 Subsequently, calculation of the correlation coefficient matrix A and calculation of the inverse matrix R −1 of the correlation coefficient matrix A are performed. In order to obtain a correlation coefficient matrix, a correlation coefficient r is calculated. The correlation coefficient r was calculated by the following equation 2. In the formula, y indicated by a superscript bar indicates an average value of y, and p and q each indicate an integer of 1 to 32.

Figure 2004264292
Figure 2004264292

相関係数行列Aは、以下の式3により求めた。式中においてaは逆行列の計算により求めた要素、kは1〜32の整数を示す。   The correlation coefficient matrix A was obtained by the following Expression 3. In the formula, a represents an element obtained by calculating an inverse matrix, and k represents an integer of 1 to 32.

Figure 2004264292
Figure 2004264292

このように求められた原因(1)に関する基準空間の相関係数行列Aは、デジタルデータとしてPC上で読み出せるファイルに保管される。このあらかじめ求められている相関係数行列Aを用いて、類似性演算部40に入力された前記デジタル信号Sm1,Sm2,・・・,Sm64のマハラノビスの距離D2が次の式4に基づいて算出される。式中のY´i1,Y´i2,・・・,Y´ik)は、前述した基準空間を求める場合と同様にしてデジタル信号Sm1,Sm2,・・・,Sm64を周波数分析した後、それをさらに正規化して求められる周波数波形データである。 The correlation coefficient matrix A in the reference space for the cause (1) thus obtained is stored as digital data in a file that can be read on a PC. With this pre-sought-after correlation coefficient matrix A, the digital signal is input to the similarity calculating unit 40 S m1, S m2, ··· , Equation 4 Mahalanobis distance D 2 is the next S m64 It is calculated based on Y ′ i1 , Y ′ i2 ,..., Y ′ ik ) in the formula are subjected to frequency analysis of the digital signals S m1 , S m2 ,. Later, it is frequency waveform data obtained by further normalizing it.

Figure 2004264292
Figure 2004264292

以上のような手順でマハラノビスの距離(距離測度)を4回(m=4)繰り返して演算することにより、空間距離(D21〜D24)が求められる。 By calculating more steps Mahalanobis distance, such as (distance measure) to 4 times (m = 4) repeatedly, the spatial distance (D 2 1 to D 2 4) is obtained.

次に、判断部50においては、類似性演算部40から出力された判別対象の音源に関する空間距離(D21〜D24)のばらつき幅DRを、予め設定されている閾値THと比較する。この比較結果により、判別対象の音源が前記した3つの発生原因(1)〜(3)のいずれかに該当するものであるかを判別する。この判断部50により、判断対象となる音源の発生原因が判断され、その発生原因に関する判断結果Rを得る(ステップS6)。 Next, the determining section 50, the variation width DR of the sound source on the spatial distance of the discrimination object output from the similarity calculation unit 40 (D 2 1~D 2 4) , is compared with a threshold value TH which is set in advance . Based on the comparison result, it is determined whether the sound source to be determined is one of the above three causes (1) to (3). The determination unit 50 determines the cause of the sound source to be determined, and obtains a determination result R regarding the cause (step S6).

この実施形態では、前記前処理(ステップS1)において発生原因(1)〜(3)ごとの音に関する空間距離(D21〜D24)のばらつき幅DRを算出した結果が以下の通りであった。原因(1)ではDR1=(D2max/D2min)=4.3/2.5=1.7、原因(2)ではDR2=(D2max/D2min)=52350/10020=5.2、原因(3)ではDR3=(D2max/D2min)=185360/9020=21であった。D2maxは空間距離(D21〜D24)のうちの最大値を示し、D2minは空間距離(D21〜D24)のうちの最小値を示す。 In this embodiment, the pretreatment cause (Step S1) (1) ~ are as variation result of calculating the width DR is less than the spatial distance in the sound of each (3) (D 2 1~D 2 4) there were. In the cause (1), DR 1 = (D 2 max / D 2 min) = 4.3 / 2.5 = 1.7, and in the cause (2), DR 2 = (D 2 max / D 2 min) = 52350 / 10020 = 5.2, and for cause (3), DR 3 = (D 2 max / D 2 min) = 185360/9020 = 21. D 2 max represents the maximum value of the spatial distance (D 2 1~D 2 4), D 2 min denotes the minimum value of the spatial distance (D 2 1~D 2 4).

また、閾値THについては、各発生原因のばらつき幅DRの中間値[(DR1+DR2)/2、(DR2+DR3)/2]]を第1閾値TH1、第2閾値TH2としてそれぞれ設定した。すなわち、第1閾値TH1は(1.7+5.2)/2=3.5、第2閾値TH2は(5.2+21)/2=13とした。 As for the threshold value TH is set each intermediate value of the variation width DR of each cause [(DR 1 + DR 2) / 2, (DR 2 + DR 3) / 2] a] a first threshold value TH1, a second threshold value TH2 did. That is, the first threshold TH1 was set to (1.7 + 5.2) /2=3.5, and the second threshold TH2 was set to (5.2 + 21) / 2 = 13.

続いて、判断部50において、波形類似性演算部40から入力される判別対象の音源の空間距離に関するばらつき幅(DR1,DR2,DR3)が第1閾値TH1よりも大きい場合にはその音源が原因(1)の音であると判別し、そのばらつき幅が第1閾値TH1〜第2閾値TH2の間(3.5〜13)である場合にはその音源が原因(2)の音であると判別し、その平均相関係数rが第2閾値TH2よりも小さい場合にはその音源が原因(3)の音であると判別することになる。 Subsequently, when the variation width (DR 1 , DR 2 , DR 3 ) related to the spatial distance of the sound source to be determined, which is input from the waveform similarity calculation unit 40, is larger than the first threshold value TH 1. The sound source is determined to be the sound of the cause (1), and if the variation range is between the first threshold value TH1 and the second threshold value TH2 (3.5 to 13), the sound source is the sound of the cause (2). If the average correlation coefficient r is smaller than the second threshold value TH2, it is determined that the sound source is the sound of the cause (3).

そして、この原因判断結果Rは、実施の形態1の場合と同様に、ディスプレイ装置5により表示される(ステップS7)。しかる後、次の音源判別が必要であれば上記工程(S2〜S7)が同様に繰り返されるが、その後の音源判別がなければ終了する(ステップS8)。   Then, the cause determination result R is displayed on the display device 5 as in the case of the first embodiment (step S7). Thereafter, if the next sound source determination is necessary, the above steps (S2 to S7) are repeated in the same manner, but if there is no subsequent sound source determination, the process ends (step S8).

以下、この実施の形態2に係る音源判別システム100の判別能力を調べた結果について説明する。   Hereinafter, the result of examining the discrimination ability of the sound source discrimination system 100 according to the second embodiment will be described.

まず音源判別システム100により、前記した原因(1)〜(3)に該当する音を複写機の騒音の中から10種類ずつ選定して収音し、その各音の4回分の繰り返し音をそれぞれ切り出して各繰り返し波形間の空間距離(D21〜D24)のばらつき幅DRをそれぞれ求めた。しかる後、その各ばらつき幅(DR1,DR2,DR3)を前記第1閾値TH1、第2閾値TH2と比較することにより、各音の発生原因について判別した。このときの判別結果を表3に示す。表3の表示の意味は実施の形態1における表1の場合と同じである。 First, the sound source discriminating system 100 selects and collects 10 types of sounds corresponding to the causes (1) to (3) from the noise of the copying machine, and collects four repetitive sounds of each of the sounds. cut out the variation width DR of the spatial distance between each repeating waveform (D 2 1~D 2 4) were determined, respectively. Thereafter, the cause of each sound was determined by comparing each variation width (DR 1 , DR 2 , DR 3 ) with the first threshold TH1 and the second threshold TH2. Table 3 shows the results of this determination. The meaning of the display in Table 3 is the same as that in Table 1 in the first embodiment.

Figure 2004264292
Figure 2004264292

この判別結果の現率および精度について実施の形態1の場合(表2)と同様に調べたところ、表4に示すような結果が得られた。   When the current rate and accuracy of the discrimination result were examined in the same manner as in the case of Embodiment 1 (Table 2), the results shown in Table 4 were obtained.

Figure 2004264292
Figure 2004264292

表4に示す結果から、発生原因の違いにかかわらず、再現率が80%以上となり、精度が70%を超えるものとなり、十分な判別能力があることが確認された。特に、従来判別しにくかった用紙先端部の衝突音と用紙後端部のはね音との判別が適切にできることが判明した。   From the results shown in Table 4, it was confirmed that the recall was 80% or more, the accuracy was more than 70%, and the discrimination ability was sufficient irrespective of the difference in the cause of occurrence. In particular, it has been found that it is possible to appropriately discriminate between the collision sound at the leading end of the sheet and the splashing sound at the trailing end of the sheet, which were conventionally difficult to distinguish.

実施の形態1に係る音源判別システムの構成を示す概念図である。FIG. 2 is a conceptual diagram showing a configuration of a sound source determination system according to Embodiment 1. 図1の判別システムの基本的な機能を示す機能ブロック図である。FIG. 2 is a functional block diagram illustrating basic functions of the discrimination system in FIG. 1. 図2に示す波形切り出し部の構成をより詳細に示す機能ブロック図である。FIG. 3 is a functional block diagram illustrating a configuration of a waveform cutout unit illustrated in FIG. 2 in more detail. 図2に示す波形類似性演算部の構成をより詳細に示す機能ブロック図である。FIG. 3 is a functional block diagram illustrating a configuration of a waveform similarity calculation unit illustrated in FIG. 2 in more detail. 図1の音源判別システムの使用法や動作を示すフローチャートである。2 is a flowchart illustrating a usage and an operation of the sound source determination system in FIG. 1. 複写機からのの時間−音圧波形を示すグラフである。6 is a graph showing a time-sound pressure waveform from a copying machine. 図6の一部を切り出した波形を示すグラフである。7 is a graph showing a waveform obtained by cutting out part of FIG. 6. 複写機から放射される音(ソレノイド)を2回ずつ繰り返して測定したときの時間−音圧波形図である。FIG. 4 is a time-sound pressure waveform chart when sound (solenoid) emitted from a copying machine is repeatedly measured twice. 複写機から放射される音(用紙先端部の衝突音)を2回ずつ繰り返して測定したときの時間−音圧波形図である。FIG. 7 is a time-sound pressure waveform chart when sound radiated from the copying machine (collision sound of the leading end of a sheet) is repeatedly measured twice. 複写機から放射される音(用紙後端部のはね音)を2回ずつ繰り返して測定したときの時間−音圧波形図である。FIG. 4 is a time-sound pressure waveform chart when sound radiated from a copying machine (bounce sound at the rear end of a sheet) is measured twice repeatedly. 各音源の距離測度(マハラノビス距離)の計測結果を示すグラフである。It is a graph which shows the measurement result of the distance measure (Maharanobis distance) of each sound source. 実施の形態2に係る音源判別システムにおける波形類似性演算部の構成をより詳細に示す機能ブロック図である。FIG. 13 is a functional block diagram illustrating a configuration of a waveform similarity calculation unit in the sound source determination system according to the second embodiment in more detail.

符号の説明Explanation of reference numerals

10…収音部、30…波形切り出し部、40…波形類似性演算部、50…判断部、100…音源判別システム(音源判別装置)、T…複写機(音源)。   Reference numerals 10: sound collecting section, 30: waveform cutout section, 40: waveform similarity calculation section, 50: determination section, 100: sound source discrimination system (sound source discrimination device), T: copying machine (sound source).

Claims (7)

音源からの音を収音して音響信号として取り込む収音部と、
この取り込んだ音響信号から判別対象となる音部分の音響信号を複数個分切り出す音切り出し部と、
この切り出した複数個の音響信号どうしの波形の類似性を示す指標を演算する類似性演算部と、
この演算された波形の類似性指標について、予め発生原因が明らかな音源の発生原因別の各音響信号に関する波形の類似性指標に基づいて設定された判別用の閾値と比較して判別対象の音源の発生原因を判断する判断部と
を有することを特徴とする音源判別装置。
A sound pickup unit that picks up sound from a sound source and takes in the sound signal;
A sound clipping unit that cuts out a plurality of sound signals of a sound portion to be determined from the captured sound signal,
A similarity calculation unit that calculates an index indicating the similarity of the waveforms of the plurality of cut out audio signals,
The calculated similarity index of the waveform is compared with a threshold value for discrimination set based on the similarity index of the waveform for each sound signal for each cause of the sound source whose cause is apparent in advance. A sound source discriminating device, comprising: a judgment unit for judging a cause of occurrence of the sound.
請求項1に記載の判別装置において、
前記類似性演算部で演算する波形の類似性指標として相関係数を使用する音源判別装置。
The discriminating apparatus according to claim 1,
A sound source discrimination device that uses a correlation coefficient as a similarity index of a waveform calculated by the similarity calculation unit.
請求項1に記載の判別装置において、
前記類似性演算部で演算する波形の類似性指標として統計学上の空間距離を使用する音源判別装置。
The discriminating apparatus according to claim 1,
A sound source discrimination device using a statistical spatial distance as a similarity index of a waveform calculated by the similarity calculation unit.
請求項3に記載の判別装置において、
前記統計学上の空間距離がマハラノビスの距離である音源判別装置。
The discriminating apparatus according to claim 3,
A sound source discrimination device in which the statistical spatial distance is Mahalanobis distance.
請求項1〜4のいずれかに記載の判別装置において、
前記類似性演算部が音響信号の音圧変動特性または周波数変動特性に基づく類似性を演算する音源判別装置。
The discriminating apparatus according to any one of claims 1 to 4,
A sound source discrimination device in which the similarity calculation unit calculates similarity based on a sound pressure fluctuation characteristic or a frequency fluctuation characteristic of an acoustic signal.
請求項1〜5のいずれかに記載の判別装置において、
前記発生原因が不明な音源が筐体の内部に存在する複数種の音源である音源判別装置。
The discriminating apparatus according to any one of claims 1 to 5,
A sound source discriminating apparatus, wherein the sound source whose generation cause is unknown is a plurality of types of sound sources existing inside the housing.
音源からの音を収音して音響信号として取り込む収音工程と、
この取り込んだ音響信号から判別対象となる音部分の音響信号を複数個分切り出す音切り出し工程と、
この切り出した複数個の音響信号どうしの波形の類似性を示す指標を演算する類似性演算工程と、
この演算された波形の類似性指標について、予め発生原因が明らかな音源の発生原因別の各音響信号に関する波形の類似性指標に基づいて設定された判別用の閾値と比較して判別対象の音源の発生原因を判断する判断工程と
を有することを特徴とする音源判別方法。
A sound-collecting step of collecting sound from a sound source and capturing the sound as an acoustic signal;
A sound clipping step of clipping a plurality of sound signals of a sound portion to be determined from the captured sound signal,
A similarity calculating step of calculating an index indicating the similarity of the waveforms of the plurality of cut out audio signals;
The calculated similarity index of the waveform is compared with a threshold value for discrimination set based on the similarity index of the waveform for each sound signal for each cause of the sound source whose cause is apparent in advance. And a determining step of determining a cause of occurrence of the sound source.
JP2004011660A 2003-02-10 2004-01-20 Sound source discrimination device and its discrimination method Expired - Fee Related JP4127211B2 (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2004011660A JP4127211B2 (en) 2003-02-10 2004-01-20 Sound source discrimination device and its discrimination method

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
JP2003031920 2003-02-10
JP2004011660A JP4127211B2 (en) 2003-02-10 2004-01-20 Sound source discrimination device and its discrimination method

Publications (3)

Publication Number Publication Date
JP2004264292A true JP2004264292A (en) 2004-09-24
JP2004264292A5 JP2004264292A5 (en) 2007-02-08
JP4127211B2 JP4127211B2 (en) 2008-07-30

Family

ID=33133803

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2004011660A Expired - Fee Related JP4127211B2 (en) 2003-02-10 2004-01-20 Sound source discrimination device and its discrimination method

Country Status (1)

Country Link
JP (1) JP4127211B2 (en)

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2006185225A (en) * 2004-12-28 2006-07-13 Megachips System Solutions Inc Alarm device identification device, system and method
JP2008008708A (en) * 2006-06-28 2008-01-17 Omron Corp Judgment knowledge creation system, judgment knowledge creation method, program, and recording medium
JP2011527421A (en) * 2008-07-08 2011-10-27 ブリュエル アンド ケアー サウンド アンド ヴァイブレーション メジャーメント エー/エス Method for reconstructing an acoustic field
JP2011527422A (en) * 2008-07-08 2011-10-27 ブリュエル アンド ケアー サウンド アンド ヴァイブレーション メジャーメント エー/エス Sound field reconstruction

Cited By (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2006185225A (en) * 2004-12-28 2006-07-13 Megachips System Solutions Inc Alarm device identification device, system and method
JP4590649B2 (en) * 2004-12-28 2010-12-01 株式会社メガチップス Alarm device identification device, system and method
JP2008008708A (en) * 2006-06-28 2008-01-17 Omron Corp Judgment knowledge creation system, judgment knowledge creation method, program, and recording medium
JP2011527421A (en) * 2008-07-08 2011-10-27 ブリュエル アンド ケアー サウンド アンド ヴァイブレーション メジャーメント エー/エス Method for reconstructing an acoustic field
JP2011527422A (en) * 2008-07-08 2011-10-27 ブリュエル アンド ケアー サウンド アンド ヴァイブレーション メジャーメント エー/エス Sound field reconstruction

Also Published As

Publication number Publication date
JP4127211B2 (en) 2008-07-30

Similar Documents

Publication Publication Date Title
US11467024B2 (en) Diagnostic device, computer program, and diagnostic system
US20220390271A1 (en) Diagnostic device, computer program, and diagnostic system
US9002024B2 (en) Reverberation suppressing apparatus and reverberation suppressing method
JP4912778B2 (en) Method and system for modeling the trajectory of a signal source
JP4950930B2 (en) Apparatus, method and program for determining voice / non-voice
US20030120485A1 (en) Signal processing system and method
JP4606800B2 (en) System for detecting non-stationary signal components and method used in a system for detecting non-stationary signal components
US11120819B2 (en) Voice extraction device, voice extraction method, and non-transitory computer readable storage medium
JP2010197998A (en) Audio signal processing system and autonomous robot having such system
JP2019066339A (en) Diagnostic device, diagnostic method and diagnostic system each using sound
JP4127211B2 (en) Sound source discrimination device and its discrimination method
JP6935655B2 (en) Signal analysis systems, methods and programs
JP7373358B2 (en) Sound extraction system and sound extraction method
JP4020024B2 (en) Sound source discrimination device and its discrimination method
US20130096855A1 (en) Detection of an Abnormal Signal in a Compound Sampled Signal
Smaragdis et al. Learning source trajectories using wrapped-phase hidden Markov models
JP2017151216A (en) Sound source direction estimation device, sound source direction estimation method, and program
JP3896804B2 (en) Signal judgment device
JP2005208186A (en) Apparatus for judging cause
JP2019049685A (en) Voice extraction device, voice extraction method and voice extraction program
JP2004205215A (en) Sound source diagnosing device
JP4127214B2 (en) Sound source discrimination device and its discrimination method
JP2005221408A (en) Sound source analyzing apparatus and sound source analytical method
JP2003083802A (en) Acoustic signal detection device and acoustic signal detection method
JP2002333460A (en) Signal discriminator

Legal Events

Date Code Title Description
RD05 Notification of revocation of power of attorney

Free format text: JAPANESE INTERMEDIATE CODE: A7425

Effective date: 20050121

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20061219

A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20061219

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20071212

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20080129

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20080331

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20080422

A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20080505

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20110523

Year of fee payment: 3

R150 Certificate of patent or registration of utility model

Free format text: JAPANESE INTERMEDIATE CODE: R150

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20110523

Year of fee payment: 3

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20120523

Year of fee payment: 4

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20130523

Year of fee payment: 5

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20140523

Year of fee payment: 6

LAPS Cancellation because of no payment of annual fees