JP4913666B2 - Cough detection device and cough detection program - Google Patents

Cough detection device and cough detection program Download PDF

Info

Publication number
JP4913666B2
JP4913666B2 JP2007131743A JP2007131743A JP4913666B2 JP 4913666 B2 JP4913666 B2 JP 4913666B2 JP 2007131743 A JP2007131743 A JP 2007131743A JP 2007131743 A JP2007131743 A JP 2007131743A JP 4913666 B2 JP4913666 B2 JP 4913666B2
Authority
JP
Japan
Prior art keywords
cepstrum
pulse
fourier transform
cough
predetermined threshold
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
JP2007131743A
Other languages
Japanese (ja)
Other versions
JP2008284151A (en
Inventor
芳雄 清水
敏明 保木
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
CHEST M.I.,INCORPORATED
Original Assignee
CHEST M.I.,INCORPORATED
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by CHEST M.I.,INCORPORATED filed Critical CHEST M.I.,INCORPORATED
Priority to JP2007131743A priority Critical patent/JP4913666B2/en
Publication of JP2008284151A publication Critical patent/JP2008284151A/en
Application granted granted Critical
Publication of JP4913666B2 publication Critical patent/JP4913666B2/en
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Landscapes

  • Measurement Of The Respiration, Hearing Ability, Form, And Blood Characteristics Of Living Organisms (AREA)

Description

この発明は、音声と咳とを峻別して、咳を高精度で検出することの可能な咳検出装置及び咳検出用プログラムに関するものである。   The present invention relates to a cough detection device and a cough detection program capable of distinguishing speech and cough and detecting cough with high accuracy.

一般的に、呼吸器疾患に関しては咳が一つのパラメータとされることが多く、この咳を如何に簡単にしかも高精度で検出できるかが問題となっている。特に、患者や被験者が睡眠中においてどの程度の頻度で咳をしているかについて、患者や被験者に問うて見ても本人は認識していなかったり、または誤った頻度の認識を行ったりしている場合が多い。   In general, cough is often a parameter for respiratory diseases, and how to detect cough easily and with high accuracy is a problem. In particular, the frequency of how often the patient or subject coughs during sleep may not be recognized by the patient or subject, or may be recognized at an incorrect frequency. There are many cases.

このような事情に鑑みて、例えば特許文献1には、音圧曲線を作成し、音圧曲線における所定以上の音圧が所定時間以上継続した領域を咳嗽音候補とし、この咳嗽音候補毎に立ち上がり勾配、尖度などにより咳嗽音であるかを検出する装置が示されている。   In view of such circumstances, for example, in Patent Document 1, a sound pressure curve is created, and a region in which a sound pressure higher than or equal to a predetermined value in the sound pressure curve continues for a predetermined time or more is defined as a cough sound candidate. An apparatus for detecting whether a coughing sound is detected based on rising slope, kurtosis, and the like is shown.

この装置によれば、良好な咳嗽音検出がなされるとされているものの、咳嗽の80〜85%程度の検出精度であり、必ずしも十分と言えるものではない。
特開2003−38460号公報
According to this apparatus, although it is said that a good cough sound is detected, the detection accuracy is about 80 to 85% of cough, which is not necessarily sufficient.
JP 2003-38460 A

本発明は上記のような従来の咳検出装置における現状に鑑みてなされたもので、その目的は、より高精度で咳検出を行うことが可能な咳検出装置及び咳検出用プログラムを提供することである。   The present invention has been made in view of the current state of the conventional cough detection apparatus as described above, and an object thereof is to provide a cough detection apparatus and a cough detection program capable of performing cough detection with higher accuracy. It is.

本発明に係る咳検出装置は、被験者の音声を取り込む音声取込手段と、音声取込手段により取り込まれた音声をディジタル化するA/D変換器と、このA/D変換器により変換されたディジタル値を用いて包絡線を求めることによりパルスの検出を行うパルス検出手段と、検出されたパルスに対してフーリェ変換を行うフーリェ変換手段と、フーリェ変換結果を用いてケプストラムを生成するケプストラム生成手段と、ケプストラム生成手段により生成されたケプストラムについて所定閾値と比較を行い、前記所定閾値より小さい場合に咳と判定する判定手段とを具備することを特徴とする。   The cough detection device according to the present invention includes a voice capturing unit that captures a subject's voice, an A / D converter that digitizes the voice captured by the voice capturing unit, and a signal converted by the A / D converter. Pulse detection means for detecting a pulse by obtaining an envelope using a digital value, Fourier transform means for performing Fourier transform on the detected pulse, and cepstrum generation means for generating a cepstrum using the Fourier transform result And a determination unit that compares the cepstrum generated by the cepstrum generation unit with a predetermined threshold value and determines that the cepstrum is cough when the cepstrum is smaller than the predetermined threshold value.

本発明に係る咳検出装置では、パルス検出手段は、振幅とパルス幅が所定の以上のパルスを選択するパルス選択手段を備えることを特徴とする。   In the cough detection apparatus according to the present invention, the pulse detection means includes a pulse selection means for selecting a pulse having an amplitude and a pulse width that are greater than or equal to a predetermined value.

本発明に係る咳検出装置では、ケプストラム生成手段は、フーリェ変換結果について対数演算を行う対数演算手段と、対数演算手段の出力を逆フーリェ変換する逆フーリェ変換手段とを備えていることを特徴とする。   In the cough detection device according to the present invention, the cepstrum generation means includes logarithm calculation means for performing a logarithmic operation on the Fourier transform result, and an inverse Fourier transform means for performing an inverse Fourier transform on the output of the logarithmic operation means. To do.

本発明に係る咳検出装置では、判定手段が用いる所定閾値を求める所定閾値生成手段を備えることを特徴とする。   The cough detection device according to the present invention is characterized by comprising a predetermined threshold generation means for obtaining a predetermined threshold used by the determination means.

本発明に係る咳検出用プログラムは、被験者の音声を取り込み、取り込まれた音声をディジタル化した音声データを処理するコンピュータを、A/D変換されたディジタル値を用いて包絡線を求めることによりパルスの検出を行うパルス検出手段と、検出されたパルスに対してフーリェ変換を行うフーリェ変換手段と、フーリェ変換結果を用いてケプストラムを生成するケプストラム生成手段と、ケプストラム生成手段により生成されたケプストラムについて所定閾値と比較を行い、前記所定閾値より小さい場合に咳と判定する判定手段として機能させることを特徴とする。   The cough detection program according to the present invention captures a subject's voice, processes a voice data obtained by digitizing the captured voice, and obtains an envelope by obtaining an envelope using an A / D converted digital value. A pulse detection means for detecting the current, a Fourier transform means for performing a Fourier transform on the detected pulse, a cepstrum generation means for generating a cepstrum using the Fourier transform result, and a cepstrum generated by the cepstrum generation means. It is compared with a threshold value, and when it is smaller than the predetermined threshold value, it functions as a determination means for determining cough.

本発明に係る咳検出用プログラムでは、パルス検出手段は、振幅とパルス幅が所定の以上のパルスを選択するパルス選択手段を備えることを特徴とする。   In the cough detection program according to the present invention, the pulse detection means includes pulse selection means for selecting a pulse whose amplitude and pulse width are greater than or equal to a predetermined value.

本発明に係る咳検出用プログラムでは、ケプストラム生成手段は、フーリェ変換結果について対数演算を行う対数演算手段と、対数演算手段の出力を逆フーリェ変換する逆フーリェ変換手段とを備えていることを特徴とする。   In the cough detection program according to the present invention, the cepstrum generation means includes logarithm calculation means for performing a logarithmic operation on the Fourier transform result and an inverse Fourier transform means for performing an inverse Fourier transform on the output of the logarithmic operation means. And

本発明に係る咳検出用プログラムでは、判定手段が用いる所定閾値を求める所定閾値生成手段を備えることを特徴とする。   The cough detection program according to the present invention is characterized by comprising a predetermined threshold generation means for obtaining a predetermined threshold used by the determination means.

本発明によれば、フーリェ変換結果を用いて有声音と無声音との峻別に力を発揮するケプストラムを生成し、生成されたケプストラムについて所定閾値と比較を行い、上記所定閾値より小さい場合に咳と判定するので、咳は無声音であり適切に判定することができ、咳の検出精度を向上させることができる。   According to the present invention, using the Fourier transform result, a cepstrum that demonstrates the distinctive power of voiced sound and unvoiced sound is generated, and the generated cepstrum is compared with a predetermined threshold value. Since it is determined, the cough is an unvoiced sound and can be determined appropriately, and the detection accuracy of the cough can be improved.

本発明にでは、振幅とパルス幅が所定の以上のパルスを選択するので、雑音や不要波成分を適切に除去して高精度な咳検出を確保する。   In the present invention, since a pulse having an amplitude and a pulse width exceeding a predetermined value is selected, noise and unnecessary wave components are appropriately removed to ensure highly accurate cough detection.

本発明では、ケプストラム生成においては、フーリェ変換結果について対数演算を行い、対数演算の出力を逆フーリェ変換するので、対数演算において気道成分との乗算によりなる音声信号を和算形式とした後に逆フーリェ変換することができ、これらの成分を分離して高精度な咳検出が可能となる。   In the present invention, in the cepstrum generation, the logarithmic operation is performed on the result of the Fourier transform, and the output of the logarithmic operation is inversely Fourier transformed. These components can be separated and cough detection can be performed with high accuracy.

本発明では、判定手段が用いる所定閾値を求める所定閾値生成手段を備えるので、所定閾値を生成して適切な咳検出を可能としてゆくことができ、高精度な咳検出へとつなげてゆくことができる。   In the present invention, since the predetermined threshold value generation means for obtaining the predetermined threshold value used by the determination means is provided, the predetermined threshold value can be generated to enable appropriate cough detection, which can lead to highly accurate cough detection. it can.

以下添付図面を参照して、本発明に係る咳検出装置及び咳検出用プログラムの実施例を説明する。各図において、同一の構成要素には同一の符号を付して重複する説明を省略する。人の発生する音声は、有声音と無声音とがある。有声音は、図1に示すように、声帯Sの振動による信号が、声道Pというフィルタを通って口Mから音声信号として出力されるものである。   Embodiments of a cough detection device and a cough detection program according to the present invention will be described below with reference to the accompanying drawings. In each figure, the same components are denoted by the same reference numerals, and redundant description is omitted. There are voiced sounds and unvoiced sounds. As shown in FIG. 1, the voiced sound is a signal produced by vibration of the vocal cord S that is output as an audio signal from the mouth M through a filter called a vocal tract P.

上記に対して、無声音は、図2に示されるように、喉奥などで発生した気息雑音Nが、声道Pというフィルタを通って口Mから音声信号として出力されるものである。一般的に日本語の場合、人が会話などにおいて用いる音声は、有声音による音または無声音に有声音が続く音である。これに対し、咳は無声音のみから構成されるものである。   On the other hand, as shown in FIG. 2, the unvoiced sound is a breath noise N generated in the back of the throat or the like, which is output as an audio signal from the mouth M through a filter called a vocal tract P. In general, in the case of Japanese, a voice used by a person in conversation or the like is a voiced sound or a voiced sound followed by a voiced sound. In contrast, a cough is composed only of unvoiced sounds.

上記に鑑み、会話などにより用いられる音声は、有声音を含むものであるから強いスペクトルを有するのに対し、咳は無声音のみから構成されており、スペクトルを有していない。この差を検出することにより、咳検出を行う。   In view of the above, the voice used for conversation or the like includes a voiced sound and thus has a strong spectrum, whereas the cough is composed only of an unvoiced sound and does not have a spectrum. By detecting this difference, cough detection is performed.

図3に、咳検出装置の実施例に係る構成図を示す。この実施例に係る咳検出装置は、音声取込手段を構成するマイクロホン11と、アンプ12と、A/D変換器13と、コンピュータ14とにより構成される。マイクロホン11は被験者の音声を取り込んで音声信号に変換して出力する。アンプ12は、マイクロホン11の出力を信号処理可能なレベルまで増幅してA/D変換器13へ送出する。   In FIG. 3, the block diagram which concerns on the Example of a cough detection apparatus is shown. The cough detection apparatus according to this embodiment includes a microphone 11, an amplifier 12, an A / D converter 13, and a computer 14 that constitute a voice capturing unit. The microphone 11 takes the subject's voice, converts it into a voice signal, and outputs it. The amplifier 12 amplifies the output of the microphone 11 to a level at which signal processing is possible and sends it to the A / D converter 13.

A/D変換器13は、例えば8KHzにより音声信号のディジタル化を行い、コンピュータ14は上記ディジタル値を例えば0.5秒毎に取り込み、これを処理する。コンピュータ14は、例えば図4に示すように、CPU20を中心として構成され、これに表示部21、キーボードやマウスなどの入力部22、記憶部23、更にA/D変換器13と接続されるポート24を備えている。   The A / D converter 13 digitizes the audio signal at, for example, 8 KHz, and the computer 14 captures the digital value every 0.5 seconds, for example, and processes it. For example, as shown in FIG. 4, the computer 14 is configured around a CPU 20, and further includes a display unit 21, an input unit 22 such as a keyboard and a mouse, a storage unit 23, and a port connected to the A / D converter 13. 24.

CPU20は、咳検出用プログラムを実行して図5に示す手段を実現することにより咳検出処理を行う。即ち、パルス検出手段30、フーリェ変換手段40、ケプストラム生成手段50、判定手段60及び所定閾値生成手段70を備える。   The CPU 20 performs the cough detection process by executing the cough detection program and realizing the means shown in FIG. That is, a pulse detection unit 30, a Fourier transform unit 40, a cepstrum generation unit 50, a determination unit 60, and a predetermined threshold generation unit 70 are provided.

パルス検出手段30は、前述のA/D変換器13により変換されたディジタル値を用いて包絡線を求めることによりパルスの検出を行うものである。具体的にはパルス検出手段30は、包絡線作成手段31、音声パルス検出手段32、パルス選択手段33を備える。包絡線作成手段31は、A/D変換されたディジタル値対応の線分を時系列に並べてその頂点を結ぶように包絡線を作成する。音声パルス検出手段32は包絡線作成手段31により作成された包絡線がパルス状に上に凸となっている部分をパルスとして検出する。パルス選択手段33は、音声パルス検出手段32が検出したパルスについて振幅とパルス幅が所定以上のものをパルスとして選択して出力する。   The pulse detection means 30 detects a pulse by obtaining an envelope using the digital value converted by the A / D converter 13 described above. Specifically, the pulse detection unit 30 includes an envelope creation unit 31, an audio pulse detection unit 32, and a pulse selection unit 33. The envelope creation means 31 creates an envelope so that line segments corresponding to digital values subjected to A / D conversion are arranged in time series and the vertices are connected. The sound pulse detecting means 32 detects, as a pulse, a part where the envelope created by the envelope creating means 31 is convex upward. The pulse selection means 33 selects and outputs a pulse whose amplitude and pulse width are greater than or equal to a predetermined value for the pulse detected by the audio pulse detection means 32.

フーリェ変換手段40は、パルス検出手段30により検出されたパルスに対してフーリェ変換を行うものである。このフーリェ変換手段40によるフーリェ変換の結果、パルス検出手段30により検出されたパルスのスペクトラムが得られることになる。   The Fourier transform means 40 performs Fourier transform on the pulses detected by the pulse detection means 30. As a result of the Fourier transform by the Fourier transform means 40, the spectrum of the pulses detected by the pulse detection means 30 is obtained.

ケプストラム生成手段50は、フーリェ変換結果を用いてケプストラムを生成するもので、フーリェ変換結果について対数演算を行う対数演算手段51と、対数演算手段51の出力を逆フーリェ変換する逆フーリェ変換手段52とを備えている。ここで、音成分をA(ω)、気道による伝達関数をH(ω)とすれば、出力される音声(有声音も無声音も含む)はA(ω)H(ω)となっており、フーリェ変換されたスペクトラムについても乗算の形であるが、対数演算によりlogA(ω)+logH(ω) のように和算の形式となり、これを逆フーリェ変換してケプストラムを得ることにより、成分分離し易く、低周波数のH(ω)を除去する。   The cepstrum generation unit 50 generates a cepstrum using the Fourier transform result, and includes a logarithmic operation unit 51 that performs logarithmic operation on the Fourier transform result, an inverse Fourier transform unit 52 that performs inverse Fourier transform on the output of the logarithmic operation unit 51, and It has. Here, if the sound component is A (ω) and the transfer function by the airway is H (ω), the output sound (including voiced and unvoiced sound) is A (ω) H (ω). The Fourier-transformed spectrum is also in the form of multiplication, but by logarithmic calculation it becomes a summation form like logA (ω) + logH (ω), and this is inverse Fourier transform to obtain the cepstrum, thereby separating the components It is easy to remove, and low frequency H (ω) is removed.

上記のようにして得られたケプストラムについて、判定手段60が所定閾値と比較を行い、上記所定閾値より小さい場合に咳と判定する。所定閾値は所定閾値生成手段70により作成されて与えられる。   About the cepstrum obtained as mentioned above, the determination means 60 compares with a predetermined threshold value, and when it is smaller than the said predetermined threshold value, it determines with a cough. The predetermined threshold value is created and given by the predetermined threshold value generation means 70.

以上のように構成された咳検出装置の動作を、図6に示されるフローチャートに基づき説明する。咳検出用プログラムの処理が開始されると、CPU20はA/D変換結果に係るディジタル値の取り込みを行い、このディジタル値対応の振幅を有する包絡線を作成して、この包絡線形状によりパルスを検出し、所定の大きさ(振幅、パルス幅)以上のパルスを選択する(S11)。   The operation of the cough detection apparatus configured as described above will be described based on the flowchart shown in FIG. When the processing of the cough detection program is started, the CPU 20 takes in a digital value related to the A / D conversion result, creates an envelope having an amplitude corresponding to the digital value, and generates a pulse by this envelope shape. A pulse having a predetermined size (amplitude and pulse width) or more is selected (S11).

次に、ステップS11において選択されたパルスに対してフーリェ変換を行い、スペクトラムを得る(S12)。例えば、「あ」の発生により図7(a)に示すアナログ波形が得られ、これに対応するスペクトラムは図8(b)のようになる。一方、咳をマクロホンで取り込んだ場合に図8(a)に示すアナログ波形が得られ、これに対応するスペクトラムは図8(b)のようになる。   Next, a Fourier transform is performed on the pulse selected in step S11 to obtain a spectrum (S12). For example, an analog waveform shown in FIG. 7A is obtained by the occurrence of “A”, and the spectrum corresponding to this is shown in FIG. 8B. On the other hand, when a cough is captured with a macrophone, the analog waveform shown in FIG. 8A is obtained, and the spectrum corresponding to this is as shown in FIG. 8B.

スペルクトラムが得られると、このスペルクトラムに対数演算を施して、和算の形式として、これを逆フーリェ変換してケプストラムを得る(S13)。図7(c)には、「あ」に対応するケプストラムが示され、図8(c)には、咳に対応するケプストラムが示されている。図7(c)と図8(c)との比較から明らかな通り、「あ」に対応するケプストラムには振幅の大きなスパイクが現れるが、咳に対応するケプストラムには全くスパイクが現れない。   When the spell spectrum is obtained, a logarithmic operation is performed on the spell spectrum, and a cepstrum is obtained by performing inverse Fourier transform as a summation format (S13). FIG. 7C shows a cepstrum corresponding to “A”, and FIG. 8C shows a cepstrum corresponding to cough. As is clear from the comparison between FIG. 7C and FIG. 8C, a spike having a large amplitude appears in the cepstrum corresponding to “A”, but no spike appears in the cepstrum corresponding to cough.

上記のようなケプストラムについて、所定閾値と比較を行い、所定閾値より小さい場合に咳と判定して、例えば咳回数カウント値を1増加させて(S14)、終了の指示が出されているかを検出し(S15)、終了の指示が出されていなければ、ステップS11へ戻って処理を続ける。   The cepstrum as described above is compared with a predetermined threshold value. If the cepstrum is smaller than the predetermined threshold value, it is determined as cough. For example, the cough frequency count value is increased by 1 (S14), and it is detected whether an end instruction is issued. If the end instruction is not issued, the process returns to step S11 to continue the process.

以上のような処理を行う咳検出装置及び咳検出用プログラムを用いて9人の被験者について、観測実験を行った。図9に実験結果を示す。横軸方向の区分は、各人の区分であり、no.1からno.9までの9人の結果を示す。縦軸方向は、ケプストラムのピッチ成分の振幅値を相対値で示したものである。同図のように咳、母音、破裂音、摩擦音についてケプストラムのピッチ成分の最大振幅値をプロットしてある。この9人に対しては、所定閾値を「0.05」としてステップS14の判定を行うことにより、「no.3」の被験者を除き、正確に咳と音声とを判別可能であることが分かった。   An observation experiment was performed on nine subjects using the cough detection apparatus and the cough detection program that perform the above processing. FIG. 9 shows the experimental results. The division in the horizontal axis direction is the division of each person, and no. 1 to no. Nine results up to 9 are shown. The vertical axis direction represents the amplitude value of the pitch component of the cepstrum as a relative value. As shown in the figure, the maximum amplitude value of the pitch component of the cepstrum is plotted for cough, vowel, plosive and friction sound. For these nine people, it was found that by performing the determination in step S14 with the predetermined threshold value being “0.05”, it is possible to accurately discriminate between cough and voice except for the “no.

同様に上記咳検出装置及び咳検出用プログラムを用いて、9人(男7名、女2名)の被験者について、合計130回のデータ取り込みにより観測実験を行った結果を、図10に示す。この実験結果によれば、咳を声と誤判定した回数は1回(no.3の人)であり、声を咳と誤判定した回数は0回であり、全体として130回の判定について129回の正しい判定がなされ、席については、45回中の44回が正しい判定であった。   Similarly, FIG. 10 shows the results of observation experiments conducted on 130 subjects (7 males and 2 females) using a total of 130 data acquisitions using the cough detection device and the cough detection program. According to the results of this experiment, the number of times that cough was mistakenly determined as a voice was 1 (no. 3), the number of times that voice was incorrectly determined as cough was 0, and a total of 130 times was determined for 130 times. Judgment of correct times was made, and for seats, 44 out of 45 times were correct.

そして、「正確に判別されたデータの個数」を「全データ個数」で割った比率である全体の判別率は、99.2%であり、「検出された咳の個数」を「真の咳の個数」で割った比率である検出率は、97.8%となり、従来例に比べて大きく精度の向上が図られている。   The overall discrimination rate, which is a ratio of “the number of correctly discriminated data” divided by “the total number of data”, is 99.2%, and “the number of detected coughs” is set to “true cough”. The detection rate, which is the ratio divided by the “number of”, is 97.8%, which is a significant improvement in accuracy compared to the conventional example.

次に、所定閾値生成手段70について説明を行う。所定閾値生成手段70は、ケプストラム生成手段50の出力を得ている。所定閾値生成手段70は、例えば、個別の被験者或いは複数の被験者について、図9に示したように、複数の咳と複数の音声のケプストラムを得てそのピッチ成分の最大振幅を求めて、咳対応の最大振幅値の平均値と音声対応の最大振幅値の平均値と得る。所定閾値生成手段70は、これら平均値の中間値を所定閾値として判定手段60へ与える。または所定閾値生成手段70は、咳対応の最大振幅値の中で最も大きい値と音声対応の最大振幅値の中で最も小さい値と得る。これら平均値の中間値(または、3:2に区分する点の値)を所定閾値生成手段70が検出し、所定閾値として判定手段60へ与える。   Next, the predetermined threshold generation means 70 will be described. The predetermined threshold generation means 70 obtains the output of the cepstrum generation means 50. For example, as shown in FIG. 9, the predetermined threshold value generation unit 70 obtains a plurality of coughs and a plurality of voice cepstrum and obtains the maximum amplitude of the pitch component for each subject or a plurality of subjects, and copes with coughing. And the average value of the maximum amplitude values corresponding to speech. The predetermined threshold generation means 70 gives an intermediate value of these average values to the determination means 60 as a predetermined threshold. Alternatively, the predetermined threshold generation means 70 obtains the largest value among the maximum amplitude values corresponding to cough and the smallest value among the maximum amplitude values corresponding to speech. An intermediate value of these average values (or the value of the point divided into 3: 2) is detected by the predetermined threshold value generation means 70 and given to the determination means 60 as the predetermined threshold value.

いずれにしても、複数の咳と複数の音声のケプストラムを得て、そのピッチ成分の最大振幅を求めて、図9に示すように分布させ、咳と音声のピッチ成分の最大振幅の分布を分離できる値(両方の値が存在しない値)を、所定閾値生成手段70が求めれば良いことになる。   In any case, the cepstrum of a plurality of coughs and a plurality of voices is obtained, the maximum amplitude of the pitch components is obtained and distributed as shown in FIG. 9, and the distribution of the maximum amplitudes of the pitch components of the cough and the voices is separated. The predetermined threshold value generation means 70 may obtain a possible value (a value in which both values do not exist).

有声音発生の原理を示す図。The figure which shows the principle of voiced sound generation. 無声音発生の原理を示す図。The figure which shows the principle of unvoiced sound generation. 本発明の実施例の咳検出装置の概略構成図。The schematic block diagram of the cough detection apparatus of the Example of this invention. 本発明の実施例の咳検出装置の要部ブロック図。The principal part block diagram of the cough detection apparatus of the Example of this invention. 本発明の実施例の咳検出装置の機能ブロック図。The functional block diagram of the cough detection apparatus of the Example of this invention. 本発明の実施例の咳検出装置の動作を示すフローチャート。The flowchart which shows operation | movement of the cough detection apparatus of the Example of this invention. 有線音「あ」について本発明の実施例の咳検出装置により処理される経過を示す図。The figure which shows the process processed by the cough detection apparatus of the Example of this invention about wired sound "A". 咳について本発明の実施例の咳検出装置により処理される経過を示す図。The figure which shows the process processed by the cough detection apparatus of the Example of this invention about cough. 本発明の実施例の咳検出装置による咳と音声との判定に関する実験結果を示す図。The figure which shows the experimental result regarding the determination of a cough and an audio | voice by the cough detection apparatus of the Example of this invention. 本発明の実施例の咳検出装置による咳と音声との判定に関する実験結果を示す図。The figure which shows the experimental result regarding the determination of a cough and an audio | voice by the cough detection apparatus of the Example of this invention.

符号の説明Explanation of symbols

11 マイクロホン
12 アンプ
13 変換器
14 コンピュータ
21 表示部
22 入力部
23 記憶部
24 ポート
30 パルス検出手段
31 包絡線作成手段
32 音声パルス検出手段
33 パルス選択手段
40 フーリェ変換手段
50 ケプストラム生成手段
51 対数演算手段
52 逆フーリェ変換手段
60 判定手段
70 所定閾値生成手段
DESCRIPTION OF SYMBOLS 11 Microphone 12 Amplifier 13 Converter 14 Computer 21 Display part 22 Input part 23 Memory | storage part 24 Port 30 Pulse detection means 31 Envelope creation means 32 Audio | voice pulse detection means 33 Pulse selection means 40 Fourier transform means 50 Cepstrum generation means 51 Logarithm calculation means 52 Inverse Fourier transform means 60 Determination means 70 Predetermined threshold generation means

Claims (8)

被験者の音声を取り込む音声取込手段と、
音声取込手段により取り込まれた音声をディジタル化するA/D変換器と、
このA/D変換器により変換されたディジタル値を用いて包絡線を求めることによりパルスの検出を行うパルス検出手段と、
検出されたパルスに対してフーリェ変換を行うフーリェ変換手段と、
フーリェ変換結果を用いてケプストラムを生成するケプストラム生成手段と、
ケプストラム生成手段により生成されたケプストラムについて所定閾値と比較を行い、前記所定閾値より小さい場合に咳と判定する判定手段と
を具備することを特徴とする咳検出装置。
Voice capturing means for capturing the subject's voice;
An A / D converter for digitizing the voice captured by the voice capturing means;
Pulse detection means for detecting a pulse by obtaining an envelope using a digital value converted by the A / D converter;
Fourier transform means for performing Fourier transform on the detected pulse;
Cepstrum generation means for generating a cepstrum using the Fourier transform result;
A cough detection apparatus comprising: a determination unit that compares the cepstrum generated by the cepstrum generation unit with a predetermined threshold value and determines cough when the cepstrum is smaller than the predetermined threshold value.
パルス検出手段は、振幅とパルス幅が所定の以上のパルスを選択するパルス選択手段を備えることを特徴とする請求項1に記載の咳検出装置。 2. The cough detection device according to claim 1, wherein the pulse detection means includes pulse selection means for selecting a pulse having an amplitude and a pulse width that are greater than or equal to a predetermined value. ケプストラム生成手段は、フーリェ変換結果について対数演算を行う対数演算手段と、対数演算手段の出力を逆フーリェ変換する逆フーリェ変換手段とを備えていることを特徴とする請求項1または2に記載の咳検出装置。 The cepstrum generation means includes logarithm calculation means for performing logarithmic operation on the Fourier transform result, and inverse Fourier transform means for performing inverse Fourier transform on the output of the logarithmic calculation means. Cough detection device. 判定手段が用いる所定閾値を求める所定閾値生成手段を備えることを特徴とする請求項1乃至3のいずれか1項に記載の咳検出装置。 The cough detection device according to claim 1, further comprising a predetermined threshold generation unit that calculates a predetermined threshold used by the determination unit. 被験者の音声を取り込み、取り込まれた音声をディジタル化した音声データを処理するコンピュータを、
A/D変換されたディジタル値を用いて包絡線を求めることによりパルスの検出を行うパルス検出手段と、
検出されたパルスに対してフーリェ変換を行うフーリェ変換手段と、
フーリェ変換結果を用いてケプストラムを生成するケプストラム生成手段と、
ケプストラム生成手段により生成されたケプストラムについて所定閾値と比較を行い、前記所定閾値より小さい場合に咳と判定する判定手段と
して機能させることを特徴とする咳検出用プログラム。
A computer that captures the subject's voice and processes the voice data obtained by digitizing the captured voice.
Pulse detection means for detecting a pulse by obtaining an envelope using a digital value subjected to A / D conversion;
Fourier transform means for performing Fourier transform on the detected pulse;
Cepstrum generation means for generating a cepstrum using the Fourier transform result;
A cough detection program for comparing a cepstrum generated by a cepstrum generation unit with a predetermined threshold value and functioning as a determination unit for determining cough when the cepstrum is smaller than the predetermined threshold value.
パルス検出手段は、振幅とパルス幅が所定の以上のパルスを選択するパルス選択手段を備えることを特徴とする請求項5に記載の咳検出用プログラム。 6. The cough detection program according to claim 5, wherein the pulse detection means includes pulse selection means for selecting a pulse having an amplitude and a pulse width that are greater than or equal to a predetermined value. ケプストラム生成手段は、フーリェ変換結果について対数演算を行う対数演算手段と、対数演算手段の出力を逆フーリェ変換する逆フーリェ変換手段とを備えていることを特徴とする請求項5または6に記載の咳検出用プログラム。 7. The cepstrum generating means comprises logarithmic arithmetic means for performing logarithmic computation on the Fourier transform result, and inverse Fourier transform means for performing inverse Fourier transform on the output of the logarithmic arithmetic means. Cough detection program. 判定手段が用いる所定閾値を求める所定閾値生成手段を備えることを特徴とする請求項5乃至7のいずれか1項に記載の咳検出用プログラム。 The cough detection program according to any one of claims 5 to 7, further comprising a predetermined threshold value generation unit that calculates a predetermined threshold value used by the determination unit.
JP2007131743A 2007-05-17 2007-05-17 Cough detection device and cough detection program Expired - Fee Related JP4913666B2 (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2007131743A JP4913666B2 (en) 2007-05-17 2007-05-17 Cough detection device and cough detection program

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2007131743A JP4913666B2 (en) 2007-05-17 2007-05-17 Cough detection device and cough detection program

Publications (2)

Publication Number Publication Date
JP2008284151A JP2008284151A (en) 2008-11-27
JP4913666B2 true JP4913666B2 (en) 2012-04-11

Family

ID=40144441

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2007131743A Expired - Fee Related JP4913666B2 (en) 2007-05-17 2007-05-17 Cough detection device and cough detection program

Country Status (1)

Country Link
JP (1) JP4913666B2 (en)

Families Citing this family (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP5035370B2 (en) * 2010-03-12 2012-09-26 沖電気工業株式会社 Motion detection device, motion detection method, and program
WO2023233667A1 (en) * 2022-06-03 2023-12-07 Pst株式会社 Information processing device, information processing method, information processing system, and information processing program

Family Cites Families (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH07376A (en) * 1993-06-15 1995-01-06 Chiesuto M I Kk Cough recording system
JPH09173320A (en) * 1995-12-25 1997-07-08 Casio Comput Co Ltd Voice inspecting device
CA2522006C (en) * 2003-04-10 2013-05-28 Vivometrics, Inc. Systems and methods for respiratory event detection
JP2007125360A (en) * 2005-10-05 2007-05-24 Konica Minolta Medical & Graphic Inc Cough detecting device

Also Published As

Publication number Publication date
JP2008284151A (en) 2008-11-27

Similar Documents

Publication Publication Date Title
JP7092777B2 (en) Methods and Devices for Cough Detection in Background Noise Environments
JP5708155B2 (en) Speaker state detecting device, speaker state detecting method, and computer program for detecting speaker state
JP6136394B2 (en) Respiratory sound analyzer, respiratory sound analysis method and respiratory sound analysis program
JPWO2010070840A1 (en) Voice detection device, voice detection program, and parameter adjustment method
JP4682700B2 (en) Voice recognition device
JP4913666B2 (en) Cough detection device and cough detection program
JP2009282824A (en) Emotion estimation system and program
JP4752028B2 (en) Discrimination processing method for non-speech speech in speech
US9772368B2 (en) Detection of an abnormal signal in a compound sampled signal
US6823304B2 (en) Speech recognition apparatus and method performing speech recognition with feature parameter preceding lead voiced sound as feature parameter of lead consonant
Jamaludin et al. An improved time domain pitch detection algorithm for pathological voice
JP2012024527A (en) Device for determining proficiency level of abdominal breathing
JP2006154212A (en) Speech evaluation method and evaluation device
JP2019056879A (en) Voice analysis system, voice analysis method, and voice analysis program
JP3588929B2 (en) Voice recognition device
JP2005010652A (en) Speech detecting device
JP6298527B2 (en) Body sound analysis apparatus, body sound analysis method, computer program, and recording medium
JPH05100661A (en) Measure border time extraction device
JP6298339B2 (en) Respiratory sound analysis device, respiratory sound analysis method, computer program, and recording medium
WO2023233667A1 (en) Information processing device, information processing method, information processing system, and information processing program
JP3484559B2 (en) Voice recognition device and voice recognition method
JP2011158515A (en) Device and method for recognizing speech
JP3474072B2 (en) Voice recognition device and voice recognition method
JP2019042148A (en) Deglutition sound determination device and deglutition sound determination method
KR101124451B1 (en) Method and apparatus for inducing speech for identification

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20100225

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20111228

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20120117

A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20120119

R150 Certificate of patent or registration of utility model

Free format text: JAPANESE INTERMEDIATE CODE: R150

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20150127

Year of fee payment: 3

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

LAPS Cancellation because of no payment of annual fees