JP7456498B2 - 置き去り検知方法、置き去り検知装置、およびプログラム - Google Patents
置き去り検知方法、置き去り検知装置、およびプログラム Download PDFInfo
- Publication number
- JP7456498B2 JP7456498B2 JP2022513762A JP2022513762A JP7456498B2 JP 7456498 B2 JP7456498 B2 JP 7456498B2 JP 2022513762 A JP2022513762 A JP 2022513762A JP 2022513762 A JP2022513762 A JP 2022513762A JP 7456498 B2 JP7456498 B2 JP 7456498B2
- Authority
- JP
- Japan
- Prior art keywords
- pitch
- autocorrelation
- acoustic signal
- unit
- determination
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 238000001514 detection method Methods 0.000 title claims description 74
- 238000004364 calculation method Methods 0.000 claims description 32
- 238000001228 spectrum Methods 0.000 claims description 32
- 206010011469 Crying Diseases 0.000 claims description 27
- 238000000605 extraction Methods 0.000 claims description 21
- 238000000034 method Methods 0.000 claims description 15
- 238000005311 autocorrelation function Methods 0.000 claims description 9
- 238000012545 processing Methods 0.000 description 22
- 230000002087 whitening effect Effects 0.000 description 19
- 230000004048 modification Effects 0.000 description 14
- 238000012986 modification Methods 0.000 description 14
- 238000010586 diagram Methods 0.000 description 12
- 230000006870 function Effects 0.000 description 10
- 238000013528 artificial neural network Methods 0.000 description 9
- 230000008569 process Effects 0.000 description 8
- 238000006243 chemical reaction Methods 0.000 description 6
- 230000002776 aggregation Effects 0.000 description 3
- 238000004220 aggregation Methods 0.000 description 3
- 238000012935 Averaging Methods 0.000 description 2
- 230000005236 sound signal Effects 0.000 description 2
- 230000004888 barrier function Effects 0.000 description 1
- 238000013461 design Methods 0.000 description 1
- AAOVKJBEBIDNHE-UHFFFAOYSA-N diazepam Chemical compound N=1CC(=O)N(C)C2=CC=C(Cl)C=C2C=1C1=CC=CC=C1 AAOVKJBEBIDNHE-UHFFFAOYSA-N 0.000 description 1
- 239000000284 extract Substances 0.000 description 1
- 238000010801 machine learning Methods 0.000 description 1
- 230000003287 optical effect Effects 0.000 description 1
- 230000003595 spectral effect Effects 0.000 description 1
- 238000012546 transfer Methods 0.000 description 1
- 230000009466 transformation Effects 0.000 description 1
- 230000001131 transforming effect Effects 0.000 description 1
- 210000001260 vocal cord Anatomy 0.000 description 1
- 230000001755 vocal effect Effects 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L25/00—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
- G10L25/48—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 specially adapted for particular use
- G10L25/51—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 specially adapted for particular use for comparison or discrimination
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L25/00—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
- G10L25/90—Pitch determination of speech signals
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L25/00—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
- G10L25/03—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 characterised by the type of extracted parameters
- G10L25/06—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 characterised by the type of extracted parameters the extracted parameters being correlation coefficients
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L25/00—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
- G10L25/03—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 characterised by the type of extracted parameters
- G10L25/18—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 characterised by the type of extracted parameters the extracted parameters being spectral information of each sub-band
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L25/00—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
- G10L25/03—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 characterised by the type of extracted parameters
- G10L25/21—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 characterised by the type of extracted parameters the extracted parameters being power information
Landscapes
- Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- Computational Linguistics (AREA)
- Signal Processing (AREA)
- Health & Medical Sciences (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Human Computer Interaction (AREA)
- Acoustics & Sound (AREA)
- Multimedia (AREA)
- Spectroscopy & Molecular Physics (AREA)
- Emergency Alarm Devices (AREA)
- Alarm Systems (AREA)
Description
この発明の第1実施形態は、自動車内に設置されたマイクロホンで収音した音響信号から乳幼児の泣き声を検出することで、自動車内における乳幼児の置き去りを検知する置き去り検知装置および方法である。ここでは、他の機能を実現するために既に自動車内に設置されているマイクロホンを利用することを想定する。他の機能とは、例えば、緊急通報やハンズフリー通話等が挙げられる。仮にマイクロホンを用いる他の機能を備えない自動車へ導入するとしても、これらの機能を想定した車載用マイクロホンは一般的に流通しているため、新たにマイクロホンを搭載することは大きなコストアップには繋がらない。
変形例1では、第1実施形態の置き去り検知装置100において、マイクロホンM1が収音した音響信号を白色化した上で、乳幼児の泣き声を検出するように構成する。
第1実施形態では、音響信号のピッチ周波数を用いて乳幼児の泣き声を検出した。第2実施形態では、ピッチ周波数に加えて、ピッチ周期に相当する自己相関値を用いて乳幼児の泣き声を検出するように構成する。
第2実施形態では、音響信号のピッチ周波数およびピッチ周期に相当する自己相関値を用いて乳幼児の泣き声を検出した。第3実施形態では、さらに短時間平均パワーを用いて乳幼児の泣き声を検出するように構成する。
第2実施形態では、音響信号のピッチ周波数およびピッチ周期に相当する自己相関値を用いて乳幼児の泣き声を検出した。第4実施形態では、さらにパワースペクトルを用いて乳幼児の泣き声を検出するように構成する。
第4実施形態の置き去り検知装置104において、ピッチ抽出部1における処理の途中で得られるパワースペクトルを用いるように構成してもよい。変形例2の置き去り検知装置は、パワースペクトル計算部4を備えず、図9に示す白色化部15を備える。変形例2の白色化部15は、変形例1の白色化部14の各処理部に加えて、バンド集約部148を備える。バンド集約部148は、二乗計算部142の出力に対して、予め設定したバンド内で平均するバンド集約を行い、判定部2の形状判定部24へ出力する。すなわち、白色化部15は、白色化部14とパワースペクトル計算部4の両方の機能を備える処理部である。
第3実施形態と第4実施形態は組み合わせることが可能である。すなわち、変形例3の置き去り検知装置は、ピッチ抽出部1、判定部2、短時間平均パワー計算部3、およびパワースペクトル計算部4を備える。変形例3の判定部2は、ピッチ判定部21、自己相関判定部22、パワー判定部23、および形状判定部24を備える。変形例3の論理積部20は、ピッチ判定部21の出力する判定結果と自己相関判定部22の出力する判定結果とパワー判定部23の出力する判定結果と形状判定部24の出力する判定結果の論理積を検知結果として出力する。すなわち、ピッチ判定部21の判定結果と自己相関判定部22の判定結果とパワー判定部23の判定結果と形状判定部24の判定結果のすべてが入力音響信号に乳幼児の泣き声が含まれることを示すとき、入力音響信号に乳幼児の泣き声が含まれることを示す検知結果を出力する。
第5実施形態は、第1~4実施形態で求めたピッチ周波数、自己相関値、短時間平均パワー、およびパワースペクトルのすべてまたは一部を、ニューラルネットワーク等の識別器へ入力し、その出力値から判定を行うように構成する。
上記実施形態で説明した各装置における各種の処理機能をコンピュータによって実現する場合、各装置が有すべき機能の処理内容はプログラムによって記述される。そして、このプログラムを図12に示すコンピュータの記憶部1020に読み込ませ、演算処理部1010、入力部1030、出力部1040などに動作させることにより、上記各装置における各種の処理機能がコンピュータ上で実現される。
Claims (6)
- 自動車内に設置されたマイクロホンにより収音された音響信号から乳幼児の泣き声を検知する置き去り検知方法であって、
ピッチ抽出部が、前記音響信号からピッチ周波数を求め、
判定部が、前記ピッチ周波数が予め定めた周波数帯に含まれるか否かを判定するものであり、
前記ピッチ抽出部は、
自己相関部が、前記音響信号から自己相関関数を求め、
ピーク検出部が、前記自己相関関数の自己相関値が最初に0以下になる時刻以降、かつ、前記自己相関値が予め定めた閾値以上となる条件を満たす範囲で、最も時刻が早いピークの時刻をピッチ周期として検出し、
逆数計算部が、前記ピッチ周期の逆数を前記ピッチ周波数として計算する、
置き去り検知方法。 - 請求項1に記載の置き去り検知方法であって、
前記判定部は、前記ピッチ周期に対応する前記自己相関値が予め定めた自己相関閾値を超えるか否かをさらに判定する、
置き去り検知方法。 - 請求項1または2に記載の置き去り検知方法であって、
前記判定部は、前記音響信号から計算された短時間平均パワーが予め定めたパワー閾値を超えるか否かをさらに判定する、
置き去り検知方法。 - 請求項1または2に記載の置き去り検知方法であって、
前記判定部は、前記音響信号から計算されたパワースペクトルが予め定めた判定領域に含まれるか否かをさらに判定する、
置き去り検知方法。 - 自動車内に設置されたマイクロホンにより収音された音響信号から乳幼児の泣き声を検知する置き去り検知装置であって、
前記音響信号からピッチ周波数を求めるピッチ抽出部と、
前記ピッチ周波数が予め定めた周波数帯に含まれるか否かを判定する判定部と、を含み、
前記ピッチ抽出部は、
前記音響信号から自己相関関数を求める自己相関部と、
前記自己相関関数の自己相関値が最初に0以下になる時刻以降、かつ、前記自己相関値が予め定めた閾値以上となる条件を満たす範囲で、最も時刻が早いピークの時刻をピッチ周期として検出するピーク検出部と、
前記ピッチ周期の逆数を前記ピッチ周波数として計算する逆数計算部と、
を含む置き去り検知装置。 - 請求項1から4のいずれかに記載の置き去り検知方法の各ステップをコンピュータに実行させるためのプログラム。
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
PCT/JP2020/015795 WO2021205560A1 (ja) | 2020-04-08 | 2020-04-08 | 置き去り検知方法、置き去り検知装置、およびプログラム |
Publications (2)
Publication Number | Publication Date |
---|---|
JPWO2021205560A1 JPWO2021205560A1 (ja) | 2021-10-14 |
JP7456498B2 true JP7456498B2 (ja) | 2024-03-27 |
Family
ID=78022513
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2022513762A Active JP7456498B2 (ja) | 2020-04-08 | 2020-04-08 | 置き去り検知方法、置き去り検知装置、およびプログラム |
Country Status (3)
Country | Link |
---|---|
US (1) | US20230162755A1 (ja) |
JP (1) | JP7456498B2 (ja) |
WO (1) | WO2021205560A1 (ja) |
Families Citing this family (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN114954339B (zh) * | 2022-05-24 | 2023-04-28 | 中国第一汽车股份有限公司 | 一种基于语音识别技术防止儿童被困车内的检测装置和方法 |
Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2016102822A (ja) | 2014-11-27 | 2016-06-02 | 株式会社Jvcケンウッド | 乳幼児泣き声検出装置 |
JP2019099086A (ja) | 2017-12-07 | 2019-06-24 | Joyson Safety Systems Japan株式会社 | 乗員検知装置及び警告装置 |
Family Cites Families (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP4491462B2 (ja) * | 2003-05-21 | 2010-06-30 | コーニンクレッカ フィリップス エレクトロニクス エヌ ヴィ | 可聴のメッセージを生成可能なモニタシステム |
-
2020
- 2020-04-08 US US17/916,963 patent/US20230162755A1/en active Pending
- 2020-04-08 WO PCT/JP2020/015795 patent/WO2021205560A1/ja active Application Filing
- 2020-04-08 JP JP2022513762A patent/JP7456498B2/ja active Active
Patent Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2016102822A (ja) | 2014-11-27 | 2016-06-02 | 株式会社Jvcケンウッド | 乳幼児泣き声検出装置 |
JP2019099086A (ja) | 2017-12-07 | 2019-06-24 | Joyson Safety Systems Japan株式会社 | 乗員検知装置及び警告装置 |
Also Published As
Publication number | Publication date |
---|---|
US20230162755A1 (en) | 2023-05-25 |
WO2021205560A1 (ja) | 2021-10-14 |
JPWO2021205560A1 (ja) | 2021-10-14 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN113380272A (zh) | 基于音频的紧急车辆检测与追踪 | |
CN111354371B (zh) | 交通工具运行状态的预测方法、装置、终端及存储介质 | |
US9934687B2 (en) | Method for providing sound detection information, apparatus detecting sound around a vehicle, and a vehicle including the same | |
CN108986822A (zh) | 语音识别方法、装置、电子设备及非暂态计算机存储介质 | |
CN111325386B (zh) | 交通工具运行状态的预测方法、装置、终端及存储介质 | |
CN110673096B (zh) | 语音定位方法和装置、计算机可读存储介质、电子设备 | |
US10618466B2 (en) | Method for providing sound detection information, apparatus detecting sound around vehicle, and vehicle including the same | |
Fook et al. | Comparison of speech parameterization techniques for the classification of speech disfluencies | |
JP6367691B2 (ja) | 報知音感知・識別装置、報知音感知・識別方法、報知音感知・識別プログラム | |
JP7456498B2 (ja) | 置き去り検知方法、置き去り検知装置、およびプログラム | |
Castellana et al. | Cepstral Peak Prominence Smoothed distribution as discriminator of vocal health in sustained vowel | |
JP5803125B2 (ja) | 音声による抑圧状態検出装置およびプログラム | |
JP6459330B2 (ja) | 音声認識装置、音声認識方法、及び音声認識プログラム | |
CN111862946B (zh) | 一种订单处理方法、装置、电子设备及存储介质 | |
Hajihashemi et al. | Novel time-frequency based scheme for detecting sound events from sound background in audio segments | |
Silva et al. | Infant cry detection system with automatic soothing and video monitoring functions | |
CN111717754A (zh) | 基于安全警报语的轿厢式电梯的控制方法 | |
WO2020208972A1 (ja) | 応答生成装置及び応答生成方法 | |
US20160372132A1 (en) | Voice enhancement device and voice enhancement method | |
JP2018005163A (ja) | 運転支援装置および運転支援方法 | |
JP6827602B2 (ja) | 情報処理装置、プログラム及び情報処理方法 | |
WO2021210088A1 (ja) | 収集システム、収集装置、その方法、およびプログラム | |
JP2019174757A (ja) | 音声認識装置 | |
WO2023159582A1 (zh) | 耳机控制方法、耳机、装置及存储介质 | |
US20240000369A1 (en) | AUTOMATIC PARKINSONS DISEASE DETECTION BASED ON THE COMBINATION OF LONG-TERM ACOUSTIC FEATURES AND MEL FREQUENCY COEFFICIENTS (MFCCs) |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20220906 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20231017 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20231206 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20240213 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20240226 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 7456498 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |