JP6329753B2 - 情報処理プログラム、情報処理装置、情報処理システム、および、音判定方法 - Google Patents

情報処理プログラム、情報処理装置、情報処理システム、および、音判定方法 Download PDF

Info

Publication number
JP6329753B2
JP6329753B2 JP2013238008A JP2013238008A JP6329753B2 JP 6329753 B2 JP6329753 B2 JP 6329753B2 JP 2013238008 A JP2013238008 A JP 2013238008A JP 2013238008 A JP2013238008 A JP 2013238008A JP 6329753 B2 JP6329753 B2 JP 6329753B2
Authority
JP
Japan
Prior art keywords
sound
determination
section
information processing
microphone
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
JP2013238008A
Other languages
English (en)
Other versions
JP2015099194A (ja
Inventor
繁利 郷原
繁利 郷原
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Nintendo Co Ltd
Original Assignee
Nintendo Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Nintendo Co Ltd filed Critical Nintendo Co Ltd
Priority to JP2013238008A priority Critical patent/JP6329753B2/ja
Priority to US14/496,546 priority patent/US9544684B2/en
Publication of JP2015099194A publication Critical patent/JP2015099194A/ja
Application granted granted Critical
Publication of JP6329753B2 publication Critical patent/JP6329753B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04RLOUDSPEAKERS, MICROPHONES, GRAMOPHONE PICK-UPS OR LIKE ACOUSTIC ELECTROMECHANICAL TRANSDUCERS; DEAF-AID SETS; PUBLIC ADDRESS SYSTEMS
    • H04R3/00Circuits for transducers, loudspeakers or microphones
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04RLOUDSPEAKERS, MICROPHONES, GRAMOPHONE PICK-UPS OR LIKE ACOUSTIC ELECTROMECHANICAL TRANSDUCERS; DEAF-AID SETS; PUBLIC ADDRESS SYSTEMS
    • H04R2410/00Microphones
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04RLOUDSPEAKERS, MICROPHONES, GRAMOPHONE PICK-UPS OR LIKE ACOUSTIC ELECTROMECHANICAL TRANSDUCERS; DEAF-AID SETS; PUBLIC ADDRESS SYSTEMS
    • H04R2420/00Details of connection covered by H04R, not provided for in its groups
    • H04R2420/07Applications of wireless loudspeakers or wireless microphones

Landscapes

  • Physics & Mathematics (AREA)
  • Engineering & Computer Science (AREA)
  • Acoustics & Sound (AREA)
  • Signal Processing (AREA)
  • User Interface Of Digital Computer (AREA)
  • Health & Medical Sciences (AREA)
  • General Health & Medical Sciences (AREA)
  • Otolaryngology (AREA)
  • Telephone Function (AREA)
  • Circuit For Audible Band Transducer (AREA)

Description

本発明は、入力された音が所定の種類の音(例えば、息吹きかけによる音)であるか否かを判定するための情報処理プログラム、情報処理装置、情報処理システム、および、音判定方法に関する。
従来、マイクに対して吹きかけられた息の入力を検知する技術がある(例えば、特許文献1参照)。例えば、従来の息吹きかけ判別装置は、息による音を表す周波数分布を予め用意しておくとともに、マイクに対して入力された音について周波数分布を検出する。そして、上記判別装置は、用意された周波数分布と、検出された入力音の周波数分布とが一致するかどうかを判別することによって、息の吹きかけの入力が行われたか否かを判別する。
特開2006−145851号公報
従来の方法では、周波数分析や周波数分布のマッチングの処理によって、処理負荷が大きくなるおそれがあった。
それ故、本発明の目的は、入力された音を簡易な方法で判定することができる情報処理プログラム、情報処理装置、情報処理システム、および、音判定方法を提供することである。
上記の課題を解決すべく、本発明は、以下の(1)〜(12)の構成を採用した。
(1)
本発明の一例は、マイクに対して入力された音について判定を行う情報処理装置のコンピュータにおいて実行される情報処理プログラムである。情報処理プログラムは、取得手段と、平均振幅算出手段と、判定手段としてコンピュータを機能させる。取得手段は、マイクによって検知される音のデータを取得する。平均振幅算出手段は、所定の判定区間における音について、当該判定区間に含まれる複数の部分区間毎に、振幅の平均である平均振幅を、取得された音のデータを用いて算出する。判定手段は、部分区間毎の平均振幅に基づいて、マイクに対して入力された音が、所定の種類の音であるか否かを判定する。所定の種類の音は、部分区間の長さに対応する周波数成分の音であってもよい。
上記「所定の種類の音であるか否かを判定する」とは、「所定の種類の音であるか、他の種類の音であるかを判定する」ことを含む意味である。すなわち、判定手段は、上記所定の種類の音のみを検出し、他の種類の音を検出しないものであってもよいし、上記所定の種類の音と他の種類の音とを区別して検出するものであってもよい。
上記(1)の構成によれば、部分区間毎の平均振幅によって、部分区間の長さに対応する周波数以下の周波数成分の大きさを簡易な方法で知ることができる。すなわち、上記(1)の構成によれば、周波数分析(周波数変換)や周波数スペクトルのパターンマッチングといった複雑な処理を実行することなく、上記平均振幅を算出するという簡易な方法で判定を行うことができる。
(2)
判定手段は、部分区間毎の平均振幅の絶対値をそれぞれ算出し、算出された各絶対値に基づいて判定を行ってもよい。
上記(2)の構成によれば、判定区間の音のうちで、部分区間に対応する周波数以下の成分の大きさを表す指標である、平均振幅の絶対値に基づいて判定が行われる。すなわち、部分区間の長さに対応する周波数以下の成分の大きさに基づいて判定を行うことができる。これによって、上記判定を精度良く行うことができる。
(3)
判定手段は、各絶対値の平均値を算出し、算出された平均値により決定される判定値を用いて判定を行ってもよい。
上記(3)の構成によれば、上記平均値を用いることによって、部分区間の長さに対応する周波数以下の成分を有する特定の種類の音(例えば、息吹きかけによる音)の判定を容易に行うことができる。
(4)
判定手段は、判定区間内における隣り合う2つの部分区間における2つの平均振幅の差分を、隣り合う2つの部分区間の組毎にそれぞれ算出し、各差分の絶対値により決定される判定値を用いて判定を行ってもよい。
上記(4)の構成によれば、部分区間の長さに対応する周波数以下であって、かつ、部分区間2つ分の長さに対応する周波数以上の成分を有する特定の種類の音(例えば、息吹きかけによる音)の判定を行うことができる。これによれば、特定の種類の音と、当該音よりも周波数が低い他の種類の音とを区別することができるので、より精度良く判定を行うことができる。
(5)
判定手段は、1つの部分区間における平均振幅と、その部分区間を含み、かつ、連続する2以上の部分区間からなるグループ区間における平均振幅との差分を部分区間毎に算出し、各差分の絶対値によって決定される判定値を用いて判定を行ってもよい。
上記(5)の構成によれば、部分区間の長さに対応する周波数以下であって、かつ、部分区間の所定数(グループ区間に含まれる部分区間の数)倍の長さに対応する周波数以上の成分を有する特定の種類の音の判定を行うことができる。これによれば、特定の種類の音と、当該音よりも周波数が低い他の種類の音とを区別することができるので、より精度良く判定を行うことができる。
(6)
判定手段は、判定値の大きさと所定の閾値との大小関係に基づいて判定を行ってもよい。
上記(6)の構成によれば、判定値を用いた判定処理を容易に行うことができる。
(7)
判定手段は、判定区間における音量に対する判定値の割合に基づいて判定を行ってもよい。
上記(7)の構成によれば、判定値を用いた判定処理を精度良く行うことができる。
(8)
判定手段は、マイクに対して入力された音が息吹きかけによる音であるか否かを判定してもよい。
上記(8)の構成によれば、マイクに対して入力される息吹きかけによる音を簡易な方法で検出することができる。例えば、声と息吹きかけとを区別して、息吹きかけの入力に応じて所定の処理を実行することができる。
(9)
判定手段は、マイクに対して入力された音が声による音であるか否かを判定してもよい。
上記(9)の構成によれば、マイクに対して入力される声による音を簡易な方法で検出することができる。例えば、声と息吹きかけとを区別して、声の入力に応じて所定の処理を実行することができる。
(10)
判定区間に含まれる複数の部分区間は、略同一の長さに設定されてもよい。
上記(10)の構成によれば、判定区間の音のうち、各部分区間の長さによって決められる所定の周波数以下の成分の大きさを精度良く算出することができ、その結果、精度良く判定を行うことができる。
(11)
部分区間は、1/700[秒]以上の長さに設定されてもよい。
上記(11)の構成によれば、マイクに対して入力される息吹きかけによる音を簡易な方法で検出することができる。
(12)
部分区間は、1/400[秒]以上の長さに設定されてもよい。
上記(12)の構成によれば、マイクに対して入力される息吹きかけによる音を簡易な方法で(上記(11)の構成よりも精度良く)検出することができる。
なお、本発明の別の一例は、上記(1)〜(12)の情報処理プログラムを実行することによって実現される各手段と同等の手段を備える情報処理装置あるいは情報処理システムであってもよいし、上記(1)〜(12)において実行される音判定方法であってもよい。
以上のように、本発明によれば、入力された音を簡易な方法で判定することができる。
本実施形態に係る情報処理装置の一例の構成を示すブロック図 声(声による音)が入力される場合と、息(息吹きかけによる音)が入力される場合とにおける音の波形を模式的に示す図 本実施形態において、検知された音に対して設定される判定区間と部分区間との一例を示す図 図2の(b)に示す波形の音に関する、部分区間毎の平均振幅を示す図 図2の(a)に示す波形の音に関する、部分区間毎の平均振幅を示す図 図2の(b)に示す波形の音に対する判定処理の一例を説明するための図 図2の(a)に示す波形の音に対する判定処理の一例を説明するための図 本実施形態において情報処理装置1の処理部4が実行する情報処理の流れの一例を示すフローチャート 複数の種類の音の周波数特性の一例を示す図 第2変形例における判定値の算出方法の一例を示す図 第3変形例における判定値の算出方法の一例を示す図
[1.情報処理システムの構成]
以下、本実施形態の一例に係る情報処理プログラム、情報処理装置、情報処理システム、および、音判定方法について説明する。まず、情報処理装置(情報処理システム)の構成について説明する。図1は、本実施形態に係る情報処理装置の一例の構成を示すブロック図である。図1に示すように、情報処理装置1は、音入力部2と、操作入力部3と、処理部4と、プログラム記憶部5と、表示部6とを備える。情報処理装置1は、例えば、ゲーム装置、パーソナルコンピュータ、携帯端末、スマートフォン等、どのような形態の情報処理装置であってもよい。本実施形態においては、情報処理装置1は、音入力部2に対して入力された音が息吹きかけによる音であるか否かを判定することで、息を吹きかける入力が行われたか否かを判定するものである。以下、情報処理装置1の各部について説明する。
音入力部2は、マイクを備え、周囲の音(ユーザによる息吹きかけ入力を含む)を検知する。なお、マイクに対しては、息吹きかけ入力の他、音声入力が行われてもよい。マイクによって検知された音信号は、音入力部2が備える処理回路によってA/D変換(サンプリングを含む)され、A/D変換によって得られる音データが処理部4へ出力される。
操作入力部3は、ボタン(キー)、タッチパネル、および/または、マウス等、ユーザから操作入力を受け付ける任意の入力装置である。操作入力部3によって受け付けられたユーザの操作入力を表すデータは、処理部4へ出力される。
処理部4は、音入力部2(および操作入力部3)からのデータを適宜用いて、情報処理装置1において実行される各種の情報処理(後述する息判定処理等)を実行する。処理部4は、CPU(Central Processing Unit)およびメモリを有し、CPUがメモリを用いて所定の情報処理プログラムを実行することによって上記各種の情報処理が実行される。
プログラム記憶部5は、情報処理システム1において実行される上記情報処理プログラムを記憶する。プログラム記憶部5は、処理部4がアクセス可能な任意の記憶装置(記憶媒体)である。プログラム記憶部5は、例えばハードディスクやメモリ等の、情報処理装置1に内蔵される記憶部であってもよいし、例えば光ディスクやカートリッジ等の、情報処理装置1に着脱可能な記憶媒体であってもよい。
表示部6は、処理部4による情報処理によって生成される画像を表示する表示装置である。なお、情報処理装置1は、表示部6を備えていなくてもよい。また、情報処理装置1は、例えば、自身とは別体の表示装置(例えばテレビ)に画像を送信して表示させるようにしてもよい。
なお、他の実施形態においては、複数の装置を含む情報処理システムが、上記情報処理装置1における各部を備える構成であってもよい。例えば、他の実施形態においては、情報処理システムは、処理部4を有し情報処理を行うメインの情報処理装置と、音入力部2、操作入力部3、および表示部6を有する端末装置とを含む構成であってもよい。また、他の実施形態においては、情報処理装置1において実行される情報処理の少なくとも一部が、ネットワーク(広域ネットワークおよび/またはローカルネットワーク)によって通信可能な複数の装置によって分散して実行されてもよい。
[2.情報処理装置における息判定処理の概要]
次に、図2〜図7を参照して、情報処理装置1(の処理部4)において実行される処理の概要を説明する。図2は、声(声による音)が入力される場合と、息(息吹きかけによる音)が入力される場合とにおける音の波形を模式的に示す図である。音入力部2に対してユーザの声が入力される場合、音入力部2によって検知される音は、図2の(a)に示すように、周期性が強く、また、比較的高い周波数を主に有する波形となる(図9の(a)および(b)参照)。一方、音入力部2に対してユーザの息が入力される場合、音入力部2によって検知される音は、図2の(b)に示すように、息の風圧によって乱れた波形となり、また、比較的低い周波数を有する波形となる(図9の(c)参照)。本実施形態においては、情報処理装置1は、入力された声と息とを区別し、声が検出された場合には息吹きかけの入力が行われたと判定せず、息が検出された場合には息吹きかけの入力が行われたと判定するべく、以下に示す息判定処理を実行する。
(部分区間)
図3は、本実施形態において、検知された音に対して設定される判定区間と部分区間との一例を示す図である。図3において、判定区間は、音入力部2によって検知された音のうちで、息(息吹きかけによる音)であるか否かの判定を行う対象となる区間である。つまり、情報処理装置1は、判定区間を設定し、判定区間における音が息であるか否かを判定する。なお、詳細は後述するが、本実施形態においては、判定区間は複数設定され、息吹きかけ入力が行われたか否かは、当該複数の判定区間における各判定結果に基づいて判定される(後述するステップS6およびS7参照)。
また、図3に示すように、1つの判定区間内には、複数(図3では7つ)の部分区間が設定される。1つの部分区間の長さは、検出すべき音(本実施形態においては、息吹きかけによる音)の周波数を考慮して設定される。詳細は後述するが、本実施形態において検出すべき息吹きかけによる音は、160[Hz]以下の周波数成分を含むと考えられる(図9参照)。そのため、本実施形態においては、部分区間の長さを、160[Hz]の波長の半分に対応する長さである1/320[sec]とする。
(判定区間の音に対する処理)
次に、図4〜図7を参照して、判定区間の音が息であるか否かを判定するための処理について説明する。上記判定区間の音データを音入力部2から取得すると、処理部4は、取得された音データを用いて、判定区間内の部分区間毎に振幅の平均(「平均振幅」と呼ぶ)を算出する。
図4は、図2の(b)に示す波形の音に関する、部分区間毎の平均振幅を示す図である。また、図5は、図2の(a)に示す波形の音に関する、部分区間毎の平均振幅を示す図である。ここで、判定区間の音が息である場合には、部分区間の長さに対応する周波数よりも低い周波数成分を多く含む。そのため、この場合、図4に示すように、部分区間の平均振幅(の絶対値)は比較的大きい値となり得る。一方、判定区間の音が声である場合には、部分区間の長さに対応する周波数よりも低い周波数成分は少ない。そのため、この場合、図5に示すように、部分区間の平均振幅(の絶対値)は比較的小さい値となる。
部分区間毎の平均振幅を算出すると、処理部4は、各平均振幅の絶対値を算出し、各絶対値の平均(「絶対値平均」と呼ぶ)を算出する。さらに、本実施形態においては、処理部4は、判定区間全体の平均振幅(「全体平均」と呼ぶ)を算出し、上記絶対値平均から全体平均を減算した値を判定値として算出する。
処理部4は、上記のように算出された判定値を用いて、判定区間の音が息であるか否かを判定する。具体的には、処理部4は、判定値が予め定められた閾値よりも大きい場合、判定区間の音が息であると判定し、判定値が当該閾値以下である場合、判定区間の音が息でないと判定する。
図6は、図2の(b)に示す波形の音に対する判定処理の一例を説明するための図である。また、図7は、図2の(a)に示す波形の音に対する判定処理の一例を説明するための図である。上述のように、判定区間の音が息である場合には、部分区間の平均振幅(の絶対値)は比較的大きい値となり得るので、絶対値平均が大きくなる。その結果、判定値は大きくなるので、判定値が上記閾値よりも大きくなり、図6に示すように、判定区間の音が息であると判定される。一方、判定区間の音が声である場合には、部分区間の平均振幅(の絶対値)は比較的小さい値となるので、絶対値平均が小さくなる。その結果、判定値は小さくなるので、判定値が上記閾値以下となり、図7に示すように、判定区間の音が息でないと判定される。このように、本実施形態における音判定方法によれば、検知された音が声である場合と息である場合とを区別することができるので、息吹きかけを正確に判定することができる。
以上のように、本実施形態においては、情報処理装置1は、マイクによって検知される音のデータを取得し、所定の判定区間における音について、当該判定区間に含まれる複数の部分区間毎に平均振幅を算出する(図4、図5)。そして、情報処理装置1は、部分区間毎の平均振幅に基づいて、マイクに対して入力された音が、所定の種類の音(息吹きかけによる音)であるか否かを判定する。これによれば、部分区間毎の平均振幅を算出することによって、部分区間の長さに対応する周波数以下の周波数成分の大きさを簡易な方法で知ることができる。したがって、本実施形態によれば、上記平均振幅を用いることによって、周波数変換および周波数スペクトルのパターンマッチングといった複雑な処理を実行することなく、息吹きかけによる音を簡易な方法で判定することができる。これによって、情報処理装置1における処理の高速化や、情報処理装置の構成の簡易化を図ることができる。
[3.情報処理装置1における処理の具体例]
次に、本実施形態において情報処理装置1で実行される、上記の息判定処理を用いた情報処理の具体的な一例について説明する。図8は、本実施形態において情報処理装置1の処理部4が実行する情報処理の流れの一例を示すフローチャートである。本実施形態においては、図8に示す一連の処理は、処理部4のCPUが、プログラム記憶部5に記憶される所定の情報処理プログラムを実行することによって行われる。
図8に示す情報処理が開始されるタイミングは任意である。本実施形態においては、当該情報処理は、例えば上記情報処理プログラムの実行を開始する指示をユーザが行ったことに応じて開始される。また、情報処理プログラムは、適宜のタイミングでその一部または全部が処理部4のメモリに読み出され、CPUによって実行される。これによって、図8に示す一連の処理が開始される。なお、上記情報処理プログラムは、情報処理装置1内のプログラム記憶部5に予め記憶されているものとする。ただし、他の実施形態においては、情報処理プログラムは、情報処理装置1に着脱可能な記憶媒体から取得されてメモリに記憶されてもよいし、インターネット等のネットワークを介して他の装置から取得されてメモリに記憶されてもよい。
なお、図8に示すフローチャートにおける各ステップの処理は、単なる一例に過ぎず、同様の結果が得られるのであれば、各ステップの処理順序を入れ替えてもよいし、各ステップの処理に加えて(または代えて)別の処理が実行されてもよい。また、本実施形態では、上記フローチャートの各ステップの処理をCPUが実行するものとして説明するが、上記フローチャートにおける一部のステップの処理を、CPU以外のプロセッサや専用回路が実行するようにしてもよい。
図8に示す情報処理では、まずステップS1において、CPUは、判定区間の音データを取得する。ここで、本実施形態において、音入力部2から取得された音データは、情報処理装置1内のバッファに記憶される。このバッファには、最後に取得されたものから所定時間(所定時間は、判定区間の長さよりも長い)分の音データが記憶される。CPUは、最後に取得されたものから判定区間の長さ分の音データを読み出してメモリに記憶する。
ステップS2において、CPUは、判定区間における音量が、予め定められた所定値以上であるか否かを判定する。なお、判定区間における音量は、判定区間における音データに含まれる各サンプルの振幅値の絶対値の平均としてCPUによって算出される。ステップS2の判定結果が肯定である場合、ステップS3の処理が実行される。一方、ステップS2の判定結果が否定である場合、ステップS3〜S8の一連の処理がスキップされてステップS9の処理が実行される。
詳細は後述するが、ステップS3〜S8の処理は、所定区間の音が息であるか否かを判定し、息吹きかけが行われたことに応じて所定の情報処理を実行する処理である。つまり、本実施形態においては、判定区間における音量が小さい場合には、所定区間の音が息であるか否かの判定を行わず、上記所定の情報処理を実行しないようにしている。これによれば、音量は小さいものの、息吹きかけによる音ではない他の低周波の音(例えば、周囲の騒音など)が検知される場合に、そのような音が息であると誤判定される可能性を低減することができる。その結果、判定をより正確に行うことができる。
ステップS3において、CPUは、所定区間内の部分区間毎に平均振幅を算出する。次に、ステップS4において、CPUは、算出された各平均振幅の絶対値の平均(絶対値平均)を算出する。さらに、ステップS5において、CPUは、上述した全体平均を算出し、絶対値平均から全体平均を減算することによって判定値を得る。これらステップS3〜S5における処理内容については、上記“(判定区間の音に対する処理)”で説明している。なお、ステップS3〜S5における具体的な処理としては、CPUは、メモリから読み出した所定区間の音データを用いて、各種数値(平均振幅、絶対値平均、全体平均、および判定値)を算出し、各種数値を適宜メモリに記憶する。
ステップS6において、CPUは、算出された判定値が閾値より大きいか否かを判定する。ステップS6の判定処理は、上記“(判定区間の音に対する処理)”で述べたように、判定区間の音が息であるか否かを判定する処理である。具体的には、CPUは、メモリに記憶されている判定値および閾値のデータを読み出して、判定値が閾値より大きいか否かを判定する。ステップS6の判定結果が肯定である場合、ステップS7の処理が実行される。一方、ステップS6の判定結果が否定である場合、ステップS7〜S8の一連の処理がスキップされてステップS9の処理が実行される。
ステップS7において、CPUは、ステップS6における判定が、所定回数連続して肯定となったか否かを判定する。つまり、ステップS7の判定は、判定区間における音が息であると、連続して所定回数判定されたか否かを判定する処理である。ステップS7の判定結果が肯定である場合、ステップS8の処理が実行される。一方、ステップS7の判定結果が否定である場合、ステップS8の処理がスキップされてステップS9の処理が実行される。
ステップS8において、CPUは、息吹きかけの入力が行われたと判断し、息吹きかけ入力に応じた所定の情報処理を実行する。この所定の情報処理の内容は任意であり、例えば、上記情報処理プログラムがゲーム処理を実行するためのゲームプログラムである場合、ゲームに登場するオブジェクトを移動させる処理であってもよい。また、CPUは、息の強さに応じて処理内容を変化させるようにしてもよい。なお、CPUは、判定値自体を息の強さを表す指標として用いてもよいし、判定値に基づいて息の強さを算出してもよい。
上記ステップS7およびS8に示したように、本実施形態においては、判定区間における音が息であるとの判定結果が所定回数連続した場合に、息吹きかけ入力が行われたと判定する。つまり、情報処理装置1は、複数の判定区間に対する複数の判定結果に基づいて、息吹きかけ入力が行われたか否かを判定する。これによれば、ノイズ等の原因で、判定区間における音が息であると偶然(1回だけ)誤判定された場合に、息吹きかけ入力に応じた情報処理が実行されないようにすることができ、情報処理をより正確に実行することができる。なお、他の実施形態においては、情報処理装置1は、所定回数の判定区間に対する判定結果のうちで、判定区間における音が息であると判定された回数に基づいて、息吹きかけ入力が行われたか否かを判定してもよい。また、他の実施形態においては、情報処理装置1は、1回の判定区間に対する判定結果に基づいて、息吹きかけ入力が行われたか否かを判定してもよい
ステップS9において、CPUは、情報処理プログラムを終了するか否かを判定する。この判定は、例えば、情報処理プログラムの実行を終了する旨の指示がユーザによって行われたか否かによって行われる。ステップS9の判定結果が否定である場合、ステップS1の処理が再度実行される。以降、ステップS9において情報処理プログラムを終了すると判定されるまで、ステップS1〜S9の一連の処理が繰り返し実行される。一方、ステップS9の判定結果が肯定である場合、CPUは、図8に示す情報処理を終了する。
なお、図8においては図示しないが、上記情報処理においては、息吹きかけ入力以外の他の入力(操作入力部3に対する入力、および/または、声による入力)が行われてもよく、当該他の入力に応じた情報処理が実行されてもよい。
[4.変形例]
(判定値の算出に関する第1変形例)
上記実施形態においては、息吹きかけの入力が行われたか否かの判定を行うための判定値として、上記絶対値平均から全体平均を減算した値が用いられた。ここで、他の実施形態においては、判定値は、複数の部分区間毎の平均振幅に基づく他の値であってもよい。例えば、他の実施形態においては、判定値は、上記の絶対値平均であってもよい(つまり、判定値の算出に全体平均が用いられなくてもよい)。
上記実施形態および上記第1変形例のように、情報処理装置1は、複数の部分区間毎の平均振幅の各絶対値の平均(絶対値平均)を算出し、算出された平均により決定される判定値を用いて判定を行ってもよい。このような平均は、判定区間の音における、部分区間の長さに対応する周波数以下の成分の大きさを表す指標と言える。したがって、このような平均を用いることによって、当該周波数以下の特定の種類の音(息吹きかけによる音)の判定を容易に行うことができる。
なお、他の実施形態では、情報処理装置1は、複数の部分区間毎の平均振幅の各絶対値の総和を用いて判定を行ってもよい。これによっても、閾値の大きさを調整することによって、絶対値平均を用いる場合と実質的に同等の判定を行うことができる。
以上のように、上記実施形態および第1変形例においては、情報処理装置1は、部分区間毎の平均振幅の絶対値をそれぞれ算出し、算出された各絶対値に基づいて、判定区間の音が息吹きかけによる音であるか否かの判定を行う。そのため、判定区間の音のうちで、部分区間に対応する周波数以下の成分の大きさに基づいて判定を行うことができるので、上記判定を精度良く行うことができる。
(判定値の算出に関する第2変形例)
次に、判定値の算出に関する他の変形例である第2変形例について説明する。第2変形例では、声の音と息の音とを区別するとともに、息の音とマイク穴を指で押す音とを区別して、息吹きかけであるか否かを判定する。以下、図9〜図11を参照して、第2変形例の詳細について説明する。
図9は、複数の種類の音の周波数特性の一例を示す図である。図9に示す(a)のグラフは、比較的高い声の音に関する周波数特性を示し、図9に示す(b)のグラフは、比較的低い声の音に関する周波数特性を示す。図9(a)、(b)のグラフからわかるように、声の音は、比較的高い周波数帯域(350[Hz]以上の周波数帯域)の成分が主であり、比較的低い周波数帯域(200[Hz]以下の周波数帯域)の成分があまりふくまれない。一方、図9に示す(c)のグラフは、息吹きかけによる音に関する周波数特性を示す。図9(c)のグラフからわかるように、息吹きかけによる音は、比較的低い周波数帯域(200[Hz]以下の周波数帯域)の成分が主となっている。したがって、上記実施形態において説明したように、所定の周波数(上記実施形態では160[Hz])以下の周波数成分がどの程度あるかを表すように判定値を算出することによって、声であるか息であるかを区別して、息吹きかけを検出することができる。上記実施形態における息判定処理は、所定の周波数以下の成分を抽出する機能を有していると言え、この機能によって声と息とを区別することを可能としている。
ここで、マイクは情報処理装置1の筐体内部に配置され、筐体にはマイクの付近においてマイク穴が形成される。マイクは、主にマイク穴を介して情報処理装置1の外部から伝達される音を検知する。したがって、ユーザがマイク穴を指で押す(マイク穴を指で塞ぐ)動作を行うと、その動作によって生じる風圧による音がマイクによって検知される。図9(d)は、そのような穴押し動作による音に関する周波数特性を示す。図9(d)からわかるように、穴押し動作による音は、息吹きかけによる音と同様、低い周波数帯域の成分が主となっている。したがって、上記実施形態における息判定処理では、穴押し動作による音の場合と息吹きかけによる音の場合とで判定値があまり異なる値とならず、穴押し動作による音と息吹きかけによる音とを区別することができないおそれがある。なお、例えば、情報処理装置1の筐体においてボタンが設けられる面にマイク穴が設けられる構成である場合には、ユーザが情報処理装置1のボタン(操作入力部3)を押した際などにマイク穴を押してしまうことが考えられる。このようにユーザがマイク穴を押した場合には、情報処理装置1は、息吹きかけの入力が行われたと誤判定してしまうおそれがある。
ここで、図9(c)および(d)に示されるように、息吹きかけによる音が100[Hz]以上の周波数成分もある程度有しているのに対して、穴押し動作による音は、100[Hz]以上の周波数成分が少なくなっている点で、両者は相違する。したがって、100[Hz]程度よりも高い周波数成分を表すように判定値を算出することができれば、穴押し動作による音と息吹きかけによる音とを区別することができる。
そこで、第2変形例では、声の音と息吹きかけによる音とを区別することに加え、穴押し動作による音と息吹きかけによる音とを区別するべく、情報処理装置1は、低域側のある周波数から高域側のある周波数までの所定の周波数帯域の成分の大きさを表すように、判定値を算出する。上記実施形態における息判定処理は所定の第1周波数以下の成分を抽出するだけの機能を有しているのに対して、第2変形例の息判定処理は当該機能に加え、所定の第2周波数以上の成分を抽出する機能を有するものと言える。以下、第2変形例における息判定処理の詳細を説明する。
図10は、第2変形例における判定値の算出方法の一例を示す図である。図10に示すように、第2変形例においても上記実施形態と同様、部分区間毎に平均振幅が算出される。なお、第2変形例においても上記実施形態と同様、部分区間の長さは、声の音と息吹きかけによる音とを区別できる周波数に対応する長さに設定される。具体的には、第2変形例における部分区間の長さは、200[Hz]に対応する長さ、すなわち、1/400[sec]とする。
次に、第2変形例においては、情報処理装置1は、判定区間における隣り合う2つの部分区間における2つの平均振幅の差分をそれぞれ算出する(図10参照)。図10に示すように、第2変形例においても上記実施形態と同様、判定区間に含まれる部分区間が7個であるので、合計6個の差分値が算出される。
さらに、情報処理装置1は、各差分の絶対値をそれぞれ算出し、当該各差分の絶対値の平均(「差分平均」と呼ぶ)を判定値として算出する。情報処理装置1は、このように算出された判定値を用いて、判定区間の音が息であるか否かを判定する。具体的には、情報処理装置1は、判定値が予め定められた閾値よりも大きい場合、判定区間の音が息であると判定し、判定値が当該閾値以下である場合、判定区間の音が息でないと判定する。なお、他の実施形態においては、情報処理装置1は、差分平均から上述の全体平均を減算した値を判定値として算出してもよいし、差分の総和を判定値として算出してもよい。
なお、第2変形例の具体的な処理としては、処理部4のCPUは、図8に示した一連の処理におけるステップS4およびS5の処理に代えて、次の処理を実行する。すなわち、ステップS3の処理の次に、CPUは、上記差分を算出し、さらに、差分平均を判定値として算出する。差分平均を算出した後、CPUは、図8に示すステップS6の処理を実行する。なお、第2変形例において、CPUは、ステップS4およびS5以外の処理については、上記実施形態と同様の処理を実行する。
以上のように、第2変形例においては、判定区間内における隣り合う2つの部分区間における2つの平均振幅の差分をそれぞれ算出し、各差分の絶対値により決定される判定値を用いて、判定区間の音が息であるか否かの判定を行う。ここで、ある部分区間Aにおける平均振幅をx、その次の部分区間Bにおける平均振幅をyとしたとき、上記差分の絶対値|y−x|は、下記(a)と(b)の和に等しくなる。
(a)1つ目の部分区間Aの平均振幅xから、上記2つの部分区間全体の平均振幅{(x+y)/2}を減算した値の絶対値|x/2−y/2|
(b)2つ目の部分区間Bの平均振幅yから、上記2つの部分区間全体の平均振幅{(x+y)/2}を減算した値の絶対値|y/2−x/2|
上記(a)および(b)は、1つの部分区間の長さに対応する周波数ω1(ここでは、200[Hz])以下の成分から、部分区間2つ分の長さに対応する周波数ω2(ここでは、100[Hz])以下の成分を消去した大きさを表す。つまり、上記(a)および(b)、ならびに、その和である上記差分の絶対値は、上記周波数ω1〜ω2の周波数帯域の成分の大きさを表す指標と言える。したがって、第2変形例では、判定区間の音に関して、上記周波数ω1〜ω2の周波数帯域の成分が所定値より大きいか否かによって、判定区間の音が息吹きかけによる音であるか否かを判定することができる。
以上より、第2変形例によれば、上記周波数ω1〜ω2の周波数帯域の成分が大きい音を検出することができるので、声と息とを区別することに加えて、穴押し動作による音と息吹きかけによる音とを区別して、息吹きかけによる音であるか否かを判定することができる。
(判定値の算出に関する第3変形例)
次に、息判定処理において穴押し動作による音と息吹きかけによる音とを区別するための他の例である第3変形例について説明する。上記第2変形例では、情報処理装置1は、隣り合う2つの部分区間について平均振幅の差分の絶対値を算出することで、2つ分の部分区間の長さに対応する周波数以下の成分を排除した。第3変形例では、2以上の部分区間からなるグループ区間全体の平均振幅を算出し、部分区間の平均振幅と、グループ区間全体の平均振幅との差分を算出する。これによって、第3変形例は、2つ以上の部分区間の長さに対応する周波数以下の成分を排除して息判定処理を行うものである。以下、第3変形例の詳細について説明する。
図11は、第3変形例における判定値の算出方法の一例を示す図である。第3変形例においては、判定区間内においてグループ区間が設定される。図11に示すように、グループ区間は、判定区間内において連続する所定数(所定数は2以上の数。図11では3つ)の部分区間からなる区間である。図11では、1つの判定区間内に9個の部分区間が含まれており、9個の部分区間は、それぞれ3つの部分区間を含む3つのグループ区間に分けられる。
第3変形例においても上記実施形態と同様、部分区間毎の平均振幅がそれぞれ算出される。さらに、第3変形例においては、情報処理装置1は、グループ区間における平均振幅(「グループ平均振幅」と呼ぶ。図11に示す一点鎖線参照)をグループ区間毎に算出する。次に、情報処理装置1は、部分区間毎に、その部分区間における平均振幅と、その部分区間に対応する(その部分区間を含む)グループ平均振幅との差分を算出する。情報処理装置1は、部分区間毎の各差分の絶対値の平均を判定値として算出する。このように算出された判定値を用いて、情報処理装置1は、判定区間の音が息であるか否かを判定する。なお、他の実施形態においては、情報処理装置1は、上記の各差分の絶対値の平均から上述の全体平均を減算した値を判定値として算出してもよいし、上記の各差分の絶対値の総和を判定値として算出してもよい。
なお、第3変形例の具体的な処理としては、処理部4のCPUは、図8に示した一連の処理におけるステップS4およびS5の処理に代えて、次の処理を実行する。すなわち、ステップS3の処理の次に、CPUは、各グループ平均振幅を算出し、さらに、部分区間における平均振幅とグループ平均振幅との差分を部分区間毎に算出する。そして、各差分の絶対値の平均を判定値として算出する。判定値を算出した後、CPUは、図8に示すステップS6の処理を実行する。なお、第3変形例において、CPUは、ステップS4およびS5以外の処理については、上記実施形態と同様の処理を実行する。
以上のように、第3変形例においては、情報処理装置1は、1つの部分区間における平均振幅と、その部分区間に対応するグループ区間におけるグループ平均振幅との差分を部分区間毎に算出し、各差分の絶対値によって決定される判定値を用いて判定を行う。ここで、グループ平均振幅は、判定区間の音における、グループ区間の長さに対応する周波数ω3以下の成分の大きさを表す。そのため、第3変形例における上記の差分は、1つの部分区間の長さに対応する周波数ω1から上記周波数ω3までの周波数帯域の成分の大きさを表す指標と言える。したがって、第3変形例では、判定区間の音に関して、上記周波数ω1〜ω3の周波数帯域の成分が所定値より大きいか否かによって、判定区間の音が息吹きかけによる音であるか否かを判定することができる。このように、第3変形例は第2変形例と同様、判定区間の音から、高域側の所定の周波数以上の成分を除去(低減)するとともに低域側の所定の周波数以下の成分を除去(低減)する処理を行うものと言える。
以上より、第3変形例によれば、上記周波数ω1〜ω3の周波数帯域の成分が大きい音を検出することができるので、声と息とを区別することに加えて、穴押し動作による音と息吹きかけによる音とを区別して、息吹きかけによる音であるか否かを判定することができる。
なお、上記周波数ω3の値は、1つの部分区間の長さと、グループ区間に含まれる部分区間の数Nとによって調整することができる。すなわち、周波数ω3は、1つの部分区間の長さに対応する周波数ω1を上記数Nで割った値となる。したがって、第3変形例においては、周波数ω1の値を部分区間の長さで調整するとともに、周波数ω3の値を上記数Nによって調整することができるので、判定区間の音から抽出すべき周波数をより詳細に調整することができる。なお、上述の第2変形例は、第3変形例において上記数Nを2とした場合と同等の効果を奏するものである。
なお、第3変形例においては、複数の部分区間に関して同じグループ区間を設定したが、他の実施形態においては、部分区間毎に異なるグループ区間が設定されてもよい。例えば、他の実施形態においては、ある部分区間に関するグループ区間は、その部分区間と、その前後で連続する部分区間との3つの部分区間からなる区間であってもよい。なお、このとき、判定区間の最初と最後の部分区間についてはグループ区間が設定できないので、情報処理装置1は、最初と最後の部分区間については上記差分を算出しないようにしてもよい。
(判定値を用いた判定方法に関する変形例)
上記実施形態および第1〜第3変形例においては、情報処理装置1は、判定値の大きさと所定の閾値との大小関係に基づいて、判定区間の音が息吹きかけによる音であるか否かの判定を行った。これによれば、より簡易な処理で上記の判定を行うことができる。
一方、他の実施形態においては、情報処理装置1は、判定区間における音量に対する判定値の割合に基づいて上記の判定を行うようにしてもよい。すなわち、情報処理装置1は、上記割合が予め定められた閾値よりも大きい場合、判定区間の音が息吹きかけによる音であると判定し、上記割合が当該閾値以下である場合、判定区間の音が息吹きかけによる音でないと判定してもよい。これによれば、上記の判定をより精度良く行うことができる。なお、ここでいう判定値は、上記実施形態における判定値であってもよいし、上記第1〜第3変形例における判定値であってもよい。
(判定区間に関する変形例)
上記実施形態においては、ステップS1〜S9の処理ループにおけるステップS1の処理で判定区間の音データが取得された。つまり、上記実施形態においては、判定区間の長さよりも、ステップS1が実行される時間間隔(ステップS1の処理が実行されてから、次にステップS1の処理が実行されるまでの間隔)が短い場合には、ある判定区間と次の判定区間とが重複することになる。ここで、判定区間の設定方法は任意であり、判定区間は、上記実施形態のように判定区間と次の判定区間とが重複するように設定されてもよいし、判定区間と次の判定区間との間が空くように設定されてもよいし、判定区間と次の判定区間とが連続する(かつ重複しない)ように設定されてもよい。
(部分区間に関する変形例)
上記実施形態においては、1つの判定区間に含まれる各部分区間は、同一の長さに設定された。ここで、他の実施形態においては、各部分区間は、厳密に同一の長さである必要はなく、概ね同じ長さに設定されてもよい。これによって、判定区間の音のうち、部分区間の長さによって決められる所定の周波数以下の成分の大きさに基づいて、精度良く判定を行うことができる。
また、上記実施形態においては、1つの判定区間に含まれる各部分区間は、間隔を空けずに連続するように設定された(図3参照)。ただし、他の実施形態においては、隣り合う2つの部分区間は隣接しておらず、間隔を空けて設定されてもよい。
また、1つの判定区間に含まれる部分区間の数は任意である。ただし、部分区間の数が少ないと判定の精度が低下するおそれがあることを考慮し、部分区間の数は例えば5個以上としてもよい。
また、部分区間の長さは、抽出すべき種類の音(および、排除すべき種類の音)の周波数に合わせて適宜設定されるとよい。上記実施形態のように、声の音を排除し、息吹きかけによる音を抽出する場合には、部分区間は、350[Hz]の周波数に対応する長さ、すなわち、1/700[秒]以上の長さに設定されるとよい。図9からわかるように、声の音については350[Hz]以下の成分が小さく、息吹きかけによる音については350[Hz]以下の成分が十分大きいので、部分区間を350[Hz]に対応する長さとすることで、声と息とを区別することができるからである。なお、声による音の成分をより排除する場合には、部分区間の長さは、200[Hz]に対応する長さ、すなわち、1/400[秒]以上の長さに設定されてもよい。
なお、上記第2変形例および第3変形例のように、上述の穴押し動作による音を排除し、息吹きかけによる音を抽出する場合には、部分区間は、40[Hz]の周波数に対応する長さ、すなわち、1/80[sec]以下の長さに設定されるとよい。図9からわかるように、穴押し動作による音については40[Hz]以上の成分が比較的小さいのに対して、息吹きかけによる音については40[Hz]以上の成分が十分大きいので、部分区間を40[Hz]に対応する長さとすることで、これら2種類の音を区別することができるからである。なお、穴押し動作による音の成分をより排除する場合には、部分区間の長さは、100[Hz]に対応する長さ、すなわち、1/200[秒]以上の長さに設定されてもよい。
(判定する音の種類に関する変形例)
上記実施形態においては、情報処理装置1は、マイクに対して入力された音が息吹きかけによる音であるか否かを判定した。ここで、情報処理装置1が判定する音の種類は、息吹きかけによる音に限らず、他の種類の音であってもよい。例えば他の実施形態においては、情報処理装置1は、マイクに対して入力された音が声による音であるか否かを判定してもよい。例えば、上記第2変形例において、部分区間の長さを調整する(例えば、400[Hz]〜800[Hz]の範囲の周波数帯域を抽出するべく、1/800[sec]とする)ことによって、息吹きかけによる音(および、穴押し動作による音)を排除して声による音を抽出するようにしてもよい。また、上記第3変形例において、部分区間の長さと、グループ区間に含まれる部分区間の数とを調整することによって、息吹きかけによる音(および、声による音よりも周波数が高い他の音)を排除して声による音を抽出するようにしてもよい。これらによって、マイクに対して入力された音が声による音であるか否かを判定することができる。
また、上記実施形態においては、情報処理装置1は、判定区間の音が息吹きかけによる音でないと判定した場合には、判定結果に応じた情報処理を実行しなかったが、他の実施形態においては、この場合に所定の情報処理を実行してもよい。例えば、穴押し動作を想定しないとすれば、情報処理装置1は、判定区間の音が息吹きかけによる音でないと判定した場合(かつ、音量が所定値以上である場合)には、声の入力が行われたと判断して、声の入力に応じた情報処理を実行するようにしてもよい。
以上のように、上記実施形態および変形例は、入力された音を簡易な方法で判定すること等を目的として、例えば息吹きかけの入力に応じた処理を実行する情報処理装置や情報処理プログラムとして利用することができる。
1 情報処理装置
2 音入力部
3 操作入力部
4 処理部
5 プログラム記憶部
6 表示部

Claims (21)

  1. マイクに対して入力された音について判定を行う情報処理装置のコンピュータにおいて実行される情報処理プログラムであって、
    前記マイクによって検知される音のデータを取得する取得手段と、
    所定の判定区間における音について、当該判定区間に含まれる複数の部分区間毎に、振幅の平均である平均振幅を、取得された音のデータを用いて算出する平均振幅算出手段と、
    前記部分区間毎の平均振幅に基づいて、前記マイクに対して入力された音が、前記部分区間の長さに対応する周波数成分の音である所定の種類の音であるか否かを判定する判定手段として前記コンピュータを機能させる、情報処理プログラム。
  2. マイクに対して入力された音について判定を行う情報処理装置のコンピュータにおいて実行される情報処理プログラムであって、
    前記マイクによって検知される音のデータを取得する取得手段と、
    所定の判定区間における音について、当該判定区間に含まれる複数の部分区間毎に、振幅の平均である平均振幅を、取得された音のデータを用いて算出する平均振幅算出手段と、
    前記部分区間毎の平均振幅に基づいて、前記マイクに対して入力された音が、所定の種類の音であるか否かを判定する判定手段として前記コンピュータを機能させ、
    前記判定手段は、前記判定区間内における隣り合う2つの部分区間における2つの平均振幅の差分を、隣り合う2つの部分区間の組毎にそれぞれ算出し、各差分の絶対値により決定される判定値を用いて判定を行う、情報処理プログラム。
  3. マイクに対して入力された音について判定を行う情報処理装置のコンピュータにおいて実行される情報処理プログラムであって、
    前記マイクによって検知される音のデータを取得する取得手段と、
    所定の判定区間における音について、当該判定区間に含まれる複数の部分区間毎に、振幅の平均である平均振幅を、取得された音のデータを用いて算出する平均振幅算出手段と、
    前記部分区間毎の平均振幅に基づいて、前記マイクに対して入力された音が、所定の種類の音であるか否かを判定する判定手段として前記コンピュータを機能させ、
    前記判定手段は、1つの部分区間における平均振幅と、その部分区間を含み、かつ、連続する2以上の部分区間からなるグループ区間における平均振幅との差分を部分区間毎に算出し、各差分の絶対値によって決定される判定値を用いて判定を行う、情報処理プログラム。
  4. 前記判定手段は、前記部分区間毎の平均振幅の絶対値をそれぞれ算出し、算出された各絶対値に基づいて判定を行う、請求項1に記載の情報処理プログラム。
  5. 前記判定手段は、前記各絶対値の平均値を算出し、算出された平均値により決定される判定値を用いて判定を行う、請求項に記載の情報処理プログラム。
  6. 前記判定手段は、前記判定値の大きさと所定の閾値との大小関係に基づいて判定を行う、請求項2、請求項3、および、請求項5のいずれか1項に記載の情報処理プログラム。
  7. 前記判定手段は、前記判定区間における音量に対する前記判定値の割合に基づいて判定を行う、請求項2、請求項3、および、請求項5のいずれか1項に記載の情報処理プログラム。
  8. 前記判定手段は、前記マイクに対して入力された音が息吹きかけによる音であるか否かを判定する、請求項1から請求項7のいずれか1項に記載の情報処理プログラム。
  9. 前記判定手段は、前記マイクに対して入力された音が声による音であるか否かを判定する、請求項または請求項のいずれか1項に記載の情報処理プログラム。
  10. 前記判定区間に含まれる複数の部分区間は、略同一の長さに設定される、請求項1から請求項9のいずれか1項に記載の情報処理プログラム。
  11. 前記部分区間は、1/700[秒]以上の長さに設定される、請求項1から請求項8、および、請求項10のいずれか1項に記載の情報処理プログラム。
  12. 前記部分区間は、1/400[秒]以上の長さに設定される、請求項1から請求項8、および、請求項10のいずれか1項に記載の情報処理プログラム。
  13. マイクに対して入力された音について判定を行う情報処理装置であって、
    前記マイクによって検知される音のデータを取得する取得部と、
    所定の判定区間における音について、当該判定区間に含まれる複数の部分区間毎に、振幅の平均である平均振幅を、取得された音のデータを用いて算出する平均振幅算出部と、
    前記部分区間毎の平均振幅に基づいて、前記マイクに対して入力された音が、前記部分区間の長さに対応する周波数成分の音である所定の種類の音であるか否かを判定する判定部とを備える、情報処理装置。
  14. マイクに対して入力された音について判定を行う情報処理装置であって、
    前記マイクによって検知される音のデータを取得する取得部と、
    所定の判定区間における音について、当該判定区間に含まれる複数の部分区間毎に、振幅の平均である平均振幅を、取得された音のデータを用いて算出する平均振幅算出部と、
    前記部分区間毎の平均振幅に基づいて、前記マイクに対して入力された音が、所定の種類の音であるか否かを判定する判定部とを備え、
    前記判定部は、前記判定区間内における隣り合う2つの部分区間における2つの平均振幅の差分を、隣り合う2つの部分区間の組毎にそれぞれ算出し、各差分の絶対値により決定される判定値を用いて判定を行う、情報処理装置。
  15. マイクに対して入力された音について判定を行う情報処理装置であって、
    前記マイクによって検知される音のデータを取得する取得部と、
    所定の判定区間における音について、当該判定区間に含まれる複数の部分区間毎に、振幅の平均である平均振幅を、取得された音のデータを用いて算出する平均振幅算出部と、
    前記部分区間毎の平均振幅に基づいて、前記マイクに対して入力された音が、所定の種類の音であるか否かを判定する判定部とを備え、
    前記判定部は、1つの部分区間における平均振幅と、その部分区間を含み、かつ、連続する2以上の部分区間からなるグループ区間における平均振幅との差分を部分区間毎に算出し、各差分の絶対値によって決定される判定値を用いて判定を行う、情報処理装置。
  16. マイクに対して入力された音について判定を行う情報処理システムであって、
    前記マイクによって検知される音のデータを取得する取得部と、
    所定の判定区間における音について、当該判定区間に含まれる複数の部分区間毎に、振幅の平均である平均振幅を、取得された音のデータを用いて算出する平均振幅算出部と、
    前記部分区間毎の平均振幅に基づいて、前記マイクに対して入力された音が、前記部分区間の長さに対応する周波数成分の音である所定の種類の音であるか否かを判定する判定部とを備える、情報処理システム。
  17. マイクに対して入力された音について判定を行う情報処理システムであって、
    前記マイクによって検知される音のデータを取得する取得部と、
    所定の判定区間における音について、当該判定区間に含まれる複数の部分区間毎に、振幅の平均である平均振幅を、取得された音のデータを用いて算出する平均振幅算出部と、
    前記部分区間毎の平均振幅に基づいて、前記マイクに対して入力された音が、所定の種類の音であるか否かを判定する判定部とを備え、
    前記判定部は、前記判定区間内における隣り合う2つの部分区間における2つの平均振幅の差分を、隣り合う2つの部分区間の組毎にそれぞれ算出し、各差分の絶対値により決定される判定値を用いて判定を行う、情報処理システム。
  18. マイクに対して入力された音について判定を行う情報処理システムであって、
    前記マイクによって検知される音のデータを取得する取得部と、
    所定の判定区間における音について、当該判定区間に含まれる複数の部分区間毎に、振幅の平均である平均振幅を、取得された音のデータを用いて算出する平均振幅算出部と、
    前記部分区間毎の平均振幅に基づいて、前記マイクに対して入力された音が、所定の種類の音であるか否かを判定する判定部とを備え、
    前記判定部は、1つの部分区間における平均振幅と、その部分区間を含み、かつ、連続する2以上の部分区間からなるグループ区間における平均振幅との差分を部分区間毎に算出し、各差分の絶対値によって決定される判定値を用いて判定を行う、情報処理システム。
  19. マイクに対して入力された音について判定を行う情報処理装置において実行される音判定方法であって、
    前記マイクによって検知される音のデータを取得する取得ステップと、
    所定の判定区間における音について、当該判定区間に含まれる複数の部分区間毎に、振幅の平均である平均振幅を、取得された音のデータを用いて算出する平均振幅算出ステップと、
    前記部分区間毎の平均振幅に基づいて、前記マイクに対して入力された音が、前記部分区間の長さに対応する周波数成分の音である所定の種類の音であるか否かを判定する判定ステップとを備える、音判定方法。
  20. マイクに対して入力された音について判定を行う情報処理装置において実行される音判定方法であって、
    前記マイクによって検知される音のデータを取得する取得ステップと、
    所定の判定区間における音について、当該判定区間に含まれる複数の部分区間毎に、振幅の平均である平均振幅を、取得された音のデータを用いて算出する平均振幅算出ステップと、
    前記部分区間毎の平均振幅に基づいて、前記マイクに対して入力された音が、所定の種類の音であるか否かを判定する判定ステップとを備え、
    前記判定ステップにおいては、前記判定区間内における隣り合う2つの部分区間における2つの平均振幅の差分を、隣り合う2つの部分区間の組毎にそれぞれ算出し、各差分の絶対値により決定される判定値を用いて判定を行う、音判定方法。
  21. マイクに対して入力された音について判定を行う情報処理装置において実行される音判定方法であって、
    前記マイクによって検知される音のデータを取得する取得ステップと、
    所定の判定区間における音について、当該判定区間に含まれる複数の部分区間毎に、振幅の平均である平均振幅を、取得された音のデータを用いて算出する平均振幅算出ステップと、
    前記部分区間毎の平均振幅に基づいて、前記マイクに対して入力された音が、所定の種類の音であるか否かを判定する判定ステップとを備え、
    前記判定ステップにおいては、1つの部分区間における平均振幅と、その部分区間を含み、かつ、連続する2以上の部分区間からなるグループ区間における平均振幅との差分を部分区間毎に算出し、各差分の絶対値によって決定される判定値を用いて判定を行う、音判定方法。
JP2013238008A 2013-11-18 2013-11-18 情報処理プログラム、情報処理装置、情報処理システム、および、音判定方法 Active JP6329753B2 (ja)

Priority Applications (2)

Application Number Priority Date Filing Date Title
JP2013238008A JP6329753B2 (ja) 2013-11-18 2013-11-18 情報処理プログラム、情報処理装置、情報処理システム、および、音判定方法
US14/496,546 US9544684B2 (en) 2013-11-18 2014-09-25 Sound determination unit based on mean amplitudes of partial sound segments

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2013238008A JP6329753B2 (ja) 2013-11-18 2013-11-18 情報処理プログラム、情報処理装置、情報処理システム、および、音判定方法

Publications (2)

Publication Number Publication Date
JP2015099194A JP2015099194A (ja) 2015-05-28
JP6329753B2 true JP6329753B2 (ja) 2018-05-23

Family

ID=53173322

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2013238008A Active JP6329753B2 (ja) 2013-11-18 2013-11-18 情報処理プログラム、情報処理装置、情報処理システム、および、音判定方法

Country Status (2)

Country Link
US (1) US9544684B2 (ja)
JP (1) JP6329753B2 (ja)

Families Citing this family (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
GB2583117B (en) * 2019-04-17 2021-06-30 Sonocent Ltd Processing and visualising audio signals
CN111739542B (zh) * 2020-05-13 2023-05-09 深圳市微纳感知计算技术有限公司 一种特征声音检测的方法、装置及设备

Family Cites Families (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2005084253A (ja) * 2003-09-05 2005-03-31 Matsushita Electric Ind Co Ltd 音響処理装置、方法、プログラム及び記憶媒体
JP4394532B2 (ja) * 2004-07-26 2010-01-06 シャープ株式会社 音声処理装置、音声・動画像処理装置及び音声・動画像処理プログラムを記録した記録媒体
JP4630646B2 (ja) 2004-11-19 2011-02-09 任天堂株式会社 息吹きかけ判別プログラム、息吹きかけ判別装置、ゲームプログラムおよびゲーム装置
JP4150795B2 (ja) * 2005-01-21 2008-09-17 国立大学法人徳島大学 聴覚補助装置、音声信号処理方法、音声処理プログラム及びコンピュータで読み取り可能な記録媒体並びに記録した機器
JP4952698B2 (ja) * 2008-11-04 2012-06-13 ソニー株式会社 音声処理装置、音声処理方法およびプログラム
JP5344698B2 (ja) * 2009-10-30 2013-11-20 任天堂株式会社 息判別プログラム、息判別装置、息判別システム、および息判別方法

Also Published As

Publication number Publication date
US20150139431A1 (en) 2015-05-21
US9544684B2 (en) 2017-01-10
JP2015099194A (ja) 2015-05-28

Similar Documents

Publication Publication Date Title
CN109256146B (zh) 音频检测方法、装置及存储介质
US9087501B2 (en) Sound signal analysis apparatus, sound signal analysis method and sound signal analysis program
US9454976B2 (en) Efficient discrimination of voiced and unvoiced sounds
KR20140059754A (ko) 스펙트럼 모션 변환을 구현하는 사운드 신호 처리 시스템 및 방법
CN103871419B (zh) 一种信息处理方法及电子设备
KR101666521B1 (ko) 입력 신호의 피치 주기 검출 방법 및 그 장치
KR20130080847A (ko) 전자 음향 신호 발생 장치 및 전자 음향 신호 발생 방법
JP2010002370A (ja) パターン抽出プログラム、方法及び装置
CN106356077B (zh) 一种笑声检测方法及装置
JP2009008823A (ja) 音響認識装置、音響認識方法、及び、音響認識プログラム
KR20070036393A (ko) 줄넘기 장치 및 방법
US10343072B2 (en) Apparatus and method of producing rhythm game, and non-transitory computer readable medium
WO2020015411A1 (zh) 一种训练改编水平评价模型、评价改编水平的方法及装置
CN115486833B (zh) 呼吸状态检测方法、装置、计算机设备以及存储介质
JP6329753B2 (ja) 情報処理プログラム、情報処理装置、情報処理システム、および、音判定方法
JP6847237B2 (ja) 楽曲解析装置および楽曲解析プログラム
KR101553484B1 (ko) 손동작 인식 장치 및 그 방법
JPWO2018016143A1 (ja) 情報処理装置、情報処理方法、およびプログラム
JPWO2019043798A1 (ja) 楽曲解析装置および楽曲解析プログラム
JP5066692B2 (ja) テンポ検出装置
WO2018117171A1 (ja) 生体音解析方法、プログラム、記憶媒体及び生体音解析装置
JP6031863B2 (ja) 心音分析装置、心音分析方法および心音分析プログラム
JP2015040970A (ja) 小節間隔推定およびその推定のための特徴量抽出を行う装置、方法、およびプログラム
JP6036242B2 (ja) 心音情報処理装置、心音情報処理方法およびプログラム
JP6946442B2 (ja) 楽曲解析装置および楽曲解析プログラム

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20161005

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20170922

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20170926

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20171117

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20180409

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20180423

R150 Certificate of patent or registration of utility model

Ref document number: 6329753

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250