WO2022137555A1

WO2022137555A1 - 脈拍検出装置および脈拍検出方法

Info

Publication number: WO2022137555A1
Application number: PCT/JP2020/048929
Authority: WO
Inventors: 彰彦菅原
Original assignee: 株式会社ソニー・インタラクティブエンタテインメント
Priority date: 2020-12-25
Filing date: 2020-12-25
Publication date: 2022-06-30

Abstract

フレーム記憶部２０は、ユーザの皮膚を含む領域の所定フレーム数の撮像画像を記憶する。画素値取得部３０は、撮像画像を複数のブロックに分割し、各ブロックの画素値を取得する。時系列画素配列取得部４０は、所定フレーム数の各ブロックの前記画素値を並べた時系列画素配列を取得する。脈拍データ配列取得部５０は、時系列画素配列の各要素の平均値を直流成分として算出し、時系列画素配列の所定の要素から直流成分を引くことにより、脈拍成分を取得し、所定期間の脈拍成分を並べた脈拍データ配列を取得する。脈拍検出部６０は、脈拍データ配列の自己相関を求めることにより得られる周波数を脈拍数として検出する。

Description

脈拍検出装置および脈拍検出方法

　この発明は、脈拍検出技術に関する。

　家庭内のゲーム機にはカメラが搭載されたものがあり、ゲームプレイをするユーザを撮像し、ユーザの撮像画像からユーザの表情を検出し、ゲームプレイ中のユーザの精神状態を把握してゲームの展開に反映させることができる。また、ゲームプレイ中のユーザの緊張度合いを検出するために、脈拍を検知するセンサをユーザに装着させ、センサが出力する脈拍の測定結果をゲーム機に入力させてゲームに反映させることも行われている。

　特許文献１には、被検体の撮像画像の濃度の時間的変化からバイタルサインを計測する方法が記載されている。

特開２００５－２１８５０７号公報

　脈拍を検知するためにユーザにセンサを装着させるのはユーザに負担を強いることになるという問題があった。また、撮像画像を利用した従来の脈拍検出方法では、脈拍の細かな変動を検出することが難しく、また呼吸などの身体の動きが影響するため、脈拍を正確に測定することは難しいという問題があった。

　本発明はこうした課題に鑑みてなされたものであり、その目的は、ユーザの撮像画像から脈拍を高い精度で検知することのできる脈拍検出技術を提供することにある。

　上記課題を解決するために、本発明のある態様の脈拍検出装置は、ユーザの皮膚を含む領域の所定フレーム数の撮像画像を記憶する記憶部と、前記撮像画像を複数のブロックに分割し、各ブロックの画素値を取得する画素値取得部と、所定フレーム数の各ブロックの前記画素値を並べた時系列画素配列を取得する時系列画素配列取得部と、前記時系列画素配列の各要素の平均値を直流成分として算出し、前記時系列画素配列の所定の要素から前記直流成分を引くことにより、脈拍成分を取得し、所定期間の前記脈拍成分を並べた脈拍データ配列を取得する脈拍データ配列取得部と、前記脈拍データ配列の自己相関を求めることにより得られる周波数を脈拍数として検出する脈拍検出部とを含む。

　本発明の別の態様は、脈拍検出方法である。この方法は、ユーザの皮膚を含む領域の所定フレーム数の撮像画像を複数のブロックに分割し、各ブロックの画素値を取得する画素値取得ステップと、所定フレーム数の各ブロックの前記画素値を並べた時系列画素配列を取得する時系列画素配列取得ステップと、前記時系列画素配列の各要素の平均値を直流成分として算出し、前記時系列画素配列の所定の要素から前記直流成分を引くことにより、脈拍成分を取得し、所定期間の前記脈拍成分を並べた脈拍データ配列を取得する脈拍データ配列取得ステップと、前記脈拍データ配列の自己相関を求めることにより得られる周波数を脈拍数として検出する脈拍検出ステップとを含む。

　なお、以上の構成要素の任意の組合せ、本発明の表現を方法、装置、システム、コンピュータプログラム、データ構造、記録媒体などの間で変換したものもまた、本発明の態様として有効である。

　本発明によれば、ユーザの撮像画像から脈拍を高い精度で検知することができる。

第１の実施の形態に係る脈拍検出装置の構成図である。図１の脈拍検出装置で用いられる信号のデータ構造を説明する図である。図１の脈拍検出装置による脈波検出手順を説明するフローチャートである。図４（ａ）は検出脈波の自己相関グラフを示し、図４（ｂ）は図４（ａ）の自己相関グラフのピーク近傍２００の拡大図である。第２の実施の形態に係る脈拍検出装置の構成図である。図６（ａ）は検出脈波とその自己相関グラフを示し、図６（ｂ）は参照脈波とその自己相関グラフを示す図である。図７（ａ）は検出脈波を示し、図７（ｂ）は振幅信頼度を示す図である。第３の実施の形態に係る脈拍検出装置の構成図である。図９（ａ）～図９（ｄ）は、撮像画像に設定される複数のエリアを説明する図である。図１０（ａ）、図１０（ｂ）は、各エリアで検出される脈拍数と信頼度の時間変化を示す図である。第４の実施の形態に係る脈拍検出装置の構成図である。図１１の画素排除部による画素の排除を説明する図である。

（第１の実施の形態）
　図１は、第１の実施の形態に係る脈拍検出装置１００の構成図である。脈拍検出装置１００は、撮像部１０、フレーム記憶部２０、画素値取得部３０、時系列画素配列取得部４０、脈拍データ配列取得部５０、脈拍検出部６０、および自己相関グラフ記憶部７０を含む。

　撮像部１０は、ユーザの顔など皮膚が露出した身体部位を撮像し、フレーム記憶部２０に記憶する。フレーム記憶部２０には、所定フレーム数の撮像画像が保存される。

　顔の皮膚には毛細血管が多く、脈拍を撮影するのに適している。顔以外では、手のひらや足裏もメラニンが少ないため、毛細血管を撮影しやすい。脈を打つと、毛細血管も脈動する。皮膚の毛細血管を撮影すると、毛細血管の脈動によって反射光も変化するため、撮影画像の画素値の時間変化から脈拍を検出することができる。

　画素値取得部３０は、フレーム記憶部２０に保存された撮像画像を複数のブロックに分割し、各ブロックの画素値を取得する。脈波検出に適した領域は、顔の領域内で、皮膚が露出しており、動きが少ない部分である。たとえば、撮像画像の顔の領域を額、右頬、左頬、鼻などのブロックに分割し、各ブロックの画素値を取得する。各ブロックの画素数は異なってよい。

　画素値取得部３０は、各ブロックの画素の色をＲＧＢで表した場合の緑の値を画素値として取得することが好ましい。

　皮膚は表皮の下に真皮があり、表皮が透明で薄ければ、可視光が真皮にまで侵入し、毛細血管を撮影することができる。可視光の透過力は波長に依存し、波長が長いほど皮膚の奥まで透過する。赤の光は波長が最も長く、皮膚の奥まで透過するが、光が奥まで侵入しすぎて毛細血管以外の余計なものも撮影してしまう。青の光は波長が最も短く、皮膚の奥まで透過しないため、毛細血管の撮影には適していない。緑の光は、表皮の下の真皮まで透過し、赤血球に吸収され易いので毛細血管を撮影するのに適している。

　画素値取得部３０は、各ブロックの所定数の画素値を加算することにより、空間的に平滑化された画素値を取得する。ブロック内のすべての画素値を加算してもよく、ブロック内の一部の画素値を加算してもよい。８ビット画素の場合、１画素から検出される脈波信号は最下位ビット（least significant bit）の変化があるかないか程度に小さいため、ブロック内の画素値を加算することにより脈波信号を増幅することができる。また、ブロック内の画素値を加算することは、ブロック内の画素値を空間的に平滑化する空間的ローパスフィルタ（ＬＰＦ）の作用を奏する。

　時系列画素配列取得部４０は、画素値取得部３０により取得された各ブロックの画素値を所定フレーム数分だけ並べた時系列画素配列を取得する。たとえば、動画のフレームレートが３０フレーム／秒である場合、各ブロックについて、１秒分、すなわち３０フレーム分の画素値を時間順に３０個並べた時系列画素配列を生成する。

　時系列画素配列取得部４０は、時系列画素配列に対してローパスフィルタを施すことにより、時間的に平滑化された時系列画素配列を取得してもよい。撮像に用いられたイメージセンサには一般に検出値にノイズがある。時系列画素配列に対してローパスフィルタを施すことは、センサの検出値の時間方向のノイズを除去する時間的ローパスフィルタの作用を奏する。

　脈拍データ配列取得部５０は、時系列画素配列の各要素の平均値を直流（ＤＣ）成分として算出し、時系列画素配列の中央の要素を交流（ＡＣ）成分として取り出し、交流成分から直流成分を引くことにより、脈拍成分を取得する。時系列画素配列の交流成分から直流成分を引くことは、時系列画素配列に対してハイパスフィルタ（ＨＰＦ）を施す作用を奏する。

　脈拍データ配列取得部５０は、フレーム毎に脈拍成分の取得を進め、所定期間の脈拍成分を並べた脈拍データ配列を取得する。所定期間は、標準的な脈拍の少なくとも２周期の時間（たとえば２．５秒）とする。２周期程度の短時間の脈波信号を用いることで瞬間的な脈拍を検出することが可能になる。長期間の脈波信号を用いると脈拍が平均化されてしまい、瞬間的な脈拍の変化を捉えることができなくなる。

　脈拍データ配列取得部５０は、脈拍データ配列に対してローパスフィルタを施すことにより、時間的に平滑化された脈拍データ配列を取得してもよい。ここで得られた脈波信号には交流成分の計算方法により時間方向に振幅のぶれが生じ得る。脈拍データ配列に対してローパスフィルタを施すことは、脈波の振幅の時間方向のぶれを除去する時間的ローパスフィルタの作用を奏する。

　ここで、時系列画素配列に対して施すローパスフィルタのフィルタ強度は、脈拍データ配列に対して施すローパスフィルタのフィルタ強度よりも強いことが好ましい。これはイメージセンサにより検出される生データに含まれる時間的ノイズは比較的大きく、振幅のぶれによる脈波信号の波形の歪みはそれに比べて大きくないからである。

　脈拍検出部６０は、脈拍データ配列の自己相関を求め、自己相関グラフを自己相関グラフ記憶部７０に記憶する。脈拍検出部６０は、脈波信号の自己相関グラフが２番目に極大となる点を検出し、２番目の極大点の横軸の時間を脈波信号の周期として取得し、その逆数を脈波信号の周波数として取得する。脈拍検出部６０は、自己相関により検出される脈波信号の周波数を脈拍数として出力する。

　図２は、脈拍検出装置１００で用いられる信号のデータ構造を説明する図である。

　画素値取得部３０は、撮像部１０により撮像されたユーザの顔画像１２の額１４ａ、右頬１４ｂ、左頬１４ｃの各ブロックから画素値を取得し、ブロック内の画素値を加算して、生データ配列である時系列画素配列Ｒ［］に格納する。たとえば１秒３０フレーム分の画素値を配列に格納することで要素数が３０個である時系列画素配列Ｒ［］が取得される。撮像画像のフレームが進むにつれて、時系列画素配列Ｒ［］の各要素が右にシフトされ、第ｉ要素が第（ｉ＋１）要素にコピーされるとともに、時系列画素配列Ｒ［］の第１要素に新しいフレームから得られた画素値が格納される。

　画素値取得部３０は、時系列画素配列Ｒ［］にフィルタ強度Ｎ＿ｒａｗ＿ｄａｔａのローパスフィルタを施す。具体的には、一例として次式の移動平均をフィルタ強度Ｎ＿ｒａｗ＿ｄａｔａに応じた回数だけ繰り返す。たとえば、フィルタ強度Ｎ＿ｒａｗ＿ｄａｔａを１０として１０回移動平均を繰り返す。
　Ｒ’［ｉ］＝０．２５＊Ｒ［ｉ－１］＋０．５＊Ｒ［ｉ］＋０．２５＊Ｒ［ｉ＋１］

　時系列画素配列Ｒ［］にフィルタ強度Ｎ＿ｒａｗ＿ｄａｔａのローパスフィルタを施して得られる時系列画素配列をＬＰＲ［］とする。

　脈拍データ配列取得部５０は、時系列画素配列ＬＰＲ［］の各要素の平均値を直流成分として算出し、時系列画素配列ＬＰＲ［］の中央の要素から直流成分を引くことにより、最初の脈拍成分Ｐ［０］を取得する。

　次に、脈拍データ配列取得部５０は、脈拍成分Ｐ［０］をＰ［１］にコピーし、次のフレームの脈拍成分Ｐ［０］を取得する。さらに、脈拍データ配列取得部５０は、脈拍成分Ｐ［１］をＰ［２］にコピーし、Ｐ［０］をＰ［１］にコピーし、さらに次のフレームの脈拍成分Ｐ［０］を取得する。これを所定期間、たとえば２．５秒繰り返すことで、脈拍成分を並べた脈拍データ配列Ｐ［］が取得される。フレームレートが３０フレーム／秒の場合、脈拍データ配列Ｐ［］の要素数は、３０＊２．５＝７５になる。

　このように撮像画像のフレームが進むにつれて、脈拍データ配列Ｐ［］の各要素が右にシフトされ、第ｉ要素が第（ｉ＋１）要素にコピーされるとともに、脈拍データ配列Ｐ［］の第１要素に新しいフレームの脈拍成分が格納される。

　脈拍データ配列取得部５０は、脈拍データ配列Ｐ［］にフィルタ強度Ｎ＿ｐｕｌｓｅ＿ｄａｔａのローパスフィルタを施す。具体的には、一例として次式の移動平均をフィルタ強度Ｎ＿ｐｕｌｓｅ＿ｄａｔａに応じた回数だけ繰り返す。たとえば、フィルタ強度Ｎ＿ｐｕｌｓｅ＿ｄａｔａを２として３回移動平均を繰り返す。
　Ｐ’［ｉ］＝０．２５＊Ｐ［ｉ－１］＋０．５＊Ｐ［ｉ］＋０．２５＊Ｐ［ｉ＋１］

　脈拍データ配列Ｐ［］にフィルタ強度Ｎ＿ｐｕｌｓｅ＿ｄａｔａのローパスフィルタを施して得られる脈拍データ配列をＬＰＰ［］とする。

　脈拍検出部６０は、脈拍データ配列ＬＰＰ［］の時間遅れｔに対する自己相関ＡＣ［ｔ］を次式で求める。
　ＡＣ［ｔ］＝ＳＵＭ（ＬＰＰ［ｎ］＊ＬＰＰ［ｎ＋ｔ］）

　脈拍検出部６０は、自己相関ＡＣ［ｔ］をｔ＝０からｔ＝Ｎ（ＮはＬＰＰ［］の要素数）まで求め、ＡＣ［Ｔ］が２番目の極大点となる時間Ｔを脈波周期として取得し、その逆数である周波数を脈拍数として出力する。

　一般に脈波信号に高速フーリエ変換を施し、脈波信号の周波数を検出する方法がある。高速フーリエ変換には少なくとも５１２個のデータが必要になり、３０フレーム／秒の場合、１０数秒の脈波信号を解析することになり、１０数秒の脈拍の平均値が得られるが、瞬間的な脈拍は得られない。本実施の形態の脈拍検出方法は自己相関を用いており、脈波信号を１周期ずれているところで重ねると自己相関が最大になり、脈波信号の周期を検出することができる。したがって、２周期分程度の短期間の脈波信号の自己相関から瞬間的な脈拍を得ることができる。本実施の形態の脈拍検出方法は、脈拍の細かな変動を検出するのに適している。

　図３は、脈拍検出装置１００による脈波検出手順を説明するフローチャートである。

　画素値取得部３０は、撮像画像の各ブロックの所定数の画素値から空間的に平準化された画素値を取得する（Ｓ１０）。

　時系列画素配列取得部４０は、所定フレーム数のブロックの画素値を並べた時系列画素配列を取得する（Ｓ２０）。時系列画素配列取得部４０は、時系列画素配列に対してローパスフィルタを施す（Ｓ３０）。

　脈拍データ配列取得部５０は、時系列画素配列の各要素の平均値を直流成分として算出し、時系列画素配列の中央の要素から直流成分を引くことにより、脈拍成分を取得する（Ｓ４０）。中央の要素を交流成分として選び、交流成分から直流成分を引くことでハイパスフィルタの作用をもたせた。中央の要素を交流成分として選ぶ理由は、時系列画素配列に対してローパスフィルタをかける際に中央の要素の前後に同程度の数の要素が存在し、時間の前後に同程度の重み付けをすることでローパスフィルタをかけるからである。

　脈拍データ配列取得部５０は、所定期間の脈拍成分を並べた脈拍データ配列を取得する（Ｓ５０）。脈拍データ配列取得部５０は、脈拍データ配列に対してローパスフィルタを施す（Ｓ６０）。

　脈拍検出部６０は、脈拍データ配列の自己相関から脈波信号の周期を求め、その逆数である周波数を脈拍数として検出する（Ｓ７０）。

　上記の説明では、検出された脈波信号の自己相関グラフの極大点から周波数を求めたが、脈拍検出部６０は、検出脈波の自己相関のピーク近傍に２次曲線を当てはめて得られるピークに対応する周波数を脈拍数として検出することで、脈拍数の検出精度を向上させることができる。撮像画像のフレームレートが３０ｆｐｓの場合、自己相関グラフの極大点から周波数を検出すると、時間解像度が１／３０秒となり、周波数の検出精度が高くない。そこで、ピーク近傍に２次曲線を当てはめて自己相関グラフを補間し、当てはめた２次曲線の極大点において周波数を検出することで検出精度を高める。

　図４（ａ）は検出脈波の自己相関グラフを示し、図４（ｂ）は図４（ａ）の自己相関グラフのピーク近傍２００の拡大図である。１／３０秒の時間解像度では、符号２１０ｂで示す位置が自己相関グラフの極大点であるが、ピーク近傍の自己相関グラフの値２１０ａ、２１０ｂ、２１０ｃを通るような２次曲線２３０を当てはめると、２次曲線２３０が極大となる位置は符号２２０で与えられる。２次曲線２３０の極大点２２０から検出脈波の周波数を求めることで、検出精度を高めることができる。

（第２の実施の形態）
　図５は、第２の実施の形態に係る脈拍検出装置１００の構成図である。第２の実施の形態に係る脈拍検出装置１００は、図１の脈拍検出装置１００の各構成に加えて、さらに信頼度計算部８０および参照グラフ記憶部９０を含む。図１の脈拍検出装置１００と共通する構成および動作については説明を省略する。

　参照グラフ記憶部９０は、所定期間のノイズフリーの脈拍成分を並べた脈拍データ配列の自己相関グラフを参照グラフとして記憶する。頻度の高い脈波を参照脈波としてモデル化するために、たとえば、脈拍数安定時、脈拍数上昇時、脈拍数下降時などのノイズフリーの参照脈波の自己相関グラフを参照グラフとして参照グラフ記憶部９０に登録する。

　実際の検出脈波の自己相関グラフを参照脈波の参照グラフと比較するために、基本周波数を揃える必要がある。検出脈波の自己相関グラフから得られる基本周波数は脈拍数に応じて変化するが、参照脈波の参照グラフの基本周波数はたとえば６０ｂｐｍ（beats per minute）に固定される。検出脈波の自己相関グラフと参照脈波の参照グラフのクロス相関によって波形の類似性を評価するために、両者の基本周波数を同じにする必要がある。そこで、検出脈波の自己相関グラフの基本周波数を参照脈波の参照グラフと同じ６０ｂｐｍになるように検出脈波の脈拍データ配列のデータを時間軸方向に伸縮する「周波数標準化」を行う。

　図６（ａ）は検出脈波とその自己相関グラフを示し、図６（ｂ）は参照脈波とその自己相関グラフを示す。自己相関フラフの２番目の極大点の横軸の値が基本周期であり、その逆数が基本周波数である。検出脈波の自己相関の基本周波数を参照脈波の自己相関の基本周波数に合わせるように補正する周波数標準化を行う。

　信頼度計算部８０は、自己相関グラフ記憶部７０に記憶された検出脈波の自己相関グラフと、参照グラフ記憶部９０に記憶された参照脈波の参照グラフのクロス相関を計算し、クロス相関値にもとづいて波形信頼度を求める。クロス相関ＣＣは、次式のように検出脈波の自己相関グラフＡＣと参照脈波の参照グラフＲＥＦの各要素間の積の和で与えられる。
　ＣＣ＝ＳＵＭ（ＡＣ［ｎ］＊ＲＥＦ［ｎ］）

　クロス相関値が高いほど、検出脈波の自己相関グラフと参照脈波の参照グラフの波形の類似度が高い。信頼度計算部８０は、参照グラフ記憶部９０に登録されたすべての参照脈波の参照グラフについて検出脈波の自己相関グラフとのクロス相関値を求め、その最大値を最終的な波形信頼度とする。波形信頼度は、検出脈波の波形の脈波らしさを判定する指標である。

　また、信頼度計算部８０は、検出脈波信号の波形の振幅を所定の上限値および下限値と比較することにより、振幅信頼度を求める。

　図７（ａ）は検出脈波を示す。横軸は時間であり、縦軸は緑の画素値であり、画素値の時間変化がグラフで示されている。検出脈波の振幅は、検出脈波の最大値と最小値の差で与えられる。

　図７（ｂ）は振幅信頼度を示す。横軸は検出脈波の振幅、縦軸は振幅信頼度である。検出脈波の振幅が下限値ｔｈ１以上、上限値ｔｈ２以下である場合、振幅信頼度は１．０である。検出脈波の振幅が下限値ｔｈ１と上限値ｔｈ２の間の範囲にあれば、脈波らしい振幅であり、振幅信頼度を１．０とする。

　検出脈波の振幅が下限値ｔｈ１より小さい場合、想定脈波より振幅が小さいので、振幅が下限値ｔｈ１から小さくなるにつれて振幅信頼度を１．０から徐々に下げる。検出脈波の振幅が下限値より小さい場合、脈波以外の微小信号またはノイズである可能性がある。

　検出脈波の振幅が上限値ｔｈ２より大きい場合、想定脈波より振幅が大きいので、振幅が上限値ｔｈ２から大きくなるにつれて振幅信頼度を１．０から徐々に下げる。検出脈波の振幅が上限値より大きい場合、ユーザの身体が動いているためか、ノイズである可能性がある。

　信頼度計算部８０は、検出された脈拍数の最終的な脈波信頼度を波形信頼度と振幅信頼度にもとづいて算出して出力する。たとえば、波形信頼度と振幅信頼度の積を脈拍数の最終的な脈波信頼度として算出する。

（第３の実施の形態）
　図８は、第３の実施の形態に係る脈拍検出装置１００の構成図である。第３の実施の形態に係る脈拍検出装置１００は、図５の脈拍検出装置１００の各構成に加えて、さらにエリア信頼度記憶部９２を含む。図５の脈拍検出装置１００と共通する構成および動作については説明を省略する。

　第１および２の実施の形態に係る脈拍検出装置１００では、フレーム記憶部２０に保存された撮像画像を複数のブロックに分割し、各ブロックの画素値から脈拍成分を取得したが、第３の実施の形態に係る脈拍検出装置１００では、撮像画像を複数のエリアに分割し、各エリアの画素値から脈拍成分を取得する。たとえば、顔の額、右頬、左頬などの狭いエリアの他、目や鼻を含む広域のエリアなどがあり、重複を許して複数のエリアを指定することができる。各エリアの画素数は異なってよい。

　画素値取得部３０は、各エリアの画素値を取得し、各エリアの所定数の画素値を加算することにより、空間的に平滑化された画素値を取得する。

　時系列画素配列取得部４０は、画素値取得部３０により取得された各エリアの画素値を所定フレーム数分だけ並べた時系列画素配列を取得し、時系列画素配列に対してローパスフィルタを施す。

　脈拍データ配列取得部５０は、各エリアの時系列画素配列の中央の要素から時系列画素配列の各要素の平均値を引くことにより、脈拍成分を取得し、所定期間の脈拍成分を並べた脈拍データ配列を生成し、脈拍データ配列に対してローパスフィルタを施す。

　脈拍検出部６０は、各エリアの脈拍データ配列の自己相関を求め、各エリアの自己相関グラフを自己相関グラフ記憶部７０に記憶し、各エリアの自己相関グラフから検出される脈波信号の周波数を各エリアの脈拍数として出力する。

　信頼度計算部８０は、自己相関グラフ記憶部７０に記憶された各エリアの検出脈波の自己相関グラフと、参照グラフ記憶部９０に記憶された参照脈波の参照グラフのクロス相関を計算し、クロス相関値にもとづいて波形信頼度を求める。また、信頼度計算部８０は、各エリアの検出脈波信号の波形の振幅を所定の上限値および下限値と比較することにより、振幅信頼度を求める。信頼度計算部８０は、各エリアについて、検出された脈拍数の最終的な脈波信頼度を波形信頼度と振幅信頼度にもとづいて算出し、エリア毎の脈拍信頼度をエリア信頼度記憶部９２に記憶する。

　脈拍検出部６０は、各エリアから検出された脈拍の内、エリア信頼度記憶部９２に記憶された信頼度が最も高い脈拍を選択して最終的な脈拍として出力してもよい。脈拍検出部６０は、各エリアから検出された脈拍の内、信頼度が所定の閾値以上の脈拍を信頼度にもとづいて重み付けして組み合わせることにより、最終的な脈拍を求めてもよい。

　図９（ａ）～図９（ｄ）は、撮像画像に設定される複数のエリアを説明する図である。一例としてユーザの顔画像１２の額１６ａ、右頬１６ｂ、左頬１６ｃ、目や鼻を含む広域１６ｄが複数のエリアとして設定される。ここで、広域１６ｄは、額１６ａ、右頬１６ｂ、左頬１６ｃと一部重複する。

　図９（ａ）では、ユーザの顔の全体が露出しているため、４つのエリア１６ａ～１６ｄにおいて高い信頼度で脈拍数が検出される。

　図９（ｂ）では、髪の毛によって額が覆われているため、額１６ａから検出される脈拍数は信頼度が低い。また、広域１６ｄの額部分が髪の毛で遮られるため、額部分の画素値からは脈拍成分を検出するのが難しくなり、図９（ａ）の広域１６ｄに比べた場合、検出される脈拍数の信頼度は低下する。

　図９（ｃ）では、ユーザが眼鏡をかけているため、右頬１６ｂ、左頬１６ｃの一部は眼鏡で遮られるため、図９（ａ）の右頬１６ｂ、左頬１６ｃに比べた場合、検出される脈拍数の信頼度は低下する。また、広域１６ｄの内、目の周辺の画素からの脈拍成分の検出は難しくなり、図９（ａ）の広域１６ｄに比べた場合、検出される脈拍数の信頼度は低下する。

　図９（ｄ）では、ユーザが口に手を当てているため、右頬１６ｂ、左頬１６ｃ、広域１６ｄの一部は手で遮られるため、図９（ａ）の右頬１６ｂ、左頬１６ｃ、広域１６ｄに比べた場合、検出される脈拍数の信頼度は低下する。

　これ以外にも、帽子、ヘッドマウントディスプレイ、マスクなどの遮断物の着用や、化粧や肌の濃いメラニン色素、反射光や影の影響、顔の動きなどにより、エリアによっては脈波信号が検出できないか、検出できても信号が弱くなることがある。

　遮断物などにより脈波信号が弱くなるか検出されなくなる領域の大きさによって、脈拍数の信頼度の低下の程度は異なる。各エリアで検出される脈拍数と信頼度を各時刻で比較し、各時刻において信頼度の高いエリアの脈拍数を採用することで、各時刻の脈拍の検出精度を高く維持することができる。

　図１０（ａ）、図１０（ｂ）は、各エリアで検出される脈拍数と信頼度の時間変化を示す図である。

　図１０（ａ）は、額１６ａ、右頬１６ｂ、左頬１６ｃ、広域１６ｄの各エリアで検出された脈拍数の時間変化のグラフである。時間帯によって、顔の動きなどでエリアの一部が見えなくなったり、手などの遮断物によりエリアの一部が遮られることで、そのエリアの脈波信号が弱くなり、検出される脈拍数が不安定になっている。

　図１０（ｂ）は、額１６ａ、右頬１６ｂ、左頬１６ｃ、広域１６ｄの各エリアの検出脈波の信頼度の時間変化のグラフである。時間帯によって特定のエリアの信頼度が極端に低下していることがわかる。各エリアの検出脈波の信頼度が所定の閾値を下回る時間帯ではそのエリアから検出された脈拍数を採用しない。各エリアの検出脈波の信頼度が所定の閾値以上である時間帯では、そのエリアから検出された脈拍数を採用し、信頼度で重み付け平均を取って最終的な脈拍数を算出するか、信頼度が最大であるエリアから検出された脈拍数を最終的な脈拍数とする。

　（第４の実施の形態）
　図１１は、第４の実施の形態に係る脈拍検出装置１００の構成図である。第４の実施の形態に係る脈拍検出装置１００は、図１の脈拍検出装置１００の各構成に加えて、さらに画素排除部３２および明るさ変化補償部３４を含む。図１の脈拍検出装置１００と共通する構成および動作については説明を省略する。

　画素値取得部３０は、撮像画像を複数のブロックに分割し、各ブロックの画素値を取得し、画素排除部３２に供給する。

　画素排除部３２は、各ブロックの画素値の中から脈波検出に適さない画素を排除することにより、各ブロックの対象画素を絞り込む。

　具体的には、画素排除部３２は、各ブロックの画素の色をＲＧＢで表した場合の緑の値が所定の閾値以下の画素を除外することにより、各ブロックの対象画素を絞り込む。暗い画素には脈波信号が小さいため、ノイズになる。そこで、画素の緑の値が所定の閾値以下の暗い画素を除外する。最大値が２５５となる８ビット画素の場合、例えば緑の値が２０以下の画素を除外する。

　画素排除部３２は、各ブロックの画素の色をＲＧＢで表した場合の赤の値が所定の閾値以上の画素を除外することにより、各ブロックの対象画素を絞り込んでもよい。明るさが飽和した画素には脈波信号が検出されない。皮膚からの明るい反射光は赤の方が緑よりも先に飽和するため、明るさが飽和しているかどうかは、赤の値によって判定することができる。そこで、画素の赤の値が所定の閾値以上の明る過ぎる画素を除外する。最大値が２５５となる８ビット画素の場合、例えば赤の値が２５４以上の画素を除外する。例えば緑の値が１５０であっても、赤の値が２５５であれば、その画素は除外することに留意する。

　明るさが飽和した赤の画素は、後述の明るさ変化補償部３４による明るさ変化補償に用いるため、対象画素から除外しておくことが好ましい。

　画素排除部３２は、各ブロックの画素の色を色相で表した場合の皮膚の色から所定の閾値より離れた画素をさらに除外することにより、各ブロックの対象画素を絞り込んでもよい。色相において、赤側が０．０で紫側が１．０とする場合、例えば色相が０．３から０．８５の範囲にある画素を除外する。

　画素排除部３２は、このようにして絞り込まれた各ブロックの対象画素を明るさ変化補償部３４に供給する。

　顔の動きによる陰影変化や顔に対する照明の変化によって明るさが変化するため、脈波検出が困難になる。そこで、明るさの変化を補償することが必要になる。同じ皮膚上では、緑の変化と、赤や青の変化には正の相関がある。そこで、脈波信号が強い緑画素の値を、脈波信号の弱い赤画素または青画素の値を用いて補償することで明るさを一定にする。

　明るさ変化補償部３４は、各ブロックの対象画素の色をＲＧＢで表した場合の緑の値の平均値を赤または青の値の平均値で割ることにより、明るさの変化を補償する。

　明るさ変化補償部３４は、各ブロックの対象画素の色をＲＧＢで表した場合の緑の値の平均値を赤の値の平均値と青の値の平均値の和で割ることにより、明るさの変化を補償してもよい。

　明るさ変化補償部３４は、このように明るさ変化の補償がなされた対象画素の緑の値を時系列画素配列取得部４０に供給する。

　上記の説明では、画素排除部３２による画素の排除の後、明るさ変化補償部３４による明るさ変化の補償を行ったが、明るさ変化補償部３４による明るさ変化の補償を行わずに、画素排除部３２が画素の排除により絞り込んだ対象画素を時系列画素配列取得部４０に供給してもよい。また、画素排除部３２による画素の排除を行わずに、画素値取得部３０から供給された各ブロックの画素値に対して明るさ変化補償部３４が明るさ変化の補償を行って時系列画素配列取得部４０に供給してもよい。

　図１２は、図１１の画素排除部３２による画素の排除を説明する図である。画素排除部３２はブロック１８ａの画素に対して緑の値が所定の閾値以下の画素を排除する。次に、画素排除部３２はブロック１８ａの画素に対して赤の値が所定の閾値以上の画素を排除する。最後に、画素排除部３２はブロック１８ａの画素の色空間をＲＧＢから、色相、彩度、明度の３つの成分からなるＨＳＶなどに変換し、色相において皮膚の色として想定される所定の範囲から外れた画素を排除する。これにより、ブロック１８ｂで示されるように対象画素が絞り込まれる。ここで排除された画素はハッチングにより示されている。

　以上述べたように、本実施の形態の脈拍検出装置１００によれば、脈波信号の自己相関を求めることにより、脈拍の細かな変動を正確に測定することができる。

　以上、本発明を実施の形態をもとに説明した。実施の形態は例示であり、それらの各構成要素や各処理プロセスの組合せにいろいろな変形例が可能なこと、またそうした変形例も本発明の範囲にあることは当業者に理解されるところである。

　この発明は、脈拍検出技術に利用できる。

　１０　撮像部、　２０　フレーム記憶部、　３０　画素値取得部、　３２　画素排除部、　３４　明るさ変化補償部、　４０　時系列画素配列取得部、　５０　脈拍データ配列取得部、　６０　脈拍検出部、　７０　自己相関グラフ記憶部、　８０　信頼度計算部、　９０　参照グラフ記憶部、　９２　エリア信頼度記憶部、　１００　脈拍検出装置。

Claims

　ユーザの皮膚を含む領域の所定フレーム数の撮像画像を記憶する記憶部と、
　前記撮像画像を複数のブロックに分割し、各ブロックの画素値を取得する画素値取得部と、
　所定フレーム数の各ブロックの前記画素値を並べた時系列画素配列を取得する時系列画素配列取得部と、
　前記時系列画素配列の各要素の平均値を直流成分として算出し、前記時系列画素配列の所定の要素から前記直流成分を引くことにより、脈拍成分を取得し、所定期間の前記脈拍成分を並べた脈拍データ配列を取得する脈拍データ配列取得部と、
　前記脈拍データ配列の自己相関を求めることにより得られる周波数を脈拍数として検出する脈拍検出部とを含むことを特徴とする脈拍検出装置。
　前記画素値取得部は、各ブロックの画素の色をＲＧＢで表した場合の緑の値を画素値として取得することを特徴とする請求項１に記載の脈拍検出装置。
　前記所定期間は、標準的な脈拍の少なくとも２周期の時間であることを特徴とする請求項１または２に記載の脈拍検出装置。
　前記画素値取得部は、各ブロックの所定数の画素値を加算することにより、空間的に平滑化された画素値を取得することを特徴とする請求項１から３のいずれかに記載の脈拍検出装置。
　前記時系列画素配列取得部は、前記時系列画素配列に対してローパスフィルタを施すことにより、時間的に平滑化された時系列画素配列を取得することを特徴とする請求項１から４のいずれかに記載の脈拍検出装置。
　前記脈拍データ配列取得部は、前記脈拍データ配列に対してローパスフィルタを施すことにより、時間的に平滑化された脈拍データ配列を取得することを特徴とする請求項５に記載の脈拍検出装置。
　前記時系列画素配列に対するローパスフィルタのフィルタ強度は、前記脈拍データ配列に対するローパスフィルタのフィルタ強度よりも強いことを特徴とする請求項６に記載の脈拍検出装置。
　所定期間のノイズフリーの脈拍成分を並べた脈拍数がＰとなる脈拍データ配列の自己相関グラフを参照グラフとして登録し、前記脈拍データ配列取得部により取得された脈拍データ配列の自己相関グラフを脈拍数がＰになるように補正してから前記参照グラフとのクロス相関を計算し、クロス相関値にもとづいて波形信頼度を求める信頼度計算部をさらに含むことを特徴とする請求項１から７のいずれかに記載の脈拍検出装置。
　前記信頼度計算部は、前記脈拍データ配列取得部により取得された脈拍データ配列の波形の振幅を所定の上限値および下限値と比較することにより、振幅信頼度を求めることを特徴とする請求項８に記載の脈拍検出装置。
　前記脈拍検出部は、前記脈拍データ配列の自己相関のピーク近傍に２次曲線を当てはめて得られるピークに対応する周波数を脈拍数として検出することを特徴とする請求項１から９のいずれかに記載の脈拍検出装置。
　ユーザの皮膚を含む領域の所定フレーム数の撮像画像を複数のブロックに分割し、各ブロックの画素値を取得する画素値取得ステップと、
　所定フレーム数の各ブロックの前記画素値を並べた時系列画素配列を取得する時系列画素配列取得ステップと、
　前記時系列画素配列の各要素の平均値を直流成分として算出し、前記時系列画素配列の所定の要素から前記直流成分を引くことにより、脈拍成分を取得し、所定期間の前記脈拍成分を並べた脈拍データ配列を取得する脈拍データ配列取得ステップと、
　前記脈拍データ配列の自己相関を求めることにより得られる周波数を脈拍数として検出する脈拍検出ステップとを含むことを特徴とする脈拍検出方法。
　ユーザの皮膚を含む領域の所定フレーム数の撮像画像を複数のブロックに分割し、各ブロックの画素値を取得する画素値取得機能と、
　所定フレーム数の各ブロックの前記画素値を並べた時系列画素配列を取得する時系列画素配列取得機能と、
　前記時系列画素配列の各要素の平均値を直流成分として算出し、前記時系列画素配列の所定の要素から前記直流成分を引くことにより、脈拍成分を取得し、所定期間の前記脈拍成分を並べた脈拍データ配列を取得する脈拍データ配列取得機能と、
　前記脈拍データ配列の自己相関を求めることにより得られる周波数を脈拍数として検出する脈拍検出機能とをコンピュータに実現させることを特徴とするプログラム。