WO2022162781A1

WO2022162781A1 - 行動系列判定装置、行動系列判定方法、及び行動系列判定プログラム

Info

Publication number: WO2022162781A1
Application number: PCT/JP2021/002816
Authority: WO
Inventors: 純也藤本; 收文中山
Original assignee: 富士通株式会社
Priority date: 2021-01-27
Filing date: 2021-01-27
Publication date: 2022-08-04
Also published as: JPWO2022162781A1; EP4258184A1; EP4258184A4; US20230377374A1

Abstract

人の動作を観測して取得した時系列の複数の観測特徴から、複数の動作で表される行動を各々が複数含む対象行動系列の複数の候補区間を決定する。複数の候補区間の各々を行動の時間区間である行動区間ごとに分割し、行動区間ごとに算出した複数の行動の各々に対応する尤度を行動区間ごとに規格化し、候補区間における全ての行動区間の各々から対象行動系列の行動の順序に基づいて選択される行動区間の各々に対応する規格化された尤度の代表値を評価値として算出する。評価値が共通閾値を超える場合に対象行動系列であると判定する。

Description

行動系列判定装置、行動系列判定方法、及び行動系列判定プログラム

　本開示は、行動系列判定装置、行動系列判定方法及び行動系列判定プログラムに関する。

　ディープラーニング技術の発展により通常のＲＧＢカメラで撮影した人の映像から姿勢を高精度に認識できるようになり、この認識情報を利用して人の行動を推定する様々な研究開発が行われている。当該状況下において、人の映像から検出した姿勢の時系列データから指定した行動が発生した時間区間を推定する取り組みが行われている。

山本龍一、酒向慎司、北村正、「隠れセミマルコフモデルと線形動的システムを組み合わせた音楽音響信号と楽譜の実時間アライメント手法」、研究報告音楽情報科学（ＭＵＳ）、２０１２年Ｓｈｕｎ－ＺｈｅｎｇＹｕ、「Ｈｉｄｄｅｎ　ｓｅｍｉ－Ｍａｒｋｏｖ　ｍｏｄｅｌｓ」、Ａｒｔｉｆｉｃｉａｌ　Ｉｎｔｅｌｌｉｇｅｎｃｅ、Ｖｏｌｕｍｅ　１７４、Ｉｓｓｕｅ　２、２０１０年２月、２１５～２４３頁若林啓、三浦孝夫、「階層型隠れマルコフモデルの高速パラメータ推定」、電子情報通信学会論文誌、２０１１年 "映像から人の様々な行動を認識するＡＩ技術「行動分析技術　Ａｃｔｌｙｚｅｒ」を開発"、［ｏｎｌｉｎｅ］、２０１９年１１月２５日、富士通株式会社、［２０２１年１月１９日検索］、インターネット（ＵＲＬ：ｈｔｔｐｓ：／／ｐｒ．ｆｕｊｉｔｓｕ．ｃｏｍ／ｊｐ／ｎｅｗｓ／２０１９／１１／２５．ｈｔｍｌ）

　人の動作を観測して取得したデータに含まれる様々な行動から対象行動系列を判定するコストが高い。

　本開示は、１つの側面として、人の動作を観測して取得したデータに含まれる様々な行動からの対象行動系列の判定を容易にすることを目的とする。

　１つの実施形態では、人の動作を観測して取得した時系列の複数の観測特徴から、複数の動作で表される行動を各々が複数含む対象行動系列の複数の候補区間を決定する。複数の候補区間の各々を行動の時間区間である行動区間ごとに分割し、行動区間ごとに算出した複数の行動の各々に対応する尤度を行動区間ごとに規格化する。候補区間における全ての行動区間の各々から対象行動系列の行動の順序に基づいて選択される行動区間の各々に対応する規格化された尤度の代表値を評価値として算出する。評価値が共通閾値を超える場合に対象行動系列であると判定する。

　本開示は、１つの側面として、人の動作を観測して取得したデータに含まれる様々な行動からの対象行動系列の判定を容易にすることができる。

本実施形態の隠れセミマルコフモデルを例示する概念図である。本実施形態の行動区間推定モデル構築装置の機能構成を例示するブロック図である。本実施形態の第１隠れマルコフモデルの状態を例示する概念図である。教師ありデータの水増しを説明する概念図である。教師ありデータの水増しを説明する概念図である。教師ありデータの水増しを説明する概念図である。教師ありデータの水増しを説明する概念図である。本実施形態の行動シーケンス判定装置の機能構成を例示するブロック図である。対象行動シーケンス判定を説明する概念図である。本実施形態のハードウェア構成を例示するブロック図である。行動区間推定モデル構築処理の流れを例示するフローチャートである。特徴ベクトル抽出処理の流れを例示するフローチャートである。行動区間推定処理の流れを例示するフローチャートである。行動シーケンス判定処理の流れを例示するフローチャートである。関連技術の行動を説明する概念図である。関連技術の階層型隠れマルコフモデルを例示する概念図である。関連技術の概要を例示する概念図である。本実施形態の概要を例示する概念図である。関連技術の手作業での区間の分割を例示する概念図である。行動区間の分割を例示する概念図である。対象行動シーケンス判定を説明する概念図である。対象行動シーケンス判定を説明する概念図である。対象行動シーケンス判定を説明する概念図である。

　本実施形態では、人の行動が発生した時間区間を推定する行動区間推定モデルの一例として、図１に例示するような隠れセミマルコフモデル（以下、ＨＳＭＭ（Ｈｉｄｄｅｎ　ｓｅｍｉ－Ｍａｒｋｏｖ　ｍｏｄｅｌ）という。）を構築する。ＨＳＭＭは、隠れマルコフモデル（以下、ＨＭＭ（Ｈｉｄｄｅｎ　Ｍａｒｋｏｖ　ｍｏｄｅｌ）という。）のパラメータに加え、状態ごとの継続時間の確率分布をパラメータとしてもつ。

　本実施形態のＨＳＭＭは、人の動作の各々を状態とする複数の第１ＨＭＭと、行動を状態とする第２ＨＭＭと、を含む。ｍ１、ｍ２、ｍ３は動作の一例であり、ａ１、ａ２、ａ３は行動の一例である。行動は、複数の動作の組合せであり、動作は、複数の姿勢の組合せである。

　パラメータを設定することで構築されたＨＳＭＭに人の姿勢を検知することで生成された時系列センサデータが与えられると、ＨＳＭＭは最適な行動の時間区間（以下、行動区間という。）を推定する。ｄ１、ｄ２、ｄ３は行動区間の一例である。

　ＨＭＭのパラメータには、観測確率及び遷移確率が存在する。Ｏ１、…、Ｏ８は観測確率の一例であり、遷移確率は状態をつなぐ矢印に対応する確率である。観測確率とは、各状態において、ある特徴が観測される確率であり、遷移確率とは、ある状態から別の状態に遷移する確率である。遷移の順番が定まっている場合は、遷移確率は不要である。なお、動作の数、行動の数、即ち、第１ＨＭＭ、第２ＨＭＭの数は例示であり、図１に例示される数に限定されない。

　図２は、本実施形態の行動区間推定モデル構築装置１０の機能ブロック図の一例である。行動区間推定モデル構築装置１０は、観測確率学習部１１、遷移確率学習部１２、構築部１３を有する。観測確率学習部１１は、以下に説明するように、教師なしデータで行動区間推定モデルの一例であるＨＳＭＭの観測確率を学習する。

　本実施形態では、ある作業目標を達成するための限定された行動を対象とする。このような行動は、例えば、工場のラインで行われる定型作業での行動であり、以下の性質を有する。
　性質１：作業を構成する各行動の違いは、限定された複数の動作の組合せの違いである。
　性質２：同じ作業を行う際に観測される複数の姿勢は類似している。

　本実施形態では、性質１に基づいて、全ての行動が１つの動作群に含まれる動作で構成される。図３に例示するように、動作群には、例えば、３つの動作ｍ１１、ｍ１２、ｍ１３が含まれている。

　例えば、動作ｍ１１は「腕を上げる」、動作ｍ１２は「腕を降ろす」、動作ｍ１３は「腕を前に伸ばす」であってよい。動作群に含まれる動作の数は図３の例に限定されない。また、各行動に含まれる動作の数も図３の例に限定されない。

　図３のＨＭＭにおいて、破線矢印に対応する各動作の観測確率は行動には依存しないため、行動区間の教師なしデータで学習することができる。学習は、例えば、機械学習、ニューラルネットワーク、ディープラーニングなどを使用して行う。

　詳細には、観測確率の教師なし学習に使用するモデルは混合ガウス分布（以下、ＧＭＭ（Ｇａｕｓｓｉａｎ　Ｍｉｘｔｕｒｅ　Ｍｏｄｅｌ）という。）であってよい。各観測は動作のうちの１つの動作が確率的に選択され、その動作についてのガウス分布により生成されると仮定する。これは、観測の時系列的な依存関係を使用しない教師あり学習とは異なる仮定である。学習したＧＭＭの各ガウス分布のパラメータを各動作における観測確率の確率分布であるガウス分布に割り当てる。

　遷移確率学習部１２は、以下に説明するように、教師情報をもつ学習データ（以下、教師ありデータという。）で、第１ＨＭＭの動作の遷移確率を学習する。教師情報は、姿勢の時系列データに対して各行動が発生している時間区間の正解を与える情報である。学習は、例えば、最尤推定やＥＭアルゴリズム（Ｅｘｐｅｃｔａｔｉｏｎ－Ｍａｘｉｍｉｚａｔｉｏｎ　ａｌｇｏｒｉｔｈｍ）などを使用して行う（その他の機械学習、ニューラルネットワーク、ディープラーニングなどの方式を使用してもよい）。

　教師ありデータの生成には、時間及び労力がかかる。したがって、本実施形態では、観測確率学習部１１で学習した観測確率を固定し、既存の教師ありデータから遷移確率を学習する。

　詳細には、図４に例示するように、第１教師ありデータの一例である既存の教師ありデータのデータを種データＳＤとし、種データＳＤにノイズを付加し、オーバーサンプリングすることでデータを水増しする。上記性質２によれば、同じ作業の姿勢は類似しているため、ノイズを付加することで、図５に例示するように実際の観測ごとのばらつきに類似したばらつきをもつデータを生成することができる。ノイズは、例えば、ランダムノイズであってよい。

　種データＳＤの教師情報ＴＩを、水増ししたデータの各々に共通に適用することで教師ありデータを水増しする。第２教師ありデータの一例である水増しした教師ありデータを使用して、第１ＨＭＭの複数の動作の遷移確率を教師あり学習で学習する。

　オーバーサンプリングでは、各時刻の観測サンプルに所定の範囲のノイズを生成して付加する。ノイズを生成する際に、当該観測サンプルを生成した確率が高い動作を特定し、当該動作のサンプル群と別の動作のサンプル群との特徴空間内での広がり方の関係を考慮して適切な大きさのノイズを生成して付加する。これにより、より適切な教師ありデータを生成することができる。

　例えば、特定した動作のサンプル群の共分散の定数倍の共分散の多変量ガウス分布から生成したノイズを付加してもよい。また、特定した動作のサンプル群から最も中心距離が近い動作のサンプル群までの中心距離ｄを算出し、特徴空間の各軸方向の標準偏差がｄの定数倍となる等方性のガウス分布（共分散行列が対角行列である）から生成したノイズを付加してもよい。

　各動作のサンプル群に含まれるサンプルの散らばり、即ち、特徴空間内での広がりには差がある。即ち、散らばりが非常に小さい動作もあるし、非常に大きい動作もある。全ての動作について一律の範囲のランダムノイズを使用した場合、ある動作のサンプル群が散らばりの大きいサンプルを含むと、ランダムノイズによるばらつかせ方が相対的に小さい。一方、ある動作のサンプル群が散らばりの小さいサンプルを含むと、ランダムノイズによるばらつかせ方が相対的に大きい。

　図６は、動作ｍ３１、動作ｍ３２、及び動作ｍ３３のサンプル群を例示する。図７は、動作ｍ３２のサンプル群にランダムノイズを付加した状態を例示する。図７では、ランダムノイズの範囲が大きいため、元の動作ｍ３２から離れているサンプルが多い。このような場合にも、上記したように、ある動作のサンプル群と別の動作のサンプル群との特徴空間内での広がり方の関係を考慮して適切な大きさのノイズを付加することで、より適切な教師ありデータを水増しすることができる。

　構築部１３は、観測確率学習部１１で学習した観測確率、及び遷移確率学習部１２で学習した状態遷移確率を使用して、図１に例示するようなＨＳＭＭを構築する。Ｏ１、Ｏ２、…、Ｏ８は、観測確率学習部１１で学習した観測確率を表し、行動ａ１、ａ２、ａ３の各々に含まれる動作ｍ１、ｍ２、及びｍ３間の矢印は、遷移確率学習部１２で学習した状態遷移確率に対応する。ｄ１、ｄ２、ｄ３は、各行動の継続時間を表し、継続時間の確率分布は、教師情報の行動の継続時間から決定される。例えば、継続時間の確率分布は、一定範囲の一様分布であってよい。構築したＨＳＭＭに、センサで人の姿勢を検知して生成したセンサデータを適用して、各行動の時間区間である行動区間を推定する。推定についての詳細は、後述する。

　本実施形態の行動区間推定モデル構築装置１０は、以下の特徴を有する。
１．第１ＨＭＭの全行動で共通な動作の観測確率は教師なし学習で学習する。
２．第１ＨＭＭの動作間の遷移確率は、教師あり種データから水増しした教師ありデータを使用して、教師あり学習で学習する。

　図８は、本実施形態の行動シーケンス判定装置２０の機能ブロック図の一例である。行動シーケンス判定装置２０は、候補区間決定部２１、評価値算出部２２、判定部２３を有する。行動シーケンス判定装置２０は、人の動作を観測して取得した時系列の複数の観測特徴から、複数の動作で表される行動を所定の順序で複数含む対象行動シーケンスを判定する。

　候補区間決定部２１は、人の動作を観測して取得した時系列の複数の観測特徴の開始時刻を１時刻ずつ変動させ、開始時刻の各々について、終了時刻を開始時刻より時間的に後の時刻で１時刻ずつ変動させることで、複数の候補区間を決定する。候補区間は、対象行動系列に相当する対象行動シーケンスの候補である。変動は、１時刻ずつに限定されず、例えば、２時刻ずつ、あるいは３時刻ずつであってもよい。

　評価値算出部２２は、候補区間決定部２１で決定された候補区間に含まれる行動の時間区間である行動区間を、行動区間推定モデルを使用して推定する。行動区間は、上記行動区間推定モデルによって推定されてもよいし、他の既存の技術によって推定されてもよい。評価値算出部２２は、候補区間に含まれる各行動区間の行動の尤度を算出し、行動区間ごとに尤度を規格化することで相対適合度を算出する。尤度は、ある行動が当該行動シーケンスの順序にしたがった行動である尤もらしさを表す。

　評価値算出部２２は、行動区間毎に、対象行動シーケンスの行動の順序にしたがって当該行動区間に対応する行動の相対適合度を選択し、選択した相対適合度の代表値を評価値として算出する。代表値は、選択された相対適合度の平均値、中央値、及び総乗などであってよい。判定部２３は、評価値と共通閾値とを比較することで、対象行動シーケンスであるか否か判定する。共通閾値は、実験的に決定されてよい一定の値である。

　行動シーケンス判定装置２０は、相対適合度が、例えば、０．０～１．０の範囲となるように尤度を規格化する。本実施形態では、尤度を規格化するため、共通の閾値、即ち、相対的ではない一定の値を閾値として使用して対象行動シーケンスを判定することができる。共通の閾値は、実験的に定められてよいが、例えば、０．５であってよい。

　尤度は、行動モデルが順序を考慮しないＧＭＭの場合、例えば、以下の式（１）で算出することができる。行動Ａの行動区間が、観測特徴値ｘ_１、ｘ_２、ｘ_３であるとする。

　尤度は、行動モデルが順序を考慮するＨＭＭの場合、例えば、以下の式（２）で算出することができる。ｓ_ｔは行動Ａの内部的な状態遷移に関しての各時刻の状態を表す。

　図９に、行動Ａ、行動Ｂ、行動Ｃの順序で行動を含む対象行動シーケンスの候補区間を例示する。行動Ａに対応する位置の行動区間がｘ_１、ｘ_２、ｘ_３、行動Ｂに対応する位置の行動区間がｘ_４、ｘ_５、ｘ_６、ｘ_７、ｘ_８、行動Ｃに対応する位置の行動区間がｘ_９、ｘ_１０であると推定された場合について説明する。

　対象行動シーケンスにおいて行動Ａに対応する位置の行動区間が行動Ｃである尤度、行動Ｂである尤度、行動Ａである尤度が以下の通りであるとする。
　　Ｐ（ｘ_１，ｘ_２，ｘ_３｜Ｃ）＝１．１×１０^－２２
　　Ｐ（ｘ_１，ｘ_２，ｘ_３｜Ｂ）＝３．４×１０^－９
　　Ｐ（ｘ_１，ｘ_２，ｘ_３｜Ａ）＝６．８×１０^－８

　行動Ｃである尤度、行動Ｂである尤度、行動Ａである尤度を各々規格化すると、相対適合度は以下の通りとなる。
　１．１×１０^－２２／（１．１×１０^－２２＋３．４×１０^－９＋６．８×１０^－８）
　＝０．００
　３．４×１０^－９／（１．１×１０^－２２＋３．４×１０^－９＋６．８×１０^－８）
　＝０．０５
　６．８×１０^－８／（１．１×１０^－２２＋３．４×１０^－９＋６．８×１０^－８）
　＝０．９５

　対象行動シーケンスにおいて行動Ｂに対応する位置の行動区間が行動Ｃである尤度、行動Ｂである尤度、行動Ａである尤度が以下の通りであるとする。
　　Ｐ（ｘ_４，ｘ_５，ｘ_６，ｘ_７，ｘ_８｜Ｃ）＝９．０×１０^－９
　　Ｐ（ｘ_４，ｘ_５，ｘ_６，ｘ_７，ｘ_８｜Ｂ）＝６．１×１０^－７
　　Ｐ（ｘ_４，ｘ_５，ｘ_６，ｘ_７，ｘ_８｜Ａ）＝９．１×１０^－９

　行動Ｃである尤度、行動Ｂである尤度、行動Ａである尤度を各々規格化すると、相対適合度は以下の通りとなる。
　９．０×１０^－９／（９．０×１０^－９＋６．１×１０^－７＋９．１×１０^－９）
　＝０．０１
　６．１×１０^－７／（９．０×１０^－９＋６．１×１０^－７＋９．１×１０^－９）
　＝０．９７
　９．１×１０^－９／（９．０×１０^－９＋６．１×１０^－７＋９．１×１０^－９）
　＝０．０１

　対象シーケンスにおいて行動Ｃに対応する位置の行動区間が行動Ｃである尤度、行動Ｂである尤度、行動Ａである尤度が以下の通りであるとする。
　　Ｐ（ｘ_９，ｘ_１０｜Ｃ）＝３．６×１０^－５
　　Ｐ（ｘ_９，ｘ_１０｜Ｂ）＝８．２×１０^－６
　　Ｐ（ｘ_９，ｘ_１０｜Ａ）＝５．７×１０^－８

　行動Ｃである尤度、行動Ｂである尤度、行動Ａである尤度を各々規格化すると、相対適合度は以下の通りとなる。
　３．６×１０^－５／（３．６×１０^－５＋８．２×１０^－６＋５．７×１０^－８）
　＝０．８１
　８．２×１０^－６／（３．６×１０^－５＋８．２×１０^－６＋５．７×１０^－８）
　＝０．１９
　５．７×１０^－８／（３．６×１０^－５＋８．２×１０^－６＋５．７×１０^－８）
　＝０．００

　代表値が平均値である場合、代表値は、行動Ａに対応する位置の行動区間が行動Ａである尤度、行動Ｂに対応する位置の行動区間が行動Ｂである尤度、行動Ｃに対応する位置の行動区間が行動Ｃである尤度から以下の通りである。
　　（０．９５＋０．９７＋０．８１）／３＝０．９１

　共通閾値が０．５である場合、上記の例では、候補区間は対象行動シーケンスであると判定することができる。

　行動区間推定モデル構築装置１０は、一例として、図１０に示すように、ＣＰＵ（Ｃｅｎｔｒａｌ　Ｐｒｏｃｅｓｓｉｎｇ　Ｕｎｉｔ）５１、一次記憶装置５２、二次記憶装置５３、及び、外部インターフェイス５４を含む。ＣＰＵ５１は、ハードウェアであるプロセッサの一例である。ＣＰＵ５１、一次記憶装置５２、二次記憶装置５３、及び、外部インターフェイス５４は、バス５９を介して相互に接続されている。ＣＰＵ５１は、単一のプロセッサであってもよいし、複数のプロセッサであってもよい。また、ＣＰＵ５１に代えて、例えば、ＧＰＵ（Ｇｒａｐｈｉｃｓ　Ｐｒｏｃｅｓｓｉｎｇ　Ｕｎｉｔ）が使用されてもよい。

　一次記憶装置５２は、例えば、ＲＡＭ（Ｒａｎｄｏｍ　Ａｃｃｅｓｓ　Ｍｅｍｏｒｙ）などの揮発性のメモリである。二次記憶装置５３は、例えば、ＨＤＤ（Ｈａｒｄ　Ｄｉｓｋ　Ｄｒｉｖｅ）、又はＳＳＤ（Ｓｏｌｉｄ　Ｓｔａｔｅ　Ｄｒｉｖｅ）などの不揮発性のメモリである。

　二次記憶装置５３は、プログラム格納領域５３Ａ及びデータ格納領域５３Ｂを含む。プログラム格納領域５３Ａは、一例として、行動区間推定モデル構築プログラムなどのプログラムを記憶している。データ格納領域５３Ｂは、一例として、教師ありデータ、教師なしデータ、学習した観測確率、及び遷移確率などを記憶する。

　ＣＰＵ５１は、プログラム格納領域５３Ａから行動区間推定モデル構築プログラムを読み出して一次記憶装置５２に展開する。ＣＰＵ５１は、行動区間推定モデル構築プログラムをロードして実行することで、図２の観測確率学習部１１、遷移確率学習部１２、及び、構築部１３として動作する。

　なお、行動区間推定モデル構築プログラムなどのプログラムは、外部サーバに記憶され、ネットワークを介して、一次記憶装置５２に展開されてもよい。また、行動区間推定モデル生成プログラムなどのプログラムは、ＤＶＤ（Ｄｉｇｉｔａｌ　Ｖｅｒｓａｔｉｌｅ　Ｄｉｓｃ）などの非一時的記録媒体に記憶され、記録媒体読込装置を介して、一次記憶装置５２に展開されてもよい。

　外部インターフェイス５４には外部装置が接続され、外部インターフェイス５４は、外部装置とＣＰＵ５１との間の各種情報の送受信を司る。図１０では、外部インターフェイス５４に、ディスプレイ５５Ａ及び外部記憶装置５５Ｂが接続されている例を示している。外部記憶装置５５Ｂには、例えば、教師ありデータ、教師なしデータ、及び、構築したＨＳＭＭなどを記憶する。ディスプレイ５５Ａは、例えば、構築したＨＳＭＭモデルを視認可能に表示する。

　行動区間推定モデル構築装置１０は、例えば、パーソナルコンピュータ、サーバ、及び、クラウド上のコンピュータなどであってよい。

　図１０の行動区間推定モデル構築装置１０は、構築したＨＳＭＭをデータ格納領域５３Ｂに格納することで行動シーケンス判定装置２０としても機能する。

　ＣＰＵ５１は、プログラム格納領域５３Ａから行動シーケンス判定プログラムを読み出して一次記憶装置５２に展開する。ＣＰＵ５１は、行動シーケンス判定プログラムをロードして実行することで、図８の候補区間決定部２１、評価値算出部２２、及び判定部２３として動作する。

　なお、行動シーケンス判定プログラムなどのプログラムは、外部サーバに記憶され、ネットワークを介して、一次記憶装置５２に展開されてもよい。また、行動シーケンス判定プログラムなどのプログラムは、ＤＶＤ（Ｄｉｇｉｔａｌ　Ｖｅｒｓａｔｉｌｅ　Ｄｉｓｃ）などの非一時的記録媒体に記憶され、記録媒体読込装置を介して、一次記憶装置５２に展開されてもよい。

　外部記憶装置５５Ｂには、例えば、対象行動シーケンスであると判定された行動シーケンスを後続処理に利用するため記憶する。ディスプレイ５５Ａは、例えば、対象行動シーケンスであると判定された行動シーケンスを視認可能に表示する。

　図１１に、行動区間推定モデル構築処理の流れを例示する。ＣＰＵ５１は、ステップ１０１で、後述するように、学習データから人の姿勢の連鎖である運動を表す特徴ベクトルを抽出する。ＣＰＵ５１は、ステップ１０２で、ステップ１０１で抽出した特徴ベクトルのクラスタリング（ＧＭＭのパラメータ推定）により、要素となる動作に分類し、各動作の観測確率を教師なし学習で学習する。

　ＣＰＵ５１は、ステップ１０３で、教師あり種データにノイズを付加し、オーバーサンプリングして生成したデータに教師あり種データの教師情報を付与することで、教師ありデータを水増しする。ＣＰＵ５１は、ステップ１０４で、教師ありデータについて、教師情報で与えられた各行動の時間区間毎に特徴ベクトルを振り分ける。

　ＣＰＵ５１は、ステップ１０５で、ステップ１０４で振り分けた時間区間内の特徴ベクトルの系列を観測データとして、ステップ１０３で水増しした教師ありデータを使用し、第１ＨＭＭの動作の遷移確率を教師あり学習で学習する。

　ＣＰＵ５１は、ステップ１０６で、各行動の継続時間の確率分布として、教師情報で与えられた各行動の継続時間に対して所定の範囲の一様分布を設定する。ＣＰＵ５１は、ステップ１０２で学習した観測確率及びステップ１０５で学習した遷移確率を使用して、ＨＳＭＭを構築する。ステップ１０６の設定で一定時間継続後に教師情報で与えられた各行動の順番に第２ＨＭＭの行動が遷移するＨＳＭＭを構築する。構築したＨＳＭＭは、例えば、データ格納領域５３Ｂに格納されてもよい。

　図１２は、図１１のステップ１０１の特徴ベクトル抽出処理の詳細を例示する。ＣＰＵ５１は、ステップ１５１で、学習に使用するデータから人を検出し、追跡することで、人の姿勢情報を取得する。ＣＰＵ５１は、ステップ１５２で、ステップ１５１で取得した姿勢情報が複数人の姿勢情報を含む場合、姿勢情報の時系列データから分析対象とする姿勢情報の時系列データを取得する。分析対象とする姿勢情報は、人を囲むバウンディングボックスの大きさ、及び時間などから選択する。

　ＣＰＵ５１は、ステップ１５３で、ステップ１５２で取得した姿勢情報の時系列データから身体の各部位についての運動情報の時系列データを取得する。運動情報の時系列とは、例えば、各部位の曲げの程度、曲げの速度などであってよい。各部位とは、例えば、肘、膝などであってよい。

　ＣＰＵ５１は、ステップ１５４で、スライディングタイムウィンドウにより一定の時間間隔ごとにウィンドウ内のステップ１５３の運動情報を時間方向で平均化して特徴ベクトルを算出する。

　図１３に、本実施形態で構築したＨＳＭＭを使用した行動区間推定処理の流れを例示する。図１０の行動区間推定モデル構築装置１０は、構築したＨＳＭＭをデータ格納領域５３Ｂに格納することで行動区間推定装置として機能してもよい。

　ＣＰＵ５１は、ステップ２５１で、センサで人の姿勢を検知することにより生成されたセンサデータから特徴ベクトルを抽出する。センサは、人の姿勢を検知するデバイスであり、例えば、カメラ、赤外線センサ、モーションキャプチャデバイスなどであってよい。図１３のステップ２５１は、図１１のステップ１０１と同様であるため、詳細な説明は省略する。

　ＣＰＵ５１は、ステップ２５２で、ステップ２５１で抽出した特徴ベクトルの系列を観測データとして、行動区間推定モデル構築処理で構築したＨＳＭＭと照合して各行動状態の継続時間を推定する。ＣＰＵ５１は、ステップ２５３で、ステップ２５２で推定した各行動状態の継続時間から各行動の時間区間を推定する。

　例えば、映像を入力として、映像における特定の行動を認識するような技術では、基本動作認識、要素行動認識、及び上位行動認識を行う。映像における特定の行動とは、要素行動の組合せで、さらに複雑な上位行動であり、基本動作認識とは、フレームごとの姿勢認識であり、要素行動認識とは、時間的空間的認識を行い、ある程度の時間長における単純行動を認識することである。上位行動認識とは、ある程度の時間長における複雑行動の認識である。当該技術において、本実施形態の行動区間推定モデル構築処理及び構築した行動区間推定モデルを適用し、行動区間を推定することができる。

　図１４に、本実施形態で構築したＨＳＭＭを使用した行動シーケンス判定処理の流れを例示する。

　ＣＰＵ５１は、ステップ２０１で、センサで人の姿勢を検知することにより生成されたセンサデータから特徴ベクトルを抽出する。センサは、人の姿勢を検知するデバイスであり、例えば、カメラ、赤外線センサ、モーションキャプチャデバイスなどであってよい。図１４のステップ２０１は、図１１のステップ１０１と同様であるため、詳細な説明は省略する。

　ＣＰＵ５１は、ステップ２０２で、開始時刻と終了時刻との全ての組合せを試行することで、対象行動シーケンスの候補区間を決定する。ＣＰＵ５１は、ステップ２０３で、ステップ２０１で抽出した特徴ベクトルの系列を観測データとして、行動区間推定モデル構築処理で構築したＨＳＭＭと照合して各行動状態の継続時間を推定する。推定した各行動状態の継続時間から各行動の時間区間を推定する。

　ＣＰＵ５１は、ステップ２０４で、候補区間の各行動区間で各行動のモデルの尤度、即ち、観測確率を規格化することで、相対適合度を算出する。ＣＰＵ５１は、ステップ２０５で、対象行動シーケンスの行動の順序にしたがって当該行動区間に対応する行動の相対適合度を使用して代表値を算出し、当該代表値を評価値とする。ＣＰＵ５１は、ステップ２０６で、評価値と共通閾値とを比較することで、対象行動シーケンスであるか否か判定する。

　ステップ２０２で、開始時刻を第１時刻から第２時刻まで変動させ、開始時刻の各々について、終了時刻を開始時刻より時間的に後の時刻である第３時刻から第４時刻まで変動させることで候補区間を複数決定する。ステップ２０３～ステップ２０６の処理は、ステップ２０２で決定される複数の候補区間の各々に対して適用する。

　対象行動シーケンスであると判定された複数の候補区間が部分的に重畳する場合、評価値が高いほうの候補区間を対象行動シーケンスであると判定するようにしてもよい。対象行動シーケンスであると判定された行動シーケンスを処理対象行動シーケンスとして抽出し、データ格納領域５３Ｂに記録してもよいし、対象行動シーケンスであると判定された行動シーケンスの開始時刻と終了時刻とをデータ格納領域５３Ｂに記録してもよい。

　関連技術では、行動に含まれる動作が特に限定されないＨＳＭＭが使用され得る。当該関連技術では、図１５に例示するように、例えば、以下の動作が存在すると仮定する。
（１）腕を上げる、（２）腕を降ろす、（３）腕を前に伸ばす、（４）両手を身体の前で近づける、（５）前に移動する、（６）横に移動する、（７）しゃがむ、（８）立つ

　行動の例は、例えば、以下の通りである。
行動ａ３１：（１）腕を上げる→（３）腕を前に伸ばす→（１）腕を上げる→（４）両手を身体の前で近づける→（７）しゃがむ、
行動ａ３２：（７）しゃがむ→（４）両手を身体の前で近づける→（８）立つ→（５）前に移動する→（３）腕を前に伸ばす、など

　上記のように、一般的な行動の動作、即ち、推定する行動が制限されない複数の動作をＨＭＭが含む場合、動作の観測確率を１つの単純な確率分布で表すことは困難である。この問題に対処するために、階層型隠れマルコフモデルを使用する技術が存在する。階層型隠れマルコフモデルは、図１６に例示するように、上位階層ＨＭＭが複数の下位階層ＨＭＭを状態として含む。行動ａ５１、ａ５２、及びａ５３は、下位階層ＨＭＭの例である。下位階層ＨＭＭの各々は、動作を状態として含み、ｍ５１、ｍ５２、ｍ５３、ｍ６１、ｍ６２、ｍ６３、ｍ７１、及びｍ７２は、動作の例である。

　階層型ＨＭＭでは、図１７に例示するように、教師情報ＴＩＬをもつ学習データＬＤを使用して、各行動の動作の観測確率及び遷移確率を教師あり学習で学習する。図１７では、行動ａ５１の観測確率ｐ１１、遷移確率ｐ２１、行動ａ５２の観測確率ｐ１２、遷移確率ｐ２２、行動ａ５３の観測確率ｐ１３、遷移確率ｐ２３を例示する。しかしながら、階層型ＨＭＭでは、パラメータの数が多く、パラメータの自由度が高いため、パラメータの学習のために教師ありデータを多数使用する。教師ありデータの教師情報を作成するには、時間及び労力を要する。

　一方、本開示では、図１８に例示するように、ＨＳＭＭの行動に対応する第１ＨＭＭの各々で共通の観測確率ｐ１は教師なしデータＬＤＮを使用して教師なし学習で学習する。学習した観測確率ｐ１を固定して、第１ＨＭＭの各々の動作の遷移確率ｐ２１Ｄ、ｐ２２Ｄ、ｐ２３Ｄを教師ありデータを使用して教師あり学習で学習する。本開示では、既存の教師ありデータＬＤＤにノイズを付加しオーバーサンプリングし生成したデータに、教師ありデータＬＤＤの教師情報ＴＩＬを付加することで、教師ありデータを水増しして教師あり学習に使用する。したがって、本実施形態では、既存の教師ありデータが少ない場合でも、行動区間推定モデルを効率的に構築することができる。

　例えば、関連技術では、作業中の動作を手作業で区間に分割する。詳細には、図１９の左に例示するように、一連の作業の様子をカメラで撮影し、取得した映像を目視することで、図１９の右に例示するように、手作業で区間に分割する。当該関連技術では、取得した映像ごとに手作業で区間に分割するため、時間と労力がかかる。

　他の関連技術では、図２０の上に例示するように、基本データについては、関連技術と同様に、作業中の行動区間を手作業で分割してもよい。一方、当該手作業で分割した行動区間を教師情報とすることで、図２０の下に例示するように、他のデータについては、自動的に行動区間を分割することができるため時間と労力を省くことができる。

　実際には、映像には、図２１の上に例示する教師情報に対応する処理対象の一連の行動である行動シーケンスが複数含まれる場合があり、さらに、対象行動シーケンス以外の行動が含まれる場合もある。本開示では、例えば、当該映像から、図２１の下に例示するように、対象行動シーケンスを判定する。

　対象行動シーケンス間にどのような動きが含まれるか不明であるため、即ち、対象行動シーケンス以外の動きはモデル化されていないため、候補区間を決定し、当該候補区間に対象行動が含まれているか否かを評価する。即ち、算出した評価値が閾値を超える場合、対象行動シーケンスであると判定する。

　行動の確率モデルにより観測情報が得られる場合、当該観測が得られる観測確率から、尤度を算出することができるため、当該尤度を評価値として利用することが考えられる。教師ありデータが大量にある場合、正解の行動区間に対する観測確率の分布がわかるため、閾値を決定することは比較的容易であるが、教師ありデータが少ない場合、即ち、基本データが少ない場合、閾値を決定することは困難である。

　教師ありデータが少ない場合、例えば、１シーケンス分である場合に、当該観測確率を評価値として使用する場合、観測確率がどの程度の値であれば高評価であるといえるかは確率モデルのパラメータによって大きく変わる。したがって、様々な行動シーケンスの検出に適用しようとする際に一定の閾値、即ち、共通に使用することができる共通閾値を決定することは困難である。共通閾値を利用しようとすると、対象行動シーケンスの行動の確率モデルのパラメータを調整しなければならず、実用的ではない。

　例えば、対象行動シーケンスＭが、３つの行動Ａ、Ｂ、Ｃを当該順序で含む場合、対象行動シーケンスＭから各行動区間内の観測が出力される確率の観測数の累乗根を評価値として使用することができる。当該評価値は、幾何平均的な発想で行動区間内の観測の平均的な尤度を表す。

　図２２の例では、行動シーケンスＭに対応する候補区間として、候補区間１、候補区間２、候補区間３を決定している。これらの候補区間は例示であり、実際には、全ての開始時刻と終了時刻との組合せで候補区間は決定される。ｘ_ｉ（ｉは自然数）は、各時刻における動作特徴ベクトルを表す。

　候補区間１、候補区間２、候補区間３の評価値が各々以下の通りである場合、評価値が最も大きい候補区間２が最も対象行動シーケンスＭらしいと判定することができる。しかしながら、観測系列には対象行動シーケンスＭがいくつ含まれているか不明であり、全く含まれていない場合もあり得る。

　したがって、評価値が最も大きいからといって、候補区間２が対象行動シーケンスであると判定することはできない。例えば、基本データの評価値と比較することは可能であるが、この場合、基本データの評価値との差異の範囲をどの程度に設定するか、を決定することが困難である。

　例えば、行動Ａ，Ｂ，Ｃを当該順序で含む対象行動シーケンスの候補区間の行動Ａの位置にある行動区間Ｘに対する、対象行動シーケンスの行動Ａ、Ｂ、Ｃのモデル各々からの観測確率Ｐ（Ｘ｜Ａ）、Ｐ（Ｘ｜Ｂ）、Ｐ（Ｘ｜Ｃ）について検討する。図２３の左に例示するように、第１作業者の候補区間の行動Ａの位置にある行動区間がＹである場合、行動Ａからの観測確率Ｐ（Ｙ｜Ａ）、行動Ｂからの観測確率Ｐ（Ｙ｜Ｂ）、行動Ｃからの観測確率Ｐ（Ｙ｜Ｃ）のうち、観測確率Ｐ（Ｙ｜Ａ）が最も大きい。

　図２３の右に例示するように、第２作業者の候補区間の行動Ａの位置にある行動区間がＺである場合も、行動Ａからの観測確率Ｐ（Ｚ｜Ａ）、行動Ｂからの観測確率Ｐ（Ｚ｜Ｂ）、行動Ｃからの観測確率Ｐ（Ｚ｜Ｃ）のうち、行動Ａからの観測確率Ｐ（Ｚ｜Ａ）が最も大きい。このように、例えば、作業者が異なる場合であっても、対象行動シーケンスの候補区間の行動Ａの位置にある行動区間に対する行動Ａの観測確率が、行動Ｂ、Ｃの観測確率と比較して大きいという関係は保持される。

　したがって、候補区間で、行動Ａの観測確率が最も大きい行動区間、行動Ｂの観測確率が最も大きい行動区間、行動Ｃの観測確率が最も大きい行動区間が当該順序で存在する場合、当該候補区間は対象行動シーケンスに対応する区間らしいと判定することができる。この判定は、行動Ａ、Ｂ、Ｃの相対的な関係を利用して行動の順序を評価し、対象行動シーケンスではない候補区間であっても高評価になり得る。しかしながら、対象行動シーケンスに含まれる行動数が増えると、偶然、当該相対的な関係が出現する可能性は低くなる。

　一方で、第２作業者の観測確率Ｐ（Ｚ｜Ａ）は、第１作業者の観測確率Ｐ（Ｙ｜Ａ）と比較して明らかに小さい。このように、観測確率を評価値として使用する場合、例えば、作業者が異なると、行動Ａからの観測確率が最も大きくなるが、値が大きく異なる場合があるため、共通閾値を使用することが困難である。

　本実施形態では、人の動作を観測して取得した時系列の複数の観測特徴から、複数の動作で表される行動を各々が複数含む対象行動系列の複数の候補区間を決定する。複数の候補区間の各々を行動の時間区間である行動区間ごとに分割し、行動区間ごとに算出した複数の行動の各々に対応する尤度を行動区間ごとに規格化する。候補区間における全ての行動区間の各々から対象行動系列の行動の順序に基づいて選択される行動区間の各々に対応する規格化された尤度の代表値を評価値として算出する。評価値が共通閾値を超える場合に対象行動系列であると判定する。

　本開示によれば、人の動作を観測して取得したデータに含まれる様々な行動からの対象行動系列の判定を容易にすることができる。即ち、例えば、様々な作業者が様々な環境で作業を行う場合であっても、共通閾値を使用して、様々な行動を含む観測系列から対象行動系列を判定することができる。

　本開示は、例えば、工場での定型作業、ダンスの振り付け、武道の型などのように決まった順序で動作を行う複数の行動を含む観測系列から容易に対象行動系列を判定することができる。判定された対象行動系列を使用して、工場での定型作業、ダンスの振り付け、武道の型などの分析などを行うことができる。

２０　行動シーケンス判定装置
２１　候補区間決定部
２２　評価値算出部
２３　判定部
５１　ＣＰＵ
５２　一次記憶装置
５３　二次記憶装置

Claims

　人の動作を観測して取得した時系列の複数の観測特徴から、複数の動作で表される行動を各々が複数含む対象行動系列の複数の候補区間を決定する候補区間決定部と、
　前記複数の候補区間の各々を前記行動の時間区間である行動区間ごとに分割し、前記行動区間ごとに算出した複数の前記行動の各々に対応する尤度を前記行動区間ごとに規格化し、前記候補区間における全ての行動区間の各々から前記対象行動系列の行動の順序に基づいて選択される前記行動区間の各々に対応する規格化された尤度の代表値を評価値として算出する評価値算出部と、
　前記評価値が共通閾値を超える場合に前記対象行動系列であると判定する判定部と、
　を含む行動系列判定装置。
　前記尤度は、前記行動区間の各々に含まれる前記観測特徴の観測確率を使用して算出される、
　請求項１に記載の行動系列判定装置。
　前記代表値は、平均値、中央値、及び総乗の何れかである、
　請求項１または請求項２に記載の行動系列判定装置。
　前記複数の候補区間の各々は開始時刻を第１時刻から第２時刻まで変動させ、前記開始時刻の各々について、終了時刻を前記開始時刻より時間的に後の時刻である第３時刻から第４時刻まで変動させることで決定する、
　請求項１～請求項３の何れか１項に記載の行動系列判定装置。
　前記対象行動系列であると判定された候補区間を処理対象行動系列として抽出する、
　請求項１～請求項４の何れか１項に記載の行動系列判定装置。
　コンピュータが、
　人の動作を観測して取得した時系列の複数の観測特徴から、複数の動作で表される行動を各々が複数含む対象行動系列の複数の候補区間を決定し、
　前記複数の候補区間の各々を前記行動の時間区間である行動区間ごとに分割し、前記行動区間ごとに算出した複数の前記行動の各々に対応する尤度を前記行動区間ごとに規格化し、前記候補区間における全ての行動区間の各々から前記対象行動系列の行動の順序に基づいて選択される前記行動区間の各々に対応する規格化された尤度の代表値を評価値として算出し、
　前記評価値が共通閾値を超える場合に前記対象行動系列であると判定する、
　行動系列判定方法。
　前記尤度は、前記行動区間の各々に含まれる前記観測特徴の観測確率を使用して算出される、
　請求項６に記載の行動系列判定方法。
　前記代表値は、平均値、中央値、及び総乗の何れかである、
　請求項６または請求項７に記載の行動系列判定方法。
　前記複数の候補区間の各々は開始時刻を第１時刻から第２時刻まで変動させ、前記開始時刻の各々について、終了時刻を前記開始時刻より時間的に後の時刻である第３時刻から第４時刻まで変動させることで決定する、
　請求項６～請求項８の何れか１項に記載の行動系列判定方法。
　前記対象行動系列であると判定された候補区間を処理対象行動系列として抽出する、
　請求項６～請求項９の何れか１項に記載の行動系列判定方法。
　人の動作を観測して取得した時系列の複数の観測特徴から、複数の動作で表される行動を各々が複数含む対象行動系列の複数の候補区間を決定し、
　前記複数の候補区間の各々を前記行動の時間区間である行動区間ごとに分割し、前記行動区間ごとに算出した複数の前記行動の各々に対応する尤度を前記行動区間ごとに規格化し、前記候補区間における全ての行動区間の各々から前記対象行動系列の行動の順序に基づいて選択される前記行動区間の各々に対応する規格化された尤度の代表値を評価値として算出し、
　前記評価値が共通閾値を超える場合に前記対象行動系列であると判定する、
　処理をコンピュータに実行させる行動系列判定プログラム。
　前記尤度は、前記行動区間の各々に含まれる前記観測特徴の観測確率を使用して算出される、
　請求項１１に記載の行動系列判定プログラム。
　前記代表値は、平均値、中央値、及び総乗の何れかである、
　請求項１１または請求項１２に記載の行動系列判定プログラム。
　前記複数の候補区間の各々は開始時刻を第１時刻から第２時刻まで変動させ、前記開始時刻の各々について、終了時刻を前記開始時刻より時間的に後の時刻である第３時刻から第４時刻まで変動させることで決定する、
　請求項１１～請求項１３の何れか１項に記載の行動系列判定プログラム。
　前記対象行動系列であると判定された候補区間を処理対象行動系列として抽出する、
　請求項１１～請求項１４の何れか１項に記載の行動系列判定プログラム。