JP2019185420A - 行動推定装置 - Google Patents

行動推定装置 Download PDF

Info

Publication number
JP2019185420A
JP2019185420A JP2018076045A JP2018076045A JP2019185420A JP 2019185420 A JP2019185420 A JP 2019185420A JP 2018076045 A JP2018076045 A JP 2018076045A JP 2018076045 A JP2018076045 A JP 2018076045A JP 2019185420 A JP2019185420 A JP 2019185420A
Authority
JP
Japan
Prior art keywords
joints
time
objects
coordinates
target
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP2018076045A
Other languages
English (en)
Other versions
JP6525179B1 (ja
Inventor
木村 大介
Daisuke Kimura
大介 木村
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
AJIRA CO Ltd
Original Assignee
AJIRA CO Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by AJIRA CO Ltd filed Critical AJIRA CO Ltd
Priority to JP2018076045A priority Critical patent/JP6525179B1/ja
Priority to PCT/JP2019/015402 priority patent/WO2019198696A1/ja
Priority to US17/045,536 priority patent/US11482046B2/en
Application granted granted Critical
Publication of JP6525179B1 publication Critical patent/JP6525179B1/ja
Publication of JP2019185420A publication Critical patent/JP2019185420A/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Landscapes

  • Image Analysis (AREA)

Abstract

【課題】 複数の時系列画像に映った対象の行動を高精度に推定することが可能な行動推定装置を提供する。【解決手段】 行動推定装置1において、推定側検出部13は、推定側識別器11に記憶された複数の関節Aを識別するための基準に基づき、各時系列画像Yに映った複数の関節Aを検出する。推定側計側部14は、各時系列画像Yに映った複数の関節Aの座標及び深度を計測する。識別部15は、計測された各関節Aの座標及び深度の複数の時系列画像Yにおける変位に基づき、複数の関節Aの中から、一の対象に属する関節群Bを識別する。推定部16は、関節群Bの全体としての座標及び深度の複数の時系列画像Yにおける変位に基づき、一の対象Zの行動を推定する。【選択図】図5

Description

本発明は、複数の時系列画像に映った対象の行動を推定するための行動推定装置に関する。
従来より、時系列データに映った人間の関節等から姿勢を検知し、当該姿勢の変化に応じて行動を認識する装置が知られている。(例えば、特許文献1参照)。
特開2017−228100号公報
しかしながら、上記特許文献1では、姿勢を検知する方法として一般的なものしか開示されておらず、より精度の高い姿勢検知、及び、行動認識が望まれている。
そこで、本発明は、複数の時系列画像に映った対象の行動を高精度に推定することが可能な行動推定装置を提供することを目的としている。
本発明は、一又は複数の対象が映った複数の時系列画像を取得する推定側取得部と、対象の複数の関節を識別するための基準を記憶した識別器と、前記複数の関節を識別するための基準に基づき、各時系列画像に映った複数の関節を検出する推定側検出部と、各時系列画像に映った前記複数の関節の座標及び深度を計測する推定側計測部と、前記計測された各関節の座標及び深度の前記複数の時系列画像における変位に基づき、前記複数の関節の中から、一の対象に属する関節群を識別する識別部と、前記関節群の全体としての座標及び深度の前記複数の時系列画像における変位に基づき、前記一の対象の行動を推定する推定部と、を備えたことを特徴とする行動推定装置を提供している。
このような構成によれば、関節群の全体としての座標及び深度の複数の時系列画像における変位に基づき対象の行動を推定するので、各関節の時系列な変位を個別に追うだけでは実現することができない高精度な行動推定を実現することが可能となる。また、各関節の変位の全てを考慮する必要がないので、CPUへの負荷を大幅に軽減させることが可能となる。また、行動推定装置、学習装置、及び、撮影手段を準備するだけで、対象側にセンサを装着させる必要や、行動推定装置側に高価で特殊なセンサを備える必要がないので、より簡易かつ安価に行動推定を行うことが可能となる。また、アノテーション技術を駆使して、同一の画像から多くのトレーニングデータを生成することができるので、より安価かつ高精度の行動推定を行うことが可能となる。
また、前記関節群の全体としての座標及び深度の変位は、前記関節群の重心の座標及び深度の変位を含むことが好ましい。
このような構成によれば、体の動きと密接に関連した重心の座標及び深度の変位を用いることで、正確に行動を推定することが可能となる。
また、前記関節群の全体としての座標及び深度の変位に基づき、前記複数の時系列画像に続く前記一の対象の行動を予測する予測部を更に備えたことが好ましい
このような構成によれば、対象が転倒防止機構を装着しているような場合には、転倒防止機構に転倒防止のための作動を瞬時に指示することが可能となる。
また、前記識別器は、対象の基本姿勢に関する基準を更に記憶しており、前記識別部は、前記基本姿勢に関する基準に基づき、各時系列画像に映った対象の数の推定を行い、前記推定された対象の数と、前記検出された複数の関節の種類ごとの個数と、に基づき、各時系列画像に映った対象の数の特定を行うことが好ましい。
このような構成によれば、時系列画像に映った対象の数を正確に特定することが可能となる。
また、前記識別器は、対象の複数の関節の可動域及び各関節間の距離に関する基準を更に記憶しており、前記識別部は、前記対象の数の特定に当たり、前記数が推定された対象を、メイン対象と、それ以外のサブ対象と、に分類し、前記複数の関節の可動域及び各関節間の距離に関する基準を考慮して、前記サブ対象を前記いずれかのメイン対象に連結し、前記識別部は、前記検出された関節の数が多い順に前記特定された数だけ、前記メイン対象に分類することが好ましい。
このような構成によれば、時系列画像に映った対象の数をより正確に特定することが可能となる。
また、前記識別器は、対象の複数の関節の可動域に関する基準を更に記憶しており、前記識別部は、前記対象の数の特定に当たり、前記推定された数の対象を、メイン対象と、それ以外のサブ対象と、に分類し、前記複数の関節の可動域に関する基準を考慮して、前記サブ対象を前記いずれかのメイン対象に連結し、前記識別部は、前記基本姿勢に関する基準に該当するものを前記メイン対象に分類することが好ましい。
このような構成によれば、時系列画像に映った対象の数をより正確に特定することが可能となる。
また、本発明の別の観点によれば、対象の複数の関節を識別するための基準が記憶されたコンピュータにインストールされるプログラムであって、一又は複数の対象が映った複数の時系列画像を取得するステップと、前記複数の関節を識別するための基準に基づき、各時系列画像に映った複数の関節を検出するステップと、各時系列画像に映った前記複数の関節の座標及び深度を計測するステップと、前記計測された各関節の座標及び深度の前記複数の時系列画像における変位に基づき、前記複数の関節の中から、一の対象に属する関節群を識別するステップと、前記関節群の全体としての座標及び深度の前記複数の時系列画像における変位に基づき、前記一の対象の行動を推定するステップと、を備えたことを特徴とする行動推定プログラムを提供している。
また、前記関節群の全体としての座標及び深度の変位は、前記関節群の重心の座標及び深度を含むことが好ましい。
また、前記関節群の全体としての座標及び深度の変位に基づき、前記複数の時系列画像に続く前記一の対象の行動を予測するステップを更に備えたことが好ましい。
また、前記コンピュータは、対象の基本姿勢に関する基準を更に記憶しており、前記識別するステップでは、前記基本姿勢に関する基準に基づき、各時系列画像に映った対象の数の推定を行い、前記推定された対象の数と、前記検出された複数の関節の種類ごとの個数と、に基づき、各時系列画像に映った対象の数の特定を行うことが好ましい。
また、前記コンピュータは、対象の複数の関節の可動域及び各関節間の距離に関する基準を更に記憶しており、前記識別するステップでは、前記対象の数の特定に当たり、前記数が推定された対象を、メイン対象と、それ以外のサブ対象と、に分類し、前記複数の関節の可動域及び各関節間の距離に関する基準を考慮して、前記サブ対象を前記いずれかのメイン対象に連結し、前記識別するステップでは、前記検出された関節の数が多い順に前記特定された数だけ、前記メイン対象に分類することが好ましい。
また、前記コンピュータは、対象の複数の関節の可動域に関する基準を更に記憶しており、前記識別するステップでは、前記対象の数の特定に当たり、前記推定された数の対象を、メイン対象と、それ以外のサブ対象と、に分類し、前記複数の関節の可動域に関する基準を考慮して、前記サブ対象を前記いずれかのメイン対象に連結し、前記識別するステップでは、前記基本姿勢に関する基準に該当するものを前記メイン対象に分類することが好ましい。
また、本発明の別の観点によれば、一又は複数の対象が映った複数の時系列画像を取得する学習側取得部と、対象の複数の関節を識別するための基準を記憶した識別器と、前記複数の関節を識別するための基準に基づき、各時系列画像に映った複数の関節を検出する学習側検出部と、前記検出された各関節に対して入力された正解行動を取得する正解行動取得部と、各時系列画像に映った前記複数の関節の座標及び深度を計測する学習側計測部と、各対象に属する複数の関節の全体としての座標及び深度の前記複数の時系列画像Yにおける変位を学習する第1の学習部と、前記第1の学習部で学習された各対象に属する複数の関節の全体としての座標及び深度の前記複数の時系列画像における変位を、前記正解行動取得部により取得された正解行動と対応付けて学習する第2の学習部と、を備えたことを特徴とする学習装置を提供している。
このような構成によれば、行動推定装置に対し、高精度な行動推定を実現するための情報を提供することが可能となる。
前記関節群の全体としての座標及び深度の変位は、前記関節群の重心の座標及び深度の変位を含むことが好ましい。
このような構成によれば、行動推定装置に対し、より高精度な行動推定を実現するための情報を提供することが可能となる。
また、本発明の別の観点によれば、対象の複数の関節を識別するための基準が記憶されたコンピュータにインストールされるプログラムであって、一又は複数の対象が映った複数の時系列画像を取得するステップと、前記複数の関節を識別するための基準に基づき、各時系列画像に映った複数の関節を検出するステップと、前記検出された各関節に対して入力された正解行動を取得するステップと、各時系列画像に映った前記複数の関節の座標及び深度を計測するステップと、各対象に属する複数の関節の全体としての座標及び深度の前記複数の時系列画像Yにおける変位を学習するステップと、前記第1の学習部で学習された各対象に属する複数の関節の全体としての座標及び深度の前記複数の時系列画像における変位を、前記正解行動取得部により取得された正解行動と対応付けて学習するステップと、を備えたことを特徴とする学習プログラムを提供している。
また、前記関節群の全体としての座標及び深度の変位は、前記関節群の重心の座標及び深度であることが好ましい。
本発明の行動推定装置によれば、複数の時系列画像に映った対象の行動を高精度に推定することが可能となる。
本発明の実施の形態による行動推定装置の使用状態の説明図 本発明の実施の形態による学習装置及び行動推定装置のブロック図 本発明の実施の形態による関節群の説明図 本発明の実施の形態による対象数識別の説明図 本発明の実施の形態による行動推定装置による行動推定のフローチャート 本発明の実施の形態による対象数識別のフローチャート 本発明の実施の形態による行動学習のフローチャート
以下、本発明の実施の形態による行動推定装置1について、図1−図7を参照して説明する。
行動推定装置1は、図1に示すように、撮影手段Xによって撮影された複数の時系列画像Y(動画を構成する各フレーム等)に映った一又は複数の対象Zの行動を推定するためのものである(本実施の形態では、理解容易のため、対象Zを骨格だけで簡易的に表示している)。行動の推定に当たっては、学習装置2(図2参照)によって学習された情報を参照する。
まず、学習装置2の構成について説明する。
学習装置2は、図2に示すように、学習側識別器21と、学習側取得部22と、学習側検出部23と、正解行動取得部24と、学習側計側部25と、第1の学習部26と、第2の学習部27と、を備えている。
学習側識別器21は、対象Zの複数の関節A(本実施の形態では、首、右肘、左肘、腰、右膝、左膝)を識別するためのものであり、関節Aごとに、それぞれを識別するための形状、方向、サイズ等の基準が記憶されている。また、学習側識別器21には、対象Zの様々なバリエーション(“歩行”、“直立”等)の “基本姿勢 “、”各関節Aの可動域“、一の対象Zにおける”各関節A間の距離“に関する基準も記憶されている。
学習側取得部22は、正解行動が既知の映像、すなわち、複数の時系列画像Yを取得する。この複数の時系列画像Yは、行動推定装置1のユーザにより入力される。
学習側検出部23は、各時系列画像Yに映った複数の関節Aを検出する。具体的には、CNN(Convolution Neural Network)を用いてモデリングされた推論モデルにより、学習側識別器21が示す基準に該当する部位を検出する。検出された各関節A(図1では、A1−A17)は、表示部(図示せず)上に、選択可能に表示される。
正解行動取得部24は、複数の時系列画像Yに映った対象Zの対応する正解行動を、学習側検出部23により検出された各関節Aについて取得する。この正解行動は、行動推定装置1のユーザにより入力される。具体的には、ユーザは、学習側取得部22において対象Zが転倒した際の複数の時系列画像Yを入力した場合には、正解行動取得部24には、表示部上で各関節Aを選択し、正解行動“転倒”を入力することとなる。
また、本実施の形態では、時系列画像Yに複数の対象Zが映っている場合には、各対象Zに対して正解行動を入力する。この場合、同一の対象Zに含まれる関節Aを特定した上で、各関節Aに対して正解行動を入力する。例えば、図1の対象Z1に関しては、関節A1−A6を特定した上で、それぞれに対し、正解行動“歩行”を入力する。また、図1の対象Z2に関しては、関節A7−A11を特定した上で、正解行動“転倒”を入力する。また、図1の対象Z3に関しては、関節A12−A17を特定した上で、正解行動“しゃがむ”を入力する。更に、対象Z3に関しては、しゃがんでいるだけでなく、バランスも崩しているので、”各関節A12−A17に対し、正解行動“バランスを崩す”を更に入力する。
学習側計側部25は、学習側検出部23により検出された複数の関節Aの座標及び深度を計測する。この計測は、各時系列画像Yに対して行われる。
例えば、時刻t1の時系列画像Yにおける関節A1の座標及び深度は、(XA1(t1)、YA1(t1)、ZA1(t1))のように表すことができる。なお、深度に関しては、必ずしも座標で表す必要はなく、複数の時系列画像Yにおける相対的な深度で表してもよい。なお、深度は、既知の方法により測定してもよいが、正解行動取得部24において各関節Aの深度を入力しておき、その入力された深度をそのまま用いてもよい。本発明の“学習側計側部による深度の計測”には、このように、入力された深度を用いる場合も含まれる。この場合には、後述する第1の学習部26は、例えば、「この関節のサイズ、角度等であれば、○○mの距離である」と学習していくことになる。
第1の学習部26は、各対象Zに属する複数の関節Aの全体としての座標及び深度の複数の時系列画像Yにおける変位を学習する。具体的には、正解行動取得部24において特定された各対象Zに属する複数の関節Aを関節群B(図3参照)と識別した上で、当該関節群B全体としての座標及び深度の複数の時系列画像Yにおける変位を学習する。
関節群Bの全体としての座標及び深度の変位としては、検出された全ての関節Aの座標の中心点の座標及び深度の変位や、体の動きと密接に関連した重心の座標及び深度の変位を用いることが考えられる。また、これらの両方を用いたり、これらに加えて各関節Aの座標及び深度の変位も考慮して、より精度を高めてもよい。なお、重心の座標及び深度は、各関節Aの座標及び深度と、各関節A(筋肉、脂肪等を含む)の重量と、を考慮して算出することが考えられる。この場合、各関節Aの重量は、学習側識別器21等に記憶させておけばよい。
第2の学習部27は、第1の学習部26で学習された関節群Bの全体としての座標及び深度の複数の時系列画像Yにおける変位を、正解行動取得部24で入力された正解行動と対応付けて学習する。例えば、正解行動“前方への転倒”の場合、関節群Bの全体としての座標の変位は、“第1の距離だけ下方へ進む”、関節群Bの全体としての深度の変位は、“第2の距離だけ前方へ進む”というように学習することになる。
続いて、行動推定装置1の構成について説明する。
行動推定装置1は、図2に示すように、推定側識別器11と、推定側取得部12と、推定側検出部13と、推定側計側部14と、識別部15と、推定部16と、を備えている。
推定側識別器11は、対象Zの複数の関節A(肘、肩、腰、膝等)を識別するためのものであり、関節Aごとに、それぞれを識別するための形状、方向、サイズ等の基準が記憶されている。また、学習側識別器21には、対象Zの様々なバリエーション(“歩行”、“直立”等)の“基本姿勢 “、”各関節Aの可動域“、一の対象Zにおける”各関節A間の距離“に関する基準も設けられている。本実施の形態では、学習側識別器21と同一のものを用いるものとする。
推定側取得部12は、撮影手段Xに接続されており、撮影手段Xにより撮影された映像、すなわち、複数の時系列画像Yを取得する。本実施の形態では、複数の時系列画像Yをリアルタイムで取得するものとするが、行動推定装置1の使用目的によっては、後から取得するようにしてもよい。
推定側検出部13は、各時系列画像Yに映った複数の関節Aを検出する。具体的には、CNN(Convolution Neural Network)を用いてモデリングされた推論モデルにより、推定側識別器11に記憶された関節Aを識別するための基準に該当する部位を検出する。推定側検出部13が関節Aを検出した場合には、時系列画像Yに一又は複数の対象Zが映っていると考えることができる。
推定側計側部14は、推定側検出部13により検出された複数の関節Aの座標及び深度を計測する。この計測は、各時系列画像Yに対して行われる。
例えば、時刻t1の時系列画像Yにおける関節A1の座標及び深度は、(XA1(t1)、YA1(t1)、ZA1(t1))のように表すことができる。なお、深度に関しては、必ずしも座標で表す必要はなく、複数の時系列画像Yにおける相対的な深度で表してもよい。なお、深度は、既知の方法により測定してもよいが、第1の学習部26によって深度の学習が行われている場合には、第1の学習部26を参照して深度を特定してもよい。本発明の“推定側計側部による深度の計測”には、このように、第1の学習部26で学習された深度を用いる場合も含まれる。
識別部15は、第1の学習部26を参照して、推定側計側部14により計測された各関節Aの座標及び深度の複数の時系列画像Yにおける変位に基づき、複数の関節Aの中から、各対象Zに属する関節群Bを識別する。図1及び図3では、関節A1−A6が対象Z1に属する関節群B1であり、関節A7−A11が対象Z2に属する関節群B2であり、関節A12−A17が対象Z3に属する関節群B3であると識別することになる。
ここで、本実施の形態では、各対象Zに属する複数の関節群A(関節群B)の識別に当たり、まず、対象Zの数の特定を行う。対象Zの数の特定に当たっては、推定側識別器11に記憶された“基本姿勢”に関する基準に基づき、(1)対象Zの数の推定を行い、続いて、複数の関節Aの種類ごとの個数に基づき、(2)対象Zの数の特定を行う。
(1)対象Zの数の推定
対象Zの数の推定では、推定側識別器11に記憶された“基本姿勢”に関する基準に該当する複数の関節Aを推定する。図1の例では、推定側検出部13により、関節A1−A17が検出されることになるが、このうち、関節A1−A6、及び、関節A7−11に関しては、“基本姿勢”に含まれる関節Aであると判断され、2つの対象Zが存在すると推定される。また、関節A12−14に関しては、“基本姿勢”の一部であると判断され、1つの対象Zが存在すると推定される。
一方、イレギュラーな位置にある関節A15−17に関しては、“基本姿勢”の一部であるとは判断されず、それぞれが個別の対象Zと推定されることになる。
従って、この場合、図4に示すように、“関節A1−A6”、“関節A7−11”、“A12−A14”、“関節A15”、“関節A16”、“関節A17”の合計6つの対象Z1’−Z6’が存在するものと推定されることになる。
(2)対象Zの数の特定
続いて、推定された対象Zの数と、複数の関節Aの種類ごとの個数と、に基づき、対象Zの数の特定を行う。
例えば、図4では、対象Z1’には、6つの関節A(“頭”、“右肘”、“左肘”、“腰”、“右膝”、“左膝”)が、対象Z2’には、5つの関節A(“頭”、“右肘”、“左肘”、“腰”、“左膝”)が、対象Z3’には、3つの関節A(“頭”、“右肘”、“左肘”)が、対象Z4’には、1つの関節A(“腰”)が、対象Z5’には、1つの関節A(“右膝”)が、対象Z6’には、1つの関節A(“左膝”)が含まれている。
この場合、それぞれ3つずつ存在する“頭”、“右肘”、“左肘”、“腰”、“左膝”の関節Aが最も多く存在する種類の関節Aとなるので、最終的には、全部で3つの対象Zが存在すると特定されることになる。
(3)各対象Zに属する複数の関節群A(関節群B)の識別
各対象Zに属する複数の関節群A(関節群B)の識別では、(A)対象Z’の“メイン対象”と“サブ対象”への分類、(B)“サブ対象”の“メイン対象”への連結、を行う。
(A)対象Z’の“メイン対象”と“サブ対象”への分類
ここでは、まず、対象Z1’−Z6’を、“メイン対象”と“サブ対象”に分類する。
図4に示す例では、「(2)対象Zの数の特定」において、全部で3つの対象Zが存在すると特定されているので、検出された関節Aの数が多い順に3つの対象Z1’、Z2’、Z3’を“メイン対象”、その他の対象Z4’、Z5’、Z6’を“サブ対象”に分類する。
(B)“サブ対象”の“メイン対象”への連結
続いて、推定側識別器11に記憶された“各関節Aの可動域”及び”各関節A間の距離“に関する基準を考慮して、“サブ対象”Z4’、Z5’、Z6’を、いずれかの“メイン対象”Z1’、Z2’、Z3’に連結可能がどうかを判断する。
図4では、“サブ対象”Z4’(“腰”)、Z5(“右膝”)’、Z6’(“左膝”)は、“メイン対象”Z3’と連結した場合に、“各関節Aの可動域”及び“各関節A間の距離”に不自然なところがないため、“メイン対象”Z3’に連結可能と判断され、これらを連結し、各対象Z1−Z3に属する複数の関節A(関節群B)を決定することになる。
なお、図1に示すように、対象Z2に関しては、対象Z3に隠れて、“右膝”のデータが欠損していることになるが、識別部15は、推定側識別器11に記憶された“基本姿勢”、“各関節Aの可動域”、“各関節A間の距離”に関する基準を考慮して、その他の関節A7−A11の位置から推定される位置に“右膝”が存在するものとして座標を与え、前後の時系列画像Yで“左膝”を検出した場合に連続動作として扱うことになる。
図2に戻り、推定部16は、第2の学習部27を参照して、識別部15で識別された関節群Bの全体としての座標及び深度の複数の時系列画像Yにおける変位に基づき、対象Zの行動を推定する。具体的には、第2の学習部27を参照して、様々な行動の選択肢(「転倒」、「歩行」、「走行」、「投球」等)の中から、確率の高い一又は複数の行動が選択されることになる。すなわち、行動推定装置1では、各対象Zの関節群B全体としての座標及び深度を、LSTM(Long Short Term Memory)を用いた時系列の推論モデルにインプットし、「walking」「standing」といった行動識別ラベルをアウトプットすることになる。
ここで、対象Zの行動というものは、各関節Aの時系列な変位によってある程度は推定できるが、各関節Aの時系列な変位を個別に追うだけでは、高精度に行動を推定することは難しい。そこで、本実施の形態では、一の対象Zに属する関節群Bの全体としての座標及び深度の複数の時系列画像Yにおける変位に基づき、対象Zの行動を推定することで、高精度な行動推定を実現している。
続いて、図5及び図6のフローチャートを用いて、行動推定装置1による“各対象Zに属する関節群Bの識別”及び“各対象Zの行動の推定”について説明する。
まず、推定側取得部12が複数の時系列画像Yを取得すると(S1)、推定側検出部13により、各時系列画像Yに映った複数の関節Aが検出される(S2)。
続いて、推定側計側部14により、S2で検出された複数の関節Aの座標及び深度が計測される(S3)。この計測は、各時系列画像Yに対して行われる。
続いて、識別部15により、S3で計測された各関節Aの座標及び深度の複数の時系列画像Yにおける変位に基づき、複数の関節Aの中から、各対象Zに属する関節群Bが識別される(S4)。
この“各対象Zに属する関節群Bの識別”に関しては、図6のフローチャートに示すように、まず、学習側識別器21に記憶された“基本姿勢”に関する基準に基づき、対象Zの数の推定を行う(S41)。
図4に示す例では、“関節A1−A6”、“関節A7−11”、“A12−A14”、“関節A15”、“関節A16”、“関節A17”の合計6つの対象Z1’−Z6’が存在すると推定されることになる。
続いて、複数の関節Aの種類ごとの個数に基づき、対象Zの数の特定を行う(S42)。
図4に示す例では、それぞれ3つずつ存在する“頭”、“右肘”、“左肘”、“腰”、“左膝”の関節Aが最も多く存在する種類の関節Aとなるので、全部で3つの対象Zが存在すると特定されることになる。
続いて、対象Z1’−Z6’を、“メイン対象”と“サブ対象”に分類する(S43)。
図4に示す例では、含まれる関節Aの数が多い上位3つの対象Z1’、Z2’、Z3’を“メイン対象”、その他の対象Z4’、Z5’、Z6’を“サブ対象”に分類する。
続いて、推定側識別器11に記憶された“各関節Aの可動域”に関する基準を考慮して、“サブ対象”Z4’、Z5’、Z6’を、いずれかの“メイン対象”Z1’、Z2’、Z3’に連結可能がどうかを判断する(S44)。
連結可能と判断された場合には(S44:YES)、これらを連結し(S45)、各対象Zに属する複数の関節A(関節群B)を決定することになる(S46)。
図4に示す例では、サブ対象Z4’(“腰”)、Z5(“右膝”)’、Z6’(“左膝”)は、全て、メイン対象Z3’に連結可能と判断され、連結されることになる。
そして、図5に戻り、最後に、推定部16により、S4で識別された関節群Bの全体としての座標及び深度の複数の時系列画像Yにおける変位に基づき、対象Zの行動を推定する(S5)。
このような構成を有する行動推定装置1は、例えば、介護施設において、被介護者がいる室内を常時撮影し、撮影された映像に基づき被介護者(対象Z)が転倒したこと等を推定した場合に、その旨を介護者へ報知する等の用途で用いることができる。
なお、上記した行動推定装置1による“各対象Zの行動の推定”には、学習装置2による“各対象Zの行動の学習”が前提となるので、図7のフローチャートを用いて、学習装置2による“各対象Zの行動の学習”について説明する。
まず、学習側取得部22が複数の時系列画像Yを取得すると(S21)、学習側検出部23により、各時系列画像Yに映った複数の関節Aが検出される(S22)。
続いて、正解行動取得部24により、学習側検出部23により検出された各関節Aに対して正解行動が取得されると(S23)、学習側計側部25により、S22で検出された複数の関節Aの座標及び深度が計測される(S24)。この計測は、各時系列画像Yに対して行われる。
続いて、第1の学習部26により、各対象Zに属する複数の関節Aの全体としての座標及び深度の複数の時系列画像Yにおける変位が学習される(S25)。
そして、最後に、第2の学習部27により、第1の学習部26で学習された関節群Bの全体としての座標及び深度の複数の時系列画像Yにおける変位を、正解行動取得部24で入力された正解行動と対応付けて学習する(S26)。
以上説明したように、本実施の形態による行動推定装置1では、複数の関節A(関節群B)の全体としての座標及び深度の複数の時系列画像Yにおける変位に基づき、対象Zの行動を推定する。
このような構成によれば、関節群Bの全体としての座標及び深度の複数の時系列画像Yにおける変位に基づき対象Zの行動を推定するので、各関節Aの時系列な変位を個別に追うだけでは実現することができない高精度な行動推定を実現することが可能となる。また、各関節Aの変位の全てを考慮する必要がないので、CPUへの負荷を大幅に軽減させることが可能となる。また、行動推定装置1、学習装置2、及び、撮影手段Xを準備するだけで、対象Z側にセンサを装着させる必要や、行動推定装置1側に高価で特殊なセンサを備える必要がないので、より簡易かつ安価に行動推定を行うことが可能となる。また、アノテーション技術を駆使して、同一の画像から多くのトレーニングデータを生成することができるので、より安価かつ高精度の行動推定を行うことが可能となる。
また、本実施の形態による行動推定装置1では、関節群Bの全体としての座標及び深度の変位は、関節群Bの重心の座標及び深度の変位を含んでいる。
このような構成によれば、体の動きと密接に関連した重心の座標及び深度の変位を用いることで、正確に行動を推定することが可能となる。
また、本実施の形態による行動推定装置1では、“基本姿勢”に関する基準に基づき、各時系列画像Yに映った対象Zの数の推定を行い、推定された対象Zの数と、検出された複数の関節Aの種類ごとの個数と、に基づき、時系列画像Yに映った対象Zの数の特定を行う。
このような構成によれば、時系列画像Yに映った対象Zの数を正確に特定することが可能となる。
また、本実施の形態による行動推定装置1では、対象Zの数の特定に当たり、数が推定された対象Z’を、“メイン対象”と、それ以外の“サブ対象”と、に分類し、“複数の関節Aの可動域” 及び”各関節A間の距離“に関する基準を考慮して、サブ対象を前記いずれかのメイン対象に連結し、その際、検出された関節Aの数が多い順に、特定された数だけ、“メイン対象”に分類する。
このような構成によれば、時系列画像Yに映った対象Zの数をより正確に特定することが可能となる。
また、本実施の形態による学習装置2では、複数の関節A(関節群B)の全体としての座標及び深度の複数の時系列画像Yにおける変位を、正解行動と対応付けて学習する。
このような構成によれば、行動推定装置1に対し、高精度な行動推定を実現するための情報を提供することが可能となる。
また、本実施の形態による学習装置2では、関節群Bの全体としての座標及び深度の変位は、関節群Bの重心の座標及び深度の変位である。
このような構成によれば、行動推定装置1に対し、より高精度な行動推定を実現するための情報を提供することが可能となる。
尚、本発明の行動推定装置は、上述した実施の形態に限定されず、特許請求の範囲に記載した範囲で種々の変形や改良が可能である。
例えば、上記実施の形態では、対象Zの行動推定に当たり、関節群Bの座標及び深度の複数の時系列画像Yにおける変位を考慮したが、各関節Aの複数の時系列画像Yにおける変位を更に考慮してもよい。
また、上記実施の形態では、深度をZ(t)の座標で表したが、深度に関しては、必ずしも座標で表す必要はなく、複数の時系列画像Yにおける相対的な深度で表してもよい。
また、上記実施の形態では、複数の時系列画像Yにおける対象Zの行動を推定したが、複数の時系列画像Yの後に起こるであろう行動を予測してもよい。例えば、対象Zの体が倒れる動作を学習装置2に学習させておき、行動推定装置1において、複数の時系列画像Yが倒れる動作の前半部分であった場合、複数の時系列画像Yの後に転倒するものと予測することができる。従って、対象Zが転倒防止機構を装着しているような場合には、転倒防止機構に転倒防止のための作動を瞬時に指示することが可能となる。
また、上記実施の形態では、対象Zの数の特定において、検出された関節Aの数が多い順に、特定された数(3つ)だけ、“メイン対象”に分類したが、“基本姿勢”又は“基本姿勢”の一部であると判断された関節Aを含む対象Z’を“メイン対象”に分類する方法も考えられる。
また、上記実施の形態では、対象Zとして人間を例に説明したが、動物やロボットの行動を推定するために使用することも可能である。また、上記実施の形態では、複数の関節Aとして、首、右肘、左肘、腰、右膝、左膝を例に説明を行ったが、その他の関節や、より多くの関節Aを用いてもよいことは言うまでもない。
また、本発明は、行動推定装置1及び学習装置2が行う処理に相当するプログラムや、当該プログラムを記憶した記録媒体にも応用可能である。記録媒体の場合、コンピュータ等に当該プログラムがインストールされることとなる。ここで、当該プログラムを記憶した記録媒体は、非一過性の記録媒体であっても良い。非一過性の記録媒体としては、CD−ROM等が考えられるが、それに限定されるものではない。
1 行動推定装置
2 学習装置
11 推定側識別器
12 推定側取得部
13 推定側検出部
14 推定側計側部
15 識別部
16 推定部
21 学習側識別器
22 学習側取得部
23 学習側検出部
24 正解行動取得部
25 学習側計側部
26 第1の学習部
27 第2の学習部
A 関節
B 関節群
X 撮影手段
Y 時系列画像
Z 対象

Claims (16)

  1. 一又は複数の対象が映った複数の時系列画像を取得する推定側取得部と、
    対象の複数の関節を識別するための基準を記憶した識別器と、
    前記複数の関節を識別するための基準に基づき、各時系列画像に映った複数の関節を検出する推定側検出部と、
    各時系列画像に映った前記複数の関節の座標及び深度を計測する推定側計測部と、
    前記計測された各関節の座標及び深度の前記複数の時系列画像における変位に基づき、前記複数の関節の中から、一の対象に属する関節群を識別する識別部と、
    前記関節群の全体としての座標及び深度の前記複数の時系列画像における変位に基づき、前記一の対象の行動を推定する推定部と、
    を備えたことを特徴とする行動推定装置。
  2. 前記関節群の全体としての座標及び深度の変位は、前記関節群の重心の座標及び深度の変位を含むことを特徴とする請求項1に記載の行動推定装置。
  3. 前記関節群の全体としての座標及び深度の変位に基づき、前記複数の時系列画像に続く前記一の対象の行動を予測する予測部を更に備えたことを特徴とする請求項1又は2に記載の行動推定装置。
  4. 前記識別器は、対象の基本姿勢に関する基準を更に記憶しており、
    前記識別部は、前記基本姿勢に関する基準に基づき、各時系列画像に映った対象の数の推定を行い、前記推定された対象の数と、前記検出された複数の関節の種類ごとの個数と、に基づき、各時系列画像に映った対象の数の特定を行うことを特徴とする請求項1から3のいずれか一項に記載の行動推定装置。
  5. 前記識別器は、対象の複数の関節の可動域及び各関節間の距離に関する基準を更に記憶しており、
    前記識別部は、前記対象の数の特定に当たり、前記数が推定された対象を、メイン対象と、それ以外のサブ対象と、に分類し、前記複数の関節の可動域及び各関節間の距離に関する基準を考慮して、前記サブ対象を前記いずれかのメイン対象に連結し、
    前記識別部は、前記検出された関節の数が多い順に前記特定された数だけ、前記メイン対象に分類することを特徴とする請求項4に記載の行動推定装置。
  6. 前記識別器は、対象の複数の関節の可動域に関する基準を更に記憶しており、
    前記識別部は、前記対象の数の特定に当たり、前記推定された数の対象を、メイン対象と、それ以外のサブ対象と、に分類し、前記複数の関節の可動域に関する基準を考慮して、前記サブ対象を前記いずれかのメイン対象に連結し、
    前記識別部は、前記基本姿勢に関する基準に該当するものを前記メイン対象に分類することを特徴とする請求項4に記載の行動推定装置。
  7. 対象の複数の関節を識別するための基準が記憶されたコンピュータにインストールされるプログラムであって、
    一又は複数の対象が映った複数の時系列画像を取得するステップと、
    前記複数の関節を識別するための基準に基づき、各時系列画像に映った複数の関節を検出するステップと、
    各時系列画像に映った前記複数の関節の座標及び深度を計測するステップと、
    前記計測された各関節の座標及び深度の前記複数の時系列画像における変位に基づき、前記複数の関節の中から、一の対象に属する関節群を識別するステップと、
    前記関節群の全体としての座標及び深度の前記複数の時系列画像における変位に基づき、前記一の対象の行動を推定するステップと、
    を備えたことを特徴とする行動推定プログラム。
  8. 前記関節群の全体としての座標及び深度の変位は、前記関節群の重心の座標及び深度を含むことを特徴とする請求項7に記載の行動推定プログラム。
  9. 前記関節群の全体としての座標及び深度の変位に基づき、前記複数の時系列画像に続く前記一の対象の行動を予測するステップを更に備えたことを特徴とする請求項7又は8に記載の行動推定プログラム。
  10. 前記コンピュータは、対象の基本姿勢に関する基準を更に記憶しており、
    前記識別するステップでは、前記基本姿勢に関する基準に基づき、各時系列画像に映った対象の数の推定を行い、前記推定された対象の数と、前記検出された複数の関節の種類ごとの個数と、に基づき、各時系列画像に映った対象の数の特定を行うことを特徴とする請求項7から9のいずれか一項に記載の行動推定プログラム。
  11. 前記コンピュータは、対象の複数の関節の可動域及び各関節間の距離に関する基準を更に記憶しており、
    前記識別するステップでは、前記対象の数の特定に当たり、前記数が推定された対象を、メイン対象と、それ以外のサブ対象と、に分類し、前記複数の関節の可動域及び各関節間の距離に関する基準を考慮して、前記サブ対象を前記いずれかのメイン対象に連結し、
    前記識別するステップでは、前記検出された関節の数が多い順に前記特定された数だけ、前記メイン対象に分類することを特徴とする請求項10に記載の行動推定プログラム。
  12. 前記コンピュータは、対象の複数の関節の可動域に関する基準を更に記憶しており、
    前記識別するステップでは、前記対象の数の特定に当たり、前記推定された数の対象を、メイン対象と、それ以外のサブ対象と、に分類し、前記複数の関節の可動域に関する基準を考慮して、前記サブ対象を前記いずれかのメイン対象に連結し、
    前記識別するステップでは、前記基本姿勢に関する基準に該当するものを前記メイン対象に分類することを特徴とする請求項10に記載の行動推定プログラム。
  13. 一又は複数の対象が映った複数の時系列画像を取得する学習側取得部と、
    対象の複数の関節を識別するための基準を記憶した識別器と、
    前記複数の関節を識別するための基準に基づき、各時系列画像に映った複数の関節を検出する学習側検出部と、
    前記検出された各関節に対して入力された正解行動を取得する正解行動取得部と、
    各時系列画像に映った前記複数の関節の座標及び深度を計測する学習側計測部と、
    各対象に属する複数の関節の全体としての座標及び深度の前記複数の時系列画像Yにおける変位を学習する第1の学習部と、
    前記第1の学習部で学習された各対象に属する複数の関節の全体としての座標及び深度の前記複数の時系列画像における変位を、前記正解行動取得部により取得された正解行動と対応付けて学習する第2の学習部と、
    を備えたことを特徴とする学習装置。
  14. 前記関節群の全体としての座標及び深度の変位は、前記関節群の重心の座標及び深度の変位を含むことを特徴とする請求項13に記載の学習装置。
  15. 対象の複数の関節を識別するための基準が記憶されたコンピュータにインストールされるプログラムであって、
    一又は複数の対象が映った複数の時系列画像を取得するステップと、
    前記複数の関節を識別するための基準に基づき、各時系列画像に映った複数の関節を検出するステップと、
    前記検出された各関節に対して入力された正解行動を取得するステップと、
    各時系列画像に映った前記複数の関節の座標及び深度を計測するステップと、
    各対象に属する複数の関節の全体としての座標及び深度の前記複数の時系列画像Yにおける変位を学習するステップと、
    前記第1の学習部で学習された各対象に属する複数の関節の全体としての座標及び深度の前記複数の時系列画像における変位を、前記正解行動取得部により取得された正解行動と対応付けて学習するステップと、
    を備えたことを特徴とする学習プログラム。
  16. 前記関節群の全体としての座標及び深度の変位は、前記関節群の重心の座標及び深度であることを特徴とする請求項15に記載の学習プログラム。
JP2018076045A 2018-04-11 2018-04-11 行動推定装置 Active JP6525179B1 (ja)

Priority Applications (3)

Application Number Priority Date Filing Date Title
JP2018076045A JP6525179B1 (ja) 2018-04-11 2018-04-11 行動推定装置
PCT/JP2019/015402 WO2019198696A1 (ja) 2018-04-11 2019-04-09 行動推定装置
US17/045,536 US11482046B2 (en) 2018-04-11 2019-04-09 Action-estimating device

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2018076045A JP6525179B1 (ja) 2018-04-11 2018-04-11 行動推定装置

Publications (2)

Publication Number Publication Date
JP6525179B1 JP6525179B1 (ja) 2019-06-05
JP2019185420A true JP2019185420A (ja) 2019-10-24

Family

ID=66730612

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2018076045A Active JP6525179B1 (ja) 2018-04-11 2018-04-11 行動推定装置

Country Status (1)

Country Link
JP (1) JP6525179B1 (ja)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2021086322A (ja) * 2019-11-26 2021-06-03 キヤノン株式会社 画像処理装置、画像処理方法及びプログラム

Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2016099982A (ja) * 2014-11-26 2016-05-30 日本電信電話株式会社 行動認識装置、行動学習装置、方法、及びプログラム

Patent Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2016099982A (ja) * 2014-11-26 2016-05-30 日本電信電話株式会社 行動認識装置、行動学習装置、方法、及びプログラム

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
黒澤 瞬: "深度センサによる高齢者の見守りシステム", 電子情報通信学会技術研究報告 VOL.112 NO.474, vol. MVE2012-98 (2013-03), JPN6017005484, 4 March 2013 (2013-03-04), JP, pages 17 - 22, ISSN: 0003998362 *

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2021086322A (ja) * 2019-11-26 2021-06-03 キヤノン株式会社 画像処理装置、画像処理方法及びプログラム
US11836944B2 (en) 2019-11-26 2023-12-05 Canon Kabushiki Kaisha Information processing apparatus, information processing method, and storage medium
JP7422456B2 (ja) 2019-11-26 2024-01-26 キヤノン株式会社 画像処理装置、画像処理方法及びプログラム

Also Published As

Publication number Publication date
JP6525179B1 (ja) 2019-06-05

Similar Documents

Publication Publication Date Title
US11182924B1 (en) System for estimating a three dimensional pose of one or more persons in a scene
Yan et al. Development of ergonomic posture recognition technique based on 2D ordinary camera for construction hazard prevention through view-invariant features in 2D skeleton motion
Chaudhari et al. Yog-guru: Real-time yoga pose correction system using deep learning methods
JP7057959B2 (ja) 動作解析装置
Zhang et al. A viewpoint-independent statistical method for fall detection
US11298050B2 (en) Posture estimation device, behavior estimation device, storage medium storing posture estimation program, and posture estimation method
WO2019198696A1 (ja) 行動推定装置
Chu et al. Monocular vision–based framework for biomechanical analysis or ergonomic posture assessment in modular construction
US11688139B1 (en) System for estimating a three dimensional pose of one or more persons in a scene
KR102371127B1 (ko) 골격의 길이 정보를 이용한 제스쳐 인식 방법 및 처리 시스템
US20220083769A1 (en) Work estimation apparatus, method and non-transitory computer-readable storage medium
Nayak et al. Development of a fully automated RULA assessment system based on computer vision
JP7480001B2 (ja) 学習装置、処理装置、学習方法、姿勢検出モデル、プログラム、及び記憶媒体
KR20180110443A (ko) 열량 정보 제공 장치 및 방법
JP2019185421A (ja) 対象数特定装置
Liu et al. Automatic fall risk detection based on imbalanced data
JP2019185420A (ja) 行動推定装置
US11544926B2 (en) Image processing apparatus, method of processing image, and storage medium
CN117593792A (zh) 一种基于视频帧的异常姿态检测方法和装置
Chu et al. 3D human body reconstruction for worker ergonomic posture analysis with monocular video camera
WO2019230199A1 (ja) 行動推定装置
JP2021081804A (ja) 状態認識装置、状態認識方法及び状態認識プログラム
US11983242B2 (en) Learning data generation device, learning data generation method, and learning data generation program
US11694571B2 (en) Information processing system, information processing apparatus, and non-transitory storage medium
Liu Video-based human motion capture and force estimation for comprehensive on-site ergonomic risk assessment

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20181122

A871 Explanation of circumstances concerning accelerated examination

Free format text: JAPANESE INTERMEDIATE CODE: A871

Effective date: 20181122

A975 Report on accelerated examination

Free format text: JAPANESE INTERMEDIATE CODE: A971005

Effective date: 20190307

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20190308

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20190319

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20190404

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20190423

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20190423

R150 Certificate of patent or registration of utility model

Ref document number: 6525179

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250