WO2023188417A1

WO2023188417A1 - 作業分析装置

Info

Publication number: WO2023188417A1
Application number: PCT/JP2022/016971
Authority: WO
Inventors: 智史上野; 一洋大和
Original assignee: ファナック株式会社
Priority date: 2022-03-31
Filing date: 2022-03-31
Publication date: 2023-10-05

Abstract

作業を精度良く判定させるために判定基準（パラメータ）を自動で調整して求めること。　作業分析装置は、作業員の作業を含む映像データに対して、作業員の作業を示す作業ラベルを付与する作業ラベル付与部と、作業ラベルが付与された前映像データに対して、作業員の作業に関連する物体をアノテーションする物体検出アノテーション部と、物体検出アノテーション部によりアノテーションされた物体の映像データから物体検出を行う物体検出モデルを生成する物体検出学習部と、物体検出モデルを用いて、映像データから物体を検出する物体検出部と、作業ラベルが付与された映像データの作業判定を行い、付与された作業ラベルとの誤差を最小とする判定基準を算出する作業判定パラメータ計算部と、物体検出モデルと判定基準とを用いて新たに入力された映像データにおける作業員の作業を判定する作業判定部と、を備える。

Description

作業分析装置

　本発明は、作業分析装置に関する。

　工場では工作機械等の稼働データは取得できているが、作業員の作業のデータは取得できていない。そこで、作業の改善、ロボット導入検討、工場のデジタルツイン等の実現には作業員の作業を見える化する必要があり、作業員の作業の映像から何をしていたのかを自動で認識する技術が重要である。
　この点、作業員の作業が撮像された画像の入力データと当該画像が示す作業員の作業のラベルデータとからなる学習対象データを用いて機械学習を行い、画像から作業を特定するための学習済みモデルを生成し、学習済みモデルを利用して分析対象の画像がどの作業を行っている画像であるかを特定する技術が知られている。例えば、特許文献１参照。
　また、デプスセンサにより撮像された深度付き画像データから作業者の手の位置を特定するとともに、デジタルカメラにより撮像された画像データから対象物の位置を特定し、作業において作業者が行なった動作の内容を特定する技術が知られている。例えば、特許文献２参照。

特開２０２１－６７９８１号公報国際公開第２０１７／２２２０７０号

　しかしながら、特許文献１の学習済みモデルのような分類モデルは複雑で解釈性が低いという問題がある。
　また、特許文献２のように作業分類のために画像内から使っている道具（物体）を検出するには、画像全体を走査するため多くの計算量が必要である。
　さらに、作業員が行っている作業を精度良く判定するには、作業判定の判定基準（パラメータ）の調整と、様々な作業の場面の画像を手動で探し出してアノテーションを行う必要があり、手間がかかる。また、手動で探し出しても作業判定の精度が上がるかわからないという課題がある。

　そこで、作業を精度良く判定させるために判定基準（パラメータ）を自動で調整して求める機能が望まれている。

　本開示の作業分析装置の一態様は、作業員の作業を分析する作業分析装置であって、前記作業員の作業を含む映像データに対して、前記作業員の作業を示す作業ラベルを付与する作業ラベル付与部と、前記作業ラベルが付与された前記映像データに対して、前記作業員の作業に関連する物体をアノテーションする物体検出アノテーション部と、前記物体検出アノテーション部によりアノテーションされた前記物体の映像データから物体検出を行う物体検出モデルを生成する物体検出学習部と、前記物体検出モデルを用いて、前記映像データから前記物体を検出する物体検出部と、前記作業ラベルが付与された前記映像データの作業判定を行い、付与された作業ラベルとの誤差を最小とする判定基準を算出する作業判定パラメータ計算部と、前記物体検出モデルと前記判定基準とを用いて新たに入力された映像データにおける前記作業員の作業を判定する作業判定部と、を備える。

　一態様によれば、作業を精度良く判定させるために判定基準（パラメータ）を自動で調整して求めることができる。

第１実施形態に係る作業分析システムの機能的構成例を示す機能ブロック図である。作業テーブルの一例を示す図である。作業ラベルを付与するためのユーザインタフェースの一例を示す図である。リュータの状態が異なる映像データの一例を示す図である。作業判定の判定結果の一例を示す図である。誤検出の一例を示す図である。映像データにおける画像領域の一例を示す図である。動体検出部の動作の一例を示す図である。作業分析装置のパラメータ算出処理について説明するフローチャートである。作業分析装置の分析処理について説明するフローチャートである。第２実施形態に係る作業分析システムの機能的構成例を示す機能ブロック図である。フレーム画像における関節位置情報の一例を示す図である。関節位置作業推定モデルの動作の一例を示す図である。作業分析装置のパラメータ算出処理について説明するフローチャートである。作業分析装置の分析処理について説明するフローチャートである。

　作業分析装置の第１実施形態及び第２実施形態について、図面を参照して詳細に説明をする。
　ここで、各実施形態は、予め作業員の作業が撮像された映像データ（動画）に対して作業員の作業を示す作業ラベルを付与し、作業ラベルが付与された映像データに対して作業員が当該作業に関連する物体（工具）をアノテーションし、アノテーションされた物体の映像データから物体検出を行う物体検出モデルを生成するという構成において共通する。
　ただし、作業員の作業の判定において、第１実施形態では生成された物体検出モデルを用いて作業ラベルが付与された映像データにおける作業員の作業の作業判定を行い、付与された作業ラベルとの誤差を最小とする判定基準を算出することにより、物体検出モデルと算出された判定基準とを用いて新たに入力された映像データにおける作業員の作業を判定する。これに対し、第２実施形態では作業員の関節に関する関節位置情報を推定し、推定された関節位置情報と付与された作業ラベルとに基づいて作業員の作業を推定する関節位置作業推定モデルを生成し、物体検出モデルを用いた作業判定における物体検出の精度に関わる値と、関節位置作業推定モデルを用いた作業判定における関節位置から推定した作業の分類確率と、に基づいて作業ラベルとの誤差が最小となるように判定基準を算出し、物体検出モデルと関節位置作業推定モデルと判定基準とを用いて新たに入力された映像データにおける作業員の作業を判定する点が、第１実施形態と相違する。
　以下では、まず第１実施形態について詳細に説明し、次に第２実施形態において第１実施形態と相違する部分を中心に説明を行う。

＜第１実施形態＞
　図１は、第１実施形態に係る作業分析システムの機能的構成例を示す機能ブロック図である。
　図１に示すように、作業分析システム１００は、作業分析装置１、及びカメラ２を有する。

　作業分析装置１、及びカメラ２は、ＬＡＮ（Ｌｏｃａｌ　Ａｒｅａ　Ｎｅｔｗｏｒｋ）やインターネット等の図示しないネットワークを介して相互に接続されていてもよい。この場合、作業分析装置１、及びカメラ２は、かかる接続によって相互に通信を行うための図示しない通信部を備えている。なお、作業分析装置１、及びカメラ２は、図示しない接続インタフェースを介して互いに有線又は無線で直接接続されてもよい。
　また、図１では、作業分析装置１は１つのカメラ２と接続されているが、２つ以上の複数のカメラ２と接続されてもよい。

　カメラ２は、デジタルカメラ等であり、図示しない作業員及び工具等の物体をカメラ２の光軸に対して垂直な平面に投影した２次元のフレーム画像を所定のフレームレート（例えば、３０ｆｐｓ等）で撮像する。カメラ２は、撮像したフレーム画像を映像データとして作業分析装置１に出力する。なお、カメラ２により撮像される映像データは、ＲＧＢカラー画像やグレースケール画像、深度画像等の可視光画像でもよい。

＜作業分析装置１＞
　作業分析装置１は、当業者にとって公知のコンピュータであり、図１に示すように、制御部１０及び記憶部２０を有する。また、制御部１０は、作業登録部１０１、作業ラベル付与部１０２、物体検出アノテーション部１０３、物体検出学習部１０４、作業判定パラメータ計算部１０５、物体検出アノテーション提案部１０６、及び作業判定部１０７を有する。また、作業判定部１０７は、物体検出部１０７１及び動体検出部１０７２を有する。

　記憶部２０は、ＲＯＭ（Ｒｅａｄ　Ｏｎｌｙ　Ｍｅｍｏｒｙ）やＨＤＤ（Ｈａｒｄ　Ｄｉｓｋ　Ｄｒｉｖｅ）等の記憶装置である。記憶部２０には、後述する制御部１０が実行するオペレーティングシステム及びアプリケーションプログラム等が記憶される。また、記憶部２０は、映像データ記憶部２０１、作業登録記憶部２０２、及び入力データ記憶部２０３を含む。

　映像データ記憶部２０１には、カメラ２により撮像された作業員及び工具等の物体の映像データが記憶される。

　作業登録記憶部２０２には、例えば、作業分析装置１に含まれるキーボードやタッチパネル等の入力装置（図示しない）を介した作業員等のユーザの入力操作に基づいて後述する作業登録部１０１により予め登録される、後述する物体検出部１０７１により検出される工具（物体）と、対応する作業員の作業と、を関係付けした作業テーブルが記憶される。
　図２は、作業テーブルの一例を示す図である。
　図２に示すように、作業テーブルは、「物体」及び「作業」の格納領域を有する。
　作業テーブル内の「物体」の格納領域には、例えば、「リュータ（登録商標）」、「紙ヤスリ」等の工具名が格納される。
　作業テーブル内の「作業」の格納領域には、例えば、「リュータかけ」、「ヤスリかけ」等の作業が格納される。

　入力データ記憶部２０３には、例えば、映像データのフレーム画像のうち後述する物体検出アノテーション部１０３によりアノテーションされた工具（物体）と当該工具が写っている画像範囲とが対応付けられたフレーム画像データの集合が、後述する物体検出学習部１０４が物体検出モデルを生成するときの入力データとして記憶される。

　制御部１０は、ＣＰＵ、ＲＯＭ、ＲＡＭ（Ｒａｎｄｏｍ　Ａｃｃｅｓｓ　Ｍｅｍｏｒｙ）、ＣＭＯＳメモリ等を有し、これらはバスを介して相互に通信可能に構成される、当業者にとって公知のものである。
　ＣＰＵは作業分析装置１を全体的に制御するプロセッサである。ＣＰＵは、ＲＯＭに格納されたシステムプログラム及びアプリケーションプログラムを、バスを介して読み出し、システムプログラム及びアプリケーションプログラムに従って作業分析装置１全体を制御する。これにより、図１に示すように、制御部１０は、作業登録部１０１、作業ラベル付与部１０２、物体検出アノテーション部１０３、物体検出学習部１０４、作業判定パラメータ計算部１０５、物体検出アノテーション提案部１０６、及び作業判定部１０７の機能を実現するように構成される。また、作業判定部１０７は、物体検出部１０７１及び動体検出部１０７２の機能を実現するように構成される。ＲＡＭには一時的な計算データや表示データ等の各種データが格納される。ＣＭＯＳメモリは図示しないバッテリでバックアップされ、作業分析装置１の電源がオフされても記憶状態が保持される不揮発性メモリとして構成される。

　作業登録部１０１は、例えば、作業分析装置１の入力装置（図示しない）を介した作業員等のユーザの入力操作に基づいて、図２に示す作業テーブルに、使用する工具（検出される物体）と、当該工具（物体）を使用する作業（認識させたい作業）と、の関係を対応付けて登録する。

　作業ラベル付与部１０２は、例えば、ユーザが映像データ記憶部２０１に記憶された作業員の作業を含む映像データ（動画データ）を見て、当該映像データ（動画データ）に対して、作業員が何の作業をしているか、その作業名を示す作業ラベルを付与する。
　図３は、作業ラベルを付与するためのユーザインタフェース３０の一例を示す図である。
　図３に示すように、ユーザインタフェース３０は、映像データ記憶部２０１に記憶された映像データ（動画）を再生する領域３０１、再生停止ボタン３０２、スライド３０３、、作業ラベル付与部１０２により映像データに付与された作業ラベルを時系列的に示す領域３１０、後述する物体検出アノテーション部１０３によりアノテーションされる工具を示すリュータボタン３２１、マイクロリュータボタン３２２、紙ヤスリボタン３２３、ウェスボタン３１４、及び作業ラベルの付与及び／又は物体のアノテーションを完了する完了ボタン３３０を有する。

　具体的には、作業ラベル付与部１０２は、例えば、ユーザインタフェース３０を作業分析装置１に含まれるＬＣＤ等の表示装置（図示しない）に表示し、ユーザインタフェース３０の領域３０１において映像データ記憶部２０１に記憶された映像データ（動画データ）を再生する。ユーザは、作業分析装置１の入力装置（図示しない）を介して再生停止ボタン３０２やスライド３０３を操作して映像データを確認し、時刻１３：１０から時刻１３：１３までの時間の映像データにおいて「リュータかけ」の作業員の作業を確認した場合、「リュータかけ」の作業名を入力し、作業ラベル付与部１０２は、時刻１３：１０から時刻１３：１３までの映像データに対して「リュータかけ」の作業ラベルを付与する。また、ユーザは、時刻１３：１３から時刻１３：１８までの時間の映像データにおいてマイクロリュータかけの作業員の作業を確認した場合、「マイクロリュータかけ」の作業名を入力し、作業ラベル付与部１０２は、時刻１３：１３から時刻１３：１８までの映像データに対して「マイクロリュータかけ」の作業ラベルを付与する。また、ユーザは時刻１３：１８から時刻１３：２０までの時間の映像データにおいて「ヤスリかけ」の作業員の作業を確認した場合、「ヤスリかけ」の作業名を入力し、作業ラベル付与部１０２は、時刻１３：１８から時刻１３：２０までの映像データに対して「ヤスリかけ」の作業ラベルを付与する。さらに、ユーザは、時刻１３：２０から時刻１３：２２までの時間の映像データにおいて「洗浄」の作業員の作業を確認した場合、「洗浄」の作業名を入力し、作業ラベル付与部１０２は、時刻１３：２０から時刻１３：２２までの映像データに対して「洗浄」の作業ラベルを付与する。
　作業ラベル付与部１０２は、領域３１０に作業ラベルの付与結果を時系列的に作業分析装置１の表示装置（図示しない）に表示するようにしてもよい。そして、作業ラベル付与部１０２は、作業ラベルを付与した映像データを物体検出アノテーション部１０３に出力する。

　物体検出アノテーション部１０３は、例えば、作業ラベルが付与された映像データに対して、作業員の作業に関連する工具（物体）をアノテーションする。
　具体的には、物体検出アノテーション部１０３は、例えば、ユーザインタフェース３０の領域３０１に、時刻１３：１０から時刻１３：１３までの「リュータかけ」の作業ラベルが付与された映像データのうちリュータの工具（物体）が写っている所定の間隔で区切られたフレーム画像（静止画像）、又はユーザにより任意の間隔で区切られたフレーム画像（静止画像）を表示する。
　なお、表示されるフレーム画像（静止画像）は、例えば、作業ラベル毎に２０枚程度になるように、所定の間隔や任意の間隔が設定されることが好ましい。
　そうすることで、ユーザは何時間もの映像データを確認する必要が無く、作業を効率的に行うことができ、ユーザの負担を軽減することができる。

　物体検出アノテーション部１０３は、ユーザの入力操作に基づいて、図３に示すように、フレーム画像（静止画像）毎に写っている工具（物体）の画像範囲（太線の矩形）を取得するとともに、リュータボタン３２１等が押下されることにより当該工具（物体）をリュータとアノテーションする。なお、物体検出アノテーション部１０３は、「マイクロリュータかけ」、「ヤスリかけ」、「洗浄」の作業ラベルが付与された映像データそれぞれについても工具（物体）が写っているフレーム画像（静止画像）に対して、「リュータかけ」の場合と同様に、写っている工具（物体）の画像範囲を取得するとともに、当該工具（物体）をアノテーションする。
　物体検出アノテーション部１０３は、作業ラベルが付与された映像データの全てのフレーム画像（静止画像）に対して工具（物体）の写っている画像範囲と工具（物体）のアノテーションが完了し、ユーザにより完了ボタン３３０が押下された場合、各作業が行われた時間（作業開始から作業終了までの時間）の映像データ（動画データ）のうち、工具が映っている（タイムスタンプの付与された）フレーム画像（静止画像）の画像範囲と、アノテーションした工具（物体）と、を対応付けたフレーム画像データの集合（以下、「アノテーション済みフレーム画像データ」ともいう）を入力データ記憶部２０３に格納する。

　物体検出学習部１０４は、アノテーションされた物体の映像データから物体検出を行う物体検出モデルを生成する。
　具体的には、物体検出学習部１０４は、例えば、入力データ記憶部２０３に記憶されたアノテーション済みフレーム画像データを入力データとし、アノテーションされた工具（物体）をラベルデータとする教師データを用いた公知の機械学習を行い、ニューラルネットワーク等の学習済みモデルである物体検出モデルを生成する。物体検出学習部１０４は、生成した物体検出モデルを記憶部２０に記憶する。

　作業判定パラメータ計算部１０５は、物体検出学習部１０４により生成された物体検出モデルを用いて、作業ラベルが付与された映像データの作業判定を行い、付与された作業ラベルとの誤差を最小とする判定基準を算出する。
　具体的には、作業判定パラメータ計算部１０５は、例えば、図２の作業テーブルに登録された作業毎に判定基準としてのパラメータの初期値を設定する。なお、パラメータには、例えば、物体を検出してからＸ秒間は作業を行っているとする秒数Ｘ、作業「リュータかけ」を行っていると判断する物体検出の精度に関わる値の閾値、作業「ヤスリかけ」を行っていると判断する物体検出の精度に関わる値の閾値等が含まれる。この物体検出してからＸ秒間は作業を行っているとする秒数Ｘがパラメータに含まれることにより、作業分析装置１は、例えば、映像データによって工具（物体）を検出できない場合でも、直近のＸ秒間に工具（物体）を検出していれば当該工具を用いた作業をしていると判定することができる。

　作業判定パラメータ計算部１０５は、入力データ記憶部２０３に記憶された作業ラベルが付与された別の映像データにおけるアノテーション済みフレーム画像データを物体検出モデルに入力し、工具（物体）を検出する。作業判定パラメータ計算部１０５は、物体の検出結果と図２の作業テーブルとに基づいて作業を判定し、判定された作業と正解の作業ラベルとの誤差を算出する。そして、作業判定パラメータ計算部１０５は、全てのアノテーション済みフレーム画像データで算出した誤差に基づいて、パラメータ値のＦ１スコア等の評価指標を作業毎に算出し、算出した作業毎の評価指標が最大となるように、ベイズ最適化等で各作業のパラメータ値を算出する。

　物体検出アノテーション提案部１０６は、作業判定パラメータ計算部１０５により算出されたパラメータ（判定基準）を用いて、作業ラベルが付与された映像データの作業判定を行い、作業判定の判定結果に基づいてアノテーションを行うフレーム画像（静止画像）を提案する。
　例えば、リュータの物体検出で、図４の上段に示すように、作業員が手で持っている状態の映像データのみで学習させた場合、図４の下段に示すような作業台等に置かれたリュータの物体検出の精度に関わる値は落ちてしまう。そこで、幅広く様々な場面でアノテーションさせた映像データが必要であるが、ユーザが様々な場面を探し出すのは手間である。そこで、物体検出アノテーション提案部１０６は、後述するように、自動でアノテーションさせた方がよいフレーム画像（静止画像）を提案する。
　具体的には、物体検出アノテーション提案部１０６は、例えば、入力データ記憶部２０３に記憶された作業ラベルが付与された別の映像データにおいてアノテーションされた工具（物体）と当該工具が写っている画像範囲とが対応付けられた画像データを用いて作業判定を行う。
　図５は、作業判定の判定結果の一例を示す図である。図５の上段は、当該別の映像データに付与された正解の作業ラベルの時系列を示す。図５の中段は、物体検出モデルとパラメータとを用いた当該画像データに対する物体検出アノテーション提案部１０６による作業員の作業の判定結果を示す。図５の下段は、物体検出モデルによる当該画像データにおける物体検出結果を示す。

　図５に示すように、正解の作業ラベルが「リュータかけ」の時刻１３：４０から時刻１３：４３までの時間において、作業判定結果において「リュータかけ」が判定（検出）されなかった時間がある。これは、例えば、パラメータの物体を検出してからＸ秒間は作業を行っているとする秒数Ｘまでの間に、リュータが写っているフレーム画像（静止画像）があるにもかかわらず抽出されなかったことが原因である。そこで、物体検出アノテーション提案部１０６は、物体検出の精度に関わる値を増加させるために、作業判定結果において「リュータかけ」と判定（検出）されなかった時間の当該別の映像データでリュータが写っているフレーム画像（静止画像）を抽出する。物体検出アノテーション提案部１０６は、物体検出アノテーション部１０３と同様に、抽出したフレーム画像（静止画像）をユーザインタフェース３０に表示し、ユーザの入力操作に基づいて抽出したフレーム画像（静止画像）においてリュータの画像範囲を取得し、リュータボタン３２１が押下されることでリュータとアノテーションする。物体検出アノテーション提案部１０６は、リュータが映っている（タイムスタンプの付与された）フレーム画像（静止画像）の画像範囲と、アノテーションしたリュータと、を対応付けた画像データを入力データ記憶部２０３に格納する。

　また、図５に示すように、正解の作業ラベルが「ヤスリかけ」の時刻１３：４３から時刻１３：５０までの時間において、作業判定結果において「リュータかけ」と誤判定（誤検出）された時間と、「ヤスリかけ」が判定（検出）されなかった時間と、がある。この「リュータかけ」の誤判定（誤検出）は、時刻１３：４３のフレーム画像（静止画像）に対する物体検出でリュータと誤検出したことが原因である。また、「ヤスリかけ」が判定（検出）されなかったことは、パラメータの物体を検出してからＸ秒間は作業を行っているとする秒数Ｘまでの間に、紙ヤスリが写っているフレーム画像（静止画像）があるにもかかわらず抽出されなかったことが原因である。
　そこで、物体検出アノテーション提案部１０６は、物体検出の精度に関わる値を増加させるために、当該別の映像データにおいて、時刻１３：４３周辺で紙ヤスリが写っているフレーム画像（静止画像）と、「ヤスリかけ」と判定（検出）されなかった時間に紙ヤスリが写っているフレーム画像（静止画像）を抽出する。物体検出アノテーション提案部１０６は、抽出したフレーム画像（静止画像）それぞれをユーザインタフェース３０に表示し、ユーザの入力操作に基づいて、フレーム画像（静止画像）それぞれにおいて紙ヤスリの画像範囲を取得し、紙ヤスリボタン３２３が押下されることで工具（物体）を紙ヤスリとアノテーションする。物体検出アノテーション提案部１０６は、紙ヤスリが映っている（タイムスタンプの付与された）フレーム画像（静止画像）の画像範囲と、アノテーションした紙ヤスリと、を対応付けた画像データを入力データ記憶部２０３に格納する。
　これにより、ユーザが様々な場面を探し出す手間をかけることなく、物体検出の精度を上げることができる。

　なお、物体検出アノテーション提案部１０６は、物体検出の精度に関わる値である工具（物体）の物体検出の信頼性が所定値（例えば、２０％等）以下の低い場合にも、当該工具（物体）が写っているフレーム画像（静止画像）を抽出するようにしてもよい。物体検出アノテーション提案部１０６は、ユーザインタフェース３０に抽出したフレーム画像（静止画像）を表示し、ユーザの入力操作に基づいて、抽出したフレーム画像（静止画像）における工具（物体）の画像範囲を取得し、工具（物体）をアノテーションするようにしてもよい。

　その後、物体検出学習部１０４は、物体検出アノテーション提案部１０６により抽出（提案）され工具（物体）をアノテーションしたフレーム画像（静止画像）を含む画像データを用いて機械学習を行い、物体検出モデルを更新する。作業判定パラメータ計算部１０５は、物体検出アノテーション提案部１０６により抽出（提案）されたフレーム画像（静止画像）を含むアノテーション済みフレーム画像データを更新された物体検出モデルに入力することで作業を判定し、付与された正解の作業ラベルと作業の判定結果との誤差を算出する。作業判定パラメータ計算部１０５は、算出した誤差に基づいてパラメータの値のＦ１スコア等の評価指標を作業毎に算出し、算出した作業毎の評価指標が最大となるように、ベイズ最適化等で各作業のパラメータ値を再度算出する。例えば、物体検出アノテーション提案部１０６により抽出（提案）されるフレーム画像（静止画像）がなくなる、又は所定数未満となるまで、物体検出学習部１０４及び作業判定パラメータ計算部１０５は処理を繰り返す。そして、物体検出学習部１０４は、生成した物体検出モデルを後述する物体検出部１０７１に出力するとともに、作業判定パラメータ計算部１０５は、算出したパラメータを後述する作業判定部１０７に出力する。

　作業判定部１０７は、物体検出モデルと設定されたパラメータ（判定基準）とを用いてカメラ２から新たに入力された映像データにおける作業員の作業を判定する。
　具体的には、作業判定部１０７は、例えば、カメラ２から新たに入力された映像データのフレーム画像（静止画像）を後述する物体検出部１０７１の物体検出モデルと、後述する動体検出部１０７２とに入力する。作業判定部１０７は、当該物体検出モデルから出力される工具（物体）の検出結果と、動体検出部１０７２の検出結果と、図２の作業テーブルと、パラメータと、に基づいて作業者の作業を判定する。なお、作業判定部１０７は、映像データのフレーム画像（静止画像）によって工具（物体）を検出できない場合で、当該フレーム画像のＸ秒以内の直近において当該工具（物体）が検出されている場合には、物体検出してからＸ秒間は作業を行っているとする秒数Ｘのパラメータに基づいて当該フレーム画像の作業員の作業を判定するようにしてもよい。
　また、作業判定部１０７は、例えば、物体検出部１０７１の物体検出モデルから出力される物体検出の信頼度やクラスの分類確率等の物体検出の精度に関する値が予め設定された閾値（例えば、７０％等）以下の場合、作業員の作業の判定を「作業無し」と判定するようにしてもよい。例えば、作業判定部１０７は、図６に示すように、映像データにおいて作業員が単にワークを触っている場合に、「紙ヤスリ」及び「信頼度４０％」という物体検出結果を受けた場合、信頼度が閾値（例えば、７０％等）以下であることから作業員の作業を「作業無し」と判定するようにしてもよい。
　そうすることで、作業の誤検出を減らすことができる。

　物体検出部１０７１は、物体検出学習部１０４により生成された物体検出モデルを有し、カメラ２から新たに入力された映像データのフレーム画像（静止画像）を物体検出モデルに入力し、工具（物体）の検出結果とともに、信頼度等の物体検出の精度に関する値を出力する。

　動体検出部１０７２は、カメラ２から新たに入力された映像データの各フレーム画像（静止画像）のうち指定された画像領域におけるピクセルの輝度変化等の変化に基づいて作業員や工具等の動体を検出する。
　具体的には、動体検出部１０７２は、図７に示すように、フレーム画像（静止画像）の太線の矩形で示す画像領域において、ピクセルの輝度変化等の動きが有れば、映像データの作業員が作業を行っていると判定するようにしてもよい。
　また、動体検出部１０７２は、図８の上段に示すように、破線の矩形で示すＸ秒（例えば、５秒等）以内の間隔で定期的に動きを検出する場合、作業員は連続して作業を行っていると判断するようにしてもよい。そして、動体検出部１０７２は、図８の下段に示すように、動体の動きが検出される期間において、物体検出部１０７１により網掛けの矩形で示す時刻のフレーム画像（静止画像）からリュータ等の工具（物体）が検出された場合、当該期間では検出された工具（物体）で作業を行っていると判定するようにしてもよい。
　一方、動体検出部１０７２は、Ｘ秒超過に亘って動きを検出しない場合、作業員は作業をしていないと判断するようにしてもよい。

＜作業分析装置１のパラメータ算出処理＞
　次に、第１実施形態に係る作業分析装置１のパラメータ算出処理に係る動作について説明する。
　図９は、作業分析装置１のパラメータ算出処理について説明するフローチャートである。ここで示すフローは、作業員等のユーザにより作業テーブルに新たな工具（物体）と作業とが登録される場合等に実行される。

　ステップＳ１において、作業ラベル付与部１０２は、映像データ記憶部２０１に記憶された作業員の作業を含む映像データをユーザインタフェース３０において再生し、ユーザによる入力操作に基づいて映像データに対して作業員が行っている作業を示す作業ラベルを付与する。

　ステップＳ２において、物体検出アノテーション部１０３は、ステップＳ１で作業ラベルが付与された映像データのうち、作業ラベル毎に所定の間隔等で区切られたフレーム画像（静止画像）に対して、写っている工具（物体）の画像範囲を取得するとともに、当該工具（物体）をアノテーションする。物体検出アノテーション部１０３は、各作業が行われた時間（作業開始から作業終了までの時間）の映像データ（動画データ）のうち、工具が映っている（タイムスタンプの付与された）フレーム画像（静止画像）の画像範囲と、アノテーションした工具（物体）と、を対応付けたアノテーション済みフレーム画像データを入力データ記憶部２０３に格納する。

　ステップＳ３において、物体検出学習部１０４は、ステップＳ２でアノテーションされたアノテーション済みフレーム画像データから物体検出を行う物体検出モデルを生成する。

　ステップＳ４において、作業判定パラメータ計算部１０５は、入力データ記憶部２０３に記憶された作業ラベルが付与された別の映像データのアノテーション済みフレーム画像データを物体検出モデルに入力し、工具（物体）を検出する。

　ステップＳ５において、作業判定パラメータ計算部１０５は、ステップＳ４の物体の検出結果と作業テーブルとに基づいて作業員の作業を判定する。

　ステップＳ６において、作業判定パラメータ計算部１０５は、正解の作業ラベルとステップＳ５の判定結果との誤差を作業毎に算出する。

　ステップＳ７において、全ての映像データで算出した誤差に基づいて、パラメータの値のＦ１スコア等の評価指標を作業毎に算出する。

　ステップＳ８において、作業判定パラメータ計算部１０５は、作業毎の評価指標が最大となるように、ベイズ最適化等で各作業のパラメータを算出する。

　ステップＳ９において、物体検出アノテーション提案部１０６は、ステップＳ８で算出されたパラメータ（判定基準）を用いて、作業ラベルが付与された別の映像データの作業判定を行う。

　ステップＳ１０において、物体検出アノテーション提案部１０６は、ステップＳ９の判定結果に基づき、誤検出や未検出等、物体検出の精度に関わる値が低い個所において、物体検出の精度に関わる値を増加させるために提案するフレーム画像（静止画像）があるか否かを判定する。提案するフレーム画像（静止画像）がある場合、処理はステップＳ２に戻り、提案されたフレーム画像（静止画像）を含めて、再度ステップＳ２からステップＳ９の処理を行う。一方、提案するフレーム画像（静止画像）が無い場合、作業分析装置１は、ステップＳ３で生成した物体検出モデルを物体検出部１０７１に設定するとともに、ステップＳ８で算出したパラメータを作業判定部１０７に設定し、パラメータ算出処理を終了する。

＜作業分析装置１の分析処理＞
　次に、第１実施形態に係る作業分析装置１の分析処理に係る動作について説明する。
　図１０は、作業分析装置１の分析処理について説明するフローチャートである。ここで示すフローは、カメラ２から映像データが入力される間、繰り返し実行される。

　ステップＳ２１において、物体検出部１０７１は、カメラ２から新たに入力された映像データのフレーム画像（静止画像）を物体検出モデルに入力し工具（物体）を検出する。

　ステップＳ２２において、動体検出部１０７２は、カメラ２から新たに入力された映像データの各フレーム画像（静止画像）の指定された画像領域におけるピクセルの輝度変化等の変化から作業員や工具等の動体を検出する。

　ステップＳ２３において、作業判定部１０７は、ステップＳ２１の工具（物体）の検出結果と、ステップＳ２２の動体の検出結果と、設定されたパラメータと、作業テーブルと、に基づいて作業員の作業を判定する。

　以上により、第１実施形態に係る作業分析装置１は、作業を精度良く判定させるために判定基準を自動で調整できる。すなわち、ユーザは作業のラベル付けと物体のアノテーションさえ行えば、自動で最適なパラメータが算出される。
　また、作業分析装置１は、作業判定の精度が不足している場合、アノテーションすれば作業判定の精度を高められる動画中のフレームを自動で提案することができる。
　以上、第１実施形態について説明した。

＜第２実施形態＞
　次に、第２実施形態について説明する。第１実施形態では生成された物体検出モデルを用いて作業ラベルが付与された映像データにおける作業員の作業の作業判定を行い、付与された作業ラベルとの誤差を最小とする判定基準を算出することにより、物体検出モデルと算出された判定基準とを用いて新たに入力された映像データにおける作業員の作業を判定する。これに対し、第２実施形態では作業員の関節に関する関節位置情報を推定し、推定された関節位置情報と付与された作業ラベルとに基づいて作業員の作業を推定する関節位置作業推定モデルを生成し、物体検出モデルを用いた作業判定における物体検出の精度に関わる値と、関節位置作業推定モデルを用いた作業判定における関節位置から推定した作業の分類確率と、に基づいて作業ラベルとの誤差が最小となるように判定基準を算出し、物体検出モデルと関節位置作業推定モデルと判定基準とを用いて新たに入力された映像データにおける作業員の作業を判定する点が、第１実施形態と相違する。
　これにより、第２実施形態に係る作業分析装置１Ａは、作業を精度良く判定させるために判定基準を自動で調整できる。
　以下、第２実施形態について説明する。

　図１１は、第２実施形態に係る作業分析システムの機能的構成例を示す機能ブロック図である。なお、図１の作業分析システム１００の要素と同様の機能を有する要素については、同じ符号を付し、詳細な説明は省略する。
　図１１に示すように、作業分析システム１００は、作業分析装置１Ａ、及びカメラ２を有する。
　カメラ２は、第１実施形態におけるカメラ２と同等の機能を有する。

＜作業分析装置１Ａ＞
　図１１に示すように、作業分析装置１Ａは、制御部１０ａ、及び記憶部２０を含む。また、制御部１０ａは、作業登録部１０１、作業ラベル付与部１０２、物体検出アノテーション部１０３、物体検出学習部１０４、作業判定パラメータ計算部１０５ａ、関節位置推定部１０８、関節位置作業学習部１０９、及び作業判定部１０７ａを有する。また、作業判定部１０７ａは、物体検出部１０７１、動体検出部１０７２、及び関節位置作業推定部１０７３を有する。また、記憶部２０は、映像データ記憶部２０１、作業登録記憶部２０２、及び入力データ記憶部２０３を有する。
　記憶部２０、映像データ記憶部２０１、作業登録記憶部２０２、及び入力データ記憶部２０３は、第１実施形態における記憶部２０、映像データ記憶部２０１、作業登録記憶部２０２、及び入力データ記憶部２０３と同等の機能を有する。
　また、作業登録部１０１、作業ラベル付与部１０２、物体検出アノテーション部１０３、及び物体検出学習部１０４は、第１実施形態における作業登録部１０１、作業ラベル付与部１０２、物体検出アノテーション部１０３、及び物体検出学習部１０４と同等の機能を有する。
　また、物体検出部１０７１及び動体検出部１０７２は、第１実施形態における物体検出部１０７１及び動体検出部１０７２と同等の機能を有する。

　関節位置推定部１０８は、入力データ記憶部２０３に記憶された作業ラベルが付与された映像データのフレーム画像（静止画像）毎に作業員の関節位置に関する関節位置情報を推定する。なお、フレーム画像は、映像データから適当な間隔で抽出してもよい。例えば映像データのフレームレートが６０ｆｐｓの場合、フレーム画像として例えば２４ｆｐｓ程度で抽出するようにしてもよい。
　具体的には、関節位置推定部１０８は、公知の手法（例えば、菅野滉介、奥健太、川越恭二、「多次元時系列データからのモーション検出・分類手法」、DEIM Forum 2016 G4-5、又は、上園翔平、小野智司、「LSTM Autoencoderを用いたマルチモーダル系列データの特徴抽出」、人工知能学会研究会資料、SIG-KBS-B802-01、2018）を用いて、入力データ記憶部２０３に記憶されている作業ラベルが付与された映像データのフレーム画像（静止画像）毎に作業員の手や腕等の関節の座標及び角度等の時系列データを関節位置情報として推定する。
　図１２は、フレーム画像における関節位置情報の一例を示す図である。図１２では、作業員がヤスリかけをしているときの関節位置情報を示す。

　関節位置作業学習部１０９は、例えば、関節位置推定部１０８により推定された関節位置情報を入力データとし、作業ラベル付与部１０２で付与された作業ラベルをラベルデータとする機械学習を行い、作業員の作業を推定する関節位置作業推定モデルを生成する。
　例えば、図１２の作業員の右手の関節位置情報が、図１３に示すように、０．３秒等で１往復する動作があったときに、ヤスリかけを行っていると判定するように、関節位置作業学習部１０９は、関節位置作業推定モデルを生成する。
　なお、関節位置作業学習部１０９は、関節位置推定部１０８により推定された関節位置情報と、作業ラベル付与部１０２で付与された作業ラベルと、に基づいてルールベースを生成するようにしてもよい。

　作業判定パラメータ計算部１０５ａは、物体検出モデルを用いた作業判定における物体検出の精度に関わる値と、関節位置作業推定モデルを用いた作業判定における関節位置から推定した作業の分類確率と、に基づいて作業ラベルとの誤差が最小となるように判定基準（パラメータ）を算出する。
　具体的には、作業判定パラメータ計算部１０５ａは、例えば、第１実施形態の作業判定パラメータ計算部１０５と同様に、図２の作業テーブルに登録された作業毎に判定基準としてのパラメータの初期値を設定する。作業判定パラメータ計算部１０５ａは、入力データ記憶部２０３に記憶された作業ラベルが付与された別の映像データのアノテーション済みフレーム画像データを物体検出モデルに入力し、工具（物体）を検出するとともに、物体検出に関わる値を取得する。作業判定パラメータ計算部１０５ａは、物体の検出結果と図２の作業テーブルとに基づいて作業員の作業を判定する。また、作業判定パラメータ計算部１０５ａは、同じ別の映像データのフレーム画像（静止画像）毎に作業員の関節位置情報を推定し、推定した関節位置情報を関節位置作業推定モデルに入力することで、作業員の作業を推定するとともに、関節位置から推定した分類確率を取得する。
　そして、作業判定パラメータ計算部１０５ａは、関節位置から推定した作業の分類確率の重み係数をａとし、及び物体検出の精度に関わる値の重み係数をｂとする、次式（１）を用いて算出される作業の分類確率と正解の作業ラベルとの誤差が最小となるように、ベイズ最適化等でパラメータ（判定基準）の値を算出する。
作業の分類確率　＝　ａ（関節位置から推定した作業の分類確率）
　　　　　　　　＋　ｂ（物体検出の精度に関わる値）　　・・・（１）
　ここで、パラメータには、例えば、物体検出してからＸ秒間は作業を行っているとする秒数Ｘ、関節位置から推定した作業の分類確率の重みａ、及び物体検出の精度に関わる値の重みｂが含まれる。
　作業判定パラメータ計算部１０５ａは、算出したパラメータを後述する作業判定部１０７ａに出力し設定する。

　作業判定部１０７ａは、物体検出モデルと関節位置作業推定モデルと設定されたパラメータ（判定基準）とを用いてカメラ２から新たに入力された映像データにおける作業員の作業を判定する。
　具体的には、作業判定部１０７ａは、例えば、カメラ２から新たに入力された映像データのフレーム画像（静止画像）を物体検出部１０７１における物体検出モデルと、動体検出部１０７２とに入力する。作業判定部１０７ａは、検出された工具（物体）と図２の作業テーブルとパラメータとに基づいて作業者の作業を判定するとともに、物体検出の精度に関わる値を取得する。また、作業判定部１０７ａは、同じ新たに入力された映像データのフレーム画像（静止画像）毎に作業員の関節位置情報を推定し、推定した関節位置情報を後述する関節位置作業推定部１０７３における関節位置作業推定モデルに入力する。作業判定部１０７ａは、後述する関節位置作業推定部１０７３から作業者の作業の推定結果と関節位置から推定した作業の分類確率とを取得する。
　そして、作業判定部１０７ａは、取得した関節位置から推定した作業の分類確率及び物体検出の精度に関わる値と、設定されたパラメータと、式（１）とから作業の分類確率を算出し、算出した分類確率と動体検出部１０７２の検出結果とに基づいて作業員の作業を判定する。

　関節位置作業推定部１０７３は、関節位置作業学習部１０９により生成された関節位置作業推定モデルを有し、作業判定部１０７ａにより推定された関節位置情報を関節位置作業推定モデルに入力し、作業員の作業の推定結果と、関節位置から推定した作業の分類確率とを作業判定部１０７ａに出力する。

＜作業分析装置１Ａのパラメータ算出処理＞
　次に、第２実施形態に係る作業分析装置１Ａのパラメータ算出処理に係る動作について説明する。
　図１４は、作業分析装置１Ａのパラメータ算出処理について説明するフローチャートである。なお、ステップＳ３１からステップＳ３３の処理は、図９のステップＳ１からステップＳ３の処理と同様であり、詳細な説明は省略する。

　ステップＳ３４において、関節位置推定部１０８は、入力データ記憶部２０３に記憶された作業ラベルが付与された映像データのフレーム画像（静止画像）毎に作業員の関節位置情報を推定する。

　ステップＳ３５において、関節位置作業学習部１０９は、ステップＳ３４で推定された関節位置情報を入力データとし、ステップＳ３１で付与された作業ラベルをラベルデータとする機械学習を行い、作業員の作業を推定する関節位置作業推定モデルを生成する。

　ステップＳ３６において、作業判定パラメータ計算部１０５ａは、入力データ記憶部２０３に記憶された作業ラベルが付与された別の映像データのアノテーション済みフレーム画像データを物体検出モデルに入力し、検出された工具（物体）と物体検出の精度に関わる値とを取得する。

　ステップＳ３７において、作業判定パラメータ計算部１０５ａは、ステップＳ３６の物体の検出結果と作業テーブルとに基づいて作業員の作業を判定する。

　ステップＳ３８において、作業判定パラメータ計算部１０５ａは、同じ別の映像データのフレーム画像（静止画像）から作業員の関節位置情報を推定する。

　ステップＳ３９において、作業判定パラメータ計算部１０５ａは、ステップＳ３８で推定した関節位置情報を関節位置作業推定モデルに入力し、作業員の作業の推定結果と関節位置から推定した分類確率とを取得する。

　ステップＳ４０において、作業判定パラメータ計算部１０５ａは、式（１）で算出される作業の分類確率と正解の作業ラベルとの誤差が最小となるように、ベイズ最適化等でパラメータ（判定基準）の値を算出する。

＜作業分析装置１Ａの分析処理＞
　次に、第２実施形態に係る作業分析装置１Ａの分析処理に係る動作について説明する。
　図１５は、作業分析装置１Ａの分析処理について説明するフローチャートである。ここで示すフローは、カメラ２から映像データが入力される間繰り返し実行される。

　ステップＳ５１において、物体検出部１０７１は、カメラ２から新たに入力された映像データのフレーム画像（静止画像）を物体検出モデルに入力し、工具（物体）を検出し物体検出の精度に関わる値を取得する。

　ステップＳ５２において、動体検出部１０７２は、カメラ２から新たに入力された映像データの各フレーム画像（静止画像）の指定された画像領域におけるピクセルの輝度変化等の変化から作業員や工具等の動体を検出する。

　ステップＳ５３において、関節位置作業推定部１０７３は、新たに入力された映像データのフレーム画像（静止画像）毎に作業員の関節位置情報を推定する。

　ステップＳ５４において、関節位置作業推定部１０７３は、ステップＳ５３で推定した関節位置情報を関節位置作業推定モデルに入力し、作業員の作業を推定するとともに、関節位置から推定した作業の分類確率を取得する。

　ステップＳ５５において、作業判定部１０７ａは、ステップＳ５１及びステップＳ５４で取得した関節位置から推定した作業の分類確率及び物体検出の精度に関わる値と、ステップＳ５２の動体の検出結果と、設定されたパラメータと、式（１）とから作業の分類確率を算出し、算出した分類確率に基づいて作業員の作業を判定する。

　以上により、第２実施形態に係る作業分析装置１Ａは、作業を精度良く判定させるために判定基準を自動で調整できる。すなわち、ユーザは作業のラベル付けと物体のアノテーションさえ行えば、自動で最適なパラメータが算出される。
　以上、第２実施形態について説明した。

　以上、第１実施形態及び第２実施形態について説明したが、作業分析装置１、１Ａは、上述の実施形態に限定されるものではなく、目的を達成できる範囲での変形、改良等を含む。

＜変形例１＞
　第１実施形態及び第２実施形態では、作業分析装置１、１Ａは、１つのカメラ２と接続されたが、これに限定されない。例えば、作業分析装置１、１Ａは、２以上の複数のカメラ２と接続されてもよい。

＜変形例２＞
　また例えば、上述の実施形態では、作業分析装置１、１Ａは、全ての機能を有したが、これに限定されない。例えば、作業分析装置１の作業登録部１０１、作業ラベル付与部１０２、物体検出アノテーション部１０３、物体検出学習部１０４、作業判定パラメータ計算部１０５、物体検出アノテーション提案部１０６、作業判定部１０７、及び物体検出部１０７１、及び動体検出部１０７２の一部又は全部、又は、作業分析装置１Ａの作業登録部１０１、作業ラベル付与部１０２、物体検出アノテーション部１０３、物体検出学習部１０４、作業判定パラメータ計算部１０５ａ、関節位置推定部１０８、関節位置作業学習部１０９、作業判定部１０７ａ、物体検出部１０７１、動体検出部１０７２、及び関節位置作業推定部１０７３の一部又は全部を、サーバが備えるようにしてもよい。また、クラウド上で仮想サーバ機能等を利用して、作業分析装置１、１Ａの各機能を実現してもよい。
　さらに、作業分析装置１、１Ａは、作業分析装置１、１Ａの各機能を適宜複数のサーバに分散される、分散処理システムとしてもよい。

＜変形例３＞
　また例えば、上述の実施形態では、作業分析装置１Ａは、物体検出アノテーション提案部１０６を有しなかったが、物体検出アノテーション提案部１０６を有してもよい。
　そうすることで、作業分析装置１Ａは、作業判定の精度が不足している場合、アノテーションすれば作業判定の精度を高められる動画中のフレームを自動で提案することができる。

　なお、第１実施形態及び第２実施形態における、作業分析装置１、１Ａに含まれる各機能は、ハードウェア、ソフトウェア又はこれらの組み合わせによりそれぞれ実現することができる。ここで、ソフトウェアによって実現されるとは、コンピュータがプログラムを読み込んで実行することにより実現されることを意味する。

　プログラムは、様々なタイプの非一時的なコンピュータ可読媒体（Ｎｏｎ－ｔｒａｎｓｉｔｏｒｙ　ｃｏｍｐｕｔｅｒ　ｒｅａｄａｂｌｅ　ｍｅｄｉｕｍ）を用いて格納され、コンピュータに供給することができる。非一時的なコンピュータ可読媒体は、様々なタイプの実体のある記録媒体（Ｔａｎｇｉｂｌｅ　ｓｔｏｒａｇｅ　ｍｅｄｉｕｍ）を含む。非一時的なコンピュータ可読媒体の例は、磁気記録媒体（例えば、フレキシブルディスク、磁気テープ、ハードディスクドライブ）、光磁気記録媒体（例えば、光磁気ディスク）、ＣＤ－ＲＯＭ（Ｒｅａｄ　Ｏｎｌｙ　Ｍｅｍｏｒｙ）、ＣＤ－Ｒ、ＣＤ－Ｒ／Ｗ、半導体メモリ（例えば、マスクＲＯＭ、ＰＲＯＭ（Ｐｒｏｇｒａｍｍａｂｌｅ　ＲＯＭ）、ＥＰＲＯＭ（Ｅｒａｓａｂｌｅ　ＰＲＯＭ）、フラッシュＲＯＭ、ＲＡＭ）を含む。また、プログラムは、様々なタイプの一時的なコンピュータ可読媒体（Ｔｒａｎｓｉｔｏｒｙ　ｃｏｍｐｕｔｅｒ　ｒｅａｄａｂｌｅ　ｍｅｄｉｕｍ）によってコンピュータに供給されてもよい。一時的なコンピュータ可読媒体の例は、電気信号、光信号、及び電磁波を含む。一時的なコンピュータ可読媒体は、電線及び光ファイバ等の有線通信路、又は、無線通信路を介して、プログラムをコンピュータに供給できる。

　なお、記録媒体に記録されるプログラムを記述するステップは、その順序に沿って時系列的に行われる処理はもちろん、必ずしも時系列的に処理されなくとも、並列的あるいは個別に実行される処理をも含むものである。

　以上を換言すると、本開示の作業分析装置は、次のような構成を有する各種各様の実施形態を取ることができる。

　（１）本開示の作業分析装置１は、作業員の作業を分析する作業分析装置であって、作業員の作業を含む映像データに対して、作業員の作業を示す作業ラベルを付与する作業ラベル付与部１０２と、作業ラベルが付与された映像データに対して、作業員の作業に関連する物体をアノテーションする物体検出アノテーション部１０３と、物体検出アノテーション部１０３によりアノテーションされた物体の映像データから物体検出を行う物体検出モデルを生成する物体検出学習部１０４と、物体検出モデルを用いて、映像データから物体を検出する物体検出部１０７１と、作業ラベルが付与された映像データの作業判定を行い、付与された作業ラベルとの誤差を最小とする判定基準を算出する作業判定パラメータ計算部１０５と、物体検出モデルと判定基準とを用いて新たに入力された映像データにおける作業員の作業を判定する作業判定部１０７と、を備える。
　この作業分析装置１によれば、作業を精度良く判定させるために判定基準を自動で調整できる。

　（２）　（１）に記載の作業分析装置１において、作業判定パラメータ計算部１０５により算出された判定基準を用いて、作業ラベルが付与された映像データの作業判定を行い、作業判定の判定結果に基づいてアノテーションを行うフレーム画像を提案する物体検出アノテーション提案部１０６を備えてもよい。
　そうすることで、作業分析装置１は、作業判定の精度が不足している場合、アノテーションすれば作業判定の精度を高められる動画中のフレーム画像を自動で提案することができる。

　（３）　（１）又は（２）に記載の作業分析装置１Ａにおいて、作業員の関節位置に関する関節位置情報を推定する関節位置推定部１０８と、関節位置推定部１０８により推定された関節位置情報と、作業ラベル付与部１０２で付与された作業ラベル情報と、に基づいて作業員の作業を推定する関節位置作業推定モデルを作成する関節位置作業学習部１０９と、関節位置作業学習部１０９により生成された関節位置作業推定モデルに基づいて、関節位置情報から作業を推定する関節位置作業推定部１０７３と、を備え、作業判定パラメータ計算部１０５ａは、物体検出モデルを用いた作業判定における物体検出の精度に関わる値と、関節位置作業推定モデルを用いた作業判定における関節位置から推定した作業の分類確率と、に基づいて作業ラベルとの誤差が最小となるように判定基準を算出し、作業判定部１０７ａは、物体検出モデルと関節位置作業推定モデルと判定基準とを用いて新たに入力された映像データにおける作業員の作業を判定してもよい。
　そうすることで、作業分析装置１Ａは、（１）と同様の効果を奏することができる。

　（４）　（１）から（３）のいずれかに記載の作業分析装置１、１Ａにおいて、新たに入力された映像データにおいて動体を検出する動体検出部１０７２をさらに備え、作業判定部１０７、１０７ａは、動体検出部１０７２が動体を検出した時間の間隔に基づいて作業員の作業が続いているか否かを判定してもよい。
　そうすることで、作業分析装置１、１Ａは、より精度良く作業者の作業を判定することができる。

　（５）　（１）から（４）のいずれかに記載の作業分析装置１、１Ａにおいて、判定基準は、少なくとも工具（物体）が検出されてから工具（物体）を使用した作業が継続していると推定できる時間、及び物体検出の精度に関わる値の閾値を含んでもよい。
　そうすることで、作業分析装置１、１Ａは、工具（物体）が検出されない場合でも精度良く作業者の作業を判定することができる。

　１、１Ａ　作業分析装置
　２　カメラ
　１０、１０ａ　制御部
　１０１　作業登録部
　１０２　作業ラベル付与部
　１０３　物体検出アノテーション部
　１０４　物体検出学習部
　１０５、１０５ａ　作業判定パラメータ計算部
　１０６　物体検出アノテーション提案部
　１０７、１０７ａ　作業判定部
　１０７１　物体検出部
　１０７２　動体検出部
　１０７３　関節位置作業推定部
　１０８　関節位置推定部
　１０９　関節位置作業学習部
　２０　記憶部
　２０１　映像データ記憶部
　２０２　作業登録記憶部
　２０３　入力データ記憶部

Claims

　作業員の作業を分析する作業分析装置であって、
　前記作業員の作業を含む映像データに対して、前記作業員の作業を示す作業ラベルを付与する作業ラベル付与部と、
　前記作業ラベルが付与された前記映像データに対して、前記作業員の作業に関連する物体をアノテーションする物体検出アノテーション部と、
　前記物体検出アノテーション部によりアノテーションされた前記物体の映像データから物体検出を行う物体検出モデルを生成する物体検出学習部と、
　前記物体検出モデルを用いて、前記映像データから前記物体を検出する物体検出部と、
　前記作業ラベルが付与された前記映像データの作業判定を行い、付与された作業ラベルとの誤差を最小とする判定基準を算出する作業判定パラメータ計算部と、
　前記物体検出モデルと前記判定基準とを用いて新たに入力された映像データにおける前記作業員の作業を判定する作業判定部と、
　を備える作業分析装置。
　前記作業判定パラメータ計算部により算出された前記判定基準を用いて、前記作業ラベルが付与された前記映像データの作業判定を行い、前記作業判定の判定結果に基づいてアノテーションを行うフレーム画像を提案する物体検出アノテーション提案部を備える、請求項１に記載の作業分析装置。
　前記作業員の関節位置に関する関節位置情報を推定する関節位置推定部と、
　前記関節位置推定部により推定された関節位置情報と、前記作業ラベル付与部で付与された作業ラベル情報と、に基づいて前記作業員の作業を推定する関節位置作業推定モデルを作成する関節位置作業学習部と、
　前記関節位置作業学習部により作成された前記関節位置作業推定モデルに基づいて、前記関節位置情報から作業を推定する関節位置作業推定部と、を備え、
　前記作業判定パラメータ計算部は、前記物体検出モデルを用いた前記作業判定における物体検出の精度に関わる値と、前記関節位置作業推定モデルを用いた前記作業判定における関節位置から推定した作業の分類確率と、に基づいて前記作業ラベルとの誤差が最小となるように前記判定基準を算出し、
　前記作業判定部は、前記物体検出モデルと前記関節位置作業推定モデルと前記判定基準とを用いて新たに入力された映像データにおける前記作業員の作業を判定する、請求項１又は請求項２に記載の作業分析装置。
　前記新たに入力された映像データにおいて動体を検出する動体検出部をさらに備え、
　前記作業判定部は、前記動体検出部が前記動体を検出した時間の間隔に基づいて前記作業員の作業が続いているか否かを判定する、請求項１から請求項３のいずれか１項に記載の作業分析装置。
　前記判定基準は、少なくとも前記物体が検出されてから前記物体を使用した作業が継続していると推定できる時間、及び物体検出の精度に関わる値の閾値を含む、請求項１から請求項４のいずれか１項に記載の作業分析装置。