WO2022208859A1

WO2022208859A1 - 技認識方法、技認識装置および体操採点支援システム

Info

Publication number: WO2022208859A1
Application number: PCT/JP2021/014248
Authority: WO
Inventors: 卓也佐藤
Original assignee: 富士通株式会社
Priority date: 2021-04-01
Filing date: 2021-04-01
Publication date: 2022-10-06
Also published as: EP4316614A4; CN116963808A; US20230405433A1; EP4316614A1; JPWO2022208859A1

Abstract

技認識方法では、骨格検出で得られる骨格情報を取得し、骨格情報に基づいて体操競技に含まれる技のうち一部の技に絞り込む第１の技認識を実行し、第１の技認識で絞り込まれた一部の技の認識に特化した特化型アルゴリズムに従って一部の技のうちいずれの技が演技されたかを認識する第２の技認識を実行する、処理をコンピュータが実行する。

Description

技認識方法、技認識装置および体操採点支援システム

　本発明は、技認識技術に関する。

　体操や医療などの幅広い分野において、選手や患者などの人物の骨格情報を用いて、人物の動作を自動で認識することが行われている。例えば、体操競技における現状の採点方法は複数の審判による目視で行っているが、器具の進化やトレーニング方法の改善により、動きの複雑化をともなう技の高度化が進み、審判による技の認識が困難となる場合が現れている。この結果、審判ごとに選手の採点結果が異なるなど採点の公平性や正確性の維持に懸念が生じている。

　このことから、選手の３次元骨格座標（以降では、「骨格情報」と記載する場合がある）を用いた自動採点技術が利用されている。例えば、３Ｄ（Three－Dimensional）レーザセンサにより選手の３次元点群データを取得し、３次元点群データを用いて選手の骨格情報を算出する。そして、骨格情報の時系列データから「技」に対応する姿勢の特徴を示す特徴量を算出し、骨格情報の時系列データと特徴量とに基づいて選手により実施された技を自動的に認識し、審判に自動採点結果を提供することで、採点の公平性や正確性を高める。

　演技のスコアは、Ｄ（Difficulty）スコアとＥ（Execution）スコアとの合計で算出される。例えば、Ｄスコアは、技の成立不成立に基づいて算出されるスコアである。Ｅスコアは、技の完成度に応じて、減点法により算出されるスコアである。技の成立不成立や技の完成度は、採点規則を記したルールブックに基づく、審判員の目視により判断される。

特開２０２０－８９５３９号公報特開２０２０－３８４４０号公報

　ところで、上記の特徴量には、腰や膝の姿勢などの多くの種目で共通するものから、特定の種目、例えばあん馬固有のもの、例えば手の支持位置まで様々なものが含まれる。このように様々な特徴量の中には、精度よく求めやすいものも含まれれば、精度よく求めにくいものも含まれる。

　しかしながら、精度よく求めにくい特徴量が技の認識で重要となる場面がある。このような場面で特徴量の算出精度が悪い場合、技の誤認識を抑制するのが困難である一面がある。

　１つの側面では、本発明は、技認識の精度向上を実現できる技認識方法、技認識装置および体操採点支援システムを提供することを目的とする。

　一態様の技認識方法では、骨格検出で得られる骨格情報を取得し、前記骨格情報に基づいて体操競技に含まれる技のうち一部の技に絞り込む第１の技認識を実行し、前記第１の技認識で絞り込まれた一部の技の認識に特化した特化型アルゴリズムに従って前記一部の技のうちいずれの技が演技されたかを認識する第２の技認識を実行する、処理をコンピュータが実行する。

　技認識の精度向上を実現できる。

図１は、体操採点支援システムの構成例を示す図である。図２は、骨格認識技術を示す模式図である。図３は、技認識技術を示す模式図である。図４は、技認識装置の機能構成例を示すブロック図である。図５は、仮技の辞書データの一例を示す図である。図６は、倒立ひねりの一例を示す模式図である。図７は、ローテーション情報の一例を示す図である。図８は、ローテーション情報の一例を示す図である。図９は、背面車輪と車輪の一例を示す模式図である。図１０は、技の辞書データの一例を示す図である。図１１は、技認識処理の手順を示すフローチャートである。図１２は、第１の系列の特化型アルゴリズムの一例を示す図である。図１３は、第２の系列の特化型アルゴリズムの一例を示す図である。図１４は、ハードウェア構成例を示す図である。

　以下、添付図面を参照して本願に係る技認識方法、技認識装置および体操採点支援システムの実施例について説明する。各実施例には、あくまで１つの例や側面を示すに過ぎず、このような例示により数値や機能の範囲、利用シーンなどは限定されない。そして、各実施例は、処理内容を矛盾させない範囲で適宜組み合わせることが可能である。

＜システム構成＞
　図１は、体操採点支援システムの構成例を示す図である。図１に示す体操採点支援システム１は、被写体である演技者３の３次元データを撮像し、骨格等を認識して正確な技の採点を行うものである。

　図１に示すように、体操採点支援システム１には、３Ｄレーザセンサ５と、骨格検出装置７と、技認識装置１０とが含まれ得る。

　３Ｄレーザセンサ５は、赤外線レーザ等を用いて対象物までの距離、いわゆる深度を走査点に対応する画素ごとに測定するセンサ装置の一例である。例えば、３Ｄレーザセンサ５の例として、深度画像カメラやＬＩＤＡＲ（Light　Detection　and　Ranging）技術を用いたレーザセンサ、例えばＭＥＭＳ（Micro-Electro-Mechanical　Systems）ミラー型のレーザセンサであってよい。

　骨格検出装置７は、３Ｄレーザセンサ５により測定される深度画像を用いて、演技者３の骨格部位、例えば関節の位置などの骨格情報を検出する骨格検出機能を提供するコンピュータの一例である。なお、骨格検出は、骨格認識、あるいは骨格推定とも呼ばれることがある。

　３Ｄレーザセンサ５および骨格検出装置７により、マーカレスで演技者３の動きの３次元計測を実行する３Ｄセンシングが実現される。

　技認識装置１０は、骨格検出装置７による骨格検出で得られる骨格情報の時系列データを用いて、演技者３により実施される技を認識する技認識機能を提供するコンピュータの一例である。このような技認識機能には、演技者３の技認識結果に基づいて、演技者３の技、さらには演技の採点、例えばＤスコアやＥスコアの算出を実行する自動採点機能がさらにパッケージ化され得る。

　なお、ここでは、あくまで一例として、技認識結果を自動採点に用いる例を挙げたが、技認識結果の利用方法はこれに限定されない。例えば、骨格情報や技認識結果は、採点支援用のアプリケーション（以下、「採点支援アプリ」と記載）へ出力することができる。採点支援アプリは、演技者３の演技におけるフレームごとの関節角度を正面や側面、平面などの複数の視点で表示するマルチアングルビュー、さらには、技認識結果として得られる技名などを表示する技認識ビューといった表示を実現できる。このような採点支援アプリの他、技認識結果は、トレーニングアプリや放映・エンタメコンテンツなどの各種の利用シーンに用いることができる。これらバックエンドの機能やサービスは、必ずしも技認識機能とパッケージ化されずともよく、当然のことながら、技認識装置１０と異なる装置や情報システム、クラウドサービスとして提供されてよい。

＜骨格認識＞
　図２は、骨格認識技術を示す模式図である。図２に示すように、骨格認識機能は、あくまで一例として、機械学習モデルを用いる骨格認識とフィッティングとを組みわせたハイブリッド方式により実現できる。

　例えば、骨格認識には、深度画像を入力として３Ｄ骨格座標の推定値を出力する機械学習モデル７ｍ、例えばＣＮＮ（Convolutional　Neural　Network）系のニューラルネットワークを用いることができる。このような機械学習モデル７ｍの訓練には、深度画像および正解ラベルの３Ｄ骨格座標が対応付けられた訓練データを含むデータセット７ＴＲを用いることができる。例えば、訓練データは、体操競技の３Ｄ骨格座標からコンピュータグラフィックス等により深度画像を生成することにより用意できる。このようなデータセットの下、学習フェイズでは、深度画像を機械学習モデル７ｍの説明変数とし、ラベルを機械学習モデル７ｍの目的変数とし、任意の機械学習のアルゴリズム、例えばディープラーニングなどにしたがって機械学習モデル７ｍを訓練できる。これにより、訓練済みの機械学習モデル７Ｍが得られる。推論フェイズでは、体操器具や演技者３自身によるオクルージョンを克服するように設置された多視点の３Ｄレーザセンサ５Ａ～５Ｎから出力される多視点の深度画像を機械学習モデル７Ｍへ入力する。このように多視点の深度画像が入力された機械学習モデル７Ｍは、演技者３の３Ｄ骨格座標を出力する。

　フィッティングでは、機械学習モデル７Ｍの３Ｄ骨格座標の出力や前フレームにおけるフィッティング結果などを初期値とし、多視点の深度画像が統合された３Ｄ点群に人体モデルを当てはめる。例えば、３Ｄ点群の座標と人体モデルの表面座標との一致度を示す評価関数（尤度）を定義し、最も尤度が高くなる関節角度を最適化により求めることで、３Ｄ骨格座標を決定する。

＜技認識による自動採点＞
　図３は、技認識技術を示す模式図である。図３には、体操競技の一例として、あん馬の技認識が行われる例が示されている。図３に示すように、技認識機能は、３Ｄ骨格座標の時系列データから認識される基本運動間の切れ目で３Ｄ骨格座標の時系列データを分割する（Ｓ１）。ここで言う「基本運動」とは、演技を構成する技に共通する基本となる動きを指し、例えば、技の辞書データ１３Ｂに例示される通り、技ごとに１又は複数の基本運動を関連付けて登録することにより辞書化できる。

　このように分割された３Ｄ骨格座標の時系列データごとに当該時系列データに含まれる基本運動が識別されると共に、当該時系列データから手や足先の位置、肩や腰のひねり角度などといった特徴量が抽出される（Ｓ２及びＳ３）。

　その後、ステップＳ２で識別された基本運動と、ステップＳ３で抽出された特徴量とに基づいて基本技が認識される（Ｓ４）。その上で、ステップＳ４の認識結果として得られる基本技の時系列パターンが技の辞書データ１３Ｂに登録された時系列パターンと照合されることにより、演技者３により実演された技が判定される（Ｓ５）。例えば、図３に示す例で言えば、１番目の基本運動として「正交差倒立」、２番目の基本運動として「下ろして開脚支持」が認識される結果、演技された技が「セア倒立」であると判定される。

　そして、ステップＳ５で判定される技の価値点および実施点を採点規則に従って集計することによりＤスコアおよびＥスコアが算出される（Ｓ６及びＳ８）。なお、ステップＳ８のＥスコアの算出前には、ステップＳ５で判定される技ごとに当該技の演技時に抽出された特徴量が採点規則に定められた減点項目に該当するか否かが判定される（Ｓ７）。このとき、減点項目に該当する場合、ステップＳ８で技の実施点から実施減点が減算される。

　このような技認識は、吊り輪やあん馬、男女の跳馬、平均台などといった５種目の自動採点を実現しつつある。

＜課題の一側面＞
　しかしながら、上記の技認識を実現する体操競技を５種目からさらに拡張するには、特徴量の算出精度のばらつきが妨げとなる場合がある。

　すなわち、上記の特徴量には、腰や膝の姿勢などの多くの種目で共通するものから、特定の種目固有のもの、例えばあん馬であれば手の支持位置まで様々なものが含まれる。このように様々な特徴量の中には、精度よく求めやすいものも含まれれば、精度よく求めにくいものも含まれる一面がある。加えて、体操競技では、１つの種目で様々な運動が行われるので、一律の方法で特徴量を算出するのが困難である一面もある。

　ところが、精度よく求めにくい特徴量が技認識で重要となる場面がある。このような場面で特徴量の算出精度が悪い場合、技の誤認識を抑制するのが困難である一面がある。

　あくまで一例として、技認識が鉄棒や段違い平行棒といった種目に拡張される場合を例に挙げる。鉄棒や段違い平行棒の場合、演技者３の鉄棒や段違い平行棒の握り方が特徴量として算出され得るが、握り方によって技の評価（点数）が変わるので、握り方の算出精度が技認識や自動採点の精度に与える影響が大きい。

　例えば、鉄棒や段違い平行棒の握り方には、順手、逆手、大逆手が含まれ得る。逆手とは、順手から外向きに１８０°ひねった状態を指し、また、大逆手とは、順手から内向きに１８０°ひねった状態を指す。これら逆手および大逆手は、腕のねじりが逆方向であるが、腕のねじれは画像から観測しづらいので、握り方が確定した状態の画像からは審判員などの専門家であっても区別が困難である場合がある。

　このような握り方を高精度に区別するアプローチとして、指の関節位置を取得する参考技術１や腕のローテーション情報を取得する参考技術２などが挙げられる。これら参考技術１および参考技術２は、公知である従来技術とは区別される。

　例えば、参考技術１では、頭や肩、背骨、肘、手首、腰、膝、足首などといった主要関節に加え、指の関節位置をさらに含む３Ｄ骨格座標が取得される。ところが、指のサイズは、他の骨格部位と比べて小さいので、深度画像上で他の骨格部位よりも小さく、かつ細く観測される側面がある。さらに、指は、棒と接触した状態で撮影されるので、多視点の深度画像であってもオクルージョン等も発生しやすい側面がある。これらの側面から、参考技術１では、正しい指の関節位置を取得すること自体がそもそも困難である。加えて、たとえ正しい指の関節位置が取得できたとしても、逆手および大逆手の間で指の関節位置に差が現れにくいので、逆手および大逆手の区別が依然として困難である。

　また、参考技術２では、腕の骨のローテーション情報が取得される。ところが、腕の回転に伴って生じる深度画像の変化は、関節位置の変化に伴って生じる深度画像の変化に比べて小さいので、腕の曲がり度合いにより腕のローテーション情報の算出精度にばらつきが生じる。例えば、腕が伸びている場合、腕が曲がっている場合よりも腕のローテーション情報の算出精度が低下するので、高精度なローテーション情報を取得するのが困難である。この場合、依然として、握り方を区別することはできないので、技認識や自動採点の精度の低下をまねく。

＜課題解決アプローチの一側面＞
　そこで、本実施例に係る技認識機能では、骨格検出で得られる骨格情報に基づいて体操競技に含まれる技のうち一部に絞り込み、絞り込まれた一部の技の認識に特化した特化型アルゴリズムを選択して一部の技のうちいずれの技が演技されたかを認識する。つまり、技の辞書に含まれる全ての技に対応する技認識のアルゴリズムを用いる代わりに、一部の技の認識に特化した特化型アルゴリズムを適用するアプローチにより課題を解決する。

　あくまで一例として、体操競技の一例として、鉄棒を例に挙げる。例えば、演技者３の３Ｄ骨格座標の時系列データと、当該時系列データから算出される演技者３の握り方以外の他の特徴量とにより、基本運動１「前方車輪倒立」、基本運動２「１回ひねり」の順に基本運動が認識された場合を挙げる。この場合、体操競技「鉄棒」に含まれる全ての技のうち、「前方車輪１回ひねり片大逆手」および「前方車輪１回ひねり大逆手」の２つの技に絞り込むことができる。これら２つの技の難度は異なるので、Ｄスコアの集計時に加算される価値点にも差が生じる。

　図３に示すように、上記２つの技の情報が特徴量の算出にフィードバックされることにより、上記２つの技の認識に特化した特化型アルゴリズムの一例として、上記２つの技を区別する決め手となる握り方の特徴量を算出するアルゴリズムを適用できる。このようなアルゴリズムは、１つの側面として、演技の構成またはルールなどの制約条件の下で成立するロジックに基づいて構築され得る。すなわち、倒立ひねり時の軸手でない手が棒を掴むまでという制約条件の下で、その肘は伸展しているよりも屈曲している可能性の方が高いというヒューリスティックが存在する。このため、上記の制約条件の下で、肘の伸展時にフィッティングに用いられる腕のローテーション情報の信用度よりも肘の屈曲時にフィッティングに用いられる腕のローテーション情報の信用度が高いというロジックが成立する。このようなロジックに基づいて、握り方の特徴量の算出時の補助情報として、演技者３の骨格情報の時系列データと共に腕の屈曲時のローテーション情報を用いるアルゴリズムが適用される。このようなアルゴリズムが適用されることで、演技者３の骨格情報の時系列データから握り方の特徴量が算出される場合よりも、握り方の特徴量を高精度に算出できる。この結果、高精度な特徴量を用いて技認識が実行されることになる。

　したがって、本実施例に係る技認識機能によれば、技認識の精度向上を実現することが可能になる。ひいては、自動採点や採点支援、トレーニング、エンタメコンテンツなどのバックエンドの機能やサービスの精度向上も実現される。

＜技認識装置１０の構成＞
　図４は、技認識装置１０の機能構成例を示すブロック図である。図４には、技認識装置１０が有する技認識機能に対応するブロックが模式化されている。図４に示すように、技認識装置１０は、通信インタフェイス部１１と、記憶部１３と、制御部１５とを有する。なお、図１には、上記の技認識機能に関連する機能部が抜粋して示されているに過ぎず、骨格検出機能や自動採点機能の他、既存のコンピュータがデフォルトまたはオプションで装備する機能が技認識装置１０に備わることとしてもよい。

　通信インタフェイス部１１は、他の装置、例えば骨格検出装置７との間で通信制御を行う通信制御部の一例に対応する。あくまで一例として、通信インタフェイス部１１は、ＬＡＮ（Local　Area　Network）カードなどのネットワークインターフェイスカードにより実現され得る。１つの側面として、通信インタフェイス部１１は、骨格検出装置７から３Ｄ骨格座標、あるいはフィッティング後の３Ｄ骨格座標を含む骨格情報を受け付けたり、技認識結果、あるいは自動採点結果などを図示しない外部装置へ出力したりする。

　記憶部１３は、各種のデータを記憶する機能部である。あくまで一例として、記憶部１３は、ストレージ、例えば内部、外部または補助のストレージにより実現される。例えば、記憶部１３は、仮技の辞書データ１３Ａと、技の辞書データ１３Ｂとを記憶する。これら仮技の辞書データ１３Ａおよび技の辞書データ１３Ｂ以外にも、記憶部１３は、技認識結果や自動採点結果などの各種のデータを記憶することができる。なお、仮技の辞書データ１３Ａおよび技の辞書データ１３Ｂの各データの説明は、参照または生成が行われる処理の説明と合わせて後述する。

　制御部１５は、技認識装置１０の全体制御を行う処理部である。例えば、制御部１５は、ハードウェアプロセッサにより実現される。図１に示すように、制御部１５は、取得部１５Ａと、第１算出部１５Ｂと、第１認識部１５Ｃと、選択部１５Ｄと、第２算出部１５Ｅと、第２認識部１５Ｆとを有する。なお、図１には、技認識機能に対応する機能が抜粋して示されているが、骨格検出機能がさらに含まれてもよいし、自動採点や採点支援、トレーニング、エンタメコンテンツなどのバックエンドの機能がさらに含まれてもよい。

　取得部１５Ａは、骨格情報を取得する処理部である。あくまで一例として、取得部１５Ａは、骨格検出装置７から骨格情報の時系列データを取得することができる。ここで、取得部１５Ａが骨格情報を取得する情報ソースは、任意の情報ソースであってよく、ネットワークＮＷを介する通信に限定されない。例えば、取得部１５Ａは、技認識装置１０が有するストレージ、あるいは技認識装置１０に着脱可能なリムーバブルメディア、例えばメモリカードやＵＳＢ（Universal　Serial　Bus）メモリなどから骨格情報を取得することとしてもよい。

　第１算出部１５Ｂは、体操競技の技を絞り込む第１の技認識に用いられる第１の特徴量を算出する処理部である。あくまで一例として、第１算出部１５Ｂは、骨格情報の時系列データから第１の特徴量を算出する。この際、第１算出部１５Ｂは、技の辞書データ１３Ｂに定義された全ての項目、例えば図３に例示された項目に関する特徴量を算出することもできるが、第１の特徴量に絞り込んで算出を実行することもできる。

　ここで言う「第１の特徴量」とは、あくまで体操競技の全ての技のうち一部の技、すなわち１又は複数の技に絞り込む特徴量を指し、必ずしも全ての項目に関する特徴量が含まれずともよい。このような第１の特徴量の例として、技の辞書データ１３Ｂに定義される特徴量のうち精度よく求め易い特徴量が挙げられる。例えば、算出精度が閾値以上である特徴量を第１の特徴量として用いることができる。更なる加重要件として、精度が安定している特徴量、例えば算出精度のばらつき、例えば分散が閾値未満である特徴量を第１の特徴量として用いることもできる。

　第１認識部１５Ｃは、第１の技認識を実行する処理部である。あくまで一例として、第１の技認識には、国際公開第２０１９／１１６４９５号に記載された技認識技術を用いることができる。

　一実施形態として、第１認識部１５Ｃは、骨格情報の時系列データと、第１算出部１５Ｂにより算出された第１の特徴量とを用いて第１の技認識を実行することができる。より詳細には、第１認識部１５Ｃは、３Ｄ骨格座標の時系列データから認識される基本運動間の切れ目で３Ｄ骨格座標の時系列データを分割する。そして、第１認識部１５Ｃは、分割された部分時系列データごとに当該部分時系列データに含まれる基本運動を識別する。その後、第１認識部１５Ｃは、識別された基本運動と、第１算出部１５Ｂにより算出された第１の特徴量とに基づいて基本技を認識する。その上で、第１認識部１５Ｃは、認識結果として得られる基本技の時系列パターンと、仮技の辞書データ１３Ａに登録された時系列パターンとを照合することにより、体操競技の全ての技のうち演技者３により実演された技の候補を絞り込む。以下、第１の技認識により暫定的に絞り込まれる技のことを、後述の第２の技認識により一意に識別される実演の技と区別する側面から、「仮技」と記載する場合がある。

　図５は、仮技の辞書データ１３Ａの一例を示す図である。図５には、あくまで一例として、体操競技「鉄棒」に関する仮技の辞書データ１３Ａが示されている。図５に示すように、仮技の辞書データ１３Ａには、仮技ごとに技の候補の集合および基本技の時系列パターンが対応付けられたデータを採用できる。さらに、基本技には、基本運動および特徴量などの項目が含まれ得る。ここで、仮技の辞書データ１３Ａは、あくまで１つの側面として、仮技の絞り込みに用いられる。このような側面から、仮技の辞書データ１３Ａには、仮技の中から実演の技を一意に識別する第２の技認識により用いられる第２の特徴量が必ずしも含まれずともよい。

　図５に示す仮技の辞書データ１３Ａに定義された基本技の時系列パターンと、第１算出部１５Ｂにより算出される第１の特徴量を用いて基本運動「前方車輪倒立」、基本運動「１回ひねり」の順に認識された基本技の時系列パターンとが照合される例に挙げる。この場合、仮技ＩＤ「００１」で識別される仮技、すなわち候補１「前方車輪１回ひねり片大逆手」および候補２「前方車輪１回ひねり大逆手」の２つの技に絞り込まれる。つまり、２つの技を区別する決め手となる第２の特徴量「握り方」の照合条件がＡＮＹに緩和されることで、識別の代わりに絞り込みとして機能している。

　また、図５に示す仮技の辞書データ１３Ａと、第１算出部１５Ｂにより算出される第１の特徴量を用いて基本運動「前方車輪倒立」、基本運動「１／２回ひねり」の順に認識された基本技の時系列パターンとが照合される例に挙げる。この場合、仮技ＩＤ「００２」で識別される仮技、すなわち候補１「前方車輪ひねり倒立」に絞り込まれる。この前方車輪ひねり倒立は、握り方が不問の技であるので、第２の技認識の実行を待たず、１つに絞り込まれる。

　さらに、図５に示す仮技の辞書データ１３Ａと、第１算出部１５Ｂにより算出される第１の特徴量を用いて基本運動「前方車輪倒立」のみが認識された基本技の時系列パターンとが照合される例に挙げる。この場合、仮技ＩＤ「００３」で識別される仮技、すなわち候補１「前方車輪」および候補２「大逆手車輪」に絞り込まれる。つまり、候補１「前方車輪」および候補２「大逆手車輪」の２つの技を区別する決め手となる第２の特徴量「握り方」の照合条件がＡＮＹに緩和されることで、識別の代わりに絞り込みとして機能している。

　選択部１５Ｄは、第１認識部１５Ｃにより絞り込まれた一部の技の認識に特化した特化型アルゴリズムを選択する処理部である。あくまで一例として、選択部１５Ｄは、第１認識部１５Ｃによる仮技認識結果が得られた場合、当該仮技認識結果として得られた仮技に関連付けられた関数名に従って仮技として絞り込まれた技候補の特化型アルゴリズムを呼び出すことができる。例えば、仮技の辞書データ１３Ａにおいて仮技ＩＤに関数名をさらに関連付けて登録しておくことにより、特化型アルゴリズムを呼び出すことができる。この他、仮技の辞書データ１３Ａとは別に、仮技と関数名との対応関係が定義されたデータベース、例えばルックアップテーブルを用いてもよい。

　第２算出部１５Ｅは、第２の特徴量を算出する処理部である。１つの側面として、第２算出部１５Ｅは、選択部１５Ｄにより選択された特化型アルゴリズムに従って、第１の技認識で絞り込まれた技候補の中から実演の技を区別する決め手となる第２の特徴量を算出する。このような特化型アルゴリズムは、演技の構成またはルールなどの制約条件の下で成立するロジックに基づいて構築され得る。

　ここで、特化型アルゴリズムの一例として、倒立ひねりでひねった後の握り方により難度が異なる第１の系列の技候補を区別する決め手となる第２の特徴量「握り方」を算出する例を挙げる。このような技候補の組合せのあくまで一例として、図５に示された仮技ＩＤ「００１」で識別される仮技に含まれる候補１「前方車輪１回ひねり片大逆手」及び候補２「前方車輪１回ひねり大逆手」が挙げられる。これに限らず、第１の系列には、下記（１）～下記（３）を始め、多数の技候補の組合せが存在する。
（１）「後方とび車輪３／２ひねり片大逆手」及び「後方とび車輪３／２ひねり大逆手」
（２）「シュタルダーひねり倒立」及び「シュタルダーひねり大逆手」
（３）「シュタルダーとび車輪３／２ひねり片大逆手」及び「シュタルダーとび車輪３／２ひねり大逆手」

　図６は、倒立ひねりの一例を示す模式図である。図６には、時間ｔの流れが矢印の方向で示されると共に、時刻ｔ１１から時刻ｔ１４までの演技者３の姿勢Ｐ１１～Ｐ１４が模式化して示されている。図６に示すように、時刻ｔ１１では、演技者３の左手が軸手とされる一方で、軸手でない右手は棒から離された状態で倒立の姿勢へ移行している。その後、時刻ｔ１２～時刻ｔ１４では、演技者３の左手を軸手として倒立された状態で１回ひねりが行われている。ここで、時刻ｔ１１における右肘関節によれば、倒立ひねりへの移行時に軸手でない右手が棒を掴むまでの間という制約条件の下で、右肘が伸展している可能性よりも屈曲している可能性の方が高いというヒューリスティックとして存在することが明らかである。それ故、第１の系列に属する技候補では、上記の制約条件の下で、肘の伸展時にフィッティングに用いる腕のローテーション情報よりも肘の屈曲時にフィッティングに用いる腕のローテーション情報の信用度が高いというロジックが成立し得る。このようなロジックに基づいて、第２の特徴量の算出時の補助情報として、演技者３の骨格情報の時系列データと共に、肘の屈曲時のローテーション情報を用いる特化型アルゴリズムが構築される。

　より詳細には、まず、第２算出部１５Ｅは、演技者３の軸手を識別する。例えば、手首の関節位置と鉄棒の位置との距離が小さい方の手が「軸手」と推定できる。そして、第２算出部１５Ｅは、第１の技認識時で基本運動「１回ひねり」と認識された第１の特徴量のうち特定種類の特徴量、例えば体の回転方向や体の回転量などに基づいて、演技者３の軸手の握り方を推定する。このとき、演技者３の軸手の握り方が「大逆手」である場合、第２算出部１５Ｅは、次のような処理を実行する。すなわち、第２算出部１５Ｅは、演技者３の軸手でない方の手首と鉄棒との距離が閾値以上である区間の骨格検出でフィッティングに用いられた腕のローテーション情報に基づいて演技者３の軸手でない方の手の握り方を推定する。そして、軸手でない方の手の握り方が大逆手である場合、第２算出部１５Ｅは、第２の特徴量の握り方を「大逆手」と算出する。一方、軸手でない方の手の握り方が大逆手でない場合、第２算出部１５Ｅは、第２の特徴量の握り方を「大逆手以外」と算出する。

　図７及び図８は、ローテーション情報の一例を示す図である。図７及び図８には、ローテーション情報のあくまで一例として、倒立ひねりを行う演技者３の軸手でない方の右手の上腕および前腕のローテーション値、例えば回転角度の合計値の時間波形が示されている。図７には、演技者３の右手が棒を逆手で握る例が示されている一方で、図８には、演技者３の右手が棒を大逆手で握る例が示されている。なお、図７及び図８では、グラフの縦軸がローテーション値を指し、グラフの横軸が時間を指す。

　図７及び図８に示すように、握り方が逆手である場合と握り方が大逆手である場合とでは、手首をひねる方向が逆になるので、ローテーション値の増減も逆になることが明らかである。また、図７及び図８には、軸手でない方の手が右手である場合を例に挙げたが、軸手でない方の手が左手である場合、右手と左手では手首をひねる方向が逆になるので、ローテーション値の増減も逆になる。具体的には、右手を順手から時計回りにひねると逆手になり、右手を反時計回りにひねると大逆手になる一方で、左手を順手から時計回りにひねると大逆手になり、左手を反時計回りにひねると逆手になる。このような特性から、演技者３の軸手でない方の腕のローテーション値の増減に基づいて握り方が大逆手であるか否かを区別することができる。

　なお、図７及び図８には、上腕および前腕のローテーション値を用いる例を挙げたが、これはあくまで一例に過ぎず、上腕のローテーション値または前腕のローテーションのうち少なくともいずれか一方を用いることができる。

　特化型アルゴリズムの他の一例として、直前の技における特定の運動の有無および特定の運動後における握り替えの有無により難度が異なる第２の系列の技候補を区別する決め手となる第２の特徴量「握り方」を算出する例を挙げる。このような技候補の組合せのあくまで一例として、図５に示された仮技ＩＤ「００３」で識別される仮技に含まれる候補１「前方車輪」及び候補２「大逆手車輪」が挙げられる。これに限らず、上記の第２の系列には、下記（１）～下記（２）を始め、多数の技候補の組合せが存在する。
（１）「エンドー」及び「大逆手エンドー」
（２）「エンドー１回ひねり片大逆手」及び「大逆手エンドー１回ひねり片大逆手倒立」

　第２の系列に属する技候補には、下記（イ）および下記（ロ）の制約条件の下で下記（ハ）および下記（ニ）のロジックが成立する。
（イ）握り以外の動きは同一である
（ロ）大逆手に握り替えるのは簡単ではなく、特定の運動を伴う必要がある
（ハ）特定の運動の例として、アドラー系の技や倒立ひねりなどが該当する
（ニ）技候補に対応する運動の直前に、特定の運動をしなければ大逆手ではないと判断でき、特定の運動をしていても技候補とみられる運動を完了する前に手を離して握り替えをすれば大逆手ではないと判断できる

　このようなロジックに基づいて、次のような特化型アルゴリズムが構築される。より詳細には、第２算出部１５Ｅは、前の技、例えば第２の技認識が実行済みである技認識結果のうち直近の技認識結果がアドラー系の技であるか否かを判定する。このとき、アドラー系の技でない場合、第２算出部１５Ｅは、前の技が倒立ひねりであるか否かを判定する。そして、前の技が倒立ひねりである場合、第２算出部１５Ｅは、前の技の第２の技認識に用いられた第２の特徴量に基づいて握り方が「大逆手」であるか否かを判定する。このとき、握り方が「大逆手」である場合、第２算出部１５Ｅは、認識中の技が完了するまでの途中で握り替えが行われたか否か、例えば手首の関節位置と鉄棒の位置との距離が閾値以上であるタイミングが存在するか否かを判定する。

　ここで、前の技がアドラー系の技または倒立ひねりで握り方が大逆手の技で、技の途中で握り替えが行われていない場合、第２算出部１５Ｅは、第２の特徴量の握り方を「大逆手」と算出する。一方、前の技がアドラー系の技または倒立ひねりで握り方が大逆手の技であっても技の途中で握り替えが行われている場合、前の技が倒立ひねりでない場合、前の技が倒立ひねりであっても握り方が大逆手でない場合、第２算出部１５Ｅは、第２の特徴量の握り方を「大逆手以外」と算出する。

　特化型アルゴリズムの更なる一例として、第２の特徴量を高精度に算出する条件判定等のロジック化が困難である第３の系列の技候補を区別する決め手となる第２の特徴量を算出する例を挙げる。このような技候補の組合せのあくまで一例として、「背面車輪」及び「通常の車輪」、「逆手背面車輪」及び「前方車輪」、「順手背面車輪」及び「後方車輪」などが挙げられる。

　図９は、背面車輪と車輪の一例を示す模式図である。図９には、背面車輪を実施する演技者３Ａの姿勢Ｐ２１～Ｐ２２と、通常の車輪を実施する演技者３Ｂの姿勢Ｐ３１～Ｐ３２とが左右に並べて示されている。演技者３Ａの姿勢Ｐ２１～Ｐ２２と、演技者３Ｂの姿勢Ｐ３１～Ｐ３２とを対比すれば、図９に示すように、両者の間に肩の形状が異なるものの、肩の形状には個人差があるので、脇の角度等と閾値とを比較するのでは技を高精度に区別するのが困難である。

　この場合、あくまで一例として、骨格情報、あるいは骨格情報の時系列データを入力とし、第２の特徴量の値に対応するクラス、例えば脇の開閉を出力する機械学習モデルを用いる特化型アルゴリズムが適用され得る。このような機械学習モデルの訓練には、脇の開閉の正解ラベルが付与された骨格情報が訓練データとして用いられる。例えば、学習フェイズでは、骨格情報を機械学習モデルの説明変数とし、ラベルを機械学習モデルの目的変数とし、任意の機械学習のアルゴリズム、例えばディープラーニングなどにしたがって機械学習モデルを訓練できる。これにより、訓練済みの機械学習モデルが得られる。推論フェイズでは、フィッティング結果として得られる骨格情報を訓練済みの機械学習モデルへ入力する。このように骨格情報が入力された機械学習モデルは、脇の開閉に対応するクラスを出力する。

　このように機械学習モデルへ入力される訓練データや入力データの範囲を第１の技認識で絞り込まれた第３の系列の技候補に対応する骨格情報に絞り込むことで、第２の特徴量の高精度化を実現できる。なお、ここでは、第３の系列に属する技候補を対象に機械学習モデルを用いる特化型アルゴリズムを適用する例を挙げたが、第１の系列や第２の系列に属する技候補を対象に機械学習モデルを用いる特化型アルゴリズムを適用することもできる。この場合、機械学習モデルの目的変数とするラベルを第１の系列または第２の系列に対応する第２の特徴量と読み替えることにより容易に実現できる。

　第２認識部１５Ｆは、第２の技認識を実行する処理部である。あくまで一例として、第２の技認識にも、国際公開第２０１９／１１６４９５号に記載された技認識技術を用いることができる。

　一実施形態として、第２認識部１５Ｆは、第１の技認識で得られた仮技認識結果と、第２算出部１５Ｅにより算出された第２の特徴量とを用いて第２の技認識を実行することができる。この記載は、骨格情報の時系列データや第１の特徴量が第２の技認識に用いられることを妨げるものではない。ここで、第２の技認識の実行時には、第１の技認識と重複する部分の処理はスキップできる。例えば、３Ｄ骨格座標の時系列データの分割や基本運動の認識を省略できる。この場合、第２認識部１５Ｆは、技の辞書データ１３Ｂに定義された基本技のうち第１の技認識で絞り込まれた技候補に対応する技の基本技を対象とし、対象とされた基本技のうち第２算出部１５Ｅにより算出された第２の特徴量が対応する基本技を認識する。その上で、第２認識部１５Ｆは、認識結果として得られる基本技の時系列パターンと、技の辞書データ１３Ｂに登録された時系列パターンとを照合することにより、第１の技認識で絞り込まれた技候補のうち演技者３により実演された技を認識する。

　図１０は、技の辞書データ１３Ｂの一例を示す図である。図１０には、あくまで一例として、体操競技「鉄棒」に関する技の辞書データ１３Ｂが示されている。図１０に示すように、技の辞書データ１３Ｂには、技ごとに基本技の時系列パターンが対応付けられたデータを採用できる。さらに、基本技には、基本運動および特徴量などが含まれ得る。

　例えば、第１の技認識により、第１の系列に属する候補１「前方車輪１回ひねり片大逆手」および候補２「前方車輪１回ひねり大逆手」の２つの技に絞り込まれた例を挙げる。この場合、握り方の第２の特徴量が「大逆手以外」である場合、第２の技認識では、技名「前方車輪１回ひねり片大逆手」が認識される。一方、握り方の第２の特徴量が「大逆手」である場合、第２の技認識では、技名「前方車輪１回ひねり大逆手」が認識される。

　また、第１の技認識により、第２の系列に属する候補１「前方車輪」および候補２「大逆手車輪」の２つの技に絞り込まれた例を挙げる。この場合、握り方の第２の特徴量が「大逆手以外」である場合、第２の技認識では、技名「前方車輪」が認識される。一方、握り方の第２の特徴量が「大逆手」である場合、第２の技認識では、技名「大逆手車輪」が認識される。

　また、第１の技認識により、第３の系列に属する候補１「背面車輪」及び候補２「通常の車輪」の２つの技に絞り込まれた例を挙げる。この場合、脇の開閉の第２の特徴量が「開」である場合、第２の技認識では、技名「背面車輪」が認識される。一方、脇の開閉の第２の特徴量が「閉」である場合、第２の技認識では、技名「前方車輪」が認識される。

　このように第２の技認識で得られた技認識結果は、次のような出力先へ出力できる。例えば、演技者３の技、さらには演技の採点、例えばＤスコアやＥスコアの算出を実行する自動採点機能を始め、採点支援、トレーニング、エンタメコンテンツなどのバックエンドの機能やサービスなどが挙げられる。

＜処理の流れ＞
　以下、本実施例に係る技認識装置１０が実行する（１）技認識処理を説明する。さらに、技認識処理のステップＳ１０５で第２の特徴量の算出に用いられる特化型アルゴリズムの例として、（２）第１の系列に適用される特化型アルゴリズムおよび（３）第２の系列に適用される第２の系列の特化型アルゴリズムを例に挙げて説明する。

（１）技認識処理
　図１１は、技認識処理の手順を示すフローチャートである。あくまで一例として、技認識処理は、骨格検出装置７から骨格情報の出力が継続する限り、反復して実行できる。また、技認識処理は、フレーム単位で骨格情報が取得されるリアルタイム処理であってもよいし、一定期間、あるいは特定のフレーム数にわたって蓄積された骨格情報の時系列データをまとめて取得するバッチ処理であってもよい。

　図１１に示すように、取得部１５Ａにより骨格情報が取得されると（ステップＳ１０１）、第１算出部１５Ｂは、ステップＳ１０１で取得された骨格情報から、体操競技の技を絞り込む第１の技認識に用いる第１の特徴量を算出する（ステップＳ１０２）。

　続いて、第１認識部１５Ｃは、ステップＳ１０１で取得された骨格情報と、ステップＳ１０２で算出された第１の特徴量とを用いて、体操競技の全ての技のうち演技者３により実演された技の候補を絞り込む第１の技認識を実行する（ステップＳ１０３）。

　そして、選択部１５Ｄは、ステップＳ１０３で絞り込まれた一部の技の認識に特化した特化型アルゴリズムを選択する（ステップＳ１０４）。続いて、第２算出部１５Ｅは、ステップＳ１０４で選択された特化型アルゴリズムに従って、第１の技認識で絞り込まれた技候補の中から実演の技を区別する決め手となる第２の特徴量を算出する（ステップＳ１０５）。

　その後、第２認識部１５Ｆは、ステップＳ１０３で得られた仮技認識結果と、ステップＳ１０５で算出された第２の特徴量とを用いて、第１の技認識で絞り込んだ技候補のうち演技者３により実演された技を認識する第２の技認識を実行する（ステップＳ１０６）。

（２）第１の系列の特化型アルゴリズム
　図１２は、第１の系列の特化型アルゴリズムの一例を示す図である。この処理は、図１１に示されたステップＳ１０５の処理に対応し、例えば、ステップＳ１０４で第１の系列の特化型アルゴリズムが選択された場合に起動される。

　図１２に示すように、第２算出部１５Ｅは、演技者３の軸手を識別する（ステップＳ３０１）。例えば、手首の関節位置と鉄棒の位置との距離が小さい方の手が「軸手」と推定できる。

　そして、第２算出部１５Ｅは、第１の技認識時で基本運動「１回ひねり」と認識された第１の特徴量のうち特定種類の特徴量、例えば体の回転方向や体の回転量などに基づいて、演技者３の軸手の握り方を推定する（ステップＳ３０２）。

　このとき、演技者３の軸手の握り方が「大逆手」である場合（ステップＳ３０３Ｙｅｓ）、第２算出部１５Ｅは、次のような処理を実行する。すなわち、第２算出部１５Ｅは、演技者３の軸手でない方の手首と鉄棒との距離が閾値以上である区間の骨格検出でフィッティングに用いられた腕のローテーション情報に基づいて演技者３の軸手でない方の手の握り方を推定する（ステップＳ３０４）。

　ここで、軸手でない方の手の握り方が大逆手である場合（ステップＳ３０５Ｙｅｓ）、第２算出部１５Ｅは、第２の特徴量の握り方を「大逆手」と算出する（ステップＳ３０６）。一方、演技者３の軸手の握り方が「大逆手」である場合または軸手でない方の手の握り方が大逆手でない場合（ステップＳ３０３ＮｏまたはステップＳ３０５Ｎｏ）、第２算出部１５Ｅは、第２の特徴量の握り方を「大逆手以外」と算出する（ステップＳ３０７）。

（３）第２の系列の特化型アルゴリズム
　図１３は、第２の系列の特化型アルゴリズムの一例を示す図である。この処理は、図１１に示されたステップＳ１０５の処理に対応し、例えば、ステップＳ１０４で第２の系列の特化型アルゴリズムが選択された場合に起動される。

　図１３に示すように、第２算出部１５Ｅは、前の技、例えば第２の技認識が実行済みである技認識結果のうち直近の技認識結果がアドラー系の技であるか否かを判定する（ステップＳ５０１）。なお、前の技がアドラー系の技である場合（ステップＳ５０１Ｙｅｓ）、ステップＳ５０４の処理へ移行する。

　このとき、アドラー系の技でない場合（ステップＳ５０１Ｎｏ）、第２算出部１５Ｅは、前の技が倒立ひねりであるか否かを判定する（ステップＳ５０２）。さらに、前の技が倒立ひねりである場合（ステップＳ５０２Ｙｅｓ）、第２算出部１５Ｅは、前の技の第２の技認識に用いられた第２の特徴量に基づいて握り方が「大逆手」であるか否かをさらに判定する（ステップＳ５０３）。

　そして、握り方が「大逆手」である場合（ステップＳ５０３Ｙｅｓ）、第２算出部１５Ｅは、次のような処理を実行する。すなわち、第２算出部１５Ｅは、認識中の技が完了するまでの途中で握り替えが行われたか否か、例えば手首の関節位置と鉄棒の位置との距離が閾値以上であるタイミングが存在するか否かを判定する（ステップＳ５０４）。

　ここで、前の技がアドラー系の技または倒立ひねりで握り方が大逆手の技で、技の途中で握り替えが行われていない場合（ステップＳ５０４Ｎｏ）、第２算出部１５Ｅは、第２の特徴量の握り方を「大逆手」と算出する（ステップＳ５０５）。

　一方、前の技がアドラー系の技または倒立ひねりで握り方が大逆手の技であるが技の途中で握り替えがある場合、前の技がアドラー系または倒立ひねりでない場合、前の技が倒立ひねりであっても握り方が大逆手でない場合、第２算出部１５Ｅは、第２の特徴量の握り方を「大逆手以外」と算出する（ステップＳ５０６）。なお、ステップＳ５０６に進む分岐には、ステップＳ５０２Ｎｏ、ステップＳ５０３ＮｏまたはステップＳ５０４Ｙｅｓが対応する。

＜効果の一側面＞
　上述してきたように、本実施例に係る技認識装置１０は、骨格検出で得られる骨格情報に基づいて技の辞書に含まれる技を一部に絞り込み、絞り込んだ一部の技の認識に特化した特化型アルゴリズムを選択して一部の技のうちいずれの技が演技されたかを認識する。したがって、本実施例に係る技認識装置１０によれば、技認識の精度向上を実現することが可能である。ひいては、自動採点や採点支援、トレーニング、エンタメコンテンツなどのバックエンドの機能やサービスの精度向上も実現される。

　さて、これまで開示の装置に関する実施例について説明したが、本発明は上述した実施例以外にも、種々の異なる形態にて実施されてよいものである。そこで、以下では、本発明に含まれる他の実施例を説明する。

＜第２の特徴量算出をスキップ＞
　上記の実施例１では、特化型アルゴリズムの一例として、技候補を区別する第２の特徴量を高精度に算出してから第２の技認識を実行する例を挙げたが、必ずしも第２の特徴量の算出が実行されずともよい。例えば、第２の特徴量の算出をスキップして第２の技認識を実行することもできる。

　例えば、第１の系列に属する技候補の一例として、仮技ＩＤ「００１」で識別される仮技、すなわち候補１「前方車輪１回ひねり片大逆手」および候補２「前方車輪１回ひねり大逆手」の２つの技に絞り込まれる例を挙げる。この場合、図１２に示すステップＳ３０５Ｙｅｓの分岐に進む場合、第２認識部１５Ｆは、第１の技認識で絞り込んだ技候補のうち演技者３により実演された技を「前方車輪１回ひねり大逆手」と認識する。一方、ステップＳ３０３ＮｏまたはステップＳ３０５Ｎｏの分岐に進む場合、第２認識部１５Ｆは、第１の技認識で絞り込んだ技候補のうち演技者３により実演された技を「前方車輪１回ひねり片大逆手」と認識する。このようにして第２の特徴量の算出をスキップすることとしてもよい。

　また、第２の系列に属する技候補の一例として、仮技ＩＤ「００３」で識別される仮技、すなわち候補１「前方車輪」および候補２「大逆手車輪」に絞り込まれる例を挙げる。この場合、図１３に示すステップＳ５０１ＹｅｓまたはステップＳ５０４Ｎｏの分岐に進む場合、第２認識部１５Ｆは、第１の技認識で絞り込んだ技候補のうち演技者３により実演された技を「大逆手車輪」と認識する。一方、ステップＳ５０２Ｎｏ、ステップＳ５０３ＮｏまたはステップＳ５０４Ｙｅｓの分岐に進む場合、第２認識部１５Ｆは、第１の技認識で絞り込んだ技候補のうち演技者３により実演された技を「前方車輪」と認識する。このようにして第２の特徴量の算出をスキップすることとしてもよい。

　さらに、第３の系列に属する技候補の一例として、「背面車輪」及び「通常の車輪」に絞り込まれる例を挙げる。この場合、骨格情報、あるいは骨格情報の時系列データを入力とし、技名に対応するクラス、例えば「背面車輪」または「通常の車輪」を出力する機械学習モデルを用いる。このような機械学習モデルの訓練には、「背面車輪」または「通常の車輪」の正解ラベルが付与された骨格情報が訓練データとして用いられる。例えば、学習フェイズでは、骨格情報を機械学習モデルの説明変数とし、ラベルを機械学習モデルの目的変数とし、任意の機械学習のアルゴリズム、例えばディープラーニングなどにしたがって機械学習モデルを訓練できる。これにより、訓練済みの機械学習モデルが得られる。推論フェイズでは、フィッティング結果として得られる骨格情報を訓練済みの機械学習モデルへ入力する。このように骨格情報が入力された機械学習モデルは、「背面車輪」または「通常の車輪」のクラスを出力する。このようにして第２の特徴量の算出をスキップすることとしてもよい。

　なお、ここでは、第３の系列に属する技候補に機械学習モデルを用いる特化型アルゴリズムを適用する例を挙げたが、第１の系列や第２の系列に属する技候補に機械学習モデルを用いる特化型アルゴリズムを適用することもできる。この場合、機械学習モデルの目的変数とするラベルを第１の系列または第２の系列に対応する技候補の技名と読み替えることにより容易に実現できる。

＜分散および統合＞
　また、図示した各装置の各構成要素は、必ずしも物理的に図示の如く構成されていることを要しない。すなわち、各装置の分散・統合の具体的形態は図示のものに限られず、その全部または一部を、各種の負荷や使用状況などに応じて、任意の単位で機能的または物理的に分散・統合して構成することができる。例えば、取得部１５Ａ、第１算出部１５Ｂ、第１認識部１５Ｃ、選択部１５Ｄ、第２算出部１５Ｅまたは第２認識部１５Ｆを技認識装置１０の外部装置としてネットワーク経由で接続するようにしてもよい。また、取得部１５Ａ、第１算出部１５Ｂ、第１認識部１５Ｃ、選択部１５Ｄ、第２算出部１５Ｅまたは第２認識部１５Ｆを別の装置がそれぞれ有し、ネットワーク接続されて協働することで、上記の技認識装置１０の機能を実現するようにしてもよい。また、記憶部１３に記憶される仮技の辞書データ１３Ａまたは技の辞書データ１３Ｂの全部または一部を別の装置がそれぞれ有し、ネットワーク接続されて協働することで、上記の技認識装置１０の機能を実現するようにしてもかまわない。

［技認識プログラム］
　また、上記の実施例で説明した各種の処理は、予め用意されたプログラムをパーソナルコンピュータやワークステーションなどのコンピュータで実行することによって実現することができる。そこで、以下では、図１３を用いて、実施例１及び実施例２と同様の機能を有する技認識プログラムを実行するコンピュータの一例について説明する。

　図１３は、ハードウェア構成例を示す図である。図１３に示すように、コンピュータ１００は、操作部１１０ａと、スピーカ１１０ｂと、カメラ１１０ｃと、ディスプレイ１２０と、通信部１３０とを有する。さらに、このコンピュータ１００は、ＣＰＵ１５０と、ＲＯＭ１６０と、ＨＤＤ１７０と、ＲＡＭ１８０とを有する。これら１１０～１８０の各部はバス１４０を介して接続される。

　ＨＤＤ１７０には、図１３に示すように、上記の実施例１で示された取得部１５Ａ、第１算出部１５Ｂ、第１認識部１５Ｃ、選択部１５Ｄ、第２算出部１５Ｅ及び第２認識部１５Ｆと同様の機能を発揮する技認識プログラム１７０ａが記憶される。この技認識プログラム１７０ａは、図４に示された取得部１５Ａ、第１算出部１５Ｂ、第１認識部１５Ｃ、選択部１５Ｄ、第２算出部１５Ｅ及び第２認識部１５Ｆの各構成要素と同様、統合又は分離してもかまわない。すなわち、ＨＤＤ１７０には、必ずしも上記の実施例１で示した全てのデータが格納されずともよく、処理に用いるデータがＨＤＤ１７０に格納されればよい。

　このような環境の下、ＣＰＵ１５０は、ＨＤＤ１７０から技認識プログラム１７０ａを読み出した上でＲＡＭ１８０へ展開する。この結果、技認識プログラム１７０ａは、図１３に示すように、技認識プロセス１８０ａとして機能する。この技認識プロセス１８０ａは、ＲＡＭ１８０が有する記憶領域のうち技認識プロセス１８０ａに割り当てられた領域にＨＤＤ１７０から読み出した各種データを展開し、この展開した各種データを用いて各種の処理を実行する。例えば、技認識プロセス１８０ａが実行する処理の一例として、図１１～図１３に示す処理などが含まれる。なお、ＣＰＵ１５０では、必ずしも上記の実施例１で示した全ての処理部が動作せずともよく、実行対象とする処理に対応する処理部が仮想的に実現されればよい。

　なお、上記の技認識プログラム１７０ａは、必ずしも最初からＨＤＤ１７０やＲＯＭ１６０に記憶されておらずともかまわない。例えば、コンピュータ１００に挿入されるフレキシブルディスク、いわゆるＦＤ、ＣＤ－ＲＯＭ、ＤＶＤディスク、光磁気ディスク、ＩＣカードなどの「可搬用の物理媒体」に各プログラムを記憶させる。そして、コンピュータ１００がこれらの可搬用の物理媒体から各プログラムを取得して実行するようにしてもよい。また、公衆回線、インターネット、ＬＡＮ、ＷＡＮなどを介してコンピュータ１００に接続される他のコンピュータまたはサーバ装置などに各プログラムを記憶させておき、コンピュータ１００がこれらから各プログラムを取得して実行するようにしてもよい。

　　　１　　体操採点支援システム
　　　３　　演技者
　　　５　　３Ｄレーザセンサ
　　　７　　骨格検出装置
　　１０　　技認識装置
　　１１　　通信インタフェイス部
　　１３　　記憶部
　　１３Ａ　仮技の辞書データ
　　１３Ｂ　技の辞書データ
　　１５　　制御部
　　１５Ａ　取得部
　　１５Ｂ　第１算出部
　　１５Ｃ　第１認識部
　　１５Ｄ　選択部
　　１５Ｅ　第２算出部
　　１５Ｆ　第２認識部

Claims

　骨格検出で得られる骨格情報を取得し、
　前記骨格情報に基づいて体操競技に含まれる技のうち一部の技に絞り込む第１の技認識を実行し、
　前記第１の技認識で絞り込まれた一部の技の認識に特化した特化型アルゴリズムに従って前記一部の技のうちいずれの技が演技されたかを認識する第２の技認識を実行する、
　処理をコンピュータが実行することを特徴とする技認識方法。
　前記第１の技認識は、前記体操競技に含まれる技に関する特徴量のうち算出精度が閾値以上である第１の特徴量に基づいて前記一部の技に絞り込む処理を含み、
　前記第２の技認識は、前記特化型アルゴリズムに従って前記第１の技認識で絞り込まれた一部の技を区別する第２の特徴量を算出し、該算出された第２の特徴量に基づいて前記一部の技のうちいずれの技が演技されたかを認識する処理を含む、
　ことを特徴とする請求項１に記載の技認識方法。
　前記第２の技認識は、前記骨格情報と、前記骨格検出時に用いられた肘の屈曲時のローテーション情報とに基づいて握り方を前記第２の特徴量として算出する処理を含む、
　ことを特徴とする請求項２に記載の技認識方法。
　前記第２の技認識は、前記第２の技認識が実行済みである技認識結果のうち直近の技認識結果として得られる技における特定の運動の有無および前記特定の運動後における握り替えの有無に基づいて握り方を前記第２の特徴量として算出する処理を含む、
　ことを特徴とする請求項２に記載の技認識方法。
　前記第２の技認識は、骨格情報を説明変数とし、前記第１の技認識で絞り込まれた一部の技を区別する第２の特徴量のラベルを目的変数とする機械学習が実行された機械学習モデルに前記骨格情報を入力することにより前記第２の特徴量を算出する処理を含む、
　ことを特徴とする請求項２に記載の技認識方法。
　前記第２の技認識は、骨格情報を説明変数とし、前記第１の技認識で絞り込まれた一部の技名のラベルを目的変数とする機械学習が実行された機械学習モデルに前記骨格情報を入力することにより、前記一部の技のうちいずれの技が演技されたかを認識する処理を含む、
　ことを特徴とする請求項１に記載の技認識方法。
　骨格検出で得られる骨格情報を取得し、
　前記骨格情報に基づいて体操競技に含まれる技のうち一部の技に絞り込む第１の技認識を実行し、
　前記第１の技認識で絞り込まれた一部の技の認識に特化した特化型アルゴリズムに従って前記一部の技のうちいずれの技が演技されたかを認識する第２の技認識を実行する、
　処理を実行する制御部を含む技認識装置。
　前記第１の技認識は、前記体操競技に含まれる技に関する特徴量のうち算出精度が閾値以上である第１の特徴量に基づいて前記一部の技に絞り込む処理を含み、
　前記第２の技認識は、前記特化型アルゴリズムに従って前記第１の技認識で絞り込まれた一部の技を区別する第２の特徴量を算出し、該算出された第２の特徴量に基づいて前記一部の技のうちいずれの技が演技されたかを認識する処理を含む、
　ことを特徴とする請求項７に記載の技認識装置。
　前記第２の技認識は、前記骨格情報と、前記骨格検出時に用いられた肘の屈曲時のローテーション情報とに基づいて握り方を前記第２の特徴量として算出する処理を含む、
　ことを特徴とする請求項８に記載の技認識装置。
　前記第２の技認識は、前記第２の技認識が実行済みである技認識結果のうち直近の技認識結果として得られる技における特定の運動の有無および前記特定の運動後における握り替えの有無に基づいて握り方を前記第２の特徴量として算出する処理を含む、
　ことを特徴とする請求項８に記載の技認識装置。
　前記第２の技認識は、骨格情報を説明変数とし、前記第１の技認識で絞り込まれた一部の技を区別する第２の特徴量のラベルを目的変数とする機械学習が実行された機械学習モデルに前記骨格情報を入力することにより前記第２の特徴量を算出する処理を含む、
　ことを特徴とする請求項８に記載の技認識装置。
　前記第２の技認識は、骨格情報を説明変数とし、前記第１の技認識で絞り込まれた一部の技名のラベルを目的変数とする機械学習が実行された機械学習モデルに前記骨格情報を入力することにより、前記一部の技のうちいずれの技が演技されたかを認識する処理を含む、
　ことを特徴とする請求項７に記載の技認識装置。
　深度画像を取得するセンサ装置と、
　前記深度画像に対する骨格検出を実行する骨格検出部と、前記骨格検出で得られる骨格情報を取得する取得部と、前記骨格情報に基づいて体操競技に含まれる技のうち一部の技に絞り込む第１の技認識を実行する第１認識部と、前記第１の技認識で絞り込まれた一部の技の認識に特化した特化型アルゴリズムに従って前記一部の技のうちいずれの技が演技されたかを認識する第２の技認識を実行する第２認識部と、前記第２の技認識で得られた技を採点する採点部とを有する技認識装置と、
　を有することを特徴とする体操採点支援システム。