JP2021524116A - 動的動作検出方法、動的動作制御方法及び装置 - Google Patents
動的動作検出方法、動的動作制御方法及び装置 Download PDFInfo
- Publication number
- JP2021524116A JP2021524116A JP2021502886A JP2021502886A JP2021524116A JP 2021524116 A JP2021524116 A JP 2021524116A JP 2021502886 A JP2021502886 A JP 2021502886A JP 2021502886 A JP2021502886 A JP 2021502886A JP 2021524116 A JP2021524116 A JP 2021524116A
- Authority
- JP
- Japan
- Prior art keywords
- motion
- frame image
- static
- queue
- dynamic
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F3/00—Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
- G06F3/01—Input arrangements or combined input and output arrangements for interaction between user and computer
- G06F3/017—Gesture based interaction, e.g. based on a set of recognized hand gestures
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V40/00—Recognition of biometric, human-related or animal-related patterns in image or video data
- G06V40/20—Movements or behaviour, e.g. gesture recognition
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/22—Matching criteria, e.g. proximity measures
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F3/00—Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
- G06F3/01—Input arrangements or combined input and output arrangements for interaction between user and computer
- G06F3/048—Interaction techniques based on graphical user interfaces [GUI]
- G06F3/0484—Interaction techniques based on graphical user interfaces [GUI] for the control of specific functions or operations, e.g. selecting or manipulating an object, an image or a displayed text element, setting a parameter value or selecting a range
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T7/00—Image analysis
- G06T7/20—Analysis of motion
- G06T7/246—Analysis of motion using feature-based methods, e.g. the tracking of corners or segments
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V20/00—Scenes; Scene-specific elements
- G06V20/10—Terrestrial scenes
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V20/00—Scenes; Scene-specific elements
- G06V20/40—Scenes; Scene-specific elements in video content
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V20/00—Scenes; Scene-specific elements
- G06V20/50—Context or environment of the image
- G06V20/59—Context or environment of the image inside of a vehicle, e.g. relating to seat occupancy, driver state or inner lighting conditions
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V40/00—Recognition of biometric, human-related or animal-related patterns in image or video data
- G06V40/10—Human or animal bodies, e.g. vehicle occupants or pedestrians; Body parts, e.g. hands
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V40/00—Recognition of biometric, human-related or animal-related patterns in image or video data
- G06V40/10—Human or animal bodies, e.g. vehicle occupants or pedestrians; Body parts, e.g. hands
- G06V40/107—Static hand or arm
- G06V40/113—Recognition of static hand signs
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V40/00—Recognition of biometric, human-related or animal-related patterns in image or video data
- G06V40/10—Human or animal bodies, e.g. vehicle occupants or pedestrians; Body parts, e.g. hands
- G06V40/107—Static hand or arm
- G06V40/117—Biometrics derived from hands
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V40/00—Recognition of biometric, human-related or animal-related patterns in image or video data
- G06V40/20—Movements or behaviour, e.g. gesture recognition
- G06V40/28—Recognition of hand or arm movements, e.g. recognition of deaf sign language
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T2207/00—Indexing scheme for image analysis or image enhancement
- G06T2207/10—Image acquisition modality
- G06T2207/10016—Video; Image sequence
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T2207/00—Indexing scheme for image analysis or image enhancement
- G06T2207/30—Subject of image; Context of image processing
- G06T2207/30196—Human being; Person
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Physics & Mathematics (AREA)
- Multimedia (AREA)
- Human Computer Interaction (AREA)
- General Engineering & Computer Science (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Social Psychology (AREA)
- Health & Medical Sciences (AREA)
- Psychiatry (AREA)
- General Health & Medical Sciences (AREA)
- Data Mining & Analysis (AREA)
- Life Sciences & Earth Sciences (AREA)
- Artificial Intelligence (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Bioinformatics & Computational Biology (AREA)
- Evolutionary Biology (AREA)
- Evolutionary Computation (AREA)
- Image Analysis (AREA)
- User Interface Of Digital Computer (AREA)
Abstract
Description
本願は、2018年8月24日に中国特許局に提出された、出願番号201810974244.8、発明の名称「動的動作検出方法、動的動作制御方法及び装置」の中国特許出願の優先権を主張し、その内容の全てが参照によって本願に組み込まれる。
Claims (45)
- ビデオストリーム中のフレーム画像を第1のキューに加え、フレーム画像が部分的に更新された前記第1のキューを取得することと、
部分的に更新された前記第1のキューのフレーム画像における動的動作を検出することと、
前記動的動作と、動作参照結果又は先に検出された動作検出結果を含む動作検出結果とがマッチングしない場合に、前記動的動作に応じて、前記動作検出結果を更新することと、を含むことを特徴とする動的動作検出方法。 - 前記先に検出された動作検出結果の取得方法として、
前記第1のキューのフレーム画像に動的動作がある場合に、前記第1のキューのフレーム画像を第2のキューに移すことと、
前記第2のキューのフレーム画像に基づいて前記動作検出結果を決定することと、を含むことを特徴とする請求項1に記載の方法。 - 前記動作検出結果に静的動作が含まれ、ビデオストリーム中のフレーム画像を第1のキューに加え、フレーム画像が部分的に更新された前記第1のキューを取得することは、
前記ビデオストリーム中の認識すべきフレーム画像における静的動作を取得することと、
前記認識すべきフレーム画像における静的動作と前記動作検出結果に含まれる静的動作とがマッチングしない場合に、前記認識すべきフレーム画像を前記第1のキューに加え、フレーム画像が部分的に更新された前記第1のキューを取得することと、を含むことを特徴とする請求項1又は2に記載の方法。 - 前記動作検出結果に前記静的動作の動作軌跡及び/又は切換情報が更に含まれ、ビデオストリーム中のフレーム画像を第1のキューに加え、フレーム画像が部分的に更新された前記第1のキューを取得することは、
前記認識すべきフレーム画像における静的動作と前記動作検出結果に含まれる静的動作とがマッチングする場合に、前記認識すべきフレーム画像及び前記第2のキューのフレーム画像に基づいて、前記認識すべきフレーム画像における静的動作の動作軌跡及び/又は切換情報を決定することと、
前記認識すべきフレーム画像における静的動作の動作軌跡及び/又は切換情報と前記動作検出結果とがマッチングしない場合に、前記認識すべきフレーム画像を前記第1のキューに加え、フレーム画像が部分的に更新された前記第1のキューを取得することと、を含むことを特徴とする請求項3に記載の方法。 - 部分的に更新された前記第1のキューのフレーム画像に基づいて検出された前記動的動作と動作検出結果とがマッチングしない場合に、前記第2のキューを空にし、前記第1のキューのフレーム画像を前記第2のキューに移すことと、
前記第2のキューのフレーム画像における動的動作に応じて、前記動作検出結果を更新することと、を更に含むことを特徴とする請求項2〜4のいずれか一項に記載の方法。 - 前記認識すべきフレーム画像における静的動作、静的動作の動作軌跡及び/又は切換情報と前記動作検出結果とがマッチングする場合に、前記認識すべきフレーム画像を前記第2のキューに加えることを更に含むことを特徴とする請求項4又は5に記載の方法。
- 前記動的動作に少なくとも1つの静的動作及び前記静的動作の動作軌跡が含まれ、部分的に更新された前記第1のキューのフレーム画像における動的動作を検出することは、
部分的に更新された前記第1のキューの各フレーム画像における静的動作及び各フレーム画像における静的動作の動作軌跡に基づいて、部分的に更新された前記第1のキューのフレーム画像における動的動作を取得することを含むことを特徴とする請求項1〜6のいずれか一項に記載の方法。 - 前記動的動作に少なくとも2つの静的動作及び静的動作間の切換情報が含まれ、部分的に更新された前記第1のキューのフレーム画像における動的動作を検出することは、
部分的に更新された前記第1のキューの各フレーム画像における静的動作及び静的動作の切換情報に基づいて、部分的に更新された前記第1のキューのフレーム画像における動的動作を取得することを含むことを特徴とする請求項1〜6のいずれか一項に記載の方法。 - 前記動的動作に少なくとも2つの静的動作、各静的動作の動作軌跡、及び静的動作間の切換情報が含まれ、部分的に更新された前記第1のキューのフレーム画像における動的動作を検出することは、
部分的に更新された前記第1のキューの各フレーム画像における静的動作、各静的動作の動作軌跡、及び静的動作間の切換情報に基づいて、部分的に更新された前記第1のキューのフレーム画像における動的動作を取得することを含むことを特徴とする請求項1〜6のいずれか一項に記載の方法。 - 前記動的動作に手部動的動作が含まれ、前記静的動作にジェスチャーが含まれ、前記ビデオストリーム中の認識すべきフレーム画像における静的動作を取得することは、
前記認識すべきフレーム画像に手部が含まれるか否かを検出することと、
前記認識すべき画像に手部が含まれる場合に、前記手部の指及び/又は掌に基づいて前記認識すべき画像におけるジェスチャーを取得することと、を含むことを特徴とする請求項3〜9のいずれか一項に記載の方法。 - 前記手部の指及び/又は掌に基づいて前記認識すべき画像におけるジェスチャーを判断することは、
指先又は指関節を含む、前記手部の指の第1のキーポイントの位置、及び/又は、掌の中央、手の甲又は掌の縁部での点を含む、掌の第2のキーポイントの位置に基づいて、前記認識すべき画像におけるジェスチャーを認識することを含むことを特徴とする請求項10に記載の方法。 - 前記手部動的動作にジェスチャーの動作軌跡及び/又は切換情報が更に含まれ、前記認識すべきフレーム画像及び前記第2のキューのフレーム画像に基づいて、前記認識すべきフレーム画像における静的動作の動作軌跡及び/又は切換情報を決定することは、
前記認識すべきフレーム画像における第1のキーポイント及びそれに対応する前記第2のキューのフレーム画像における第1のキーポイントに基づいて、前記認識すべきフレーム画像における動作軌跡及び/又は切換情報を決定すること、及び/又は
前記認識すべきフレーム画像における第2のキーポイント及びそれに対応する前記第2のキューのフレーム画像における第2のキーポイントに基づいて、前記認識すべきフレーム画像における動作軌跡及び/又は切換情報を決定することを含むことを特徴とする請求項11に記載の方法。 - 前記動的動作に静的動作及び静的動作の動作軌跡が含まれ、部分的に更新された前記第1のキューのフレーム画像における動的動作を検出することは、
前記第1のキューのフレーム画像における静的動作を検出することと、
前記第1のキューの最初のフレーム画像における静的動作に対する、前記第1のキューの前記最初のフレーム画像以外のいずれか1つのフレーム画像を含む目標フレーム画像における静的動作の、X軸方向及びY軸方向の累積移動距離を計算することと、
前記目標フレーム画像における静的動作及び前記累積移動距離に基づいて、前記第1のキューのフレーム画像における動的動作を取得することと、を含むことを特徴とする請求項1〜12のいずれか一項に記載の方法。 - 前記目標フレーム画像における静的動作及び前記累積移動距離に基づいて、前記第1のキューのフレーム画像における動的動作を取得することは、
前記目標フレーム画像における静的動作の累積移動距離が移動閾値よりも小さい場合に、前記第1のキューのフレーム画像における目標対象物の動的動作が断続動作であると決定することを含むことを特徴とする請求項13に記載の方法。 - 前記目標フレーム画像における静的動作及び前記累積移動距離に基づいて、前記第1のキューのフレーム画像における動的動作を取得することは、
前記累積移動距離が前記移動閾値以上である場合に、各前記フレーム画像における静的動作の累積移動距離の、前記静的動作の所属する目標対象物の幅に対する比を計算することと、
前記比が比閾値よりも小さい場合に、目標フレーム画像における静的動作の動作軌跡が回転動作軌跡であると決定することと、
前記目標フレーム画像における静的動作及び前記回転動作軌跡に基づいて、前記第1のキューのフレーム画像における動的動作を取得することと、を含むことを特徴とする請求項13に記載の方法。 - 前記比が前記比閾値以上である場合に、目標フレーム画像における静的動作の動作軌跡が並進移動動作軌跡であると決定することと、
前記目標フレーム画像における静的動作及び前記並進移動動作軌跡に基づいて、前記第1のキューのフレーム画像における動的動作を取得することと、を更に含むことを特徴とする請求項15に記載の方法。 - ビデオストリームを取得することと、
請求項1〜16のいずれか一項に記載の方法を用いて前記ビデオストリームの動作検出結果を決定することと、
機器が前記動作検出結果に対応する操作を実行するように制御することと、を含むことを特徴とする動的動作制御方法。 - 機器が前記動作検出結果に対応する操作を実行するように制御することは、
予め設定された動作検出結果と操作コマンドとの対応関係に基づいて、前記動作検出結果に対応する操作コマンドを取得することと、
前記操作コマンドに基づいて、機器が対応する操作を実行するように制御することと、を含むことを特徴とする請求項17に記載の方法。 - 前記操作コマンドに基づいて、機器が対応する操作を実行するように制御することは、
前記操作コマンドに基づいて車両の車窓、車両のドア、車載システム、又は車載機器を制御することを含むことを特徴とする請求項18に記載の方法。 - 機器が前記動作検出結果に対応する操作を実行するように制御することは、
前記検出結果が定義済み動的動作であることに応じて、車両が前記定義済み動的動作に対応する操作を実行するように制御することを含むことを特徴とする請求項17に記載の方法。 - 前記定義済み動的動作は、1本の指を時計方向/反時計方向に回転させる、掌を左/右へ振り動かす、2本の指で前へ突く、親指と小指を伸ばす、掌を下へ向けて下へ押す、親指を伸ばして左/右へ移動する、掌を左/右へ長くスライドさせる、掌の中央を上へ向けて拳を掌に変える、掌の中央を上へ向けて掌を拳に変える、掌の中央を下へ向けて掌を拳に変える、掌の中央を下へ向けて拳を掌に変える、1本の指をスライドさせる、複数の指を内へ向けて握る、1本の指でダブルクリックする、1本の指でシングルクリックする、複数の指でダブルクリックする、複数の指でシングルクリックするといったジェスチャーの少なくとも1つを含む動的ジェスチャーを含み、
前記定義済み動的動作に対応する操作は、音量を大/小に調節する、曲を切り替える、曲を一時停止/継続する、電話を受ける又は起動する、電話を切る又は拒否する、エアコン温度を上げる又は下げる、マルチスクリーン・インタラクションを行う、サンルーフを開ける、サンルーフを閉める、ドアロックをかける、ドアロックを解除する、ナビゲーションをドラッグする、地図を縮小する、地図を拡大するといった操作の少なくとも1つを含むことを特徴とする請求項20に記載の方法。 - ビデオストリーム中のフレーム画像を第1のキューに加え、フレーム画像が部分的に更新された前記第1のキューを取得するための第1のキュー更新モジュールと、
部分的に更新された前記第1のキューのフレーム画像における動的動作を検出するための動的動作検出モジュールと、
前記動的動作と、動作参照結果又は先に検出された動作検出結果を含む動作検出結果とがマッチングしない場合に、前記動的動作に応じて、前記動作検出結果を更新するための動作検出結果更新モジュールと、を含むことを特徴とする動的動作検出装置。 - 前記第1のキューのフレーム画像に動的動作がある場合に、前記第1のキューのフレーム画像を第2のキューに移すことと、前記第2のキューのフレーム画像に基づいて前記動作検出結果を決定することとに用いられる、先に検出された動作検出結果の取得モジュールを更に含むことを特徴とする請求項22に記載の装置。
- 前記動作検出結果に静的動作が含まれ、前記第1のキュー更新モジュールは、
前記ビデオストリーム中の認識すべきフレーム画像における静的動作を取得するための第1の取得サブモジュールと、
前記認識すべきフレーム画像における静的動作と前記動作検出結果に含まれる静的動作とがマッチングしない場合に、前記認識すべきフレーム画像を前記第1のキューに加え、フレーム画像が部分的に更新された前記第1のキューを取得するための第1の更新サブモジュールと、を含むことを特徴とする請求項22又は23に記載の装置。 - 前記動作検出結果に前記静的動作の動作軌跡及び/又は切換情報が更に含まれ、前記第1のキュー更新モジュールは、
前記認識すべきフレーム画像における静的動作と前記動作検出結果に含まれる静的動作とがマッチングする場合に、前記認識すべきフレーム画像及び前記第2のキューのフレーム画像に基づいて、前記認識すべきフレーム画像における静的動作の動作軌跡及び/又は切換情報を決定するための第2の取得サブモジュールと、
前記認識すべきフレーム画像における静的動作の動作軌跡及び/又は切換情報と前記動作検出結果とがマッチングしない場合に、前記認識すべきフレーム画像を前記第1のキューに加え、フレーム画像が部分的に更新された前記第1のキューを取得するための第2の更新サブモジュールと、を含むことを特徴とする請求項24に記載の装置。 - 部分的に更新された前記第1のキューのフレーム画像に基づいて検出された前記動的動作と動作検出結果とがマッチングしない場合に、前記第2のキューを空にし、前記第1のキューのフレーム画像を前記第2のキューに移すためのキュー転移モジュールと、
前記第2のキューのフレーム画像における動的動作に応じて、前記動作検出結果を更新するための動作検出結果更新モジュールと、を更に含むことを特徴とする請求項23〜25のいずれか一項に記載の装置。 - 前記認識すべきフレーム画像における静的動作、静的動作の動作軌跡及び/又は切換情報と前記動作検出結果とがマッチングする場合に、前記認識すべきフレーム画像を前記第2のキューに加えるための第2のキュー更新モジュールを更に含むことを特徴とする請求項25又は26に記載の装置。
- 前記動的動作に少なくとも1つの静的動作及び前記静的動作の動作軌跡が含まれ、前記動的動作検出モジュールは、
部分的に更新された前記第1のキューの各フレーム画像における静的動作及び各フレーム画像における静的動作の動作軌跡に基づいて、部分的に更新された前記第1のキューのフレーム画像における動的動作を取得するための第1の動的動作検出サブモジュールを含むことを特徴とする請求項22〜27のいずれか一項に記載の装置。 - 前記動的動作に少なくとも2つの静的動作及び静的動作間の切換情報が含まれ、前記動的動作検出モジュールは、
部分的に更新された前記第1のキューの各フレーム画像における静的動作及び静的動作の切換情報に基づいて、部分的に更新された前記第1のキューのフレーム画像における動的動作を取得するための第2の動的動作検出サブモジュールを含むことを特徴とする請求項22〜27のいずれか一項に記載の装置。 - 前記動的動作に少なくとも2つの静的動作、各静的動作の動作軌跡、及び静的動作間の切換情報が含まれ、前記動的動作検出モジュールは、
部分的に更新された前記第1のキューの各フレーム画像における静的動作、各静的動作の動作軌跡、及び静的動作間の切換情報に基づいて、部分的に更新された前記第1のキューのフレーム画像における動的動作を取得するための第3の動的動作検出サブモジュールを含むことを特徴とする請求項22〜27のいずれか一項に記載の装置。 - 前記動的動作に手部動的動作が含まれ、前記静的動作にジェスチャーが含まれ、前記第1の取得サブモジュールは、
前記認識すべきフレーム画像に手部が含まれるか否かを検出するための手部検出ユニットと、
前記認識すべき画像に手部が含まれる場合に、前記手部の指及び/又は掌に基づいて前記認識すべき画像におけるジェスチャーを取得するためのジェスチャー決定ユニットと、を含むことを特徴とする請求項24〜30のいずれか一項に記載の装置。 - 前記ジェスチャー決定ユニットは、
指先又は指の関節を含む、前記手部の指の第1のキーポイントの位置、及び/又は、掌の中央、手の甲又は掌の縁部での点を含む、掌の第2のキーポイントの位置に基づいて、前記認識すべき画像におけるジェスチャーを認識することに用いられることを特徴とする請求項31に記載の装置。 - 前記手部動的動作にジェスチャーの動作軌跡及び/又は切換情報が更に含まれ、前記第2の取得サブモジュールは、
前記認識すべきフレーム画像における第1のキーポイント及びそれに対応する前記第2のキューのフレーム画像における第1のキーポイントに基づいて、前記認識すべきフレーム画像における動作軌跡及び/又は切換情報を決定するための第1の取得ユニット、及び/又は
前記認識すべきフレーム画像における第2のキーポイント及びそれに対応する前記第2のキューのフレーム画像における第2のキーポイントに基づいて、前記認識すべきフレーム画像における動作軌跡及び/又は切換情報を決定するための第2の取得ユニットを含むことを特徴とする請求項32に記載の装置。 - 前記動的動作に静的動作及び静的動作の動作軌跡が含まれ、前記動的動作検出モジュールは、
前記第1のキューのフレーム画像における静的動作を検出するための静的動作検出サブモジュールと、
前記第1のキューの最初のフレーム画像における静的動作に対する、前記第1のキューの前記最初のフレーム画像以外のいずれか1つのフレーム画像を含む目標フレーム画像における静的動作の、X軸方向及びY軸方向の累積移動距離を計算するための累積移動距離決定サブモジュールと、
前記目標フレーム画像における静的動作及び前記累積移動距離に基づいて前記第1のキューのフレーム画像における動的動作を取得するための第4の動的動作検出サブモジュールと、を含むことを特徴とする請求項22〜33のいずれか一項に記載の装置。 - 前記第4の動的動作検出サブモジュールは、
前記目標フレーム画像における静的動作の累積移動距離が移動閾値よりも小さい場合に、前記第1のキューのフレーム画像における目標対象物の動的動作が断続動作であると決定することに用いられることを特徴とする請求項34に記載の装置。 - 前記第4の動的動作検出サブモジュールは、
前記累積移動距離が前記移動閾値以上である場合に、各前記フレーム画像における静的動作の累積移動距離の、前記静的動作の所属する目標対象物の幅に対する比を計算することと、
前記比が比閾値よりも小さい場合に、目標フレーム画像における静的動作の動作軌跡が回転動作軌跡であると決定することと、
前記目標フレーム画像における静的動作及び前記回転動作軌跡に基づいて、前記第1のキューのフレーム画像における動的動作を取得することとに用いられることを特徴とする請求項34に記載の装置。 - 前記第4の動的動作検出サブモジュールは、更に、
前記比が前記比閾値以上である場合に、目標フレーム画像における静的動作の動作軌跡が並進移動動作軌跡であると決定することと、
前記目標フレーム画像における静的動作及び前記並進移動動作軌跡に基づいて、前記第1のキューのフレーム画像における動的動作を取得することとに用いられることを特徴とする請求項36に記載の装置。 - ビデオストリームを取得するためのビデオストリーム取得モジュールと、
請求項22〜37のいずれか一項に記載の装置を用いて前記ビデオストリームの動作検出結果を決定するための動作検出結果取得モジュールと、
機器が前記動作検出結果に対応する操作を実行するように制御するための操作実行モジュールと、を含むことを特徴とする動的動作制御装置。 - 操作実行モジュールは、
予め設定された動作検出結果と操作コマンドとの対応関係に基づいて、前記動作検出結果に対応する操作コマンドを取得するための操作コマンド取得サブモジュールと、
前記操作コマンドに基づいて、機器が対応する操作を実行するように制御するための操作実行サブモジュールと、を含むことを特徴とする請求項38に記載の装置。 - 前記操作実行サブモジュールは、
前記操作コマンドに基づいて車両の車窓、車両のドア、車載システム、又は車載機器を制御することに用いられることを特徴とする請求項39に記載の装置。 - 前記操作実行モジュールは、更に、
前記検出結果が定義済み動的動作であることに応じて、車両が前記定義済み動的動作に対応する操作を実行するように制御することに用いられることを特徴とする請求項38に記載の装置。 - 前記定義済み動的動作は、1本の指を時計方向/反時計方向に回転させる、掌を左/右へ振り動かす、2本の指で前へ突く、親指と小指を伸ばす、掌を下へ向けて下へ押す、親指を伸ばして左/右へ移動する、掌を左/右へ長くスライドさせる、掌の中央を上へ向けて拳を掌に変える、掌の中央を上へ向けて掌を拳に変える、掌の中央を下へ向けて掌を拳に変える、掌の中央を下へ向けて拳を掌に変える、1本の指をスライドさせる、複数の指を内へ向けて握る、1本の指でダブルクリックする、1本の指でシングルクリックする、複数の指でダブルクリックする、複数の指でシングルクリックするといったジェスチャーの少なくとも1つを含む動的ジェスチャーを含み、
前記定義済み動的動作に対応する操作は、音量を大/小に調節する、曲を切り替える、曲を一時停止/継続する、電話を受ける又は起動する、電話を切る又は拒否する、エアコン温度を上げる又は下げる、マルチスクリーン・インタラクションを行う、サンルーフを開ける、サンルーフを閉める、ドアロックをかける、ドアロックを解除する、ナビゲーションをドラッグする、地図を縮小する、地図を拡大するといった操作の少なくとも1つを含むことを特徴とする請求項41に記載の装置。 - プロセッサと、
プロセッサにより実行可能なコマンドを記憶するためのメモリと、を含み、
前記プロセッサは請求項1〜21のいずれか一項に記載の方法を実行するように構成されることを特徴とする電子機器。 - コンピュータプログラムコマンドが記憶されているコンピュータ読取可能記憶媒体であって、前記コンピュータプログラムコマンドは、プロセッサにより実行されると、請求項1〜21のいずれか一項に記載の方法を実現させることを特徴とするコンピュータ読取可能記憶媒体。
- コンピュータ読取可能コードを含むコンピュータプログラムであって、前記コンピュータ読取可能コードは、電子機器において実行されると、前記電子機器のプロセッサに請求項1〜21のいずれか一項に記載の方法を実現するためのコマンドを実行させることを特徴とするコンピュータプログラム。
Applications Claiming Priority (3)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201810974244.8A CN109144260B (zh) | 2018-08-24 | 2018-08-24 | 动态动作检测方法、动态动作控制方法及装置 |
CN201810974244.8 | 2018-08-24 | ||
PCT/CN2019/093583 WO2020038108A1 (zh) | 2018-08-24 | 2019-06-28 | 动态动作检测方法、动态动作控制方法及装置 |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2021524116A true JP2021524116A (ja) | 2021-09-09 |
JP7127202B2 JP7127202B2 (ja) | 2022-08-29 |
Family
ID=64827872
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2021502886A Active JP7127202B2 (ja) | 2018-08-24 | 2019-06-28 | 動的動作検出方法、動的動作制御方法及び装置 |
Country Status (6)
Country | Link |
---|---|
US (1) | US11455836B2 (ja) |
JP (1) | JP7127202B2 (ja) |
KR (1) | KR102321562B1 (ja) |
CN (1) | CN109144260B (ja) |
SG (1) | SG11202013098TA (ja) |
WO (1) | WO2020038108A1 (ja) |
Families Citing this family (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN109144260B (zh) | 2018-08-24 | 2020-08-18 | 上海商汤智能科技有限公司 | 动态动作检测方法、动态动作控制方法及装置 |
US11873000B2 (en) | 2020-02-18 | 2024-01-16 | Toyota Motor North America, Inc. | Gesture detection for transport control |
US20210253135A1 (en) * | 2020-02-18 | 2021-08-19 | Toyota Motor North America, Inc. | Determining transport operation level for gesture control |
EP3926544B1 (en) | 2020-06-18 | 2024-03-13 | Tata Consultancy Services Limited | System and method of gesture recognition using a reservoir based convolutional spiking neural network |
US11829443B2 (en) | 2021-03-29 | 2023-11-28 | International Business Machines Corporation | Augmentation of video datasets for machine learning training |
CN115600171B (zh) * | 2022-10-24 | 2023-08-04 | 星空映画(武汉)科技有限公司 | 一种根据用户习惯判断的计算机用户动作识别*** |
Citations (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2004199623A (ja) * | 2002-12-20 | 2004-07-15 | Minolta Co Ltd | 移動体の計数方法 |
US20050271279A1 (en) * | 2004-05-14 | 2005-12-08 | Honda Motor Co., Ltd. | Sign based human-machine interaction |
JP2006345081A (ja) * | 2005-06-07 | 2006-12-21 | Sony Corp | 検出装置および方法、記録媒体、プログラム、並びに画像表示装置 |
US20110135148A1 (en) * | 2009-12-08 | 2011-06-09 | Micro-Star Int'l Co., Ltd. | Method for moving object detection and hand gesture control method based on the method for moving object detection |
CN102609093A (zh) * | 2012-02-16 | 2012-07-25 | 中国农业大学 | 用手势控制视频播放的方法及装置 |
JP2014042139A (ja) * | 2012-08-22 | 2014-03-06 | Fujitsu Ltd | 符号化装置、符号化方法、及びプログラム |
CN105894540A (zh) * | 2016-04-11 | 2016-08-24 | 上海斐讯数据通信技术有限公司 | 一种基于移动终端的上下往复移动计数方法及*** |
Family Cites Families (19)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20070057912A1 (en) | 2005-09-14 | 2007-03-15 | Romriell Joseph N | Method and system for controlling an interface of a device through motion gestures |
WO2009049314A2 (en) | 2007-10-11 | 2009-04-16 | Trustees Of Boston University | Video processing system employing behavior subtraction between reference and observed video image sequences |
CN101419499B (zh) * | 2008-11-14 | 2010-06-02 | 东南大学 | 基于摄像头和话筒的多媒体人机交互方法 |
US8751215B2 (en) * | 2010-06-04 | 2014-06-10 | Microsoft Corporation | Machine based sign language interpreter |
CN102053702A (zh) * | 2010-10-26 | 2011-05-11 | 南京航空航天大学 | 动态手势控制***与方法 |
US20150193393A1 (en) * | 2011-09-01 | 2015-07-09 | Scott R. Violet | Dynamic Display of Web Content |
EP2650754A3 (en) * | 2012-03-15 | 2014-09-24 | Omron Corporation | Gesture recognition apparatus, electronic device, gesture recognition method, control program, and recording medium |
JP2013235513A (ja) * | 2012-05-10 | 2013-11-21 | Sony Computer Entertainment Inc | 画像生成装置、画像生成方法、プログラム及び情報記憶媒体 |
CN104239844A (zh) * | 2013-06-18 | 2014-12-24 | 华硕电脑股份有限公司 | 图像识别***及图像识别方法 |
US9886094B2 (en) | 2014-04-28 | 2018-02-06 | Microsoft Technology Licensing, Llc | Low-latency gesture detection |
US20160162148A1 (en) * | 2014-12-04 | 2016-06-09 | Google Inc. | Application launching and switching interface |
US10097758B2 (en) * | 2015-11-18 | 2018-10-09 | Casio Computer Co., Ltd. | Data processing apparatus, data processing method, and recording medium |
JP2017191496A (ja) * | 2016-04-14 | 2017-10-19 | 株式会社東海理化電機製作所 | ジェスチャ判定装置 |
CN106648112A (zh) * | 2017-01-07 | 2017-05-10 | 武克易 | 一种体感动作识别方法 |
CN106599882A (zh) * | 2017-01-07 | 2017-04-26 | 武克易 | 一种体感动作识别装置 |
CN107169411B (zh) * | 2017-04-07 | 2019-10-29 | 南京邮电大学 | 一种基于关键帧和边界约束dtw的实时动态手势识别方法 |
US10572072B2 (en) * | 2017-09-29 | 2020-02-25 | Apple Inc. | Depth-based touch detection |
CN109144260B (zh) * | 2018-08-24 | 2020-08-18 | 上海商汤智能科技有限公司 | 动态动作检测方法、动态动作控制方法及装置 |
CN108197596B (zh) * | 2018-01-24 | 2021-04-06 | 京东方科技集团股份有限公司 | 一种手势识别方法和装置 |
-
2018
- 2018-08-24 CN CN201810974244.8A patent/CN109144260B/zh active Active
-
2019
- 2019-06-28 US US17/257,136 patent/US11455836B2/en active Active
- 2019-06-28 SG SG11202013098TA patent/SG11202013098TA/en unknown
- 2019-06-28 JP JP2021502886A patent/JP7127202B2/ja active Active
- 2019-06-28 KR KR1020217005497A patent/KR102321562B1/ko active IP Right Grant
- 2019-06-28 WO PCT/CN2019/093583 patent/WO2020038108A1/zh active Application Filing
Patent Citations (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2004199623A (ja) * | 2002-12-20 | 2004-07-15 | Minolta Co Ltd | 移動体の計数方法 |
US20050271279A1 (en) * | 2004-05-14 | 2005-12-08 | Honda Motor Co., Ltd. | Sign based human-machine interaction |
JP2006345081A (ja) * | 2005-06-07 | 2006-12-21 | Sony Corp | 検出装置および方法、記録媒体、プログラム、並びに画像表示装置 |
US20110135148A1 (en) * | 2009-12-08 | 2011-06-09 | Micro-Star Int'l Co., Ltd. | Method for moving object detection and hand gesture control method based on the method for moving object detection |
CN102609093A (zh) * | 2012-02-16 | 2012-07-25 | 中国农业大学 | 用手势控制视频播放的方法及装置 |
JP2014042139A (ja) * | 2012-08-22 | 2014-03-06 | Fujitsu Ltd | 符号化装置、符号化方法、及びプログラム |
CN105894540A (zh) * | 2016-04-11 | 2016-08-24 | 上海斐讯数据通信技术有限公司 | 一种基于移动终端的上下往复移动计数方法及*** |
Also Published As
Publication number | Publication date |
---|---|
KR20210030983A (ko) | 2021-03-18 |
US20210248359A1 (en) | 2021-08-12 |
US11455836B2 (en) | 2022-09-27 |
CN109144260B (zh) | 2020-08-18 |
WO2020038108A1 (zh) | 2020-02-27 |
KR102321562B1 (ko) | 2021-11-04 |
JP7127202B2 (ja) | 2022-08-29 |
CN109144260A (zh) | 2019-01-04 |
SG11202013098TA (en) | 2021-02-25 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP2021524116A (ja) | 動的動作検出方法、動的動作制御方法及び装置 | |
EP3096184A1 (en) | Method and device for controlling flash light and terminal | |
CN108234873A (zh) | 一种获取图像的方法和装置 | |
WO2022110614A1 (zh) | 手势识别方法及装置、电子设备和存储介质 | |
RU2651151C2 (ru) | Способ и устройство управления иконками приложений | |
CN111680521A (zh) | 一种翻译处理方法、装置和用于翻译处理的装置 | |
CN110889382A (zh) | 虚拟形象渲染方法及装置、电子设备和存储介质 | |
CN104090721A (zh) | 终端控制方法和装置 | |
CN108476339B (zh) | 一种遥控方法和终端 | |
CN104065883B (zh) | 拍摄方法及装置 | |
KR20170142839A (ko) | 단말기의 작업모드 확정방법, 장치, 프로그램 및 기록매체 | |
CN110674801A (zh) | 基于加速度计识别用户运动模式的方法、装置及电子设备 | |
WO2017096958A1 (zh) | 人机交互方法及装置、移动设备 | |
CN110636383A (zh) | 一种视频播放方法、装置、电子设备及存储介质 | |
CN106168877A (zh) | 进入单手模式的方法及装置 | |
KR20210005508A (ko) | 터치신호의 처리방법, 장치 및 매체 | |
CN108398127A (zh) | 一种室内定位方法及装置 | |
CN108803892A (zh) | 一种在输入法中调用第三方应用程序的方法和装置 | |
CN107566615B (zh) | 消息处理方法、装置及计算机可读存储介质 | |
CN108986803A (zh) | 场景控制方法及装置、电子设备、可读存储介质 | |
JP2021534482A (ja) | ジェスチャー認識方法、ジェスチャー処理方法及び装置 | |
WO2023051119A1 (zh) | 虚拟键盘设置方法、装置、存储介质及计算机程序产品 | |
CN108073291A (zh) | 一种输入方法和装置、一种用于输入的装置 | |
CN105847675A (zh) | 一种照相机模式切换方法、装置及移动设备 | |
CN108227927B (zh) | 基于vr的产品展示方法、装置及电子设备 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20210115 |
|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20210115 |
|
A871 | Explanation of circumstances concerning accelerated examination |
Free format text: JAPANESE INTERMEDIATE CODE: A871 Effective date: 20210115 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20210831 |
|
A02 | Decision of refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A02 Effective date: 20220215 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20220613 |
|
C60 | Trial request (containing other claim documents, opposition documents) |
Free format text: JAPANESE INTERMEDIATE CODE: C60 Effective date: 20220613 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A821 Effective date: 20220613 |
|
A911 | Transfer to examiner for re-examination before appeal (zenchi) |
Free format text: JAPANESE INTERMEDIATE CODE: A911 Effective date: 20220630 |
|
C21 | Notice of transfer of a case for reconsideration by examiners before appeal proceedings |
Free format text: JAPANESE INTERMEDIATE CODE: C21 Effective date: 20220705 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20220816 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20220817 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 7127202 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |