JP2019204505A - オブジェクト検出装置及び方法及び記憶媒体 - Google Patents
オブジェクト検出装置及び方法及び記憶媒体 Download PDFInfo
- Publication number
- JP2019204505A JP2019204505A JP2019091606A JP2019091606A JP2019204505A JP 2019204505 A JP2019204505 A JP 2019204505A JP 2019091606 A JP2019091606 A JP 2019091606A JP 2019091606 A JP2019091606 A JP 2019091606A JP 2019204505 A JP2019204505 A JP 2019204505A
- Authority
- JP
- Japan
- Prior art keywords
- spatial relationship
- candidate
- object detection
- image
- spatial
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V10/00—Arrangements for image or video recognition or understanding
- G06V10/40—Extraction of image or video features
- G06V10/42—Global feature extraction by analysis of the whole pattern, e.g. using frequency domain transformations or autocorrelation
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V10/00—Arrangements for image or video recognition or understanding
- G06V10/40—Extraction of image or video features
- G06V10/44—Local feature extraction by analysis of parts of the pattern, e.g. by detecting edges, contours, loops, corners, strokes or intersections; Connectivity analysis, e.g. of connected components
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V20/00—Scenes; Scene-specific elements
- G06V20/50—Context or environment of the image
- G06V20/52—Surveillance or monitoring of activities, e.g. for recognising suspicious objects
Landscapes
- Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- Multimedia (AREA)
- Theoretical Computer Science (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Image Analysis (AREA)
Abstract
Description
・2つのオブジェクト間の相対位置関係(Relative positional relationship)(例えば、方向関係、距離関係等)
例えば、机の上に置かれたコンピュータの場合、そのコンピュータと机との方向関係は、“机の上(on the desk)”となる。例えば、芝生上の人物/動物の場合、その人物/動物と芝生との方向関係は“芝生の上(on the grass)”となる。例えば、子供の手を握って歩くように導いている女性の場合、女性と子供との間の距離関係は“隣接して、近くに(adjacent to, close to)”である。しかし、これに限定される必要がないのは明らかである。
・2つのオブジェクト間の位相関係(Topological relationship)(たとえば、重複関係(overlapping relationship)、包含関係(inclusion relationship)、隣接関係(adjacency relationship)など)
例えば、車いすに座っている男性の場合、その男性と車椅子との位相関係は“重複関係”となる。例えば子供を抱えている女性の場合、その女性と子供との位相関係は“包含関係”となる。パラソルを持つ女性の場合、その女性とパラソルとの位相関係は“隣接関係”となる。しかし、これに限定される必要がないのは明らかである。
・2つのオブジェクト間の相対形状関係(Relative shape relationship)
例えば、車椅子に座っている男性のように、人と車椅子間の空間的規制が、“相対形状関係”にもなる。しかし、これに限定される必要がないのは明らかである。
まず、以下で説明される具術を実現可能なハードウェア構成について、図1を参照して説明する。
次に、本発明におけるオブジェクト検出を、図2乃至図8を参照して説明する。
順位判定後の候補領域を、オブジェクトの領域とする。
本発明の第1の実施形態にて説明したように、本発明に適用可能なモデル(すなわち、事前生成モデル)は、空間的関係がラベル付けされたサンプルの学習にしたがって事前学習/事前生成される。ここで、上記のように、本発明の処理速度を向上させるため、例えば、図5に示すように、本発明に適用する事前生成モデルは、例えば、特徴抽出する部分、空間的関係を判定する部分、及び、領域/候補領域を検出する部分を含む。本発明において、事前学習モデルは、ディープラーニング法(例えば、ニューラルネットワーク法)を用いて、空間的関係がラベル付けされたサンプルのトレーニングに基づき生成されても良い。ここで、本発明における事前生成モデルの各部分は、複数レイヤのネットワークで構成され、例えば、特徴を抽出する部分はNレイヤネットワークで構成され、空間的関係を判定する部分はMレイヤネットワークで構成され、領域/候補領域を検出する部分はTレイヤネットワークで構成されても良い。ここで、N,M,Tは自然数であって、それらが示す値は同じでも異なっても良い。
Claims (21)
- オブジェクト検出装置であって、
画像から特徴を抽出する抽出手段と、
抽出した特徴に基づき前記画像における個別の特徴点間の空間的関係を判定する判定手段と、
判定した空間的関係に基づき、前記画像内のオブジェクトの領域を検出する検出手段と、ここで前記オブジェクトは前記画像内の関連付けられたオブジェクトである
を有することを特徴とするオブジェクト検出装置。 - 前記判定手段は、事前生成モデルを用いて、前記抽出された特徴に基づき、前記特徴点間の空間的関係とその空間的関係値とを判定することを特徴とする請求項1に記載のオブジェクト検出装置。
- 前記検出手段は、
抽出した特徴に基づき画像からオブジェクトの候補領域を検出する候補領域検出手段と、
判定した空間的関係に基づいて前記候補領域の順位を判定し、当該順位判定後の候補領域を前記オブジェクトの領域とする順位判定手段と
を有することを特徴とする請求項1に記載のオブジェクト検出装置。 - 前記判定手段は、事前生成モデルを用いて、抽出された特徴に基づく前記特徴点間の空間的関係及びその空間的関係値を判定することを特徴とする請求項3に記載のオブジェクト検出装置。
- 前記順位判定手段は、前記候補領域の間の空間的関係の空間的関係値に基づき、前記候補領域のスコアを更新することを特徴とする請求項4に記載のオブジェクト検出装置。
- 任意の2つの候補領域における、当該2つの候補猟奇間の空間的関係は、その2つの候補領域に含まれる特徴点間の相互の空間的関係に基づいて判定されることを特徴とする請求項5に記載のオブジェクト検出装置。
- 任意の2つの候補領域における、当該2つの候補領域間の空間的関係は、更に、
前記2つの候補領域における少なくとも1つの対象オブジェクトの位置情報およびカテゴリ情報、
前記2つの候補領域内の少なくとも1つの対象オブジェクトの結合点情報、
前記画像の背景情報、
の少なくとも1つに基づき判定されることを特徴とする請求項6に記載のオブジェクト検出装置。 - 2つの候補領域間の空間的関係は当該2つの候補領域間の空間的拘束を表し、
前記空間的拘束は、少なくとも
前記2つの候補領域間の相対的な位置関係、
前記2つの候補領域間の位相関係、
前記2つの候補領域間の相対形状関係
の1つを少なくとも含むことを特徴とする請求項5に記載のオブジェクト検出装置。 - 前記抽出手段は、事前生成モデルを用いて、前記画像から特徴を抽出し、
前記検出手段は、前記事前生成モデルを用いて、前記画像からオブジェクトの領域を検出する
ことを特徴とする請求項2又は4に記載のオブジェクト検出装置。 - 前記事前生成モデルは、ディープラーニング法を用い、空間的関係がラベル付けされたトレーニングサンプルに基づいて生成されることを特徴とする請求項9に記載のオブジェクト検出装置。
- 前記事前生成モデルは、特徴を抽出するための部分、空間的関係を判定するための部分、オブジェクトの領域を検出するための部分の少なくとも3つの部分を有し、
前記事前生成モデルの生成処理にて、特徴を抽出する現在の部分、空間的関係を判定するための現在の部分、オブジェクトの領域を検出するための現在の部分が、バックプロパゲーションの手段により同時に更新される
ことを特徴とする請求項10に記載のオブジェクト検出装置。 - オブジェクト検出方法であって、
画像から特徴を抽出する抽出ステップと、
抽出した特徴に基づき前記画像における個別の特徴点間の空間的関係を判定する判定ステップと、
判定した空間的関係に基づき、前記画像内のオブジェクトの領域を検出する検出ステップと、ここで前記オブジェクトは前記画像内の関連付けられたオブジェクトである
を有することを特徴とするオブジェクト検出方法。 - 前記判定ステップでは、事前生成モデルを用いて、前記抽出された特徴に基づき、前記特徴点間の空間的関係とその空間的関係値とを判定されることを特徴とする請求項12に記載のオブジェクト検出方法。
- 前記検出ステップは、
抽出した特徴に基づき画像からオブジェクトの候補領域を検出する候補領域検出ステップと、
判定した空間的関係に基づいて前記候補領域の順位を判定し、当該順位判定後の候補領域を前記オブジェクトの領域とする順位判定ステップと
を有することを特徴とする請求項12に記載のオブジェクト検出方法。 - 前記判定ステップでは、事前生成モデルを用いて、抽出された特徴に基づく前記特徴点間の空間的関係及びその空間的関係値が判定されることを特徴とする請求項14に記載のオブジェクト検出方法。
- 前記順位判定ステップでは、前記候補領域の間の空間的関係の空間的関係値に基づき、前記候補領域のスコアが更新されることを特徴とする請求項15に記載のオブジェクト検出方法。
- 任意の2つの候補領域における、当該2つの候補猟奇間の空間的関係は、その2つの候補領域に含まれる特徴点間の相互の空間的関係に基づいて判定されることを特徴とする請求項16に記載のオブジェクト検出方法。
- 2つの候補領域間の空間的関係はその2つの候補領域間の空間的拘束を表し、
前記空間的拘束は、少なくとも
前記2つの候補領域間の相対的な位置関係、
前記2つの候補領域間の位相関係、
前記2つの候補領域間の相対形状関係
の1つを少なくとも含むことを特徴とする請求項16に記載のオブジェクト検出方法。 - 前記抽出ステップでは、事前生成モデルを用いて、前記特徴が前記画像からを抽出され、
前記検出ステップでは、前記事前生成モデルを用いて、前記オブジェクトの領域が前記画像から検出される
ことを特徴とする請求項13又は15に記載のオブジェクト検出方法。 - ビデオ内の現ビデオフレームから特徴を抽出する特徴抽出手段と、
抽出した特徴に基づき、前記現ビデオフレームからオブジェクトの候補領域を検出する候補領域検出手段と、
前記現ビデオフレームの前ビデオフレームの検出結果に基づき、前記候補領域の間の空間的関係を判定する空間的関係判定手段と、
前記候補領域間の空間的関係に基づき、前記候補領域の順位を判定し、当該順位の判定後の候補領域を、前記オブジェクトの領域する順位判定手段とを有し、
前記現ビデオフレームの前ビデオフレームの検出結果は、請求項1乃至11のいずれか1つのオブジェクト検出装置を用いて得られることを特徴とするオブジェクト検出装置。 - コンピュータが実行したとき、請求項12乃至19のいずれか1項に記載のオブジェクト検出方法を実行される命令を記憶する記憶媒体。
Applications Claiming Priority (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201810516451.9A CN110532838A (zh) | 2018-05-25 | 2018-05-25 | 对象检测装置和方法及存储介质 |
CN201810516451.9 | 2018-05-25 |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2019204505A true JP2019204505A (ja) | 2019-11-28 |
JP6823686B2 JP6823686B2 (ja) | 2021-02-03 |
Family
ID=68656802
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2019091606A Active JP6823686B2 (ja) | 2018-05-25 | 2019-05-14 | オブジェクト検出装置及び方法及び記憶媒体 |
Country Status (2)
Country | Link |
---|---|
JP (1) | JP6823686B2 (ja) |
CN (1) | CN110532838A (ja) |
Cited By (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN112633069A (zh) * | 2020-11-26 | 2021-04-09 | 贝壳技术有限公司 | 物体检测方法及装置 |
CN113011377A (zh) * | 2021-04-06 | 2021-06-22 | 新疆爱华盈通信息技术有限公司 | 行人属性识别方法、装置、电子设备及存储介质 |
KR20210136138A (ko) * | 2019-12-30 | 2021-11-16 | 상하이 센스타임 린강 인텔리전트 테크놀로지 컴퍼니 리미티드 | 이미지 처리 방법, 장치, 저장 매체 및 전자 기기 |
WO2022249351A1 (ja) * | 2021-05-26 | 2022-12-01 | 日本電信電話株式会社 | 位置推定装置、位置推定学習装置、位置推定方法、位置推定学習方法、位置推定プログラム、及び位置推定学習プログラム |
Citations (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2011003136A (ja) * | 2009-06-22 | 2011-01-06 | Sony Corp | 操作制御装置および操作制御方法 |
Family Cites Families (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2007025900A (ja) * | 2005-07-13 | 2007-02-01 | Canon Inc | 画像処理装置、画像処理方法 |
WO2013136395A1 (ja) * | 2012-03-12 | 2013-09-19 | 日本電気株式会社 | 検知装置、検知方法、プログラムが格納された記憶媒体 |
JP6708368B2 (ja) * | 2014-04-25 | 2020-06-10 | コンデュエント ビジネス サービシーズ エルエルシー | 変形可能部分モデルを使用した車両追跡における部分的隠蔽処理方法及びシステム |
CN106355182A (zh) * | 2015-07-14 | 2017-01-25 | 佳能株式会社 | 用于对象检测和图像处理的方法和装置 |
CN107766867A (zh) * | 2016-08-15 | 2018-03-06 | 佳能株式会社 | 对象形状检测装置及方法、图像处理装置及***、监视*** |
US10467459B2 (en) * | 2016-09-09 | 2019-11-05 | Microsoft Technology Licensing, Llc | Object detection based on joint feature extraction |
-
2018
- 2018-05-25 CN CN201810516451.9A patent/CN110532838A/zh active Pending
-
2019
- 2019-05-14 JP JP2019091606A patent/JP6823686B2/ja active Active
Patent Citations (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2011003136A (ja) * | 2009-06-22 | 2011-01-06 | Sony Corp | 操作制御装置および操作制御方法 |
Non-Patent Citations (1)
Title |
---|
山村敦 外1名: "ファジー推論ニューラルネットワークによる位置関係を考慮した風景画像の認識", 電気学会論文誌C 電子・情報・システム部門誌, vol. 第122-C巻 第3号, JPN6020018342, 1 March 2002 (2002-03-01), pages 506 - 511, ISSN: 0004345141 * |
Cited By (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
KR20210136138A (ko) * | 2019-12-30 | 2021-11-16 | 상하이 센스타임 린강 인텔리전트 테크놀로지 컴퍼니 리미티드 | 이미지 처리 방법, 장치, 저장 매체 및 전자 기기 |
KR102432204B1 (ko) * | 2019-12-30 | 2022-08-12 | 상하이 센스타임 린강 인텔리전트 테크놀로지 컴퍼니 리미티드 | 이미지 처리 방법, 장치, 저장 매체 및 전자 기기 |
CN112633069A (zh) * | 2020-11-26 | 2021-04-09 | 贝壳技术有限公司 | 物体检测方法及装置 |
CN113011377A (zh) * | 2021-04-06 | 2021-06-22 | 新疆爱华盈通信息技术有限公司 | 行人属性识别方法、装置、电子设备及存储介质 |
WO2022249351A1 (ja) * | 2021-05-26 | 2022-12-01 | 日本電信電話株式会社 | 位置推定装置、位置推定学習装置、位置推定方法、位置推定学習方法、位置推定プログラム、及び位置推定学習プログラム |
Also Published As
Publication number | Publication date |
---|---|
CN110532838A (zh) | 2019-12-03 |
JP6823686B2 (ja) | 2021-02-03 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP6823686B2 (ja) | オブジェクト検出装置及び方法及び記憶媒体 | |
US11704907B2 (en) | Depth-based object re-identification | |
US8929600B2 (en) | Action recognition based on depth maps | |
CN106127120B (zh) | 姿势估计方法和装置、计算机*** | |
WO2021227726A1 (zh) | 面部检测、图像检测神经网络训练方法、装置和设备 | |
US9846845B2 (en) | Hierarchical model for human activity recognition | |
CN108288051B (zh) | 行人再识别模型训练方法及装置、电子设备和存储介质 | |
WO2019222401A2 (en) | Gradient adversarial training of neural networks | |
WO2020015752A1 (zh) | 一种对象属性识别方法、装置、计算设备及*** | |
Chhetri et al. | Deep learning for vision‐based fall detection system: Enhanced optical dynamic flow | |
CN110555481A (zh) | 一种人像风格识别方法、装置和计算机可读存储介质 | |
Luo et al. | Shape constrained network for eye segmentation in the wild | |
Park et al. | Attributed grammars for joint estimation of human attributes, part and pose | |
JP6948851B2 (ja) | 情報処理装置、情報処理方法 | |
CN110689030A (zh) | 属性识别装置和方法及存储介质 | |
US20200242404A1 (en) | Image searching apparatus, classifier training method, and recording medium | |
WO2019205729A1 (zh) | 用于识别物体的方法、设备和计算机可读存储介质 | |
CN110738650B (zh) | 一种传染病感染识别方法、终端设备及存储介质 | |
Raj et al. | Image based bird species identification using convolutional neural network | |
Go et al. | Fine-grained multi-class object counting | |
Li et al. | Personrank: Detecting important people in images | |
Venkatachalam et al. | Bimodal HAR-An efficient approach to human activity analysis and recognition using bimodal hybrid classifiers | |
Rao et al. | A multi-view human gait recognition using hybrid whale and gray wolf optimization algorithm with a random forest classifier | |
Dufourq | A survey on factors affecting facial expression recognition based on convolutional neural networks | |
Zhou et al. | Learning a superpixel-driven speed function for level set tracking |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20190514 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20200521 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20200605 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20200730 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20200914 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20201112 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20201211 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20210108 |
|
R151 | Written notification of patent or utility model registration |
Ref document number: 6823686 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R151 |