JP7164008B2 - データ生成方法、データ生成装置及びプログラム - Google Patents
データ生成方法、データ生成装置及びプログラム Download PDFInfo
- Publication number
- JP7164008B2 JP7164008B2 JP2021504714A JP2021504714A JP7164008B2 JP 7164008 B2 JP7164008 B2 JP 7164008B2 JP 2021504714 A JP2021504714 A JP 2021504714A JP 2021504714 A JP2021504714 A JP 2021504714A JP 7164008 B2 JP7164008 B2 JP 7164008B2
- Authority
- JP
- Japan
- Prior art keywords
- correct data
- correct
- data
- indicating
- target image
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V10/00—Arrangements for image or video recognition or understanding
- G06V10/70—Arrangements for image or video recognition or understanding using pattern recognition or machine learning
- G06V10/77—Processing image or video features in feature spaces; using data integration or data reduction, e.g. principal component analysis [PCA] or independent component analysis [ICA] or self-organising maps [SOM]; Blind source separation
- G06V10/774—Generating sets of training patterns; Bootstrap methods, e.g. bagging or boosting
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T7/00—Image analysis
- G06T7/70—Determining position or orientation of objects or cameras
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N20/00—Machine learning
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T7/00—Image analysis
- G06T7/10—Segmentation; Edge detection
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V10/00—Arrangements for image or video recognition or understanding
- G06V10/20—Image preprocessing
- G06V10/255—Detecting or recognising potential candidate objects based on visual cues, e.g. shapes
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V10/00—Arrangements for image or video recognition or understanding
- G06V10/70—Arrangements for image or video recognition or understanding using pattern recognition or machine learning
- G06V10/77—Processing image or video features in feature spaces; using data integration or data reduction, e.g. principal component analysis [PCA] or independent component analysis [ICA] or self-organising maps [SOM]; Blind source separation
- G06V10/776—Validation; Performance evaluation
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V10/00—Arrangements for image or video recognition or understanding
- G06V10/70—Arrangements for image or video recognition or understanding using pattern recognition or machine learning
- G06V10/77—Processing image or video features in feature spaces; using data integration or data reduction, e.g. principal component analysis [PCA] or independent component analysis [ICA] or self-organising maps [SOM]; Blind source separation
- G06V10/778—Active pattern-learning, e.g. online learning of image or video features
- G06V10/7784—Active pattern-learning, e.g. online learning of image or video features based on feedback from supervisors
- G06V10/7788—Active pattern-learning, e.g. online learning of image or video features based on feedback from supervisors the supervisor being a human, e.g. interactive learning with a human teacher
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V10/00—Arrangements for image or video recognition or understanding
- G06V10/94—Hardware or software architectures specially adapted for image or video understanding
- G06V10/945—User interactive design; Environments; Toolboxes
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T2207/00—Indexing scheme for image analysis or image enhancement
- G06T2207/20—Special algorithmic details
- G06T2207/20081—Training; Learning
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T2207/00—Indexing scheme for image analysis or image enhancement
- G06T2207/20—Special algorithmic details
- G06T2207/20084—Artificial neural networks [ANN]
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T2207/00—Indexing scheme for image analysis or image enhancement
- G06T2207/20—Special algorithmic details
- G06T2207/20092—Interactive image processing based on input by user
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T2207/00—Indexing scheme for image analysis or image enhancement
- G06T2207/30—Subject of image; Context of image processing
- G06T2207/30196—Human being; Person
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V2201/00—Indexing scheme relating to image or video recognition or understanding
- G06V2201/07—Target detection
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- Software Systems (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Multimedia (AREA)
- Databases & Information Systems (AREA)
- Artificial Intelligence (AREA)
- Computing Systems (AREA)
- Evolutionary Computation (AREA)
- Medical Informatics (AREA)
- Health & Medical Sciences (AREA)
- General Health & Medical Sciences (AREA)
- Data Mining & Analysis (AREA)
- General Engineering & Computer Science (AREA)
- Mathematical Physics (AREA)
- Image Analysis (AREA)
- Electrically Operated Instructional Devices (AREA)
Description
図1は、実施形態における学習データ生成システム100の概略構成を示す。学習データ生成システム100は、大まかな正解付け作業により正解付けがなされた正解データから、より正確度又は精度が高い正解データを生成する。学習データ生成システム100は、データ生成装置10と、記憶装置20とを有する。
次に、データ生成装置10の機能ブロックについて説明する。以後では、正解データ生成処理について説明した後、学習処理について説明する。ここで、正解データ生成処理は、推定器情報が既に推定器情報記憶部24に記憶されている場合に第1正解データから第2正解データを生成する処理である。また、学習処理は、推定器情報記憶部24に記憶する推定器情報を学習により生成する処理である。
次に、第1~第4正解データが示す対象物位置の具体例について説明する。以下に説明するように、第1正解データ及び第4正解データが示す対象物位置は、対象物を含む位置、対象物の一部を示す位置、又は、対象物の候補位置となるように決定される。また、第2正解データ及び第3正解データが示す対象物位置は、対象物の正解の位置を示すように決定される。
次に、正解データ生成処理及び学習処理の各処理フローについて説明する。
次に、上述の実施形態に好適な変形例について説明する。以下に説明する変形例は、任意に組み合わせて上述の実施形態に適用してもよい。
データ生成装置10は、上述した第2正解データ生成処理及び学習処理のうち第2正解データ生成処理のみを行ってもよい。
データ生成装置10は、対象画像及び第1正解データを記憶装置20から取得する代わりに、正解付け作業を行う端末装置から受信してもよい。
データ生成装置10は、図2に示す適格性判定部34及び出力部35に相当する機能を有しなくともよい。
正解付けがなされる対象となる対象画像を取得し、
前記対象画像に表示された対象物に対し、
当該対象物を含む位置若しくは当該対象物の一部を示す位置、又は、
当該対象物の候補位置
を示した第1正解データを取得し、
対象物を含む位置若しくは当該対象物の一部を示す位置、又は、当該対象物の候補位置から、当該対象物の推定位置を出力するように学習された推定器に基づき、前記第1正解データから、前記対象物の推定位置を示した第2正解データを生成する、
データ生成方法。
前記第1正解データは、前記対象画像内において指定された位置を示す、付記1に記載のデータ生成方法。
前記対象物を含む位置は、前記対象画像に表示された前記対象物の表示領域の全体を少なくとも含むように指定された領域である、付記1または2に記載のデータ生成方法。
前記対象物の一部を示す位置は、前記対象画像に表示された前記対象物の表示領域内において指定された一部の領域又は座標を示す、付記1~3のいずれか一項に記載のデータ生成方法。
前記候補位置は、前記対象画像に表示された前記対象物の表示領域の近傍となる領域又は座標を示す、付記1~4のいずれか一項に記載のデータ生成方法。
前記第2正解データが示す前記推定位置が前記対象物の正解位置としての適格性を有するか否かを判定する、付記1~5のいずれか一項に記載のデータ生成方法。
前記適格性を有すると判定された前記第2正解データを、学習に用いる学習データとして記憶部に記憶する、付記6に記載のデータ生成方法。
画像群を取得し、
当該画像群の各々の画像に表示された対象物の位置を示す第3正解データを取得し、
前記第3正解データから、当該対象物を含む位置若しくは当該対象物の一部を示す位置、又は、当該対象物の候補位置を示す第4正解データを生成し、
前記画像群と、前記第3正解データと、前記第4正解データとに基づき、前記推定器の学習を行う、付記1~7のいずれか一項に記載のデータ生成方法。
前記対象物を含む位置として無作為に選定した位置、当該対象物の一部を示す位置として無作為に選定した位置、又は、当該対象物の候補位置として無作為に選定した位置のいずれかの位置を示す前記第4正解データを生成する、付記8に記載のデータ生成方法。
正解付けがなされる対象となる対象画像を取得する対象画像取得部と、
前記対象画像に表示された対象物に対し、
当該対象物を含む位置若しくは当該対象物の一部を示す位置、又は、
当該対象物の候補位置
を示した第1正解データを取得する第1正解データ取得部と、
対象物を含む位置若しくは当該対象物の一部を示す位置、又は、当該対象物の候補位置から、当該対象物の推定位置を出力するように学習された推定器に基づき、前記第1正解データから、前記対象物の推定位置を示した第2正解データを生成する第2正解データ生成部と、を有するデータ生成装置。
コンピュータが実行するプログラムであって、
正解付けがなされる対象となる対象画像を取得する対象画像取得部と、
前記対象画像に表示された対象物に対し、
当該対象物を含む位置若しくは当該対象物の一部を示す位置、又は、
当該対象物の候補位置
を示した第1正解データを取得する第1正解データ取得部と、
対象物を含む位置若しくは当該対象物の一部を示す位置、又は、当該対象物の候補位置から、当該対象物の推定位置を出力するように学習された推定器に基づき、前記第1正解データから、前記対象物の推定位置を示した第2正解データを生成する第2正解データ生成部
として前記コンピュータを機能させる、プログラム。
11 プロセッサ
12 メモリ
13 インターフェース
14 表示部
15 入力部
20 記憶装置
21 対象画像記憶部
22 第1正解データ記憶部
23 第2正解データ記憶部
24 推定器情報記憶部
25 教師データ記憶部
100 学習データ生成システム
Claims (10)
- 正解付けがなされる対象となる対象画像を取得し、
前記対象画像に表示された対象物に対し、
当該対象物を含む位置若しくは当該対象物の一部を示す位置、又は、
当該対象物の候補位置
を示した第1正解データを取得し、
対象物を含む位置若しくは当該対象物の一部を示す位置、又は、当該対象物の候補位置から、当該対象物の推定位置を出力するように学習された推定器に基づき、前記第1正解データから、前記対象物の推定位置を示した第2正解データを生成する、
データ生成方法。 - 前記第1正解データは、前記対象画像内において指定された位置を示す、請求項1に記載のデータ生成方法。
- 前記対象物を含む位置は、前記対象画像に表示された前記対象物の表示領域の全体を少なくとも含むように指定された領域である、請求項1または2に記載のデータ生成方法。
- 前記対象物の一部を示す位置は、前記対象画像に表示された前記対象物の表示領域内において指定された一部の領域又は座標を示す、請求項1~3のいずれか一項に記載のデータ生成方法。
- 前記候補位置は、前記対象画像に表示された前記対象物の表示領域の近傍となる領域又は座標を示す、請求項1~4のいずれか一項に記載のデータ生成方法。
- 前記第2正解データが示す前記推定位置が前記対象物の正解位置としての適格性を有するか否かを判定する、請求項1~5のいずれか一項に記載のデータ生成方法。
- 前記適格性を有すると判定された前記第2正解データを、学習に用いる学習データとして記憶部に記憶する、請求項6に記載のデータ生成方法。
- 画像群を取得し、
当該画像群の各々の画像に表示された対象物の位置を示す第3正解データを取得し、
前記第3正解データから、当該対象物を含む位置若しくは当該対象物の一部を示す位置、又は、当該対象物の候補位置を示す第4正解データを生成し、
前記画像群と、前記第3正解データと、前記第4正解データとに基づき、前記推定器の学習を行う、請求項1~7のいずれか一項に記載のデータ生成方法。 - 正解付けがなされる対象となる対象画像を取得する対象画像取得手段と、
前記対象画像に表示された対象物に対し、
当該対象物を含む位置若しくは当該対象物の一部を示す位置、又は、
当該対象物の候補位置
を示した第1正解データを取得する第1正解データ取得手段と、
対象物を含む位置若しくは当該対象物の一部を示す位置、又は、当該対象物の候補位置から、当該対象物の推定位置を出力するように学習された推定器に基づき、前記第1正解データから、前記対象物の推定位置を示した第2正解データを生成する第2正解データ生成手段と、を有するデータ生成装置。 - コンピュータが実行するプログラムであって、
正解付けがなされる対象となる対象画像を取得する対象画像取得手段と、
前記対象画像に表示された対象物に対し、
当該対象物を含む位置若しくは当該対象物の一部を示す位置、又は、
当該対象物の候補位置
を示した第1正解データを取得する第1正解データ取得手段と、
対象物を含む位置若しくは当該対象物の一部を示す位置、又は、当該対象物の候補位置から、当該対象物の推定位置を出力するように学習された推定器に基づき、前記第1正解データから、前記対象物の推定位置を示した第2正解データを生成する第2正解データ生成手段
として前記コンピュータを機能させる、プログラム。
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
PCT/JP2019/010323 WO2020183656A1 (ja) | 2019-03-13 | 2019-03-13 | データ生成方法、データ生成装置及びプログラム |
Publications (2)
Publication Number | Publication Date |
---|---|
JPWO2020183656A1 JPWO2020183656A1 (ja) | 2021-11-18 |
JP7164008B2 true JP7164008B2 (ja) | 2022-11-01 |
Family
ID=72427239
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2021504714A Active JP7164008B2 (ja) | 2019-03-13 | 2019-03-13 | データ生成方法、データ生成装置及びプログラム |
Country Status (3)
Country | Link |
---|---|
US (1) | US20220130135A1 (ja) |
JP (1) | JP7164008B2 (ja) |
WO (1) | WO2020183656A1 (ja) |
Families Citing this family (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2020183705A1 (ja) * | 2019-03-14 | 2020-09-17 | 日本電気株式会社 | 生成方法、学習データ生成装置及びプログラム |
Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20180276815A1 (en) | 2017-03-27 | 2018-09-27 | Siemens Healthcare Gmbh | Highly Integrated Annotation and Segmentation System for Medical Imaging |
US20190065995A1 (en) | 2017-08-31 | 2019-02-28 | Canon Kabushiki Kaisha | Information processing apparatus and method of controlling information processing apparatus |
Family Cites Families (14)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP4517633B2 (ja) * | 2003-11-25 | 2010-08-04 | ソニー株式会社 | 対象物検出装置及び方法 |
JP6624877B2 (ja) * | 2015-10-15 | 2019-12-25 | キヤノン株式会社 | 情報処理装置、情報処理方法及びプログラム |
JP6897042B2 (ja) * | 2016-09-27 | 2021-06-30 | 日本電気株式会社 | 画像検査装置、画像検査方法および画像検査プログラム |
CN106709936A (zh) * | 2016-12-14 | 2017-05-24 | 北京工业大学 | 一种基于卷积神经网络的单目标跟踪方法 |
KR20180081353A (ko) * | 2017-01-06 | 2018-07-16 | 삼성전자주식회사 | 전자 장치 및 그의 동작 방법 |
CN109214245B (zh) * | 2017-07-03 | 2022-02-18 | 株式会社理光 | 一种目标跟踪方法、装置、设备及计算机可读存储介质 |
CN107689052B (zh) * | 2017-07-11 | 2021-06-29 | 西安电子科技大学 | 基于多模型融合和结构化深度特征的视觉目标跟踪方法 |
JP2019023858A (ja) * | 2017-07-21 | 2019-02-14 | パナソニック インテレクチュアル プロパティ コーポレーション オブ アメリカPanasonic Intellectual Property Corporation of America | 学習データ生成装置、学習データ生成方法、機械学習方法及びプログラム |
KR102040309B1 (ko) * | 2017-09-18 | 2019-11-04 | 한국전자통신연구원 | 멀티미디어 콘텐츠와 연관되는 후각 정보 인식 장치 및 방법, 라벨 정보 생성 장치 및 방법 |
JP6919990B2 (ja) * | 2017-10-17 | 2021-08-18 | 株式会社日立製作所 | オンライン認識装置、オンライン認識方法、及びそれに用いる設定画面 |
JP2019096072A (ja) * | 2017-11-22 | 2019-06-20 | 株式会社東芝 | 物体検出装置、物体検出方法およびプログラム |
JP6901007B2 (ja) * | 2017-12-06 | 2021-07-14 | 日本電気株式会社 | 学習装置、検査システム、学習方法、検査方法およびプログラム |
JP6943338B2 (ja) * | 2018-05-18 | 2021-09-29 | 日本電気株式会社 | 画像処理装置、システム、方法及びプログラム |
US10755128B2 (en) * | 2018-12-18 | 2020-08-25 | Slyce Acquisition Inc. | Scene and user-input context aided visual search |
-
2019
- 2019-03-13 JP JP2021504714A patent/JP7164008B2/ja active Active
- 2019-03-13 WO PCT/JP2019/010323 patent/WO2020183656A1/ja active Application Filing
- 2019-03-13 US US17/436,695 patent/US20220130135A1/en active Pending
Patent Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20180276815A1 (en) | 2017-03-27 | 2018-09-27 | Siemens Healthcare Gmbh | Highly Integrated Annotation and Segmentation System for Medical Imaging |
US20190065995A1 (en) | 2017-08-31 | 2019-02-28 | Canon Kabushiki Kaisha | Information processing apparatus and method of controlling information processing apparatus |
Also Published As
Publication number | Publication date |
---|---|
US20220130135A1 (en) | 2022-04-28 |
WO2020183656A1 (ja) | 2020-09-17 |
JPWO2020183656A1 (ja) | 2021-11-18 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP7071054B2 (ja) | 情報処理装置、情報処理方法およびプログラム | |
US20160328825A1 (en) | Portrait deformation method and apparatus | |
US10964057B2 (en) | Information processing apparatus, method for controlling information processing apparatus, and storage medium | |
CN110991649A (zh) | 深度学习模型搭建方法、装置、设备和存储介质 | |
US9508177B2 (en) | Method of controlling skeleton model, and recording medium therewith | |
JP6872044B2 (ja) | 対象物の外接枠を決定するための方法、装置、媒体及び機器 | |
EP4191540A1 (en) | 3d data system and 3d data generation method | |
JP2023109570A (ja) | 情報処理装置、学習装置、画像認識装置、情報処理方法、学習方法、画像認識方法 | |
JP7164008B2 (ja) | データ生成方法、データ生成装置及びプログラム | |
JP6645442B2 (ja) | 情報処理装置、情報処理方法、及び、プログラム | |
US10573033B2 (en) | Selective editing of brushstrokes in a digital graphical image based on direction | |
JP2006318232A (ja) | 解析用メッシュ修正装置 | |
CN111951348A (zh) | 确定框选区域的方法、装置及电子设备 | |
CN115457206A (zh) | 三维模型生成方法、装置、设备及存储介质 | |
JP6590606B2 (ja) | 画像処理装置、画像処理方法、プログラム | |
CN113167568B (zh) | 坐标计算装置、坐标计算方法和计算机可读记录介质 | |
CN109308703B (zh) | 利用结构化的用户点击点对解剖结构智能描轮廓 | |
JP2022013433A (ja) | 情報処理装置、情報処理方法 | |
WO2023188160A1 (ja) | 入力支援装置、入力支援方法、及び非一時的なコンピュータ可読媒体 | |
WO2020183705A1 (ja) | 生成方法、学習データ生成装置及びプログラム | |
CN109002163A (zh) | 三维交互姿势采样方法、装置、计算机设备及存储介质 | |
WO2024009888A1 (ja) | 情報処理装置及びその制御方法及びプログラム | |
US20240078832A1 (en) | Joint detection apparatus, learning-model generation apparatus, joint detection method, learning-model generation method, and computer readable recording medium | |
JP6751540B1 (ja) | 形状予測システム、形状予測方法及び形状予測プログラム | |
JP4691659B2 (ja) | 画像認識装置、画像認識方法及びプログラム |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20210709 |
|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20210709 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20220920 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20221003 |
|
R151 | Written notification of patent or utility model registration |
Ref document number: 7164008 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R151 |