JP2024043999A - 情報処理装置、学習用データの生成方法及びプログラム - Google Patents
情報処理装置、学習用データの生成方法及びプログラム Download PDFInfo
- Publication number
- JP2024043999A JP2024043999A JP2022149287A JP2022149287A JP2024043999A JP 2024043999 A JP2024043999 A JP 2024043999A JP 2022149287 A JP2022149287 A JP 2022149287A JP 2022149287 A JP2022149287 A JP 2022149287A JP 2024043999 A JP2024043999 A JP 2024043999A
- Authority
- JP
- Japan
- Prior art keywords
- nail
- contour
- finger
- image
- information processing
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 230000010365 information processing Effects 0.000 title claims abstract description 54
- 238000000034 method Methods 0.000 title claims abstract description 37
- 238000010801 machine learning Methods 0.000 claims description 32
- 238000012549 training Methods 0.000 claims description 8
- 230000005484 gravity Effects 0.000 claims description 7
- 230000006870 function Effects 0.000 claims description 4
- 230000004044 response Effects 0.000 claims description 4
- 210000000282 nail Anatomy 0.000 description 183
- 230000008569 process Effects 0.000 description 16
- 238000012545 processing Methods 0.000 description 16
- 238000004891 communication Methods 0.000 description 10
- 238000007639 printing Methods 0.000 description 9
- 230000008859 change Effects 0.000 description 8
- 230000015654 memory Effects 0.000 description 7
- 238000010586 diagram Methods 0.000 description 5
- 230000004048 modification Effects 0.000 description 5
- 238000012986 modification Methods 0.000 description 5
- 230000007246 mechanism Effects 0.000 description 3
- 238000004040 coloring Methods 0.000 description 2
- 238000013527 convolutional neural network Methods 0.000 description 2
- 238000012937 correction Methods 0.000 description 2
- 238000001514 detection method Methods 0.000 description 2
- 210000004905 finger nail Anatomy 0.000 description 2
- 238000003384 imaging method Methods 0.000 description 2
- 230000006740 morphological transformation Effects 0.000 description 2
- 230000002093 peripheral effect Effects 0.000 description 2
- 210000004906 toe nail Anatomy 0.000 description 2
- 208000002078 Ingrown Nails Diseases 0.000 description 1
- 238000013528 artificial neural network Methods 0.000 description 1
- 230000008901 benefit Effects 0.000 description 1
- 210000000078 claw Anatomy 0.000 description 1
- 238000013135 deep learning Methods 0.000 description 1
- 238000003708 edge detection Methods 0.000 description 1
- 238000005516 engineering process Methods 0.000 description 1
- 238000005286 illumination Methods 0.000 description 1
- 239000004973 liquid crystal related substance Substances 0.000 description 1
- 239000000463 material Substances 0.000 description 1
- 230000011218 segmentation Effects 0.000 description 1
- 230000009466 transformation Effects 0.000 description 1
- 238000013519 translation Methods 0.000 description 1
- 238000009966 trimming Methods 0.000 description 1
- 230000003936 working memory Effects 0.000 description 1
Images
Landscapes
- Image Analysis (AREA)
Abstract
【課題】爪の形状の認識精度を向上させる学習用データをより容易に増やすことのできる情報処理装置、学習用データの生成方法及びプログラムを提供する。【解決手段】情報処理装置は、爪を含む指画像を取得する画像取得手段と、指画像における爪輪郭(Nb)及び指輪郭(Fb)を取得する輪郭取得手段と、爪輪郭(Nb)を移動させ、移動後の爪輪郭(Nb)を基準として指輪郭(Fb)の内側を変形させた変形指画像を生成する生成手段と、を備える。【選択図】図3
Description
この発明は、情報処理装置、学習用データの生成方法及びプログラムに関する。
撮影画像に基づいて人の爪を認識して、当該爪や爪に貼付するネイルシールなどに対して着色(印刷;ネイルプリント)などの処理を行う技術がある。認識には、画像認識処理が用いられればよい。画像認識処理には、機械学習モデルを利用したものが含まれ得る。対象位置に置かれた人の爪を撮影し、当該撮影画像に対して画像認識を行うことで、爪の位置及び範囲が特定される。特許文献1には、複数枚の爪の画像をそのうち少なくともいずれかに位置関係を示す標識を含めて撮影することで、爪の三次元的形状を精度よく特定する技術が開示されている。
しかしながら、爪の状態によってはその境界を特定しづらい場合がある。一方で、このような特定しづらい状態の爪の画像を学習用に大量に集めるのは難しく、また、手間がかかるという課題がある。
この発明の目的は、爪の形状の認識精度を向上させる学習用データをより容易に増やすことのできる情報処理装置、学習用データの生成方法及びプログラムを提供することにある。
上記目的を達成するため、本発明は、
爪を含む指画像を取得する画像取得手段と、
前記指画像における爪輪郭及び指輪郭を取得する輪郭取得手段と、
前記爪輪郭を移動させ、当該移動後の前記爪輪郭を基準として前記指輪郭の内側を変形させた変形指画像を生成する生成手段と、
を備える情報処理装置である。
爪を含む指画像を取得する画像取得手段と、
前記指画像における爪輪郭及び指輪郭を取得する輪郭取得手段と、
前記爪輪郭を移動させ、当該移動後の前記爪輪郭を基準として前記指輪郭の内側を変形させた変形指画像を生成する生成手段と、
を備える情報処理装置である。
本発明に従うと、爪の形状の認識精度を向上させるのに好適な学習用データをより容易に増やすことができるという効果がある。
以下、本発明の実施の形態を図面に基づいて説明する。
図1は、情報処理装置1の機能構成を示すブロック図である。
図1は、情報処理装置1の機能構成を示すブロック図である。
本実施形態の情報処理装置1は、一般的なPC(Personal Computer;コンピュータ)であってもよい。情報処理装置1は、CPU11(Central Processing Unit)と、RAM12(Random Access Memory)と、記憶部13と、通信部14と、表示部15と、操作受付部16などを備える。
CPU11は、演算処理を行い、情報処理装置1の動作を統括制御するプロセッサである。CPU11は、単一のプロセッサを有していてもよいし、複数のプロセッサが並列又は用途などに応じて独立に処理を行ってもよい。CPU11は、本実施形態の情報処理装置1において、画像取得手段、輪郭取得手段、生成手段、学習制御手段及び爪領域判定手段を構成する。
RAM12は、CPU11に作業用のメモリ空間を提供し、一時データを記憶する。RAM12は、例えば、DRAMであるが、これに限られるものではない。
記憶部13は、プログラム131及び各種設定データなどを記憶する不揮発性メモリである。不揮発性メモリには、HDD(Hard Disk Drive)が含まれ得る。記憶部13は、周辺機器として情報処理装置に外付けされるものであってもよい。あるいは、記憶部13は、ネットワーク上に位置するネットワークストレージやクラウドサーバなどであってもよい。また、記憶部13には、後述の爪輪郭の画像認識に係る機械学習モデル132を有していてもよい。
通信部14は、通信規格に従って外部機器との間でデータの送受信を行う。通信規格には、例えば、LAN(Local Area Network)に係るTCP/IPなど各種規格が含まれる。
表示部15は、表示画面を有し、CPU11の制御に基づいて当該表示画面への表示を行う。表示画面は、例えば、液晶表示画面であるが、これに限られるものではない。また、表示部15は、動作状態などを報知するためのLEDランプなどを有していてもよい。
操作受付部16は、入力操作を受け付けて受け付けた内容に応じた入力信号をCPU11へ出力する。操作受付部16は、例えば、キーボードやポインティングデバイスなどからの入力操作を受け付ける。
なお、表示部15及び操作受付部16は、情報処理装置1とは別個の構成であって周辺機器として取り付けられて動作するものであってもよい。
なお、表示部15及び操作受付部16は、情報処理装置1とは別個の構成であって周辺機器として取り付けられて動作するものであってもよい。
次に、画像からの爪検出について説明する。
ここでいう爪には、手足の爪のいずれもが含まれ得る。爪を含む指の撮影画像(指画像)における爪の検出は、画像認識処理により行われる。画像認識処理には、機械学習モデルが用いられる。機械学習モデルは、特には限られないが、例えば、DNN(Deep Neural Network)、CNN(Convolutional Neural Network)、セマンティックセグメンテーションなどのディープラーニングに係るアルゴリズムを用いたものである。学習は、教師有学習であり、教師データの作成担当者が指画像を視認しながら爪の輪郭を指定することで教師データが得られる。
ここでいう爪には、手足の爪のいずれもが含まれ得る。爪を含む指の撮影画像(指画像)における爪の検出は、画像認識処理により行われる。画像認識処理には、機械学習モデルが用いられる。機械学習モデルは、特には限られないが、例えば、DNN(Deep Neural Network)、CNN(Convolutional Neural Network)、セマンティックセグメンテーションなどのディープラーニングに係るアルゴリズムを用いたものである。学習は、教師有学習であり、教師データの作成担当者が指画像を視認しながら爪の輪郭を指定することで教師データが得られる。
図2は、爪の形状について説明する図である。
図2(a)に示すように、爪Nは、概ねピンク色の爪甲部分N1と、その先端で指の皮膚から離れて白くなっている爪先部分N2とを含む。この爪先部分N2が指の皮膚の先端よりも伸びていると、画像認識において爪Nの輪郭、特に先端が特定されやすい。一方で、図2(b)に示すように、爪先部分N2が短い又はない(深爪)状態、特に、爪の先端が指の皮膚の先端より根元側にあって、爪の輪郭が指の輪郭に内包される(これらの輪郭が一致する部分を有さない)場合には、画像認識において爪Nの先端が相対的に特定しづらくなりやすい。
図2(a)に示すように、爪Nは、概ねピンク色の爪甲部分N1と、その先端で指の皮膚から離れて白くなっている爪先部分N2とを含む。この爪先部分N2が指の皮膚の先端よりも伸びていると、画像認識において爪Nの輪郭、特に先端が特定されやすい。一方で、図2(b)に示すように、爪先部分N2が短い又はない(深爪)状態、特に、爪の先端が指の皮膚の先端より根元側にあって、爪の輪郭が指の輪郭に内包される(これらの輪郭が一致する部分を有さない)場合には、画像認識において爪Nの先端が相対的に特定しづらくなりやすい。
これに対し、特定しづらいタイプの爪を含む指画像を多く与えて機械学習モデルの学習を行わせるのがよい。しかしながら、例外的な爪の画像を多く入手するのは、容易ではない。
本実施形態の情報処理装置1では、一枚の学習用データから複数の学習用データを生成することで学習用データを増量する。
情報処理装置1では、元の学習用データの画像における指の輪郭を維持したまま爪の輪郭を微調整する。微調整には、サイズの変更(縦横比の変更を含む)に加えて微小角度の回転及び平行移動を含み得る。このとき、主に爪のサイズ変更に伴って爪の輪郭付近を大きく変形すると、実際の人間の指に即した画像から乖離し得る。このように変形された画像は、学習用データとして不適切となる。
図3は、指画像の変形について説明する図である。
図3(a)に示すように、情報処理装置1では、爪輪郭Nbの若干内側(爪輪郭Nbより小さい)及び外側(爪輪郭Nbよりも大きい)にそれぞれ境界線Nbi(内側境界線)及び境界線Nbо(外側境界線)が設定される。破線で示したこれらの境界線Nbi、Nbоは、それぞれ爪Nの領域をモルフォロジー変換などにより数画素(例えば、2~10画素程度)縮小処理及び拡張処理してそれぞれ変形された領域の外縁であってもよい。境界線Nbi、Nbо上には、それぞれある間隔で複数の頂点が定められる。間隔は、爪輪郭の曲線状で当該曲線が概ね適切に表現される程度であればよい。また、爪輪郭Nbの重心位置(あるいは上記境界線の重心位置であってもよい)が基準位置P0として定められる。
図3(a)に示すように、情報処理装置1では、爪輪郭Nbの若干内側(爪輪郭Nbより小さい)及び外側(爪輪郭Nbよりも大きい)にそれぞれ境界線Nbi(内側境界線)及び境界線Nbо(外側境界線)が設定される。破線で示したこれらの境界線Nbi、Nbоは、それぞれ爪Nの領域をモルフォロジー変換などにより数画素(例えば、2~10画素程度)縮小処理及び拡張処理してそれぞれ変形された領域の外縁であってもよい。境界線Nbi、Nbо上には、それぞれある間隔で複数の頂点が定められる。間隔は、爪輪郭の曲線状で当該曲線が概ね適切に表現される程度であればよい。また、爪輪郭Nbの重心位置(あるいは上記境界線の重心位置であってもよい)が基準位置P0として定められる。
また、指輪郭Fbは、単純に指画像からコントラスト(輝度の傾斜)などに基づいて自動設定されてもよい。指Fの付け根側には、照明範囲などにより、あるいは指先から適宜な長さの位置に便宜上の指輪郭Fbが設定されてもよい。この自動設定を容易にするために、指画像は、背面が単色、特に濃色(黒など)の状態で撮影されるのがより好ましい。指輪郭Fb上にも、ある間隔で頂点が定められる。あるいは、指輪郭Fbよりも若干内側(例えば、2~3画素)に指の境界線を設定して、当該境界線上に頂点を定めてもよい。これにより、指の外縁の画素には変形による変更が生じない。この場合も、指の境界線は、指の範囲のモルフォロジー変換などによって定められた領域の外縁であってもよい。爪Nが指の皮膚の先端よりも外側に突出している場合には、当該部分において指輪郭Fbは、爪輪郭Nbと一致する。
点線で示すように、上記境界線Nbi、Nbоと交差しないようにこれらの頂点及び基準位置P0を3点つないで、指輪郭Fb内を三角形(多角形)のタイル(ポリゴン、領域)に分割する(ここでは説明のために頂点の間隔を広くとっている)。指輪郭Fb(又は指の境界線。以下同じ)上の頂点は、他の指輪郭Fb上の頂点及び境界線Nbо上の頂点とのみ接続する。これらの頂点により分割されるタイルは、爪Nの周囲の指部分Fsのみを含む(爪輪郭Nbの近傍領域の外側)。基準位置P0は、境界線Nbi上の頂点とのみ接続する。これらの頂点により分割されるタイルは、爪Nの内部のみを含む(爪輪郭Nbの近傍領域の内側)。
図3(b)に示すように、爪輪郭Nbを移動させるように境界線Nbi、Nbо(の上の頂点)を変更サイズや回転などのパラメータに応じて移動させる。ここでは、一例として、基準位置P0から各頂点への距離が0.9倍となるように当該各頂点が移動している。当該移動に応じて各タイル(指輪郭Fbの内側、区分された各々)を変形する。
爪輪郭Nbが指輪郭Fbに内包されている場合には、変形により指輪郭Fbは移動せず、固定された状態となる。上記のように学習用データの数が不足しがちなこのタイプの指画像を選択的に変形の対象としてもよい。
爪輪郭Nbが指輪郭Fbに内包されている場合には、変形により指輪郭Fbは移動せず、固定された状態となる。上記のように学習用データの数が不足しがちなこのタイプの指画像を選択的に変形の対象としてもよい。
タイル(ポリゴン)への分割は、従来周知の方法で行われてもよい。例えば、ドロネーの三角形分割などが周知の方法の一例として挙げられる。
サイズ変更の際の変更量は、現実的に想定される範囲に概ね収まる大きさを上限として、縦(指の伸びる方向)、横(指の幅方向)のそれぞれについて基準位置P0からの距離の例えば元の0.7倍以上の係数などとして定められる。係数は、変形指画像ごとに各々ランダムに又は予め定められた出現頻度分布に基づいて定められてもよいし、予め適宜な分布で複数の値が設定されていてもよい。また、爪輪郭Nbが指輪郭Fbに内包されている画像への変形に限定される場合には、指輪郭Fbと爪輪郭Nb(境界線Nboであってもよい)との距離が下限距離以上である範囲に変更量が限定されてもよい。回転時の回転角度は微小であってよく、例えば、5度以下などである。また、手指の爪が曲がることは少ないので、回転変形は、足の爪に限定されてもよい。
このような分割により、爪輪郭Nbを含む境界線Nbi、Nbоの間(爪輪郭Nbの近傍領域)は、当該境界線Nbi、Nbо上の頂点を結んだタイルのみとなる。したがって、爪輪郭Nb周囲の点の位置関係が大きく変化しない。特に、この範囲の変形では、爪輪郭Nbに垂直な方向には変化が小さく、かつ一様になりやすいので、実際の人間の指に対して歪んだ変形指画像となりにくい。
図4は、情報処理装置1で実行される指画像生成制御処理のCPU11による制御手順を示すフローチャートである。本実施形態の学習用データの生成方法を含むこの指画像生成制御処理は、例えば、ユーザ又はバッチコマンドなどにより対象の指画像ファイルを指定した開始命令に応じて記憶部13からプログラム131が読み出されて起動される。
CPU11は、指定された指画像データを取得する(ステップS101;画像取得手段、画像取得ステップ)。CPU11は、指画像における指の輪郭(指輪郭Fb)を特定、取得する(ステップS102)。例えば、CPU11は、指画像を表示部15に表示させて、操作受付部16への入力操作を受け付ける(ステップS103)。CPU11は、入力操作の内容に応じて爪の輪郭線(爪輪郭Nb)を取得する(ステップS104)。入力操作は、例えば、表示画面の表示された指画像の爪輪郭Nbをポインティングデバイスでなぞるなどで直接爪輪郭Nbを指定するものであってもよい。あるいは、入力操作は、簡易的な画像処理(例えばエッジ検出など)や、現時点までの学習用データに基づいて学習されている機械学習モデルを利用して得られた初期輪郭を修正、承認するものであってもよい。なお、外部で予め対象の指画像における指輪郭Fbの教師データが設定され、情報処理装置1がこの教師データを取得して、記憶部13に保持していてもよい。この場合には、CPU11は、単純にこの教師データを記憶部13から読み出せばよい。ステップS102、S104の処理が本実施形態の輪郭取得手段、輪郭取得ステップに対応する。
CPU11は、指輪郭Fb上にある間隔で頂点を設定する(ステップS105)。CPU11は、爪輪郭Nbの内外に境界線Nbi、Nbоを定めて、当該境界線Nbi、Nbо上にそれぞれ頂点を設定する(ステップS106)。
CPU11は、取得された爪輪郭Nbが指輪郭Fbから基準距離以上内側にあるか否かを判別する(ステップS107)。すなわち、CPU11は、爪輪郭Nbが指輪郭Fbに内包されており、かつ十分に指輪郭Fbの内側に位置する深爪状態であるか否かを判別する。ここでは、CPU11は、指輪郭Fb上の頂点と、境界線Nbo上の頂点との最短距離を求めて、当該最短距離と基準距離とを比較する。基準距離は、例えば、爪輪郭Nbと境界線Nboとの下限距離に定められてもよい。爪輪郭Nbが指輪郭Fbから基準距離以上内側にないと判別された場合には(ステップS107で“NO”)、CPU11は、得られた指輪郭Fbの情報と対応付けて指画像データを記憶する。そして、CPU11は、指画像生成制御処理を終了する。
爪輪郭Nbが指輪郭Fbから基準距離以上内側にある(深爪状態である)と判別された場合には(ステップS107で“YES”)、CPU11は、爪輪郭Nbの重心位置を特定して基準位置P0とする(ステップS108)。CPU11は、指輪郭Fbの範囲内(爪N及びその周囲の指部分Fs)を三角形のタイル(ポリゴン)に分割する(ステップS109)。
CPU11は、爪Nの形状変更に係る変更パラメータを設定する(ステップS110)。変更パラメータには、上記のように基準位置P0からの距離の変更に係る係数、回転角度及び基準位置P0自体の移動距離が含まれ得る。係数は、指輪郭Fb上の頂点と境界線Nboとの最短距離が下限距離以上となる範囲で定められてもよい。CPU11は、上記変更パラメータに従って境界線Nbi、Nbо上の頂点、及び必要に応じて基準位置P0を連動して移動させる。このとき、CPU11は、爪輪郭Nbの位置も併せて変更する。
CPU11は、移動に応じて各タイル内の各画素の位置を変換して、変形指画像を生成する(ステップS111)。縮尺変更などで画素の移動元と移動先とが1対1で対応しない場合には、対応する複数画素や、周囲の画素などの情報が利用される。例えば、移動先に複数の画素が対応する場合には、CPU11は、当該複数画素の画素値を重み付き平均してもよい。また、移動先に対応する画素がない場合には、CPU11は、周囲の画素による線形補間などにより当該画素の輝度値(階調値)が定められてもよい。これらにより、爪輪郭Nbの移動後の位置を基準として、指輪郭Fbの内側、すなわち、爪N(爪輪郭Nbの内側)及びその周囲の指部分Fs(爪輪郭Nbの外側)が変形される。CPU11は、生成された変形指画像のデータを予め特定、変更されている爪輪郭Nbのデータとともに記憶する。ステップS110、S111の処理が本実施形態の生成手段、生成ステップに対応する。
CPU11は、規定された範囲の変更パラメータの設定がなされたか否かを判別する(ステップS112)。規定された範囲の全体で設定されていないと判別された場合には(ステップS112で“NO”)、CPU11の処理は、ステップS110に戻る。規定された範囲の全体で設定されたと判別された場合には(ステップS112で“YES”)、CPU11は、指画像生成制御処理を終了する。
機械学習モデル132は、上記のようにして記憶された指画像データ(変形指画像データ)及び爪輪郭情報の組み合わせに基づいて学習が行われる。これにより、機械学習モデル132は、指画像データの入力に対して爪輪郭Nb内の爪Nの範囲を特定して出力することが可能となる。CPU11は、通信部14を介して受け付けた指画像データを学習済の機械学習モデル132に入力して爪Nの範囲の特定結果を取得し、外部機器や表示部15に出力することが可能であってもよい。通信部14は、指の撮影装置に直接接続されて、撮影装置のデータを取得可能であってもよい。
さらに、情報処理装置1は、プリントエンジン(印刷機構)に接続されていてもよい。情報処理装置1は、印刷装置(ネイルプリンタ)の一部(制御機構)であってもよい。あるいは、情報処理装置1が外部の1又は複数の印刷装置に対して通信部14を介して接続されているのであってもよい。プリントエンジンは、例えば、インクを吐出する機構の駆動部を有する。インクの吐出方式は、任意のものであってよく、従来周知のものであってもよい。
CPU11は、取得、設定されたネイルプリント画像を、指画像から特定された爪Nの範囲に合わせて調整する。調整対象には、基準位置、サイズ(縮尺、トリミング、アスペクト比など)及び向き(回転方向)などが含まれ得る。CPU11は、調整済みのネイルプリント画像のデータをプリントエンジンに出力することで、プリント位置に置かれた指、又はネイルシール若しくはネイルチップなどに対して当該プリントエンジンによりプリントを行わせる。
図5は、情報処理装置1で実行される学習制御処理(a)及び画像調整制御処理(b)のCPU11による制御手順を示すフローチャートである。
図5(a)に示す学習制御処理は、本実施形態の学習制御手段を構成する。学習制御処理は、操作受付部16への入力操作などにより、学習対象の機械学習モデル132及び学習用データ(教師データ付き)が指定されて開始される。
学習制御処理が開始されると、CPU11は、指定された学習対象の機械学習モデル132に順番に選択した1枚の学習用の指画像データを入力する(ステップS141)。この学習用の指画像データは、上記の変形指画像データを含むものである。
CPU11は、機械学習モデル132から出力された指輪郭(又は指の領域)と、入力された指画像データに対応付けられている教師データとを比較する。CPU11は、比較結果に基づいて損失関数を算出する(ステップS142)。
CPU11は、損失関数を機械学習モデル132のパラメータにフィードバックする(ステップS143)。フィードバックは周知の技術、例えば、誤差逆伝播法などにより行われればよい。
CPU11は、機械学習モデル132の学習終了条件を満たしているか否かを判別する(ステップS144)。学習終了条件は、例えば、損失関数の大きさや、入力された学習用画像データの枚数などについて定められていればよい。学習終了条件を満たしていないと判別された場合には(ステップS144で“NO”)、CPU11の処理は、ステップS141に戻る。学習終了条件を満たしていると判別された場合には(ステップS144で“YES”)、CPU11は、学習制御処理を終了する。このとき、CPU11は、満たされた学習終了条件などに応じて学習の成功又は失敗を判断してもよい。学習が成功した場合には、CPU11は、機械学習モデル132を学習済モデルとして記憶部13に別途記憶保持してもよい。
図5(b)に示す画像調整制御処理は、調整を行う印刷対象画像データ及び印刷対象(ネイルシールの貼付対象)とされる指の撮影画像データとともに操作受付部16により又は通信部14を介して外部から要求されることで開始される。
CPU11は、学習済の機械学習モデル(学習済モデル)に撮影画像を入力する(ステップS181)。CPU11は、学習済モデルから爪輪郭(又は領域)の出力結果を取得する(ステップS182)。CPU11は、取得した爪輪郭の結果に合わせて印刷対象画像の位置、サイズや向きなどを調整する(ステップS183)。ステップS182、S183の処理が本実施形態の爪領域判定手段を構成する。
CPU11は、調整済みの印刷対象画像のデータを出力する(ステップS184)。出力先は、撮影画像の送付元の外部機器であってもよいし、自機の表示部15であってもよい。あるいは、CPU11は、上記のようにプリントエンジンに調整済み印刷対象画像のデータを出力して、セット済みの指やネイルシールなどに対して当該印刷対象画像の印刷を行わせてもよい。そして、CPU11は、画像調整制御処理を終了する。
以上のように、本実施形態の情報処理装置1は、CPU11を備える。CPU11は、画像取得手段として爪Nを含む指画像を取得する。CPU11は、輪郭取得手段として指画像の爪輪郭Nb及び指輪郭Fbを取得する。CPU11は、生成手段として爪輪郭Nbを移動させ、この移動後の爪輪郭Nbを基準として指輪郭Fbの内側を変形させた変形指画像を生成する。このように、情報処理装置1では、元の画像における指輪郭Fbを保ったまま、爪輪郭Nbを移動させる。そして、移動された後の爪Nの輪郭(爪輪郭Nb)を基準として指画像を変形する。これにより、爪Nの輪郭近辺の変形による歪みを低減することができる。したがって、実際の爪Nの近傍の状態から乖離が小さい変形指画像を生成することができる。よって、この情報処理装置1によれば、爪の形状の認識精度を向上させるための学習用データをより容易に増やすことができる。
また、CPU11は、生成手段として、爪輪郭Nbが指輪郭Fbに内包される指画像から選択的に変形指画像を生成することとしてもよい。爪輪郭Nb、特に爪の先端が指輪郭Fbの内側にある画像における爪の先端の認識は他の爪と比較して難しい。したがって、このような画像を選択して学習用データに追加する変形指画像の生成に用いることで、効率的に認識精度の高い学習済モデルを得るための学習用データを生成することができる。特に、深爪などの撮影画像は全体に比して少ないので、好適な学習用画像のオリジナルを大量に取得することは難しい。したがって、情報処理装置1では、爪輪郭Nbが指輪郭Fbに内包される変形指画像を選択的に生成することで、機械学習モデルの学習により好ましい学習用データを効率よく取得することができる。さらに、ネイルプリントでは、爪の先端に位置を合わせて色材を付与することが多いので、爪の先端の認識精度が向上することで、プリントミスを低減することが可能となる。
また、CPU11は、生成手段として、指輪郭Fbの内側(指F)を爪輪郭Nbの近傍領域(境界線Nbiと境界線Nbоとの間)、近傍領域の内側の領域(境界線Nbiの内側)及び近傍領域の外側の領域(境界線Nboの内側)に区分して、区分された各々を、移動後の爪輪郭Nbを基準として変形させる。このように、爪輪郭Nbを不自然に変形させないように近傍領域の変形量が定められる。また、近傍領域の両側の領域の変形量が当該近傍領域の変形を補うように定められる。したがって、爪輪郭Nb付近の変形が不自然になりにくい。よって、この情報処理装置1は、爪輪郭Nbの認識の学習に好適な学習用データが効率よく容易に得ることができる。
また、CPU11は、輪郭取得手段として、爪Nの基準位置P0を設定し、指輪郭Fbと、爪輪郭Nbより小さい境界線Nbiと、爪輪郭Nbより大きい境界線Nbоと、に沿ってそれぞれ複数の頂点を設定する。CPU11は、生成手段として、境界線Nbi上の頂点と境界線Nbо上の頂点とを連動して移動させることで爪輪郭Nbを移動させる。すなわち、情報処理装置1では、単に爪輪郭Nbを境界とするだけではなく、当該爪輪郭Nbの内側と外側に境界線Nbi、Nbоを設定する。すなわち、内側の境界線Nbiよりも内側の爪内部、外側の境界線Nbоよりも外側の指部分Fsに加えて、爪輪郭Nbを含む2本の境界線Nbi、Nbоの間を更に別領域に定められる。これにより、情報処理装置1では、境界線Nbi、Nbоの間の部分の狭い範囲で周囲の変形に対して微調整するので、爪輪郭Nbの近傍で画像が大きく歪むのを抑制することができる。よって、情報処理装置1では、爪の認識にとって不自然さの少ない変形指画像を生成することができる。
また、CPU11は、生成手段として境界線Nbi及び境界線Nbоと交差しないように基準位置P0と頂点とを結んで、指輪郭Fb内(爪を含む)を多角形の領域に分割し、頂点の移動に応じて各領域を変形する。このように指輪郭Fb内を境界線Nbi、Nbоの内外で別個に分割することで、情報処理装置1は、爪輪郭Nbの歪みを抑えつつ適切に爪Nを変形させた指画像を得ることができる。
また、爪輪郭Nbに基づいて定められた頂点の移動は、境界線Nbiと境界線Nboの間に位置する多角形の領域を、境界線Nbiの内側及び境界線Nboの外側に位置する多角形の領域に比して歪みを抑えるように定められる。爪輪郭Nbを挟んだ境界線Nbi、Nboの間の狭い領域で多角形の領域に分割し、爪輪郭Nb自体を大きく変形させないようにしながら縮尺を変更させたり回転させたりすることで、この領域内の各多角形の変形による歪みを抑えることができるので、爪N付近の不自然な歪みの抑えられた現実的におかしくない変形指画像を容易に得ることができる。
また、爪Nの基準位置P0は、爪輪郭Nbの重心位置であってもよい。重心位置に対して爪Nのサイズを変更したり爪Nを回転させることで、爪Nの変形が不自然になりにくい。したがって、情報処理装置1は、適切な変形指画像を生成することができる。
また、CPU11は、生成手段として、指輪郭Fbの頂点と境界線Nboの頂点との最短距離が下限距離以上である範囲で爪輪郭Nbを移動することとしてもよい。これにより、指輪郭Fbの近傍及び爪輪郭Nbの近傍の画像の歪みを適切に抑えつつ、従来爪輪郭Nbを判別しにくい画像を効率的に生成、増量して機械学習モデルの学習に用いることができる。
また、情報処理装置1は、表示部15と、操作受付部16と、を備える。CPU11は、輪郭取得手段として、取得した指画像に対して操作受付部16により受け付けられた内容に基づいて爪輪郭Nbを特定、取得する。すなわち、教師データとなる爪輪郭Nbは、ユーザ操作などによって、表示部15に表示された指画像に対応して適切に定められて、取得されればよい。
CPU11は、学習制御手段として、取得された指画像及び爪輪郭、並びに生成された変形指画像及び移動された爪輪郭を用いて、指の撮影画像の入力に対して爪の範囲に係る情報を出力する機械学習モデル132を学習させる。CPU11は、爪領域判定手段として、得られた学習済モデルに対して指の撮影画像を入力して、爪の範囲に係る情報を取得する。
このように、情報処理装置1が機械学習モデル132を学習させて、指の撮影画像から爪の範囲を判定してもよい。上記のように生成された学習用データを利用することで、この情報処理装置1では、爪の判別精度が向上した学習済モデルが得られる。また、この学習済モデルを用いることで、情報処理装置1は、爪をより精度よく判別することができる。
このように、情報処理装置1が機械学習モデル132を学習させて、指の撮影画像から爪の範囲を判定してもよい。上記のように生成された学習用データを利用することで、この情報処理装置1では、爪の判別精度が向上した学習済モデルが得られる。また、この学習済モデルを用いることで、情報処理装置1は、爪をより精度よく判別することができる。
また、本実施形態の学習用データの生成方法は、爪を含む指画像を取得する画像取得ステップ、指画像の爪輪郭Nbの位置及び指輪郭Fbの位置を取得する輪郭取得ステップ、爪輪郭Nbを変形させ、変形後の爪輪郭Nbの位置に応じて爪N及び当該爪Nの周囲の指部分Fsとを変形させた変形指画像を生成する生成ステップ、を含む。
この学習用データの生成方法によれば、爪の形状を画像認識するための機械学習モデルの学習に用いられるのに好適な画像データを教師データ共々効率よく増量することができる。したがって、撮影、データ収集及び教師データの生成の手間を軽減しつつ、認識精度の高い学習済モデルを得ることができる。
この学習用データの生成方法によれば、爪の形状を画像認識するための機械学習モデルの学習に用いられるのに好適な画像データを教師データ共々効率よく増量することができる。したがって、撮影、データ収集及び教師データの生成の手間を軽減しつつ、認識精度の高い学習済モデルを得ることができる。
また、上記学習用データの生成方法に係るプログラム131を汎用のコンピュータにインストールして実行することで、爪を画像認識するための機械学習モデルを学習させるために好適な学習用データを、特殊な構成を必要とせずに効率よく増量することができる。
なお、本発明は、上記実施の形態に限られるものではなく、様々な変更が可能である。
例えば、上記実施の形態では、指輪郭Fbが爪輪郭Nbを内包する場合にのみ変形指画像が生成されるものとして説明したが、これに限られなくてもよい。また、この場合には、指輪郭Fbの外側にある爪輪郭Nbの変形に伴って必要な指輪郭Fbが適宜定められてもよい。また、この場合には、指の伸びる方向についての変形により爪先部分N2の長さが変わり得る。したがって、爪甲部分N1と爪先部分N2とが区分されて変形処理がなされてもよい。
例えば、上記実施の形態では、指輪郭Fbが爪輪郭Nbを内包する場合にのみ変形指画像が生成されるものとして説明したが、これに限られなくてもよい。また、この場合には、指輪郭Fbの外側にある爪輪郭Nbの変形に伴って必要な指輪郭Fbが適宜定められてもよい。また、この場合には、指の伸びる方向についての変形により爪先部分N2の長さが変わり得る。したがって、爪甲部分N1と爪先部分N2とが区分されて変形処理がなされてもよい。
また、上記実施の形態では、爪輪郭の内側と外側とにそれぞれ境界線Nbi、Nbоが設定されて、爪輪郭Nbが爪N及び指部分Fsとは別領域とされたが、これに限られない。境界線の一部が爪輪郭Nbと重なっていてもよいし、単純に爪輪郭Nbを基準に内外に2分割してもよい。
また、上記実施の形態では、基準位置P0は、爪輪郭Nbの重心位置ではなくてもよい。例えば、基準位置は、爪の左右両端の中心かつ根元位置などに定められてもよい。
また、上記実施の形態では、操作受付部16により爪輪郭Nbの入力操作を受け付けるものとして説明したが、これに限られない。情報処理装置1は、予め外部で爪輪郭Nbが設定された指画像を取得するだけであってもよい。
また、上記実施の形態では、単一の情報処理装置1により変形指画像の生成に係る処理が行われることとしたが、これに限られない。例えば、あるサーバ装置が爪輪郭と指輪郭の位置関係を判別し、変形指画像の生成の対象となる元画像のデータを外部のクライアント装置に送信してもよい。クライアント装置は、各々変形指画像を生成して、生成した変形指画像のデータをサーバ装置に生成データを送信するか、又は共通のデータサーバなどに送信、記憶させてもよい。
また、上記実施の形態では、爪を認識するための機械学習モデルを学習させるための画像データを予め準備する目的で変形指画像を生成したが、これに限られるものではない。生成された変形指画像と元の指画像とに基づいて機械学習モデルを即座に学習させて更新し、更新された機械学習モデルを用いて同一ユーザの他の指の爪輪郭を認識する処理が行われてもよい。この場合、例えば、最初に取得された指画像における爪輪郭の認識結果がユーザに提示(表示部15により表示)されて、ユーザの承認又は修正操作を受け付けることで、爪輪郭Nbが特定される。特定された爪輪郭Nbが教師データとされて、機械学習モデルの更新に利用される。ユーザに提示される認識結果は一種類ではなくてもよい。複数種類の候補が表示されて、ユーザにより正しいものが選択されてもよい。
また、情報処理装置1は、機械学習モデル132を有さず、プリントエンジンに接続されていなくてもよい。情報処理装置1は、生成した変形指画像のデータ及びその爪輪郭情報を外部のデータベースサーバなどに出力するのみであってもよい。機械学習モデル132を有する外部の情報処理装置又は印刷装置がデータベースサーバに記憶されたデータを用いて機械学習モデル132の学習を行わせてもよい。印刷装置は、学習済の機械学習モデルを取得して、爪Nの領域判別に利用するだけであってもよい。
また、以上の説明では、本発明の指画像生成制御に係るプログラム131を記憶するコンピュータ読み取り可能な媒体としてHDD、フラッシュメモリなどの不揮発性メモリなどからなる記憶部13を例に挙げて説明したが、これらに限定されない。その他のコンピュータ読み取り可能な媒体として、MRAMなどの他の不揮発性メモリや、CD-ROM、DVDディスクなどの可搬型記録媒体を適用することが可能である。また、本発明に係るプログラムのデータを通信回線を介して提供する媒体として、キャリアウェーブ(搬送波)も本発明に適用される。
その他、上記実施の形態で示した具体的な構成、処理動作の内容及び手順などは、本発明の趣旨を逸脱しない範囲において適宜変更可能である。本発明の範囲は、特許請求の範囲に記載した発明の範囲とその均等の範囲を含む。
その他、上記実施の形態で示した具体的な構成、処理動作の内容及び手順などは、本発明の趣旨を逸脱しない範囲において適宜変更可能である。本発明の範囲は、特許請求の範囲に記載した発明の範囲とその均等の範囲を含む。
1 情報処理装置
11 CPU
12 RAM
13 記憶部
131 プログラム
14 通信部
15 表示部
16 操作受付部
F 指
Fb 指輪郭
N 爪
N1 爪甲部分
N2 爪先部分
Nb 爪輪郭
Nbi、Nbо 境界線
P0 基準位置
11 CPU
12 RAM
13 記憶部
131 プログラム
14 通信部
15 表示部
16 操作受付部
F 指
Fb 指輪郭
N 爪
N1 爪甲部分
N2 爪先部分
Nb 爪輪郭
Nbi、Nbо 境界線
P0 基準位置
Claims (12)
- 爪を含む指画像を取得する画像取得手段と、
前記指画像における爪輪郭及び指輪郭を取得する輪郭取得手段と、
前記爪輪郭を移動させ、当該移動後の前記爪輪郭を基準として前記指輪郭の内側を変形させた変形指画像を生成する生成手段と、
を備える情報処理装置。 - 前記生成手段は、前記爪輪郭が前記指輪郭に内包される前記指画像から選択的に前記変形指画像を生成する請求項1記載の情報処理装置。
- 前記生成手段は、前記指輪郭の内側を前記爪輪郭の近傍領域、前記近傍領域の内側の領域及び前記近傍領域の外側の領域に区分して、区分された各々を、前記移動後の前記爪輪郭を基準として変形させる請求項1記載の情報処理装置。
- 前記輪郭取得手段は、前記爪の基準位置を設定し、前記指輪郭と、前記爪輪郭より小さい内側境界線と、前記爪輪郭より大きい外側境界線と、に沿ってそれぞれ複数の頂点を設定し、
前記生成手段は、前記内側境界線上の頂点と前記外側境界線上の頂点とを連動して移動させることで前記爪輪郭を移動させる請求項1記載の情報処理装置。 - 前記生成手段は、前記内側境界線及び前記外側境界線と交差しないように前記基準位置と前記頂点とを結んで、前記指輪郭内を多角形の領域に分割し、前記頂点の移動に応じて各領域を変形する請求項4記載の情報処理装置。
- 前記頂点の移動は、前記内側境界線と前記外側境界線の間に位置する多角形の領域を前記内側境界線の内側及び前記外側境界線の外側に位置する多角形の領域に比して歪みを抑えるように定められる請求項5記載の情報処理装置。
- 前記爪の基準位置は、前記爪輪郭の重心位置である請求項4記載の情報処理装置。
- 前記生成手段は、前記指輪郭の前記頂点と前記外側境界線の前記頂点との最短距離が下限距離以上である範囲で前記爪輪郭を移動させる請求項5記載の情報処理装置。
- 表示部と、
操作受付部と、
を備え、
前記輪郭取得手段は、取得した前記指画像に対して前記操作受付部により受け付けられた内容に基づいて前記爪輪郭を取得する
請求項1記載の情報処理装置。 - 前記画像取得手段により取得された前記指画像及び前記輪郭取得手段により取得された前記爪輪郭、並びに前記生成手段により生成された前記変形指画像及び変形された前記爪輪郭を用いて、指の撮影画像の入力に対して爪の範囲に係る情報を出力する機械学習モデルを学習させる学習制御手段と、
前記学習制御手段により学習された前記機械学習モデルに対して指の撮影画像を入力して、爪の範囲に係る情報を取得する爪領域判定手段と、
を備える請求項1記載の情報処理装置。 - 爪を含む指画像を取得する画像取得ステップ、
前記指画像における爪輪郭及び指輪郭を取得する輪郭取得ステップ、
前記爪輪郭を移動させ、当該移動後の前記爪輪郭を基準として前記指輪郭の内側を変形させた変形指画像を生成する生成ステップ、
を含む学習用データの生成方法。 - コンピュータを、
爪を含む指画像を取得する画像取得手段、
前記指画像における爪輪郭及び指輪郭を取得する輪郭取得手段、
前記爪輪郭を移動させ、当該移動後の前記爪輪郭を基準として前記指輪郭の内側を変形させた変形指画像を生成する生成手段、
として機能させるプログラム。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2022149287A JP2024043999A (ja) | 2022-09-20 | 2022-09-20 | 情報処理装置、学習用データの生成方法及びプログラム |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2022149287A JP2024043999A (ja) | 2022-09-20 | 2022-09-20 | 情報処理装置、学習用データの生成方法及びプログラム |
Publications (1)
Publication Number | Publication Date |
---|---|
JP2024043999A true JP2024043999A (ja) | 2024-04-02 |
Family
ID=90480204
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2022149287A Pending JP2024043999A (ja) | 2022-09-20 | 2022-09-20 | 情報処理装置、学習用データの生成方法及びプログラム |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP2024043999A (ja) |
-
2022
- 2022-09-20 JP JP2022149287A patent/JP2024043999A/ja active Pending
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US5317646A (en) | Automated method for creating templates in a forms recognition and processing system | |
JP4799101B2 (ja) | 画像処理方法および装置ならびにプログラム | |
JP4605006B2 (ja) | 印刷データ生成装置、印刷データ生成方法及びプログラム | |
US20160209740A1 (en) | Augmenting physical appearance using illumination | |
US20130038647A1 (en) | Nail print apparatus and printing control method | |
JP2007257585A (ja) | 画像処理方法および装置ならびにプログラム | |
US9942442B2 (en) | Image reading apparatus, image reading method, and medium | |
US20220180122A1 (en) | Method for generating a plurality of sets of training image data for training machine learning model | |
JP2021039424A (ja) | 画像処理システム、画像処理方法、及びプログラム | |
JP2006295303A (ja) | 画像処理方法および装置ならびにプログラム | |
US10558850B2 (en) | Body information analysis apparatus and method of simulating face shape by using same | |
US20180035006A1 (en) | Print transformation effects | |
US20110110589A1 (en) | Image Contrast Enhancement | |
JP4957607B2 (ja) | 画像における顔領域の検出 | |
JP2024043999A (ja) | 情報処理装置、学習用データの生成方法及びプログラム | |
JP2009211148A (ja) | 顔画像処理装置 | |
JP5639499B2 (ja) | 顔画像処理装置 | |
JP6578844B2 (ja) | 画像データ生成装置、印刷装置、及び画像データ生成プログラム | |
JP4725351B2 (ja) | 画像処理装置、画像処理方法、画像処理プログラム | |
US20100033740A1 (en) | Image forming apparatus and method of controlling the same | |
JP2005316550A (ja) | 画像処理装置、画像読取装置、画像検査装置、およびプログラム | |
US20190213454A1 (en) | Method for producing center scan image output using an over scan rip | |
JP6985931B2 (ja) | 画像処理装置、画像処理プログラム、画像処理方法および当該画像処理装置を備える画像形成装置 | |
JP2001291097A (ja) | 画像処理方法と画像処理装置及び画像処理プログラム及びコンピュータ読み取り可能な記録媒体 | |
JP5991406B2 (ja) | 画像処理システム、画像処理方法および画像処理装置 |