JP7055530B1 - 人工知能により生成される画像のベクター画像化 - Google Patents
人工知能により生成される画像のベクター画像化 Download PDFInfo
- Publication number
- JP7055530B1 JP7055530B1 JP2022029232A JP2022029232A JP7055530B1 JP 7055530 B1 JP7055530 B1 JP 7055530B1 JP 2022029232 A JP2022029232 A JP 2022029232A JP 2022029232 A JP2022029232 A JP 2022029232A JP 7055530 B1 JP7055530 B1 JP 7055530B1
- Authority
- JP
- Japan
- Prior art keywords
- image
- information processing
- classifier
- identification result
- format
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 238000013473 artificial intelligence Methods 0.000 title abstract description 12
- 238000003384 imaging method Methods 0.000 title description 2
- 230000010365 information processing Effects 0.000 claims abstract description 65
- 238000003672 processing method Methods 0.000 claims abstract description 12
- 238000006243 chemical reaction Methods 0.000 claims description 51
- 238000010586 diagram Methods 0.000 abstract description 7
- 230000006866 deterioration Effects 0.000 abstract description 5
- 238000000034 method Methods 0.000 description 22
- 208000009119 Giant Axonal Neuropathy Diseases 0.000 description 17
- 201000003382 giant axonal neuropathy 1 Diseases 0.000 description 17
- 238000004891 communication Methods 0.000 description 9
- 238000004364 calculation method Methods 0.000 description 5
- 230000004044 response Effects 0.000 description 4
- 238000013528 artificial neural network Methods 0.000 description 2
- 210000004556 brain Anatomy 0.000 description 2
- 230000000750 progressive effect Effects 0.000 description 2
- 239000004065 semiconductor Substances 0.000 description 2
- 230000006978 adaptation Effects 0.000 description 1
- 230000001143 conditioned effect Effects 0.000 description 1
- 230000010354 integration Effects 0.000 description 1
- 239000004973 liquid crystal related substance Substances 0.000 description 1
- 238000010801 machine learning Methods 0.000 description 1
- 239000000463 material Substances 0.000 description 1
- 238000010606 normalization Methods 0.000 description 1
- 238000004321 preservation Methods 0.000 description 1
- 230000002194 synthesizing effect Effects 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T11/00—2D [Two Dimensional] image generation
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
- G06N3/0475—Generative networks
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/08—Learning methods
- G06N3/0985—Hyperparameter optimisation; Meta-learning; Learning-to-learn
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V10/00—Arrangements for image or video recognition or understanding
- G06V10/70—Arrangements for image or video recognition or understanding using pattern recognition or machine learning
- G06V10/764—Arrangements for image or video recognition or understanding using pattern recognition or machine learning using classification, e.g. of video objects
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V10/00—Arrangements for image or video recognition or understanding
- G06V10/70—Arrangements for image or video recognition or understanding using pattern recognition or machine learning
- G06V10/82—Arrangements for image or video recognition or understanding using pattern recognition or machine learning using neural networks
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/08—Learning methods
- G06N3/084—Backpropagation, e.g. using gradient descent
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/08—Learning methods
- G06N3/094—Adversarial learning
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T2210/00—Indexing scheme for image generation or computer graphics
- G06T2210/32—Image data format
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- Evolutionary Computation (AREA)
- General Health & Medical Sciences (AREA)
- Artificial Intelligence (AREA)
- Software Systems (AREA)
- Computing Systems (AREA)
- Health & Medical Sciences (AREA)
- Data Mining & Analysis (AREA)
- Biomedical Technology (AREA)
- Computational Linguistics (AREA)
- Molecular Biology (AREA)
- Biophysics (AREA)
- General Engineering & Computer Science (AREA)
- Mathematical Physics (AREA)
- Life Sciences & Earth Sciences (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Databases & Information Systems (AREA)
- Medical Informatics (AREA)
- Multimedia (AREA)
- Image Analysis (AREA)
- Image Processing (AREA)
Abstract
Description
図1は、実施形態に係るシステム構成の一例を示す図である。図1に示す例では、サーバ10と、各情報処理装置20A、20B、20C、20Dとが、ネットワークを介してデータ送受信可能なように接続される。情報処理装置を個別に区別しない場合は情報処理装置20とも表記する。
図2は、実施形態に係る情報処理装置10の物理的構成の一例を示す図である。情報処理装置10は、演算部に相当するCPU(Central Processing Unit)10aと、記憶部に相当するRAM(Random Access Memory)10bと、記憶部に相当するROM(Read only Memory)10cと、通信部10dと、入力部10eと、表示部10fと、を有する。これらの各構成は、バスを介して相互にデータ送受信可能に接続される。
図3は、実施形態に係る情報処理装置(サーバ装置)10の処理ブロックの一例を示す図である。情報処理装置10は、取得部102、画像生成部104、データベース(DB)110、第1画像変換部112、第2画像変換部114、判定部116、記憶部118、出力部120を備える。情報処理装置20は、量子コンピュータなどで構成されてもよい。
(1)pix2pix
条件画像と画像のペアから画像同士の関係を学習することで、1枚の画像から学習したペアの画像関係を補完した画像が生成される。
(2)CycleGAN
2組の画像を使い、一方の画像から他方の画像を生成し、他方の画像から一方の画像に戻した時に(サイクルした時に)精度が高くなるように学習させる。
(3)CGAN((Conditional GAN)
条件付きGANと呼ばれ、生成器と識別器に画像データに加えて追加の情報を与えることで、条件付けができるように訓練を行う。
(4)DCGAN(Deep Convolutional GAN)
DCGANは広い意味でCGANの一種であり、オリジナルGANとの大きな違いは、生成器(generator)と識別器(Discriminator)それぞれのネットワークに全結合層ではなく、畳み込み層と転置畳み込み層を使用し、画像が生成される。
(5)PGGAN(Progressive Growing GAN)
PGGANとDCGANとは異なり、段階的に学習データの解像度を上げて行き、これに合わせて生成器と識別器のネットワークもその対象構造を保ったまま層を追加して解像度を上げていくことで、画像が生成される。
(6)BigGAN
生成器に直行正規化を用い、最大で512x512ピクセルの高解像度画像を条件付きで生成するモデルを用いて、画像が生成される。
(7)StyleGAN
低解像度の学習から初めて、モデルに徐々に高い解像度に対応した層を加えながら学習を進めるprogressive growingを用いることで、画像が生成される。
(8)StackGAN
GANを多段構成にすることによって、最初のステージのGANで大枠をとらえた低解像度な画像が生成され、以降のステージのGANでより高解像度な画像が生成される。
(9)AttnGAN
画像のキャプションのようなテキストによる描写の個々の単語に注意を払うことにより、画像のさまざまなサブ領域で詳細を合成することが、画像が生成される。
上述した手法はGANsの一例であり、その他のGANsの手法が用いられてもよい。
実施例1では、上述したとおり、ラスター形式の画像を用いてベクター形式の画像を更新するが、画像生成部104のGANsを利用して新たな第1画像を生成する(更新する)。図3に示すブロック構成は、実施例1に係るブロック構成に対応する。
図4は、実施例1に係る保存画像の一例を示す図である。図4に示す例では、記憶部118に記憶された画像の例を示す。例えば、ベクター形式の画像には画像IDが付与され、画像ID「0001」には、「Img01」としてベクター形式のデータが対応付けられる。ベクター形式のデータは、例えば、コントロールポイントである複数の点の数値、この点から数式によって導き出される曲線などである。
図6は、実施例1に係る情報処理装置10の処理例を示すフローチャートである。ステップS102において、画像生成部104は、生成器106と識別器108とを含む敵対的生成ネットワークを用いてラスター形式の第1画像を生成する。
実施例2では、上述したとおり、ベクター形式の画像を直接更新するが、例えば、ベクター形式の画像を生成できるDeepSVG(https://proceedings.neurips.cc/paper/2020/file/bcf9d6bd14a2095866ce8c950b702341-Paper.pdf)の生成モデルを用いてベクター形式の画像を更新する。なお、ベクター形式の画像を生成するモデルであればいずれのモデルが利用されてもよい。
図8は、実施例2に係る情報処理装置10の処理例を示すフローチャートである。実施例2に係る処理について、図6に示すステップS102からステップS106までは同様の処理であるため処理を省略する。図8では、ステップS108以降の処理を記載する。
Claims (8)
- プロセッサを有する情報処理装置により実行される情報処理方法であって、
前記プロセッサは、
生成器と識別器とを含む敵対的生成ネットワークを用いてラスター形式の第1画像を生成すること、
前記第1画像をベクター形式の第2画像に変換すること、
前記第2画像がラスター形式に変換された第3画像、又は前記第2画像を前記識別器に入力し、識別結果を取得すること、
前記識別結果が真であれば、又は前記識別結果が前記識別器による前記第1画像の識別結果と同じであれば、前記第2画像を記憶部に記憶すること、
を実行する情報処理方法。 - 前記識別器に前記第3画像が入力される場合、前記識別器は、モデルに寄らないメタ学習(Model-Agnostic Meta-Learning)を実行することを含む、請求項1に記載の情報処理方法。
- 前記プロセッサは、
前記識別結果が偽である場合、又は前記第1画像が前記識別器に入力されたときの識別結果と異なる場合、前記生成器にノイズを与えて新たな画像を生成するよう指示すること、
をさらに実行する、請求項1又は2に記載の情報処理方法。 - 前記指示することは、
前記第1画像から前記第2画像への変換アルゴリズムに応じて、前記ノイズを変更することを含む、請求項3に記載の情報処理方法。 - 前記プロセッサは、
前記識別結果が偽である場合、ベクター形式の画像を生成する他の生成器に新たな画像を生成するよう指示すること、
前記他の生成器は、生成したベクター形式の画像を前記識別器に入力すること、
をさらに実行する、請求項2に記載の情報処理方法。 - 前記記憶部に記憶された前記第2画像は、仮想空間上で利用される、請求項1又は2に記載の情報処理方法。
- プロセッサを有する情報処理装置であって、
前記プロセッサは、
生成器と識別器とを含む敵対的生成ネットワークを用いてラスター形式の第1画像を生成すること、
前記第1画像をベクター形式の第2画像に変換すること、
前記第2画像がラスター形式に変換された第3画像、又は前記第2画像を前記識別器に入力し、識別結果を取得すること、
前記識別結果が真であれば、又は前記識別結果が前記識別器による前記第1画像の識別結果と同じであれば、前記第2画像を記憶部に記憶すること、
を実行する情報処理装置。 - 情報処理装置に含まれるプロセッサに、
生成器と識別器とを含む敵対的生成ネットワークを用いてラスター形式の第1画像を生成すること、
前記第1画像をベクター形式の第2画像に変換すること、
前記第2画像がラスター形式に変換された第3画像、又は前記第2画像を前記識別器に入力し、識別結果を取得すること、
前記識別結果が真であれば、又は前記識別結果が前記識別器による前記第1画像の識別結果と同じであれば、前記第2画像を記憶部に記憶すること、
を実行させるプログラム。
Priority Applications (4)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2022029232A JP7055530B1 (ja) | 2022-02-28 | 2022-02-28 | 人工知能により生成される画像のベクター画像化 |
JP2022057575A JP2023126068A (ja) | 2022-02-28 | 2022-03-30 | 人工知能により生成される画像のベクター画像化 |
CN202310207502.0A CN116664708A (zh) | 2022-02-28 | 2023-02-27 | 对人工智能生成的图像进行矢量化的信息处理方法、装置及计算机可读存储介质 |
US18/115,361 US20230274469A1 (en) | 2022-02-28 | 2023-02-28 | Vectorization of images generated by artificial intelligence |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2022029232A JP7055530B1 (ja) | 2022-02-28 | 2022-02-28 | 人工知能により生成される画像のベクター画像化 |
Related Child Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2022057575A Division JP2023126068A (ja) | 2022-02-28 | 2022-03-30 | 人工知能により生成される画像のベクター画像化 |
Publications (2)
Publication Number | Publication Date |
---|---|
JP7055530B1 true JP7055530B1 (ja) | 2022-04-18 |
JP2023125242A JP2023125242A (ja) | 2023-09-07 |
Family
ID=81289287
Family Applications (2)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2022029232A Active JP7055530B1 (ja) | 2022-02-28 | 2022-02-28 | 人工知能により生成される画像のベクター画像化 |
JP2022057575A Pending JP2023126068A (ja) | 2022-02-28 | 2022-03-30 | 人工知能により生成される画像のベクター画像化 |
Family Applications After (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2022057575A Pending JP2023126068A (ja) | 2022-02-28 | 2022-03-30 | 人工知能により生成される画像のベクター画像化 |
Country Status (3)
Country | Link |
---|---|
US (1) | US20230274469A1 (ja) |
JP (2) | JP7055530B1 (ja) |
CN (1) | CN116664708A (ja) |
Citations (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2020119255A (ja) | 2019-01-23 | 2020-08-06 | 京セラドキュメントソリューションズ株式会社 | 画像変換システムおよび情報処理装置 |
-
2022
- 2022-02-28 JP JP2022029232A patent/JP7055530B1/ja active Active
- 2022-03-30 JP JP2022057575A patent/JP2023126068A/ja active Pending
-
2023
- 2023-02-27 CN CN202310207502.0A patent/CN116664708A/zh active Pending
- 2023-02-28 US US18/115,361 patent/US20230274469A1/en active Pending
Patent Citations (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2020119255A (ja) | 2019-01-23 | 2020-08-06 | 京セラドキュメントソリューションズ株式会社 | 画像変換システムおよび情報処理装置 |
Also Published As
Publication number | Publication date |
---|---|
US20230274469A1 (en) | 2023-08-31 |
JP2023125242A (ja) | 2023-09-07 |
CN116664708A (zh) | 2023-08-29 |
JP2023126068A (ja) | 2023-09-07 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
EP3963516B1 (en) | Teaching gan (generative adversarial networks) to generate per-pixel annotation | |
US20220012533A1 (en) | Object Recognition Method and Apparatus | |
CN111369440B (zh) | 模型训练、图像超分辨处理方法、装置、终端及存储介质 | |
JP2020507824A (ja) | 電子装置及びその制御方法 | |
CN113902921A (zh) | 图像处理方法、装置、设备及存储介质 | |
EP4207051A1 (en) | Image super-resolution method and electronic device | |
CN112991171B (zh) | 图像处理方法、装置、电子设备及存储介质 | |
CN112488923A (zh) | 图像超分辨率重建方法、装置、存储介质及电子设备 | |
CN114612289A (zh) | 风格化图像生成方法、装置及图像处理设备 | |
CN114266943A (zh) | 图像风格迁移方法、装置、设备及存储介质 | |
CN115272082A (zh) | 模型训练、视频质量提升方法、装置和计算机设备 | |
US20220301106A1 (en) | Training method and apparatus for image processing model, and image processing method and apparatus | |
JP7055530B1 (ja) | 人工知能により生成される画像のベクター画像化 | |
CN114762004A (zh) | 数据生成方法、数据生成装置、模型生成方法、模型生成装置及程序 | |
WO2023119922A1 (ja) | 画像生成装置、方法及びプログラム並びに学習装置及び学習データ | |
CN116957964A (zh) | 一种基于扩散模型的小样本图像生成方法及*** | |
JP7199121B1 (ja) | 計算グラフの改善 | |
Cosmo et al. | Multiple sequential regularized extreme learning machines for single image super resolution | |
CN112837318B (zh) | 超声图像生成模型的生成方法、合成方法、介质及终端 | |
JP5388779B2 (ja) | 画像処理装置、画像処理方法、および画像処理プログラム | |
CN114743000A (zh) | 基于Unet的多任务气胸医学图像语义分割模型***及其方法 | |
CN114066726A (zh) | 一种图像处理方法、装置、设备及存储介质 | |
KR102580159B1 (ko) | 자기수렴 생성망 학습 방법 및 시스템 | |
US20240070813A1 (en) | Image processing apparatus, image processing method, non-transitory computer readable medium, and endoscope system | |
CN115526775B (zh) | 图像数据处理方法及装置 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20220228 |
|
A871 | Explanation of circumstances concerning accelerated examination |
Free format text: JAPANESE INTERMEDIATE CODE: A871 Effective date: 20220228 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20220323 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20220330 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 7055530 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |