JP6727642B2 - 学習型アルゴリズムによるフォーカス補正処理方法 - Google Patents
学習型アルゴリズムによるフォーカス補正処理方法 Download PDFInfo
- Publication number
- JP6727642B2 JP6727642B2 JP2016090290A JP2016090290A JP6727642B2 JP 6727642 B2 JP6727642 B2 JP 6727642B2 JP 2016090290 A JP2016090290 A JP 2016090290A JP 2016090290 A JP2016090290 A JP 2016090290A JP 6727642 B2 JP6727642 B2 JP 6727642B2
- Authority
- JP
- Japan
- Prior art keywords
- image
- learning
- processing
- convolutional neural
- neural network
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired - Fee Related
Links
- 238000012937 correction Methods 0.000 title claims description 14
- 238000004422 calculation algorithm Methods 0.000 title claims description 10
- 238000003672 processing method Methods 0.000 title claims description 5
- 238000012545 processing Methods 0.000 claims description 53
- 238000013527 convolutional neural network Methods 0.000 claims description 49
- 238000000034 method Methods 0.000 claims description 48
- 230000008569 process Effects 0.000 claims description 31
- 238000011156 evaluation Methods 0.000 claims description 22
- 230000006870 function Effects 0.000 description 29
- 239000003623 enhancer Substances 0.000 description 23
- 230000004913 activation Effects 0.000 description 19
- 238000010586 diagram Methods 0.000 description 13
- 238000009499 grossing Methods 0.000 description 9
- 238000012549 training Methods 0.000 description 8
- 230000003044 adaptive effect Effects 0.000 description 4
- 230000007423 decrease Effects 0.000 description 4
- 230000006872 improvement Effects 0.000 description 4
- 238000012360 testing method Methods 0.000 description 4
- 238000006243 chemical reaction Methods 0.000 description 3
- 238000013135 deep learning Methods 0.000 description 3
- 238000003708 edge detection Methods 0.000 description 3
- 238000005457 optimization Methods 0.000 description 3
- 238000004088 simulation Methods 0.000 description 3
- 238000013528 artificial neural network Methods 0.000 description 2
- 238000004891 communication Methods 0.000 description 2
- 238000012790 confirmation Methods 0.000 description 2
- 230000006866 deterioration Effects 0.000 description 2
- 238000005516 engineering process Methods 0.000 description 2
- 238000002474 experimental method Methods 0.000 description 2
- 238000010606 normalization Methods 0.000 description 2
- 230000003287 optical effect Effects 0.000 description 2
- 238000011160 research Methods 0.000 description 2
- 230000003595 spectral effect Effects 0.000 description 2
- 238000001228 spectrum Methods 0.000 description 2
- 238000012935 Averaging Methods 0.000 description 1
- 241000287828 Gallus gallus Species 0.000 description 1
- 238000004364 calculation method Methods 0.000 description 1
- 235000013330 chicken meat Nutrition 0.000 description 1
- 230000006835 compression Effects 0.000 description 1
- 238000007906 compression Methods 0.000 description 1
- 238000007796 conventional method Methods 0.000 description 1
- 238000012888 cubic function Methods 0.000 description 1
- 238000007405 data analysis Methods 0.000 description 1
- 230000003247 decreasing effect Effects 0.000 description 1
- 238000009826 distribution Methods 0.000 description 1
- 235000013601 eggs Nutrition 0.000 description 1
- 238000011478 gradient descent method Methods 0.000 description 1
- 238000010191 image analysis Methods 0.000 description 1
- 238000003384 imaging method Methods 0.000 description 1
- 230000010365 information processing Effects 0.000 description 1
- 230000000873 masking effect Effects 0.000 description 1
- 210000000653 nervous system Anatomy 0.000 description 1
- 210000002569 neuron Anatomy 0.000 description 1
- 230000000737 periodic effect Effects 0.000 description 1
- 238000012805 post-processing Methods 0.000 description 1
- 230000002123 temporal effect Effects 0.000 description 1
- 238000012800 visualization Methods 0.000 description 1
Landscapes
- Image Processing (AREA)
Description
4K/8K(スーパーハイビジョン)超高精細映像におけるフォーカスずれを補正することを目的として、学習型アルゴリズムである畳み込みニューラルネットワークによるデブラー処理を行う。真の画像(出力期待画像)から、フォーカスずれを想定した平滑化入力画像を生成する。予め、そのような入出力画像を学習用データとして、平滑化入力画像をネットワークにより処理した結果の復元画像と真の画像の差分二乗和が最小になるようにネットワークのパラメータを推定(学習)する。学習結果のパラメータを用いた畳み込みニューラルネットワークによる処理は、CPU、GPU、FPGAによる実装が可能であり、従来法と比較して、少ない処理コスト、局所領域処理による低フレーム遅延、高いデブラー性能、ノイズ耐性を実現する。
本発明は、学習型アルゴリズムである畳み込みニューラルネットワークにより画像(映像)復元処理を行う。また、事前の学習により、期待する出力画像を生成するためのネットワークパラメータを学習する。パラメータの決定には、学習用画像とは異なる別の評価用画像における平均ISNRが最大となるパラメータとする。また、このような学習用画像とは異なる評価用画像を用いることにより、学習用画像に過剰に適合するパラメータの過学習を防ぎ、学習用画像以外の画像(映像)においても、高いデブラー復元性能を実現する汎化能力を得ることが可能となる。
また、
4K/8K (スーパーハイビジョン(参考文献[15]))超高精細映像におけるフォーカスずれを補正することを目的として、畳み込みニューラルネットワークによるデブラー処理を行う。畳み込みニューラルネットワークによるデブラー処理の復元性能、ノイズ耐性を評価する。さらに、1パスビデオ超解像(参考文献[12])における非線形エンハンサ処理、真の画像との二乗誤差を最小化するウィーナーフィルタ(参考文献[21])による結果と比較する。
次世代テレビ放送としての4Kの試験放送が2014年6月2日より、CS(Communication Satellite)、およびケーブルテレビにて開始された(次世代放送推進フォーラム(NexTV-F),http://www.nextv-f.jP/)。8K(スーパーハイビジョン(参考文献[15])も含め、2018年(可能な限り早期に)の実用放送開始へ向けて加速している(総務省「4K・8Kロードマップに関するフォローアップ会合(第6回会合)配布資料」,平成27年7月、http://www.soumu.go.jp/main_sosiki/kenkyu/4k8kroadmap/02ryutsu11_03000046.html)。
本発明者は、1パスビデオ超解像として、フレーム内空間方向性補間による解像度変換処理の結果の後処理として、画像のエッジ情報に基づいた非線形エンハンサ処理を行うことにより、さらなる解像度の向上を図った(参考文献[12])。図4に非線形エンハンサ処理の動作を示す。
図5はフォーカス補正のためのデブラー処理を行う畳み込みニューラルネットワークのブロツク図である。畳み込みニューラルネットワークは最小構成の2層とする。畳み込みニューラルネットワークの各層は次のようになる。
は、それぞれ入出力画像の画素値であり、活性化関数
ガウシアン平滑化入力画像を畳み込みニューラルネットワークによりデブラー復元する画像シミュレーションを行う。真の画像を出力期待画像として、σ=1.0のガウシアンフイルタにより平滑化したものを入力画像とする。反復毎に入出力画像間で同じ位置の部分画像(33×33画素サイズ)を画像毎にランダムに256枚抽出して、学習に用いた(ミニバッチ学習(参考文献[11])。図6に、学習に用いたKodakカラー評価画像(Kodak Lossless True Color Image Suite, http://r0k.us/graphics/kodak/)を示す。実験には、G(グリーン)画像のみを用いている。畳み込みニューラルネットワークの構成は、特徴マップ数M=8、入力畳み込みカーネルサイズは7×7画素サイズ(L=3)とした。学習のためのパラメータ初期値は、入力畳み込み重みパラメータ
4K/8K超高精細映像におけるフォーカスずれを補正することを目的として、畳込みニューラルネットワークによるデブラー処理を行った。畳み込みニューラルネットワークによるデブラー処理と1パスビデオ超解像における非線形エンハンサ処理との類似性を指摘するとともに、畳み込みニューラルネットッワークにおけるレベルに関する非線形操作を行うReLU活性化関数の処理結果をフーリエ級数展開することにより、高調波成分が発生していることを明らかにした。そして、畳み込みニューラルネットワークによるデブラー処理の復元性能、ノイズ耐性を評価した。さらに、1パスビデオ超解像における非線形エンハンサ処理、最小二乗の意味において最適なウィーナーフィルタによる結果と比較した。
[1] S. Amari, A theory of adaptive pattern classifiers, IEEE Transactions on Electronic Computers, EC-16-3 (June 1967), 299-307.
[2] J. Biemond, R. L. Lagendijk, and R. M.Mersereau, Iterative methods for image deblurring, Proceedings of the IEEE, 78-5 (May 1990), 856-883.
[3] C. Dong, C.-C. Loy, K. He, and X. Tang, Learning a deep convolutional network for image superresolution, Proceedings of 13th European Conference on Computer Vision (ECCV2014), Part IV, Zurich, Switzerland, pp. 184-199 (September 2014).
[4] D. Eigen, D. Krishnan, and R. Fergus, Restoring an image taken through a window covered with dirt or rain, IEEE International Conference on Computer Vision (ICCV2013), Sydney, Australia, pp. 633-640 (December 2013).
[5] K. Fukushima, Neocognitron: A self-organizing neural network model for a mechanism of pattern recognition unaffected by shift in position, Biological Cybernetics, 36-4 (April 1980), 193-202.
[6] 船津 良平,山下 誉行,三谷 公二,野尻 裕司,スーパーハイビジョンカメラ用フォーカス補助信号,映像情報メディア学会誌, 65-4 (2011年4月), 531-539
[7] V. Jain and H. S. Seung, Natural image denoising with convolutional networks, Proceedings of Advances in Neural Information Processing Systems 21 (NIPS2008), pp. 769-776 (2008).
[8]金谷 健一,「これなら分かる応用数学教室:最小二乗法からウェーブレットまで」,共立出版, 2003年6月.
[9] A. Krizhevsky, I. Sutskever, and G. E. Hinton, ImageNet classification with deep convolutional neural networks, Proceedings of Advances in Neural Information Processing Systems 25 (NIPS2012), pp. 1106-1114 (2012).
[10] Y. LeCun, B. Boser, J. S. Denker, D. Henderson, R. E. Howard, W. Hubbard, and L. D. Jackel, Backpropagation applied to handwritten zip code recognition, Neural Computation, 1-4 (December 1989), 541-551.
[11] Y. LeCun, L. Bottou, G. Orr, and K. Miiller, Efficient BackProp, In G. Orr and K. Miiller (Eds), Neural Networks: Tricks of the trade, Springer, 1998.
[12]松永 力,時間空間方向性補間とマルチスケール非線形エンハンサによる1パスビデオ超解像,第20回画像センシングシンポジウム(SSII2014)講演論文集,横浜(パシフィコ横浜), 2014年6月.
[13] W. S. McCulloch and W. Pitts, A logical calculus of the ideas immanent in nervous activity, The bulletin of mathematical biophysics, 5-4 (December 1943), 115-133.
[14] V. Nair and G. E. Hinton, Rectified linear units improve restricted Boltzmann machines, Proceedings of the 27th International Conference on Machine Learning (ICML10), Haifa, Israel, pp. 807-814 (June 2010).
[15] 日本放送協会, 「スーパーハイビジョン映像技術」特集号, NHK技研R&D,No.137,2013年1月
[16] S. C. Park, M. K. Park, and M. G. Kang, Super-resolution image reconstruction: A technical overview, IEEE Signal Processing Magazine, 20-3 (May 2003), 21-36.
[17] W. H. Press, S. A. Teukolsky, W. T. Vetterling, and B. P. Flannery, Numerical Recipes 3rd Edition: The Art of Scientific Computing, Cambridge University Press, September 2007.
[18] F. Rosenblatt, The Perceptron: A probabilistic model for information storage and organization in the brain, Psychological Review, 65-6 (1958), 386-408.
[19] D. E. Rumelhart, J. L. McClelland, and CORPORATE PDP Research Group, Parallel Distributed Processing: Explorations in the Micro structure of Cognition, Vol. 1: Foundations, Vol. 2: Psychological and Biological Models, MIT Press, Cambridge, MA, USA, July 1986, July 1987. 甘利 俊一(監訳),「PDPモデル−認知科学とニューロン回路網の探索」,産業図書,1989年3月
[20] J. -L. Starck, and F. Murtagh, Astronomical Image and Data Analysis, Springer, 2006.
[21] N. Wiener, Extrapolation, interpolation, and smoothing of stationary time series: with engineering applications, John Wiley & Sons. Inc., New York, 1949.
[22] L. Xu, J. S. Ren, C. Liu, and J. Jia, Deep convolutional neural network for image deconvolution, Proceedings of Advances in Neural Information Processing Systems 27 (NIPS2014), pp. 1790-1798 (2014).
[23]趙 延軍,松永 力, MXFファイルに対応した1パスビデオ超解像アップ変換のGPUによる高速化,GPUテクノロジ・カンファレンス(GTC Japan 2014), 2014-8008,東京(東京ミッドタウンホール&カンファレンス), 2014年7月.
畳み込みニューラルネットワークの各層のパラメータの式(10)の目的関数Jに関する勾配は次のようになる。
の微分は次のようになる.
周期Tで繰り返される周期関数f(t)は、次の三角関数によるフーリエ級数に展開できる(参考文献[8])。
観測画像g(x,y)は、真の画像
が点拡がり関数h(x,y)により劣化したものに、ノイズ成分n(x,y)が加わったものとして、次のように表される。
周波数領域では、
を
K(u,v)は、真の画像とノイズ成分から決まるものであり、近似的なものが既知の場合もあるが、通常は経験的な定数として指定する調整パラメータである。K=0とすると、W(u,v)=1/H(u,v)であり、逆フィルタになる。大きなu,vに対して、
とすると、高周波成分が抑制される。ウィーナーフィルタは、真の画像との二乗誤差
Claims (1)
- 学習型アルゴリズムによるフォーカス補正処理方法において、
前記学習型アルゴリズムである畳み込みニューラルネットワークをデブラー復元処理に用いるために、
真の画像から、フォーカスずれを想定した平滑化入力画像を生成するように、そのような入出力画像を学習用データとして、平滑化入力画像をネットワークにより処理した結果の復元画像と真の画像の差分二乗和が最小になるようにネットワークのパラメータを推定する工程であって、前記学習パラメータは、学習用画像とは異なる別の評価用画像におけるデブラー復元結果の平均ISNRが最大となるように決定される、工程と、
決定された学習済みパラメータによる前記畳み込みニューラルネットワークを用いて、フォーカス補正処理を行う工程と、を有する
ことを特徴とする学習型アルゴリズムによるフォーカス補正処理方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2016090290A JP6727642B2 (ja) | 2016-04-28 | 2016-04-28 | 学習型アルゴリズムによるフォーカス補正処理方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2016090290A JP6727642B2 (ja) | 2016-04-28 | 2016-04-28 | 学習型アルゴリズムによるフォーカス補正処理方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2017199235A JP2017199235A (ja) | 2017-11-02 |
JP6727642B2 true JP6727642B2 (ja) | 2020-07-22 |
Family
ID=60237945
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2016090290A Expired - Fee Related JP6727642B2 (ja) | 2016-04-28 | 2016-04-28 | 学習型アルゴリズムによるフォーカス補正処理方法 |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP6727642B2 (ja) |
Families Citing this family (10)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN111602146B (zh) * | 2018-01-16 | 2024-05-10 | 奥林巴斯株式会社 | 数据处理***、数据处理方法和记录介质 |
JP6476531B1 (ja) * | 2018-03-06 | 2019-03-06 | 株式会社ツバサファクトリー | 処理装置、処理方法、コンピュータプログラム及び処理システム |
CN108830809B (zh) * | 2018-06-05 | 2022-05-03 | 陕西师范大学 | 一种基于膨胀卷积图像去噪方法 |
CN108959732B (zh) * | 2018-06-15 | 2019-09-27 | 西安科技大学 | 一种基于卷积神经网络的输电线路故障类型识别方法 |
JP7362284B2 (ja) * | 2019-03-29 | 2023-10-17 | キヤノン株式会社 | 画像処理方法、画像処理装置、プログラム、画像処理システム、および、学習済みモデルの製造方法 |
JP7016835B2 (ja) | 2019-06-06 | 2022-02-07 | キヤノン株式会社 | 画像処理方法、画像処理装置、画像処理システム、学習済みウエイトの製造方法、および、プログラム |
CN110378854B (zh) * | 2019-07-17 | 2021-10-26 | 上海商汤智能科技有限公司 | 机器人图像增强方法及装置 |
CN112001956B (zh) * | 2020-07-30 | 2024-04-09 | 中国科学院西安光学精密机械研究所 | 基于cnn的纹影法强激光远场焦斑测量图像去噪方法 |
KR20230006106A (ko) * | 2021-07-02 | 2023-01-10 | 주식회사 뷰웍스 | 스테레오 영상을 이용한 고심도 영상 생성 방법 및 장치, 고심도 영상 생성 모델 학습 장치 |
WO2023095212A1 (ja) * | 2021-11-24 | 2023-06-01 | 日本電信電話株式会社 | 多視点画像生成装置、方法およびプログラム |
-
2016
- 2016-04-28 JP JP2016090290A patent/JP6727642B2/ja not_active Expired - Fee Related
Also Published As
Publication number | Publication date |
---|---|
JP2017199235A (ja) | 2017-11-02 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP6727642B2 (ja) | 学習型アルゴリズムによるフォーカス補正処理方法 | |
Protter et al. | Image sequence denoising via sparse and redundant representations | |
CN110766632A (zh) | 基于通道注意力机制和特征金字塔的图像去噪方法 | |
CN104091314B (zh) | 基于边缘预测和稀疏比值正则约束的湍流退化图像盲复原方法 | |
US20150254814A1 (en) | Globally dominant point spread function estimation | |
Teng et al. | Modified pyramid dual tree direction filter‐based image denoising via curvature scale and nonlocal mean multigrade remnant filter | |
Lau et al. | Variational models for joint subsampling and reconstruction of turbulence-degraded images | |
US9508134B2 (en) | Apparatus, system, and method for enhancing image data | |
Alam et al. | Space-variant blur kernel estimation and image deblurring through kernel clustering | |
Zhao et al. | Motion-blurred image restoration framework based on parameter estimation and fuzzy radial basis function neural networks | |
Shukla et al. | Image restoration using modified binary particle Swarm Optimization Richardson-Lucy (MBSO-RL) algorithm | |
CN103337055B (zh) | 一种基于梯度拟合的文本图像去模糊方法 | |
Lavatelli et al. | A motion blur compensation algorithm for 2D DIC measurements of deformable bodies | |
Cao et al. | Dark channel inspired deblurring method for remote sensing image | |
Chen et al. | Blind restoration for nonuniform aerial images using nonlocal Retinex model and shearlet-based higher-order regularization | |
Carbajal et al. | Single image non-uniform blur kernel estimation via adaptive basis decomposition | |
Mastriani | Denoising based on wavelets and deblurring via self-organizing map for Synthetic Aperture Radar images | |
Singh et al. | Comparative analysis of image deblurring techniques | |
Wong et al. | Regularization-based modulation transfer function compensation for optical satellite image restoration using joint statistical model in curvelet domain | |
CN110517196B (zh) | 一种sar图像降噪方法及*** | |
Deshpande et al. | Gaussian Process Regression based iris polar image super resolution | |
Conti et al. | A regularized deep learning approach for image de-blurring | |
CN112464780A (zh) | 基于最大熵准则的椭圆物体特征提取方法 | |
Dash et al. | Particle swarm optimization based support vector regression for blind image restoration | |
Karaca et al. | Image denoising with CNN-based attention |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20190419 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20200605 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20200612 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20200626 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 6727642 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
LAPS | Cancellation because of no payment of annual fees |