JP7490886B2 - 情報処理装置及び情報処理方法 - Google Patents

情報処理装置及び情報処理方法 Download PDF

Info

Publication number
JP7490886B2
JP7490886B2 JP2023508879A JP2023508879A JP7490886B2 JP 7490886 B2 JP7490886 B2 JP 7490886B2 JP 2023508879 A JP2023508879 A JP 2023508879A JP 2023508879 A JP2023508879 A JP 2023508879A JP 7490886 B2 JP7490886 B2 JP 7490886B2
Authority
JP
Japan
Prior art keywords
feature map
data
correctly detected
image
determines
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
JP2023508879A
Other languages
English (en)
Other versions
JPWO2022202177A1 (ja
Inventor
雅之 藤田
圭吾 長谷川
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Hitachi Kokusai Electric Inc
Original Assignee
Hitachi Kokusai Electric Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Hitachi Kokusai Electric Inc filed Critical Hitachi Kokusai Electric Inc
Publication of JPWO2022202177A1 publication Critical patent/JPWO2022202177A1/ja
Application granted granted Critical
Publication of JP7490886B2 publication Critical patent/JP7490886B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T7/00Image analysis

Landscapes

  • Engineering & Computer Science (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Theoretical Computer Science (AREA)
  • Image Analysis (AREA)

Description

本発明は、画像分析を行う情報処理装置に係り、特に、機械学習における再学習データの候補を効率的に取得できる情報処理装置及び情報処理方法に関する。
[従来の技術] AI(Artificial Intelligence:人工知能)のディープラーニングなどの機械学習では、既に学習した学習データを元に、入力画像に映る物体を検知するようになっている。
しかし、学習データの不足により、画像中に物体が映っているにもかかわらず検知ができない「見逃し」や物体が映っていないが検知してしまう「誤検知」が発生する場合がある。
特に、屋外で撮影した画像から特定の物体を検知する際には、特定の時間帯に撮影した画像では精度良く検知できていたとしても、時間の経過により照度や影の向き、物体の向きの変化や遮蔽の発生など、想定外の要因により検知精度が劣化することがある。
見逃しや誤検知が発生した画像に対しては、正解付けを行い再学習することで精度を向上させることができる。
但し、見逃しや誤検知が発生したかどうかは検知結果の画像を人間が見て判断する必要がある。
[関連技術] 尚、関連する先行技術として、特開2019-220116号公報「情報処理装置、判定方法、および対象物判定プログラム」(特許文献1)がある。
特許文献1には、再学習データを効率的に収集する技術として、商品などの対象物を撮影した画像の中から検知精度が低い画像を自動で選択する方法が示されている。ただし、この技術は画像中に対象物が写っていることを前提としている。
特開2019-220116号公報
しかしながら、従来の機械学習では、対象物の検出の精度を向上させるためには、大量の画像に対して見逃しや誤検知の有無の判断を行い、正解付けを行った上で再学習することが必要であり、作業に時間が掛かるという問題点があった。
尚、特許文献1には、見逃しや誤検知の有無の判定を自動化し、再学習データの候補を効率的に取得することについての記載がない。
本発明は上記実情に鑑みて為されたもので、撮影した画像について見逃しや誤検知の有無の判定を自動化し、再学習データの候補を効率的に取得する情報処理装置及び情報処理方法を提供することを目的とする。
上記従来例の問題点を解決するための本発明は、画像解析を行う情報処理装置であって、取得した画像データを、CNNを用いて画像中に写る対象物の検知を行い、検知された対象物についての確信度に基づく特徴量を表す特徴マップを出力する画像解析部と、出力された特徴マップを解析し、検知結果の確からしさを評価する特徴マップ解析部と、特徴マップの評価結果から画像データに対象物が正しく検知されたか否かを判定し、正しく検知された場合には正検知データとし、正しく検知されなかった場合には対象物の検知を行うCNNを再学習するための再学習データの候補とする正解判定部と、を有することを特徴とする。
本発明は、上記情報処理装置において、特徴マップ解析部が、特徴マップの画素値の分布を用いたエントロピーの値を評価し、正解判定部が、エントロピーの値が予め定めた閾値以下であれば、正しく検知された場合とし、エントロピーの値が閾値を超えていれば、正しく検知されなかった場合とすることを特徴とする。
本発明は、画像解析を行う情報処理方法であって、取得した画像データを、CNNを用いて画像中に写る対象物の検知を行い、検知された対象物についての確信度に基づく特徴量を表す特徴マップを出力する画像解析ステップと、出力された特徴マップを解析し、検知結果の確からしさを評価する特徴マップ解析ステップと、特徴マップの評価結果から画像データに対象物が正しく検知されたか否かを判定し、正しく検知された場合には正検知データとし、正しく検知されなかった場合には対象物の検知を行うCNNを再学習するための再学習データの候補とする正解判定ステップと、を有することを特徴とする。
本発明は、上記情報処理方法において、特徴マップ解析ステップが、特徴マップの画素値の分布を用いたエントロピーの値を評価し、正解判定ステップが、エントロピーの値が予め定めた閾値以下であれば、正しく検知された場合とし、エントロピーの値が閾値を超えていれば、正しく検知されなかった場合とすることを特徴とする。
本発明によれば、画像解析部が、取得した画像データを、CNNを用いて画像中に写る対象物の検知を行い、検知された対象物についての確信度に基づく特徴量を表す特徴マップを出力し、特徴マップ解析部が、出力された特徴マップを解析し、検知結果の確からしさを評価し、正解判定部が、特徴マップの評価結果から画像データに対象物が正しく検知されたか否かを判定し、正しく検知された場合には正検知データとし、正しく検知されなかった場合には対象物の検知を行うCNNを再学習するための再学習データの候補とする画像処理装置及び画像処理方法としているので、見逃しや誤検知の有無の判定を自動化し、再学習データの候補を効率的に取得できる効果がある。
本装置の概略構成図である。 本装置の処理フロー図である。 本装置における正検知の例を示す説明図である。 本装置における再学習データ候補取得の例を示す説明図である。
本発明の実施の形態について図面を参照しながら説明する。[実施の形態の概要] 本発明の実施の形態に係る情報処理装置(本装置)は、取得した画像データから特定の対象物についての確信度に基づく特徴量を表す特徴マップを出力する画像解析部と、出力された特徴マップを解析し、検知結果の確からしさを評価する特徴マップ解析部と、特徴マップの評価結果から画像データに対象物が正しく検知されたか否かを判定し、正しく検知された場合には正検知データとし、正しく検知されなかった場合には再学習データの候補とする正解判定部と、を有するものであり、正解判定部が見逃しや誤検知の有無を自動的に判定し、再学習データの候補を効率的に取得できるものである。
[本装置:図1] 本装置について図1を参照しながら説明する。図1は、本装置の概略構成図である。
本装置100は、図1に示すように、コンピュータ(PC)等の情報処理装置で実現され、制御部101と、記憶部106とを基本的に有している。
以下、本装置100の各部について具体的に説明する。
[制御部101] 制御部101は、演算処理装置で実現され、各部を統括して制御するものであり、画像取得部102と、画像解析部103と、特徴マップ解析部104と、正解判定部105と備えている。
制御部101における各部102~105は、例えば、記憶部106に記憶された処理プログラムを制御部101が読み込んでソフトウェアとして機能を実現する手段である。
[記憶部106] 記憶部106は、ハードディスクなどの記録媒体によって実現され、使用するデータ等を記憶するものであり、画像データ記憶部107と、再学習データ候補記憶部108と、正検知データ記憶部109とを備えている。
[画像取得部102] 画像取得部102は、再学習データの候補とすべきかどうかの判定対象となる画像データを記憶部106の画像データ記憶部107から取得し、画像解析部103に出力する。
画像取得部102が画像を取得する方法は特に限定するものではないが、例えば、画像取得部102は、撮像装置(カメラ)から画像データを直接取得してもよいし、当該撮像装置の記憶装置に記憶された画像データを取得してもよい。
[画像解析部103] 画像解析部103は、CNN(Convolution Neural Network:畳み込みニューラルネットワーク)を用いて画像中に写る対象物体の検知を行い、その検知結果と検知結果の根拠となる特徴マップを出力する。
特徴マップは、撮影された画像データの中に特定の対象物についての確信度(確からしさ)に基づく特徴量を表すマップであり、その特徴量が画素値で表される。
尚、本実施の形態では、CNNのアルゴリズムは限定されるものではないが、本実施の形態では、Openposeを適用する例で説明する。
Openposeは、画像中に写っている人物の各関節を検知する機能と、それら関節を結ぶことで形成される骨格を検知する機能を備えている。
Openposeについては、「OpenPose: Realtime Multi-Person 2D Pose Estimation using Part Affinity Fields, arXiv:1812.08008v1, (2018)」の文献で紹介されている。
また、画像解析部103の出力をOpenposeの背景クラスの特徴マップとしてもよい。尚、Openposeの背景クラスの特徴マップは、画素値が高い画素ほど関節としての確信度が低く、画素値が低い画素ほど関節としての確信度が高い。
または、各関節の特徴マップ、更に各特徴マップを加算した特徴マップ(加算特徴マップ)を画像解析部103の出力としてもよい。
[特徴マップ解析部104] 特徴マップ解析部104は、画像解析部103が出力した特徴マップに基づき、検知結果の確からしさ(確信度)を評価する。
具体的には、特徴マップの画素値の分布を用いたエントロピーの値を評価する。
画像のエントロピーは画素値の乱雑さを示しており、確信度が高い画素から低い画素まで均一に存在しているほどエントロピーの値は高くなる。つまり、エントロピーの値が高いほど対象の物体とそれ以外の境目がはっきりしないため、対象の物体とそれ以外を明確に区別できていないことを意味する。
これにより、検知結果の確からしさを評価することを可能とする。無論、これは一例であり、例えば、画素値の分散、閾値と比較しての平均値や最大値など他の統計量を指標として適用することも可能である。
尚、特定の領域に関する検知結果の確からしさを評価するために、特徴マップの一部の領域に限定し評価を行ってもよい。
[正解判定部105] 正解判定部105は、特徴マップ解析部104が出力する検知結果の確からしさについて、閾値と比較して、正検知データ又は再学習データ候補の判定を行う。
特徴マップ解析部104が出力する検知結果の確からしさが、閾値以上(エントロピーの値が閾値以下)であれば、正検知データと判定し、検知結果の確からしさが、閾値未満(エントロピーの値が閾値を超えている)であれば、再学習データ候補と判定する。
尚、閾値は、収集した画像データセットの確からしさのランキングに基づいてもよい。つまり、確からしさが高いランクの画像データセットについては閾値を高くし、確からしさが低いランクの画像データセットについては閾値を低く設定する。
また、任意に集められた画像データセットのうち、確からしさが低いものから順に所定の枚数を候補としてもよい。確からしさが低い順に再学習データの候補にすることで、再学習に重要な候補を優先的に選択できるものである。尚、任意に集められた画像データセットとは、ランダムに選ばれたセット、直近に集められた所定枚数のセットなどである。
[記憶部106内の各記憶部107~109] 画像データ記憶部107は、分析等の処理が為される前の画像データを記憶する。
再学習データ候補記憶部108は、正解判定部105で判定された再学習データ候補のデータを記憶する。
正検知データ記憶部109は、正解判定部105で判定された正検知データを記憶する。
[本装置での処理:図2~4] 次に、本装置での処理について図2~4を参照しながら説明する。図2は、本装置の処理フロー図であり、図3は、正検知の例を示す説明図であり、図4は、再学習データ候補取得の例を示す説明図である。
本装置100の制御部101において、図2に示すように、画像取得部102が、記憶部106の画像データ記憶部107に記憶されている画像データを取得する(S11)。処理方法における画像取得のステップとなる。
ここで、画像データは、例えば、図3に示すように、人物のみが写っている画像D11であってもよいし、また、図4に示すように、人物と似た物体や人物を隠す物体が写っている画像D21であってもよい。
次に、画像解析部103が、処理S11で取得した画像を解析処理して特徴マップを出力する(S12)。特徴マップ出力のステップとなる。
例えば、図3の人物のみが写っている画像D11を画像分析処理した場合には、特徴マップD12のような特徴マップが出力される。そして、検知結果D13のように正しく検知が為されている。
また、図4の人物以外の物体が写っている画像D21を画像解析処理した場合には、特徴マップD22のような特徴マップが出力される。そして、検知結果D23のように人物以外の物が検知されたため、誤検知が発生した場合となる。
特徴マップ解析部104が、処理S12で出力された特徴マップを解析処理し、検知結果の確からしさを評価する(S13)。特徴マップ解析ステップとなる。特徴マップの解析及び検知結果の評価の処理については上述した通りである。
正解判定部105が、処理S13で評価された検知結果の確からしさから、検知結果が確からしいかどうかを判定する(S14)。正解判定ステップとなる。検知結果が確からしいと判定された場合(Yesの場合)、正しく検知された(正検知)ものとして処理は終了する。
尚、正検知データとして記憶部106の正検知データ記憶部109に保存してもよい。
図3の例では、正解判定部105から正検知データD14が出力されることになる。
正解判定部105が、判定処理S14によって検知結果が不確かであると判定された場合(Noの場合)、処理S15に移行する。
そして、正解判定部105は、検知結果が不確かであるとされた画像データを再学習データ候補の画像データとして記憶部106の再学習データ候補記憶部108に保存する(S15)。
図4の例では、正解判定部105から再学習データ候補D24が出力されることになる。
以上のように、本実施の形態では、人間の目による検知結果の確認を行わないため、再学習データ候補を効率よく収集することができるものである。
また、カメラ等で撮影される現場の画像に対して、リアルタイムに撮影したすべての画像を保存することなく、再学習データ候補の画像データのみを速やかに選択して再学習データ候補記憶部108に保存することが可能である。例えば、正検知データを保存するための記憶容量が十分でない場合に有効である。
[実施の形態の効果] 本装置によれば、取得した画像データから特定の対象物についての確信度に基づく特徴量を表す特徴マップを出力する画像解析部103と、出力された特徴マップを解析し、検知結果の確からしさを評価する特徴マップ解析部104と、特徴マップの評価結果から画像データに対象物が正しく検知されたか否かを判定し、正しく検知された場合には正検知データとし、正しく検知されなかった場合には再学習データの候補とする正解判定部105とを有するものとしているので、正解判定部105が見逃しや誤検知の有無を自動的に判定し、再学習データの候補を効率的に取得できるできる効果がある。
本発明は、撮影した画像について見逃しや誤検知の有無の判定を自動化し、再学習データの候補を効率的に取得する情報処理装置及び情報処理方法に好適である。
100…情報処理装置、 101…制御部、 102…画像取得部、 103…画像解析部、 104…特徴マップ解析部、 105…正解判定部、 106…記憶部、 107…画像データ記憶部、 108…再学習データ候補記憶部、 109…正検知データ記憶部

Claims (4)

  1. 画像解析を行う情報処理装置であって、
    取得した画像データを、CNNを用いて画像中に写る対象物の検知を行い、前記検知された対象物についての確信度に基づく特徴量を表す特徴マップを出力する画像解析部と、
    前記出力された特徴マップを解析し、検知結果の確からしさを評価する特徴マップ解析部と、
    前記特徴マップの評価結果から前記画像データに前記対象物が正しく検知されたか否かを判定し、正しく検知された場合には正検知データとし、正しく検知されなかった場合には前記対象物の検知を行う前記CNNを再学習するための再学習データの候補とする正解判定部と、を有することを特徴とする情報処理装置。
  2. 特徴マップ解析部は、特徴マップの画素値の分布を用いたエントロピーの値を評価し、
    正解判定部は、前記エントロピーの値が予め定めた閾値以下であれば、正しく検知された場合とし、前記エントロピーの値が前記閾値を超えていれば、正しく検知されなかった場合とすることを特徴とする請求項1記載の情報処理装置。
  3. 取得した画像データを、CNNを用いて画像中に写る対象物の検知を行い、前記検知された対象物についての確信度に基づく特徴量を表す特徴マップを出力する画像解析ステップと、
    前記出力された特徴マップを解析し、検知結果の確からしさを評価する特徴マップ解析ステップと、
    前記特徴マップの評価結果から前記画像データに前記対象物が正しく検知されたか否かを判定し、正しく検知された場合には正検知データとし、正しく検知されなかった場合には前記対象物の検知を行う前記CNNを再学習するための再学習データの候補とする正解判定ステップと、を有することを特徴とする情報処理方法。
  4. 特徴マップ解析ステップは、特徴マップの画素値の分布を用いたエントロピーの値を評価し、
    正解判定ステップは、前記エントロピーの値が予め定めた閾値以下であれば、正しく検知された場合とし、前記エントロピーの値が前記閾値を超えていれば、正しく検知されなかった場合とすることを特徴とする請求項3記載の情報処理方法。
JP2023508879A 2021-03-23 2022-03-03 情報処理装置及び情報処理方法 Active JP7490886B2 (ja)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
JP2021048268 2021-03-23
JP2021048268 2021-03-23
PCT/JP2022/009061 WO2022202177A1 (ja) 2021-03-23 2022-03-03 情報処理装置及び情報処理方法

Publications (2)

Publication Number Publication Date
JPWO2022202177A1 JPWO2022202177A1 (ja) 2022-09-29
JP7490886B2 true JP7490886B2 (ja) 2024-05-27

Family

ID=83396921

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2023508879A Active JP7490886B2 (ja) 2021-03-23 2022-03-03 情報処理装置及び情報処理方法

Country Status (2)

Country Link
JP (1) JP7490886B2 (ja)
WO (1) WO2022202177A1 (ja)

Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2018097807A (ja) 2016-12-16 2018-06-21 株式会社デンソーアイティーラボラトリ 学習装置

Patent Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2018097807A (ja) 2016-12-16 2018-06-21 株式会社デンソーアイティーラボラトリ 学習装置

Also Published As

Publication number Publication date
WO2022202177A1 (ja) 2022-09-29
JPWO2022202177A1 (ja) 2022-09-29

Similar Documents

Publication Publication Date Title
CN110909651B (zh) 视频主体人物的识别方法、装置、设备及可读存储介质
CN111127425A (zh) 基于视网膜眼底图像的目标检测定位方法和装置
JP2021140739A (ja) プログラム、学習済みモデルの生成方法、情報処理方法及び情報処理装置
Prasetyo et al. A comparison of yolo and mask r-cnn for segmenting head and tail of fish
CN112700408A (zh) 模型训练方法、图像质量评估方法及装置
JP2012058787A (ja) 情報処理装置、およびその処理方法
CN111144425B (zh) 检测拍屏图片的方法、装置、电子设备及存储介质
CN110633711A (zh) 训练特征点检测器的计算机装置、方法及特征点检测方法
CN113297963A (zh) 多人姿态的估计方法、装置、电子设备以及可读存储介质
Pagaduan et al. iblurdetect: Image blur detection techniques assessment and evaluation study
Warif et al. A comprehensive evaluation procedure for copy-move forgery detection methods: results from a systematic review
CN112926695B (zh) 基于模板匹配的图像识别方法和***
Bedi et al. Estimating cover image for universal payload region detection in stego images
CN116630286B (zh) 一种图像异常检测与定位的方法、装置、设备及存储介质
CN113592769A (zh) 异常图像的检测、模型的训练方法、装置、设备及介质
JP7490886B2 (ja) 情報処理装置及び情報処理方法
CN116934747A (zh) 眼底图像分割模型训练方法、设备和青光眼辅助诊断***
CN117132768A (zh) 车牌及人脸检测和脱敏方法、装置、电子设备和存储介质
CN115527083B (zh) 图像标注方法、装置和电子设备
Yao et al. An accurate box localization method based on rotated-RPN with weighted edge attention for bin picking
CN116091784A (zh) 一种目标跟踪方法、设备及存储介质
CN112733959A (zh) 肺部影像分类方法、分类网络确定方法及其装置
Ruiz et al. Weakly supervised polyp segmentation from an attention receptive field mechanism
CN117474916B (zh) 一种图像检测方法、电子设备及存储介质
Szczuko Influence of image transformations and quality degradations on SURF detector efficiency

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20230328

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20240109

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20240228

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20240514

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20240515

R150 Certificate of patent or registration of utility model

Ref document number: 7490886

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150