JP7375934B2 - 学習装置、推定装置、学習方法及びプログラム - Google Patents

学習装置、推定装置、学習方法及びプログラム Download PDF

Info

Publication number
JP7375934B2
JP7375934B2 JP2022531312A JP2022531312A JP7375934B2 JP 7375934 B2 JP7375934 B2 JP 7375934B2 JP 2022531312 A JP2022531312 A JP 2022531312A JP 2022531312 A JP2022531312 A JP 2022531312A JP 7375934 B2 JP7375934 B2 JP 7375934B2
Authority
JP
Japan
Prior art keywords
image
learning
estimation
similarity
images
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
JP2022531312A
Other languages
English (en)
Other versions
JPWO2021260837A1 (ja
Inventor
健全 劉
賢太 石原
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
NEC Corp
Original Assignee
NEC Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by NEC Corp filed Critical NEC Corp
Publication of JPWO2021260837A1 publication Critical patent/JPWO2021260837A1/ja
Priority to JP2023183772A priority Critical patent/JP2023178454A/ja
Application granted granted Critical
Publication of JP7375934B2 publication Critical patent/JP7375934B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/70Arrangements for image or video recognition or understanding using pattern recognition or machine learning
    • G06V10/77Processing image or video features in feature spaces; using data integration or data reduction, e.g. principal component analysis [PCA] or independent component analysis [ICA] or self-organising maps [SOM]; Blind source separation
    • G06V10/774Generating sets of training patterns; Bootstrap methods, e.g. bagging or boosting
    • GPHYSICS
    • G08SIGNALLING
    • G08BSIGNALLING OR CALLING SYSTEMS; ORDER TELEGRAPHS; ALARM SYSTEMS
    • G08B13/00Burglar, theft or intruder alarms
    • G08B13/18Actuation by interference with heat, light, or radiation of shorter wavelength; Actuation by intruding sources of heat, light, or radiation of shorter wavelength
    • G08B13/189Actuation by interference with heat, light, or radiation of shorter wavelength; Actuation by intruding sources of heat, light, or radiation of shorter wavelength using passive radiation detection systems
    • G08B13/194Actuation by interference with heat, light, or radiation of shorter wavelength; Actuation by intruding sources of heat, light, or radiation of shorter wavelength using passive radiation detection systems using image scanning and comparing systems
    • G08B13/196Actuation by interference with heat, light, or radiation of shorter wavelength; Actuation by intruding sources of heat, light, or radiation of shorter wavelength using passive radiation detection systems using image scanning and comparing systems using television cameras
    • G08B13/19602Image analysis to detect motion of the intruder, e.g. by frame subtraction
    • G08B13/19613Recognition of a predetermined image pattern or behaviour pattern indicating theft or intrusion
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/70Arrangements for image or video recognition or understanding using pattern recognition or machine learning
    • G06V10/77Processing image or video features in feature spaces; using data integration or data reduction, e.g. principal component analysis [PCA] or independent component analysis [ICA] or self-organising maps [SOM]; Blind source separation
    • G06V10/778Active pattern-learning, e.g. online learning of image or video features
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/70Arrangements for image or video recognition or understanding using pattern recognition or machine learning
    • G06V10/82Arrangements for image or video recognition or understanding using pattern recognition or machine learning using neural networks
    • GPHYSICS
    • G08SIGNALLING
    • G08BSIGNALLING OR CALLING SYSTEMS; ORDER TELEGRAPHS; ALARM SYSTEMS
    • G08B13/00Burglar, theft or intruder alarms
    • G08B13/18Actuation by interference with heat, light, or radiation of shorter wavelength; Actuation by intruding sources of heat, light, or radiation of shorter wavelength
    • G08B13/189Actuation by interference with heat, light, or radiation of shorter wavelength; Actuation by intruding sources of heat, light, or radiation of shorter wavelength using passive radiation detection systems
    • G08B13/194Actuation by interference with heat, light, or radiation of shorter wavelength; Actuation by intruding sources of heat, light, or radiation of shorter wavelength using passive radiation detection systems using image scanning and comparing systems
    • G08B13/196Actuation by interference with heat, light, or radiation of shorter wavelength; Actuation by intruding sources of heat, light, or radiation of shorter wavelength using passive radiation detection systems using image scanning and comparing systems using television cameras
    • G08B13/19602Image analysis to detect motion of the intruder, e.g. by frame subtraction
    • G08B13/19604Image analysis to detect motion of the intruder, e.g. by frame subtraction involving reference image or background adaptation with time to compensate for changing conditions, e.g. reference image update on detection of light level change

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Databases & Information Systems (AREA)
  • Evolutionary Computation (AREA)
  • Computing Systems (AREA)
  • Artificial Intelligence (AREA)
  • General Health & Medical Sciences (AREA)
  • Medical Informatics (AREA)
  • Software Systems (AREA)
  • Health & Medical Sciences (AREA)
  • Multimedia (AREA)
  • Image Analysis (AREA)

Description

本発明は、学習装置、推定装置、学習方法及びプログラムに関する。
特許文献1は、正解及び不正解の教師画像に基づいた学習により、入力画像を、良画像又は不良画像に分類する推定モデルを生成する技術を開示している。良画像は、正解の教師画像との類似度合が高い画像であり、不良画像は正解の教師画像との類似度合が低い画像である。特許文献2は、異常行動を示す教師画像により異常行動を定義し、定義した異常行動を検出する推定モデルを生成する技術を開示している。
特開2020-35097号公報 特開2019-053384号公報
異常を検出する推定モデルを生成する技術において、教師画像を効率的に収集する技術が望まれている。特許文献1は、当該課題及び解決手段を開示していない。特許文献2に記載の技術の場合、異常行動を示す教師画像を大量に収集する必要がある。しかし、「異常」を示す教師画像を収集することは容易でない。本発明は、異常を検出する推定モデルを生成するための教師画像を効率的に収集する技術を提供することを課題とする。
本発明によれば、
画像を取得する取得手段と、
前記取得された画像と、予め蓄積された異常状態を示す第1の画像との類似度を算出する類似度算出手段と、
前記類似度が第1の基準値以下の前記取得された画像を、正常状態を示す第2の画像として登録する登録手段と、
前記第1の画像及び前記第2の画像を用いた機械学習により、正常/異常を判別する推定モデルを生成する学習手段と、
を有する学習装置が提供される。
また、本発明によれば、
コンピュータが、
画像を取得し、
前記取得された画像と、予め蓄積された異常状態を示す第1の画像との類似度を算出し、
前記類似度が第1の基準値以下の前記取得された画像を、正常状態を示す第2の画像として登録し、
前記第1の画像及び前記第2の画像を用いた機械学習により、正常/異常を判別する推定モデルを生成する学習方法が提供される。
また、本発明によれば、
コンピュータを、
画像を取得する取得手段、
前記取得された画像と、予め蓄積された異常状態を示す第1の画像との類似度を算出する類似度算出手段、
前記類似度が第1の基準値以下の前記取得された画像を、正常状態を示す第2の画像として登録する登録手段、
前記第1の画像及び前記第2の画像を用いた機械学習により、正常/異常を判別する推定モデルを生成する学習手段、
として機能させるプログラムが提供される。
また、本発明によれば、前記学習装置により生成された推定モデルを用いて正常/異常を判別する推定装置が提供される。
本発明によれば、異常を検出する推定モデルを生成するための教師画像を効率的に収集することが可能となる。
本実施形態の学習装置の処理の流れの一例を示すフローチャートである。 本実施形態の学習装置の機能ブロック図の一例である。 本実施形態の学習装置の処理の流れの一例を詳細に示す図である。 本実施形態の学習装置のハードウエア構成例を示す図である。 本実施形態の学習装置の機能ブロック図の一例である。 本実施形態の学習装置の処理の流れの一例を詳細に示す図である。
以下、本発明の実施の形態について、図面を用いて説明する。尚、すべての図面において、同様な構成要素には同様の符号を付し、適宜説明を省略する。
<第1の実施形態>
本実施形態の学習装置(以下、単に「学習装置」という場合がある)は、入力された画像が示す状態が、正常か異常かを判別する推定モデルを生成する。
正常/異常の判別対象は、例えば場所(公園、駅、施設など)である。大多数の時間において観察される通常の状態が正常と判別され、通常の状態と異なる状態が異常と判別される。例えば異常行動を行っている人物が存在する状態や、その場所に常に存在する物が故障したり移動したりした状態等が異常と判別される。異常行動は、画像で観察される大多数の人が行う行動と異なる行動である。なお、判別対象は、その他、工場、店舗、施設、オフィス等の設備であってもよいし、その他であってもよい。いずれにおいても、大多数の時間において観察される通常の状態が正常と判別され、通常の状態と異なる状態が異常と判別される。
学習装置は、図1に示すサイクルを繰り返し実行することで、上記推定モデルを生成する。図1に示すように、学習装置は、第1の画像登録処理S1、画像選択処理S2、学習処理S3、推定処理S4、ユーザ確認処理S5、第2の画像登録処理S6をこの順に繰り返し実行する。なお、処理順は、同様の作用効果が実現される範囲で変更してもよい。
図2に、学習装置10の機能ブロック図の一例を示す。図示するように、学習装置10は、取得部11と、類似度算出部12と、登録部13と、学習部14と、学習時推定部15と、ユーザ確認部16と、画像記憶部17と、推定モデル記憶部18とを有する。これらの機能部により、図1に示す各処理が実行される。
図3は、図1のサイクルをより詳細に示す図である。当該図を用いて、図1に示す各処理及び図2に示す各機能部の処理を説明する。
「第1の画像登録処理S1」
第1の画像登録処理S1は、カメラが生成した画像と、予め登録されている異常状態を示す画像との類似度に基づき、カメラが生成した画像を分類・登録する処理である。
図3の第1乃至第3の画像群DB17-1乃至17-3、カメラD14、類似度算出S10及び登録S11が、当該処理に関係する。そして、図2の取得部11、類似度算出部12、登録部13及び画像記憶部17が、当該処理に関係する。第1乃至第3の画像群DB17-1乃至17-3は、図2の画像記憶部17により実現される。
まず、当該処理の前準備として、第1の画像群DB(データベース)17-1に、異常状態のラベルを付与されたラベル付き画像が記憶される。ユーザは、予め異常状態を示す画像をいくつか用意し、異常状態のラベルを付与して第1の画像群DB17-1に記憶させる。このようにして蓄積される第1の画像群DB17-1内の画像は、ユーザにより異常状態を示すことを確認された、信頼度の高いラベル付き画像である。なお、第1の画像群DB17-1に最初に記憶させる画像は、数十枚から数百枚程度でよく、大量の画像は不要である。この程度の数であれば、ラベル付き画像の収集に要するユーザ負担は大きくない。なお、予め異常状態を定義しておき、その異常状態を検出する推定モデルを生成する場合、一般的に、異常状態を示す教師画像を数千枚から数万枚以上用意する必要がある。第1の画像群DB17-1は、図2の画像記憶部17に対応する。以下、第1の画像群DB17-1に記憶されている異常状態を示す画像を「第1の画像」と呼ぶ。
取得部11は、カメラD14が生成した画像を取得する。カメラD14は、正常/異常の判別対象を撮影するカメラ(監視カメラ等)であってもよいし、判別対象と同種の対象を撮影するカメラであってもよい。カメラD14は、動画像を撮影してもよいし、動画像よりも長いフレーム間隔で連続的に静止画像を撮影してもよい。図では、1つのカメラD14が示されているが、複数のカメラD14が利用されてもよい。
取得部11は、カメラD14が生成した画像をリアルタイム処理で取得してもよい。この場合、学習装置10とカメラD14とは互いに通信可能に構成される。その他、取得部11は、カメラD14が生成した画像をバッチ処理で取得してもよい。この場合、カメラD14が有する記憶装置、又は、その他の任意の記憶装置内にカメラD14が生成した画像が蓄積され、取得部11は任意のタイミングでその蓄積された画像を取得する。
なお、本明細書において、「取得」とは、ユーザ入力に基づき、又は、プログラムの指示に基づき、「自装置が他の装置や記憶媒体に格納されているデータを取りに行くこと(能動的な取得)」、たとえば、他の装置にリクエストまたは問い合わせして受信すること、他の装置や記憶媒体にアクセスして読み出すこと等、および、ユーザ入力に基づき、又は、プログラムの指示に基づき、「自装置に他の装置から出力されるデータを入力すること(受動的な取得)」、たとえば、配信(または、送信、プッシュ通知等)されるデータを受信すること、また、受信したデータまたは情報の中から選択して取得すること、及び、「データを編集(テキスト化、データの並び替え、一部データの抽出、ファイル形式の変更等)などして新たなデータを生成し、当該新たなデータを取得すること」の少なくともいずれか一方を含む。
類似度算出部12は、取得部11により取得された画像(以下、「取得画像」という)と、予め第1の画像群DB17-1に蓄積された異常状態を示す第1の画像との類似度を算出する(図3のS10)。類似度算出部12は、第1の画像群DB17-1に蓄積された複数の第1の画像各々と、各取得画像との類似度を算出してもよい。その他、類似度算出部12は、第1の画像群DB17-1に蓄積された複数の第1の画像に基づき生成した1つの画像(例:平均画像)と、各取得画像との類似度を算出してもよい。
なお、画像間の類似度の算出においては、様々な手法が提案されている。本実施形態では、あらゆる手法を採用することができる。例えば、類似度算出部12は、画像内から物体を検出し、検出結果の類似度(検出された物体の数の類似度、検出された物体の外観の類似度等)を算出してもよい。また、類似度算出部12は、深層学習で生成された画像解析を行う推定モデルに各画像を入力し、得られた画像の解析結果(画像が示す物体の認識結果、画像が示す場面の認識結果等)の類似度を算出してもよい。また、類似度算出部12は、画像の全体又は局所部分に現れる色や輝度の類似度を算出してもよい。
登録部13は、類似度が第1の基準値以下の取得画像を、正常状態を示す第2の画像(正常状態のラベルを付与した画像)として第2の画像群DB(データベース)17-2に登録する(S11)。類似度算出部12が、第1の画像群DB17-1に蓄積された複数の第1の画像各々と、各取得画像との類似度を算出する場合、登録部13は、複数の第1の画像のすべてと類似度が第1の基準値以下である取得画像を、第2の画像として第2の画像群DB17-2に登録する。
また、登録部13は、類似度が第2の基準値以上の取得画像を、異常状態を示す第3の画像(異常状態のラベルを付与した画像)として第3の画像群DB(データベース)17-3に登録する(S11)。類似度算出部12が、第1の画像群DB17-1に蓄積された複数の第1の画像各々と、各取得画像との類似度を算出する場合、登録部13は、複数の第1の画像の中の少なくとも1つとの類似度が第2の基準値以上である取得画像を、第3の画像として第3の画像群DB17-3に登録する。
第3の画像群DB17-3には、このようにコンピュータにより第1の画像と所定レベル以上類似していると判定された画像が、異常状態を示す画像として登録される。この点で、ユーザにより異常状態を示すことを確認された、信頼度の高い第1の画像が記憶される第1の画像群DB17-1と異なる。
第1の基準値と第2の基準値は同じ値であってもよいし、異なる値であってもよい。しかし、第1の基準値と第2の基準値とを異なる値とし、第1の基準値を十分に小さい値とするとともに、第2の基準値を十分に大きい値とすることで、第1の画像との類似度が高くもなく低くもないグレーゾーン(類似度が第1の基準値より大、第2の基準値未満)に存在する取得画像を、第2の画像や第3の画像として登録する不都合を抑制できる。
「画像選択処理S2、学習処理S3」
画像選択処理S2は、第1乃至第3の画像群DB17-1乃至17-3に蓄積されている画像の中から、教師画像とする画像を選択する処理である。学習処理S3は、選択された画像を教師画像として、推定モデルDB(データベース)18-1に登録されている複数の推定モデル各々の学習を実行する処理である。
図3の第1乃至第3の画像群DB17-1乃至17-3、推定モデルDB18-1、選択S12及び学習S13が、当該処理に関係する。そして、図2の学習部14、画像記憶部17及び推定モデル記憶部18が、当該処理に関係する。推定モデルDB18-1は、図2の推定モデル記憶部18により実現される。
まず、推定モデルDB18-1には、複数の推定モデルの情報が記憶される。複数の推定モデルはいずれも、入力された画像が示す状態が、正常か異常かを判別するモデルである。複数の推定モデルは、学習及び推定のアルゴリズムが互いに異なる。例えば、複数の推定モデルは、深層学習で生成される。本実施形態では、例えば、ニューラルネットワーク、ベイジアンネットワーク、回帰分析、サポートベクトルマシン(SVM)、決定木、遺伝的アルゴリズム、最近傍法分類等で学習・生成された複数の推定モデルの情報が、推定モデルDB18-1に記憶される。
学習部14は、第1乃至第3の画像群DB17-1乃至17-3に登録された画像の中から少なくとも一部を選択し(図3のS12)、選択した画像を用いた機械学習により推定モデルを生成する(図3のS13)。
選択の手法は様々である。例えば、学習部14は、第1乃至第3の画像群DB17-1乃至17-3全体から予め定められた所定数の画像をランダムに選択してもよい。その他、学習部14は、第1の画像群DB17-1から予め定められた第1の所定数の画像をランダムに選択し、第2の画像群DB17-2から予め定められた第2の所定数の画像をランダムに選択し、第3の画像群DB17-3から予め定められた第3の所定数の画像をランダムに選択してもよい。第1乃至第3の所定数は、同数であってもよいし、異なってもよい。すなわち、第1乃至第3の画像群DB17-1乃至17-3各々から選択する画像の数の割合(選択する画像全体に対する割合)は、同じあってもよいし、異なってもよい。
また、学習部14は、推定モデル毎に画像を選択してもよい。この場合、上記第1乃至第3の所定数や上記割合は、推定モデル毎に異なってもよい。
学習部14は、画像を選択後、選択した第1乃至第3の画像を教師画像として、推定モデルDB(データベース)18-1に登録されている複数の推定モデル各々の学習を実行する。すなわち、学習部14は、第1乃至第3の画像を用いた機械学習(深層学習を含む概念)により、正常/異常を判別する推定モデルを生成する。
「推定処理S4」
推定処理S4は、推定モデルDB(データベース)18-1に登録されている複数の推定モデル各々に取得画像を入力し、取得画像が示す状態を判別する処理である。
図3の推定モデルDB18-1、カメラD14及び推定S14が、当該処理に関係する。そして、図2の取得部11、学習時推定部15及び推定モデル記憶部18が、当該処理に関係する。
学習時推定部15は、推定モデル記憶部18に記憶されている複数の推定モデル各々に取得画像を入力し、取得画像が示す状態(正常/異常)を判別する。なお、当該処理で推定モデルに入力される取得画像は、その推定モデルの生成(学習)にその時点で利用されていない取得画像である。例えば、学習時推定部15は、画像記憶部17に記憶される前の取得画像を利用して、当該判別を行うことができる。
なお、複数の推定モデル各々の判別結果は、学習装置10内の記憶装置に蓄積されてもよい。
「ユーザ確認処理S5」
ユーザ確認処理S5は、推定処理S4の判別結果をユーザに向けて出力し、その判別結果の正誤入力をユーザから受付ける処理である。
図3の表示装置D15、抽出S15、出力S16及び正誤入力S17が、当該処理に関係する。そして、図2のユーザ確認部16が、当該処理に関係する。
ユーザ確認部16は、学習時推定部15による判別結果をユーザに向けて出力し(図3のS16)、その判別結果の正誤入力をユーザから受付ける(図3のS17)。例えば、ユーザ確認部16は、取得画像と判別結果(正常状態又は異常状態)とを出力し、その取得画像に対するその判別結果の正誤入力を受付ける。
すべての取得画像に対して当該処理を実行するとユーザの負担が大きくなる。そこで、ユーザ確認部16は、所定の条件を満たす一部の取得画像を抽出し(図3のS15)、抽出した一部の取得画像に対してのみ、判別結果の出力(図3のS16)、及び、正誤入力の受付(図3のS17)を行ってもよい。
判別結果の出力、及び、正誤入力の受付が行われる一部の取得画像は、例えば、以下の中のいずれかであってもよい。
・少なくとも1つの推定モデルにおいて、異常状態を示すと判別された取得画像。
・少なくとも1つの推定モデルにおいて、所定レベル以上の信頼度で異常状態を示すと判別された取得画像。
・所定数以上の推定モデルにおいて、異常状態を示すと判別された取得画像。
・所定数以上の推定モデルにおいて、所定レベル以上の信頼度で異常状態を示すと判別された取得画像。
・全ての推定モデルにおいて、異常状態を示すと判別された取得画像。
・全ての推定モデルにおいて、所定レベル以上の信頼度で異常状態を示すと判別された取得画像。
判別結果の出力、及び、正誤入力の受付が行われる一部の取得画像は、上記の中のいずれかの取得画像に加えて、上記条件を満たさない取得画像(正常状態を示すと推測される取得画像)の中からランダムにピックアップされた取得画像を含んでもよい。
ユーザ確認部16は、ディスプレイ、投影装置などの任意の出力装置を介して判別結果の出力を行い、キーボード、マウス、タッチパネル、物理ボタン、マイクなどの任意の入力装置を介して正誤入力を受付けてもよい。その他、ユーザ確認部16は、所定の携帯端末に判別結果を送信し、当該携帯端末に対してなされた正誤入力の内容を当該携帯端末から取得してもよい。その他、ユーザ確認部16は、任意のサーバ上に当該判別結果を任意の装置から閲覧可能な状態で保存してもよい。そして、ユーザ確認部16は、任意の装置から入力され、上記サーバに保存された正誤入力の内容を取得してもよい。なお、ここで例示した例はあくまで一例であり、これらに限定されない。
「第2の画像登録処理S6」
第2の画像登録処理S6は、ユーザ確認処理S5で異常状態を示すことが入力された取得画像を、第1の画像として第1の画像群DB17-1に登録する処理である。
図3の第1の画像群DB17-1及び登録S18が、当該処理に関係する。そして、図2の登録部13及び画像記憶部17が、当該処理に関係する。
登録部13は、ユーザ確認部16が受付ける正誤入力において、異常状態を示すことが入力された取得画像を、第1の画像として第1の画像群DB17-1に登録する。
異常状態を示すことが入力された取得画像は、判別結果が「異常状態」であり正誤入力が「正しい」である取得画像や、判別結果が「正常状態」であり正誤入力が「誤り」である取得画像などが該当する、
ここで、本実施形態の学習装置10の変形例を説明する。学習装置10は、第3の画像群DB17-3を有さなくてもよい。そして、登録部13は、第1の画像との類似度が第1の基準値以下の取得画像を第2の画像として第2の画像群DB17-2に登録する処理を実行し、第1の画像との類似度が第2の基準値以上の取得画像を第3の画像として第3の画像群DB17-3に登録する処理を実行しなくてもよい。この場合、登録部13による処理により、正常状態を示す画像が蓄積されていくこととなる。
次に、学習装置10のハードウエア構成の一例を説明する。学習装置10の各機能部は、任意のコンピュータのCPU(Central Processing Unit)、メモリ、メモリにロードされるプログラム、そのプログラムを格納するハードディスク等の記憶ユニット(あらかじめ装置を出荷する段階から格納されているプログラムのほか、CD(Compact Disc)等の記憶媒体やインターネット上のサーバ等からダウンロードされたプログラムをも格納できる)、ネットワーク接続用インターフェイスを中心にハードウエアとソフトウエアの任意の組合せによって実現される。そして、その実現方法、装置にはいろいろな変形例があることは、当業者には理解されるところである。
図4は、学習装置10のハードウエア構成を例示するブロック図である。図4に示すように、学習装置10は、プロセッサ1A、メモリ2A、入出力インターフェイス3A、周辺回路4A、バス5Aを有する。周辺回路4Aには、様々なモジュールが含まれる。学習装置10は周辺回路4Aを有さなくてもよい。なお、学習装置10は物理的及び/又は論理的に分かれた複数の装置で構成されてもよいし、物理的及び/又は論理的に一体となった1つの装置で構成されてもよい。学習装置10が物理的及び/又は論理的に分かれた複数の装置で構成される場合、複数の装置各々が上記ハードウエア構成を備えることができる。
バス5Aは、プロセッサ1A、メモリ2A、周辺回路4A及び入出力インターフェイス3Aが相互にデータを送受信するためのデータ伝送路である。プロセッサ1Aは、例えばCPU、GPU(Graphics Processing Unit)などの演算処理装置である。メモリ2Aは、例えばRAM(Random Access Memory)やROM(Read Only Memory)などのメモリである。入出力インターフェイス3Aは、入力装置、外部装置、外部サーバ、外部センサー、カメラ等から情報を取得するためのインターフェイスや、出力装置、外部装置、外部サーバ等に情報を出力するためのインターフェイスなどを含む。入力装置は、例えばキーボード、マウス、マイク、物理ボタン、タッチパネル等である。出力装置は、例えばディスプレイ、スピーカ、プリンター、メーラ等である。プロセッサ1Aは、各モジュールに指令を出し、それらの演算結果をもとに演算を行うことができる。
次に、学習装置10の作用効果を説明する。
本実施形態の学習装置10は、正常状態を示す画像と、異常状態を示す画像とを教師画像とした機械学習により、正常/異常を判別する推定モデルを生成する。推定モデルにおいては、大多数の時間において観察される通常の状態が正常と判別され、通常の状態と異なる状態が異常と判別される。
かかる場合、予め定義していない異常状態が発生した場合であっても、その状態が正常状態と異なる状態である限り、異常状態として判別することができる。このため、異常状態を漏れなく検出することが可能となる。
また、予め異常状態を定義しておき、その異常状態を検出する推定モデルを生成する場合、各異常状態を示す教師画像を多数用意する必要がある。しかし、異常状態を示す教師画像を用意するのは容易でない。本実施形態の場合、予め定義した異常状態を検出する推定モデルを生成する場合に比べて、用意すべき「異常状態を示す画像」の数が少なくなる。結果、ユーザの負担が軽減される。
なお、本実施形態の場合、大量の「正常状態を示す画像」が必要になる。しかし、通常、多くの対象は「正常状態」であるので、そのような対象を撮影している画像から容易に「正常状態を示す画像」を収集することが可能である。
また、本実施形態の場合、予め用意した少量(予め定義した異常状態を検出する推定モデルを生成するために要する異常状態を示す画像の数よりも少量であることを意味する)の「異常状態を示す画像」と、監視カメラ等が生成した画像との類似度判定の結果に基づき、「正常状態を示す画像」を自動的に蓄積していくことができる。このため、ユーザの負担が軽減される。
また、本実施形態の場合、第2の画像登録処理S6により、「異常状態を示す画像」を増やしてくことができる。このように「異常状態を示す画像」を増やすことができるので、得られる推定モデルの推定精度が向上する。
また、本実施形態の場合、第1の画像登録処理S1により、「異常状態を示す画像」を増やすこともできる。この場合、上述した第2の基準値を十分に高い値とすることで、より信頼度の高い「異常状態を示す画像」を増やすことができる。そして、「異常状態を示す画像」の増加により、得られる推定モデルの推定精度の向上が期待される。
また、本実施形態の場合、異常状態を示す画像を、「ユーザにより異常状態を示すことを確認された、信頼度の高い第1の画像」と、「コンピュータにより第1の画像と所定レベルより類似していると判定された第3の画像」とに分けて管理することができる。そして、第1の画像のみを、図3の類似度算出S10の参照対象とすることができる。このように、信頼度の高い第1の画像のみを参照対象とすることで、画像間の類似度に基づき正常状態/異常状態に分類する処理(図3の類似度算出S10、登録S11)の信頼度が高まる。
また、本実施形態の場合、複数の推定モデルを並行して学習することができる。このため、実際の推定場面(以下の実施形態で説明する推定装置による推定)において、その中からより好ましい結果が得られる推定モデルを選択して利用することが可能となる。
<第2の実施形態>
図5に、本実施形態の学習装置10の機能ブロック図の一例を示す。また、図6に、図1のサイクルをより詳細に示す図を示す。第1の実施形態で説明した図2及び図3と、本実施形態の構成を示す図5及び図6とを比較すると、本実施形態の学習装置10は、第3の画像群DB17-3を有さず、画像記憶部17は第3の画像群を記憶しない点で異なる。
第1の実施形態では、異常状態を示す画像を、「ユーザにより異常状態を示すことを確認された、信頼度の高い第1の画像」と、「コンピュータにより第1の画像と所定レベルより類似していると判定された第3の画像」とに分けて管理した。しかし、本実施形態の学習装置10は、このような管理を行わない。すなわち、「ユーザにより異常状態を示すことを確認された、信頼度の高い画像」及び「コンピュータにより当該信頼度の高い画像と所定レベルより類似していると判定された画像」をまとめて、「異常状態を示す第1の画像」として管理する。本実施形態の「第1の画像」は、異常状態を示す画像であり、第1の実施形態で説明した第1の画像及び第3の画像を含む概念である。
登録部13は、第1の画像群DB17-1に登録されている第1の画像との類似度が第2の基準値以上である取得画像を、第1の画像として第1の画像群DB17-1に登録する。
本実施形態の学習装置10のその他の構成は、第1の実施形態と同様である。
以上説明した本実施形態の学習装置10によれば、第1の実施形態の学習装置10と同様の作用効果が実現される。また、異常状態を示す画像を効率的に収集することができる。なお、「ユーザにより異常状態を示すことを確認された、信頼度の高い画像」と「コンピュータにより当該信頼度の高い画像と所定レベルより類似していると判定された画像」の信頼度(異常状態を示すことの信頼度)は異なり得る。そして、信頼度の異なる画像を混ぜて管理すると、学習の精度や推定精度等に悪影響を及ぼし得る。しかし、上述した第2の基準値を十分に高い値にしておくと、このような不都合を軽減できる。
<第3の実施形態>
本実施形態の推定装置は、第1又は第2の実施形態の学習装置10により生成された推定モデルを用いて、画像が示す状態(正常/異常)を判別する。
本実施形態の推定装置は、上述のような特徴的な手法で十分かつ高精度な教師画像を収集し、当該教師画像に基づく学習で生成された推定モデルを用いることができるので、高い推定精度が得られる。
以上、図面を参照して本発明の実施形態について述べたが、これらは本発明の例示であり、上記以外の様々な構成を採用することもできる。
また、上述の説明で用いた複数のフローチャートでは、複数の工程(処理)が順番に記載されているが、各実施形態で実行される工程の実行順序は、その記載の順番に制限されない。各実施形態では、図示される工程の順番を内容的に支障のない範囲で変更することができる。また、上述の各実施形態は、内容が相反しない範囲で組み合わせることができる。
上記の実施形態の一部又は全部は、以下の付記のようにも記載されうるが、以下には限定されない。
1. 画像を取得する取得手段と、
前記取得された画像と、予め蓄積された異常状態を示す第1の画像との類似度を算出する類似度算出手段と、
前記類似度が第1の基準値以下の前記取得された画像を、正常状態を示す第2の画像として登録する登録手段と、
前記第1の画像及び前記第2の画像を用いた機械学習により、正常/異常を判別する推定モデルを生成する学習手段と、
を有する学習装置。
2. 前記登録手段は、前記類似度が第2の基準値以上の前記取得された画像を、異常状態を示す第3の画像として登録し、
前記学習手段は、前記第1の画像、前記第2の画像及び前記第3の画像を用いた機械学習により、前記推定モデルを生成する1に記載の学習装置。
3. 前記登録手段は、前記類似度が第2の基準値以上の前記取得された画像を、前記第1の画像として登録する1に記載の学習装置。
4. 前記学習手段は、登録された画像の中から一部を選択し、選択した画像を用いた機械学習により、前記推定モデルを生成する1から3のいずれかに記載の学習装置。
5. 前記推定モデルを用いて、前記取得された画像が示す状態を判別する学習時推定手段と、
前記学習時推定手段により異常状態を示すと判別された前記取得された画像を出力し、ユーザによる正誤入力を受付けるユーザ確認手段と、
をさらに有し、
前記登録手段は、前記正誤入力で異常状態を示すことが入力された前記取得された画像を、前記第1の画像として登録する1から4のいずれかに記載の学習装置。
6. 前記学習手段は、互いに異なるアルゴリズムで学習する複数の前記推定モデル各々の学習を実行し、
前記学習時推定手段は、複数の前記推定モデル各々を用いて、前記取得された画像が示す状態を判別し、複数の前記推定モデル各々の判別結果を蓄積する1から5のいずれかに記載の学習装置。
7. 前記取得手段は、監視カメラが生成した画像を取得する1から6のいずれかに記載の学習装置。
8. コンピュータが、
画像を取得し、
前記取得された画像と、予め蓄積された異常状態を示す第1の画像との類似度を算出し、
前記類似度が第1の基準値以下の前記取得された画像を、正常状態を示す第2の画像として登録し、
前記第1の画像及び前記第2の画像を用いた機械学習により、正常/異常を判別する推定モデルを生成する学習方法。
9. コンピュータを、
画像を取得する取得手段、
前記取得された画像と、予め蓄積された異常状態を示す第1の画像との類似度を算出する類似度算出手段、
前記類似度が第1の基準値以下の前記取得された画像を、正常状態を示す第2の画像として登録する登録手段、
前記第1の画像及び前記第2の画像を用いた機械学習により、正常/異常を判別する推定モデルを生成する学習手段、
として機能させるプログラム。
10. 1から7のいずれかに記載の学習装置により生成された推定モデルを用いて正常/異常を判別する推定装置。
10 学習装置
11 取得部
12 類似度算出部
13 登録部
14 学習部
15 学習時推定部
16 ユーザ確認部
17 画像記憶部
17-1 第1の画像群DB
17-2 第2の画像群DB
17-3 第3の画像群DB
18 推定モデル記憶部
18-1 推定モデルDB
D14 カメラ
D15 表示装置

Claims (10)

  1. 画像を取得する取得手段と、
    前記取得された画像と、予め蓄積された異常状態を示す第1の画像との類似度を算出する類似度算出手段と、
    前記類似度が第1の基準値以下の前記取得された画像を、正常状態を示す第2の画像として登録する登録手段と、
    前記第1の画像及び前記第2の画像を用いた機械学習により、正常/異常を判別する推定モデルを生成する学習手段と、
    を有する学習装置。
  2. 前記登録手段は、前記類似度が第2の基準値以上の前記取得された画像を、異常状態を示す第3の画像として登録し、
    前記学習手段は、前記第1の画像、前記第2の画像及び前記第3の画像を用いた機械学習により、前記推定モデルを生成する請求項1に記載の学習装置。
  3. 前記登録手段は、前記類似度が第2の基準値以上の前記取得された画像を、前記第1の画像として登録する請求項1に記載の学習装置。
  4. 前記学習手段は、登録された画像の中から一部を選択し、選択した画像を用いた機械学習により、前記推定モデルを生成する請求項1から3のいずれか1項に記載の学習装置。
  5. 前記推定モデルを用いて、前記取得された画像が示す状態を判別する学習時推定手段と、
    前記学習時推定手段により異常状態を示すと判別された前記取得された画像を出力し、ユーザによる正誤入力を受付けるユーザ確認手段と、
    をさらに有し、
    前記登録手段は、前記正誤入力で異常状態を示すことが入力された前記取得された画像を、前記第1の画像として登録する請求項1から4のいずれか1項に記載の学習装置。
  6. 前記学習手段は、互いに異なるアルゴリズムで学習する複数の前記推定モデル各々の学習を実行し、
    前記学習時推定手段は、複数の前記推定モデル各々を用いて、前記取得された画像が示す状態を判別し、複数の前記推定モデル各々の判別結果を蓄積する請求項に記載の学習装置。
  7. 前記取得手段は、監視カメラが生成した画像を取得する請求項1から6のいずれか1項に記載の学習装置。
  8. コンピュータが、
    画像を取得し、
    前記取得された画像と、予め蓄積された異常状態を示す第1の画像との類似度を算出し、
    前記類似度が第1の基準値以下の前記取得された画像を、正常状態を示す第2の画像として登録し、
    前記第1の画像及び前記第2の画像を用いた機械学習により、正常/異常を判別する推定モデルを生成する学習方法。
  9. コンピュータを、
    画像を取得する取得手段、
    前記取得された画像と、予め蓄積された異常状態を示す第1の画像との類似度を算出する類似度算出手段、
    前記類似度が第1の基準値以下の前記取得された画像を、正常状態を示す第2の画像として登録する登録手段、
    前記第1の画像及び前記第2の画像を用いた機械学習により、正常/異常を判別する推定モデルを生成する学習手段、
    として機能させるプログラム。
  10. 請求項1から7のいずれか1項に記載の学習装置により生成された推定モデルを用いて正常/異常を判別する推定装置。
JP2022531312A 2020-06-24 2020-06-24 学習装置、推定装置、学習方法及びプログラム Active JP7375934B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2023183772A JP2023178454A (ja) 2020-06-24 2023-10-26 学習装置、学習方法及びプログラム

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
PCT/JP2020/024793 WO2021260837A1 (ja) 2020-06-24 2020-06-24 学習装置、推定装置、学習方法及びプログラム

Related Child Applications (1)

Application Number Title Priority Date Filing Date
JP2023183772A Division JP2023178454A (ja) 2020-06-24 2023-10-26 学習装置、学習方法及びプログラム

Publications (2)

Publication Number Publication Date
JPWO2021260837A1 JPWO2021260837A1 (ja) 2021-12-30
JP7375934B2 true JP7375934B2 (ja) 2023-11-08

Family

ID=79282090

Family Applications (2)

Application Number Title Priority Date Filing Date
JP2022531312A Active JP7375934B2 (ja) 2020-06-24 2020-06-24 学習装置、推定装置、学習方法及びプログラム
JP2023183772A Pending JP2023178454A (ja) 2020-06-24 2023-10-26 学習装置、学習方法及びプログラム

Family Applications After (1)

Application Number Title Priority Date Filing Date
JP2023183772A Pending JP2023178454A (ja) 2020-06-24 2023-10-26 学習装置、学習方法及びプログラム

Country Status (3)

Country Link
US (1) US20230298445A1 (ja)
JP (2) JP7375934B2 (ja)
WO (1) WO2021260837A1 (ja)

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2008234551A (ja) 2007-03-23 2008-10-02 Hitachi Ltd 異常検知装置及び異常検知プログラム
WO2017017722A1 (ja) 2015-07-24 2017-02-02 オリンパス株式会社 処理装置、処理方法及びプログラム
JP2018073024A (ja) 2016-10-27 2018-05-10 ホーチキ株式会社 監視システム
JP2019003329A (ja) 2017-06-13 2019-01-10 キヤノン株式会社 情報処理装置、情報処理方法、及びプログラム

Family Cites Families (13)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
GB2183878B (en) * 1985-10-11 1989-09-20 Matsushita Electric Works Ltd Abnormality supervising system
AU2002358343A1 (en) * 2002-04-08 2003-12-19 Bioinfra Inc. Method and system for analysis of cancer biomarkers using proteome image mining
US7244230B2 (en) * 2002-11-08 2007-07-17 Siemens Medical Solutions Usa, Inc. Computer aided diagnostic assistance for medical imaging
US20070250548A1 (en) * 2006-04-21 2007-10-25 Beckman Coulter, Inc. Systems and methods for displaying a cellular abnormality
US20070276723A1 (en) * 2006-04-28 2007-11-29 Gideon Samid BiPSA: an inferential methodology and a computational tool
JP7452068B2 (ja) * 2020-02-17 2024-03-19 コニカミノルタ株式会社 情報処理装置、情報処理方法及びプログラム
WO2021245819A1 (ja) * 2020-06-03 2021-12-09 日本電気株式会社 学習装置、学習済みモデル生成方法、及び、記録媒体
JP2024509039A (ja) * 2021-01-18 2024-02-29 シーメンス メディカル ソリューションズ ユーエスエー インコーポレイテッド 分類の視覚的説明、方法、システム
US20220301689A1 (en) * 2021-03-16 2022-09-22 Genentech, Inc. Anomaly detection in medical imaging data
JP2023019756A (ja) * 2021-07-29 2023-02-09 富士フイルム株式会社 医療画像学習方法及び医療画像処理装置
US20230134508A1 (en) * 2021-11-04 2023-05-04 Samsung Electronics Co., Ltd. Electronic device and method with machine learning training
KR102411652B1 (ko) * 2021-11-05 2022-06-22 석인수 Did 및 nft를 이용한 실물자산의 원본 인증 서비스 제공 방법
JP2023148238A (ja) * 2022-03-30 2023-10-13 住友重機械工業株式会社 検査装置、射出成形システム及び検査方法

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2008234551A (ja) 2007-03-23 2008-10-02 Hitachi Ltd 異常検知装置及び異常検知プログラム
WO2017017722A1 (ja) 2015-07-24 2017-02-02 オリンパス株式会社 処理装置、処理方法及びプログラム
JP2018073024A (ja) 2016-10-27 2018-05-10 ホーチキ株式会社 監視システム
JP2019003329A (ja) 2017-06-13 2019-01-10 キヤノン株式会社 情報処理装置、情報処理方法、及びプログラム

Also Published As

Publication number Publication date
JPWO2021260837A1 (ja) 2021-12-30
WO2021260837A1 (ja) 2021-12-30
JP2023178454A (ja) 2023-12-14
US20230298445A1 (en) 2023-09-21

Similar Documents

Publication Publication Date Title
CN113255518B (zh) 一种视频异常事件检测方法和芯片
JP7268756B2 (ja) 劣化抑制プログラム、劣化抑制方法および情報処理装置
US11741685B2 (en) Commodity identification device, non-transitory computer-readable storage medium, and learning method
JP2017102906A (ja) 情報処理装置、情報処理方法及びプログラム
JP6031210B1 (ja) 販売予測装置、販売予測方法、およびプログラム
JP2017102865A (ja) 情報処理装置、情報処理方法及びプログラム
US20220222545A1 (en) Generation method, non-transitory computer-readable storage medium, and information processing device
JP2019105871A (ja) 異常候補抽出プログラム、異常候補抽出方法および異常候補抽出装置
JP2020204800A (ja) 学習用データセット生成システム、学習サーバ、及び学習用データセット生成プログラム
JP7375934B2 (ja) 学習装置、推定装置、学習方法及びプログラム
WO2020137228A1 (ja) 画像判定装置、画像判定方法及び画像判定プログラム
CN108596068B (zh) 一种动作识别的方法和装置
US20220230028A1 (en) Determination method, non-transitory computer-readable storage medium, and information processing device
WO2021049119A1 (ja) 学習装置、学習方法及び学習プログラムが格納された非一時的なコンピュータ可読媒体
JP7206892B2 (ja) 画像検査装置、画像検査のための学習方法および画像検査プログラム
CN115567224A (zh) 一种用于检测区块链交易异常的方法及相关产品
JP7315022B2 (ja) 機械学習装置、機械学習方法、及び、機械学習プログラム
KR20180082680A (ko) 분류기를 학습시키는 방법 및 이를 이용한 예측 분류 장치
CN110147790B (zh) 基于自适应阈值的场景图像商标检测方法、***、装置
EP4318279A1 (en) Determination program, determination method, and information processing apparatus
US20220237459A1 (en) Generation method, computer-readable recording medium storing generation program, and information processing apparatus
US20220215272A1 (en) Deterioration detection method, computer-readable recording medium storing deterioration detection program, and information processing apparatus
JP7371695B2 (ja) 劣化検出方法、劣化検出プログラムおよび情報処理装置
US20220237463A1 (en) Generation method, computer-readable recording medium storing generation program, and information processing apparatus
CN114978616B (zh) 风险评估***的构建方法及装置、风险评估方法及装置

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20221215

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20230815

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20230921

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20230926

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20231009

R151 Written notification of patent or utility model registration

Ref document number: 7375934

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R151