JP6656988B2 - 画像処理装置、半導体装置、画像認識装置、移動体装置、及び画像処理方法 - Google Patents
画像処理装置、半導体装置、画像認識装置、移動体装置、及び画像処理方法 Download PDFInfo
- Publication number
- JP6656988B2 JP6656988B2 JP2016068437A JP2016068437A JP6656988B2 JP 6656988 B2 JP6656988 B2 JP 6656988B2 JP 2016068437 A JP2016068437 A JP 2016068437A JP 2016068437 A JP2016068437 A JP 2016068437A JP 6656988 B2 JP6656988 B2 JP 6656988B2
- Authority
- JP
- Japan
- Prior art keywords
- luminance
- resolution
- image
- pixel
- output
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V10/00—Arrangements for image or video recognition or understanding
- G06V10/94—Hardware or software architectures specially adapted for image or video understanding
- G06V10/955—Hardware or software architectures specially adapted for image or video understanding using specific electronic processors
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V10/00—Arrangements for image or video recognition or understanding
- G06V10/40—Extraction of image or video features
- G06V10/50—Extraction of image or video features by performing operations within image blocks; by using histograms, e.g. histogram of oriented gradients [HoG]; by summing image-intensity values; Projection analysis
- G06V10/507—Summing image-intensity values; Histogram projection analysis
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V10/00—Arrangements for image or video recognition or understanding
- G06V10/94—Hardware or software architectures specially adapted for image or video understanding
Landscapes
- Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- Multimedia (AREA)
- Theoretical Computer Science (AREA)
- Software Systems (AREA)
- Image Processing (AREA)
- Image Analysis (AREA)
Description
輝度勾配分布による画像特徴量としては、HOG(Histogram of Oriented Gradients)特徴量が有名であり、盛んに研究されている。
画像からCoHOG特徴量を抽出する装置は、ICチップ化されており、ビデオキャプチャボードなどに搭載されて、広く実用化されている。
CoHOGを用いた技術に、特許文献1の「パターン認識方法及び該方法を用いたパターン認識装置」がある。
MRCoHOG特徴量は、極めて高い頑健性を有していることが実験により明らかになってきている。
そのため、ビデオカメラから出力される画像をリアルタイムで画像認識するには、如何にしてMRCoHOG特徴量抽出アルゴリズムを高速に動作するハードウェア構成に落とし込むかという課題があった。
(2)請求項2に記載の発明では、前記勾配方向出力手段が、前記複数の解像度ごとに並列して設けられ、前記順次出力される輝度から当該解像度の画素における輝度の勾配方向を出力する複数の解像度別勾配方向出力手段を備えており、前記解像度別勾配方向出力手段を同時に動作させることにより、前記解像度別の勾配方向を並行して順次出力することを特徴とする請求項1に記載の画像処理装置を提供する。
(3)請求項3に記載の発明では、前記解像度別勾配方向出力手段が、前記輝度出力手段から順次出力される輝度を当該解像度に基づく頻度によって選択することにより(輝度選択手段)、当該解像度の輝度を順次出力し、当該出力した輝度を用いて当該解像度における勾配方向を出力することを特徴とする請求項2に記載の画像処理装置を提供する。
(4)請求項4に記載の発明では、前記解像度別勾配方向出力手段が、当該解像度の輝度の出力順序に基づいて注目画素の水平方向、及び垂直方向に隣接する隣接画素の輝度を特定し(輝度特定手段)、当該特定した隣接画素の輝度を用いて前記注目画素の勾配方向を出力する(注目画素勾配方向出力手段)ことを特徴とする請求項2、又は請求項3に記載の画像処理装置を提供する。
(5)請求項5に記載の発明では、前記解像度別勾配方向出力手段が、前記特定した隣接画素の輝度を用いて前記注目画素の水平方向の輝度勾配強度、及び垂直方向の輝度勾配強度を取得し、当該取得した水平方向の輝度勾配強度と垂直方向の輝度勾配強度を、水平方向の輝度勾配強度と垂直方向の輝度勾配強度の正負及び大小と、量子化した勾配方向と、を対応させた対応テーブルで参照して量子化した勾配方向を出力することを特徴とする請求項4に記載の画像処理装置を提供する。
(6)請求項6に記載の発明では、前記解像度別勾配方向出力手段が、前記隣接画素の位置が対応づけられた配列に、当該解像度の輝度の出力順序に基づいて輝度を配置することにより、前記隣接画素の輝度を特定することを特徴とする請求項4、又は、請求項5に記載の画像処理装置を提供する。
(7)請求項7に記載の発明では、前記配列が、前記注目画素の属する画素行と、当該画素行と垂直方向に隣接する2つの画素行の3つの画素行に対応する3つの配列から構成されており、前記解像度別勾配方向出力手段は、3つの画素行の輝度を、それぞれ対応する前記3つの配列に配置し、当該輝度が配置された位置によって前記隣接画素の輝度を特定することを特徴とする請求項6に記載の画像処理装置を提供する。
(8)請求項8に記載の発明では、前記共起行列作成手段は、前記勾配方向出力手段から順次出力される勾配方向の解像度別の出力順序に基づいて、注目画素の勾配方向と、当該注目画素と組合せる画素の勾配方向を順次特定し、当該特定した勾配方向の組合せに基づいて前記共起行列に順次投票することにより前記共起行列を作成することを特徴とする請求項1から請求項7までのうちの何れか1の請求項に記載の画像処理装置を提供する。
(9)請求項9に記載の発明では、前記共起行列作成手段は、注目画素と、当該注目画素と組合せる画素の位置が対応づけられると共に解像度別に設けられた配列に、前記解像度別の出力順序に基づいて勾配方向を解像度別に配置することにより、前記組合せる画素の勾配方向を特定することを特徴とする請求項8に記載の画像処理装置を提供する。
(10)請求項10に記載の発明では、前記配列は、それぞれの解像度について垂直方向に隣接する2つの画素行に対応する6つの配列から構成され、前記共起行列作成手段は、それぞれの解像度の2つの画素行の勾配方向を、それぞれ対応する2つの配列に配置し、当該勾配方向が配置された位置によって前記組合せる画素の勾配方向を特定することを特徴とする請求項9に記載の画像処理装置を提供する。
(11)請求項11に記載の発明では、請求項1から請求項10までのうちの何れか1の画像処理装置を実装した半導体装置を提供する。
(12)請求項12に記載の発明では、請求項1から請求項10までのうちの何れか1の画像処理装置と、前記画像処理装置から出力される共起行列によるヒストグラムを、基準となる画像の共起行列によるヒストグラムと対比することにより前記画像に写っている対象を認識する認識手段と、を具備したことを特徴とする画像認識装置を提供する。
(13)請求項13に記載の発明では、請求項12に記載の画像認識装置を用いて対象を検出する検出手段と、前記検出した対象に対して所定の位置に移動する移動手段と、を具備したことを特徴とする移動体装置を提供する。
(14)請求項14に記載の発明では、画像を構成する画素の輝度を前記画素の順番に基づいて順次出力する輝度出力ステップと、前記順次出力される輝度を用いて、複数の解像度における各画素の輝度の勾配方向を解像度別に並行して順次出力する勾配方向出力ステップと、前記順次出力される解像度別の勾配方向を順次組合せることにより、異なる解像度間における勾配方向の共起を含む共起行列を作成する共起行列作成ステップと、前記作成した共起行列を前記画像の画像特徴量として出力する共起行列出力ステップと、を実行することを特徴とする画像処理方法を提供する。
画像処理装置21(図5)は、高解像度画像から輝度勾配方向を抽出する3ラインバッファ25a〜バッファ28aから構成された高解像度画像用の処理ライン、中解像度画像から輝度勾配方向を抽出する中解像度部24b〜バッファ28bから構成された中解像度画像用の処理ライン、及び低解像度画像から輝度勾配方向を抽出する低解像度部24c〜バッファ28cから構成された低解像度画像用の処理ラインを並列に配設しており、これら3つの解像度の画像から並行して同時に輝度勾配方向を画素ごとに抽出する。
3つの解像度の画像を同時に処理するため、高速に処理でき、カメラから出力される動画をリアルタイムで処理することができる。
まず、HOG特徴量、CoHOG特徴量、及びMRCoHOG特徴量について簡単に説明する。
図1は、HOG特徴量の概念を説明するための図である。
HOG特徴量は、次の手順により画像から抽出される。
図1(a)左図に示した画像101は、対象を観測する観測窓などによる注目画像領域とする。
まず、画像101を矩形のセル102a、102b、・・・に分割する。
次に、図1(a)右図に示したように、セル102ごとに各画素(ピクセル)の輝度勾配方向(低輝度から高輝度に向かう方向)を例えば8方向に量子化する。
そして、セル102をいくつか集めたブロック単位でヒストグラム106の合計度数が1となるように正規化する。
このようにして正規化したヒストグラム106a、106b、・・・を図1(c)のように一列に並べたヒストグラムが画像101のHOG特徴量107である。
CoHOG特徴量は、局所領域における2画素間の勾配ペアに着目した特徴量であり、次の手順により画像から抽出される。
図2(a)に示したように、画像101を矩形のセル102a、102b、・・・に分割する。なお、セルは、ブロックとも呼ばれる。
なお、注目画素110の上と左の画素が組合せに含まれないのは、一番上の画素行の左端から右方向に向けて順に注目画素110を設定して処理していくため、既に処理が終了しているからである。
注目画素110の輝度勾配方向は、右方向で画素1aの輝度勾配方向は、右上方向である。
そこで、図2(b)の共起行列113で、(行番号、列番号)=(右方向、右上方向)の要素に一票を投じる。
図2(b)の例では、注目画素110と画素1aの輝度勾配方向の組みとして、行番号として右方向の矢印が記載された行と、列番号として右上方向の矢印が記載された列の要素に1が加算された結果、当該要素の値が10になっている。
以下、同様に注目画素110と画素1b、1c、1dとの組合せによる投票(計数)を行う。
これらについても同様に注目画素110と組合せて共起行列113に投票する。
更に、これを全てのセル102で行い、全ての共起行列の成分を図2(d)に示したように一列に並べたヒストグラムが画像101のCoHOG特徴量117である。
MRCoHOG特徴量は、同じ画像の異なる解像度間で共起をみることでオフセット数を大幅に削減する。
まず、図3(a)に示したように、元画像から解像度(画像サイズ)の異なる画像を生成することにより高解像度画像120(元画像)、中解像度画像121、低解像度画像122を得る。画像中の升目は、画素を表している。図示しないが、これら各解像度画像にもセル(ブロックとも呼ばれる)が設定されている。
そして、高解像度画像120、中解像度画像121、及び低解像度画像122のそれぞれの画素について量子化した輝度勾配方向を計算する。
この処理を、高解像度画像120のセル内の各画素に対して行い、更に、全てのセルについて行う。
これにより、高解像度画像120の画素ごとの共起行列が得られる。
また、何れか2つを組合せてもよいし、更に、解像度を増やして4種類以上の解像度画像で共起をとってもよい。
これは、解像度を低下させることによりノイズが低減することと、注目画素から離れた部分との共起を見るためではないかと推測されている。
MRCoHOG特徴量を算出するためには、平方根、除算、逆正接を計算する必要がある。
ところが、コンピュータは、加算によって平方根などの各種計算をするため、これらの演算は、負荷が大きい。
そのため、計算速度を高速化したり、ICチップ化できるように回路規模を適正なものにするためには、ハードウェアに適した計算方法を考案する必要がある。
図4(a)の式(1)のm(x、y)は、座標(x、y)にある画素の輝度勾配の勾配強度の計算式を示している。
なお、文字化け防止のために、下付の小文字は、全角文字で表す。
fx(x、y)、fy(x、y)は、数学的には、輝度をx方向、y方向に偏微分して求めるが、本実施の形態では、fx(x、y)を着目画素の水平方向(左右横方向)両隣に隣接する画素の輝度の差分で表し、fy(x、y)を着目画素の垂直方向(上下縦方向)両隣に隣接する画素の輝度の差分で表す。
この置き換えは、図4(a)の右図に示したように、地点TU間のユーグリッド距離である(t自乗+u自乗)の平方根を、マンハッタン距離であるt+uで近似するものである。名称のマンハッタンは、米国都市のマンハッタンの街路が碁盤の目状であることに由来する。
勾配強度が所定の閾値に達しないものに関しては、例えば、共起を取らないなどの所定の処理を行うが、画像の識別精度に与える影響が小さいため、本実施の形態では、当該処理については説明を省略する。
実験の結果、ユーグリッド距離をマンハッタン距離で置き換えても画像認識能力には、殆ど影響しないことが確認された。
式(3)は、fx(x、y)によるfy(x、y)の除算と、逆正接(arctangent)の計算が含まれているため、計算に必要な処理負荷が大きくなる。
そこで、本実施形態では、MRCoHOG特徴量の計算で必要なのは、式(3)による正確な値ではなく、量子化された輝度勾配方向であることに着目し、式(3)を用いずに、fx(x、y)とfy(x、y)の組と輝度勾配方向を対応させた対応テーブルを用意し、これによってfx(x、y)とfy(x、y)の組を量子化された輝度勾配方向に写像する。
本実施の形態では、一例として、輝度勾配方向を8方向に量子化するものとする。
ここでは、図4(c)に示すように、輝度勾配方向θが0°≦θ<45°のものは0°に量子化し、45°≦θ<90°のものは45°に量子化し、他の角度も同様に、90°、135°、180°、225°、270°、315°に量子化するものとする。
分類aはfx(x、y)とfy(x、y)が共に正の場合、分類bはfx(x、y)とfy(x、y)が共に負の場合、分類cはfx(x、y)か正でfy(x、y)が負の場合、分類dは、fx(x、y)が負でfy(x、y)が正の場合である。
分類がaで、yがx以下の場合は、0°に対応させ、yがxより大きい場合は、45°に対応させる。
分類がbで、−yがx以下の場合は、90°に対応させ、−yがxより大きい場合は、135°に対応させる。
分類がdで、−yがx以上の場合は、270°に対応させ、−yがxより小さい場合は、315°に対応させる。
このように、本実施の形態では、分類11、12によって構成される対応テーブルを参照することにより、逆正接や除算を使用せずに、高速に量子化された輝度勾配方向を得ることができる。
画像処理装置21は、半導体装置として、例えば、半導体チップの上に形成されている。
画像処理装置21は、3ラインバッファ25a〜バッファ28aから構成された高解像度画像処理ラインと、中解像度部24b〜バッファ28bから構成された中解像度画像処理ラインと、低解像度部24c〜バッファ28cから構成された低解像度画像処理ラインを備えている。
これらのパイプラインは、並列に配設されており、高中低解像度の画像を同時に並行処理するため、高速に処理することができる。
画像処理装置21は、クロックに同期して、これらの解像度別勾配方向出力手段を同時に動作させることにより、解像度別の勾配方向を並行して順次出力することができる。
MRCoHOG特徴量を計算するには、画像を構成する各画素の輝度データが有ればよい。
そのため、本実施の形態では、YUYV形式で形成された画像から、画素のY(輝度)を抽出してこれを輝度データとして画像処理装置21に入力する。
以下では、画像のi行目j列の画素の輝度データや後述の勾配方向データを(i−j)などと対応する画素の行番号と列番号で表すことにする。
なお、本実施の形態では、予めYUYV形式の画像から輝度データYを抽出し、これを画像として画像入力部23に入力するが、画像入力部23、あるいは、勾配方向算出部26a、26b、26cで画素データから輝度成分を抽出するように構成してもよい。
なお、図5では、高解像度の輝度データの配線を太線の矢線で表し、中解像度の輝度データの配線を細線の矢線で表し、低解像度の輝度データの配線を点線で示している。
これらの解像度変換回路により、画像40から解像度が1/2、1/4の画像が生成される。
なお、画像40は、解像度を変換せずにそのまま高解像度画像としても使用される。
最近隣接補間は、リサイズ前の画素を抜き出してそのまま使う方法であり、バイリニア補間は、対象画素を中心とする2×2の領域を加重平均する方法であり、バイキュビック補間は、対象画素を中心とする4×4の領域を3次関数によって補完する方法である。
画像処理装置21では、計算が単純で、更に、検出精度が高まる(後述)最近隣接補間を採用した。
中解像度部24bは、図6(a)の画像40bに示したように、画像入力部23が送信してくる画像40の輝度データのうち、斜線で示した1つおきの頻度で輝度データを読み込み、その他の輝度データを読み飛ばすことにより、垂直方向・水平方向の輝度データが1つおきとなった解像度1/2の画像データを生成する。
最近隣接補間を採用したため、不要なデータを読み飛ばし、必要なデータを拾うという計算負荷の小さい簡単な処理によって解像度を変更することができる。
これらの処理ラインは、これらの輝度データを用いて各解像度における勾配方向を出力する。
縦軸と横軸は、それぞれ再現率と誤検出率となっており、曲線の下側の面積が大きいほど識別率がよいことを示している。
このように最近隣接補間は、処理が簡単なのでハードウェア実装に向いているのに加えて、識別率も大いに向上する。
勾配方向算出部26aは、3行分の輝度データを用いて高解像度画像における注目画素の輝度勾配方向を表す勾配方向データを出力する回路である。
勾配方向算出部26bは、3行分の輝度データを用いて中解像度画像における注目画素の輝度勾配方向を表す勾配方向データを出力する回路である。
勾配方向算出部26cは、3行分の輝度データを用いて低解像度画像における注目画素の輝度勾配方向を表す勾配方向データを出力する回路である。
図7(a)を用いて先に説明したように、画像入力部23からは、高解像度画像の画像40の輝度データが(0−0)、(0−1)、・・・と出力される。
図7(b)の例では、画像40の2行目の輝度データ(1−0)、(1−1)、(1−2)、・・・と、3行目の輝度データ(2−0)、(2−1)、(2−2)、・・・と、4行目の輝度データ(2−0)、(2−1)、(2−2)、・・・を画素の列を揃えながら並行して勾配方向算出部26aに出力している場合を表している。
図に示したように、勾配方向算出部26aは、3行3列の記憶素子の配列を備えており、3ラインバッファ25aの出力に同期して3行3列分の輝度データを取り込んで、これら輝度データによる輝度を読み取る。
m(x、y)が閾値に達している場合は、fx(x、y)、fy(x、y)を対応テーブルで参照して、当該画素の量子化した輝度勾配方向を表す勾配方向データ(2−1)を出力する。
このように、勾配方向データは、輝度データと同様に画素に対応して生成される。
このように、勾配方向算出部26aは、クロックごとに勾配方向データを順次出力する。
また、勾配方向算出部26aは、最後の列に達すると、行が1つ分進み、次の行の輝度データを注目画素とする勾配方向データを出力する。
これら注目画素の位置や隣接画素の位置を通過する順序は、画像入力部23が輝度データを出力した順序によって定まる。
そして、解像度別勾配方向出力手段は、隣接画素の位置が対応づけられた配列に、当該解像度の輝度の出力順序に基づいて輝度を配置することにより、隣接画素の輝度を特定している。
この処理は、後に共起行列作成部30aなどで共起を読み取る際のタイミングを合わせるためのものである。
データ51は、データ延ばし前の勾配方向データの構成を示している。各升目が各勾配方向データを表しており、これらが対応する画素の順に並べられている。
データ51の各行を複製して、複製元の行と隣接させて配置すると、垂直方向に2倍に伸ばしたデータ52と、4倍に伸ばしたデータ53が得られる。
また、縦方向4倍部27cは、勾配方向算出部26cから出力された低解像度画像の勾配方向データを行ごとに複製して縦方向に4倍に延ばす。
タイミングコントローラ29は、これら各解像度画像の勾配方向データがバッファ28a、28b、28cに揃うまで待機し、これらが揃ったら出力する。
これにより、解像度変更によってずれてしまった各解像度画像ごとの出力タイミングを揃えることができる。
これらの配線は、それぞれ、共起行列作成部30a、30b、30cと接続しており、これによって、解像度画像別の勾配方向データが共起行列作成部30a、30b、30cに送信される。
データ列55、56、57は、それぞれ、タイミングコントローラ29が、高解像度画像、中解像度画像、低解像度画像の勾配方向データを出力するタイミングを表している。
これに対して、中解像度画像の勾配方向データに対しては、データ列56に示されるように、1番目のデータを1回、2番目のデータから15番目のデータをそれぞれ2回ずつ、16番目のデータを1回、高解像度の出力タイミングに合わせて出力する。
また、低像度画像の勾配方向データに対しては、データ列57に示されるように、1番目のデータを3回、2番目のデータから7番目のデータを4回ずつ、8番目のデータを3回、高解像度の出力タイミングに合わせて出力する。
なお、データ列55とデータ56の最初と最後における出力回数がそれぞれ2回ずつ、4回ずつでないのは、データ列55による幅と同じ幅に調整するためである。
これにより、中解像度画像、低解像度画像の勾配方向データが水平方向に、それぞれ2倍、4倍に伸ばされる。
共起行列作成部30a、30b、30cは、それぞれ、高解像度画像、中解像度画像、低解像度画像の画素を注目画素とする共起行列を作成する。
ヒストグラム作成部31は、共起行列作成部30a、30b、30cから出力される共起行列からMRCoHOG特徴量を作成する回路である。
これにより、共起行列作成部30a、30b、30cから出力される共起行列を選択するなど、より柔軟な運用が可能となり、汎用性が向上する。
共起行列作成部30aは、タイミングコントローラ29から送信されてくる勾配データを解像度別に2行に渡って記憶する、高解像度画像用の2ラインバッファ61a、中解像度画像用の2ラインバッファ61b、低解像度画像用の2ラインバッファ61cを備えている。
勾配方向データの位置を示す符号は、図3(c)の位置の符号に対応させてある(勾配方向は対応していない)。また、注目画素に対応する勾配方向データを太線の矩形で囲み、投票のためにこれと組合せる相手の画素の勾配方向データを○で囲んである。
なお、画像入力部23が輝度データを出力した順に配置するため、2ラインバッファ61a、61b、61cでの配置は、図3(c)と左右が逆になっている。
まず、共起行列作成部30aは、注目画素125の勾配方向データと画素1a〜1dの勾配方向データとの組合せに基づいて共起行列記憶部62に投票する。
これにより、共起行列作成部30aは、画素1aに対応する勾配方向データを注目画素125の位置に配置し、これを用いた投票を共起行列記憶部62に対して行う。
出力された共起行列によるヒストグラムは、ヒストグラム作成部31にて連結され、高解像度画像の画素を注目画素とした場合のMRCoHOG特徴量となる。
このようにして動画カメラから出力される画像をリアルタイムで処理することができる。
まず、画像入力部23が画像40の輝度データを出力し、中解像度部24bと低解像度部24cが、中解像度、低解像度に解像度を変換した輝度データを出力する(ステップ5)。
また、勾配方向算出部26a、26b、26cが、それぞれ、高解像度画像、中解像度画像、低解像度画像の画素の勾配方向を算出し、勾配方向データを出力する(ステップ15)。
なお、ステップ5、10、15の各処理は並行して同時に行われる。
高解像度画像の勾配方向データ、2倍に垂直に伸ばされた中解像度画像の勾配方向データ、及び4倍に垂直に伸ばされた低解像度画像の勾配方向データは、それぞれ、バッファ28a、28b、28cにバッファリングされる。
タイミングコントローラ29は、この際に、中解像度画像と低解像度画像の勾配方向データを水平方向に2倍、4倍に伸ばして出力する(ステップ25)。
更に、ヒストグラム作成部31が、作成された共起行列からヒストグラムを作成し、これをMRCoHOG特徴量として出力する(ステップ35)。
以上、各回路の動作を個別に説明したが、各回路は、クロックに同期して一斉に動作しており、左から流れてきたデータを順次(逐次)処理して右に流す流れ作業を同時に行っている。
半導体装置71は、例えば、ICチップによって構成されており、プロセッサ、RAM、MRCoHOGアクセラレータ72、アフィンアクセラレータ、ヒストグラムアクセラレータ、ビデオ入力インターフェース73、ビデオ出力インターフェース74、入出力インターフェース75などが内部に形成されている。
あるいは、ビデオ出力インターフェース74から動画データを出力すると共にMRCoHOG特徴量を入出力インターフェース75から出力して、外部機器により対象の画像認識を行ってもよい。
画像認識装置80は、CPU(Central Processing Unit)81、ROM(Read Only Memory)82、RAM(Random Access Memory)83、カメラ84、記憶装置85、ビデオキャプチャボード86、入力装置87、出力装置88などから構成されている。
より詳細には、CPU81は、ビデオキャプチャボード86から入力される画像と、当該画像のMRCoHOG特徴量を用いて対象を画像認識する。
RAM83は、CPU81が上記処理を行うためのワーキングメモリを提供する読み書きが可能なメモリである。
画像やMRCoHOG特徴量は、RAM83に展開されてCPU81により利用される。
ビデオキャプチャボード86は、映像を構成する画像の各々について、MRCoHOG特徴量を抽出し、これを画像データに対応させて出力する。
また、記憶装置85は、撮影した動画データを記憶するデータ記憶部も備えている。
出力装置88は、画像認識装置80が各種の情報を出力する装置であり、例えば、操作画面や、撮影中・撮影済みの動画を表示する液晶ディスプレイなどの出力デバイスで構成されている。
まず、MRCoHOG特徴量の度数(M個あるとする)を成分とするベクトルφ(x)を考える。ここで、xは、画像を表すベクトルであり、x=(第1番目の画素の輝度、第2番目の画素の輝度、・・・)である。
なお、ベクトルは太字などで表すが、文字化け防止のため、以下では、通常の文字で表す。
なお、図では簡単化のためMRCoHOG特徴量を2次元空間で表してある。
一方、Fは、対象画像の学習によって得た重みベクトルであり、多数の対象画像のMRCoHOG特徴量を平均化したベクトルである。
Fとφ(x)は、規格化されており、Fとφ(x)の内積で定義される相関係数は、画像が学習画像に類似するほど1に近づき、類似程度が低いほど−1に近づく。
このように、類似判断の対象となる画像をMRCoHOG特徴量空間に写像することにより、学習画像に類似している画像と類似していない画像を輝度勾配分布により分離することができる。
これによって対象を画像認識することができる。
このように画像認識装置80は、画像処理装置21から出力されるヒストグラムのベクトルφ(x)を、基準となる画像のヒストグラムのベクトルFと対比することにより画像に写っている対象を認識する認識手段を備えている。
半導体装置71は、リアルタイムで画像処理を行うことができるため、リアルタイム処理の必要な移動体に搭載するのに適している。
例えば、移動体が車両の場合は、カメラ84を車両前方に設置し、車両の前景を撮影する。
これにより、車両は、カメラ84の映像から前方を走行する他車両を追跡することにより、当該他車両に追随して所謂コンボイ走行を行ったり、前方を移動する車両や歩行者の追跡軌跡から衝突の危険を判断した場合には、ブレーキを作動させたり、走行方向を変えて回避動作を行ったりなどする。このように、画像認識装置80は、自動運転技術やその他の技術に応用することができる。
このように、本実施の形態では、画像認識装置80を用いて対象を検出する検出手段と、検出した対象に対して所定の位置に移動する移動手段と、を備えた移動体装置を提供することができる。
画像処理装置21は、MRCoHOG特徴量の複数解像度画像の生成処理の補間方法に、高速かつ、物体境界のエッジがはっきり出る最近隣接補間(最近傍補間)を採用した。生成する画像サイズごとに、メモリの間引き間隔を設定し、間引くことで最近隣接補間による画像を生成する。
そのため、資本や技術の蓄積のある企業が制作した場合、更に高速化を図ることができると期待され、これによりコンピュータの計算資源を他の処理に振り分けることができる。
11、12 分類
21 画像処理装置
23 画像入力部
24b 中解像度部
24c 低解像度部
25a、25b、25c 3ラインバッファ
26a、26b、26c 勾配方向算出部
27b 縦方向2倍部
27c 縦方向4倍部
28a、28b、28c バッファ
29 タイミングコントローラ
30a、30b、30c 共起行列作成部
31 ヒストグラム作成部
40 画像
51、52、53 データ
55、56、57 データ列
61a、61b、61c 2ラインバッファ
62 共起行列記憶部
71 半導体装置
72 MRCoHOGアクセラレータ
73 ビデオ入力インターフェース
74 ビデオ出力インターフェース
75 入出力インターフェース
80 画像認識装置
81 CPU
82 ROM
83 RAM
84 カメラ
85 記憶装置
86 ビデオキャプチャボード
87 入力装置
88 出力装置
101 画像
102 セル
106 ヒストグラム
107 HOG特徴量
109a、109b、109c ベクトル
110 注目画素
113 共起行列
117 CoHOG特徴量
120 高解像度画像
121 中解像度画像
122 低解像度画像
125 注目画素
127 MRCoHOG特徴量
Claims (14)
- 画像を構成する画素の輝度を前記画素の順番に基づいて順次出力する輝度出力手段と、
前記順次出力される輝度を用いて、複数の解像度における各画素の輝度の勾配方向を解像度別に並行して順次出力する勾配方向出力手段と、
前記順次出力される解像度別の勾配方向を順次組合せることにより、異なる解像度間における勾配方向の共起を含む共起行列を作成する共起行列作成手段と、
前記作成した共起行列を前記画像の画像特徴量として出力する共起行列出力手段と、
を具備したことを特徴とする画像処理装置。 - 前記勾配方向出力手段は、
前記複数の解像度ごとに並列して設けられ、前記順次出力される輝度から当該解像度の画素における輝度の勾配方向を出力する複数の解像度別勾配方向出力手段を備えており、
前記解像度別勾配方向出力手段を同時に動作させることにより、前記解像度別の勾配方向を並行して順次出力することを特徴とする請求項1に記載の画像処理装置。 - 前記解像度別勾配方向出力手段は、
前記輝度出力手段から順次出力される輝度を当該解像度に基づく頻度によって選択することにより、当該解像度の輝度を順次出力し、
当該出力した輝度を用いて当該解像度における勾配方向を出力することを特徴とする請求項2に記載の画像処理装置。 - 前記解像度別勾配方向出力手段は、
当該解像度の輝度の出力順序に基づいて注目画素の水平方向、及び垂直方向に隣接する隣接画素の輝度を特定し、
当該特定した隣接画素の輝度を用いて前記注目画素の勾配方向を出力することを特徴とする請求項2、又は請求項3に記載の画像処理装置。 - 前記解像度別勾配方向出力手段は、
前記特定した隣接画素の輝度を用いて前記注目画素の水平方向の輝度勾配強度、及び垂直方向の輝度勾配強度を取得し、
当該取得した水平方向の輝度勾配強度と垂直方向の輝度勾配強度を、水平方向の輝度勾配強度と垂直方向の輝度勾配強度の正負及び大小と、量子化した勾配方向と、を対応させた対応テーブルで参照して量子化した勾配方向を出力することを特徴とする請求項4に記載の画像処理装置。 - 前記解像度別勾配方向出力手段は、
前記隣接画素の位置が対応づけられた配列に、当該解像度の輝度の出力順序に基づいて輝度を配置することにより、前記隣接画素の輝度を特定することを特徴とする請求項4、又は、請求項5に記載の画像処理装置。 - 前記配列は、前記注目画素の属する画素行と、当該画素行と垂直方向に隣接する2つの画素行の3つの画素行に対応する3つの配列から構成されており、
前記解像度別勾配方向出力手段は、
3つの画素行の輝度を、それぞれ対応する前記3つの配列に配置し、当該輝度が配置された位置によって前記隣接画素の輝度を特定することを特徴とする請求項6に記載の画像処理装置。 - 前記共起行列作成手段は、
前記勾配方向出力手段から順次出力される勾配方向の解像度別の出力順序に基づいて、注目画素の勾配方向と、当該注目画素と組合せる画素の勾配方向を順次特定し、
当該特定した勾配方向の組合せに基づいて前記共起行列に順次投票することにより前記共起行列を作成することを特徴とする請求項1から請求項7までのうちの何れか1の請求項に記載の画像処理装置。 - 前記共起行列作成手段は、
注目画素と、当該注目画素と組合せる画素の位置が対応づけられると共に解像度別に設けられた配列に、前記解像度別の出力順序に基づいて勾配方向を解像度別に配置することにより、前記組合せる画素の勾配方向を特定することを特徴とする請求項8に記載の画像処理装置。 - 前記配列は、それぞれの解像度について垂直方向に隣接する2つの画素行に対応する6つの配列から構成され、
前記共起行列作成手段は、
それぞれの解像度の2つの画素行の勾配方向を、それぞれ対応する2つの配列に配置し、当該勾配方向が配置された位置によって前記組合せる画素の勾配方向を特定することを特徴とする請求項9に記載の画像処理装置。 - 請求項1から請求項10までのうちの何れか1の画像処理装置を実装した半導体装置。
- 請求項1から請求項10までのうちの何れか1の画像処理装置と、
前記画像処理装置から出力される共起行列によるヒストグラムを、基準となる画像の共起行列によるヒストグラムと対比することにより前記画像に写っている対象を認識する認識手段と、
を具備したことを特徴とする画像認識装置。 - 請求項12に記載の画像認識装置を用いて対象を検出する検出手段と、
前記検出した対象に対して所定の位置に移動する移動手段と、
を具備したことを特徴とする移動体装置。 - 画像を構成する画素の輝度を前記画素の順番に基づいて順次出力する輝度出力ステップと、
前記順次出力される輝度を用いて、複数の解像度における各画素の輝度の勾配方向を解像度別に並行して順次出力する勾配方向出力ステップと、
前記順次出力される解像度別の勾配方向を順次組合せることにより、異なる解像度間における勾配方向の共起を含む共起行列を作成する共起行列作成ステップと、
前記作成した共起行列を前記画像の画像特徴量として出力する共起行列出力ステップと、
を実行することを特徴とする画像処理方法。
Priority Applications (5)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2016068437A JP6656988B2 (ja) | 2016-03-30 | 2016-03-30 | 画像処理装置、半導体装置、画像認識装置、移動体装置、及び画像処理方法 |
US15/771,840 US11017262B2 (en) | 2016-03-30 | 2017-03-30 | Method and device to determine image features using multi-resolution gradient analysis |
PCT/JP2017/013280 WO2017170877A1 (ja) | 2016-03-30 | 2017-03-30 | 画像処理装置、半導体装置、画像認識装置、移動体装置、及び画像処理方法 |
CN201780003758.2A CN108292367B (zh) | 2016-03-30 | 2017-03-30 | 图像处理装置、半导体装置、图像识别装置、移动体装置以及图像处理方法 |
EP17775411.6A EP3438927B1 (en) | 2016-03-30 | 2017-03-30 | Image processing device, semiconductor device, image recognition device, mobile device, and image processing method |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2016068437A JP6656988B2 (ja) | 2016-03-30 | 2016-03-30 | 画像処理装置、半導体装置、画像認識装置、移動体装置、及び画像処理方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2017182438A JP2017182438A (ja) | 2017-10-05 |
JP6656988B2 true JP6656988B2 (ja) | 2020-03-04 |
Family
ID=59965885
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2016068437A Active JP6656988B2 (ja) | 2016-03-30 | 2016-03-30 | 画像処理装置、半導体装置、画像認識装置、移動体装置、及び画像処理方法 |
Country Status (5)
Country | Link |
---|---|
US (1) | US11017262B2 (ja) |
EP (1) | EP3438927B1 (ja) |
JP (1) | JP6656988B2 (ja) |
CN (1) | CN108292367B (ja) |
WO (1) | WO2017170877A1 (ja) |
Families Citing this family (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US11004205B2 (en) * | 2017-04-18 | 2021-05-11 | Texas Instruments Incorporated | Hardware accelerator for histogram of oriented gradients computation |
JP7295234B2 (ja) * | 2018-07-17 | 2023-06-20 | エヌビディア コーポレーション | 自律運転マシンのための回帰ベースの線分検出 |
JP7285479B2 (ja) * | 2019-03-28 | 2023-06-02 | 株式会社アイシン | 画像認識装置、及び画像認識プログラム |
JP2020166342A (ja) * | 2019-03-28 | 2020-10-08 | 株式会社エクォス・リサーチ | 画像処理装置、及び画像処理プログラム |
CN112016356A (zh) * | 2019-05-30 | 2020-12-01 | 西北工业大学深圳研究院 | 基于zynq的高光谱目标识别***及方法 |
CN113870296B (zh) * | 2021-12-02 | 2022-02-22 | 暨南大学 | 基于刚体碰撞优化算法的图像边缘检测方法、装置及介质 |
Family Cites Families (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP4997178B2 (ja) * | 2008-06-10 | 2012-08-08 | 学校法人中部大学 | 物体検出装置 |
JPWO2011037097A1 (ja) * | 2009-09-24 | 2013-02-21 | 国立大学法人京都大学 | パターン認識方法及び該方法を用いたパターン認識装置 |
JP2013097583A (ja) * | 2011-11-01 | 2013-05-20 | Nec Corp | 特徴量生成装置、方法及びプログラム |
JP5924735B2 (ja) * | 2012-06-28 | 2016-05-25 | 国立大学法人九州工業大学 | 画像特徴抽出及び画像処理のためのシステム、方法及びプログラム |
CN103578110B (zh) * | 2013-11-12 | 2016-06-08 | 河海大学 | 基于灰度共生矩阵的多波段高分辨率遥感影像分割方法 |
JP6259671B2 (ja) * | 2014-01-23 | 2018-01-10 | 株式会社デンソーアイティーラボラトリ | 関連性判定装置、関連性判定プログラム、及び関連性判定方法 |
JP6303090B2 (ja) * | 2014-03-24 | 2018-04-04 | アルパイン株式会社 | 画像処理装置および画像処理プログラム |
-
2016
- 2016-03-30 JP JP2016068437A patent/JP6656988B2/ja active Active
-
2017
- 2017-03-30 US US15/771,840 patent/US11017262B2/en active Active
- 2017-03-30 WO PCT/JP2017/013280 patent/WO2017170877A1/ja active Application Filing
- 2017-03-30 CN CN201780003758.2A patent/CN108292367B/zh active Active
- 2017-03-30 EP EP17775411.6A patent/EP3438927B1/en active Active
Also Published As
Publication number | Publication date |
---|---|
JP2017182438A (ja) | 2017-10-05 |
US20180322361A1 (en) | 2018-11-08 |
EP3438927A1 (en) | 2019-02-06 |
US11017262B2 (en) | 2021-05-25 |
EP3438927B1 (en) | 2023-09-27 |
CN108292367B (zh) | 2022-08-02 |
WO2017170877A1 (ja) | 2017-10-05 |
CN108292367A (zh) | 2018-07-17 |
EP3438927A4 (en) | 2019-11-13 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP6656988B2 (ja) | 画像処理装置、半導体装置、画像認識装置、移動体装置、及び画像処理方法 | |
Leng et al. | Realize your surroundings: Exploiting context information for small object detection | |
JP6732214B2 (ja) | 画像処理装置、画像処理方法、テンプレート作成装置、物体認識処理装置及びプログラム | |
Ren et al. | Unsupervised change detection in satellite images with generative adversarial network | |
US10366307B2 (en) | Coarse-to-fine search method, image processing device and recording medium | |
JP6923159B2 (ja) | 情報処理装置 | |
JP5936561B2 (ja) | 画像における外観及びコンテキストに基づく物体分類 | |
CN111164604B (zh) | 信息处理装置 | |
WO2011037097A1 (ja) | パターン認識方法及び該方法を用いたパターン認識装置 | |
JP7165353B2 (ja) | 画像特徴量出力装置、画像認識装置、画像特徴量出力プログラム、及び画像認識プログラム | |
CN112651294A (zh) | 基于多尺度融合的遮挡人体姿势识别方法 | |
Potje et al. | XFeat: Accelerated Features for Lightweight Image Matching | |
CN109614841B (zh) | 嵌入式***中的快速人脸检测方法 | |
JP6276504B2 (ja) | 画像検出装置及び制御プログラム並びに画像検出方法 | |
WO2020196917A1 (ja) | 画像認識装置、及び画像認識プログラム | |
JP4863121B2 (ja) | 画像特徴抽出装置および画像特徴抽出方法 | |
Liu et al. | Efficient Scale Divide and Conquer Network for Object Detection | |
CN117373020A (zh) | 基于几何约束动态卷积的实例分割方法及*** | |
Mikrut et al. | Neural networks in the automation of photogrammetric processes | |
JP2018106413A (ja) | 被写体識別装置、方法、及びプログラム | |
Lahdenoja et al. | Regional image correspondence matching method for SIMD processing | |
JP2008191817A (ja) | 画像処理装置、および画像処理方法、並びにコンピュータ・プログラム |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20181228 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A821 Effective date: 20181228 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20200110 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20200205 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 6656988 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |