WO2022215195A1

WO2022215195A1 - 物体検出装置、物体検出システム、物体検出方法、及び、記録媒体

Info

Publication number: WO2022215195A1
Application number: PCT/JP2021/014768
Authority: WO
Inventors: 雅也藤若
Original assignee: 日本電気株式会社
Priority date: 2021-04-07
Filing date: 2021-04-07
Publication date: 2022-10-13
Also published as: US20240161445A1; JPWO2022215195A1

Abstract

物体検出装置（１）は、画像生成装置から取得した第１画像（ＩＭＧ＿ｏｒｉｇｉｎａｌ）及び検出対象物体を示す第２画像（ＩＭＧ＿ｔａｒｇｅｔ）の夫々を、物体検出を可能とする特徴量を抽出するように且つ後に復号可能になるように圧縮符号化することで、圧縮符号化された第１画像であって且つ第１画像の第１特徴量（ＣＭ＿ｏｒｉｇｉｎａｌ）として利用可能な第１符号化情報（ＥＩ＿ｏｒｉｇｉｎａｌ）及び圧縮符号化された第２画像であって且つ第２画像の特徴量である第２特徴量（ＣＭ＿ｔａｒｇｅｔ）として利用可能な第２符号化情報（ＥＩ＿ｔａｒｇｅｔ）を生成する生成手段（１１１）と、第１及び第２特徴量を用いて、第１画像内において検出対象物体を検出する検出手段（１１２）とを備える。

Description

物体検出装置、物体検出システム、物体検出方法、及び、記録媒体

　この開示は、例えば、画像内において検出対象物体を検出可能な物体検出装置、物体検出システム、物体検出方法、及び、記録媒体の技術分野に関する。

　特許文献１には、ニューラルネットワークを用いて、画像内において検出対象物体を検出する物体検出装置の一例が記載されている。

　その他、この開示に関連する先行技術文献として、特許文献２から特許文献４があげられる。

国際公開第２０２０／０３１４２２号パンフレット特開２０２０－０５１９８２号公報特許第６６０５７４２号公報国際公開第２０１７／１８７５１６号パンフレット

　物体検出装置は、画像内において検出対象物体を検出する物体検出処理と並行して、通信回線を介して、物体検出装置の外部の情報処理装置に対して画像を送信することがある。一例として、物体検出装置が相対的に低い処理能力しか有していない携帯端末に搭載されている場合には、物体検出装置は、相対的に高い処理能力を必要とする情報処理を画像に対して行うことが可能な情報処理装置に対して、画像を送信することがある。

　この場合、通信回線における帯域の制約を満たすために、物体検出装置は、画像を圧縮し、圧縮した画像を情報処理装置に送信することがある。この場合、物体検出装置は、物体検出動作と別個独立に、画像を圧縮するための圧縮動作を行う必要がある。しかしながら、物体検出装置は、物体検出動作と圧縮動作とを別個独立に行うことが可能な程度に高い処理能力を有しているとは限らない。このため、物体検出動作と圧縮動作とを行うための処理負荷を低減することが望まれる。

　この開示は、上述した技術的問題を解決可能な物体検出装置、物体検出システム、物体検出方法、及び、記録媒体を提供することを課題とする。一例として、この開示は、画像を圧縮し且つ画像内において検出対象物体を検出するための処理負荷を低減可能な物体検出装置、物体検出システム、物体検出方法、及び、記録媒体を提供することを課題とする。

　この開示の物体検出装置は、画像生成装置から取得した第１画像及び検出対象物体を示す第２画像の夫々を、物体検出を可能とする特徴量を抽出するように且つ後に復号可能になるように圧縮符号化することで、圧縮符号化された前記第１画像であって且つ前記第１画像の前記特徴量である第１特徴量として利用可能な第１符号化情報及び圧縮符号化された前記第２画像であって且つ前記第２画像の前記特徴量である第２特徴量として利用可能な第２符号化情報を生成する生成手段と、前記第１及び第２特徴量を用いて、前記第１画像内において前記検出対象物体を検出する検出手段とを備える。

　この開示の物体検出システムは、物体検出装置と、情報処理装置とを備える物体検出システムであって、前記物体検出装置は、画像生成装置から取得した第１画像及び検出対象物体を示す第２画像の夫々を、物体検出を可能とする特徴量を抽出するように且つ後に復号可能になるように圧縮符号化することで、圧縮符号化された前記第１画像であって且つ前記第１画像の前記特徴量である第１特徴量として利用可能な第１符号化情報及び圧縮符号化された前記第２画像であって且つ前記第２画像の前記特徴量である第２特徴量として利用可能な第２符号化情報を生成する生成手段と、前記第１及び第２特徴量を用いて、前記第１画像内において前記検出対象物体を検出する検出手段と、通信回線を介して、前記第１符号化情報を前記情報処理装置に送信する送信手段とを備え、前記情報処理装置は、前記第１符号化情報を用いた所定動作を行う。

　この開示の物体検出方法は、画像生成装置から取得した第１画像及び検出対象物体を示す第２画像の夫々を、物体検出を可能とする特徴量を抽出するように且つ後に復号可能になるように圧縮符号化することで、圧縮符号化された前記第１画像であって且つ前記第１画像の前記特徴量である第１特徴量として利用可能な第１符号化情報及び圧縮符号化された前記第２画像であって且つ前記第２画像の前記特徴量である第２特徴量として利用可能な第２符号化情報を生成し、前記第１及び第２特徴量を用いて、前記第１画像内において前記検出対象物体を検出する。

　この開示の記録媒体は、コンピュータに、画像生成装置から取得した第１画像及び検出対象物体を示す第２画像の夫々を、物体検出を可能とする特徴量を抽出するように且つ後に復号可能になるように圧縮符号化することで、圧縮符号化された前記第１画像であって且つ前記第１画像の前記特徴量である第１特徴量として利用可能な第１符号化情報及び圧縮符号化された前記第２画像であって且つ前記第２画像の前記特徴量である第２特徴量として利用可能な第２符号化情報を生成し、前記第１及び第２特徴量を用いて、前記第１画像内において前記検出対象物体を検出する物体検出方法を実行させるコンピュータプログラムが記録された記録媒体である。

　上述した物体検出装置、物体検出システム、物体検出方法、及び、記録媒体によれば、第１画像を圧縮し且つ第１画像内において検出対象物体を検出するための処理負荷が低減可能となる。

図１は、本実施形態の物体検出システムの全体構成を示すブロック図である。図２は、本実施形態の物体検出装置の構成を示すブロック図である。図３は、本実施形態の物体検出装置が用いるニューラルネットワークの構造を模式的に示す。図４は、本実施形態の情報処理装置の構成を示すブロック図である。図５は、本実施形態の物体検出システムの動作の流れを示すフローチャートである。図６は、物体検出装置が用いる演算モデルを生成するための機械学習を概念的に示す。図７は、比較例の物体検出装置が用いるニューラルネットワークの構造を模式的に示す。図８は、変形例における物体検出装置の構成を示すブロック図である。

　以下、図面を参照しながら、物体検出装置、物体検出システム、物体検出方法、及び、記録媒体の実施形態について説明する。以下では、物体検出装置、物体検出システム、物体検出方法、及び、記録媒体の実施形態が適用された物体検出システムＳＹＳを用いて、物体検出装置、物体検出システム、物体検出方法、及び、記録媒体の実施形態について説明する。但し、本発明が以下に説明する実施形態に限定されることはない。

　＜１＞物体検出システムＳＹＳの構成
　初めに、本実施形態の物体検出システムＳＹＳの構成について説明する。

　＜１－１＞物体検出システムＳＹＳの全体構成
　初めに、図１を参照しながら、本実施形態の物体検出システムＳＹＳの全体構成について説明する。図１は、本実施形態の物体検出システムＳＹＳの全体構成を示すブロック図である。

　図１に示すように、物体検出システムＳＹＳは、物体検出装置１と、情報処理装置２とを備えている。物体検出装置１と情報処理装置２とは、通信回線３を介して互いに通信可能である。通信回線３は、有線の通信回線を含んでいてもよい。通信回線３は、有線の通信回線を含んでいてもよい。

　物体検出装置１は、元画像ＩＭＧ＿ｏｒｉｇｉｎａｌ内において検出対象物体を検出可能である。つまり、物体検出装置１は、物体検出を行うことが可能である。元画像ＩＭＧ＿ｏｒｉｇｉｎａは、検出対象物体を検出するべき画像である。物体検出装置１は、このような元画像ＩＭＧ＿ｏｒｉｇｉｎａｌを、カメラ等の画像生成装置から取得してもよい。本実施形態では、物体検出装置１は、元画像ＩＭＧ＿ｏｒｉｇｉｎａｌ内において検出対象物体を検出するために、検出対象物体を示す検出対象画像ＩＭＧ＿ｔａｒｇｅｔを用いる。つまり、物体検出装置１は、元画像ＩＭＧ＿ｏｒｉｇｉｎａｌと検出対象画像ＩＭＧ＿ｔａｒｇｅｔとを用いて、検出対象画像ＩＭＧ＿ｔａｒｇｅｔが示す検出対象物体を、元画像ＩＭＧ＿ｏｒｉｇｉｎａｌ内において検出する。具体的には、物体検出装置１は、元画像ＩＭＧ＿ｏｒｉｇｉｎａｌに基づいて、元画像ＩＭＧ＿ｏｒｉｇｉｎａｌの特徴量ＣＭ＿ｏｒｉｇｉｎａｌを、物体検出を可能とする特徴量として生成する。更に、物体検出装置１は、検出対象画像ＩＭＧ＿ｔａｒｇｅｔに基づいて、検出対象画像ＩＭＧ＿ｔａｒｇｅｔの特徴量ＣＭ＿ｔａｒｇｅｔを、物体検出を可能とする特徴量として生成する。その後、物体検出装置１は、特徴量ＣＭ＿ｏｒｉｇｉｎａｌと特徴量ＣＭ＿ｔａｒｇｅｔとに基づいて、元画像ＩＭＧ＿ｏｒｉｇｉｎａｌ内において検出対象物体を検出する。

　物体検出装置１は更に、元画像ＩＭＧ＿ｏｒｉｇｉｎａｌを、後に復号可能になるように圧縮符号化する。換言すると、物体検出装置１は、元画像ＩＭＧ＿ｏｒｉｇｉｎａｌに対して、所望の圧縮符号化する処理を施すことにより、その所望の圧縮符号化に対応する復号処理を後から施すことが可能なデータ構造（情報形式、情報形態）に変換する処理を実行する。以下本願では、あるデータ構造をなす入力画像に対して、所望の圧縮符号化する処理を施すことにより、その所望の圧縮符号化に対応する復号処理を後から施すことが可能なデータ構造（情報形式、情報形態）に変換することを、「入力画像を、後に復号可能になるように圧縮符号化する」あるいは「後に復号可能になるように入力画像を圧縮符号化する」と表現することとする。そして、ここで言う“入力画像”なる文言は、説明箇所に応じて適当な名称を付した画像に置き換えられて用いられることとする。

　係る圧縮符号化の結果、物体検出装置１は、圧縮符号化された元画像ＩＭＧ＿ｏｒｉｇｉｎａｌである符号化情報ＥＩ＿ｏｒｉｇｉｎａｌを生成する。物体検出装置１は、生成した符号化情報ＥＩ＿ｏｒｉｇｉｎａｌを、通信回線３を介して情報処理装置２に送信する。その結果、元画像ＩＭＧ＿ｏｒｉｇｉｎａｌが通信回線３を介して情報処理装置２に送信される場合と比較して、通信回線３における帯域の制約を満たす可能性が高くなる。

　本実施形態では特に、物体検出装置１は、符号化情報ＥＩ＿ｏｒｉｇｉｎａｌを、元画像ＩＭＧ＿ｏｒｉｇｉｎａｌの特徴量ＣＭ＿ｏｒｉｇｉｎａｌ（つまり、検出対象物体を検出するための特徴量ＣＭ＿ｏｒｉｇｉｎａｌ）として用いる。つまり、物体検出装置１は、元画像ＩＭＧ＿ｏｒｉｇｉｎａｌを圧縮符号化することで、特徴量ＣＭ＿ｏｒｉｇｉｎａｌとして利用可能な符号化情報ＥＩ＿ｏｒｉｇｉｎａｌを生成する。より具体的には、物体検出装置１は、物体検出を可能とする特徴量を抽出するように且つ後に復号可能となるように元画像ＩＭＧ＿ｏｒｉｇｉｎａｌを圧縮符号化することで、特徴量ＣＭ＿ｏｒｉｇｉｎａｌとして利用可能な符号化情報ＥＩ＿ｏｒｉｇｉｎａｌを生成する（言い換えれば、符号化情報ＥＩ＿ｏｒｉｇｉｎａｌとして利用可能な特徴量ＣＭ＿ｏｒｉｇｉｎａｌを生成する）。

　上述したように、検出対象物体を検出するために物体検出装置１は、元画像ＩＭＧ＿ｏｒｉｇｉｎａｌに加えて検出対象画像ＩＭＧ＿ｔａｒｇｅｔを用いる。このため、物体検出装置１は、特徴量ＣＭ＿ｏｒｉｇｉｎａｌに加えて、圧縮符号化された検出対象画像ＩＭＧ＿ｔａｒｇｅｔである符号化情報ＥＩ＿ｔａｒｇｅｔを、検出対象画像ＩＭＧ＿ｔａｒｇｅｔの特徴量ＣＭ＿ｔａｒｇｅｔ（つまり、検出対象物体を検出するための特徴量ＣＭ＿ｔａｒｇｅｔ）として生成する。つまり、物体検出装置１は、元画像ＩＭＧ＿ｏｒｉｇｉｎａｌを圧縮符号化する場合と同様に検出対象画像ＩＭＧ＿ｔａｒｇｅｔを圧縮符号化することで、特徴量ＣＭ＿ｔａｒｇｅｔとして利用可能な符号化情報ＥＩ＿ｔａｒｇｅｔを生成する。より具体的には、物体検出装置１は、物体検出を可能とする特徴量を抽出するように且つ後に復号可能となるように検出対象画像ＩＭＧ＿ｔａｒｇｅｔを圧縮符号化することで、特徴量ＣＭ＿ｔａｒｇｅｔとして利用可能な符号化情報ＥＩ＿ｔａｒｇｅｔを生成する（言い換えれば、符号化情報ＥＩ＿ｔａｒｇｅｔとして利用可能な特徴量ＣＭ＿ｔａｒｇｅｔを生成する）。物体検出装置１は、生成した符号化情報ＥＩ＿ｔａｒｇｅｔを、通信回線３を介して情報処理装置２に送信してもよいし、送信しなくてもよい。

　情報処理装置２は、通信回線３を介して、物体検出装置１から、符号化情報ＥＩ＿ｏｒｉｇｉｎａｌを受信する（つまり、取得する）。情報処理装置２は、受信した符号化情報ＥＩ＿ｏｒｉｇｉｎａｌを用いた所定動作を行う。本実施形態では、情報処理装置２が、所定動作の一例として、符号化情報ＥＩ＿ｏｒｉｇｉｎａｌを復号化することで復元画像ＩＭＧ＿ｄｅｃを生成する復号動作を行う例について説明する。

　このような物体検出システムＳＹＳの具体例としては、例えば、拡張現実（ＡＲ：Ａｕｇｕｍｅｎｔｅ　Ｒｅａｌｉｔｙ）システムがあげられる。拡張現実は、現実空間に存在する実物体を検出し、現実空間を示す画像内で実物体が存在する場所に仮想物体を配置する技術である。拡張現実システムでは、物体検出装置１は、スマートフォン等の携帯端末に適用されてもよい。この場合、物体検出装置１は、携帯端末のカメラが現実空間を撮像することで生成される元画像ＩＭＧ＿ｏｒｉｇｉｎａｌ内において検出対象物体（つまり、実物体）を検出し、元画像ＩＭＧ＿ｏｒｉｇｉｎａｌ内において、検出した検出対象物体が存在する場所に仮想物体を配置してもよい。また、この場合、情報処理装置２は、上述した復号動作を行うことで復元画像ＩＭＧ＿ｄｅｃを生成し、更に、復元画像ＩＭＧ＿ｄｅｃを解析する画像解析動作を行ってもよい。画像解析動作の結果は、携帯端末に送信されてもよい。この場合、携帯端末は、物体検出装置１による検出対象物体の検出結果に加えて、情報処理装置２による画像解析動作の結果に基づいて、仮想物体を配置してもよい。情報処理装置２による画像解析動作の一例として、復元画像ＩＭＧ＿ｄｅｃに基づいて、携帯端末の向きを推定する動作があげられる。この場合、携帯端末は、情報処理装置２による画像解析動作によって推定された携帯端末の向きに基づいて、仮想物体を配置してもよい。

　＜１－２＞物体検出装置１の構成
　続いて、図２を参照しながら、物体検出装置１の構成について説明する。図２は、物体検出装置１の構成を示すブロック図である。

　図２に示すように、物体検出装置１は、演算装置１１と、記憶装置１２と、通信装置１３とを備えている。更に、物体検出装置１は、入力装置１４と、出力装置１５とを備えていてもよい。但し、物体検出装置１は、入力装置１４及び出力装置１５のうちの少なくとも一つを備えていなくてもよい。演算装置１１と、記憶装置１２と、通信装置１３と、入力装置１４と、出力装置１５とは、データバス１６を介して接続されていてもよい。

　演算装置１１は、例えば、ＣＰＵ（Ｃｅｎｔｒａｌ　Ｐｒｏｃｅｓｓｉｎｇ　Ｕｎｉｔ）、ＧＰＵ（Ｇｒａｐｈｉｃｓ　Ｐｒｏｅｃｓｓｉｎｇ　Ｕｎｉｔ）及びＦＰＧＡ（Ｆｉｅｌｄ　Ｐｒｏｇｒａｍｍａｂｌｅ　Ｇａｔｅ　Ａｒｒａｙ）のうちの少なくとも一つを含む。演算装置１１は、コンピュータプログラムを読み込む。例えば、演算装置１１は、記憶装置１２が記憶しているコンピュータプログラムを読み込んでもよい。例えば、演算装置１１は、コンピュータで読み取り可能であって且つ一時的でない記録媒体が記憶しているコンピュータプログラムを、物体検出装置１が備える図示しない記録媒体読み取り装置を用いて読み込んでもよい。演算装置１１は、通信装置１３（或いは、その他の通信装置）を介して、物体検出装置１の外部に配置される不図示の装置からコンピュータプログラムを取得してもよい（つまり、ダウンロードしてもよい又は読み込んでもよい）。演算装置１１は、読み込んだコンピュータプログラムを実行する。その結果、演算装置１１内には、物体検出装置１が行うべき動作（言い換えれば、処理）を実行するための論理的な機能ブロックが実現される。つまり、演算装置１１は、物体検出装置１が行うべき動作を実行するための論理的な機能ブロックを実現するためのコントローラとして機能可能である。

　図２には、演算装置１１内に実現される論理的な機能ブロックの一例が示されている。図２に示すように、演算装置１１内には、「生成手段」の一具体例である符号化部１１１と、「検出手段」の一具体例である物体検出部１１２と、「送信手段」の一具体例である送信制御部１１３とが実現される。

　符号化部１１１は、後に復号可能になるように元画像ＩＭＧ＿ｏｒｉｇｉｎａｌを圧縮符号化することで、元画像ＩＭＧ＿ｏｒｉｇｉｎａｌの特徴量ＣＭ＿ｏｒｉｇｉｎａｌとして利用可能な符号化情報ＥＩ＿ｏｒｉｇｉｎａｌを生成する。更に、符号化部１１１は、後に復号可能になるように検出対象画像ＩＭＧ＿ｔａｒｇｅｔを圧縮符号化することで、検出対象画像ＩＭＧ＿ｔａｒｇｅｔの特徴量ＣＭ＿ｔａｒｇｅｔとして利用可能な符号化情報ＥＩ＿ｔａｒｇｅｔを生成する。

　物体検出部１１２は、符号化部１１１が生成した特徴量ＣＭ＿ｏｒｉｇｉｎａ及び特徴量ＣＭ＿ｔａｒｇｅｔに基づいて、元画像ＩＭＧ＿ｏｒｉｇｉｎａｌ内において検出対象物体を検出する。

　本実施形態では、符号化部１１１は、機械学習によって生成される演算モデルを用いて、符号化情報ＥＩ＿ｏｒｉｇｉｎａｌ及びＥＩ＿ｔａｒｇｅｔ（つまり、特徴量ＣＭ＿ｏｒｉｇｉｎａｌ及びＣＭ＿ｔａｒｇｅｔ）を生成する。更に、物体検出部１１２は、機械学習によって生成される演算モデルを用いて、元画像ＩＭＧ＿ｏｒｉｇｉｎａｌ内において検出対象物体を検出する。

　演算モデルは、圧縮符号化モデルと、物体検出モデルとを含んでいてもよい。圧縮符号化モデルは、主として符号化情報ＥＩ＿ｏｒｉｇｉｎａｌ及びＥＩ＿ｔａｒｇｅｔ（つまり、特徴量ＣＭ＿ｏｒｉｇｉｎａ及びＣＭ＿ｔａｒｇｅｔ）を生成するためのモデルであってもよい。物体検出モデルは、主として特徴量ＣＭ＿ｏｒｉｇｉｎａ及びＣＭ＿ｔａｒｇｅｔ（つまり、符号化情報ＥＩ＿ｏｒｉｇｉｎａｌ及びＥＩ＿ｔａｒｇｅｔ）に基づいて、元画像ＩＭＧ＿ｏｒｉｇｉｎａｌ内において検出対象物体を検出するためのモデルであってもよい。

　機械学習によって生成される演算モデルの一例として、ニューラルネットワークＮＮがあげられる。符号化部１１１及び物体検出部１１２が用いるニューラルネットワークＮＮの一例が、図３に模式的に示されている。図３に示すように、ニューラルネットワークＮＮは、「第１モデル部分」の一具体例であるネットワーク部分ＮＮ１と、「第２モデル部分」の一具体例であるネットワーク部分ＮＮ２とを含む。

　ネットワーク部分ＮＮ１は、主として符号化情報ＥＩ＿ｏｒｉｇｉｎａｌ及びＥＩ＿ｔａｒｇｅｔ（つまり、特徴量ＣＭ＿ｏｒｉｇｉｎａｌ及びＣＭ＿ｔａｒｇｅｔ）を生成するために、符号化部１１１によって用いられる。つまり、ネットワーク部分ＮＮ１は、上述した圧縮符号化モデルを実現するためのニューラルネットワークである。ネットワーク部分ＮＮ１は、入力画像が入力された場合に、後に復号可能になるように圧縮符号化された入力画像であって且つ入力画像の特徴量として利用可能な符号化情報を出力可能である。このため、ネットワーク部分ＮＮ１に元画像ＩＭＧ＿ｏｒｉｇｉｎａｌが入力された場合には、ネットワーク部分ＮＮ１は、符号化情報ＥＩ＿ｏｒｉｇｉｎａｌ（つまり、特徴量ＣＭ＿ｏｒｉｇｉｎａｌ）を出力する。ネットワーク部分ＮＮ１に検出対象画像ＩＭＧ＿ｔａｒｇｅｔが入力された場合には、ネットワーク部分ＮＮ１は、符号化情報ＥＩ＿ｔａｒｇｅｔ（つまり、特徴量ＣＭ＿ｔａｒｇｅｔ）を出力する。

　ネットワーク部分ＮＮ１は、所望の圧縮符号化方法に準拠したニューラルネットワークを含んでいてもよい。例えば、オートエンコーダのうちのエンコーダ部分が、ネットワーク部分ＮＮ１として用いられてもよい。この場合、情報処理装置２は、オートエンコーダのうちのデコード部分を用いて、符号化情報ＥＩ＿ｏｒｉｇｉｎａｌから復元画像ＩＭＧ＿ｄｅｃを生成してもよい。

　ネットワーク部分ＮＮ２は、主として元画像ＩＭＧ＿ｏｒｉｇｉｎａｌ内において検出対象物体を検出するために、物体検出部１１２によって用いられる。つまり、ネットワーク部分ＮＮ２は、上述した物体検出モデルを実現するためのニューラルネットワークである。ネットワーク部分ＮＮ２は、一の画像の特徴量と他の画像の特徴量とが入力された場合に、一の画像内において他の画像が示す物体の検出結果を出力する。ネットワーク部分ＮＮ２には、ネットワーク部分ＮＮ１の出力である特徴量ＣＭ＿ｏｒｉｇｉｎａｌ及びＣＭ＿ｔａｒｇｅｔが入力される。この場合、ネットワーク部分ＮＮ２は、元画像ＩＭＧ＿ｏｒｉｇｉｎａｌ内において検出対象画像ＩＭＧ＿ｔａｒｇｅｔが示す検出対象物体の検出結果を出力する。例えば、ネットワーク部分ＮＮ２は、元画像ＩＭＧ＿ｏｒｉｇｉｎａｌ内における検出対象物体の存在の有無に関する情報を、検出対象物体の検出結果として出力してもよい。ネットワーク部分ＮＮ２は、元画像ＩＭＧ＿ｏｒｉｇｉｎａｌ内において検出対象画像ＩＭＧ＿ｔａｒｇｅｔが存在する位置（例えば、バウンディングボックスの位置）に関する情報を、検出対象物体の検出結果として出力してもよい。

　ネットワーク部分ＮＮ２は、二つの画像を用いて物体を検出するための所望の物体検出方法に準拠したニューラルネットワークを含んでいてもよい。例えば、二つの画像を用いて物体を検出するための所望の物体検出方法に準拠したニューラルネットワークの一例として、ＳｉａｍＲＰＮ（Ｓｉａｍｅｓｅ　Ｒｅｇｉｏｎ　Ｐｒｏｐｏｓａｌ　Ｎｅｔｗｏｒｋ）があげられる。

　再び図２において、送信制御部１１３は、通信装置１３を用いて、符号化部１１１が生成した符号化情報ＥＩ＿ｏｒｉｇｉｎａｌを情報処理装置２に送信する。より具体的には、図３に示すように、送信制御部１１３は、通信装置１３を用いて、ネットワーク部分ＮＮ１が出力した符号化情報ＥＩ＿ｏｒｉｇｉｎａｌを情報処理装置２に送信する。更に、送信制御部１１３は、通信装置１３を用いて、符号化部１１１が生成した符号化情報ＥＩ＿ｔａｒｇｅｔを情報処理装置２に送信してもよい。より具体的には、図３に示すように、送信制御部１１３は、通信装置１３を用いて、ネットワーク部分ＮＮ１が出力した符号化情報ＥＩ＿ｔａｒｇｅｔを情報処理装置２に送信してもよい。

　記憶装置１２は、所望のデータを記憶可能である。例えば、記憶装置１２は、演算装置１１が実行するコンピュータプログラムを一時的に記憶していてもよい。記憶装置１２は、演算装置１１がコンピュータプログラムを実行している際に演算装置１１が一時的に使用するデータを一時的に記憶してもよい。記憶装置１２は、物体検出装置１が長期的に保存するデータを記憶してもよい。尚、記憶装置１２は、ＲＡＭ（Ｒａｎｄｏｍ　Ａｃｃｅｓｓ　Ｍｅｍｏｒｙ）、ＲＯＭ（Ｒｅａｄ　Ｏｎｌｙ　Ｍｅｍｏｒｙ）、ハードディスク装置、光磁気ディスク装置、ＳＳＤ（Ｓｏｌｉｄ　Ｓｔａｔｅ　Ｄｒｉｖｅ）及びディスクアレイ装置のうちの少なくとも一つを含んでいてもよい。つまり、記憶装置１２は、一時的でない記録媒体を含んでいてもよい。

　通信装置１３は、通信回線３を介して、情報処理装置２と通信可能である。本実施形態では、通信装置１３は、送信制御部１１３の制御下で、通信回線３を介して、符号化情報ＥＩ＿ｏｒｉｇｉｎａｌを情報処理装置２に送信する。更に、通信装置１３は、送信制御部１１３の制御下で、通信回線３を介して、符号化情報ＥＩ＿ｔａｒｇｅｔを情報処理装置２に送信してもよい。

　入力装置１４は、物体検出装置１の外部からの物体検出装置１に対する情報の入力を受け付ける装置である。例えば、入力装置１４は、物体検出装置１のオペレータが操作可能な操作装置（例えば、キーボード、マウス及びタッチパネルのうちの少なくとも一つ）を含んでいてもよい。例えば、入力装置１４は、物体検出装置１に対して外付け可能な記録媒体にデータとして記録されている情報を読み取り可能な読取装置を含んでいてもよい。

　出力装置１５は、物体検出装置１の外部に対して情報を出力する装置である。例えば、出力装置１５は、情報を画像として出力してもよい。つまり、出力装置１５は、出力したい情報を示す画像を表示可能な表示装置（いわゆる、ディスプレイ）を含んでいてもよい。例えば、出力装置１５は、情報を音声として出力してもよい。つまり、出力装置１５は、音声を出力可能な音声装置（いわゆる、スピーカ）を含んでいてもよい。例えば、出力装置１５は、紙面に情報を出力してもよい。つまり、出力装置１５は、紙面に所望の情報を印刷可能な印刷装置（いわゆる、プリンタ）を含んでいてもよい。

　＜１－３＞情報処理装置２の構成
　続いて、図４を参照しながら、情報処理装置２の構成について説明する。図４は、情報処理装置２の構成を示すブロック図である。

　図４に示すように、情報処理装置２は、演算装置２１と、記憶装置２２と、通信装置２３とを備えている。更に、情報処理装置２は、入力装置２４と、出力装置２５とを備えていてもよい。但し、情報処理装置２は、入力装置２４及び出力装置２５のうちの少なくとも一つを備えていなくてもよい。演算装置２１と、記憶装置２２と、通信装置２３と、入力装置２４と、出力装置２５とは、データバス２６を介して接続されていてもよい。

　演算装置２１は、例えば、ＣＰＵ、ＧＰＵ及びＦＰＧＡのうちの少なくとも一つを含む。演算装置２１は、コンピュータプログラムを読み込む。例えば、演算装置２１は、記憶装置２２が記憶しているコンピュータプログラムを読み込んでもよい。例えば、演算装置２１は、コンピュータで読み取り可能であって且つ一時的でない記録媒体が記憶しているコンピュータプログラムを、情報処理装置２が備える図示しない記録媒体読み取り装置を用いて読み込んでもよい。演算装置２１は、通信装置２３（或いは、その他の通信装置）を介して、情報処理装置２の外部に配置される不図示の装置からコンピュータプログラムを取得してもよい（つまり、ダウンロードしてもよい又は読み込んでもよい）。演算装置２１は、読み込んだコンピュータプログラムを実行する。その結果、演算装置２１内には、情報処理装置２が行うべき動作を実行するための論理的な機能ブロックが実現される。つまり、演算装置２１は、情報処理装置２が行うべき動作を実行するための論理的な機能ブロックを実現するためのコントローラとして機能可能である。

　図４には、演算装置２１内に実現される論理的な機能ブロックの一例が示されている。図４に示すように、演算装置２１内には、情報取得部２１１と、処理部２１２とが実現される。情報取得部２１１は、通信装置２３を用いて、物体検出装置１から送信された符号化情報ＥＩ＿ｏｒｉｇｉｎａｌを受信する（つまり、取得する）。処理部２１２は、符号化情報ＥＩ＿ｏｒｉｇｉｎａｌを用いた所定動作を行う。本実施形態では、処理部２１２は、情報取得部２１１が取得した符号化情報ＥＩ＿ｏｒｉｇｉｎａｌを復号化することで復元画像ＩＭＧ＿ｄｅｃを生成する復号動作を行う。更に、処理部２１２は、復元画像ＩＭＧ＿ｄｅｃを解析する画像解析動作を行ってもよい。

　記憶装置２２は、所望のデータを記憶可能である。例えば、記憶装置２２は、演算装置２１が実行するコンピュータプログラムを一時的に記憶していてもよい。記憶装置２２は、演算装置２１がコンピュータプログラムを実行している際に演算装置２１が一時的に使用するデータを一時的に記憶してもよい。記憶装置２２は、情報処理装置２が長期的に保存するデータを記憶してもよい。尚、記憶装置２２は、ＲＡＭ、ＲＯＭ、ハードディスク装置、光磁気ディスク装置、ＳＳＤ及びディスクアレイ装置のうちの少なくとも一つを含んでいてもよい。つまり、記憶装置２２は、一時的でない記録媒体を含んでいてもよい。

　通信装置２３は、通信回線３を介して、物体検出装置１と通信可能である。本実施形態では、通信装置２３は、情報取得部２１１の制御下で、通信回線３を介して、物体検出装置１から符号化情報ＥＩ＿ｏｒｉｇｉｎａｌを受信（つまり、取得）してもよい。

　入力装置２４は、情報処理装置２の外部からの情報処理装置２に対する情報の入力を受け付ける装置である。例えば、入力装置２４は、情報処理装置２のオペレータが操作可能な操作装置（例えば、キーボード、マウス及びタッチパネルのうちの少なくとも一つ）を含んでいてもよい。例えば、入力装置２４は、情報処理装置２に対して外付け可能な記録媒体にデータとして記録されている情報を読み取り可能な読取装置を含んでいてもよい。

　出力装置２５は、情報処理装置２の外部に対して情報を出力する装置である。例えば、出力装置２５は、情報を画像として出力してもよい。つまり、出力装置２５は、出力したい情報を示す画像を表示可能な表示装置（いわゆる、ディスプレイ）を含んでいてもよい。例えば、出力装置２５は、情報を音声として出力してもよい。つまり、出力装置２５は、音声を出力可能な音声装置（いわゆる、スピーカ）を含んでいてもよい。例えば、出力装置２５は、紙面に情報を出力してもよい。つまり、出力装置２５は、紙面に所望の情報を印刷可能な印刷装置（いわゆる、プリンタ）を含んでいてもよい。

　＜２＞物体検出システムＳＹＳの動作
　続いて、図５を参照しながら、物体検出システムＳＹＳの行う動作について説明する。図５は、物体検出システムＳＹＳの行う動作の流れを示すフローチャートである。

　図５に示すように、物体検出装置１（特に、符号化部１１１）は、元画像ＩＭＧ＿ｏｒｉｇｉｎａｌを取得する（ステップＳ１１）。例えば、物体検出装置１は、画像生成装置の一具体例であるカメラから、元画像ＩＭＧ＿ｏｒｉｇｉｎａｌを取得してもよい。この場合、物体検出装置１は、カメラが元画像ＩＭＧ＿ｏｒｉｇｉｎａｌを生成する都度、カメラから、元画像ＩＭＧ＿ｏｒｉｇｉｎａｌを取得してもよい。物体検出装置１は、カメラから、時系列データとしての複数の元画像ＩＭＧ＿ｏｒｉｇｉｎａｌを取得してもよい。この場合、各元画像ＩＭＧ＿を用いて図５に示す動作が行われる。

　更に、物体検出装置１（特に、符号化部１１１）は、検出対象画像ＩＭＧ＿ｔａｒｇｅｔを取得する（ステップＳ１１）。例えば、検出対象画像ＩＭＧ＿ｔａｒｇｅｔが記憶装置１２に記憶されている場合には、物体検出装置１は、記憶装置１２から検出対象画像ＩＭＧ＿ｔａｒｇｅｔを取得してもよい。例えば、物体検出装置１に対して外付け可能な記録媒体に検出対象画像ＩＭＧ＿ｔａｒｇｅｔが記録されている場合には、物体検出装置１は、物体検出装置１が備える記録媒体読取装置（例えば、入力装置１４）を用いて、記録媒体から検出対象画像ＩＭＧ＿ｔａｒｇｅｔを取得してもよい。例えば、物体検出装置１の外部の装置（例えば、サーバ）に検出対象画像ＩＭＧ＿ｔａｒｇｅｔが記録されている場合には、物体検出装置１は、通信装置１３を用いて、外部の装置から検出対象画像ＩＭＧ＿ｔａｒｇｅｔを取得してもよい。

　尚、検出対象物体が変わらない場合には、物体検出装置１は、検出対象画像ＩＭＧ＿ｔａｒｇｅｔを一旦取得した後に、検出対象画像ＩＭＧ＿ｔａｒｇｅｔを改めて取得しなくてもよい。言い換えれば、物体検出装置１は、検出対象物体が変わる場合に、検出対象画像ＩＭＧ＿ｔａｒｇｅｔを取得してもよい。

　その後、物体検出装置１（特に、符号化部１１１）は、後に復号可能になるように元画像ＩＭＧ＿ｏｒｉｇｉｎａｌを圧縮符号化することで、元画像ＩＭＧ＿ｏｒｉｇｉｎａｌの特徴量ＣＭ＿ｏｒｉｇｉｎａｌとして利用可能な符号化情報ＥＩ＿ｏｒｉｇｉｎａｌを生成する（ステップＳ１２）。更に、物体検出装置１（特に、符号化部１１１）は、後に復号可能になるように検出対象画像ＩＭＧ＿ｔａｒｇｅｔを圧縮符号化することで、検出対象画像ＩＭＧ＿ｔａｒｇｅｔの特徴量ＣＭ＿ｔａｒｇｅｔとして利用可能な符号化情報ＥＩ＿ｔａｒｇｅｔを生成する（ステップＳ１２）。

　その後、物体検出装置１（特に、物体検出部１１２）は、ステップＳ１２において生成された特徴量ＣＭ＿ｏｒｉｇｉｎａｌ及びＣＭ＿ｔａｒｇｅｔに基づいて、元画像ＩＭＧ＿ｏｒｉｇｉｎａｌ内において検出対象物体を検出する（ステップＳ１３）。検出対象物体を検出する動作は、元画像ＩＭＧ＿ｏｒｉｇｉｎａｌ内において検出対象物体を含む所望形状の領域（例えば、矩形状の領域であり、いわゆるバウンディングボックス）を検出する動作を含んでいてもよい。検出対象物体を検出する動作は、元画像ＩＭＧ＿ｏｒｉｇｉｎａｌ内において検出対象物体を含む所望形状の領域の位置（例えば、座標値）を検出する動作を含んでいてもよい。検出対象物体を検出する動作は、元画像ＩＭＧ＿ｏｒｉｇｉｎａｌ内における検出対象物体の特性（例えば、色、形状、サイズ及び向きの少なくとも一つ）を検出する動作を含んでいてもよい。

　ステップＳ１３における検出対象物体の検出結果は、所望の用途で用いられてもよい。例えば、上述したように、ステップＳ１３における検出対象物体の検出結果は、ＡＲの用途で用いられてもよい。つまり、ステップＳ１３における検出対象物体の検出結果は、検出対象物体の位置に仮想物体を配置する用途で用いられてもよい。

　ステップＳ１３の動作と並行して又は相前後して、物体検出装置１（特に、送信制御部１１３）は、通信装置１３を用いて、ステップＳ１２において生成された符号化情報ＥＩ＿ｏｒｉｇｉｎａｌを情報処理装置２に送信する（ステップＳ１４）。ここで、符号化情報ＥＩ＿ｏｒｉｇｉｎａｌが圧縮符号化された元画像ＩＭＧ＿ｏｒｉｇｉｎａｌであるがゆえに、符号化情報ＥＩ＿ｏｒｉｇｉｎａｌのデータサイズは、元画像ＩＭＧ＿ｏｒｉｇｉｎａｌのデータサイズよりも小さい。このため、元画像ＩＭＧ＿ｏｒｉｇｉｎａｌが通信回線３を介して情報処理装置２に送信される場合と比較して、通信回線３における帯域の制約を満たす可能性が高くなる。つまり、通信回線３における帯域が相対的に狭い（つまり、単位時間当たりに送信可能なデータ量が相対的に少ない）場合であっても、物体検出装置１は、符号化情報ＥＩ＿ｏｒｉｇｉｎａｌを情報処理装置２に送信することができる。

　その結果、情報処理装置２（特に、情報取得部２１１）は、通信装置２３を用いて、物体検出装置１から送信された符号化情報ＥＩ＿ｏｒｉｇｉｎａｌを受信する（ステップＳ２１）。その後、情報処理装置２（特に、処理部２１２）は、符号化情報ＥＩ＿ｏｒｉｇｉｎａｌを用いた所定動作を行う（ステップＳ２２）。例えば、処理部２１２は、情報取得部２１１が取得した符号化情報ＥＩ＿ｏｒｉｇｉｎａｌを復号化することで復元画像ＩＭＧ＿ｄｅｃを生成する復号動作を行ってもよい。処理部２１２は、復元画像ＩＭＧ＿ｄｅｃを解析する画像解析動作を行ってもよい。

　＜３＞機械学習による演算モデルの生成
　続いて、図６を参照しながら、物体検出装置１が用いる演算モデルを生成するための機械学習について説明する。図６は、物体検出装置１が用いる演算モデルを生成するための機械学習を概念的に示す。尚、以下の説明では、説明の便宜上、演算モデルが図３のニューラルネットワークＮＮである場合に行われる機械学習について説明する。しかしながら、演算モデルが図３のニューラルネットワークＮＮとは異なる場合であっても、以下に説明する機械学習によって演算モデルが生成されてもよい。

　ニューラルネットワークＮＮは、学習用の画像（以降、“学習画像ＩＭＧ＿ｌｅａｒｎ＿ｏｒｉｇｉｎａｌ”と称する）と、学習画像ＩＭＧ＿ｌｅａｒｎ＿ｏｒｉｇｉｎａｌ内における検出対象物体の検出結果の正解ラベルｙ＿ｌｅａｒｎとが関連付けられた学習データを複数含む学習データセットを用いた機械学習によって生成される。更に、ニューラルネットワークＮＮが一旦生成された後においても、ニューラルネットワークＮＮは、新たな学習データを含む学習データセットを用いた機械学習によって適宜更新されてもよい。

　ニューラルネットワークＮＮを生成又は更新するために、初期の又は生成済みのニューラルネットワークＮＮに含まれるネットワーク部分ＮＮ１（つまり、圧縮符号化モデル）に対して、学習データに含まれる学習画像ＩＭＧ＿ｌｅａｒｎ＿ｏｒｉｇｉｎａｌが入力される。その結果、ネットワーク部分ＮＮ１は、後に復号可能になるように学習画像ＩＭＧ＿ｌｅａｒｎ＿ｏｒｉｇｉｎａｌを圧縮符号化することで、圧縮符号化された学習画像ＩＭＧ＿ｌｅａｒｎ＿ｏｒｉｇｉｎａｌであって且つ学習画像ＩＭＧ＿ｌｅａｒｎ＿ｏｒｉｇｉｎａｌの特徴量ＣＭ＿ｌｅａｒｎ＿ｏｒｉｇｉｎａｌとして利用可能な符号化情報ＥＩ＿ｌｅａｒｎを出力する。更に、初期の又は生成済みのニューラルネットワークＮＮに含まれるネットワーク部分ＮＮ１に対して、学習用の検出対象物体を示す学習用の検出対象画像（以降、“検出対象画像ＩＭＧ＿ｌｅａｒｎ＿ｔａｒｇｅｔ”と称する）が入力される。その結果、ネットワーク部分ＮＮ１は、後に復号可能になるように検出対象画像ＩＭＧ＿ｌｅａｒｎ＿ｔａｒｇｅｔを圧縮符号化することで、圧縮符号化された検出対象画像ＩＭＧ＿ｌｅａｒｎ＿ｔａｒｇｅｔであって且つ検出対象画像ＩＭＧ＿ｌｅａｒｎ＿ｔａｒｇｅｔの特徴量ＣＭ＿ｌｅａｒｎ＿ｔａｒｇｅｔとして利用可能な符号化情報ＥＩ＿ｌｅａｒｎ＿ｔａｒｇｅｔを出力する。

　その後、初期の又は生成済みのニューラルネットワークＮＮに含まれるネットワーク部分ＮＮ２（つまり、物体検出モデル）に対して、ネットワーク部分ＮＮ１の出力（つまり、特徴量ＣＭ＿ｌｅａｒｎ＿ｏｒｉｇｉｎａｌ及びＣＭ＿ｌｅａｒｎ＿ｔａｒｇｅｔ）が入力される。その結果、ネットワーク部分ＮＮ２は、学習画像ＩＭＧ＿ｌｅａｒｎ＿ｏｒｉｇｉｎａｌ内における検出対象物体の実際の検出結果ｙを出力する。更に、ネットワーク部分ＮＮ２が出力した符号化情報ＥＩ＿ｌｅａｒｎ＿ｏｒｉｇｉｎａｌは、復号化される。その結果、復元画像ＩＭＧ＿ｌｅａｒｎ＿ｄｅｃが生成される。

　以上の動作が、学習データセットに含まれる複数の学習データ（或いは、それらの一部）を対象に繰り返される。更に、複数の学習データ（或いは、それらの一部）を対象に行う動作が、複数の検出対象画像ＩＭＧ＿ｌｅａｒｎ＿ｔａｒｇｅｔを対象に繰り返されてもよい。

　その後、検出対象物体の検出に関する損失関数Ｌｏｓｓ１と、圧縮符号化及び復号化に関する損失関数Ｌｏｓｓ２とを含む損失関数Ｌｏｓｓを用いて、ニューラルネットワークＮＮが生成又は更新される。損失関数Ｌｏｓｓ１は、ネットワーク部分ＮＮ２の出力ｙ（つまり、ネットワーク部分ＮＮ２による、学習画像ＩＭＧ＿ｌｅａｒｎ＿ｏｒｉｇｉｎａｌ内における検出対象物体の実際の検出結果）と正解ラベルｙ＿ｌｅａｒｎとの誤差に関する損失関数である。例えば、損失関数Ｌｏｓｓ１は、ネットワーク部分ＮＮ２の出力ｙと正解ラベルｙ＿ｌｅａｒｎとの誤差が小さくなるほど小さくなる損失関数であってもよい。一方で、損失関数Ｌｏｓｓ２は、復元画像ＩＭＧ＿ｌｅａｒｎ＿ｄｅｃと学習画像ＩＭＧ＿ｌｅａｒｎ＿ｏｒｉｇｉｎａｌとの誤差に関する損失関数である。例えば、損失関数Ｌｏｓｓ２は、復元画像ＩＭＧ＿ｌｅａｒｎ＿ｄｅｃと学習画像ＩＭＧ＿ｌｅａｒｎ＿ｏｒｉｇｉｎａｌとの誤差が小さくなるほど小さくなる損失関数であってもよい。

　ニューラルネットワークＮＮは、損失関数Ｌｏｓｓが最小になるように生成又は更新されてもよい。この場合、ニューラルネットワークＮＮは、機械学習を行うための既存のアルゴリズムを用いて、損失関数Ｌｏｓｓが最小になるように生成又は更新されてもよい。例えば、ニューラルネットワークＮＮは、誤差逆伝搬法を用いて、損失関数Ｌｏｓｓが最小になるように生成又は更新されてもよい。その結果、ニューラルネットワークＮＮが生成又は更新される。

　＜４＞物体検出システムＳＹＳの技術的効果
　以上説明したように、本実施形態では、物体検出装置１は、元画像ＩＭＧ＿ｏｒｉｇｉｎａｌを圧縮符号化することで、元画像ＩＭＧ＿ｏｒｉｇｉｎａｌの特徴量ＣＭ＿ｏｒｉｇｉｎａｌとして利用可能な符号化情報ＥＩ＿ｏｒｉｇｉｎａｌを生成する。つまり、物体検出装置１は、特徴量ＣＭ＿ｏｒｉｇｉｎａｌを生成する動作と、符号化情報ＥＩ＿ｏｒｉｇｉｎａｌを生成する動作とを別個独立に行わなくてもよい。物体検出装置１は、符号化情報ＥＩ＿ｏｒｉｇｉｎａｌとは別個独立に特徴量ＣＭ＿ｏｒｉｇｉｎａｌを生成する動作を行わなくてもよい。物体検出装置１は、特徴量ＣＭ＿ｏｒｉｇｉｎａｌとは別個独立に符号化情報ＥＩ＿ｏｒｉｇｉｎａｌを生成する動作を行わなくてもよい。このため、元画像ＩＭＧ＿ｏｒｉｇｉｎａｌを圧縮し且つ元画像ＩＭＧ＿ｏｒｉｇｉｎａｌ内において検出対象物体を検出するための処理負荷が低減可能となる。

　具体的には、特徴量ＣＭ＿ｏｒｉｇｉｎａｌとして利用可能な符号化情報ＥＩ＿ｏｒｉｇｉｎａｌを生成しない比較例の物体検出装置は、図７に示すように、特徴量ＣＭ＿ｏｒｉｇｉｎａｌを生成する動作と符号化情報ＥＩ＿ｏｒｉｇｉｎａｌを生成する動作とを別個独立に行う必要がある。図７に示す例では、比較例の物体検出装置は、符号化情報ＥＩ＿ｏｒｉｇｉｎａｌとは別個独立に特徴量ＣＭ＿ｏｒｉｇｉｎａｌを生成するためのネットワーク部分ＮＮ３と、特徴量ＣＭ＿ｏｒｉｇｉｎａｌとは別個独立に符号化情報ＥＩ＿ｏｒｉｇｉｎａｌを生成するためのネットワーク部分ＮＮ４と、特徴量ＣＭ＿ｏｒｉｇｉｎａｌに基づいて検出対象物体を検出するためのネットワーク部分ＮＮ２とを含むニューラルネットワークＮＮ’を用いて、元画像ＩＭＧ＿ｏｒｉｇｉｎａｌを圧縮し且つ元画像ＩＭＧ＿ｏｒｉｇｉｎａｌ内において検出対象物体を検出している。このような比較例の物体検出装置に対して、本実施形態の物体検出装置１は、ネットワーク部分ＮＮ３及びＮＮ４のいずれか一方を備えていなくてもよい。このため、物体検出装置１が用いるニューラルネットワークＮＮの構造は、比較例の物体検出装置が用いるニューラルネットワークＮＮ’の構造よりも簡略化される。つまり、物体検出装置１が用いる演算モデルの構造は、比較例の物体検出装置が用いる演算モデルの構造よりも簡略化される。その結果、本実施形態では、比較例と比較して、元画像ＩＭＧ＿ｏｒｉｇｉｎａｌを圧縮し且つ元画像ＩＭＧ＿ｏｒｉｇｉｎａｌの特徴量ＣＭ＿ｏｒｉｇｉｎａｌを生成するための処理負荷が低減可能となる。つまり、本実施形態では、比較例と比較して、元画像ＩＭＧ＿ｏｒｉｇｉｎａｌを圧縮し且つ元画像ＩＭＧ＿ｏｒｉｇｉｎａｌ内において検出対象物体を検出するための処理負荷が低減可能となる。

　また、ニューラルネットワークＮＮ（つまり、演算モデル）は、検出対象物体の検出に関する損失関数Ｌｏｓｓ１と圧縮符号化及び復号化に関する損失関数Ｌｏｓｓ２とを含む損失関数Ｌｏｓｓを用いた機械学習により、生成される。このため、圧縮した元画像ＩＭＧ＿ｏｒｉｇｉｎａｌであって且つ元画像ＩＭＧ＿ｏｒｉｇｉｎａｌの特徴量ＣＭ＿ｏｒｉｇｉｎａｌとして利用可能な符号化情報ＥＩ＿ｏｒｉｇｉｎａｌを適切に生成可能な演算モデルが生成される。その結果、物体検出装置１は、このように生成される演算モデルを用いて元画像ＩＭＧ＿ｏｒｉｇｉｎａｌを圧縮符号化することで、圧縮した元画像ＩＭＧ＿ｏｒｉｇｉｎａｌであって且つ元画像ＩＭＧ＿ｏｒｉｇｉｎａｌの特徴量ＣＭ＿ｏｒｉｇｉｎａｌとして利用可能な符号化情報ＥＩ＿ｏｒｉｇｉｎａｌを適切に生成することができる。

　＜５＞変形例
　上述した説明では、物体検出装置１は、情報処理装置２に符号化情報ＥＩ＿ｏｒｉｇｉｎａｌを送信している。しかしながら、物体検出装置１は、情報処理装置２に符号化情報ＥＩ＿ｏｒｉｇｉｎａｌを送信しなくてもよい。例えば、物体検出装置１は、符号化情報ＥＩ＿ｏｒｉｇｉｎａｌを、記憶装置１２に格納してもよい。この場合、図８に示すように、物体検出装置１は、送信制御部１１３を備えていなくてもよい。

　上述した説明では、物体検出装置１は、元画像ＩＭＧ＿ｏｒｉｇｉｎａｌと検出対象画像ＩＭＧ＿ｔａｒｇｅｔとを用いて、検出対象画像ＩＭＧ＿ｔａｒｇｅｔが示す検出対象物体を、元画像ＩＭＧ＿ｏｒｉｇｉｎａｌ内において検出している。しかしながら、物体検出装置１は、検出対象画像ＩＭＧ＿ｔａｒｇｅｔを用いることなく、元画像ＩＭＧ＿ｏｒｉｇｉｎａｌ内において検出対象物体を検出してもよい。例えば、物体検出装置１は、物体を検出するべき画像を用いて物体を検出するための所望の物体検出方法に準拠した演算モデルを用いて、対象物体を検出してもよい。物体を検出するべき画像を用いて物体を検出するための所望の物体検出方法に準拠した演算モデルの一例として、ＹＯＬＯ（Ｙｏｕ　Ｏｎｌｙ　Ｌｏｏｋ　Ｏｎｃｅ）に準拠した演算モデルがあげられる。この場合においても、物体検出装置１は、後に復号可能になるように元画像ＩＭＧ＿ｏｒｉｇｉｎａｌを圧縮符号化することで、圧縮符号化された元画像ＩＭＧ＿ｏｒｉｇｉｎａｌであって且つ元画像ＩＭＧ＿ｏｒｉｇｉｎａｌの特徴量ＣＭ＿ｏｒｉｇｉｎａｌとして利用可能な符号化情報ＥＩ＿ｏｒｉｇｉｎａｌを生成してもよい。その結果、物体検出装置１は、上述した効果を享受することができる。

　一例として、上述したＹＯＬＯに準拠した演算モデルが用いられる場合には、ＹＯＬＯに準拠した演算モデルの中間層の出力が復号可能となるように、ＹＯＬＯに準拠した演算モデルの機械学習が行われてもよい。つまり、出力を後に復号可能となる中間層を含むように、ＹＯＬＯに準拠しつつもＹＯＬＯを拡張した演算モデルを生成するための機械学習が行われてもよい。その結果、ＹＯＬＯに準拠した演算モデルの中間層は、物体検出用の特徴量として利用可能であって且つ後に復号可能な符号化情報を出力可能となる。このため、ＹＯＬＯに準拠した演算モデルを用いて物体検出を行う物体検出装置１であっても、上述した効果を享受することができる。

　上述した説明では、情報処理装置２は、所定動作の一例として、符号化情報ＥＩ＿ｏｒｉｇｉｎａｌを復号化することで復元画像ＩＭＧ＿ｄｅｃを生成する復号動作と、復元画像ＩＭＧ＿ｄｅｃを解析する画像解析動作とを行っている。しかしながら、情報処理装置２は、復号動作及び画像解析動作とは異なる動作を行ってもよい。例えば、情報処理装置２は、物体検出装置１から受信した符号化情報ＥＩ＿ｏｒｉｇｉｎａｌを記憶装置２２に格納する動作を行ってもよい。例えば、情報処理装置２は、符号化情報ＥＩ＿ｏｒｉｇｉｎａｌから生成した復元画像ＩＭＧ＿ｄｅｃを記憶装置２２に格納する動作を行ってもよい。

　＜６＞付記
　以上説明した実施形態に関して、更に以下の付記を開示する。
［付記１］
　画像生成装置から取得した第１画像及び検出対象物体を示す第２画像の夫々を、物体検出を可能とする特徴量を抽出するように且つ後に復号可能になるように圧縮符号化することで、圧縮符号化された前記第１画像であって且つ前記第１画像の前記特徴量である第１特徴量として利用可能な第１符号化情報及び圧縮符号化された前記第２画像であって且つ前記第２画像の前記特徴量である第２特徴量として利用可能な第２符号化情報を生成する生成手段と、
　前記第１及び第２特徴量を用いて、前記第１画像内において前記検出対象物体を検出する検出手段と
　を備える物体検出装置。
［付記２］
　通信回線を介して、前記第１符号化情報を、前記第１符号化情報を用いた所定動作を行う情報処理装置に送信する送信手段を更に備える
　付記１に記載の物体検出装置。
［付記３］
　前記所定動作は、前記第１符号化情報を復号化することで第３画像を生成する第１動作、前記第３画像を解析する第２動作、及び、前記第１符号化情報を記憶装置に格納する第３動作及び前記第３画像を記憶装置に格納する第４動作の少なくとも一つを含む
　付記２に記載の物体検出装置。
［付記４］
　前記生成手段は、機械学習によって生成される演算モデルのうちの前記第１及び第２画像が入力された場合に前記第１及び第２符号化情報を出力する第１モデル部分を用いて、前記第１及び第２特徴量として夫々利用可能な前記第１及び第２符号化情報を生成し、
　前記検出手段は、前記演算モデルのうちの前記第１及び第２特徴量が入力された場合に前記第１画像内における前記検出対象物体の検出結果を出力する第２モデル部分を用いて、前記検出対象物体を検出し、
　前記演算モデルは、学習用の第４画像が入力された前記演算モデルのうちの第２モデル部分が出力する前記検出対象物体の検出結果と、前記第４画像内における前記検出対象物体の検出結果の正解ラベルとの誤差に基づく第１損失関数、及び、前記第４画像が入力された前記演算モデルのうちの前記第１モデル部分が出力する前記第１符号化情報を復号化することで生成される第３画像と前記第４画像との誤差に基づく第２損失関数とを用いた機械学習によって生成される
　付記１から３のいずれか一項に記載の物体検出装置。
［付記５］
　前記演算モデルは、ニューラルネットワークを含み、
　前記第１モデル部分は、オートエンコーダのうちのエンコーダ部分を含み、
　付記４に記載の物体検出装置。
［付記６］
　物体検出装置と、情報処理装置とを備える物体検出システムであって、
　前記物体検出装置は、
　画像生成装置から取得した第１画像及び検出対象物体を示す第２画像の夫々を、物体検出を可能とする特徴量を抽出するように且つ後に復号可能になるように圧縮符号化することで、圧縮符号化された前記第１画像であって且つ前記第１画像の前記特徴量である第１特徴量として利用可能な第１符号化情報及び圧縮符号化された前記第２画像であって且つ前記第２画像の前記特徴量である第２特徴量として利用可能な第２符号化情報を生成する生成手段と、
　前記第１及び第２特徴量を用いて、前記第１画像内において前記検出対象物体を検出する検出手段と、
　通信回線を介して、前記第１符号化情報を前記情報処理装置に送信する送信手段と
　を備え、
　前記情報処理装置は、前記第１符号化情報を用いた所定動作を行う
　物体検出システム。
［付記７］
　画像生成装置から取得した第１画像及び検出対象物体を示す第２画像の夫々を、物体検出を可能とする特徴量を抽出するように且つ後に復号可能になるように圧縮符号化することで、圧縮符号化された前記第１画像であって且つ前記第１画像の前記特徴量である第１特徴量として利用可能な第１符号化情報及び圧縮符号化された前記第２画像であって且つ前記第２画像の前記特徴量である第２特徴量として利用可能な第２符号化情報を生成し、
　前記第１及び第２特徴量を用いて、前記第１画像内において前記検出対象物体を検出する
　物体検出方法。
［付記８］
　コンピュータに、
　画像生成装置から取得した第１画像及び検出対象物体を示す第２画像の夫々を、物体検出を可能とする特徴量を抽出するように且つ後に復号可能になるように圧縮符号化することで、圧縮符号化された前記第１画像であって且つ前記第１画像の前記特徴量である第１特徴量として利用可能な第１符号化情報及び圧縮符号化された前記第２画像であって且つ前記第２画像の前記特徴量である第２特徴量として利用可能な第２符号化情報を生成し、
　前記第１及び第２特徴量を用いて、前記第１画像内において前記検出対象物体を検出する
　物体検出方法を実行させるコンピュータプログラムが記録された記録媒体。

　上述の各実施形態の構成要件の少なくとも一部は、上述の各実施形態の構成要件の少なくとも他の一部と適宜組み合わせることができる。上述の各実施形態の構成要件のうちの一部が用いられなくてもよい。また、法令で許容される限りにおいて、上述のこの開示で引用した全ての文献（例えば、公開公報）の開示を援用してこの開示の記載の一部とする。

　この開示は、請求の範囲及び明細書全体から読み取るこのできる技術的思想に反しない範囲で適宜変更可能である。そのような変更を伴う物体検出装置、物体検出システム、物体検出方法、及び、記録媒体もまた、この開示の技術的思想に含まれる。

　ＳＹＳ　物体検出システム
　１　物体検出装置
　１１　演算装置
　１１１　符号化部
　１１２　物体検出部
　１１３　送信制御部
　２　情報処理装置
　ＩＭＧ＿ｏｒｉｇｉｎａｌ　元画像
　ＩＭＧ＿ｔａｒｇｅｔ　検出対象画像
　ＥＩ＿ｏｒｉｇｉｎａｌ、ＥＩ＿ｔａｒｇｅｔ　符号化情報
　ＣＭ＿ｏｒｉｇｉｎａｌ、ＣＭ＿ｔａｒｇｅｔ　特徴量
　ＮＮ　ニューラルネットワーク
　ＮＮ１、ＮＮ２　ネットワーク部分

Claims

　画像生成装置から取得した第１画像及び検出対象物体を示す第２画像の夫々を、物体検出を可能とする特徴量を抽出するように且つ後に復号可能になるように圧縮符号化することで、圧縮符号化された前記第１画像であって且つ前記第１画像の前記特徴量である第１特徴量として利用可能な第１符号化情報及び圧縮符号化された前記第２画像であって且つ前記第２画像の前記特徴量である第２特徴量として利用可能な第２符号化情報を生成する生成手段と、
　前記第１及び第２特徴量を用いて、前記第１画像内において前記検出対象物体を検出する検出手段と
　を備える物体検出装置。
　通信回線を介して、前記第１符号化情報を、前記第１符号化情報を用いた所定動作を行う情報処理装置に送信する送信手段を更に備える
　請求項１に記載の物体検出装置。
　前記所定動作は、前記第１符号化情報を復号化することで第３画像を生成する第１動作、前記第３画像を解析する第２動作、前記第１符号化情報を記憶装置に格納する第３動作及び前記第３画像を記憶装置に格納する第４動作の少なくとも一つを含む
　請求項２に記載の物体検出装置。
　前記生成手段は、機械学習によって生成される演算モデルのうちの前記第１及び第２画像が入力された場合に前記第１及び第２符号化情報を出力する第１モデル部分を用いて、前記第１及び第２特徴量として夫々利用可能な前記第１及び第２符号化情報を生成し、
　前記検出手段は、前記演算モデルのうちの前記第１及び第２特徴量が入力された場合に前記第１画像内における前記検出対象物体の検出結果を出力する第２モデル部分を用いて、前記検出対象物体を検出し、
　前記演算モデルは、学習用の第４画像が入力された前記演算モデルのうちの第２モデル部分が出力する前記検出対象物体の検出結果と、前記第４画像内における前記検出対象物体の検出結果の正解ラベルとの誤差に基づく第１損失関数、及び、前記第４画像が入力された前記演算モデルのうちの前記第１モデル部分が出力する前記第１符号化情報を復号化することで生成される第３画像と前記第４画像との誤差に基づく第２損失関数とを用いた機械学習によって生成される
　請求項１から３のいずれか一項に記載の物体検出装置。
　前記演算モデルは、ニューラルネットワークを含み、
　前記第１モデル部分は、オートエンコーダのうちのエンコーダ部分を含み、
　請求項４に記載の物体検出装置。
　物体検出装置と、情報処理装置とを備える物体検出システムであって、
　前記物体検出装置は、
　画像生成装置から取得した第１画像及び検出対象物体を示す第２画像の夫々を、物体検出を可能とする特徴量を抽出するように且つ後に復号可能になるように圧縮符号化することで、圧縮符号化された前記第１画像であって且つ前記第１画像の前記特徴量である第１特徴量として利用可能な第１符号化情報及び圧縮符号化された前記第２画像であって且つ前記第２画像の前記特徴量である第２特徴量として利用可能な第２符号化情報を生成する生成手段と、
　前記第１及び第２特徴量を用いて、前記第１画像内において前記検出対象物体を検出する検出手段と、
　通信回線を介して、前記第１符号化情報を前記情報処理装置に送信する送信手段と
　を備え、
　前記情報処理装置は、前記第１符号化情報を用いた所定動作を行う
　物体検出システム。
　画像生成装置から取得した第１画像及び検出対象物体を示す第２画像の夫々を、物体検出を可能とする特徴量を抽出するように且つ後に復号可能になるように圧縮符号化することで、圧縮符号化された前記第１画像であって且つ前記第１画像の前記特徴量である第１特徴量として利用可能な第１符号化情報及び圧縮符号化された前記第２画像であって且つ前記第２画像の前記特徴量である第２特徴量として利用可能な第２符号化情報を生成し、
　前記第１及び第２特徴量を用いて、前記第１画像内において前記検出対象物体を検出する
　物体検出方法。
　コンピュータに、
　画像生成装置から取得した第１画像及び検出対象物体を示す第２画像の夫々を、物体検出を可能とする特徴量を抽出するように且つ後に復号可能になるように圧縮符号化することで、圧縮符号化された前記第１画像であって且つ前記第１画像の前記特徴量である第１特徴量として利用可能な第１符号化情報及び圧縮符号化された前記第２画像であって且つ前記第２画像の前記特徴量である第２特徴量として利用可能な第２符号化情報を生成し、
　前記第１及び第２特徴量を用いて、前記第１画像内において前記検出対象物体を検出する
　物体検出方法を実行させるコンピュータプログラムが記録された記録媒体。