WO2013133057A1

WO2013133057A1 - 画像処理装置および方法、並びにプログラム

Info

Publication number: WO2013133057A1
Application number: PCT/JP2013/054670
Authority: WO
Inventors: 黒木　義彦
Original assignee: ソニー株式会社
Priority date: 2012-03-07
Filing date: 2013-02-25
Publication date: 2013-09-12
Also published as: CA2861212A1; US20150116202A1

Abstract

　本技術は、より自然な立体画像を提示できるようにする画像処理装置および方法、並びにプログラムに関する。撮影ユニットは、右眼画像と左眼画像からなる画像対を複数撮影する。また、撮影ユニットは、各右眼画像の被写体が含まれる広角右眼画像と、各左眼画像の被写体が含まれる広角左眼画像も撮影する。位置決定部は、輻輳点の異なる複数の画像対に基づいて、広角右眼画像を基準とする座標系上に複数の右眼画像を配置するとともに、広角左眼画像を基準とする座標系上に複数の左眼画像を配置する。合成処理部は、座標系上に配置された右眼画像を合成するとともに、座標系上に配置された左眼画像を合成する。これにより、合成された右眼画像と左眼画像とからなる、複数の輻輳点を有する立体画像が得られる。本技術は、画像処理装置に適用することができる。

Description

画像処理装置および方法、並びにプログラム

　本技術は画像処理装置および方法、並びにプログラムに関し、特に、より自然な立体画像を提示できるようにした画像処理装置および方法、並びにプログラムに関する。

　従来、複数の撮影ユニットを利用して、右眼画像と左眼画像を撮影し、それらの右眼画像と左眼画像から立体画像を提示する技術が知られている。

　そのような技術として、２つの撮影ユニットの光軸が平行となるようにして撮影された右眼画像と左眼画像から人の顔を検出し、その検出結果に応じて輻輳角を調整するものが提案されている（例えば、特許文献１参照）。

特開２００８－２２１５０号公報

　ところで、上述した技術により得られる立体画像の輻輳点、すなわち撮影ユニットの２つの光軸が交差する点は、１つの立体画像に対して１つとなる。したがって、得られた立体画像をユーザが観視するときに、立体画像上における、撮影ユニットが輻輳した位置とは異なる位置をユーザが注視した場合には、立体画像の視差分布が実際の物体を見たときのものと異なるものとなり、違和感が生じてしまう。

　例えば、図１に示すように、ユーザが右眼ＥＲと左眼ＥＬで、２つの物体ＯＢ１１と物体ＯＢ１２を観察したとする。

　具体的には、例えば図中、左側に示すようにユーザが物体ＯＢ１１の頂点である点Ｐ１を注視したとする。この例では、直線ＰＬ１１がユーザの左眼ＥＬの視線方向となり、直線ＰＬ１２がユーザの右眼ＥＲの視線方向となるので、点Ｐ１が輻輳点となる。

　この場合、図中、右側の矢印Ｑ１１に示すように、ユーザの左眼ＥＬには、物体ＯＢ１１の図中、左側の側面ＳＤ１１が観察されるが、物体ＯＢ１１の図中、右側の側面ＳＤ１２は観察されない。また、ユーザの左眼ＥＬには、物体ＯＢ１２の図中、左側の側面ＳＤ１３が観察されるが、物体ＯＢ１２の図中、右側の側面ＳＤ１４は観察されない。

　また、図中、右側の矢印Ｑ１２に示すように、ユーザの右眼ＥＲには、物体ＯＢ１１の左側の側面ＳＤ１１と右側の側面ＳＤ１２が観察されるとともに、物体ＯＢ１２の左側の側面ＳＤ１３と右側の側面ＳＤ１４が観察される。

　これに対して、例えばユーザが物体ＯＢ１２の頂点である点Ｐ２を注視したとする。この例では、直線ＰＬ１３がユーザの左眼ＥＬの視線方向となり、直線ＰＬ１４がユーザの右眼ＥＲの視線方向となるので、点Ｐ２が輻輳点となる。

　したがって、この場合、図中、右側の矢印Ｑ１３に示すように、ユーザの左眼ＥＬには、物体ＯＢ１１の左側の側面ＳＤ１１と右側の側面ＳＤ１２が観察されるとともに、物体ＯＢ１２の左側の側面ＳＤ１３と右側の側面ＳＤ１４が観察される。

　また、図中、右側の矢印Ｑ１４に示すように、ユーザの右眼ＥＲには、物体ＯＢ１１の右側の側面ＳＤ１２が観察されるが、物体ＯＢ１１の左側の側面ＳＤ１１は観察されない。また、ユーザの右眼ＥＲには、物体ＯＢ１２の右側の側面ＳＤ１４が観察されるが、物体ＯＢ１２の左側の側面ＳＤ１３は観察されない。

　このように、ユーザの顔が同じ位置にあっても、輻輳点の位置が異なる場合には、ユーザの左右の眼で観察される物体の見え方は異なる。つまり、視差分布が異なる。例えば、視線方向が１５度変化すると人の眼の水晶体表面は、およそ3.6mm移動するため、このような視差分布の変化が生じるが、ユーザが顔の向きを変えた場合には、水晶体表面の移動量はさらに大きくなり、その分だけ視差分布の変化も大きくなる。

　以上のように、ユーザが実際に物体を観察する場合には、輻輳点の位置によって視差分布は異なる。したがって、単一輻輳の立体画像では、ユーザが立体画像上の輻輳点と異なる位置を注視したときには、実際の物体を観察したときと視差分布が異なることになり、ユーザは不自然に感じてしまう。

　特に、人の眼は視差に対する感度が高く、このような視差分布の違いはユーザにより知覚されてしまう。例えば、人の空間分解能に対する感度は角分のオーダーであるのに対し、人の視差に対する感度は、空間分解能に対する感度の場合と比べて１オーダー程度高い。そのため、輻輳点と異なる位置を注視したときの視差分布の違いは、実体との違いにより不自然な印象が生じる１つの要因となる。

　本技術は、このような状況に鑑みてなされたものであり、より自然な立体画像を提示することができるようにするものである。

　本技術の一側面の画像処理装置は、複数の異なる視点の視点画像からなる画像群であって、互いに注視点の異なる複数の画像群に基づいて、前記視点ごとに、前記視点画像上の同じ被写体が重なるように、前記視点画像を新たな座標系上に配置する位置決定部と、前記視点ごとに、前記座標系上に配置された複数の前記視点画像を合成して合成視点画像を生成することで、各前記視点の前記合成視点画像からなる、複数の注視点を有する立体画像を生成する合成処理部とを備える。

　前記注視点ごとの画像群は、それぞれ一対の視点画像からなる、１つの輻輳点を有するようにすることができる。

　前記合成処理部には、複数の前記視点画像が重なる領域内の位置に応じた重みを付けて、前記視点画像に対する加算平均フィルタ処理を行なうことで、前記合成視点画像を生成させることができる。

　前記複数の前記画像群を同一時刻に撮影されたものとすることができる。

　前記複数の前記画像群を、前記画像群ごとに異なる時刻に撮影されたものとすることができる。

　本技術の一側面の画像処理方法またはプログラムは、複数の異なる視点の視点画像からなる画像群であって、互いに注視点の異なる複数の画像群に基づいて、前記視点ごとに、前記視点画像上の同じ被写体が重なるように、前記視点画像を新たな座標系上に配置し、前記視点ごとに、前記座標系上に配置された複数の前記視点画像を合成して合成視点画像を生成することで、各前記視点の前記合成視点画像からなる、複数の注視点を有する立体画像を生成するステップを含む。

　本技術の一側面においては、複数の異なる視点の視点画像からなる画像群であって、互いに注視点の異なる複数の画像群に基づいて、前記視点ごとに、前記視点画像上の同じ被写体が重なるように、前記視点画像が新たな座標系上に配置され、前記視点ごとに、前記座標系上に配置された複数の前記視点画像を合成して合成視点画像を生成することで、各前記視点の前記合成視点画像からなる、複数の注視点を有する立体画像が生成される。

　本技術の一側面によれば、より自然な立体画像を提示することができる。

輻輳点による物体の見え方の違いについて説明する図である。輻輳点の異なる画像の合成について説明する図である。立体画像の視差について説明する図である。輻輳点の異なる複数の画像の撮影について説明する図である。表示処理システムの構成例を示す図である。立体画像生成処理について説明するフローチャートである。コンピュータの構成例を示す図である。

　以下、図面を参照して、本技術を適用した実施の形態について説明する。

〈第１の実施の形態〉
［立体画像の生成について］
　本技術は、ユーザが観察した場合に、より違和感のない自然な立体画像を生成するためのものである。まず、本技術による立体画像の生成について説明する。

　本技術により生成される立体画像は、例えば立体表示時において、ユーザの左眼で観察される左眼画像と、ユーザの右眼で観察される右眼画像とからなる。なお、立体画像は、３以上の異なる視点の視点画像からなるものとしてもよいが、以下では、説明を簡単にするため、立体画像は、２つの異なる視点画像である左眼画像と右眼画像からなるものとして説明を続ける。

　本技術では、１つの立体画像を生成する場合に、輻輳点の異なる複数の画像が用いられる。すなわち、所定の輻輳点を有する左眼画像と右眼画像からなる画像対が、複数の異なる輻輳点ごとに用意される。例えば、立体画像を構成する右眼画像に注目すると、図２に示すように、輻輳点の異なる４つの右眼画像ＰＣ１１乃至右眼画像ＰＣ１４が合成されて、最終的な右眼画像が生成される。

　図２の例では、右眼画像ＰＣ１１乃至右眼画像ＰＣ１４は、２つの人の胸像ＯＢ２１と胸像ＯＢ２２を被写体として撮影することで得られた画像である。

　例えば、右眼画像ＰＣ１１は、胸像ＯＢ２１の右眼の位置が輻輳点となるように撮影された画像であり、右眼画像ＰＣ１２は、胸像ＯＢ２１の左眼の位置が輻輳点となるように撮影された画像である。また、右眼画像ＰＣ１３は、胸像ＯＢ２２の右眼の位置が輻輳点となるように撮影された画像であり、右眼画像ＰＣ１４は、胸像ＯＢ２２の左眼の位置が輻輳点となるように撮影された画像である。

　本技術では、これらの輻輳点の異なる４つの右眼画像ＰＣ１１乃至右眼画像ＰＣ１４が、それらの画像上の同じ被写体が重なるように新たな座標系（平面）上に配置される。そして、それらの重ね合わされた右眼画像ＰＣ１１乃至右眼画像ＰＣ１４が、滑らかにつなぎ合わせられるように合成され、最終的な１つの右眼画像（以下、右眼合成画像とも称する）とされる。

　このとき、例えば複数の右眼画像が互いに重なる領域において、その重なる領域内の位置に応じた重みで右眼画像が合成される。

　具体的には、例えば右眼画像ＰＣ１１と右眼画像ＰＣ１３が合成されて、すなわち重み付き加算されて、右眼合成画像が生成されるとする。このとき、右眼画像ＰＣ１１と右眼画像ＰＣ１３が重なる領域のうち、より右眼画像ＰＣ１１に近い位置では、右眼画像ＰＣ１１に対する重みが、右眼画像ＰＣ１３に対する重みよりもより大きくなるようにされる。ここで、右眼画像ＰＣ１１と右眼画像ＰＣ１３が重なる領域内で、より右眼画像ＰＣ１１に近い位置とは、例えば、右眼画像ＰＣ１３の中心位置よりも、より右眼画像ＰＣ１１の中心に近い位置などとされる。

　右眼画像における場合と同様に、輻輳点の異なる複数の左眼画像が合成されて、最終的な１つの左眼画像（以下、左眼合成画像とも称する）とされる。

　これにより、例えば図３に示すように、右眼合成画像ＰＵＲと左眼合成画像ＰＵＬとからなる立体画像が得られる。なお、図３において図２における場合と対応する部分には同一の符号を付してあり、その説明は適宜省略する。

　輻輳点の異なる複数の画像を合成することで得られた右眼合成画像ＰＵＲと左眼合成画像ＰＵＬとについて、それらの画像上の同じ位置にある画素の平均値を新たな画素とすると、図中、下側に示す加算平均画像ＰＡが得られる。

　この加算平均画像ＰＡでは、被写体としての胸像ＯＢ２１や胸像ＯＢ２２の輪郭がわずかにぼけている。この輪郭のぼけは、右眼合成画像ＰＵＲと左眼合成画像ＰＵＬの視差により生じるものであるが、加算平均画像ＰＡにおける胸像ＯＢ２１や胸像ＯＢ２２の輪郭のぼけの量は少なく、右眼合成画像ＰＵＲと左眼合成画像ＰＵＬの視差が適切な視差であることが分かる。

　例えば、被写体としての胸像ＯＢ２１の右眼近傍の領域では、右眼合成画像ＰＵＲと左眼合成画像ＰＵＬの視差は、胸像ＯＢ２１の右眼の位置を輻輳点として撮影された右眼画像と左眼画像の視差に近い値となる。つまり、立体画像における胸像ＯＢ２１の右眼近傍の領域では、ユーザが実際に胸像ＯＢ２１の右眼を注視したときと近い視差分布となる。

　同様に、例えば被写体としての胸像ＯＢ２２の左眼近傍の領域では、右眼合成画像ＰＵＲと左眼合成画像ＰＵＬの視差は、胸像ＯＢ２２の左眼の位置を輻輳点として撮影された右眼画像と左眼画像の視差に近い値となる。そのため、立体画像における胸像ＯＢ２２の左眼近傍の領域では、ユーザが実際に胸像ＯＢ２２の左眼を注視したときと近い視差分布となる。

　これは、例えば図２を参照して説明したように、重みが付けられて、輻輳点の異なる画像が滑らかにつなぎ合わせられるように各画像を合成することで、右眼合成画像ＰＵＲと左眼合成画像ＰＵＬが生成されるからである。

　このようにして右眼合成画像ＰＵＲと左眼合成画像ＰＵＬを生成することで、立体画像上に複数の輻輳点を設けることができ、ユーザが感じる不自然さの要因となる視差分布の矛盾を軽減させることができる。つまり、立体画像における各部位ごとの視差分布の整合性を向上させ、より自然な立体画像を提示することができる。

　なお、上述したように、本技術では、輻輳点の異なる複数の画像が合成されて右眼合成画像ＰＵＲや左眼合成画像ＰＵＬが生成される。そのため、例えばユーザが立体画像上の１つの輻輳点を注視しているときには、他の輻輳点近傍の領域における視差分布は、実際にユーザが被写体を見たときの視差分布とは異なるものとなる。しかし、ユーザが注視していない領域では、多少の視差分布の誤差があったとしても、周辺視では眼の解像能力が低下しているという生体の性質によって、その誤差によりユーザが不自然さを感じるようなことはない。

　また、右眼合成画像ＰＵＲや左眼合成画像ＰＵＬを得るための右眼画像と左眼画像の輻輳点は、ユーザが注視する可能性の高い被写体の部位などとされる。

　例えば、被写体が人である場合、ユーザは被写体としての人の眼やテクスチャ部分に注目することが多い。そこで、被写体の各部位のうち、ユーザが注視する可能性の高い部位を輻輳点として撮影した右眼画像と左眼画像の対を複数用意し、それらの右眼画像や左眼画像を境界が目立たないように合成して接続し、右眼合成画像および左眼合成画像とすればよい。

［輻輳点の異なる画像の撮影について］
　以上においては、本技術による立体画像を構成する右眼合成画像と左眼合成画像は、それぞれ輻輳点の異なる複数の右眼画像または左眼画像を合成することで生成されると説明した。次に、これらの右眼合成画像と左眼合成画像を生成するのに用いられる右眼画像と左眼画像の撮影について説明する。

　輻輳点の異なる複数の右眼画像や左眼画像は、例えば図４の矢印Ｑ３１に示すように、複数の撮影装置を各撮影装置の光軸とほぼ垂直な方向に並べて撮影を行なうことで得ることができる。

　矢印Ｑ３１に示す例では、図中、奥側から手前方向に、撮影装置１１Ｒ－１、撮影装置１１Ｌ－１、撮影装置１１Ｒ－２、撮影装置１１Ｌ－２、撮影装置１１Ｒ－３、および撮影装置１１Ｌ－３が順番に並べられている。

　ここで、撮影装置１１Ｒ－１、撮影装置１１Ｒ－２、および撮影装置１１Ｒ－３は、互いに輻輳点の異なる右眼画像を撮影するための撮影装置である。また、撮影装置１１Ｌ－１、撮影装置１１Ｌ－２、および撮影装置１１Ｌ－３は、互いに輻輳点の異なる左眼画像を撮影するための撮影装置である。

　つまり、この例では、撮影装置１１Ｒ－１と撮影装置１１Ｌ－１，撮影装置１１Ｒ－２と撮影装置１１Ｌ－２，撮影装置１１Ｒ－３と撮影装置１１Ｌ－３が、それぞれ異なる輻輳点を有する撮影装置対となる。

　なお、以下、撮影装置１１Ｒ－１乃至撮影装置１１Ｒ－３を特に区別する必要のない場合、単に撮影装置１１Ｒとも称し、撮影装置１１Ｌ－１乃至撮影装置１１Ｌ－３を特に区別する必要のない場合、単に撮影装置１１Ｌとも称する。

　また、矢印Ｑ３２に示すように、撮影装置１１Ｒと撮影装置１１Ｌとを分けて配置するようにしてもよい。この例では、被写体の方向からの光の半分を透過させ、残りの半分を反射させるハーフミラー１２が配置されている。

　そして、ハーフミラー１２の図中、右側に、奥側から手前方向に撮影装置１１Ｌ－１、撮影装置１１Ｌ－２、および撮影装置１１Ｌ－３が順番に配置されている。また、ハーフミラー１２の図中、上側に、奥側から手前方向に撮影装置１１Ｒ－１、撮影装置１１Ｒ－２、および撮影装置１１Ｒ－３が順番に配置されている。

　したがって、この場合、各撮影装置１１Ｌは、被写体から発せられ、ハーフミラー１２を透過した光を受光することで左眼画像を撮影し、各撮影装置１１Ｒは、被写体から発せられ、ハーフミラー１２で反射した光を受光することで右眼画像を撮影することになる。

　なお、矢印Ｑ３２に示す例では、撮影装置１１Ｒからハーフミラー１２の方向を見た場合に、各撮影装置１１Ｒの光軸は、互いに隣接する撮影装置１１Ｌの光軸の間に位置している。例えば、撮影装置１１Ｒ－１の光軸は、撮影装置１１Ｌ－１の光軸と撮影装置１１Ｌ－２の光軸の間に位置している。このように撮影装置１１Ｒと撮影装置１１Ｌを配置することで、矢印Ｑ３１における場合と比べて、対となる撮影装置１１Ｒと撮影装置１１Ｌの光軸間の距離をより短くすることができる。また、矢印Ｑ３１と矢印Ｑ３２に示す例では、１つの輻輳点を有する右眼画像と左眼画像からなる画像対が、同一時刻に３つ撮影されることになる。つまり、３つの異なる輻輳点の画像対が同時に撮影される。

　さらに、矢印Ｑ３３に示すように、１つの撮影装置１１Ｒ－１により、輻輳点の異なる複数の右眼画像がほぼ同時に撮影され、１つの撮影装置１１Ｌ－１により、輻輳点の異なる複数の左眼画像がほぼ同時に撮影されるようにしてもよい。

　この場合、輻輳点の異なる右眼画像と左眼画像の撮影のため、撮影装置１１Ｒ－１と撮影装置１１Ｌ－１が、それらの撮影装置の光軸とほぼ垂直な直線ＲＴ１１または直線ＲＴ１２を軸として回転される。これにより、撮影装置１１Ｒ－１と撮影装置１１Ｌ－１の輻輳点を任意の位置に高速に移動させながら、撮影を行なうことができる。この場合、例えば１つの輻輳点を有する右眼画像と左眼画像からなる画像対が、輻輳点ごとに異なる時刻に撮影されることになる。

　例えば、立体画像の１フレーム期間が１／６０秒であり、４つの輻輳点の右眼画像と左眼画像を得ようとする場合には、１秒間に２４０フレーム撮影可能なカメラを撮影装置１１Ｒ－１および撮影装置１１Ｌ－１として用いればよい。撮影装置１１Ｒ－１や撮影装置１１Ｌ－１の移動により画像のぶれが生じる場合には、電子シャッタを併用して対応すればよい。

　なお、以上においては、輻輳点の異なる右眼画像と左眼画像、つまり２視点のステレオ画像が撮影される場合について説明したが、視点の異なるＭ枚（但し３≦Ｍ）の視点画像からなるＭ視点画像が、輻輳点（注視点）ごとに複数撮影されるようにしてもよい。

　そのような場合、右眼画像や左眼画像における場合と同様に、Ｍ個の各視点について、輻輳点（注視点）の異なる複数の第ｍ番目（但し、１≦ｍ≦Ｍ）の視点の視点画像が、それらの視点画像上の同じ被写体が重なるように、新たな座標系上に配置される。そして、新たな座標系上に配置された第ｍ番目の視点の各視点画像が合成されて合成視点画像とされ、Ｍ個の視点ごとの合成視点画像からなる立体画像、つまりＭ視点画像が生成される。

　以下においては、立体画像として、右眼画像と左眼画像を撮影，表示する場合について、さらに説明を続ける。

［表示処理システムの構成例］
　次に、本技術を適用した具体的な実施の形態について説明する。図５は、本技術を適用した表示処理システムの一実施の形態の構成例を示す図である。

　図５の表示処理システムは、撮影ユニット４１、画像処理装置４２、表示制御部４３、および表示部４４から構成される。

　撮影ユニット４１は、画像処理装置４２の制御に基づいて右眼画像や左眼画像を撮影し、画像処理装置４２に供給する。撮影ユニット４１は、右眼画像撮影部６１、左眼画像撮影部６２、広角右眼画像撮影部６３、および広角左眼画像撮影部６４を備えている。

　右眼画像撮影部６１および左眼画像撮影部６２は、所定の輻輳点の右眼画像および左眼画像を撮影する対となる撮影装置であり、例えば右眼画像撮影部６１と左眼画像撮影部６２は、図４の矢印Ｑ３３に示した撮影装置１１Ｒ－１と撮影装置１１Ｌ－１に対応する。

　なお、右眼画像撮影部６１が、図４の矢印Ｑ３１や矢印Ｑ３２に示した撮影装置１１Ｒ－１乃至撮影装置１１Ｒ－３からなり、左眼画像撮影部６２が、図４の矢印Ｑ３１や矢印Ｑ３２に示した撮影装置１１Ｌ－１乃至撮影装置１１Ｌ－３からなるようにしてもよい。

　右眼画像撮影部６１および左眼画像撮影部６２は、輻輳点の異なる複数の右眼画像および左眼画像を撮影し、得られた右眼画像および左眼画像を画像処理装置４２に供給する。

　なお、以下では、Ｎ個の異なる輻輳点について、右眼画像と左眼画像の対が撮影されることとし、ｎ番目（但し、１≦ｎ≦Ｎ）の右眼画像と左眼画像を、それぞれ右眼画像Ｒ_nおよび左眼画像Ｌ_nとも称することとする。右眼画像Ｒ_nと左眼画像Ｌ_nからなる画像対は、１つの輻輳点を有する画像対である。

　また、広角右眼画像撮影部６３および広角左眼画像撮影部６４は、各右眼画像Ｒ_nおよび左眼画像Ｌ_nよりも広角な画像を、広角右眼画像Ｒ_gおよび広角左眼画像Ｌ_gとして撮影し、画像処理装置４２に供給する。すなわち、広角右眼画像Ｒ_gは、各右眼画像Ｒ_n上にある被写体が全て含まれている画像であり、広角左眼画像Ｌ_gは、各左眼画像Ｌ_n上にある被写体が全て含まれている画像である。

　画像処理装置４２は、撮影ユニット４１から供給された右眼画像Ｒ_nおよび左眼画像Ｌ_nと、広角右眼画像Ｒ_gおよび広角左眼画像Ｌ_gとに基づいて、右眼合成画像および左眼合成画像を生成し、表示制御部４３に供給する。画像処理装置４２は、位置決定部７１、合成処理部７２、および切り出し部７３を備えている。

　位置決定部７１は、広角右眼画像Ｒ_gを基準とした新たな座標系（以下、投影座標系とも称する）上において各右眼画像Ｒ_nが広角右眼画像Ｒ_gと重なるように、各右眼画像Ｒ_nの投影座標系上の位置を決定する。例えば広角右眼画像Ｒ_gを基準とする投影座標系は、広角右眼画像Ｒ_gの中心位置を原点とする２次元座標系である。

　また、位置決定部７１は、左眼画像Ｌ_nについても右眼画像Ｒ_nにおける場合と同様に、広角左眼画像Ｌ_gを基準とした投影座標系上において各左眼画像Ｌ_nが広角左眼画像Ｌ_gと重なるように、各左眼画像Ｌ_nの投影座標系上の位置を決定する。

　合成処理部７２は、投影座標系上に配置された右眼画像Ｒ_nを合成するとともに、投影座標系上に配置された左眼画像Ｌ_nを合成する。切り出し部７３は、投影座標系上で右眼画像Ｒ_nを合成して得られた画像の所定の領域を切り出して（トリミングして）右眼合成画像を生成するとともに、投影座標系上で左眼画像Ｌ_nを合成して得られた画像の所定の領域を切り出して左眼合成画像を生成する。

　表示制御部４３は、画像処理装置４２から供給された右眼合成画像と左眼合成画像を表示部４４に供給し、立体表示させる。表示部４４は、例えば裸眼方式の立体表示装置などからなり、表示制御部４３から供給された右眼合成画像と左眼合成画像を表示させることで、立体画像を表示する。

［立体画像生成処理の説明］
　ところで、図５の表示処理システムに対して、立体画像の生成および表示が指示されると、表示処理システムは立体画像生成処理を行なって、立体画像を表示する。以下、図６のフローチャートを参照して、表示処理システムによる立体画像生成処理について説明する。

　ステップＳ１１において、撮影ユニット４１は、複数の輻輳点のそれぞれに対する右眼画像Ｒ_nおよび左眼画像Ｌ_nと、広角右眼画像Ｒ_gおよび広角左眼画像Ｌ_gとを撮影する。

　すなわち、右眼画像撮影部６１および左眼画像撮影部６２は、それぞれＮ個の輻輳点の右眼画像Ｒ_nおよび左眼画像Ｌ_n（但し、１≦ｎ≦Ｎ）を撮影して画像処理装置４２に供給する。また、広角右眼画像撮影部６３および広角左眼画像撮影部６４は、広角右眼画像Ｒ_gおよび広角左眼画像Ｌ_gを撮影して画像処理装置４２に供給する。

　なお、右眼画像Ｒ_nおよび左眼画像Ｌ_nの撮影時において、画像処理装置４２が撮影ユニット４１を制御して、ユーザにより注視される可能性の高い所望の被写体の部位が輻輳点とされて、右眼画像Ｒ_nおよび左眼画像Ｌ_nが撮影されるようにしてもよい。

　そのような場合、例えば画像処理装置４２は、広角右眼画像Ｒ_gや広角左眼画像Ｌ_gから、コントラストが高い領域、すなわち平坦ではなく何らかの輝度変化のある領域を輻輳点の位置として定め、その領域が輻輳点となるように撮影ユニット４１を制御する。

　また、例えば広角右眼画像Ｒ_gや広角左眼画像Ｌ_gに人の顔がアップで映っている場合には、画像処理装置４２が、人の両眼や顔の中央を輻輳点として選択するようにしてもよい。さらに、例えば広角右眼画像Ｒ_gや広角左眼画像Ｌ_gに複数の人が映っている場合には、それらの人の顔のなかから、画面の中央、左右などの位置にある顔の領域が、輻輳点として選択されるようにしてもよい。なお、広角右眼画像Ｒ_gや広角左眼画像Ｌ_gからの人の顔の検出は、顔認識機能を利用すればよい。

　ステップＳ１２において、位置決定部７１は、右眼画像Ｒ_nおよび左眼画像Ｌ_nを、新たな投影座標系上に配置する。

　例えば、位置決定部７１は、各右眼画像Ｒ_nについて、右眼画像Ｒ_nと広角右眼画像Ｒ_gの相関や差分絶対値和を求めることで、広角右眼画像Ｒ_gを基準とする投影座標系上において、右眼画像Ｒ_nの中心部分の領域が広角右眼画像Ｒ_gと最も重なる位置を定める。そして、位置決定部７１は、各右眼画像Ｒ_nを定めた位置に配置する。

　ここで、右眼画像Ｒ_nの中心部分の領域とは、例えば右眼画像Ｒ_nの高さがｈである場合、右眼画像Ｒ_nの中心を中心とする直径ｈ／２の円の領域などとされる。

　右眼画像Ｒ_nの場合と同様に、位置決定部７１は各左眼画像Ｌ_nについて、広角左眼画像Ｌ_gを基準とする投影座標系上において、左眼画像Ｌ_nの中心部分の領域が広角左眼画像Ｌ_gと最も重なる位置を定め、その位置に左眼画像Ｌ_nを配置する。これにより、各右眼画像Ｒ_nの同じ被写体が重なるように、それらの右眼画像Ｒ_nが投影座標系上に配置され、各左眼画像Ｌ_nの同じ被写体が重なるように、それらの左眼画像Ｌ_nが投影座標系上に配置されることになる。

　ステップＳ１３において、合成処理部７２は、投影座標系上に配置された右眼画像Ｒ_nと左眼画像Ｌ_nについて、重ね合わせを行なう。

　具体的には、合成処理部７２は、投影座標系上に配置された各右眼画像Ｒ_nの互いに重なる部分が滑らかに連続するように、右眼画像Ｒ_nに対してガウシアンフィルタ等を用いた加算平均フィルタ処理を施し、Ｎ個の右眼画像Ｒ_nを合成する。

　なお、投影座標系上において互いに重なる右眼画像Ｒ_nを合成するときに、それらの右眼画像Ｒ_nの境界近傍の領域で対応点を探索し、それらの対応点が一致するように（重なるように）、右眼画像Ｒ_nがアフィン変換等の幾何学変換で変形されてもよい。そのような場合、変形後の各右眼画像Ｒ_nが、それらの画像が互いに重なる領域内の位置に応じた重みで重ね合わせられる。これにより、互いに重なる右眼画像Ｒ_nの境界が見立たないように、各右眼画像Ｒ_nが滑らかに合成される。

　また、各右眼画像Ｒ_nが投影座標系上に配置されるときに、各右眼画像Ｒ_nの各部が広角右眼画像Ｒ_gの各部と重なるように、右眼画像Ｒ_nに対してアフィン変換等の幾何学変換が施されるようにしてもよい。

　さらに、合成処理部７２は、右眼画像Ｒ_nの重ね合わせと同様に、投影座標系上に配置された各左眼画像Ｌ_nの互いに重なる部分が滑らかに連続するように、左眼画像Ｌ_nに対して加算平均フィルタ処理を施し、Ｎ個の左眼画像Ｌ_nを合成する。

　ステップＳ１４において、切り出し部７３は、合成された右眼画像Ｒ_nおよび左眼画像Ｌ_nに基づいて立体画像を生成し、表示制御部４３に供給する。

　すなわち、切り出し部７３は、投影座標系上で右眼画像Ｒ_nを合成して得られた画像の所定の領域を切り出して右眼合成画像とするとともに、投影座標系上で左眼画像Ｌ_nを合成して得られた画像の所定の領域を切り出して左眼合成画像とする。これにより、右眼合成画像と左眼合成画像とからなる立体画像が得られる。

　ステップＳ１５において、表示制御部４３は、切り出し部７３から供給された立体画像を表示部４４に供給して表示させ、立体画像生成処理は終了する。

　なお、右眼合成画像と左眼合成画像とからなる立体画像は、静止画像であってもよいし、動画像であってもよい。また、立体画像は、３以上の視点の画像からなる多視点画像であってもよい。

　以上のようにして、表示処理システムは、輻輳点の異なる複数の右眼画像や左眼画像を合成し、右眼合成画像および左眼合成画像からなる立体画像を生成する。

　このようにして得られた立体画像は複数の輻輳点を有しているので、より自然な立体画像を提示することができる。すなわち、ユーザが立体画像を観察する場合に、各注視点において実際の視差分布との違いが抑えられ、自然で見やすい高品質な立体画像を提示することができる。

　なお、以上においては、画像処理装置４２に撮影ユニット４１や表示制御部４３が接続される場合を例として説明したが、撮影ユニット４１が画像処理装置４２に設けられていてもよいし、表示制御部４３と表示部４４が画像処理装置４２に設けられていてもよい。

　ところで、上述した一連の処理は、ハードウェアにより実行することもできるし、ソフトウェアにより実行することもできる。一連の処理をソフトウェアにより実行する場合には、そのソフトウェアを構成するプログラムが、コンピュータにインストールされる。ここで、コンピュータには、専用のハードウェアに組み込まれているコンピュータや、各種のプログラムをインストールすることで、各種の機能を実行することが可能な、例えば汎用のパーソナルコンピュータなどが含まれる。

　図７は、上述した一連の処理をプログラムにより実行するコンピュータのハードウェアの構成例を示すブロック図である。

　コンピュータにおいて、CPU（Central Processing Unit）２０１，ROM（Read Only Memory）２０２，RAM（Random Access Memory）２０３は、バス２０４により相互に接続されている。

　バス２０４には、さらに、入出力インターフェース２０５が接続されている。入出力インターフェース２０５には、入力部２０６、出力部２０７、記録部２０８、通信部２０９、及びドライブ２１０が接続されている。

　入力部２０６は、キーボード、マウス、マイクロホンなどよりなる。出力部２０７は、ディスプレイ、スピーカなどよりなる。記録部２０８は、ハードディスクや不揮発性のメモリなどよりなる。通信部２０９は、ネットワークインターフェースなどよりなる。ドライブ２１０は、磁気ディスク、光ディスク、光磁気ディスク、又は半導体メモリなどのリムーバブルメディア２１１を駆動する。

　以上のように構成されるコンピュータでは、CPU２０１が、例えば、記録部２０８に記録されているプログラムを、入出力インターフェース２０５及びバス２０４を介して、RAM２０３にロードして実行することにより、上述した一連の処理が行われる。

　コンピュータ（CPU２０１）が実行するプログラムは、例えば、パッケージメディア等としてのリムーバブルメディア２１１に記録して提供することができる。また、プログラムは、ローカルエリアネットワーク、インターネット、デジタル衛星放送といった、有線または無線の伝送媒体を介して提供することができる。

　コンピュータでは、プログラムは、リムーバブルメディア２１１をドライブ２１０に装着することにより、入出力インターフェース２０５を介して、記録部２０８にインストールすることができる。また、プログラムは、有線または無線の伝送媒体を介して、通信部２０９で受信し、記録部２０８にインストールすることができる。その他、プログラムは、ROM２０２や記録部２０８に、あらかじめインストールしておくことができる。

　なお、コンピュータが実行するプログラムは、本明細書で説明する順序に沿って時系列に処理が行われるプログラムであっても良いし、並列に、あるいは呼び出しが行われたとき等の必要なタイミングで処理が行われるプログラムであっても良い。

　また、本技術の実施の形態は、上述した実施の形態に限定されるものではなく、本技術の要旨を逸脱しない範囲において種々の変更が可能である。

　例えば、本技術は、１つの機能をネットワークを介して複数の装置で分担、共同して処理するクラウドコンピューティングの構成をとることができる。

　また、上述のフローチャートで説明した各ステップは、１つの装置で実行する他、複数の装置で分担して実行することができる。

　さらに、１つのステップに複数の処理が含まれる場合には、その１つのステップに含まれる複数の処理は、１つの装置で実行する他、複数の装置で分担して実行することができる。

　さらに、本技術は、以下の構成とすることも可能である。

［１］
　複数の異なる視点の視点画像からなる画像群であって、互いに注視点の異なる複数の画像群に基づいて、前記視点ごとに、前記視点画像上の同じ被写体が重なるように、前記視点画像を新たな座標系上に配置する位置決定部と、
　前記視点ごとに、前記座標系上に配置された複数の前記視点画像を合成して合成視点画像を生成することで、各前記視点の前記合成視点画像からなる、複数の注視点を有する立体画像を生成する合成処理部と
　を備える画像処理装置。
［２］
　前記注視点ごとの画像群は、それぞれ一対の視点画像からなる、１つの輻輳点を有する
　［１］に記載の画像処理装置。
［３］
　前記合成処理部は、複数の前記視点画像が重なる領域内の位置に応じた重みを付けて、前記視点画像に対する加算平均フィルタ処理を行なうことで、前記合成視点画像を生成する
　［１］または［２］に記載の画像処理装置。
［４］
　前記複数の前記画像群は同一時刻に撮影されたものである
　［１］乃至［３］の何れかに記載の画像処理装置。
［５］
　前記複数の前記画像群は、前記画像群ごとに異なる時刻に撮影されたものである
　［１］乃至［３］の何れかに記載の画像処理装置。

　４１　撮影ユニット，　４２　画像処理装置，　４３　表示制御部，　４４　表示部，　７１　位置決定部，　７２　合成処理部，　７３　切り出し部

Claims

　複数の異なる視点の視点画像からなる画像群であって、互いに注視点の異なる複数の画像群に基づいて、前記視点ごとに、前記視点画像上の同じ被写体が重なるように、前記視点画像を新たな座標系上に配置する位置決定部と、
　前記視点ごとに、前記座標系上に配置された複数の前記視点画像を合成して合成視点画像を生成することで、各前記視点の前記合成視点画像からなる、複数の注視点を有する立体画像を生成する合成処理部と
　を備える画像処理装置。
　前記注視点ごとの画像群は、それぞれ一対の視点画像からなる、１つの輻輳点を有する
　請求項１に記載の画像処理装置。
　前記合成処理部は、複数の前記視点画像が重なる領域内の位置に応じた重みを付けて、前記視点画像に対する加算平均フィルタ処理を行なうことで、前記合成視点画像を生成する
　請求項２に記載の画像処理装置。
　前記複数の前記画像群は同一時刻に撮影されたものである
　請求項３に記載の画像処理装置。
　前記複数の前記画像群は、前記画像群ごとに異なる時刻に撮影されたものである
　請求項３に記載の画像処理装置。
　複数の異なる視点の視点画像からなる画像群であって、互いに注視点の異なる複数の画像群に基づいて、前記視点ごとに、前記視点画像上の同じ被写体が重なるように、前記視点画像を新たな座標系上に配置し、
　前記視点ごとに、前記座標系上に配置された複数の前記視点画像を合成して合成視点画像を生成することで、各前記視点の前記合成視点画像からなる、複数の注視点を有する立体画像を生成する
　ステップを含む画像処理方法。
　複数の異なる視点の視点画像からなる画像群であって、互いに注視点の異なる複数の画像群に基づいて、前記視点ごとに、前記視点画像上の同じ被写体が重なるように、前記視点画像を新たな座標系上に配置し、
　前記視点ごとに、前記座標系上に配置された複数の前記視点画像を合成して合成視点画像を生成することで、各前記視点の前記合成視点画像からなる、複数の注視点を有する立体画像を生成する
　ステップを含む処理をコンピュータに実行させるプログラム。