WO2017117743A1

WO2017117743A1 - 处理图像的方法和设备

Info

Publication number: WO2017117743A1
Application number: PCT/CN2016/070275
Authority: WO
Inventors: 温华栋
Original assignee: 华为技术有限公司
Priority date: 2016-01-06
Filing date: 2016-01-06
Publication date: 2017-07-13
Also published as: CN107211095B; US20190012797A1; EP3389256B1; EP3389256A1; EP3389256A4; CN107211095A

Abstract

本发明实施例提供一种处理图像的方法和设备，该方法包括：获取输入图像，该输入图像包括多个普通像素和多个相位像素对，该多个相位像素对中的每个相位像素对包括第一相位像素和第二相位像素；将该输入图像划分为至少两个区域窗口，该至少两个区域窗口中的每个区域窗口包括该多个相位像素对中的至少两个相邻的相位像素对；根据该至少两个区域窗口中的每个区域窗口的至少两个相位像素对，确定该每个区域窗口对应的相位差；根据该每个区域窗口对应的相位差，确定与该输入图像对应的深度图像。上述技术方案无需拍摄多张输入图像，也无需借助其他辅助设备来获取深度图像。

Description

处理图像的方法和设备

技术领域

本发明实施例涉及图像处理技术领域，并且更具体地，涉及处理图像的方法和设备。

背景技术

深度图像反映了图像的深度信息。深度信息表示图像中的物体与相机之间的距离。深度图像的像素可以用于反映对应的区域与相机之间的距离信息。

现有技术中，深度图像的获取方式非常复杂。常见的一种深度图像的获取方式是通过以不同位置为焦点拍摄多张照片来实现。例如，可以通过双照相机实现。具体地，双照相机是指具有两个独立的图像传感器的照相机。使用每个图像传感器各拍摄一张照片，其中一张照片的焦点在远景，另一张照片的焦点在近景。深度图像可以根据这两张照片生成。但是双照相机的成本非常高。再如，还可以通过普通相机以不同焦点拍摄多张照片实现。但是，这种方式在拍摄不同焦点的照片的时间是不同的。因此，不能很好地用于拍摄移动的物体。另一种获取深度图像的方式是基于飞行时间的***方案。该方案需要一个独立的发光单元。该发光单元用于照射需要拍摄的物体。另一个独立的传感器会拍摄下光并计算光到达目标物体需要的时间。根据光的传输时间，可以计算目标物体的距离并生成深度图像。

上述方案中，深度图像的获取方式复杂或者用于获取深度图像的设备成本高昂。

发明内容

本发明实施例提供一种处理图像的方法和设备，能够提供一种简单的获取深度图像的方式。

第一方面，本发明实施例提供一种处理图像的方法，该方法包括：获取输入图像，该输入图像包括多个普通像素和多个相位像素对，该多个相位像素对中的每个相位像素对包括第一相位像素和第二相位像素，该第一相位像素为左侧遮挡的相位像素，该第二相位像素为右侧遮挡的相位像素；将该输入图像划分为至少两个区域窗口，该至少两个区域窗口中的每个区域窗口包括该多个相位像素对中的至少两个相邻的相位像素对；根据该至少两个区域窗口中的每个区域窗口的至少两个相位像素对，确定该每个区域窗口对应的相位差；根据该每个区域窗口对应的相位差，确定与该输入图像对应的深度图像。上述技术方案中，输入图像是利用能够获取相位像素的图像传感器获取的。根据相位像素，可以确定出深度图像。上述技术方案无需拍摄多张输入图像，也无需借助其他辅助设备来获取深度图像。具体地，该第一相位像素和该第二相位像素分别位于相邻的像素行，并且该第二相位像素位于该第一相位像素的右侧的相邻列。

结合第一方面，在第一方面的第一种可能的实现方式中，该将该输入图像划分为至少两个区域窗口，包括：以第一长度为步长，将该输入图像延第一方向的至少一部分划分为具有相同大小的至少两个区域窗口，该第一方向为该输入图像的水平方向或该输入图像的竖直方向。

结合第一方面的第一种可能的实现方式，在第一方面的第二种可能的实现方式中，该将该输入图像划分为至少连个区域窗口，还包括：以第二长度为步长，将该输入图像沿第二方向的至少一部分划分为具有相同大小的至少两个区域窗口，该第二方向与该第一方向垂直。这样，与仅沿第一方向划分该输入图像的情况相比，沿两个方向划分输入图像可以得到更多的区域窗口。从而可以提高输入图像的深度图的解析度。

结合第一方面或第一方面的上述任一种可能的实现方式，在第一方面的第三种可能的实现方式中，该根据该至少两个区域窗口中每个区域窗口的至少两个相位像素对，确定该每个区域窗口对应的相位差，包括：根据该至少两个区域窗口中每个区域窗口的至少两个相位像素对，确定该每个区域窗口中的第一相位像素和第二相位像素的互相关；根据该每个区域窗口中的第一相位像素和第二相位像素的互相关，确定该每个区域窗口对应的相位差。

第二方面，本发明实施例提供一种处理图像的设备，该设备包括：用于执行该第一方面提供的方法的单元。

第三方面，本发明实施例提供一种图像处理设备，该设备包括图像传感器和处理器。该图像传感器和该处理器用于执行该第一方面提供的方法。

第四方面，本发明实施例提供一种计算机可读存储介质，该计算机可读存储介质存储的程序包括用于执行该第一方面提供的方法的指令。

第五方面，本发明实施例提供一种处理图像的设备，该设备包括第三方面的计算机可读存储介质、处理器。处理器用于执行该计算机可读存储介质中存储的程序的指令，以完成对输入图像的处理。

进一步，该第一长度大于或等于延第一方向的两个相邻的相位像素之间的距离。这样，才能保证在该第一方向上的任意两个相邻区域窗口中都存在不同的相位像素对。进一步，该第一长度还可以小于该每个区域窗口延第一方向的长度。这样，可以保证在第一方向上的任意两个相邻的区域窗口中都存在相同的相位像素对。

进一步，该第二长度大于或等于延第二方向的两个相邻的相位像素之间的距离。这样，才能保证在该第二方向上的任意两个相邻区域窗口中都存在不同的相位像素对。进一步，该第二长度还可以小于该每个区域窗口延第二方向的长度。这样，可以保证在第二方向上的任意两个相邻的区域窗口中都存在相同的相位像素对。

附图说明

为了更清楚地说明本发明实施例的技术方案，下面将对本发明实施例中所需要使用的附图作简单地介绍，显而易见地，下面所描述的附图仅仅是本发明的一些实施例，对于本领域普通技术人员来讲，在不付出创造性劳动的前提下，还可以根据这些附图获得其他的附图。

图1是一个输入图像的示意图。

图2是根据本发明实施例提供的处理图像的方法的示意性流程图。

图3是一种沿第一方向将该输入图像划分为四个区域窗口的示意图。

图4是同时延第一方向和第二方向将该输入图像划分为六个区域窗口的示意图。

图5是利用相位差确定深度图的示意图。

图6是根据本发明实施例提供的一种处理图像的设备的结构框图。

图7是根据本发明实施例提供的设备的结构框图。

具体实施方式

下面将结合本发明实施例中的附图，对本发明实施例中的技术方案进行清楚、完整地描述，显然，所述的实施例是本发明的一部分实施例，而不是全部实施例。基于本发明中的实施例，本领域普通技术人员在没有做出创造性劳动的前提下所获得的所有其他实施例，都应属于本发明保护的范围。

数字照相机是通过使用图像传感器替代传统胶片获取图像的。图像传感器中均匀分布着感光元件，用于将光学图像转换为电信号最终生成图像。相位对焦是一种利用图像传感器中的特殊感光元件进行对焦的方法。

图1是一个能够实现相位对焦的图像传感器的示意图。如图1所示的图像传感器中均匀分布着多个感光元件。感光元件中存在一种特殊的感光元件，这种特殊的感光元件是一半被遮挡的普通感光元件。相位对焦正式利用这种特殊的感光元件获取到的信号计算相位差实现的。

以上所称的信号是由多个感光元件获得的。每个感光元件获得的仅是信号中的采样(sample)。为了方便描述，以下将用于相位对焦的特殊的感光元件所获得的采样称为相位像素(phase pixel)，将普通的感光元件获取到的采样称为普通像素，将能够获取相位像素实现相位对焦的图像传感器称为具有相位像素的图像传感器。

更具体地，相位像素还可以分为第一相位像素和第二相位像素，其中第一相位像素是由左侧被遮挡的感光元件获得的，第二相位像素是由右侧被遮挡的感光元件获得的。本发明中所称的输入图像由具有相位像素的图像传感器获得的原始信号，而并非是经过一系列后续处理得到的照片。该具有相位像素的图像传感器中的一个感光元件对应于该输入图像中的一个像素。该输入图像中的像素是相位像素和普通像素。因此，图1也可以视为是输入图像的示意图。

从图1中可以看出，该输入图像中包括多个普通和多个相位像素对，该多个相位像素对中的每个相位像素包括第一相位像素和第二相位像素。图1所示的输入图像中每个相位像素对中的第一相位像素和第二相位像素分别位于相邻的像素行，并且第二相位像素位于第一相位像素右侧的相邻列。当然，图1所示的相位像素对的排列仅是一个实施例，相位像素对还可以有其他的排列方式，本发明并不限定。但是，组成一个相位像素对的两个相位像素的距离越近，计算相位差的精度越高。

201，获取输入图像。

202，将该输入图像划分为至少两个区域窗口，该至少两个区域窗口中的每个区域窗口包括该多个相位像素对中的至少两个相邻的相位像素对。

203，根据该至少两个区域窗口中每个区域窗口的至少两个相位像素对，确定该每个区域窗口对应的相位差(英文：Phase Difference，简称：PD)。

204，根据该每个区域窗口对应的相位差，确定与该输入图像对应的深度图像。

根据图2所示的方法，输入图像是利用能够获取相位像素的图像传感器获取的。根据每个区域窗口中的相位像素，可以确定出该区域窗口的相位差。这样就可以确定出深度图像。上述技术方案无需拍摄多张输入图像，也无需借助其他辅助设备来获取深度图像。

可选的，作为一个实施例，将该输入图像划分为至少两个区域窗口，包括：以第一长度为步长，将该输入图像延第一方向的至少一部分划分为具有相同大小的至少两个区域窗口，该第一方向为该输入图像的水平方向或该输入图像的竖直方向。

该第一长度的具体值可以根据需要的第一方向上的解析度来确定。解析度越低，该第一长度值越大，解析度越高，该第一长度值越小。但是，该第一长度大于或等于沿第一方向的两个相邻的相位像素之间的距离。这样才能保证在第一方向上任意两个相邻的区域窗口中都存在不同的相位像素对。

可选的，作为一个实施例，该第一长度还可以小于该每个区域窗口延第一方向的长度。作为另一个实施例，该第一长度可以等于该每个区域窗口的第一方向的长度。若该第一长度大于或等于沿该第一方向的两个相邻的相位像素之间的距离，且该第一长度小于该每个区域窗口沿第一方向的距离，则在第一方向上的任意两个相邻的区域窗口中存在公共的相位像素对。换句话说，在第一方向上的得到的区域窗口是重叠的。若该第一长度等于该每个区域窗口的第一方向的距离，则是将该输入图像延该第一方向的至少一部分等分为不存在公共的相位像素对的至少两个区域窗口。换句话说，得到的区域窗口是不重叠的。容易理解的是，与区域窗口不重叠相比的情况相比，区域窗口存在重叠时可以划分出更多的区域窗口。

具体地，可以使用以下公式确定该第一长度：

s＝(W–ROI_W)/(r_h–1)，(公式1.1)

其中，s表示第一长度，W表示输入图像的第一方向的长度，ROI_w表示区域窗口在第一方向的长度，r_h表示第一方向上期望得到的解析度。

图3是一种沿第一方向将该输入图像划分为四个区域窗口的示意图。如图3所示，首先沿水平方向以第一长度为步长，将输入图像的上半部分划分为第一个区域窗口和第二个区域窗口。然后沿水平方向以第一长度为步长，将该输入图像的下半部分划分为第三个区域窗口和第四个区域窗口。可以看出，该第一长度大于水平方向上两个相邻的相位像素对之间的距离，且该第一长度小于该区域窗口的水平方向长度。

可以理解的是，图3所示的示意图中采用了四个图像分别示出四个不同的区域窗口。但是图3所示的四个图像是同一个输入图像。采用四个图像分别示出四个不同的区域窗口仅是为了更清楚地表示出不同的区域窗口所在的位置。

可以看出，该第一区域窗口和该第二区域窗口中存在公共的相位像素对(即第一行和第二行相位像素对中的第三个相位像素对和第四个相位像素对)；该第三区域窗口和该第四区域窗口也存在公共的相位像素对(即第三行和第四行相位像素对中的第三个相位像素对和第四个相位像素对)。

当然，还可以沿竖直方向将该输入图像划分为至少两个区域窗口。具体过程与图3所示的沿水平方向划分该输入图像的过程类似，在此就不必赘述。

进一步，将该输入图像划分为至少两个区域窗口，还包括：以第二长度为步长，将该输入图像延第二方向的至少一部分划分为具有相同大小的至少两个区域窗口，该第二方向与该第一方向垂直。该第二长度大于或等于沿第二方向的两个相邻的相位像素之间的距离。该第二长度小于该每个区域窗口延第二方向的距离。这样才能保证在第二方向上相邻的两个区域窗口中都存在不同的相位像素对以及第二方向上相邻的两个区域窗口中都存在公共的相位像素对。也就是说，在第二方向上的任意两个相邻的区域窗口是重叠的。该第二长度的具体确定方式与该第一长度相同，在此就不必赘述。

如图4所示，分别以第一长度和第二长度为步长将该输入图像划分为六个区域窗口。可以看出，该第一长度大于水平方向上两个相邻的相位像素对之间的距离，且该第一长度小于该区域窗口的水平方向长度。该第一长度大于竖直方向上两个相邻的相位像素对之间的距离，且该第一长度小于该区域窗口的竖直方向长度。

与图3类似，图4所示的示意图中采用了六个图像分别示出六个不同的区域窗口。但是图4所示的六个图像是同一个输入图像。采用六个图像分别示出六个不同的区域窗口仅是为了更清楚地表示出不同的区域窗口所在的位置。

可以看出，对于同一个输入图像，采用一个方向划分区域窗口得到的区域窗口数量小于采用两个方向划分区域窗口得到的区域窗口数量。

可选的，作为另一个实施例，将该输入图像划分为至少两个区域窗口，包括：将该输入图像等分为具有相同大小的至少两个区域窗口，其中相邻的两个区域窗口中不存在相同的相位像素对。

在确定了区域窗口后，可以确定出每个区域窗口对应的相位差。显然，区域窗口的数量越多，该输入图像的相位差越多。该输入图像的深度图像的解析度越好。

若采用不重叠的区域窗口，则得到的深度图像的解析度为：

(公式1.2)

其中，W表示输入图像的第一方向的长度，ROI_w表示区域窗口在第一方向的长度，r_h表示第一方向的解析度。H表示输入图像的第二方向的长度，ROI_h表示区域窗口在第二方向的长度，r_v表示第二方向的解析度。

若区域窗口在仅在第一方向重叠，由于第一长度小于该区域窗口在第一方向上的长度，该第一图像的深度图像在第一方向的解析度高于不采用重叠区域窗口的解析度。类似的，若区域窗口仅在第二方向重叠，由于该第二长度小于该区域窗口在第二方向上的长度，该第一图像的深度图像在第二方向的解析度高于不采用重叠区域窗口的解析度。可以理解，若该区域窗口同时在第一方向和第二方向重叠，该第一图像的深度图像在第一方向和第二方向的解析度均高于不采用重叠区域窗口的解析度。

具体地，若该区域窗口同时在第一方向和第二方向重叠，则得到的深度图像的解析度为：

(公式1.3)

其中，W表示输入图像的第一方向的长度，s_w表示区域窗口在第一长度，r_h表示第一方向的解析度。H表示输入图像的第二方向的长度，s_h表示第二长度，r_v表示第二方向的解析度。

每个区域窗口的相位差可以通过每个区域窗口的互相关获得。具体地，可以通过以下公式确定出每个区域窗口中的每个第一方向上相位像素对的互相关：

(公式1.4)

其中，f(x)*k(x)第一方向上相位像素对的互相关，f(x)表示第一方向上相位像素对中的第二相位像素信号，k(x)表示第一方向上相位像素对中的第一相位像素信号，T表示信号宽幅。

在确定了互相关后，可以确定每个第一方向上的相位差。本领域技术人员知晓根据互相关确定相位差的具体过程，在此就不必赘述。类似的，可以确定出每个区域窗口中的每个第一方向上的相位差。在确定了每个第一方向上的相位差后，可以采用以下公式确定该每个区域窗口的相位差：

其中，PD(ROI)表示区域窗口的相位差，n表示该区域窗口中存在几个第一方向的相位像素对，PD(n)表示第n个第一方向的相位像素对的相位差。在确定了每个区域窗口的相位差后，就可以根据该每个区域窗口的相位差确定与该输入图像对应的深度图像。

图5是利用相位差确定深度图的示意图。图5所示的示意图中包括相机的镜头501和图像传感器502。镜头501与图像传感器502之间的距离为D1。图5所示的示意图中还包括被拍摄的物体，包括：物体503、物体504和物体505。

如图5所示，假设焦点与镜头501的距离为D2，那么位于焦点上的物体503的相位差为0。物体504与镜头501的距离小于D2。因此，物体504的相位差为负。物体505与镜头501的距离大于D2。因此，物体505的相位差为正。由于与镜头距离不同的物体的相位差不同，因此可以利用相位差来反映物体到镜头之间的距离信息。换句话说，相位差可以反映不同物体的深度信息。位于焦点的物体的相位差的为0，越接近镜头501的物体的相位差越小，越远离镜头501的物体的相位差越大。

这样，在确定出每个区域窗口的相位差后，就可以利用该每个区域窗口的相位差，确定出与输入图像对应的深度图像。该深度图像可以是灰度图。在此情况下，不同的相位差可以对应于不同的灰度值。由于根据图2所示的方法得到的相位差是一个区域窗口的相位差，那么一个区域窗口对应一个灰度值。如果两个区域窗口的相位差不同，那么这两个区域窗口的灰度值也不同。例如，相位差越大，灰度值越大，相位差越小，灰度值越小。该深度图像也可以是彩色图。在此情况下，不同的相位差可以对应于不同的颜色。由于根据图2所示的方法得到的相位差是一个区域窗口的相位差，那么一个区域窗口对应的一个颜色。如果两个区域窗口的相位差不同，那么这两个区域窗口的颜色也不同。因此，区域窗口的数量越多，该输入图像的相位差越多。该输入图像的深度图像的解析度越好。

以图3中的第一个区域窗口为例，可以根据第一个区域窗口中的第一行相位像素对中的第二相位像素的信号和第一个区域窗口中的第一行相位像素对中的第一相位像素的信号，确定第一互相关。可以根据第一个区域窗口中的第二行相位像素对中的第二相位像素的信号和第一个区域窗口中的第二行相位像素对中的第一相位像素的信号，确定第二互相关。根据该第一互相关，确定第一相位差PD₁；根据该第二互相关，确定第二相位差PD₂。然后，可以确定该第一区域窗口相位差为(PD₁+PD₂)/2。采用类似的方式，可以确定出该输入图像中所有区域窗口的相位差。然后，可以根据各个区域窗口的相位差，确定到该输入图像的深度图像。

本领域技术人员可以理解的是，图1、图3和图4中所示的输入图像仅是一个示意图。图中所示的区域窗口的大小、第一长度和第二长度也仅是一个示例。例如，实际应用中，区域窗口的最小长度可以是20×p_s，其中p_s为两个相邻的相位像素之间的距离。区域窗口的宽度可以是包括至少两列位像素对的长度。如果区域窗口的长度过小，计算出来的相位差的精确度会降低。

此外，本领域技术人员可以理解，本发明实施例中所称的长度、距离以及解析度的单位均为像素。

图6是根据本发明实施例提供的一种处理图像的设备的结构框图。图6所示的设备600能够执行如图2所示方法的各个步骤。如图6所示的设备600包括获取单元601和确定单元602。

获取单元601，用于获取输入图像，该输入图像包括多个普通像素和多个相位像素对，该多个相位像素对中每个相位像素对包括第一相位像素和第二相位像素，该第一相位像素为左侧遮挡的相位像素，该第二相位像素为右侧遮挡的相位像素。

确定单元602，用于将该输入图像划分为至少两个区域窗口，该至少两个区域窗口中的每个区域窗口包括该多个相位像素对中的至少两个相邻的相位像素对。

确定单元602，还用于根据该至少两个区域窗口中每个区域窗口的至少两个相位像素对，确定该每个区域窗口对应的相位差。

确定单元602，还用于根据该每个区域窗口对应的相位差，确定与该输入图像对应的深度图像。

根据图6所示的设备可以根据相位像素，可以确定出深度图像。该设备无需多张输入图像，也无需借助其他辅助设备来获取深度图像。

可选的，作为一个实施例，确定单元602，具体用于以第一长度为步长，将该输入图像沿着第一方向的至少一部分划分为具有相同大小的至少两个区域窗口，该第一方向为该输入图像的水平方向或该输入图像的竖直方向。

进一步，确定单元602，还用于以第二长度为步长，将该输入图像沿第二方向的至少一部分划分为具有相同大小的至少两个区域窗口，该第二方向与该第一方向垂直。

确定单元602，具体用于根据该至少两个区域窗口中每个区域窗口的至少两个相位像素对，确定该每个区域窗口中的第一相位像素和第二相位像素的互相关；根据该每个区域窗口中的第一相位像素和第二相位像素的互相关，确定该每个区域窗口对应的相位差。

图7是根据本发明实施例提供的处理图像的设备的结构框图。图7所示的设备700包括：处理器701和存储器702。

设备700中的各个组件通过总线***703耦合在一起，其中总线***703除包括数据总线之外，还包括电源总线、控制总线和状态信号总线。但是为了清楚说明起见，在图7中将各种总线都标为总线***703。

上述本发明实施例揭示的方法可以应用于处理器701中，或者由处理器701实现。处理器701可能是一种集成电路芯片，具有信号的处理能力。在实现过程中，上述方法的各步骤可以通过处理器701中的硬件的集成逻辑电路或者软件形式的指令完成。上述的处理器701可以是通用处理器、数字信号处理器(Digital Signal Processor，DSP)、专用集成电路(Application Specific Integrated Circuit，ASIC)、现成可编程门阵列(Field Programmable Gate Array，FPGA)或者其他可编程逻辑器件、分立门或者晶体管逻辑器件、分立硬件组件。可以实现或者执行本发明实施例中的公开的各方法、步骤及逻辑框图。通用处理器可以是微处理器或者该处理器也可以是任何常规的处理器等。结合本发明实施例所公开的方法的步骤可以直接体现为硬件译码处理器执行完成，或者用译码处理器中的硬件及软件模块组合执行完成。软件模块可以位于随机存取存储器(Random Access Memory，RAM)、闪存、只读存储器(Read-Only Memory，ROM)、可编程只读存储器或者电可擦写可编程存储器、寄存器等本领域成熟的存储介质中。该存储介质位于存储器702，处理器701读取存储器702中的指令，结合其硬件完成上述方法的步骤。

处理器701，用于获取输入图像，该输入图像包括多个普通像素和多个相位像素对，该多个相位像素对中每个相位像素对包括第一相位像素和第二相位像素，该第一相位像素为左侧遮挡的相位像素，该第二相位像素为右侧遮挡的相位像素。

可选的，作为一个实施例，设备700还可以包括图像传感器704，用于拍摄所述输入图像，其中所述图像传感器704包括用于获取普通像素、第一相位像素和第二相位像素的传感元件。在此情况下，处理器701具体用于从图像传感器704获取输入图像。

处理器701，还用于将该输入图像划分为至少两个区域窗口，该至少两个区域窗口中的每个区域窗口包括该多个相位像素对中的至少两个相邻的相位像素对。

处理器701，还用于根据该至少两个区域窗口中每个区域窗口的至少两个相位像素对，确定该每个区域窗口对应的相位差。

处理器701，还用于根据该每个区域窗口对应的相位差，确定与该输入图像对应的深度图像。

根据图7所示的设备可以根据相位像素，可以确定出深度图像。该设备无需多张输入图像，也无需借助其他辅助设备来获取深度图像。

可选的，作为一个实施例，处理器701，具体用于以第一长度为步长，将该输入图像沿着第一方向的至少一部分划分为具有相同大小的至少两个区域窗口，该第一方向为该输入图像的水平方向或该输入图像的竖直方向。

进一步，处理器701，还用于以第二长度为步长，将该输入图像沿第二方向的至少一部分划分为具有相同大小的至少两个区域窗口，该第二方向与该第一方向垂直。

处理器701，具体用于根据该至少两个区域窗口中每个区域窗口的至少两个相位像素对，确定该每个区域窗口中的第一相位像素和第二相位像素的互相关；根据该每个区域窗口中的第一相位像素和第二相位像素的互相关，确定该每个区域窗口对应的相位差。

本领域普通技术人员可以意识到，结合本文中所公开的实施例描述的各示例的单元及算法步骤，能够以电子硬件、或者计算机软件和电子硬件的结合来实现。这些功能究竟以硬件还是软件方式来执行，取决于技术方案的特定应用和设计约束条件。专业技术人员可以对每个特定的应用来使用不同方法来实现所描述的功能，但是这种实现不应认为超出本发明的范围。

所属领域的技术人员可以清楚地了解到，为描述的方便和简洁，上述描述的***、装置和单元的具体工作过程，可以参考前述方法实施例中的对应过程，在此不再赘述。

在本申请所提供的几个实施例中，应该理解到，所揭露的***、装置和方法，可以通过其它的方式实现。例如，以上所描述的装置实施例仅仅是示意性的，例如，所述单元的划分，仅仅为一种逻辑功能划分，实际实现时可以有另外的划分方式，例如多个单元或组件可以结合或者可以集成到另一个***，或一些特征可以忽略，或不执行。另一点，所显示或讨论的相互之间的耦合或直接耦合或通信连接可以是通过一些接口，装置或单元的间接耦合或通信连接，可以是电性，机械或其它的形式。

所述作为分离部件说明的单元可以是或者也可以不是物理上分开的，作为单元显示的部件可以是或者也可以不是物理单元，即可以位于一个地方，或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部单元来实现本实施例方案的目的。

另外，在本发明各个实施例中的各功能单元可以集成在一个处理单元中，也可以是各个单元单独物理存在，也可以两个或两个以上单元集成在一个单元中。

所述功能如果以软件功能单元的形式实现并作为独立的产品销售或使用时，可以存储在一个计算机可读取存储介质中。基于这样的理解，本发明的技术方案本质上或者说对现有技术做出贡献的部分或者该技术方案的部分可以以软件产品的形式体现出来，该计算机软件产品存储在一个存储介质中，包括若干指令用以使得一台计算机设备(可以是个人计算机，服务器，或者网络设备等)或处理器(processor)执行本发明各个实施例所述方法的全部或部分步骤。而前述的存储介质包括：U盘、移动硬盘、只读存储器(ROM，Read-Only Memory)、随机存取存储器(RAM，Random Access Memory)、磁碟或者光盘等各种可以存储程序代码的介质。

以上所述，仅为本发明的具体实施方式，但本发明的保护范围并不局限于此，任何熟悉本技术领域的技术人员在本发明揭露的技术范围内，可轻易想到的变化或替换，都应涵盖在本发明的保护范围之内，因此本发明的保护范围应以权利要求的保护范围为准。

Claims

一种处理图像的方法，其特征在于，所述方法包括：

获取输入图像，所述输入图像包括多个普通像素和多个相位像素对，所述多个相位像素对中每个相位像素对包括第一相位像素和第二相位像素，所述第一相位像素由左侧遮挡的感光元件获取，所述第二相位像素由右侧遮挡的感光元件获取；

将所述输入图像划分为至少两个区域窗口，所述至少两个区域窗口中的每个区域窗口包括所述多个相位像素对中的至少两个相邻的相位像素对；

根据所述至少两个区域窗口中每个区域窗口的至少两个相位像素对，确定所述每个区域窗口对应的相位差；

根据所述每个区域窗口对应的相位差，确定与所述输入图像对应的深度图像。
如权利要求1所述的方法，其特征在于，所述将所述输入图像划分为至少两个区域窗口，包括：

以第一长度为步长，将所述输入图像沿着第一方向的至少一部分划分为具有相同大小的至少两个区域窗口，所述第一方向为所述输入图像的水平方向或所述输入图像的竖直方向。
如权利要求2所述的方法，其特征在于，所述第一长度大于或等于沿所述第一方向的两个相邻的相位像素对之间的距离。
如权利要求2或3所述的方法，其特征在于，所述第一长度小于所述每个区域窗口延所述第一方向的长度。
如权利要求2至4中任一项所述的方法，其特征在于，所述将所述输入图像划分为至少两个区域窗口，还包括：

以第二长度为步长，将所述输入图像沿第二方向的至少一部分划分为具有相同大小的至少两个区域窗口，所述第二方向与所述第一方向垂直。
如权利要求5所述的方法，其特征在于，所述第二长度大于或等于沿所述第二方向的两个相邻的相位像素对之间的距离。
如权利要求5或6所述的方法，其特征在于，所述第二长度小于所述每个区域窗口延所述第二方向的长度。
如权利要求1至7中任一项所述的方法，其特征在于，所述根据所述至少两个区域窗口中每个区域窗口的至少两个相位像素对，确定所述每个区域窗口对应的相位差，包括：

根据所述至少两个区域窗口中每个区域窗口的至少两个相位像素对，确定所述每个区域窗口中的第一相位像素和第二相位像素的互相关；

根据所述每个区域窗口中的第一相位像素和第二相位像素的互相关，确定所述每个区域窗口对应的相位差。
一种处理图像的设备，其特征在于，所述设备包括：

获取单元，所述获取单元包括多个感光单元，所述多个感光单元包括多个普通感光单元和多个相位感光单元对，所述多个普通感光单元用于获取多个普通像素，所述多个相位感光单元对用于获取多个相位像素对，所述多个相位感光单元中的每个相位感光单元包括第一相位感光单元和第二相位感光单元，所述第一相位感光单元为左侧被遮挡的普通感光单元，所述第二相位感光单元为右侧被遮挡的普通感光单元，所述第一相位感光单元用于获取第一相位像素，所述第二相位感光单元用于获取第二相位像素，所述多个普通像素和所述多个相位像素组成输入图像；

确定单元，用于将所述输入图像划分为至少两个区域窗口，所述至少两个区域窗口中的每个区域窗口包括所述多个相位像素对中的至少两个相邻的相位像素对；

所述确定单元，还用于根据所述至少两个区域窗口中每个区域窗口的至少两个相位像素对，确定所述每个区域窗口对应的相位差；

所述确定单元，还用于根据所述每个区域窗口对应的相位差，确定与所述输入图像对应的深度图像。
如权利要求9所述的设备，其特征在于，所述确定单元，具体用于以第一长度为步长，将所述输入图像沿着第一方向的至少一部分划分为具有相同大小的至少两个区域窗口，所述第一方向为所述输入图像的水平方向或所述输入图像的竖直方向。
如权利要求10所述的设备，其特征在于，所述第一长度大于或等于沿所述第一方向的两个相邻的相位像素对之间的距离。
如权利要求10或11所述的设备，其特征在于，所述第一长度小于所述每个区域窗口延所述第一方向的长度。
如权利要求10至12中任一项所述的设备，其特征在于，所述确定单元，还用于以第二长度为步长，将所述输入图像沿第二方向的至少一部分划分为具有相同大小的至少两个区域窗口，所述第二方向与所述第一方向垂直。
如权利要求13所述的设备，其特征在于，所述第二长度大于或等于沿所述第二方向的两个相邻的相位像素对之间的距离。
如权利要求13或14所述的设备，其特征在于，所述第二长度小于所述每个区域窗口延所述第二方向的长度。
如权利要求9至15中任一项所述的设备，其特征在于，所述确定单元，具体用于根据所述至少两个区域窗口中每个区域窗口的至少两个相位像素对，确定所述每个区域窗口中的第一相位像素和第二相位像素的互相关；根据所述每个区域窗口中的第一相位像素和第二相位像素的互相关，确定所述每个区域窗口对应的相位差。
一种处理图像的设备，其特征在于，所述设备包括：

图像传感器，所述图像传感器包括多个感光单元，所述多个感光单元包括多个普通感光单元和多个相位感光单元对，所述多个普通感光单元用于获取多个普通像素，所述多个相位感光单元对用于获取多个相位像素对，所述多个相位感光单元中的每个相位感光单元包括第一相位感光单元和第二相位感光单元，所述第一相位感光单元为左侧被遮挡的普通感光单元，所述第二相位感光单元为右侧被遮挡的普通感光单元，所述第一相位感光单元用于获取第一相位像素，所述第二相位感光单元用于获取第二相位像素，所述多个普通像素和所述多个相位像素组成输入图像；

处理器，用于将所述输入图像划分为至少两个区域窗口，所述至少两个区域窗口中的每个区域窗口包括所述多个相位像素对中的至少两个相邻的相位像素对；

所述处理器，还用于根据所述至少两个区域窗口中每个区域窗口的至少两个相位像素对，确定所述每个区域窗口对应的相位差；

所述处理器，还用于根据所述每个区域窗口对应的相位差，确定与所述输入图像对应的深度图像。。
如权利要求17所述的设备，其特征在于，所述处理器，具体用于以第一长度为步长，将所述输入图像沿着第一方向的至少一部分划分为具有相同大小的至少两个区域窗口，所述第一方向为所述输入图像的水平方向或所述输入图像的竖直方向。
如权利要求18所述的设备，其特征在于，所述第一长度大于或等于沿所述第一方向的两个相邻的相位像素对之间的距离。
如权利要求18或19所述的设备，其特征在于，所述第一长度小于所述每个区域窗口延所述第一方向的长度。
如权利要求18至20中任一项所述的设备，其特征在于，所述处理器，还用于以第二长度为步长，将所述输入图像沿第二方向的至少一部分划分为具有相同大小的至少两个区域窗口，所述第二方向与所述第一方向垂直。
如权利要求21所述的设备，其特征在于，所述第二长度大于或等于沿所述第二方向的两个相邻的相位像素对之间的距离。
如权利要求21或22所述的设备，其特征在于，所述第二长度小于所述每个区域窗口延所述第二方向的长度。
如权利要求17至23中任一项所述的设备，其特征在于，所述处理器，具体用于根据所述至少两个区域窗口中每个区域窗口的至少两个相位像素对，确定所述每个区域窗口中的第一相位像素和第二相位像素的互相关；根据所述每个区域窗口中的第一相位像素和第二相位像素的互相关，确定所述每个区域窗口对应的相位差。
一种计算机可读存储介质，其特征在于，所述计算机可读存储介质存储的程序包括用于执行如权利要求1至8中任一项方法的指令。