CN114885086A - 一种图像处理方法、头戴式设备和计算机可读存储介质 - Google Patents
一种图像处理方法、头戴式设备和计算机可读存储介质 Download PDFInfo
- Publication number
- CN114885086A CN114885086A CN202110081406.7A CN202110081406A CN114885086A CN 114885086 A CN114885086 A CN 114885086A CN 202110081406 A CN202110081406 A CN 202110081406A CN 114885086 A CN114885086 A CN 114885086A
- Authority
- CN
- China
- Prior art keywords
- frame
- target area
- filling
- head
- target
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000003860 storage Methods 0.000 title claims abstract description 14
- 238000003672 processing method Methods 0.000 title claims abstract description 13
- 238000004422 calculation algorithm Methods 0.000 claims abstract description 79
- 230000011218 segmentation Effects 0.000 claims abstract description 45
- 238000000034 method Methods 0.000 claims description 32
- 230000003287 optical effect Effects 0.000 claims description 12
- 238000004590 computer program Methods 0.000 claims description 7
- 238000004891 communication Methods 0.000 description 32
- 230000006854 communication Effects 0.000 description 32
- 230000006870 function Effects 0.000 description 20
- 238000007726 management method Methods 0.000 description 15
- 238000012545 processing Methods 0.000 description 13
- 238000010295 mobile communication Methods 0.000 description 11
- 230000005236 sound signal Effects 0.000 description 11
- 210000000988 bone and bone Anatomy 0.000 description 10
- 238000013527 convolutional neural network Methods 0.000 description 8
- 238000010586 diagram Methods 0.000 description 8
- 230000000694 effects Effects 0.000 description 6
- 230000003993 interaction Effects 0.000 description 5
- 230000008569 process Effects 0.000 description 5
- 238000005516 engineering process Methods 0.000 description 4
- 239000011521 glass Substances 0.000 description 4
- 229920001621 AMOLED Polymers 0.000 description 3
- 230000001133 acceleration Effects 0.000 description 3
- 238000013528 artificial neural network Methods 0.000 description 3
- 238000013500 data storage Methods 0.000 description 3
- 230000003190 augmentative effect Effects 0.000 description 2
- 230000036772 blood pressure Effects 0.000 description 2
- 238000004364 calculation method Methods 0.000 description 2
- 230000001413 cellular effect Effects 0.000 description 2
- 230000008859 change Effects 0.000 description 2
- 238000013461 design Methods 0.000 description 2
- 238000001514 detection method Methods 0.000 description 2
- 239000000945 filler Substances 0.000 description 2
- 230000002093 peripheral effect Effects 0.000 description 2
- 230000009467 reduction Effects 0.000 description 2
- 238000006467 substitution reaction Methods 0.000 description 2
- 230000002159 abnormal effect Effects 0.000 description 1
- 230000009471 action Effects 0.000 description 1
- 230000003321 amplification Effects 0.000 description 1
- 230000003416 augmentation Effects 0.000 description 1
- 238000010009 beating Methods 0.000 description 1
- 230000007175 bidirectional communication Effects 0.000 description 1
- 238000013529 biological neural network Methods 0.000 description 1
- 230000000903 blocking effect Effects 0.000 description 1
- 210000004556 brain Anatomy 0.000 description 1
- 230000000295 complement effect Effects 0.000 description 1
- 239000004020 conductor Substances 0.000 description 1
- 201000010099 disease Diseases 0.000 description 1
- 208000037265 diseases, disorders, signs and symptoms Diseases 0.000 description 1
- 238000001914 filtration Methods 0.000 description 1
- 230000014509 gene expression Effects 0.000 description 1
- 230000005484 gravity Effects 0.000 description 1
- 230000036541 health Effects 0.000 description 1
- 238000007654 immersion Methods 0.000 description 1
- 230000001939 inductive effect Effects 0.000 description 1
- 230000002452 interceptive effect Effects 0.000 description 1
- 239000010985 leather Substances 0.000 description 1
- 239000004973 liquid crystal related substance Substances 0.000 description 1
- 230000007774 longterm Effects 0.000 description 1
- 238000004519 manufacturing process Methods 0.000 description 1
- 210000002569 neuron Anatomy 0.000 description 1
- 238000003199 nucleic acid amplification method Methods 0.000 description 1
- 238000005457 optimization Methods 0.000 description 1
- 230000010349 pulsation Effects 0.000 description 1
- 239000002096 quantum dot Substances 0.000 description 1
- 238000009877 rendering Methods 0.000 description 1
- 230000002441 reversible effect Effects 0.000 description 1
- 238000005070 sampling Methods 0.000 description 1
- 239000004065 semiconductor Substances 0.000 description 1
- 230000003238 somatosensory effect Effects 0.000 description 1
- 230000001360 synchronised effect Effects 0.000 description 1
- 238000012549 training Methods 0.000 description 1
- 238000012546 transfer Methods 0.000 description 1
- 230000000007 visual effect Effects 0.000 description 1
- 230000001755 vocal effect Effects 0.000 description 1
Images
Classifications
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N23/00—Cameras or camera modules comprising electronic image sensors; Control thereof
- H04N23/80—Camera processing pipelines; Components thereof
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N23/00—Cameras or camera modules comprising electronic image sensors; Control thereof
- H04N23/60—Control of cameras or camera modules
- H04N23/64—Computer-aided capture of images, e.g. transfer from script file into camera, check of taken image quality, advice or proposal for image composition or decision on when to take image
Landscapes
- Engineering & Computer Science (AREA)
- Multimedia (AREA)
- Signal Processing (AREA)
- Physics & Mathematics (AREA)
- Theoretical Computer Science (AREA)
- Data Mining & Analysis (AREA)
- General Health & Medical Sciences (AREA)
- Biomedical Technology (AREA)
- Biophysics (AREA)
- Computational Linguistics (AREA)
- Life Sciences & Earth Sciences (AREA)
- Evolutionary Computation (AREA)
- Artificial Intelligence (AREA)
- Molecular Biology (AREA)
- Computing Systems (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Mathematical Physics (AREA)
- Software Systems (AREA)
- Health & Medical Sciences (AREA)
- User Interface Of Digital Computer (AREA)
Abstract
本发明实施例提供的一种图像处理方法、头戴式设备和计算机可读存储介质的技术方案中,识别到用户的点击手势时,通过相机拍摄当前环境生成拍照帧;通过分割算法对拍照帧进行计算以分割出拍照帧中的指定区域,将分割后的拍照帧作为目标帧,并将目标帧中分割后的指定区域作为目标区域;判断目标区域是否填充完成;若目标区域未填充完成,通过相机拍摄当前环境生成抓拍帧;根据抓拍帧生成填充像素;将填充像素填充至目标区域,并继续进行判断目标区域是否填充完成的步骤;若目标区域填充完成,将填充完成的目标帧作为拍摄照片。本发明实施例能够在手势照场景中移除掉图像中的手部,并恢复手部遮挡的真实背景内容以得到干净的拍照录像画面。
Description
【技术领域】
本发明涉及计算机技术领域,尤其涉及一种图像处理方法、头戴式设备和计算机可读存储介质。
【背景技术】
在头戴式设备的拍照录像场景中,手势操作虽然提供了交互的便利性,但是其也带来了一些新的问题。其中最主要的问题在于,当用户通过手势进行拍照的时,手部很有可能会出现在相机视场范围(Field of View,FoV)内,进而导致拍照或者录像的画面中出现用户的手部,影响画面的整体效果,也有可能会挡住拍摄场景中用户比较关注的背景内容。
目前,在手势拍照场景中并没有移除掉图像中手部并恢复手部遮挡的真实背景内容,以得到干净的拍照录像画面的技术方案。
【发明内容】
有鉴于此,本发明实施例提供了一种图像处理方法、头戴式设备和计算机可读存储介质,能够在手势照场景中移除掉图像中的手部并恢复手部遮挡的真实背景内容,以得到干净的拍照录像画面。
第一方面,本发明实施例提供了一种图像处理方法,应用于头戴式设备,所述头戴式设备包括相机,所述方法包括:
识别到用户的点击手势时,通过所述相机拍摄当前环境生成拍照帧;
通过分割算法对所述拍照帧进行计算以分割出所述拍照帧中的指定区域,将分割后的所述拍照帧作为目标帧,并将所述目标帧中分割后的指定区域作为目标区域;
判断所述目标区域是否填充完成;
若判断出所述目标区域未填充完成,通过所述相机拍摄当前环境生成抓拍帧;
根据所述抓拍帧生成填充像素;
将所述填充像素填充至所述目标区域,并继续进行所述判断所述目标区域是否填充完成的步骤;
若判断出所述目标区域填充完成,将填充完成的目标帧作为拍摄照片。
在一种可能的实现方式中,所述根据所述抓拍帧生成填充像素,具体包括:
通过对齐算法对所述抓拍帧和所述目标帧进行计算,以使所述抓拍帧和所述目标帧对齐;
通过分割算法对对齐后的抓拍帧进行计算生成所述填充像素。
在一种可能的实现方式中,所述判断所述目标区域是否填充完成,具体包括:
判断所述目标区域中每个像素位置的所述填充像素的数量是否大于或者等于预设阈值;
若所述目标区域中每个像素位置的所述填充像素的数量大于或者等于预设阈值,则所述目标区域填充完成;
若所述目标区域中至少一个像素位置的所述填充像素的数量小于所述预设阈值,则所述目标区域未填充完成。
在一种可能的实现方式中,所述分割算法包括基于CNN的语义分割算法或实例分割算法。
在一种可能的实现方式中,所述对齐算法包括基于特征点匹配的全局对齐算法、基于光流的算法或运动估计的局部对齐算法。
在一种可能的实现方式中,所述指定区域包括所述用户的手部区域和/或身体区域。
另一方面,本发明实施例提供了一种头戴式设备,包括相机、处理器和存储器,其中,所述存储器用于存储计算机程序,所述计算机程序包括程序指令,当所述处理器运行所述程序指令时,使所述头戴式设备执行以下步骤:
识别到用户的点击手势时,通过所述相机拍摄当前环境生成拍照帧;
通过分割算法对所述拍照帧进行计算以分割出所述拍照帧中的指定区域,将分割后的所述拍照帧作为目标帧,并将所述目标帧中分割后的指定区域作为目标区域;
判断所述目标区域是否填充完成;
若判断出所述目标区域未填充完成,通过所述相机拍摄当前环境生成抓拍帧;
根据所述抓拍帧生成填充像素;
将所述填充像素填充至所述目标区域,并继续进行所述判断所述目标区域是否填充完成的步骤;
若判断出所述目标区域填充完成,将填充完成的目标帧作为拍摄照片。
在一种可能的实现方式中,当所述处理器运行所述程序指令时,使所述头戴式设备执行以下步骤:
所述根据所述抓拍帧生成填充像素,具体包括:
通过对齐算法对所述抓拍帧和所述目标帧进行计算,以使所述抓拍帧和所述目标帧对齐;
通过分割算法对对齐后的抓拍帧进行计算生成所述填充像素。
在一种可能的实现方式中,当所述处理器运行所述程序指令时,使所述头戴式设备执行以下步骤:
所述判断所述目标区域是否填充完成,具体包括:
判断所述目标区域中每个像素位置的所述填充像素的数量是否大于或者等于预设阈值;
若所述目标区域中每个像素位置的所述填充像素的数量大于或者等于预设阈值,则所述目标区域填充完成;
若所述目标区域中至少一个像素位置的所述填充像素的数量小于所述预设阈值,则所述目标区域未填充完成。
在一种可能的实现方式中,所述分割算法包括基于CNN的语义分割算法或实例分割算法。
在一种可能的实现方式中,所述对齐算法包括基于特征点匹配的全局对齐算法、基于光流的算法或运动估计的局部对齐算法。
在一种可能的实现方式中,所述指定区域包括所述用户的手部区域和/或身体区域。
另一方面,本发明实施例提供了一种计算机可读存储介质,所述计算机可读存储介质存储有计算机程序,所述计算机程序包括程序指令,当所述程序请求被计算机运行时使所述计算机执行如上述所述的方法。
本发明实施例提供的图像处理方法、头戴式设备和计算机可读存储介质的技术方案中,识别到用户的点击手势时,通过相机拍摄当前环境生成拍照帧;通过分割算法对拍照帧进行计算以分割出拍照帧中的指定区域,将分割后的拍照帧作为目标帧,并将目标帧中分割后的指定区域作为目标区域;判断目标区域是否填充完成;若判断出目标区域未填充完成,通过相机拍摄当前环境生成抓拍帧;根据抓拍帧生成填充像素;将填充像素填充至目标区域,并继续进行判断目标区域是否填充完成的步骤;若判断出目标区域填充完成,将填充完成的目标帧作为拍摄照片。本发明实施例能够在手势照场景中移除掉图像中的手部,并恢复手部遮挡的真实背景内容以得到干净的拍照录像画面。
【附图说明】
为了更清楚地说明本发明实施例的技术方案,下面将对实施例中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动性的前提下,还可以根据这些附图获得其它的附图。
图1为手部出现在相机FoV内的示意图;
图2为本发明实施例提供的一种头戴式设备的示意图;
图3为本发明实施例提供的一种头戴式设备的结构示意图;
图4为本发明实施例提供的一种图像处理方法的流程图;
图5为本发明实施例提供的填充目标区域的示意图;
图6为图4中根据抓拍帧生成填充像素的具体流程图;
图7为本发明实施例提供的生成拍摄照片的示意图;
图8为本发明实施例提供的一种头戴式设备的示意性框图。
【具体实施方式】
为了更好的理解本发明的技术方案,下面结合附图对本发明实施例进行详细描述。
应当明确,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其它实施例,都属于本发明保护的范围。
在本发明实施例中使用的术语是仅仅出于描述特定实施例的目的,而非旨在限制本发明。在本发明实施例和所附权利要求书中所使用的单数形式的“一种”、“所述”和“该”也旨在包括多数形式,除非上下文清楚地表示其他含义。
应当理解,本文中使用的术语“和/或”仅仅是一种描述关联对象的关联关系,表示可以存在三种关系,例如,甲和/或乙,可以表示:单独存在甲,同时存在甲和乙,单独存在乙这三种情况。另外,本文中字符“/”,一般表示前后关联对象是一种“或”的关系。
当前市面上出现了越来越多的头戴式设备,例如,头戴式设备包括虚拟现实(Virtual Reality,VR)头盔、增强现实(Augmented Reality,AR)头盔,AR眼镜等。头戴式设备通过创造出沉浸式的交互环境,为用户提供了虚拟现实或增强现实的体验,因此头戴式设备在娱乐、教育、医疗和生产等方面有着越发广泛的应用场景。头戴式设备通常都具备相机,允许用户进行拍照和录像。同时,在VR头盔、AR头盔和AR眼镜中,最主要的交互方式是手势。用户可以通过手势打开关闭应用、与虚拟物体进行交互等;在拍照和录像时,手势则主要是用于触发拍照、开始录像或者结束录像,以及一些其他的功能选择和参数调整等。
在头戴式设备的拍照录像场景中,手势操作虽然提供了交互的便利性,但是也带来了一些新的问题。其中最主要的问题在于,当用户抬起手通过点击手势进行拍照的时候,手部很有可能会出现在相机视场范围(Field of View,FoV)内,进而导致拍照或者录像的画面中出现用户的手部,影响画面的整体效果,也有可能会挡住拍摄场景中用户比较关注的背景内容,如图1所示。
手势拍照导致手部出现在画面中的主要原因在于手部出现在了相机的FoV内,虽然可以通过缩小相机的FoV来避免手部出现,但是这也会导致相机的拍摄视角受限,影响用户拍照体验。此外,如果使用其它技术,例如,其它技术包括语音交互或者小型附属设备交互,虽然可以避免手部出现在FoV内,但是也失去了手势交互的沉浸感和灵活性。
目前,在戴设备手势拍照场景中并没有直接进行手部移除的技术方案。相关技术中移除手势的技术是先将手部扣除,然后通过单帧图像修复的方式进行填充。近些年也出现了很多基于卷积神经网络(Convolutional Neural Network,CNN)的单帧图像修复方法,例如,基于CNN的单帧图像修复方法包括DeepFillv1或DeepFillv2。基于CNN的单帧图像修复方法的核心在于从当前图像上寻找可以用于填充移除区域的像素,然后进行拷贝和修复。由于单帧图像修复方法是通过生成的方式得到被遮挡区域的内容,是一种“无中生有”的病态问题,因此只能基于大量的训练数据集得到一些先验知识然后进行联想。通过单帧图像修复方法可以生成看起来自然的图片,但是生成的内容和用户手部所遮挡的真实背景内容是无关的,如果手部所遮挡的部分是有复杂结构信息的场景,单帧图像修复方法是无法修复的。另外,目前的单帧图像修复方法也比较不成熟,只能处理分辨率较低的图像,在有复杂的结构化纹理的场景容易出现伪影,因此不适用于任意场景中的手势移除。
综上所述,目前在手势拍照场景中并没有移除掉图像中手部并恢复手部遮挡的真实背景内容,以得到干净的拍照录像画面的技术方案。
为了解决上述技术问题,本发明实施例提供一种图像处理方法、头戴式设备和计算机可读存储介质。
图2为本发明实施例提供的一种头戴式设备的示意图。本发明实施例涉及的头戴式设备可以是智能眼镜、VR头盔、AR头盔、AR眼镜或护目镜等。
需要说明的是,图2中示出的头戴式设备仅为一种示意图,本发明实施例并不以此限定。
图3为本发明实施例提供的一种头戴式设备的结构示意图。
头戴式设备100可以包括处理器110,外部存储器接口120,内部存储器121,通用串行总线(universal serial bus,USB)接口130,充电管理模块140,电源管理模块141,电池142,天线1,天线2,移动通信模块150,无线通信模块160,音频模块170,扬声器170A,受话器170B,麦克风170C,耳机接口170D,传感器模块180,按键190,马达191,指示器192,摄像头193,显示屏194,以及用户标识模块(subscriber identification module,SIM)卡接口195等。其中传感器模块180可以包括压力传感器180A,陀螺仪传感器180B,气压传感器180C,磁传感器180D,加速度传感器180E,距离传感器180F,接近光传感器180G,指纹传感器180H,温度传感器180J,触摸传感器180K,环境光传感器180L,骨传导传感器180M等。
可以理解的是,本发明实施例示意的结构并不构成对头戴式设备100的具体限定。在本申请另一些实施例中,头戴式设备100可以包括比图示更多或更少的部件,或者组合某些部件,或者拆分某些部件,或者不同的部件布置。图示的部件可以以硬件,软件或软件和硬件的组合实现。
处理器110可以包括一个或多个处理单元,例如:处理器110可以包括应用处理器(application processor,AP),调制解调处理器,图形处理器(graphics processingunit,GPU),图像信号处理器(image signal processor,ISP),控制器,视频编解码器,数字信号处理器(digital signal processor,DSP),基带处理器,和/或神经网络处理器(neural-network processing unit,NPU)等。其中,不同的处理单元可以是独立的器件,也可以集成在一个或多个处理器中。
控制器可以根据指令操作码和时序信号,产生操作控制信号,完成取指令和执行指令的控制。
处理器110中还可以设置存储器,用于存储指令和数据。在一些实施例中,处理器110中的存储器为高速缓冲存储器。该存储器可以保存处理器110刚用过或循环使用的指令或数据。如果处理器110需要再次使用该指令或数据,可从所述存储器中直接调用。避免了重复存取,减少了处理器110的等待时间,因而提高了***的效率。
在一些实施例中,处理器110可以包括一个或多个接口。接口可以包括集成电路(inter-integrated circuit,I2C)接口,集成电路内置音频(inter-integrated circuitsound,I2S)接口,脉冲编码调制(pulse code modulation,PCM)接口,通用异步收发传输器(universal asynchronous receiver/transmitter,UART)接口,移动产业处理器接口(mobile industry processor interface,MIPI),通用输入输出(general-purposeinput/output,GPIO)接口,用户标识模块(subscriber identity module,SIM)接口,和/或通用串行总线(universal serial bus,USB)接口等。
I2C接口是一种双向同步串行总线,包括一根串行数据线(serial data line,SDA)和一根串行时钟线(derail clock line,SCL)。在一些实施例中,处理器110可以包含多组I2C总线。处理器110可以通过不同的I2C总线接口分别耦合触摸传感器180K,充电器,闪光灯,摄像头193等。例如:处理器110可以通过I2C接口耦合触摸传感器180K,使处理器110与触摸传感器180K通过I2C总线接口通信,实现头戴式设备100的触摸功能。
I2S接口可以用于音频通信。在一些实施例中,处理器110可以包含多组I2S总线。处理器110可以通过I2S总线与音频模块170耦合,实现处理器110与音频模块170之间的通信。在一些实施例中,音频模块170可以通过I2S接口向无线通信模块160传递音频信号,实现通过蓝牙耳机接听电话的功能。
PCM接口也可以用于音频通信,将模拟信号抽样,量化和编码。在一些实施例中,音频模块170与无线通信模块160可以通过PCM总线接口耦合。在一些实施例中,音频模块170也可以通过PCM接口向无线通信模块160传递音频信号,实现通过蓝牙耳机接听电话的功能。所述I2S接口和所述PCM接口都可以用于音频通信。
UART接口是一种通用串行数据总线,用于异步通信。该总线可以为双向通信总线。它将要传输的数据在串行通信与并行通信之间转换。在一些实施例中,UART接口通常被用于连接处理器110与无线通信模块160。例如:处理器110通过UART接口与无线通信模块160中的蓝牙模块通信,实现蓝牙功能。在一些实施例中,音频模块170可以通过UART接口向无线通信模块160传递音频信号,实现通过蓝牙耳机播放音乐的功能。
MIPI接口可以被用于连接处理器110与显示屏194,摄像头193等***器件。MIPI接口包括摄像头串行接口(camera serial interface,CSI),显示屏串行接口(displayserial interface,DSI)等。在一些实施例中,处理器110和摄像头193通过CSI接口通信,实现头戴式设备100的拍摄功能。处理器110和显示屏194通过DSI接口通信,实现头戴式设备100的显示功能。
GPIO接口可以通过软件配置。GPIO接口可以被配置为控制信号,也可被配置为数据信号。在一些实施例中,GPIO接口可以用于连接处理器110与摄像头193,显示屏194,无线通信模块160,音频模块170,传感器模块180等。GPIO接口还可以被配置为I2C接口,I2S接口,UART接口,MIPI接口等。
USB接口130是符合USB标准规范的接口,具体可以是Mini USB接口,Micro USB接口,USB Type C接口等。USB接口130可以用于连接充电器为头戴式设备100充电,也可以用于头戴式设备100与***设备之间传输数据。也可以用于连接耳机,通过耳机播放音频。该接口还可以用于连接其他头戴式设备,例如AR设备等。
可以理解的是,本发明实施例示意的各模块间的接口连接关系,只是示意性说明,并不构成对头戴式设备100的结构限定。在本申请另一些实施例中,头戴式设备100也可以采用上述实施例中不同的接口连接方式,或多种接口连接方式的组合。
充电管理模块140用于从充电器接收充电输入。其中,充电器可以是无线充电器,也可以是有线充电器。在一些有线充电的实施例中,充电管理模块140可以通过USB接口130接收有线充电器的充电输入。在一些无线充电的实施例中,充电管理模块140可以通过头戴式设备100的无线充电线圈接收无线充电输入。充电管理模块140为电池142充电的同时,还可以通过电源管理模块141为头戴式设备供电。
电源管理模块141用于连接电池142,充电管理模块140与处理器110。电源管理模块141接收电池142和/或充电管理模块140的输入,为处理器110,内部存储器121,显示屏194,摄像头193,和无线通信模块160等供电。电源管理模块141还可以用于监测电池容量,电池循环次数,电池健康状态(漏电,阻抗)等参数。在其他一些实施例中,电源管理模块141也可以设置于处理器110中。在另一些实施例中,电源管理模块141和充电管理模块140也可以设置于同一个器件中。
头戴式设备100的无线通信功能可以通过天线1,天线2,移动通信模块150,无线通信模块160,调制解调处理器以及基带处理器等实现。
天线1和天线2用于发射和接收电磁波信号。头戴式设备100中的每个天线可用于覆盖单个或多个通信频带。不同的天线还可以复用,以提高天线的利用率。例如:可以将天线1复用为无线局域网的分集天线。在另外一些实施例中,天线可以和调谐开关结合使用。
移动通信模块150可以提供应用在头戴式设备100上的包括2G/3G/4G/5G等无线通信的解决方案。移动通信模块150可以包括至少一个滤波器,开关,功率放大器,低噪声放大器(low noise amplifier,LNA)等。移动通信模块150可以由天线1接收电磁波,并对接收的电磁波进行滤波,放大等处理,传送至调制解调处理器进行解调。移动通信模块150还可以对经调制解调处理器调制后的信号放大,经天线1转为电磁波辐射出去。在一些实施例中,移动通信模块150的至少部分功能模块可以被设置于处理器110中。在一些实施例中,移动通信模块150的至少部分功能模块可以与处理器110的至少部分模块被设置在同一个器件中。
调制解调处理器可以包括调制器和解调器。其中,调制器用于将待发送的低频基带信号调制成中高频信号。解调器用于将接收的电磁波信号解调为低频基带信号。随后解调器将解调得到的低频基带信号传送至基带处理器处理。低频基带信号经基带处理器处理后,被传递给应用处理器。应用处理器通过音频设备(不限于扬声器170A,受话器170B等)输出声音信号,或通过显示屏194显示图像或视频。在一些实施例中,调制解调处理器可以是独立的器件。在另一些实施例中,调制解调处理器可以独立于处理器110,与移动通信模块150或其他功能模块设置在同一个器件中。
无线通信模块160可以提供应用在头戴式设备100上的包括无线局域网(wirelesslocal area networks,WLAN)(如无线保真(wireless fidelity,Wi-Fi)网络),蓝牙(bluetooth,BT),全球导航卫星***(global navigation satellite system,GNSS),调频(frequency modulation,FM),近距离无线通信技术(near field communication,NFC),红外技术(infrared,IR)等无线通信的解决方案。无线通信模块160可以是集成至少一个通信处理模块的一个或多个器件。无线通信模块160经由天线2接收电磁波,将电磁波信号调频以及滤波处理,将处理后的信号发送到处理器110。无线通信模块160还可以从处理器110接收待发送的信号,对其进行调频,放大,经天线2转为电磁波辐射出去。
在一些实施例中,头戴式设备100的天线1和移动通信模块150耦合,天线2和无线通信模块160耦合,使得头戴式设备100可以通过无线通信技术与网络以及其他设备通信。所述无线通信技术可以包括全球移动通讯***(global system for mobilecommunications,GSM),通用分组无线服务(general packet radio service,GPRS),码分多址接入(code division multiple access,CDMA),宽带码分多址(wideband codedivision multiple access,WCDMA),时分码分多址(time-division code divisionmultiple access,TD-SCDMA),长期演进(long term evolution,LTE),BT,GNSS,WLAN,NFC,FM,和/或IR技术等。所述GNSS可以包括全球卫星定位***(global positioning system,GPS),全球导航卫星***(global navigation satellite system,GLONASS),北斗卫星导航***(beidou navigation satellite system,BDS),准天顶卫星***(quasi-zenithsatellite system,QZSS)和/或星基增强***(satellite based augmentation systems,SBAS)。
头戴式设备100通过GPU,显示屏194,以及应用处理器等实现显示功能。GPU为图像处理的微处理器,连接显示屏194和应用处理器。GPU用于执行数学和几何计算,用于图形渲染。处理器110可包括一个或多个GPU,其执行程序指令以生成或改变显示信息。
显示屏194用于显示图像,视频等。显示屏194包括显示面板。显示面板可以采用液晶显示屏(liquid crystal display,LCD),有机发光二极管(organic light-emittingdiode,OLED),有源矩阵有机发光二极体或主动矩阵有机发光二极体(active-matrixorganic light emitting diode的,AMOLED),柔性发光二极管(flex light-emittingdiode,FLED),Miniled,MicroLed,Micro-oLed,量子点发光二极管(quantum dot lightemitting diodes,QLED)等。在一些实施例中,头戴式设备100可以包括1个或N个显示屏194,N为大于1的正整数。
头戴式设备100可以通过ISP,摄像头193,视频编解码器,GPU,显示屏194以及应用处理器等实现拍摄功能。
ISP用于处理摄像头193反馈的数据。例如,拍照时,打开快门,光线通过镜头被传递到摄像头感光元件上,光信号转换为电信号,摄像头感光元件将所述电信号传递给ISP处理,转化为肉眼可见的图像。ISP还可以对图像的噪点,亮度,肤色进行算法优化。ISP还可以对拍摄场景的曝光,色温等参数优化。在一些实施例中,ISP可以设置在摄像头193中。
摄像头193用于捕获静态图像或视频。物体通过镜头生成光学图像投射到感光元件。感光元件可以是电荷耦合器件(charge coupled device,CCD)或互补金属氧化物半导体(complementary metal-oxide-semiconductor,CMOS)光电晶体管。感光元件把光信号转换成电信号,之后将电信号传递给ISP转换成数字图像信号。ISP将数字图像信号输出到DSP加工处理。DSP将数字图像信号转换成标准的RGB,YUV等格式的图像信号。在一些实施例中,头戴式设备100可以包括1个或N个摄像头193,N为大于1的正整数。
数字信号处理器用于处理数字信号,除了可以处理数字图像信号,还可以处理其他数字信号。例如,当头戴式设备100在频点选择时,数字信号处理器用于对频点能量进行傅里叶变换等。
视频编解码器用于对数字视频压缩或解压缩。头戴式设备100可以支持一种或多种视频编解码器。这样,头戴式设备100可以播放或录制多种编码格式的视频,例如:动态图像专家组(moving picture experts group,MPEG)1,MPEG2,MPEG3,MPEG4等。
NPU为神经网络(neural-network,NN)计算处理器,通过借鉴生物神经网络结构,例如借鉴人脑神经元之间传递模式,对输入信息快速处理,还可以不断的自学习。通过NPU可以实现头戴式设备100的智能认知等应用,例如:图像识别,人脸识别,语音识别,文本理解等。
外部存储器接口120可以用于连接外部存储卡,例如Micro SD卡,实现扩展头戴式设备100的存储能力。外部存储卡通过外部存储器接口120与处理器110通信,实现数据存储功能。例如将音乐,视频等文件保存在外部存储卡中。
内部存储器121可以用于存储计算机可执行程序代码,所述可执行程序代码包括指令。内部存储器121可以包括存储程序区和存储数据区。其中,存储程序区可存储操作***,至少一个功能所需的应用程序(比如声音播放功能,图像播放功能等)等。存储数据区可存储头戴式设备100使用过程中所创建的数据(比如音频数据,电话本等)等。此外,内部存储器121可以包括高速随机存取存储器,还可以包括非易失性存储器,例如至少一个磁盘存储器件,闪存器件,通用闪存存储器(universal flash storage,UFS)等。处理器110通过运行存储在内部存储器121的指令,和/或存储在设置于处理器中的存储器的指令,执行头戴式设备100的各种功能应用以及数据处理。
头戴式设备100可以通过音频模块170,扬声器170A,受话器170B,麦克风170C,耳机接口170D,以及应用处理器等实现音频功能。例如音乐播放,录音等。
音频模块170用于将数字音频信息转换成模拟音频信号输出,也用于将模拟音频输入转换为数字音频信号。音频模块170还可以用于对音频信号编码和解码。在一些实施例中,音频模块170可以设置于处理器110中,或将音频模块170的部分功能模块设置于处理器110中。
扬声器170A,也称“喇叭”,用于将音频电信号转换为声音信号。头戴式设备100可以通过扬声器170A收听音乐,或收听免提通话。
受话器170B,也称“听筒”,用于将音频电信号转换成声音信号。当头戴式设备100接听电话或语音信息时,可以通过将受话器170B靠近人耳接听语音。
麦克风170C,也称“话筒”,“传声器”,用于将声音信号转换为电信号。当拨打电话或发送语音信息时,用户可以通过人嘴靠近麦克风170C发声,将声音信号输入到麦克风170C。头戴式设备100可以设置至少一个麦克风170C。在另一些实施例中,头戴式设备100可以设置两个麦克风170C,除了采集声音信号,还可以实现降噪功能。在另一些实施例中,头戴式设备100还可以设置三个,四个或更多麦克风170C,实现采集声音信号,降噪,还可以识别声音来源,实现定向录音功能等。
耳机接口170D用于连接有线耳机。耳机接口170D可以是USB接口130,也可以是3.5mm的开放移动头戴式设备平台(open mobile terminal platform,OMTP)标准接口,美国蜂窝电信工业协会(cellular telecommunications industry association of theUSA,CTIA)标准接口。
压力传感器180A用于感受压力信号,可以将压力信号转换成电信号。在一些实施例中,压力传感器180A可以设置于显示屏194。压力传感器180A的种类很多,如电阻式压力传感器,电感式压力传感器,电容式压力传感器等。电容式压力传感器可以是包括至少两个具有导电材料的平行板。当有力作用于压力传感器180A,电极之间的电容改变。头戴式设备100根据电容的变化确定压力的强度。当有触摸操作作用于显示屏194,头戴式设备100根据压力传感器180A检测所述触摸操作强度。头戴式设备100也可以根据压力传感器180A的检测信号计算触摸的位置。在一些实施例中,作用于相同触摸位置,但不同触摸操作强度的触摸操作,可以对应不同的操作指令。例如:当有触摸操作强度小于第一压力阈值的触摸操作作用于短消息应用图标时,执行查看短消息的指令。当有触摸操作强度大于或等于第一压力阈值的触摸操作作用于短消息应用图标时,执行新建短消息的指令。
陀螺仪传感器180B可以用于确定头戴式设备100的运动姿态。在一些实施例中,可以通过陀螺仪传感器180B确定头戴式设备100围绕三个轴(即,x,y和z轴)的角速度。陀螺仪传感器180B可以用于拍摄防抖。示例性的,当按下快门,陀螺仪传感器180B检测头戴式设备100抖动的角度,根据角度计算出镜头模组需要补偿的距离,让镜头通过反向运动抵消头戴式设备100的抖动,实现防抖。陀螺仪传感器180B还可以用于导航,体感游戏场景。
气压传感器180C用于测量气压。在一些实施例中,头戴式设备100通过气压传感器180C测得的气压值计算海拔高度,辅助定位和导航。
磁传感器180D包括霍尔传感器。头戴式设备100可以利用磁传感器180D检测翻盖皮套的开合。在一些实施例中,当头戴式设备100是翻盖机时,头戴式设备100可以根据磁传感器180D检测翻盖的开合。进而根据检测到的皮套的开合状态或翻盖的开合状态,设置翻盖自动解锁等特性。
加速度传感器180E可检测头戴式设备100在各个方向上(一般为三轴)加速度的大小。当头戴式设备100静止时可检测出重力的大小及方向。还可以用于识别头戴式设备姿态,应用于横竖屏切换,计步器等应用。
距离传感器180F,用于测量距离。头戴式设备100可以通过红外或激光测量距离。在一些实施例中,拍摄场景,头戴式设备100可以利用距离传感器180F测距以实现快速对焦。
接近光传感器180G可以包括例如发光二极管(LED)和光检测器,例如光电二极管。发光二极管可以是红外发光二极管。头戴式设备100通过发光二极管向外发射红外光。头戴式设备100使用光电二极管检测来自附近物体的红外反射光。当检测到充分的反射光时,可以确定头戴式设备100附近有物体。当检测到不充分的反射光时,头戴式设备100可以确定头戴式设备100附近没有物体。头戴式设备100可以利用接近光传感器180G检测用户手持头戴式设备100贴近耳朵通话,以便自动熄灭屏幕达到省电的目的。接近光传感器180G也可用于皮套模式,口袋模式自动解锁与锁屏。
环境光传感器180L用于感知环境光亮度。头戴式设备100可以根据感知的环境光亮度自适应调节显示屏194亮度。环境光传感器180L也可用于拍照时自动调节白平衡。环境光传感器180L还可以与接近光传感器180G配合,检测头戴式设备100是否在口袋里,以防误触。
指纹传感器180H用于采集指纹。头戴式设备100可以利用采集的指纹特性实现指纹解锁,访问应用锁,指纹拍照,指纹接听来电等。
温度传感器180J用于检测温度。在一些实施例中,头戴式设备100利用温度传感器180J检测的温度,执行温度处理策略。例如,当温度传感器180J上报的温度超过阈值,头戴式设备100执行降低位于温度传感器180J附近的处理器的性能,以便降低功耗实施热保护。在另一些实施例中,当温度低于另一阈值时,头戴式设备100对电池142加热,以避免低温导致头戴式设备100异常关机。在其他一些实施例中,当温度低于又一阈值时,头戴式设备100对电池142的输出电压执行升压,以避免低温导致的异常关机。
触摸传感器180K,也称“触控器件”。触摸传感器180K可以设置于显示屏194,由触摸传感器180K与显示屏194组成触摸屏,也称“触控屏”。触摸传感器180K用于检测作用于其上或附近的触摸操作。触摸传感器可以将检测到的触摸操作传递给应用处理器,以确定触摸事件类型。可以通过显示屏194提供与触摸操作相关的视觉输出。在另一些实施例中,触摸传感器180K也可以设置于头戴式设备100的表面,与显示屏194所处的位置不同。
骨传导传感器180M可以获取振动信号。在一些实施例中,骨传导传感器180M可以获取人体声部振动骨块的振动信号。骨传导传感器180M也可以接触人体脉搏,接收血压跳动信号。在一些实施例中,骨传导传感器180M也可以设置于耳机中,结合成骨传导耳机。音频模块170可以基于所述骨传导传感器180M获取的声部振动骨块的振动信号,解析出语音信号,实现语音功能。应用处理器可以基于所述骨传导传感器180M获取的血压跳动信号解析心率信息,实现心率检测功能。
按键190包括开机键,音量键等。按键190可以是机械按键。也可以是触摸式按键。头戴式设备100可以接收按键输入,产生与头戴式设备100的用户设置以及功能控制有关的键信号输入。
马达191可以产生振动提示。马达191可以用于来电振动提示,也可以用于触摸振动反馈。例如,作用于不同应用(例如拍照,音频播放等)的触摸操作,可以对应不同的振动反馈效果。作用于显示屏194不同区域的触摸操作,马达191也可对应不同的振动反馈效果。不同的应用场景(例如:时间提醒,接收信息,闹钟,游戏等)也可以对应不同的振动反馈效果。触摸振动反馈效果还可以支持自定义。
指示器192可以是指示灯,可以用于指示充电状态,电量变化,也可以用于指示消息,未接来电,通知等。
SIM卡接口195用于连接SIM卡。SIM卡可以通过***SIM卡接口195,或从SIM卡接口195拔出,实现和头戴式设备100的接触和分离。头戴式设备100可以支持1个或N个SIM卡接口,N为大于1的正整数。SIM卡接口195可以支持Nano SIM卡,Micro SIM卡,SIM卡等。同一个SIM卡接口195可以同时***多张卡。所述多张卡的类型可以相同,也可以不同。SIM卡接口195也可以兼容不同类型的SIM卡。SIM卡接口195也可以兼容外部存储卡。头戴式设备100通过SIM卡和网络交互,实现通话以及数据通信等功能。在一些实施例中,头戴式设备100采用eSIM,即:嵌入式SIM卡。eSIM卡可以嵌在头戴式设备100中,不能和头戴式设备100分离。
基于上述图2和图3提供的头戴式设备,本发明实施例提供一种图像处理方法,应用于头戴式设备,头戴式设备包括相机。图4为本发明实施例提供的一种图像处理方法的流程图。如图4所示,该方法包括:
步骤102、识别到用户的点击手势时,通过相机拍摄当前环境生成拍照帧。
本发明实施例中,各步骤由头戴式设备执行,无需借助外置设备。
用户在戴上头戴式设备并对头戴式设备进行开机操作后,头戴式设备的处理器根据开机操作执行开机后,头戴式设备的摄像头被打开,同时头戴式设备的显示器显示头戴式设备中的应用程序图标。用户使用头戴式设备拍照前,头戴式设备的摄像头检测到用户对相机应用程序图标的点击手势后,向头戴式设备的处理器发送打开相机请求。处理器根据该打开相机请求携带的点击手势信息,识别出该点击手势为对相机应用程序图标的点击手势后,打开相机。摄像头再次检测到用户的点击手势后,向头戴式设备的处理器发送拍摄请求,处理器根据该拍摄请求携带的点击手势信息,识别出该点击手势为拍照的点击手势后,通过相机调用摄像头拍摄当前环境生成拍照帧。
步骤104、通过分割算法对拍照帧进行计算以分割出拍照帧中的指定区域,将分割后的拍照帧作为目标帧,并将目标帧中分割后的指定区域作为目标区域。
该步骤中,头戴式设备的摄像头将拍摄的拍照帧发送至头戴式设备的处理器,头戴式设备的处理器通过分割算法对拍照帧进行计算,以分割出拍照帧中的指定区域。
本发明实施例中,分割算法包括基于CNN的语义分割算法或实例分割算法。
例如:实例分割算法包括DeepLabv3+算法、PSPNet算法或MaskRCNN算法。
本发明实施例中,通过分割算法对拍照帧进行手部分割、身体分割和/或运动分割,以分割出拍照帧中的指定区域。其中,指定区域包括用户的手部区域和/或身体区域。如图1和7所示,以指定区域包括用户的手部区域为例,摄像头根据用户的点击手势进行拍照时将用户的手部拍摄进拍照帧的画面中。
需要说明的是,本发明实施例可以通过建立手部分割数据集、身体分割数据集和/或运动分割数据集进行重训练来提升对指定区域分割的精度。
步骤106、判断目标区域是否填充完成,若否,执行步骤108;若是,执行步骤112。
本发明实施例中,头戴式设备的处理器判断目标区域是否填充完成。
进一步的,步骤106具体包括:
步骤1062、判断目标区域中每个像素位置的填充像素的数量是否大于或者等于预设阈值,若否,执行步骤1064;若是,执行步骤1066。
本发明实施例中,头戴式设备的处理器判断目标区域中每个像素位置的填充像素的数量是否大于或者等于预设阈值。
其中,填充像素是根据后续拍摄的抓拍帧中生成的用于填充目标区域的像素。由于目标区域可能需要多次进行填充,因此也需要拍摄多个抓拍帧,可以根据实际需要设置预设阈值判断目标区域是否填充完成,以使头戴式设备的处理器决定是否继续拍摄抓拍帧。
步骤1064、则目标区域未填充完成,执行步骤108。
本发明实施例中,头戴式设备的处理器若判断出目标区域中每个像素位置的填充像素的数量小于预设阈值,则目标区域未填充完成,执行步骤108。
例如,预设阈值包括2。如图5所示,目标帧的目标区域在未填充像素时,每个像素位置的填充像素数量为0。拍摄抓拍帧1,将根据抓拍帧1中生成的填充像素对目标区域填充后,目标区域中至少一个像素位置的填充像素的数量为0或者1,由于目标区域中至少一个像素位置的填充像素的数量小于2,则目标区域未填充完成。拍摄抓拍帧2,将根据抓拍帧2中生成的填充像素对目标区域填充后,目标区域中至少一个像素位置的填充像素的数量为0或者1或者2,由于目标区域中至少一个像素位置的填充像素的数量小于2,则目标区域未填充完成。拍摄抓拍帧3,将根据抓拍帧3中生成的填充像素对目标区域填充后,目标区域中至少一个像素位置的填充像素的数量为1或者2或者3,由于目标区域中至少一个像素位置的填充像素的数量小于2,则目标区域未填充完成,继续拍摄抓拍帧4。
步骤1066、则目标区域填充完成,执行步骤114。
本发明实施例中,头戴式设备的处理器若判断出目标区域中至少一个像素位置的填充像素的数量大于或者等于预设阈值,则目标区域填充完成,执行步骤114。
如图5所示,拍摄抓拍帧4,将根据抓拍帧4中生成的填充像素对目标区域填充后,目标区域中每个像素位置的填充像素的数量为2或者3或者4,由于目标区域中每个像素位置的填充像素的数量大于或者等于2,则目标区域填充完成,停止拍摄抓拍帧。
步骤108、通过相机拍摄当前环境生成抓拍帧。
本发明实施例中,头戴式设备的处理器判断出目标区域未填充完成,通过相机调用摄像头拍摄当前环境生成抓拍帧;摄像头将拍摄的抓拍帧发送至头戴式设备的处理器。
如图5所示,当目标帧的目标区域中的每个位置的填充像素的数量小于2时,目标区域未填充完成,继续通过相机拍摄当前环境生成抓拍帧。
步骤110、根据抓拍帧生成填充像素。
本发明实施例中,头戴式设备的处理器接收摄像头拍摄的抓拍帧,然后根据抓拍帧生成填充像素。
进一步地,如图6所示,步骤110具体包括:
步骤1102、通过对齐算法对抓拍帧和目标帧进行计算,以使抓拍帧和目标帧对齐。
本发明实施例中,头戴式设备的处理器通过对齐算法对抓拍帧和目标帧进行计算,以使抓拍帧和目标帧对齐。
本发明实施例中,对齐算法包括基于特征点匹配的全局对齐算法、基于光流的算法或运动估计的局部对齐算法。
例如:基于特征点匹配的全局对齐算法中的特征点包括尺度不变特征转换(ScaleInvariant Feature Transform,SIFT)特征点或加速稳健特征(Speeded Up RobustFeatures,SURF)特征点。
例如:基于光流的算法包括FlowNet算法或PWC-Net算法。
步骤1104、通过分割算法对对齐后的抓拍帧进行计算生成填充像素。
本发明实施例中,头戴式设备的处理器通过分割算法对对齐后的抓拍帧进行计算生成填充像素。
步骤112、将填充像素填充至目标区域,并继续执行步骤106。
本发明实施例中,头戴式设备的处理器将填充像素填充至目标区域。
本发明实施例中,对于目标帧中的目标区域中的每个像素位置维护一个从抓拍帧进行填充的备选像素集合。每抓拍一个抓拍帧,就通过分割算法得到可用于填充目标区域的填充像素,然后将填充像素更新到备选像素集合中。
如图5所示,分别将根据抓拍帧1、抓拍帧2、抓拍帧3、抓拍帧4生成的填充像素填充至目标帧的目标区域中对应的像素位置。
步骤114、将填充完成的目标帧作为拍摄照片。
本发明实施例中,处理器将填充完成的目标帧作为拍摄照片进行显示和/或保存。
如图5所示,当目标帧的目标区域中的每个位置的填充像素的数量大于或者等于2时,目标区域填充完成,无需再获取抓拍帧,将填充完成的目标帧作为拍摄照片进行显示和/或保存。
例如,如图7所示,拍照帧中用户的手部遮挡了背景内容,首先将拍照帧中用户的手部区域分割掉得到目标帧,然后分别获取抓拍帧1、抓拍帧2和抓拍帧3,并将抓拍帧1、抓拍帧2和抓拍帧3对齐到目标帧,通过分割算法分别对对齐后的抓拍帧1、抓拍帧2和抓拍帧3计算得到用于填充目标区域的填充像素,当整个目标区域都被填充完成后,停止采集抓拍帧,将填充完成的目标帧作为干净真实的拍摄照片进行显示和/或保存。
本发明实施例利用用户完成拍照手势动作后手部自然下降的习惯,从后续的抓拍帧中搜索可以用于填充目标区域的真实的背景像素,从而恢复手部遮挡的背景内容,最终得到干净的拍照录像画面。
本发明实施例提供的图像处理方法中,识别到用户的点击手势时,通过相机拍摄当前环境生成拍照帧;通过分割算法对拍照帧进行计算以分割出拍照帧中的指定区域,将分割后的拍照帧作为目标帧,并将目标帧中分割后的指定区域作为目标区域;判断目标区域是否填充完成;若判断出目标区域未填充完成,通过相机拍摄当前环境生成抓拍帧;根据抓拍帧生成填充像素;将填充像素填充至目标区域,并继续进行判断目标区域是否填充完成的步骤;若判断出目标区域填充完成,将填充完成的目标帧作为拍摄照片。本发明实施例能够在手势照场景中移除掉图像中的手部,并恢复手部遮挡的真实背景内容以得到干净的拍照录像画面。
基于上述图2和图3提供的头戴式设备,本发明实施例提供一种头戴式设备200,头戴式设备200包括相机。图8为本发明实施例提供的一种头戴式设备200的示意性框图。应理解,头戴式设备200能够执行图4和图6的方法中的步骤,为了避免重复,此处不再详述。头戴式设备200包括:第一拍摄单元21、分割单元22、判断单元23、第二拍摄单元24、生成单元25和填充单元26。
第一拍摄单元21,用于识别到用户的点击手势时,通过相机拍摄当前环境生成拍照帧。
分割单元22,用于通过分割算法对拍照帧进行计算以分割出拍照帧中的指定区域,将分割后的拍照帧作为目标帧,并将目标帧中分割后的指定区域作为目标区域。
本发明实施例中,分割算法包括基于CNN的语义分割算法或实例分割算法。
本发明实施例中,指定区域包括所述用户的手部区域和/或身体区域。
判断单元23,用于判断目标区域是否填充完成。
进一步的,判断单元23具体用于判断目标区域中每个像素位置的填充像素的数量是否大于或者等于预设阈值。
第二拍摄单元24,用于若判断单元23判断出目标区域未填充完成,通过相机拍摄当前环境生成抓拍帧。
具体地,第二拍摄单元24,用于若判断单元23判断出目标区域中至少一个像素位置的填充像素的数量小于预设阈值,则目标区域未填充完成,则目标区域未填充完成,根据抓拍帧生成填充像素。
生成单元25,用于根据抓拍帧生成填充像素。
进一步地,生成单元25具体包括:
对齐子单元251,用于通过对齐算法对抓拍帧和目标帧进行计算,以使抓拍帧和目标帧对齐。
本发明实施例中,对齐算法包括基于特征点匹配的全局对齐算法、基于光流的算法或运动估计的局部对齐算法。
生成子单元252,用于通过分割算法对对齐后的抓拍帧进行计算生成填充像素。
填充单元26,用于将填充像素填充至目标区域,并继续执行判断目标区域是否填充完成的操作。
本发明实施例中,判断单元23还用于若判断单元23判断出目标区域填充完成,将填充完成的目标帧作为拍摄照片。
具体地,判断单元23还用于若判断单元23判断出目标区域中每个像素位置的填充像素的数量大于或者等于预设阈值,则目标区域填充完成,将填充完成的目标帧作为拍摄照片。
应理解,这里的头戴式设备200以功能单元的形式体现。这里的术语“单元”可以通过软件和/或硬件形式实现,对此不作具体限定。例如,“单元”可以是实现上述功能的软件程序、硬件电路或二者结合。所述硬件电路可能包括应用特有集成电路(applicationspecific integrated circuit,ASIC)、电子电路、用于执行一个或多个软件或固件程序的处理器(例如共享处理器、专有处理器或组处理器等)和存储器、合并逻辑电路和/或其它支持所描述的功能的合适组件。
因此,在本发明的实施例中描述的各示例的单元,能够以电子硬件、或者计算机软件和电子硬件的结合来实现。这些功能究竟以硬件还是软件方式来执行,取决于技术方案的特定应用和设计约束条件。专业技术人员可以对每个特定的应用来使用不同方法来实现所描述的功能,但是这种实现不应认为超出本发明的范围。
本发明实施例提供一种计算机可读存储介质,该计算机可读存储介质中存储有指令,当该指令在终端设备上运行时,使得终端设备执行如上述图4和图6所示的方法中头戴式执行的各个步骤。
本发明实施例还提供了一种包含指令的计算机程序产品,当该计算机程序产品在计算机或任一至少一种处理器上运行时,使得计算机执行如上述图4和图6所示的方法中头戴式执行的各个步骤。
本发明实施例中,“至少一个”是指一个或者多个,“多个”是指两个或两个以上。“和/或”,描述关联对象的关联关系,表示可以存在三种关系,例如,A和/或B,可以表示单独存在A、同时存在A和B、单独存在B的情况。其中A,B可以是单数或者复数。字符“/”一般表示前后关联对象是一种“或”的关系。“以下至少一项”及其类似表达,是指的这些项中的任意组合,包括单项或复数项的任意组合。例如,a,b和c中的至少一项可以表示:a,b,c,a-b,a-c,b-c,或a-b-c,其中a,b,c可以是单个,也可以是多个。
本领域普通技术人员可以意识到,本文中公开的实施例中描述的各单元及算法步骤,能够以电子硬件、计算机软件和电子硬件的结合来实现。这些功能究竟以硬件还是软件方式来执行,取决于技术方案的特定应用和设计约束条件。专业技术人员可以对每个特定的应用来使用不同方法来实现所描述的功能,但是这种实现不应认为超出本发明的范围。
所属领域的技术人员可以清楚地了解到,为描述的方便和简洁,上述描述的***、装置和单元的具体工作过程,可以参考前述方法实施例中的对应过程,在此不再赘述。
在本发明所提供的几个实施例中,任一功能如果以软件功能单元的形式实现并作为独立的产品销售或使用时,可以存储在一个计算机可读取存储介质中。基于这样的理解,本发明的技术方案本质上或者说对现有技术做出贡献的部分或者该技术方案的部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质中,包括若干指令用以使得一台电子设备(可以是个人计算机,服务器,或者网络设备等)执行本发明各个实施例所述方法的全部或部分步骤。而前述的存储介质包括:U盘、移动硬盘、只读存储器(read-only memory,ROM)、随机存取存储器(random access memory,RAM)、磁碟或者光盘等各种可以存储程序代码的介质。
以上所述,仅为本发明的具体实施方式,任何熟悉本技术领域的技术人员在本发明揭露的技术范围内,可轻易想到变化或替换,都应涵盖在本发明的保护范围之内。本发明的保护范围应以所述权利要求的保护范围为准。
Claims (13)
1.一种图像处理方法,其特征在于,应用于头戴式设备,所述头戴式设备包括相机,所述方法包括:
识别到用户的点击手势时,通过所述相机拍摄当前环境生成拍照帧;
通过分割算法对所述拍照帧进行计算以分割出所述拍照帧中的指定区域,将分割后的所述拍照帧作为目标帧,并将所述目标帧中分割后的指定区域作为目标区域;
判断所述目标区域是否填充完成;
若判断出所述目标区域未填充完成,通过所述相机拍摄当前环境生成抓拍帧;
根据所述抓拍帧生成填充像素;
将所述填充像素填充至所述目标区域,并继续进行所述判断所述目标区域是否填充完成的步骤;
若判断出所述目标区域填充完成,将填充完成的目标帧作为拍摄照片。
2.根据权利要求1所述的方法,其特征在于,所述根据所述抓拍帧生成填充像素,具体包括:
通过对齐算法对所述抓拍帧和所述目标帧进行计算,以使所述抓拍帧和所述目标帧对齐;
通过分割算法对对齐后的抓拍帧进行计算生成所述填充像素。
3.根据权利要求2所述的方法,其特征在于,所述判断所述目标区域是否填充完成,具体包括:
判断所述目标区域中每个像素位置的所述填充像素的数量是否大于或者等于预设阈值;
若所述目标区域中每个像素位置的所述填充像素的数量大于或者等于预设阈值,则所述目标区域填充完成;
若所述目标区域中至少一个像素位置的所述填充像素的数量小于所述预设阈值,则所述目标区域未填充完成。
4.根据权利要求1或2所述的方法,其特征在于,所述分割算法包括基于CNN的语义分割算法或实例分割算法。
5.根据权利要求2所述的方法,其特征在于,所述对齐算法包括基于特征点匹配的全局对齐算法、基于光流的算法或运动估计的局部对齐算法。
6.根据权利要求1所述的方法,其特征在于,所述指定区域包括所述用户的手部区域和/或身体区域。
7.一种头戴式设备,其特征在于,包括相机、处理器和存储器,其中,所述存储器用于存储计算机程序,所述计算机程序包括程序指令,当所述处理器运行所述程序指令时,使所述头戴式设备执行以下步骤:
识别到用户的点击手势时,通过所述相机拍摄当前环境生成拍照帧;
通过分割算法对所述拍照帧进行计算以分割出所述拍照帧中的指定区域,将分割后的所述拍照帧作为目标帧,并将所述目标帧中分割后的指定区域作为目标区域;
判断所述目标区域是否填充完成;
若判断出所述目标区域未填充完成,通过所述相机拍摄当前环境生成抓拍帧;
根据所述抓拍帧生成填充像素;
将所述填充像素填充至所述目标区域,并继续进行所述判断所述目标区域是否填充完成的步骤;
若判断出所述目标区域填充完成,将填充完成的目标帧作为拍摄照片。
8.根据权利要求7所述的头戴式设备,其特征在于,当所述处理器运行所述程序指令时,使所述头戴式设备执行以下步骤:
所述根据所述抓拍帧生成填充像素,具体包括:
通过对齐算法对所述抓拍帧和所述目标帧进行计算,以使所述抓拍帧和所述目标帧对齐;
通过分割算法对对齐后的抓拍帧进行计算生成所述填充像素。
9.根据权利要求8所述的头戴式设备,其特征在于,当所述处理器运行所述程序指令时,使所述头戴式设备执行以下步骤:
所述判断所述目标区域是否填充完成,具体包括:
判断所述目标区域中每个像素位置的所述填充像素的数量是否大于或者等于预设阈值;
若所述目标区域中每个像素位置的所述填充像素的数量大于或者等于预设阈值,则所述目标区域填充完成;
若所述目标区域中至少一个像素位置的所述填充像素的数量小于所述预设阈值,则所述目标区域未填充完成。
10.根据权利要求7或8所述的头戴式设备,其特征在于,所述分割算法包括基于CNN的语义分割算法或实例分割算法。
11.根据权利要求8所述的头戴式设备,其特征在于,所述对齐算法包括基于特征点匹配的全局对齐算法、基于光流的算法或运动估计的局部对齐算法。
12.根据权利要求7所述的头戴式设备,其特征在于,所述指定区域包括所述用户的手部区域和/或身体区域。
13.一种计算机可读存储介质,其特征在于,所述计算机可读存储介质存储有计算机程序,所述计算机程序包括程序指令,当所述程序请求被计算机运行时使所述计算机执行如权利要求1-6任一项所述的方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202110081406.7A CN114885086A (zh) | 2021-01-21 | 2021-01-21 | 一种图像处理方法、头戴式设备和计算机可读存储介质 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202110081406.7A CN114885086A (zh) | 2021-01-21 | 2021-01-21 | 一种图像处理方法、头戴式设备和计算机可读存储介质 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN114885086A true CN114885086A (zh) | 2022-08-09 |
Family
ID=82667687
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202110081406.7A Pending CN114885086A (zh) | 2021-01-21 | 2021-01-21 | 一种图像处理方法、头戴式设备和计算机可读存储介质 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN114885086A (zh) |
Citations (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN101266685A (zh) * | 2007-03-14 | 2008-09-17 | 中国科学院自动化研究所 | 一种基于多幅照片去除无关图像的方法 |
US20110103644A1 (en) * | 2009-10-30 | 2011-05-05 | Zoran Corporation | Method and apparatus for image detection with undesired object removal |
JP2017097800A (ja) * | 2015-11-27 | 2017-06-01 | 日本電信電話株式会社 | 画像処理装置、画像処理方法及びコンピュータプログラム |
CN107886471A (zh) * | 2017-11-03 | 2018-04-06 | 北京航空航天大学 | 一种基于超像素投票模型的照片多余物体去除方法 |
CN108513664A (zh) * | 2017-02-06 | 2018-09-07 | 华为技术有限公司 | 图像处理的方法和设备 |
CN109035185A (zh) * | 2018-06-29 | 2018-12-18 | 努比亚技术有限公司 | 一种图像处理方法及终端 |
CN109978805A (zh) * | 2019-03-18 | 2019-07-05 | Oppo广东移动通信有限公司 | 拍照处理方法、装置、移动终端以及存储介质 |
-
2021
- 2021-01-21 CN CN202110081406.7A patent/CN114885086A/zh active Pending
Patent Citations (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN101266685A (zh) * | 2007-03-14 | 2008-09-17 | 中国科学院自动化研究所 | 一种基于多幅照片去除无关图像的方法 |
US20110103644A1 (en) * | 2009-10-30 | 2011-05-05 | Zoran Corporation | Method and apparatus for image detection with undesired object removal |
JP2017097800A (ja) * | 2015-11-27 | 2017-06-01 | 日本電信電話株式会社 | 画像処理装置、画像処理方法及びコンピュータプログラム |
CN108513664A (zh) * | 2017-02-06 | 2018-09-07 | 华为技术有限公司 | 图像处理的方法和设备 |
CN107886471A (zh) * | 2017-11-03 | 2018-04-06 | 北京航空航天大学 | 一种基于超像素投票模型的照片多余物体去除方法 |
CN109035185A (zh) * | 2018-06-29 | 2018-12-18 | 努比亚技术有限公司 | 一种图像处理方法及终端 |
CN109978805A (zh) * | 2019-03-18 | 2019-07-05 | Oppo广东移动通信有限公司 | 拍照处理方法、装置、移动终端以及存储介质 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN110445978B (zh) | 一种拍摄方法及设备 | |
CN109793498B (zh) | 一种皮肤检测方法及电子设备 | |
CN113810601B (zh) | 终端的图像处理方法、装置和终端设备 | |
CN113797530B (zh) | 图像的预测方法、电子设备和存储介质 | |
CN110851067A (zh) | 屏幕显示模式的切换方法、装置及电子设备 | |
CN112446255A (zh) | 一种视频图像处理方法及装置 | |
CN113542580B (zh) | 去除眼镜光斑的方法、装置及电子设备 | |
CN112085647B (zh) | 一种人脸校正方法及电子设备 | |
CN113395382A (zh) | 一种设备间数据交互的方法及相关设备 | |
CN111543049A (zh) | 一种拍照方法及电子设备 | |
CN113572957B (zh) | 一种拍摄对焦方法及相关设备 | |
CN113852755A (zh) | 拍摄方法、设备、计算机可读存储介质及程序产品 | |
CN113518189B (zh) | 拍摄方法、***、电子设备及存储介质 | |
CN113467735A (zh) | 图像调整方法、电子设备及存储介质 | |
CN111557007B (zh) | 一种检测眼睛睁闭状态的方法及电子设备 | |
CN114257737B (zh) | 一种摄像模式切换方法以及相关设备 | |
CN113923351B (zh) | 多路视频拍摄的退出方法、设备和存储介质 | |
WO2022033344A1 (zh) | 视频防抖方法、终端设备和计算机可读存储介质 | |
CN111417982A (zh) | 一种色斑检测方法及电子设备 | |
CN111460942B (zh) | 接近检测方法及装置、计算机可读介质及终端设备 | |
CN113132532B (zh) | 环境光强度校准方法、装置及电子设备 | |
CN115393676A (zh) | 手势控制优化方法、装置、终端和存储介质 | |
CN113596320A (zh) | 视频拍摄变速录制方法、设备、存储介质和程序产品 | |
CN113391735A (zh) | 显示形态的调整方法、装置、电子设备及存储介质 | |
CN114885086A (zh) | 一种图像处理方法、头戴式设备和计算机可读存储介质 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
RJ01 | Rejection of invention patent application after publication | ||
RJ01 | Rejection of invention patent application after publication |
Application publication date: 20220809 |