CN109191370A - 图像处理方法、装置、智能终端和计算机可读存储介质 - Google Patents
图像处理方法、装置、智能终端和计算机可读存储介质 Download PDFInfo
- Publication number
- CN109191370A CN109191370A CN201810884934.4A CN201810884934A CN109191370A CN 109191370 A CN109191370 A CN 109191370A CN 201810884934 A CN201810884934 A CN 201810884934A CN 109191370 A CN109191370 A CN 109191370A
- Authority
- CN
- China
- Prior art keywords
- image
- feature
- described image
- additional information
- processed
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000003672 processing method Methods 0.000 title claims abstract description 10
- 238000000034 method Methods 0.000 claims abstract description 59
- 238000006243 chemical reaction Methods 0.000 claims description 8
- 230000003068 static effect Effects 0.000 claims description 7
- 230000000694 effects Effects 0.000 description 12
- 238000010586 diagram Methods 0.000 description 8
- 230000001960 triggered effect Effects 0.000 description 8
- 241000209094 Oryza Species 0.000 description 6
- 235000007164 Oryza sativa Nutrition 0.000 description 6
- 238000004590 computer program Methods 0.000 description 6
- 235000009566 rice Nutrition 0.000 description 6
- 230000008901 benefit Effects 0.000 description 4
- 210000003128 head Anatomy 0.000 description 4
- 241000287828 Gallus gallus Species 0.000 description 2
- 238000005034 decoration Methods 0.000 description 2
- 210000000554 iris Anatomy 0.000 description 2
- 208000001491 myopia Diseases 0.000 description 2
- 230000006870 function Effects 0.000 description 1
- 238000004519 manufacturing process Methods 0.000 description 1
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T3/00—Geometric image transformations in the plane of the image
- G06T3/04—Context-preserving transformations, e.g. by using an importance map
Landscapes
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Image Analysis (AREA)
Abstract
本发明公开了图像处理方法、装置、智能终端和计算机可读存储介质。所述方法包括:获取待处理的图像;对所述图像进行识别,得到所述图像的至少一个特征;基于所述特征在所述图像中添加附加信息。该技术方案的应用场景广泛,对于拍摄的各类照片、普通图片等都能够从中识别出可以附加信息的特征,并在此基础上添加附加信息,丰富了图片的内容,拓展了用户群体,玩法多样,新奇有趣。
Description
技术领域
本发明涉及图像处理技术领域,具体涉及图像处理方法、装置、智能终端和计算机可读存储介质。
背景技术
目前,能够提供图像处理的应用有很多,例如拍照应用大多带有美颜效果,还有的提供了各种头饰等特效,供用户选择。然而,现有的应用场景较少,不能够满足用户的需求,大多是基于人脸识别才能实现。例如拍摄一个桌面,就很难对其进行富有趣味的处理。
发明内容
鉴于上述问题,提出了本发明以便提供一种克服上述问题或者至少部分地解决上述问题的图像处理方法、装置、智能终端和计算机可读存储介质。
依据本发明的一个方面,提供了一种图像处理方法,包括:
获取待处理的图像;
对所述图像进行识别,得到所述图像的至少一个特征;
基于所述特征在所述图像中添加附加信息。
可选地,所述获取待处理的图像包括如下的一种或多种:
从智能终端的存储器中读取待处理的图像;
从应用的服务器获取待处理的图像;
开启智能终端的摄像头,获取所述摄像头拍摄的待处理的图像。
可选地,所述图像包括如下的一种或多种:
静态图片;
动态图片中的部分或全部帧;
视频中的部分或全部帧。
可选地,所述对所述图像进行识别,得到所述图像的至少一个特征包括:
对所述图像进行二值化处理;
从二值化后的图像中识别出至少一个预设几何图形特征。
可选地,所述预设几何图形特征包括如下的一种或多种:
直线,平面和长方体。
可选地,所述基于所述特征在所述图像中添加附加信息包括:
从特效库中选取与所述几何图形特征匹配的特效;
将所述特效与所述几何图形特征在所述图像中进行融合。
可选地,所述对所述图像进行识别,得到所述图像的至少一个特征包括:
利用若干种目标物识别算法,从所述图像中识别出至少一种目标物;
所述基于所述特征在所述图像中添加附加信息包括:为所述目标物添加标签。
可选地,所述标签为文字展示控件和/或在被触发后播放声音的声音展示控件。
可选地,所述标签包含以一种或多种文字对所述目标物进行描述的描述信息。
可选地,所述基于所述特征在所述图像中添加附加信息包括:
当所述特征有多个时,根据各特征在所述图像中的面积占比,确定出作为附加信息添加基础的特征;或者,将得到的特征在所述图像中进行标示,根据选取指令确定出作为附加信息添加基础的特征;或者,根据各特征所属类型的优先级,确定出作为附加信息添加基础的特征。
依据本发明的另一方面,提供了一种图像处理装置,包括:
图像获取单元,适于获取待处理的图像;
图像识别单元,适于对所述图像进行识别,得到所述图像的至少一个特征;
图像处理单元,适于基于所述特征在所述图像中添加附加信息。
可选地,所述图像获取单元,适于以如下的一种或多种方式获取待处理的图像:从智能终端的存储器中读取待处理的图像;从应用的服务器获取待处理的图像;开启智能终端的摄像头,获取所述摄像头拍摄的待处理的图像。
可选地,所述图像包括如下的一种或多种:静态图片;动态图片中的部分或全部帧;视频中的部分或全部帧。
可选地,所述图像识别单元,适于对所述图像进行二值化处理;从二值化后的图像中识别出至少一个预设几何图形特征。
可选地,所述预设几何图形特征包括如下的一种或多种:
直线,平面和长方体。
可选地,所述图像处理单元,适于从特效库中选取与所述几何图形特征匹配的特效;将所述特效与所述几何图形特征在所述图像中进行融合。
可选地,所述图像识别单元,适于利用若干种目标物识别算法,从所述图像中识别出至少一种目标物;
所述图像处理单元,适于为所述目标物添加标签。
可选地,所述标签为文字展示控件和/或在被触发后播放声音的声音展示控件。
可选地,所述标签包含以一种或多种文字对所述目标物进行描述的描述信息。
可选地,所述图像处理单元,适于当所述特征有多个时,根据各特征在所述图像中的面积占比,确定出作为附加信息添加基础的特征;或者,将得到的特征在所述图像中进行标示,根据选取指令确定出作为附加信息添加基础的特征;或者,根据各特征所属类型的优先级,确定出作为附加信息添加基础的特征。
依据本发明的又一方面,提供了一种智能终端,包括:处理器;以及被安排成存储计算机可执行指令的存储器,所述可执行指令在被执行时使所述处理器执行如上述任一所述的方法。
依据本发明的再一方面,提供了一种计算机可读存储介质,其中,所述计算机可读存储介质存储一个或多个程序,所述一个或多个程序当被处理器执行时,实现如上述任一所述的方法。
由上述可知,本发明的技术方案,在获取到待处理的图像后,利用图像识别技术识别出图像中的至少一个特征,再基于识别出的特征对图像进行附加信息的添加。该技术方案的应用场景广泛,对于拍摄的各类照片、普通图片等都能够从中识别出可以附加信息的特征,并在此基础上添加附加信息,丰富了图片的内容,拓展了用户群体,玩法多样,新奇有趣。
上述说明仅是本发明技术方案的概述,为了能够更清楚了解本发明的技术手段,而可依照说明书的内容予以实施,并且为了让本发明的上述和其它目的、特征和优点能够更明显易懂,以下特举本发明的具体实施方式。
附图说明
通过阅读下文优选实施方式的详细描述,各种其他的优点和益处对于本领域普通技术人员将变得清楚明了。附图仅用于示出优选实施方式的目的,而并不认为是对本发明的限制。而且在整个附图中,用相同的参考符号表示相同的部件。在附图中:
图1示出了根据本发明一个实施例的一种图像处理方法的流程示意图;
图2示出了根据本发明一个实施例的一种图像处理装置的结构示意图;
图3示出了根据本发明一个实施例的智能终端的结构示意图;
图4示出了根据本发明一个实施例的计算机可读存储介质的结构示意图;
图5a示出了根据本发明一个实施例的在图像中添加附加信息的效果图;
图5b示出了根据本发明另一个实施例的在图像中添加附加信息的效果图;
图5c示出了根据本发明又一个实施例的在图像中添加附加信息的效果图;
图5d示出了根据本发明再一个实施例的在图像中添加附加信息的效果图。
具体实施方式
下面将参照附图更详细地描述本公开的示例性实施例。虽然附图中显示了本公开的示例性实施例,然而应当理解,可以以各种形式实现本公开而不应被这里阐述的实施例所限制。相反,提供这些实施例是为了能够更透彻地理解本公开,并且能够将本公开的范围完整的传达给本领域的技术人员。
图1示出了根据本发明一个实施例的一种图像处理方法的流程示意图。如图1所示,该方法包括:
步骤S110,获取待处理的图像。具体来说,在本发明的一个实施例中,获取待处理的图像包括如下的一种或多种:从智能终端的存储器中读取待处理的图像;从应用的服务器获取待处理的图像;开启智能终端的摄像头,获取摄像头拍摄的待处理的图像。
例如,将该方法应用于相机应用中,可以在相机应用启动后,获得了智能终端摄像头的使用权限时,开启智能终端的摄像头,获取摄像头拍摄的待处理的图像。又例如,将该方法应用于图像处理应用中,可以对智能终端中相册或指定文件夹下的图像进行处理。再例如,将该方法应用于直播应用中,可以在将拍摄的视频流发送出去之前,对其中的各帧进行图像处理,也可以对接收到的视频流中的各帧进行图像处理。
在本实施例中也可以不限制获取待处理的图像的方式。
步骤S120,对图像进行识别,得到图像的至少一个特征。
步骤S130,基于特征在图像中添加附加信息。
可见,图1所示的方法,在获取到待处理的图像后,利用图像识别技术识别出图像中的至少一个特征,再基于识别出的特征对图像进行附加信息的添加。该技术方案的应用场景广泛,对于拍摄的各类照片、普通图片等都能够从中识别出可以附加信息的特征,并在此基础上添加附加信息,丰富了图片的内容,拓展了用户群体,玩法多样,新奇有趣。
在本发明的一个实施例中,上述方法中,图像包括如下的一种或多种:静态图片;动态图片中的部分或全部帧;视频中的部分或全部帧。
在对动态图片或者视频进行处理时,可以由用户选择对哪些帧进行处理,例如用户只想利用一段视频中的片段生成短视频,那么可以仅选择这一片段中的帧。
在本发明的一个实施例中,上述方法中,对图像进行识别,得到图像的至少一个特征包括:对图像进行二值化处理;从二值化后的图像中识别出至少一个预设几何图形特征。
一幅图像通常包括目标物体、背景还有噪声,要想从多值的数字图像中直接提取出目标物体,可以设定一个阈值T,用T将图像的数据分成两部分:大于T的像素群和小于T的像素群。这种方式也称为图像的二值化。
在本实施例中利用二值化处理是为了识别图像中的预设几何特征,几何特征有很多,例如曲线、直线、三角形、椭圆形等等。在本发明的一个实施例中,上述方法中,预设几何图形特征包括如下的一种或多种:直线,平面和长方体。
上述三种几何图形特征一般而言更适宜添加特效等附加信息,并且在照片中也更为常见、便于识别。当然,在其他实施例中预设的几何图形特征可以不限于上述三种。
参见图5a、图5b和图5c,分别示出了在照片中添加附加信息的效果示例。图5a中,在沙发的表面(平面)添加了表情;图5b中,在书(长方体)上添加了表情,在书架边缘(直线)上添加了小鸡特效;图5c中,在咖啡杯杯口(圆形的平面)上添加了咖啡拉花特效。
在本发明的一个实施例中,上述方法中,基于特征在图像中添加附加信息包括:从特效库中选取与几何图形特征匹配的特效;将特效与几何图形特征在图像中进行融合。
以图5c为例,咖啡拉花在现实场景中,一般都是在圆形的咖啡杯表面实现的,因此其匹配的几何图形就是圆形的平面。图5a和图5b虽然都是添加了表情,但是可以看出,表情所适用的几何图形不同,图5b中的表情如果应用到图5a的沙发表面是可以的,但是图5a中的表情却无法应用到图5b中的书上。因此,特效与几何图形是存在一定的匹配关系的。
在本发明的一个实施例中,上述方法中,对图像进行识别,得到图像的至少一个特征包括:利用若干种目标物识别算法,从图像中识别出至少一种目标物;基于特征在图像中添加附加信息包括:为目标物添加标签。
标签顾名思义,可以对目标物进行一定程度的描述,例如在本发明的一个实施例中,上述方法中,标签包含以一种或多种文字对目标物进行描述的描述信息。
图5d示出了根据本发明再一个实施例的在图像中添加附加信息的效果图。如图5d所示,图中有一个带有米奇装饰的杯子,添加的标签所包含的内容有中文“杯子”和英文“Cup”,容易想象,该方法可以应用于儿童的英语教育中。
在本发明的一个实施例中,上述方法中,标签为文字展示控件和/或在被触发后播放声音的声音展示控件。
图5d所示出的可以是一种包含文字展示控件的效果示意。当然,可以理解图像可以作为一个可交互的载体,在上面添加声音展示控件,例如被触发后发出“Cup”的读音。
在本发明的一个实施例中,上述方法中,基于特征在图像中添加附加信息包括:当特征有多个时,根据各特征在图像中的面积占比,确定出作为附加信息添加基础的特征;或者,将得到的特征在图像中进行标示,根据选取指令确定出作为附加信息添加基础的特征;或者,根据各特征所属类型的优先级,确定出作为附加信息添加基础的特征。
以图5d为例,图中不仅有杯子,还有一个米奇装饰。因此在能够识别出多个特征(米奇、杯子)时,可以参照本实施例中所示出的方式进行选择。例如,图5d就是依据特征在图像中的面积占比来确定特征为杯子而非米奇。容易理解,在图中如果将杯子和米奇分别圈出,由用户选择,则也可以为米奇添加附加信息。再例如,可以设定不同类型特征的优先级(例如平面优于直线),确定出作为附加信息添加基础的特征。
图2示出了根据本发明一个实施例的一种图像处理装置的结构示意图。如图2所示,图像处理装置200包括:
图像获取单元210,适于获取待处理的图像。具体来说,在本发明的一个实施例中,图像获取单元210,适于以如下的一种或多种方式获取待处理的图像:从智能终端的存储器中读取待处理的图像;从应用的服务器获取待处理的图像;开启智能终端的摄像头,获取摄像头拍摄的待处理的图像。
例如,将该方法应用于相机应用中,可以在相机应用启动后,获得了智能终端摄像头的使用权限时,开启智能终端的摄像头,获取摄像头拍摄的待处理的图像。又例如,将该方法应用于图像处理应用中,可以对智能终端中相册或指定文件夹下的图像进行处理。再例如,将该方法应用于直播应用中,可以在将拍摄的视频流发送出去之前,对其中的各帧进行图像处理,也可以对接收到的视频流中的各帧进行图像处理。
在本实施例中也可以不限制获取待处理的图像的方式。
图像识别单元220,适于对图像进行识别,得到图像的至少一个特征。
图像处理单元230,适于基于特征在图像中添加附加信息。
可见,图2所示的装置,通过各单元的相互配合,在获取到待处理的图像后,利用图像识别技术识别出图像中的至少一个特征,再基于识别出的特征对图像进行附加信息的添加。该技术方案的应用场景广泛,对于拍摄的各类照片、普通图片等都能够从中识别出可以附加信息的特征,并在此基础上添加附加信息,丰富了图片的内容,拓展了用户群体,玩法多样,新奇有趣。
在本发明的一个实施例中,上述装置中,图像包括如下的一种或多种:静态图片;动态图片中的部分或全部帧;视频中的部分或全部帧。
在对动态图片或者视频进行处理时,可以由用户选择对哪些帧进行处理,例如用户只想利用一段视频中的片段生成短视频,那么可以仅选择这一片段中的帧。
在本发明的一个实施例中,上述装置中,图像识别单元220,适于对图像进行二值化处理;从二值化后的图像中识别出至少一个预设几何图形特征。
一幅图像通常包括目标物体、背景还有噪声,要想从多值的数字图像中直接提取出目标物体,可以设定一个阈值T,用T将图像的数据分成两部分:大于T的像素群和小于T的像素群。这种方式也称为图像的二值化。
在本实施例中利用二值化处理是为了识别图像中的预设几何特征,几何特征有很多,例如曲线、直线、三角形、椭圆形等等。在本发明的一个实施例中,上述装置中,预设几何图形特征包括如下的一种或多种:直线,平面和长方体。
上述三种几何图形特征一般而言更适宜添加特效等附加信息,并且在照片中也更为常见、便于识别。当然,在其他实施例中预设的几何图形特征可以不限于上述三种。
参见图5a、图5b和图5c,分别示出了在照片中添加附加信息的效果示例。图5a中,在沙发的表面(平面)添加了表情;图5b中,在书(长方体)上添加了表情,在书架边缘(直线)上添加了小鸡特效;图5c中,在咖啡杯杯口(圆形的平面)上添加了咖啡拉花特效。
在本发明的一个实施例中,上述装置中,图像处理单元230,适于从特效库中选取与几何图形特征匹配的特效;将特效与几何图形特征在图像中进行融合。
以图5c为例,咖啡拉花在现实场景中,一般都是在圆形的咖啡杯表面实现的,因此其匹配的几何图形就是圆形的平面。图5a和图5b虽然都是添加了表情,但是可以看出,表情所适用的几何图形不同,图5b中的表情如果应用到图5a的沙发表面是可以的,但是图5a中的表情却无法应用到图5b中的书上。因此,特效与几何图形是存在一定的匹配关系的。
在本发明的一个实施例中,上述装置中,图像识别单元220,适于利用若干种目标物识别算法,从图像中识别出至少一种目标物;图像处理单元230,适于为目标物添加标签。
标签顾名思义,可以对目标物进行一定程度的描述,例如在本发明的一个实施例中,上述装置中,标签包含以一种或多种文字对目标物进行描述的描述信息。
图5d示出了根据本发明再一个实施例的在图像中添加附加信息的效果图。如图5d所示,图中有一个带有米奇装饰的杯子,添加的标签所包含的内容有中文“杯子”和英文“Cup”,容易想象,该方法可以应用于儿童的英语教育中。
在本发明的一个实施例中,上述装置中,标签为文字展示控件和/或在被触发后播放声音的声音展示控件。
图5d所示出的可以是一种包含文字展示控件的效果示意。当然,可以理解图像可以作为一个可交互的载体,在上面添加声音展示控件,例如被触发后发出“Cup”的读音。
在本发明的一个实施例中,上述装置中,图像处理单元230,适于当特征有多个时,根据各特征在图像中的面积占比,确定出作为附加信息添加基础的特征;或者,将得到的特征在图像中进行标示,根据选取指令确定出作为附加信息添加基础的特征;或者,根据各特征所属类型的优先级,确定出作为附加信息添加基础的特征。
以图5d为例,图中不仅有杯子,还有一个米奇装饰。因此在能够识别出多个特征(米奇、杯子)时,可以参照本实施例中所示出的方式进行选择。例如,图5d就是依据特征在图像中的面积占比来确定特征为杯子而非米奇。容易理解,在图中如果将杯子和米奇分别圈出,由用户选择,则也可以为米奇添加附加信息。再例如,可以设定不同类型特征的优先级(例如平面优于直线),确定出作为附加信息添加基础的特征。
综上所述,本发明的技术方案,在获取到待处理的图像后,利用图像识别技术识别出图像中的至少一个特征,再基于识别出的特征对图像进行附加信息的添加。该技术方案的应用场景广泛,对于拍摄的各类照片、普通图片等都能够从中识别出可以附加信息的特征,并在此基础上添加附加信息,丰富了图片的内容,拓展了用户群体,玩法多样,新奇有趣。
需要说明的是:
在此提供的算法和显示不与任何特定计算机、虚拟装置或者其它设备固有相关。各种通用装置也可以与基于在此的示教一起使用。根据上面的描述,构造这类装置所要求的结构是显而易见的。此外,本发明也不针对任何特定编程语言。应当明白,可以利用各种编程语言实现在此描述的本发明的内容,并且上面对特定语言所做的描述是为了披露本发明的最佳实施方式。
在此处所提供的说明书中,说明了大量具体细节。然而,能够理解,本发明的实施例可以在没有这些具体细节的情况下实践。在一些实例中,并未详细示出公知的方法、结构和技术,以便不模糊对本说明书的理解。
类似地,应当理解,为了精简本公开并帮助理解各个发明方面中的一个或多个,在上面对本发明的示例性实施例的描述中,本发明的各个特征有时被一起分组到单个实施例、图、或者对其的描述中。然而,并不应将该公开的方法解释成反映如下意图:即所要求保护的本发明要求比在每个权利要求中所明确记载的特征更多的特征。更确切地说,如下面的权利要求书所反映的那样,发明方面在于少于前面公开的单个实施例的所有特征。因此,遵循具体实施方式的权利要求书由此明确地并入该具体实施方式,其中每个权利要求本身都作为本发明的单独实施例。
本领域那些技术人员可以理解,可以对实施例中的设备中的模块进行自适应性地改变并且把它们设置在与该实施例不同的一个或多个设备中。可以把实施例中的模块或单元或组件组合成一个模块或单元或组件,以及此外可以把它们分成多个子模块或子单元或子组件。除了这样的特征和/或过程或者单元中的至少一些是相互排斥之外,可以采用任何组合对本说明书(包括伴随的权利要求、摘要和附图)中公开的所有特征以及如此公开的任何方法或者设备的所有过程或单元进行组合。除非另外明确陈述,本说明书(包括伴随的权利要求、摘要和附图)中公开的每个特征可以由提供相同、等同或相似目的的替代特征来代替。
此外,本领域的技术人员能够理解,尽管在此所述的一些实施例包括其它实施例中所包括的某些特征而不是其它特征,但是不同实施例的特征的组合意味着处于本发明的范围之内并且形成不同的实施例。例如,在下面的权利要求书中,所要求保护的实施例的任意之一都可以以任意的组合方式来使用。
本发明的各个部件实施例可以以硬件实现,或者以在一个或者多个处理器上运行的软件模块实现,或者以它们的组合实现。本领域的技术人员应当理解,可以在实践中使用微处理器或者数字信号处理器(DSP)来实现根据本发明实施例的图像处理装置中的一些或者全部部件的一些或者全部功能。本发明还可以实现为用于执行这里所描述的方法的一部分或者全部的设备或者装置程序(例如,计算机程序和计算机程序产品)。这样的实现本发明的程序可以存储在计算机可读介质上,或者可以具有一个或者多个信号的形式。这样的信号可以从因特网网站上下载得到,或者在载体信号上提供,或者以任何其他形式提供。
例如,图3示出了根据本发明一个实施例的智能终端的结构示意图。该智能终端包括处理器310和被安排成存储计算机可执行指令(计算机可读程序代码)的存储器320。存储器320可以是诸如闪存、EEPROM(电可擦除可编程只读存储器)、EPROM、硬盘或者ROM之类的电子存储器。存储器320具有存储用于执行上述方法中的任何方法步骤的计算机可读程序代码331的存储空间330。例如,用于存储计算机可读程序代码的存储空间330可以包括分别用于实现上面的方法中的各种步骤的各个计算机可读程序代码331。计算机可读程序代码331可以从一个或者多个计算机程序产品中读出或者写入到这一个或者多个计算机程序产品中。这些计算机程序产品包括诸如硬盘,紧致盘(CD)、存储卡或者软盘之类的程序代码载体。这样的计算机程序产品通常为例如图4所述的计算机可读存储介质。图4示出了根据本发明一个实施例的一种计算机可读存储介质的结构示意图。该计算机可读存储介质400存储有用于执行根据本发明的方法步骤的计算机可读程序代码331,可以被智能终端300的处理器310读取,当计算机可读程序代码331由智能终端300运行时,导致该智能终端300执行上面所描述的方法中的各个步骤,具体来说,该计算机可读存储介质存储的计算机可读程序代码331可以执行上述任一实施例中示出的方法。计算机可读程序代码331可以以适当形式进行压缩。
应该注意的是上述实施例对本发明进行说明而不是对本发明进行限制,并且本领域技术人员在不脱离所附权利要求的范围的情况下可设计出替换实施例。在权利要求中,不应将位于括号之间的任何参考符号构造成对权利要求的限制。单词“包含”不排除存在未列在权利要求中的元件或步骤。位于元件之前的单词“一”或“一个”不排除存在多个这样的元件。本发明可以借助于包括有若干不同元件的硬件以及借助于适当编程的计算机来实现。在列举了若干装置的单元权利要求中,这些装置中的若干个可以是通过同一个硬件项来具体体现。单词第一、第二、以及第三等的使用不表示任何顺序。可将这些单词解释为名称。
本发明公开了A1、一种图像处理方法,包括:
获取待处理的图像;
对所述图像进行识别,得到所述图像的至少一个特征;
基于所述特征在所述图像中添加附加信息。
A2、如A1所述的方法,其中,所述获取待处理的图像包括如下的一种或多种:
从智能终端的存储器中读取待处理的图像;
从应用的服务器获取待处理的图像;
开启智能终端的摄像头,获取所述摄像头拍摄的待处理的图像。
A3、如A1所述的方法,其中,所述图像包括如下的一种或多种:
静态图片;
动态图片中的部分或全部帧;
视频中的部分或全部帧。
A4、如A1所述的方法,其中,所述对所述图像进行识别,得到所述图像的至少一个特征包括:
对所述图像进行二值化处理;
从二值化后的图像中识别出至少一个预设几何图形特征。
A5、如A4所述的方法,其中,所述预设几何图形特征包括如下的一种或多种:
直线,平面和长方体。
A6、如A4所述的方法,其中,所述基于所述特征在所述图像中添加附加信息包括:
从特效库中选取与所述几何图形特征匹配的特效;
将所述特效与所述几何图形特征在所述图像中进行融合。
A7、如A1所述的方法,其中,所述对所述图像进行识别,得到所述图像的至少一个特征包括:
利用若干种目标物识别算法,从所述图像中识别出至少一种目标物;
所述基于所述特征在所述图像中添加附加信息包括:为所述目标物添加标签。
A8、如A7所述的方法,其中,所述标签为文字展示控件和/或在被触发后播放声音的声音展示控件。
A9、如A7所述的方法,其中,所述标签包含以一种或多种文字对所述目标物进行描述的描述信息。
A10、如A1所述的方法,其中,所述基于所述特征在所述图像中添加附加信息包括:
当所述特征有多个时,根据各特征在所述图像中的面积占比,确定出作为附加信息添加基础的特征;或者,将得到的特征在所述图像中进行标示,根据选取指令确定出作为附加信息添加基础的特征;或者,根据各特征所属类型的优先级,确定出作为附加信息添加基础的特征。
本发明还公开了B11、一种图像处理装置,包括:
图像获取单元,适于获取待处理的图像;
图像识别单元,适于对所述图像进行识别,得到所述图像的至少一个特征;
图像处理单元,适于基于所述特征在所述图像中添加附加信息。
B12、如B11所述的装置,其中,
所述图像获取单元,适于以如下的一种或多种方式获取待处理的图像:从智能终端的存储器中读取待处理的图像;从应用的服务器获取待处理的图像;开启智能终端的摄像头,获取所述摄像头拍摄的待处理的图像。
B13、如B11所述的装置,其中,所述图像包括如下的一种或多种:静态图片;动态图片中的部分或全部帧;视频中的部分或全部帧。
B14、如B11所述的装置,其中,
所述图像识别单元,适于对所述图像进行二值化处理;从二值化后的图像中识别出至少一个预设几何图形特征。
B15、如B14所述的装置,其中,所述预设几何图形特征包括如下的一种或多种:
直线,平面和长方体。
B16、如B14所述的装置,其中,
所述图像处理单元,适于从特效库中选取与所述几何图形特征匹配的特效;将所述特效与所述几何图形特征在所述图像中进行融合。
B17、如B11所述的装置,其中,
所述图像识别单元,适于利用若干种目标物识别算法,从所述图像中识别出至少一种目标物;
所述图像处理单元,适于为所述目标物添加标签。
B18、如B17所述的装置,其中,所述标签为文字展示控件和/或在被触发后播放声音的声音展示控件。
B19、如B17所述的装置,其中,所述标签包含以一种或多种文字对所述目标物进行描述的描述信息。
B20、如B11所述的装置,其中,
所述图像处理单元,适于当所述特征有多个时,根据各特征在所述图像中的面积占比,确定出作为附加信息添加基础的特征;或者,将得到的特征在所述图像中进行标示,根据选取指令确定出作为附加信息添加基础的特征;或者,根据各特征所属类型的优先级,确定出作为附加信息添加基础的特征。
本发明还公开了C21、一种智能终端,其中,该智能终端包括:处理器;以及被安排成存储计算机可执行指令的存储器,所述可执行指令在被执行时使所述处理器执行如A1-A10中任一项所述的方法。
本发明还公开了D 22、一种计算机可读存储介质,其中,所述计算机可读存储介质存储一个或多个程序,所述一个或多个程序当被处理器执行时,实现如A1-A10中任一项所述的方法。
Claims (10)
1.一种图像处理方法,包括:
获取待处理的图像;
对所述图像进行识别,得到所述图像的至少一个特征;
基于所述特征在所述图像中添加附加信息。
2.如权利要求1所述的方法,其中,所述获取待处理的图像包括如下的一种或多种:
从智能终端的存储器中读取待处理的图像;
从应用的服务器获取待处理的图像;
开启智能终端的摄像头,获取所述摄像头拍摄的待处理的图像。
3.如权利要求1所述的方法,其中,所述图像包括如下的一种或多种:
静态图片;
动态图片中的部分或全部帧;
视频中的部分或全部帧。
4.如权利要求1所述的方法,其中,所述对所述图像进行识别,得到所述图像的至少一个特征包括:
对所述图像进行二值化处理;
从二值化后的图像中识别出至少一个预设几何图形特征。
5.如权利要求4所述的方法,其中,所述预设几何图形特征包括如下的一种或多种:
直线,平面和长方体。
6.如权利要求4所述的方法,其中,所述基于所述特征在所述图像中添加附加信息包括:
从特效库中选取与所述几何图形特征匹配的特效;
将所述特效与所述几何图形特征在所述图像中进行融合。
7.如权利要求1所述的方法,其中,所述对所述图像进行识别,得到所述图像的至少一个特征包括:
利用若干种目标物识别算法,从所述图像中识别出至少一种目标物;
所述基于所述特征在所述图像中添加附加信息包括:为所述目标物添加标签。
8.一种图像处理装置,包括:
图像获取单元,适于获取待处理的图像;
图像识别单元,适于对所述图像进行识别,得到所述图像的至少一个特征;
图像处理单元,适于基于所述特征在所述图像中添加附加信息。
9.一种智能终端,其中,该智能终端包括:处理器;以及被安排成存储计算机可执行指令的存储器,所述可执行指令在被执行时使所述处理器执行如权利要求1-7中任一项所述的方法。
10.一种计算机可读存储介质,其中,所述计算机可读存储介质存储一个或多个程序,所述一个或多个程序当被处理器执行时,实现如权利要求1-7中任一项所述的方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201810884934.4A CN109191370A (zh) | 2018-08-06 | 2018-08-06 | 图像处理方法、装置、智能终端和计算机可读存储介质 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201810884934.4A CN109191370A (zh) | 2018-08-06 | 2018-08-06 | 图像处理方法、装置、智能终端和计算机可读存储介质 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN109191370A true CN109191370A (zh) | 2019-01-11 |
Family
ID=64920252
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201810884934.4A Pending CN109191370A (zh) | 2018-08-06 | 2018-08-06 | 图像处理方法、装置、智能终端和计算机可读存储介质 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN109191370A (zh) |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2020192761A1 (zh) * | 2019-03-28 | 2020-10-01 | 华为技术有限公司 | 记录用户情感的方法及相关装置 |
CN111914523A (zh) * | 2020-08-19 | 2020-11-10 | 腾讯科技(深圳)有限公司 | 基于人工智能的多媒体处理方法、装置及电子设备 |
Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN107492128A (zh) * | 2017-09-14 | 2017-12-19 | 光锐恒宇(北京)科技有限公司 | 一种图像处理方法和装置 |
CN107948585A (zh) * | 2017-11-13 | 2018-04-20 | 西安艾润物联网技术服务有限责任公司 | 录像标记方法、装置及计算机可读存储介质 |
CN108076288A (zh) * | 2017-12-14 | 2018-05-25 | 光锐恒宇(北京)科技有限公司 | 图像处理方法、装置和计算机可读存储介质 |
-
2018
- 2018-08-06 CN CN201810884934.4A patent/CN109191370A/zh active Pending
Patent Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN107492128A (zh) * | 2017-09-14 | 2017-12-19 | 光锐恒宇(北京)科技有限公司 | 一种图像处理方法和装置 |
CN107948585A (zh) * | 2017-11-13 | 2018-04-20 | 西安艾润物联网技术服务有限责任公司 | 录像标记方法、装置及计算机可读存储介质 |
CN108076288A (zh) * | 2017-12-14 | 2018-05-25 | 光锐恒宇(北京)科技有限公司 | 图像处理方法、装置和计算机可读存储介质 |
Cited By (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2020192761A1 (zh) * | 2019-03-28 | 2020-10-01 | 华为技术有限公司 | 记录用户情感的方法及相关装置 |
CN111914523A (zh) * | 2020-08-19 | 2020-11-10 | 腾讯科技(深圳)有限公司 | 基于人工智能的多媒体处理方法、装置及电子设备 |
CN111914523B (zh) * | 2020-08-19 | 2021-12-14 | 腾讯科技(深圳)有限公司 | 基于人工智能的多媒体处理方法、装置及电子设备 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US10299008B1 (en) | Smart closed caption positioning system for video content | |
Minichino et al. | Learning OpenCV 3 computer vision with python | |
TWI253860B (en) | Method for generating a slide show of an image | |
US8495133B2 (en) | Interactive information system, interactive information method, and computer readable medium thereof | |
Rahman | Beginning Microsoft Kinect for Windows SDK 2.0: Motion and Depth Sensing for Natural User Interfaces | |
CN108174099A (zh) | 图像显示方法、装置和计算机可读存储介质 | |
CN108810619B (zh) | 识别视频中水印的方法、装置和电子设备 | |
EP3410258B1 (en) | Method for pushing picture, mobile terminal and storage medium | |
CN108377418A (zh) | 一种视频标注处理方法和装置 | |
CN108495058A (zh) | 图像处理方法、装置和计算机可读存储介质 | |
CN107633541A (zh) | 一种图像特效的生成方法和装置 | |
CN108848416A (zh) | 音视频内容的评价方法和装置 | |
CN105807917A (zh) | 一种辅助用户识字的方法及装置 | |
CN109191370A (zh) | 图像处理方法、装置、智能终端和计算机可读存储介质 | |
Bednarek | The television title sequence: A visual analysis of Flight of the Conchords | |
CN109191545A (zh) | 一种制作漫画的方法及装置 | |
US20100194761A1 (en) | Converting children's drawings into animated movies | |
Smith et al. | A method for animating children’s drawings of the human figure | |
Hartzheim | Making of a mangaka: Industrial reflexivity and Shueisha’s weekly Shônen jump | |
CN108833974A (zh) | 识别视频中的半透明水印的方法、装置和电子设备 | |
CN111782603A (zh) | 视频书封展示方法、计算设备及计算机存储介质 | |
CN105869447A (zh) | 有声读物的生成方法及装置 | |
Hetherington et al. | Make-believing animated films featuring digital humans: A qualitative inquiry using online sources | |
US20180330167A1 (en) | Personalized Augmented Reality | |
CN106162376A (zh) | 一种多媒体自动编辑为视频播放文件的方法及装置 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination |