CN107886947A - 一种图像处理的方法以及装置 - Google Patents

一种图像处理的方法以及装置 Download PDF

Info

Publication number
CN107886947A
CN107886947A CN201710980039.8A CN201710980039A CN107886947A CN 107886947 A CN107886947 A CN 107886947A CN 201710980039 A CN201710980039 A CN 201710980039A CN 107886947 A CN107886947 A CN 107886947A
Authority
CN
China
Prior art keywords
voice
keyword
voice messaging
word
sound
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201710980039.8A
Other languages
English (en)
Inventor
邓童虎
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Gree Electric Appliances Inc of Zhuhai
Original Assignee
Gree Electric Appliances Inc of Zhuhai
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Gree Electric Appliances Inc of Zhuhai filed Critical Gree Electric Appliances Inc of Zhuhai
Priority to CN201710980039.8A priority Critical patent/CN107886947A/zh
Publication of CN107886947A publication Critical patent/CN107886947A/zh
Priority to PCT/CN2018/100212 priority patent/WO2019076120A1/zh
Pending legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F3/00Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
    • G06F3/16Sound input; Sound output
    • G06F3/167Audio in a user interface, e.g. using voice commands for navigating, audio feedback
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/08Speech classification or search
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/22Procedures used during a speech recognition process, e.g. man-machine dialogue
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/26Speech to text systems
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/08Speech classification or search
    • G10L2015/088Word spotting
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/22Procedures used during a speech recognition process, e.g. man-machine dialogue
    • G10L2015/223Execution procedure of a spoken command

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Multimedia (AREA)
  • Computational Linguistics (AREA)
  • Acoustics & Sound (AREA)
  • Theoretical Computer Science (AREA)
  • General Health & Medical Sciences (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • User Interface Of Digital Computer (AREA)
  • Telephonic Communication Services (AREA)

Abstract

本发明实施方式涉及图像处理技术领域,特别是涉及一种图像处理的方法以及装置。该方法包括:接收语音信息;对所述语音信息进行识别,得到图像处理命令;根据所述图像处理命令,对目标图像进行图像处理,得到处理后的所述目标图像。因此,在本发明实施方式中,用户无需通过手动操作移动终端来处理图像,而是仅仅通过接收用户的语音信息,便可实现图像处理的功能,相比现有技术,此过程更加简便,节省了用户时间,提高了操作效率。

Description

一种图像处理的方法以及装置
技术领域
本发明实施方式涉及图像处理技术领域,特别是涉及一种图像处理的方法以及装置。
背景技术
随着科学技术的发展,移动终端等智能设备的功能日渐丰富和完善,其中包括智能化的图像处理功能,现有技术中,用户使用移动终端等智能设备进行图像处理的过程一般是,先由用户使用移动终端获取待处理的图像,用户再对移动终端进行手动操作,对图像进行处理,进而处理并获取到想要的图像。
本发明的发明人在实现本发明的过程中,发现现有技术中存在以下问题:在现有技术中,用户使用移动终端等智能设备进行图像处理的过程较为繁琐,用户必须对移动终端等智能设备进行手动在可以处理图像,为用户带来不便,因此,能够提供一种简便、无需手动操作的图像处理方法是尤为必要的。
发明内容
本发明实施方式主要解决的技术问题是提供一种简便、无需手动操作的图像处理的方法以及装置。
第一方面,为解决上述技术问题,本发明实施方式采用的一个技术方案是:提供一种图像处理的方法,应用于终端设备,包括:
接收语音信息;
对所述语音信息进行识别,得到图像处理命令;
根据所述图像处理命令,对目标图像进行图像处理,得到处理后的所述目标图像。
可选的,所述对所述语音信息进行识别,得到图像处理命令的步骤包括:
将所述语音信息转换为文本信息;
从所述文本信息中提取出处理对象关键词和处理方式关键词;
将所述处理对象关键词和处理方式关键词组成图像处理命令。
可选的,所述对所述语音信息进行识别,得到图像处理命令的步骤包括:
根据所述语音信息和预设有关键词语音的语音库,提取出所述语音信息中与预设有关键词语音的语音库中发音相同的词语,其中,预设有关键词语音的语音库中包含了预设的处理对象关键词语音和处理方式关键词语音;
根据所提取出的发音相同的所述词语,获得处理对象关键词和处理方式关键词;
将所述处理对象关键词和处理方式关键词组成图像处理命令。
可选的,所述根据所述图像处理命令,对目标图像进行图像处理的步骤包括:
根据所述处理对象关键词,从所述目标图像中识别出处理对象;
根据所述处理方式关键词,对所述处理对象执行处理。
可选的,在所述接收语音信息的步骤之后,所述方法还包括:
判断所述语音信息中是否只包含一种声音;
若所述语音信息中只包含一种声音,提取所述语音信息前N位的语音词;
判断所述语音词是否包含有预设命令词的声音;
若是,则进入所述对语音信息进行识别,得到所述图像处理命令的步骤。
可选的,所述方法还包括:
若所述语音信息包含有多种声音,提取各个声音前N位的语音词;
获取所述语音词包含有预设命令词的声音;
所述对所述语音信息进行识别,得到所述图像处理命令具体为:
对获取得到的声音进行识别,得到所述图像处理命令。
第二方面,为解决上述技术问题,本发明实施方式采用的另一个技术方案是:提供一种图像处理的装置,应用于终端设备,包括:
语音接收模块,用于接收语音信息;
命令获取模块,用于对所述语音信息进行识别,得到图像处理命令;
图像处理模块,用于根据所述图像处理命令,对目标图像进行图像处理,得到处理后的所述目标图像。
可选的,所述命令获取模块包括:
文本获取单元,用于将所述语音信息转换为文本信息;
文本提取单元,用于从所述文本信息中提取出处理对象关键词和处理方式关键词;
命令形成单元,用于将所述处理对象关键词和处理方式关键词组成图像处理命令。
可选的,所述命令获取模块包括:
词语获取单元,其用于根据所述语音信息和预设有关键词语音的语音库,提取出所述语音信息中与所述预设有关键词语音的语音库中发音相同的词语,其中,预设有关键词语音的语音库中包含了预设的处理对象关键词语音和处理方式关键词语音;
词语提取单元,其用于根据所提取出的发音相同的所述词语,获得处理对象关键词和处理方式关键词;
命令生成单元,其用于将所述处理对象关键词和处理方式关键词组成图像处理命令。
可选的,所述图像处理模块包括:
对象识别单元,用于根据所述处理对象关键词,从所述目标图像中识别出处理对象;
执行处理单元,用于根据所述处理方式关键词,对所述处理对象执行处理。
可选的,声音判断模块,用于判断所述语音信息中是否只包含一种声音;
第一提取模块,用于若所述语音信息中只包含一种声音,提取所述语音信息前N位的语音词;
语音词判断模块,用于判断所述语音词是否包含有预设命令词的声音;若是,则进入所述对语音信息进行识别,得到所述图像处理命令的步骤。
可选的,所述装置还包括:
第二提取模块,用于若所述语音信息包含有多种声音,提取各个声音前N位的语音词;
声音筛选模块,用于获取所述语音词包含有预设命令词的声音;
所述对所述语音信息进行识别,得到所述图像处理命令具体为:
对声音筛选模块获取得到的声音进行识别,得到所述图像处理命令。
本发明实施方式的有益效果是:区别于现有技术的情况,在本发明实施方式中,图像处理方法的步骤包括:接收语音信息;对所述语音信息进行识别,得到图像处理命令;根据所述图像处理命令,对目标图像进行图像编辑处理,得到编辑后的所述目标图像。因此,在本发明实施方式中,用户无需通过的手动操作移动终端来处理图像,而是仅仅通过接收用户的语音信息,便可实现图像处理的功能,相比现有技术,此过程更加简便,节省了用户时间,提高了操作效率。
附图说明
一个或多个实施方式通过与之对应的附图中的图片进行示例性说明,这些示例性说明并不构成对实施方式的限定,附图中具有相同参考数字标号的元件表示为类似的元件,除非有特别申明,附图中的图不构成比例限制。
图1是本发明实施方式一提供的一种图像处理的方法的流程示意图;
图2是本发明实施方式一提供的一种图像处理中对语音信息进行识别并得到图像处理命令的方法的一流程示意图;
图3是本发明实施方式一提供的一种图像处理中对语音信息进行识别并得到图像处理命令的方法的另一流程示意图;
图4是本发明本发明实施方式一提供的一种图像处理中根据图像处理命令,对目标图像进行图像处理,得到处理后的目标图像的方法的流程示意图;
图5是本发明实施方式二提供的一种图像处理的方法的流程示意图;
图6是本发明实施方式三提供的一种图像处理的装置的结构示意图;
图7是本发明实施方式四提供的一种图像处理的装置的结构示意图;
图8是本发明实施例提供的执行图像处理的电子设备的硬件结构示意图。
具体实施方式
为了使本发明的目的、技术方案及优点更加清楚明白,以下结合附图及实施方式,对本发明进行进一步详细说明。应当理解,此处所描述的具体实施方式仅用以解释本发明,并不用于限定本发明。
实施方式一
请参阅图1至图4,图1是本发明实施方式一提供的一种图像处理的方法,应用于终端设备,包括:
步骤101:接收语音信息;
当用户开启移动终端的图像处理功能时,移动终端将实时采集用户的语音信息,该语音信息为用户实时发出的语音。
步骤102:对语音信息进行识别,得到图像处理命令;
具体的,对语音信息进行识别的步骤包括:
步骤1021:将所接受到的语音信息转换为文本信息;
该文本信息与语音信息一致,文本信息便于移动终端识别以及提取。其中,文本信息中包括处理对象关键词和处理方式关键词,处理对象关键词为待处理图片中待处理的对象的名称,例如:处理对象关键词包括“人”、“苹果”和“房子”等;处理方式关键词为用户想对图片中待处理对象的处理方式,例如:处理方式关键词包括“裁剪”、“打马赛克”、“美颜”、“高光”和“瘦脸”等。
步骤1022:从文本信息中提取处理对象关键词和处理方式关键词;
步骤1023:将处理对象关键词和处理方式关键词组成图像处理命令,举个例子,当所接受的语音信息转换为文本信息后得到的内容为“对图片中的人进行美颜处理”时,其中,处理对象关键词为“人”,处理方式关键词为“美颜”,则获取的图像处理命令则为“对图片中的人进行美颜”。
当然,在本发明实施方式一中,也可以通过其他方式对语音信息进行识别,并得到图像处理命令,例如,请进一步参阅图3,执行如下步骤1021a、步骤1022a和步骤1023a:
步骤1021a:根据语音信息和预设有关键词语音的语音库,提取出语音信息中与预设有关键词语音的语音库中发音相同的词语,其中,预设有关键词语音的语音库中包含了预设的处理对象关键词语音和处理方式关键词语音;例如,预设有关键词语音的语音库中包含了“人”、“女性”和“男性”等预先设置的处理对象关键词语音,以及“裁剪”、“打马赛克”、“美颜”和“高光”等预先设置的处理方式关键词语音。
步骤1022a:根据所提取出的发音相同的词语,获得处理对象关键词和处理方式关键词;
具体的,例如,假如预先设置的处理对象关键词语音包括了“女性”,预先设置的处理方式关键词语音包括了“美颜”,并且,所提取出的发音相同的词语为“女性”和“美颜”,则将“女性”作为处理对象关键词,将“美颜”作为处理方式关键词。
步骤1023a:将处理对象关键词和处理方式关键词组成图像处理命令。
具体的,例如,假如所获取的处理对象关键词为“女性”,所获取的处理方式关键词为“美颜”,则获取的图像处理命令则为“对图片中的女性进行美颜”。步骤103:根据图像处理命令,对目标图像进行图像处理,得到处理后的目标图像。
进一步的,步骤103包括:
步骤1031:根据步骤102所获取的图像处理命令中的处理对象关键词和处理方式关键词,利用图像识别技术识别图片中与处理对象关键词对应的对象;
步骤1032:根据处理方式关键词对应的方式对处理对象执行处理。
根据处理方式关键词对应的方式对待处理图像中的处理对象执行处理并生成一处理后的新图像。
本发明实施方式中,图像处理方法的步骤包括:接收语音信息;对所述语音信息进行识别,得到图像处理命令;根据所述图像处理命令,对目标图像进行图像处理,得到处理后的所述目标图像。因此,在本发明实施方式中,移动终端无需接收用户的手动操作来处理图像,而是仅仅通过接收用户的语音信息,便可实现图像处理的功能,相比现有技术,此过程更加简便,节省了用户时间,提高了操作效率。
实施方式二
请参阅图5,图5是本发明实施方式二提供的一种图像处理的方法,应用于终端设备,包括:
步骤201:接收语音信息;
当用户开启移动终端的图像处理功能时,移动终端将实时采集用户的语音信息,该语音信息为用户实时发出的语音。
步骤202:判断语音信息中是否只包含一种声音;
具体的,利用现有的语音识别技术,通过音色、音频等语音特征判断语音信息中是否只包含一种声音。
步骤203:若语音信息中只包含一种声音,提取语音信息前N位的语音词;
具体的,当根据步骤202判断确认语音信息中只包含一种声音时,提取语音信息前N位的语音词,可选的,N为3、5或者7等;举个例子,当N为5,且所接受到的语音信息为“处理命令为对图片中的女性进行美颜”,则提取语音信息前5位的语音词为“处理命令为”。
步骤204:判断语音词是否包含有预设命令词;
预设命令词为预先设置的命令词,例如:“处理命令为”或者“命令为”等,举个具体的例子,当根据步骤203获取的语音词为“处理命令为”,且预设命令词也为“处理命令为”时,则确定语音词包含有预设命令词。当判断语音词包含有预设命令词,则进入步骤205,否则,进入步骤207。
步骤205:对语音信息进行识别,得到图像处理命令;
需要说明的是:本发明实施方式的步骤205与步骤102基于相同的发明构思,步骤205的具体内容可以参照步骤102,在此不一一赘述。
步骤206:根据所述图像处理命令,对目标图像进行图像处理,得到处理后的所述目标图像;
步骤207:若语音信息包含有多种声音,则提取各个声音前N位的语音词;
当执行完步骤202后确定语音信息包含有多种声音时,则提取并记录各个声音前N位的语音词。
步骤208:获取语音词包含有预设命令词的声音;
获取步骤207中各个语音信息中的语音词包含有预设命令词的声音。进一步可选的,在所获取的语音词包含有预设命令词的声音中,筛选出音量最大的声音,对该声音执行步骤209。
步骤209:对获取得到的声音进行识别,得到所述图像处理命令。
需要说明的是:本发明实施方式的步骤209与步骤102基于相同的发明构思,步骤209的具体内容可以参照步骤102,在此不一一赘述。
当执行完步骤209后,再执行步骤206。
本发明实施方式中,图像处理方法的步骤包括:接收语音信息;判断语音信息中是否只包含一种声音,若是,提取语音信息前N位的语音词并判断语音词是否包含有预设命令词,若是,则对所述语音信息进行识别,得到图像处理命令,再根据所述图像处理命令,对目标图像进行图像编辑处理,得到处理后的所述目标图像;若判断语音信息中包含多种声音,则提取各个声音前N位的语音词,获取语音词包含有预设命令词的声音,对获取得到的声音进行识别,得到所述图像处理命令,对目标图像进行图像处理,得到处理后的所述目标图像。
因此,在本发明实施方式中,移动终端无需接收用户的手动操作来处理图像,而是仅仅通过接收用户的语音信息,便可实现图像处理的功能,相比现有技术,此过程更加简便,节省了用户时间,提高了操作效率。此外,当获取的声音为多个时,还将针对各个声音提取各个声音前N位的语音词,分别执行图像处理,或者根据音量最大的声音,执行图像处理。
实施方式三
请参阅图6,图6是本发明实施方式三提供的一种图像处理的装置50,应用于终端设备,包括:语音接收模块51、命令获取模块52和图像处理模块53;
其中,语音接收模块51用于接收语音信息;
命令获取模块52用于对所述语音信息进行识别,得到图像处理命令;
图像处理模块53用于根据所述图像处理命令,对目标图像进行图像处理,得到处理后的所述目标图像。
可选的,所述命令获取模块52包括:文本获取单元521、文本提取单元522和命令形成单元523;
文本获取单元521用于将所述语音信息转换为文本信息;
文本提取单元522用于从所述文本信息中提取出处理对象关键词和处理方式关键词;
命令形成单元523用于将所述处理对象关键词和处理方式关键词组成图像处理命令。
可选的,所述图像处理模块53包括:对象识别单元531和执行处理单元532;
对象识别单元531,用于根据所述处理对象关键词,从所述目标图像中识别出处理对象;
执行处理单元532,用于根据所述处理方式关键词,对所述处理对象执行处理。
本发明实施方式中,图像处理方法装置包括:语音接收模块51、命令获取模块52和图像处理模块53;分别执行:接收语音信息;对所述语音信息进行识别,得到图像处理命令;根据所述图像处理命令,对目标图像进行图像处理,得到处理后的所述目标图像。因此,在本发明实施方式中,移动终端无需接收用户的手动操作来处理图像,而是仅仅通过接收用户的语音信息,便可实现图像处理的功能,相比现有技术,此过程更加简便,节省了用户时间,提高了操作效率。
实施方式四
请参阅图7,图7是本发明实施方式四提供的一种图像处理的装置50,应用于终端设备,包括:语音接收模块51、命令获取模块52和图像处理模块53;
其中,语音接收模块51用于接收语音信息;
命令获取模块52用于对所述语音信息进行识别,得到图像处理命令;
图像处理模块53用于根据所述图像处理命令,对目标图像进行图像处理,得到处理后的所述目标图像。
可选的,所述命令获取模块52包括:文本获取单元521、文本提取单元522和命令形成单元523;
文本获取单元521用于将所述语音信息转换为文本信息;
文本提取单元522用于从所述文本信息中提取出处理对象关键词和处理方式关键词;
命令形成单元523用于将所述处理对象关键词和处理方式关键词组成图像处理命令。
可选的,所述命令获取模块52包括:词语获取单元(图未示)、词语提取单元(图未示)和命令生成单元(图未示);
词语获取单元,其用于根据语音信息和预设有关键词语音的语音库,提取出语音信息中与预设有关键词语音的语音库中发音相同的词语,其中,预设有关键词语音的语音库中包含了预设的处理对象关键词语音和处理方式关键词语音;
词语提取单元,其用于根据所提取出的发音相同的词语,获得处理对象关键词和处理方式关键词;
命令生成单元,其用于将处理对象关键词和处理方式关键词组成图像处理命令。
可选的,所述图像处理模块53包括:对象识别单元531和执行处理单元532;
对象识别单元531,用于根据所述处理对象关键词,从所述目标图像中识别出处理对象;
执行处理单元532,用于根据所述处理方式关键词,对所述处理对象执行处理。
可选的,装置50还包括:声音判断模块54,用于判断所述语音信息中是否只包含一种声音;
第一提取模块55,用于若所述语音信息中只包含一种声音,提取所述语音信息前N位的语音词;
语音词判断模块56,用于判断所述语音词是否包含有预设命令词的声音;若是,则进入所述对语音信息进行识别,得到所述图像处理命令的步骤。
可选的,所述装置50还包括:
第二提取模块57,用于若所述语音信息包含有多种声音,提取各个声音前N位的语音词;
声音筛选模块58,用于获取所述语音词包含有预设命令词的声音;
所述对所述语音信息进行识别,得到所述图像处理命令具体为:
对声音筛选模块获取得到的声音进行识别,得到所述图像处理命令。
本发明实施方式中,图像处理方法装置包括:语音接收模块51、命令获取模块52和图像处理模块53;分别执行:接收语音信息;对所述语音信息进行识别,得到图像处理命令;根据所述图像处理命令,对目标图像进行图像处理,得到处理后的所述目标图像。因此,在本发明实施方式中,移动终端无需接收用户的手动操作来处理图像,而是仅仅通过接收用户的语音信息,便可实现图像处理的功能,相比现有技术,此过程更加简便,节省了用户时间,提高了操作效率。此外,当获取的声音为多个时,还将针对各个声音提取各个声音前N位的语音词,分别执行图像处理,或者根据音量最大的声音,执行图像处理。
请参考图8,图8是本发明实施例提供的执行图像处理的电子设备的硬件结构示意图,如图8所示,该电子设备70包括:
一个或多个处理器71以及存储器72,图7中以一个处理器71为例。
处理器71和存储器72可以通过总线或者其他方式连接,图8中以通过总线连接为例。
存储器72作为一种非易失性计算机可读存储介质,可用于存储非易失性软件程序、非易失性计算机可执行程序以及模块,如本发明实施例中的图像处理对应的程序指令/模块(例如,附图6所示的语音接收模块51、命令获取模块52和图像处理模块53)。处理器71通过运行存储在存储器72中的非易失性软件程序、指令以及模块,从而执行服务器的各种功能应用以及数据处理,即实现上述方法实施例图像处理。
存储器72可以包括存储程序区和存储数据区,其中,存储程序区可存储操作***、至少一个功能所需要的应用程序;存储数据区可存储根据商品推荐装置的使用所创建的数据等。此外,存储器72可以包括高速随机存取存储器,还可以包括非易失性存储器,例如至少一个磁盘存储器件、闪存器件、或其他非易失性固态存储器件。在一些实施例中,存储器72可选包括相对于处理器71远程设置的存储器,这些远程存储器可以通过网络连接至商品推荐装置。上述网络的实例包括但不限于互联网、企业内部网、局域网、移动通信网及其组合。
所述一个或者多个模块存储在所述存储器72中,当被所述一个或者多个处理器71执行时,执行上述任意方法实施例中的图像处理,例如,执行以上描述的图1中的方法步骤101至步骤103,图2中的方法步骤1021至步骤1023,图3中的方法步骤1021a至步骤1023a,图4中的方法步骤1031至步骤1032,图5中的方法步骤201至步骤209,实现图6中的模块51-53,单元521-523,单元531-532,图7中的模块51-58,单元521-523,单元531-532的功能。
上述产品可执行本发明实施例所提供的方法,具备执行方法相应的功能模块和有益效果。未在本实施例中详尽描述的技术细节,可参见本发明实施例所提供的方法。
本发明实施例的电子设备以多种形式存在,包括但不限于:服务器:提供计算服务的设备,服务器的构成包括处理器、硬盘、内存、***总线等,服务器和通用的计算机架构类似,但是由于需要提供高可靠的服务,因此在处理能力、稳定性、可靠性、安全性、可扩展性、可管理性等方面要求较高。或者,其他具有数据交互功能的电子装置。
本发明实施例提供了一种非易失性计算机可读存储介质,所述非易失性计算机可读存储介质存储有计算机可执行指令,该计算机可执行指令被电子设备执行上述任意方法实施例中的图像处理,例如,执行以上描述的图1中的方法步骤101至步骤103,图2中的方法步骤1021至步骤1023,图3中的方法步骤1021a至步骤1023a,图4中的方法步骤1031至步骤1032,图5中的方法步骤201至步骤209,实现图6中的模块51-53,单元521-523,单元531-532,图7中的模块51-58,单元521-523,单元531-532的功能。
本发明实施例提供了一种计算机程序产品,包括存储在非易失性计算机可读存储介质上的计算程序,所述计算机程序包括程序指令,当所述程序指令被计算机执行时时,使所述计算机执行上述任意方法实施例中的图像处理,例如,执行以上描述的图1中的方法步骤101至步骤103,图2中的方法步骤1021至步骤1023,图3中的方法步骤1021a至步骤1023a,图4中的方法步骤1031至步骤1032,图5中的方法步骤201至步骤209,实现图6中的模块51-53,单元521-523,单元531-532,图7中的模块51-58,单元521-523,单元531-532的功能。
以上所描述的装置实施例仅仅是示意性的,其中所述作为分离部件说明的单元可以是或者也可以不是物理上分开的,作为单元显示的部件可以是或者也可以不是物理单元,即可以位于一个地方,或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部模块来实现本实施例方案的目的。
通过以上的实施方式的描述,本领域普通技术人员可以清楚地了解到各实施方式可借助软件加通用硬件平台的方式来实现,当然也可以通过硬件。本领域普通技术人员可以理解实现上述实施例方法中的全部或部分流程是可以通过计算机程序来指令相关的硬件来完成,所述的程序可存储于一计算机可读取存储介质中,该程序在执行时,可包括如上述各方法的实施例的流程。其中,所述的存储介质可为磁碟、光盘、只读存储记忆体(Read-Only Memory,ROM)或随机存储记忆体(Random Access Memory,RAM)等。
以上所述仅为本发明的实施方式,并非因此限制本发明的专利范围,凡是利用本发明说明书及附图内容所作的等效结构或等效流程变换,或直接或间接运用在其他相关的技术领域,均同理包括在本发明的专利保护范围内。

Claims (12)

1.一种图像处理的方法,应用于终端设备,其特征在于,包括:
接收语音信息;
对所述语音信息进行识别,得到图像处理命令;
根据所述图像处理命令,对目标图像进行图像处理,得到处理后的所述目标图像。
2.根据权利要求1所述的方法,其特征在于,
所述对所述语音信息进行识别,得到图像处理命令的步骤包括:
将所述语音信息转换为文本信息;
从所述文本信息中提取出处理对象关键词和处理方式关键词;
将所述处理对象关键词和处理方式关键词组成图像处理命令。
3.根据权利要求1所述的方法,其特征在于,
所述对所述语音信息进行识别,得到图像处理命令的步骤包括:
根据所述语音信息和预设有关键词语音的语音库,提取出所述语音信息中与所述预设有关键词语音的语音库中发音相同的词语,其中,所述预设有关键词语音的语音库中包含了预设的处理对象关键词语音和处理方式关键词语音;
根据所提取出的所述发音相同的词语,获得处理对象关键词和处理方式关键词;
将所述处理对象关键词和处理方式关键词组成图像处理命令。
4.根据权利要求2或3所述的方法,其特征在于,
所述根据所述图像处理命令,对目标图像进行图像处理的步骤包括:
根据所述处理对象关键词,从所述目标图像中识别出处理对象;
根据所述处理方式关键词,对所述处理对象执行处理。
5.根据权利要求1所述的方法,其特征在于,
在所述接收语音信息的步骤之后,所述方法还包括:
判断所述语音信息中是否只包含一种声音;
若所述语音信息中只包含一种声音,提取所述语音信息前N位的语音词;
判断所述语音词是否包含有预设命令词;
若是,则进入所述对语音信息进行识别,得到所述图像处理命令的步骤。
6.根据权利要求5所述的方法,其特征在于,
所述方法还包括:
若所述语音信息包含有多种声音,提取各个声音前N位的语音词;
获取所述语音词包含有预设命令词的声音;
所述对所述语音信息进行识别,得到所述图像处理命令具体为:
对获取得到的声音进行识别,得到所述图像处理命令。
7.一种图像处理的装置,应用于终端设备,其特征在于,包括:
语音接收模块,其用于接收语音信息;
命令获取模块,其用于对所述语音信息进行识别,得到图像处理命令;
图像处理模块,其用于根据所述图像处理命令,对目标图像进行图像处理,得到处理后的所述目标图像。
8.根据权利要求7所述的装置,其特征在于,
所述命令获取模块包括:
文本获取单元,其用于将所述语音信息转换为文本信息;
文本提取单元,其用于从所述文本信息中提取出处理对象关键词和处理方式关键词;
命令形成单元,其用于将所述处理对象关键词和处理方式关键词组成图像处理命令。
9.根据权利要求7所述的装置,其特征在于,
所述命令获取模块包括:
词语获取单元,其用于根据所述语音信息和预设有关键词语音的语音库,提取出所述语音信息中与所述预设有关键词语音的语音库中发音相同的词语,其中,所述预设有关键词语音的语音库中包含了预设的处理对象关键词语音和处理方式关键词语音;
词语提取单元,其用于根据所提取出的所述发音相同的词语,获得处理对象关键词和处理方式关键词;
命令生成单元,其用于将所述处理对象关键词和处理方式关键词组成图像处理命令。
10.根据权利要求8或9所述的装置,其特征在于,
所述图像处理模块包括:
对象识别单元,其用于根据所述处理对象关键词,从所述目标图像中识别出处理对象;
执行处理单元,其用于根据所述处理方式关键词,对所述处理对象执行处理。
11.根据权利要求7所述的装置,其特征在于,所述装置还包括:
声音判断模块,其用于判断所述语音信息中是否只包含一种声音;
第一提取模块,其用于若所述语音信息中只包含一种声音,提取所述语音信息前N位的语音词;
语音词判断模块,其用于判断所述语音词是否包含有预设命令词;若是,则进入所述对语音信息进行识别,得到所述图像处理命令的步骤。
12.根据权利要求11所述的装置,其特征在于,
所述装置还包括:
第二提取模块,其用于若所述语音信息包含有多种声音,提取各个声音前N位的语音词;
声音筛选模块,其用于获取所述语音词包含有预设命令词的声音;
所述对所述语音信息进行识别,得到所述图像处理命令具体为:
对声音筛选模块获取得到的声音进行识别,得到所述图像处理命令。
CN201710980039.8A 2017-10-19 2017-10-19 一种图像处理的方法以及装置 Pending CN107886947A (zh)

Priority Applications (2)

Application Number Priority Date Filing Date Title
CN201710980039.8A CN107886947A (zh) 2017-10-19 2017-10-19 一种图像处理的方法以及装置
PCT/CN2018/100212 WO2019076120A1 (zh) 2017-10-19 2018-08-13 一种图像处理的方法、装置、存储介质及电子装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201710980039.8A CN107886947A (zh) 2017-10-19 2017-10-19 一种图像处理的方法以及装置

Publications (1)

Publication Number Publication Date
CN107886947A true CN107886947A (zh) 2018-04-06

Family

ID=61781978

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201710980039.8A Pending CN107886947A (zh) 2017-10-19 2017-10-19 一种图像处理的方法以及装置

Country Status (2)

Country Link
CN (1) CN107886947A (zh)
WO (1) WO2019076120A1 (zh)

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2019076120A1 (zh) * 2017-10-19 2019-04-25 格力电器(武汉)有限公司 一种图像处理的方法、装置、存储介质及电子装置
CN109977254A (zh) * 2019-04-03 2019-07-05 百度在线网络技术(北京)有限公司 用于获取图像的方法及装置
CN111383637A (zh) * 2018-12-28 2020-07-07 上海寒武纪信息科技有限公司 信号处理装置、信号处理方法及相关产品
CN112801083A (zh) * 2021-01-29 2021-05-14 百度在线网络技术(北京)有限公司 图像识别的方法、装置、设备以及存储介质

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110784523B (zh) * 2019-10-11 2022-08-02 北京地平线机器人技术研发有限公司 一种目标物信息的推送方法及装置

Citations (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP1014258A3 (en) * 1998-12-23 2003-11-26 Hewlett-Packard Company, A Delaware Corporation Automatic data routing via voice command annotation
US20070198258A1 (en) * 2006-02-17 2007-08-23 Inventec Appliances Corp. Method and portable device for inputting characters by using voice recognition
CN102945671A (zh) * 2012-10-31 2013-02-27 四川长虹电器股份有限公司 语音识别方法
CN103714815A (zh) * 2013-12-09 2014-04-09 何永 语音控制方法及其设备
CN105446146A (zh) * 2015-11-19 2016-03-30 深圳创想未来机器人有限公司 基于语义分析的智能终端控制方法、***及智能终端
CN106156310A (zh) * 2016-06-30 2016-11-23 努比亚技术有限公司 一种图片处理装置和方法
CN106157950A (zh) * 2016-09-29 2016-11-23 合肥华凌股份有限公司 语音控制***及其唤醒方法、唤醒装置和家电、协处理器
CN106250747A (zh) * 2016-08-01 2016-12-21 联想(北京)有限公司 一种信息处理方法及电子设备
KR101713770B1 (ko) * 2015-09-18 2017-03-08 주식회사 베이리스 차량용 음성 인식 시스템 및 그 음성 인식 방법
CN106782563A (zh) * 2016-12-28 2017-05-31 上海百芝龙网络科技有限公司 一种智能家居语音交互***

Family Cites Families (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20100238323A1 (en) * 2009-03-23 2010-09-23 Sony Ericsson Mobile Communications Ab Voice-controlled image editing
JP5146429B2 (ja) * 2009-09-18 2013-02-20 コニカミノルタビジネステクノロジーズ株式会社 画像処理装置、音声認識処理装置、音声認識処理装置の制御方法、およびコンピュータプログラム
KR20130016644A (ko) * 2011-08-08 2013-02-18 삼성전자주식회사 음성인식장치, 음성인식서버, 음성인식시스템 및 음성인식방법
TW201407538A (zh) * 2012-08-05 2014-02-16 Hiti Digital Inc 影像擷取裝置與利用語音辨識進行影像處理的方法
CN105912717A (zh) * 2016-04-29 2016-08-31 广东小天才科技有限公司 基于图像的信息搜索方法及装置
CN107886947A (zh) * 2017-10-19 2018-04-06 珠海格力电器股份有限公司 一种图像处理的方法以及装置

Patent Citations (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP1014258A3 (en) * 1998-12-23 2003-11-26 Hewlett-Packard Company, A Delaware Corporation Automatic data routing via voice command annotation
US20070198258A1 (en) * 2006-02-17 2007-08-23 Inventec Appliances Corp. Method and portable device for inputting characters by using voice recognition
CN102945671A (zh) * 2012-10-31 2013-02-27 四川长虹电器股份有限公司 语音识别方法
CN103714815A (zh) * 2013-12-09 2014-04-09 何永 语音控制方法及其设备
KR101713770B1 (ko) * 2015-09-18 2017-03-08 주식회사 베이리스 차량용 음성 인식 시스템 및 그 음성 인식 방법
CN105446146A (zh) * 2015-11-19 2016-03-30 深圳创想未来机器人有限公司 基于语义分析的智能终端控制方法、***及智能终端
CN106156310A (zh) * 2016-06-30 2016-11-23 努比亚技术有限公司 一种图片处理装置和方法
CN106250747A (zh) * 2016-08-01 2016-12-21 联想(北京)有限公司 一种信息处理方法及电子设备
CN106157950A (zh) * 2016-09-29 2016-11-23 合肥华凌股份有限公司 语音控制***及其唤醒方法、唤醒装置和家电、协处理器
CN106782563A (zh) * 2016-12-28 2017-05-31 上海百芝龙网络科技有限公司 一种智能家居语音交互***

Cited By (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2019076120A1 (zh) * 2017-10-19 2019-04-25 格力电器(武汉)有限公司 一种图像处理的方法、装置、存储介质及电子装置
CN111383637A (zh) * 2018-12-28 2020-07-07 上海寒武纪信息科技有限公司 信号处理装置、信号处理方法及相关产品
CN109977254A (zh) * 2019-04-03 2019-07-05 百度在线网络技术(北京)有限公司 用于获取图像的方法及装置
CN112801083A (zh) * 2021-01-29 2021-05-14 百度在线网络技术(北京)有限公司 图像识别的方法、装置、设备以及存储介质
CN112801083B (zh) * 2021-01-29 2023-08-08 百度在线网络技术(北京)有限公司 图像识别的方法、装置、设备以及存储介质

Also Published As

Publication number Publication date
WO2019076120A1 (zh) 2019-04-25

Similar Documents

Publication Publication Date Title
CN107886947A (zh) 一种图像处理的方法以及装置
CN110147726B (zh) 业务质检方法和装置、存储介质及电子装置
CN107239666B (zh) 一种对医疗影像数据进行脱敏处理的方法及***
US10372950B2 (en) Identification verification using a device with embedded radio-frequency identification functionality
US9197244B2 (en) Multi-layer system for symbol-space based compression of patterns
CN111950424B (zh) 一种视频数据处理方法、装置、计算机及可读存储介质
CN108447471A (zh) 语音识别方法及语音识别装置
CN109450850A (zh) 身份验证方法、装置、计算机设备和存储介质
US20170011735A1 (en) Speech recognition system and method
CN109271533A (zh) 一种多媒体文件检索方法
CN109074808A (zh) 语音控制方法、中控设备和存储介质
CN110598008B (zh) 录制数据的数据质检方法及装置、存储介质
CN109241780B (zh) 一种图像隐藏信息的检测方法、装置及设备
CN110033027A (zh) 一种物品识别方法、装置、终端及可读存储介质
CN114419363A (zh) 基于无标注样本数据的目标分类模型训练方法及装置
CN107910006A (zh) 语音识别方法、装置和多信源语音区分识别***
CN112612877A (zh) 多类型消息智能答复方法、装置、计算机设备及存储介质
CN108133209A (zh) 一种文本识别中的目标区域搜索方法及其装置
CN113051384A (zh) 基于对话的用户画像抽取方法及相关装置
CN115222047A (zh) 一种模型训练方法、装置、设备及存储介质
CN114218428A (zh) 音频数据聚类方法、装置、设备及存储介质
US20200286506A1 (en) Method and system using successive differences of speech signals for emotion identification
CN106775810A (zh) 分布式文件***中配置文件的写入方法及装置
CN106294659A (zh) 基于智能终端的搜题方法及装置
CN109712607A (zh) 一种处理方法、装置及电子设备

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
RJ01 Rejection of invention patent application after publication

Application publication date: 20180406

RJ01 Rejection of invention patent application after publication