CN111565281A - 拍照方法、装置、电子设备以及存储介质 - Google Patents

拍照方法、装置、电子设备以及存储介质 Download PDF

Info

Publication number
CN111565281A
CN111565281A CN202010378771.XA CN202010378771A CN111565281A CN 111565281 A CN111565281 A CN 111565281A CN 202010378771 A CN202010378771 A CN 202010378771A CN 111565281 A CN111565281 A CN 111565281A
Authority
CN
China
Prior art keywords
photographing
processing
intention
voice instruction
mode
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202010378771.XA
Other languages
English (en)
Inventor
张童飞
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Guangdong Oppo Mobile Telecommunications Corp Ltd
Original Assignee
Guangdong Oppo Mobile Telecommunications Corp Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Guangdong Oppo Mobile Telecommunications Corp Ltd filed Critical Guangdong Oppo Mobile Telecommunications Corp Ltd
Priority to CN202010378771.XA priority Critical patent/CN111565281A/zh
Publication of CN111565281A publication Critical patent/CN111565281A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N23/00Cameras or camera modules comprising electronic image sensors; Control thereof
    • H04N23/60Control of cameras or camera modules
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/22Procedures used during a speech recognition process, e.g. man-machine dialogue

Landscapes

  • Engineering & Computer Science (AREA)
  • Multimedia (AREA)
  • Signal Processing (AREA)
  • Computational Linguistics (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Physics & Mathematics (AREA)
  • Acoustics & Sound (AREA)
  • User Interface Of Digital Computer (AREA)

Abstract

本申请公开了一种拍照方法、装置、电子设备以及存储介质,涉及电子设备技术领域。该方法应用于电子设备,所述方法包括:在电子设备处于拍照模式的过程中,接收语音指令并获取语音指令对应的处理意图,从语音指令中获取与处理意图对应的图像优化方式,基于图像优化方式调整电子设备的拍照参数,显示与拍照参数对应的预览图像。本申请提供的拍照方法、装置、电子设备以及存储介质通过在电子设备处于拍照模式的过程中,对接收到的语音指令进行意图分析,并获取与意图对应的图像优化方式对拍照参数进行调整,以在拍照场景中简化用户操作,提升用户的拍照体验。

Description

拍照方法、装置、电子设备以及存储介质
技术领域
本申请涉及电子设备技术领域,更具体地,涉及一种拍照方法、装置、电子设备以及存储介质。
背景技术
随着科学技术的发展,电子设备的使用越来越广泛,功能越来越多,已经成为人们日常生活中的必备之一。目前,电子设备可以用于进行拍照,但是,用户在利用电子设备进行拍照时,需要通过触控操作触发拍照对应的功能,拍照过程繁琐,造成用户体验不佳。
发明内容
鉴于上述问题,本申请提出了一种拍照方法、装置、电子设备以及存储介质,以解决上述问题。
第一方面,本申请实施例提供了一种拍照方法,应用于电子设备,所述方法包括:在所述电子设备处于拍照模式的过程中,接收语音指令并获取所述语音指令对应的处理意图;从所述语音指令中获取与所述处理意图对应的图像优化方式;基于所述图像优化方式调整所述电子设备的拍照参数;显示与所述拍照参数对应的预览图像。
第二方面,本申请实施例提供了一种拍照装置,应用于电子设备,所述装置包括:处理意图获取模块,用于在所述电子设备处于拍照模式的过程中,接收语音指令并获取所述语音指令对应的处理意图;图像优化方式获取模块,用于,用于从所述语音指令中获取与所述处理意图对应的图像优化方式;拍照参数调整模块,用于基于所述图像优化方式调整所述电子设备的拍照参数;预览图像显示模块,用于显示与所述拍照参数对应的预览图像。
第三方面,本申请实施例提供了一种电子设备,包括存储器和处理器,所述存储器耦接到所述处理器,所述存储器存储指令,当所述指令由所述处理器执行时所述处理器执行上述方法。
第四方面,本申请实施例提供了一种计算机可读取存储介质,所述计算机可读取存储介质中存储有程序代码,所述程序代码可被处理器调用执行上述方法。
本申请实施例提供的拍照方法、装置、电子设备以及存储介质,在电子设备处于拍照模式的过程中,接收语音指令并获取语音指令对应的处理意图,从语音指令中获取与处理意图对应的图像优化方式,基于图像优化方式调整电子设备的拍照参数,显示与拍照参数对应的预览图像,从而通过在电子设备处于拍照模式的过程中,对接收到的语音指令进行意图分析,并获取与意图对应的图像优化方式对拍照参数进行调整,以在拍照场景中简化用户操作,提升用户的拍照体验。
附图说明
为了更清楚地说明本申请实施例中的技术方案,下面将对实施例描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本申请的一些实施例,对于本领域技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其它的附图。
图1示出了本申请一个实施例提供的拍照方法的流程示意图;
图2示出了本申请又一个实施例提供的拍照方法的流程示意图;
图3示出了本申请的图2所示的拍照方法的步骤S280的流程示意图;
图4示出了本申请再一个实施例提供的拍照方法的流程示意图;
图5示出了本申请实施例提供的拍照装置的模块框图;
图6示出了本申请实施例用于执行根据本申请实施例的拍照方法的电子设备的框图;
图7示出了本申请实施例的用于保存或者携带实现根据本申请实施例的拍照方法的程序代码的存储单元。
具体实施方式
为了使本技术领域的人员更好地理解本申请方案,下面将结合本申请实施例中的附图,对本申请实施例中的技术方案进行清楚、完整地描述。
其中,随着电子设备技术的发展,其所应用的领域也越来越广,例如,越来越多的电子设备开始被应用于拍照领域。目前,在利用电子设备进行拍照时,主要通过用户的触控操作触发执行,从而造成操作繁琐,用户体验不佳的问题。为了解决上述问题,目前的电子设备厂商开始支持语音指令控制拍照,以减少触控操作的繁琐步骤,提升用户的拍照体验,但是,发明人经过研究发现,目前的电子设备支持的语音指令仅包括与拍摄启动相关的语音指令,而在电子设备处于拍摄模式的过程中,仅能通过触控操作实现拍照触发,另外,目前的电子设备对于语音指令的实现是通过将接收到的语音指令与预存的语音指令进行对比,因此,对于一些口语化的表达方式则无法识别,从而造成应用范围有限的问题。
针对上述问题,发明人经过长期的研究发现,并提出了本申请实施例提供的拍照方法、装置、电子设备以及存储介质,通过在电子设备处于拍照模式的过程中,对接收到的语音指令进行意图分析,并获取与意图对应的图像优化方式对拍照参数进行调整,以在拍照场景中简化用户操作,提升用户的拍照体验。其中,具体的拍照方法在后续的实施例中进行详细的说明。
请参阅图1,图1示出了本申请一个实施例提供的拍照方法的流程示意图。所述拍照方法用于通过在电子设备处于拍照模式的过程中,对接收到的语音指令进行意图分析,并获取与意图对应的图像优化方式对拍照参数进行调整,以在拍照场景中简化用户操作,提升用户的拍照体验。在具体的实施例中,所述拍照方法应用于如图5所示的拍照装置200以及配置有拍照装置200的电子设备100(图6)。下面将以电子设备为例,说明本实施例的具体流程,当然,可以理解的,本实施例所应用的电子设备可以为智能手机、平板电脑、穿戴式电子设备等,在此不做限定。下面将针对图1所示的流程进行详细的阐述,所示拍照方法具体可以包括以下步骤:
步骤S110:在所述电子设备处于拍照模式的过程中,接收语音指令并获取所述语音指令对应的处理意图。
在一些实施方式中,用户可以在电子设备输入拍照启动指令,电子设备可以响应该拍照启动指令启动拍照功能并处于拍照模式。其中,当电子设备接收到用户以文本形式输入的拍照启动指令时,可以响应该拍照启动指令启动拍照功能并处于拍照模式;当电子设备接收到用户以语音形式输入的拍照启动指令时,可以响应该拍照启动指令启动拍照功能并处于拍照模式;当电子设备接收到用户针对拍照应用对应的应用图标的点击操作时,可以响应该针对应用图标的点击操作启动拍照功能并处于拍照模式;当电子设备接收到用户针对拍照应用对应的应用链接的点击操作时,可以响应该针对应用链接的点击操作启动拍照功能并处于拍照模式;当电子设备接收到用户针对其他应用程序中可调用摄像头的控件的点击操作(如针对“扫一扫”控件的点击操作)时,可以响应针对该可调用摄像头的控件的点击操作启动拍照功能并处于拍照模式等,在此不做限定。
在一些实施方式中,该电子设备启动的摄像头可以是前置摄像头、可以是后置摄像头、也可以是隐藏在电子设备的本体内、且可相对于电子设备的本体转动的摄像头等,在此不做限定。
在本实施例中,在电子设备处于拍照模式的过程中,可以接收语音指令,并对接收到的语音指令进行分析获得该语音指令对应的处理意图。在一些实施方式中,在电子设备处于拍照模式的过程中,可以实时接收语音指令、可以按预设时间间隔接收语音指令、可以按指定时间接收语音指令、也可以按其他预设方式接收语音指令等,在此不做限定。其中,在一些实施方式中,电子设备可以在处于拍摄模式的过程中接收到语音指令时,便直接响应该语音指令获取该语音指令对应的处理意图,电子设备也可以在处于拍照模式的过程中接收到语音指令时,可以对该语音指令进行声纹识别,并在声纹识别成功时获取该语音指令对应的处理意图。
其中,以在接收到语音指令时,对语音指令进行声纹识别并声纹识别成功时获取该语音指令对应的处理意图为例。电子设备可以预先获取并存储合法用户的声纹信息作为指定声纹信息,该指定声纹信息用于作为获取到的语音指令对应的声纹信息的判断依据,即,在确定语音指令对应的声纹信息与指定声纹信息匹配时,可以确定该语音指令对应的用户为电子设备的合法用户,在确定语音指令对应的声纹信息与指定声纹信息不匹配时,可以确定该语音指令对应的用户不是电子设备的合法用户,因此,在本实施例中,在电子设备处于拍照模式的过程中,当接收到语音指令时,可以对语音指令进行声纹提取,获取该语音指令对应的声纹信息,并将该语音指令对应的声纹信息与指定声纹信息进行匹配,当语音指令对应的声纹信息与指定声纹信息匹配时,可以确定该语音指令对应的用户为电子设备的合法用户,则可以获取该语音指令对应的处理意图,当语音指令对应的声纹信息与指定声纹信息不匹配时,可以确定该语音指令对应的用户不是电子设备的合法用户,则可以不获取该语音指令对应的处理意图。
在一些实施方式中,电子设备在接收到语音指令后,可以对语音指令进行识别并进行意图分析,以获取该语音指令对应的处理意图。其中,该语音指令对应的处理意图是用于反应用户所期望电子设备进行的处理,例如,处理意图可以包括“图像优化”、“图像拍摄”、“图像删除”等,在此不做限定。例如,当语音指令为“我要瘦脸”时,可以确定该语音指令对应的处理意图为“图像优化”,当语音指令为“我要磨皮”时,可以确定该语音指令对应的处理意图为“图像优化”等,在此不做限定。
在一些实施方式中,可以将语音指令输入至意图分类模型进行意图分类,获取语音指令对应的处理意图,可以是提取语音指令中的实体输入至意图分类模型进行意图分类,获取语音指令对应的处理意图,也可以是提取语音指令中的实体,基于知识图谱获取实体的实体内容,将实体内容输入至意图分类模型进行意图分类,获取语音指令对应的处理意图等。其中,意图分类模型可以由SVM(Support Vector Machine,支持向量机)模型、神经网络模型或者随机森林模型等分类模型训练获得,通过机器学习实现用户意图分类,有效提高用户意图分类的准确性,从而提高语音识别的准确度。
步骤S120:从所述语音指令中获取与所述处理意图对应的图像优化方式。
在本实施例中,该语音指令对应的处理意图为图像优化。其中,在获取语音指令对应的处理意图(图像优化)后,可以基于该处理意图从语音指令中获取与该处理意图对应的图像优化方式。
在一些实施方式中,假设语音指令为“帮我瘦脸”,则可以确定该语音指令对应的处理意图为“图像优化”,则可以从“帮我瘦脸”中获取与“图像优化”对应的图像优化方式为“瘦脸”;假设语音指令为“脸小一点”,则可以确定该语音指令对应的处理意图为“图像优化”,则可以从“脸小一点”中获取与“图像优化”对应的图像优化方式为“瘦脸”;假设语音指令为“打开磨皮”,则可以确定该语音指令对应的处理意图为“图像优化”,则可以从“打开磨皮”中获取与“图像优化”对应的图像优化方式为“磨皮”;假设语音指令为“磨皮效果加强”,则可以确定该语音指令对应的处理意图为“图像优化”,则可以从“磨皮效果加强”中获取与“图像优化”对应的图像优化方式为“磨皮”;假设语音指令为“开启滤镜”,则可以确定该语音指令对应的处理意图为“图像优化”,则可以从“开启滤镜”中获取与“图像优化”对应的图像优化方式为“滤镜”;假设语音指令为“使用XX滤镜”,则可以确定该语音指令对应的处理意图为“图像优化”,则可以从“使用XX滤镜”中获取与“图像优化”对应的图像优化方式为“磨皮”等,在此不做限定。
步骤S130:基于所述图像优化方式调整所述电子设备的拍照参数。
在本实施例中,在从语音指令中获取与该处理意图对应的图像优化方式后,可以基于该图像优化方式调整电子设备的拍照参数。在一些实施方式中,可以基于该图像优化方式调整电子设备的“瘦脸参数”,可以基于该图像优化方式调整电子设备的“磨皮参数”,也可以基于该图像优化方式调整该电子设备的“滤镜参数”等。
在一些实施方式中,基于图像优化方式所调整的电子设备的拍照参数可以是预先设置的固定数值,也可以是根据语音指令的不同设置的不同数值,在此不做限定。其中,当基于图像优化方式所调整的电子设备的拍照参数是预先设置的固定数值时,则每次调整的电子设备的拍照参数可以是固定不变的,例如,若图像优化方式为“瘦脸”时,则可以按照预先设置的固定参数调整电子设备的“瘦脸参数”,如果预先设置的固定参数为N1,则对电子设备的“瘦脸参数”调整N1得到“当前瘦脸参数”;若图像优化方式为“磨皮”时,则可以按照预先设置的固定参数调整电子设备的“磨皮参数”,如果预先设置的固定参数为N1,则对电子设备的“磨皮参数”调整N1得到“当前磨皮参数”等,在此不做限定。其中,当基于图像优化方式所调整的电子设备的拍照参数为根据语音指令的不同设置的不同数值时,则每次调整的电子设备的拍照参数可以是可变的,例如,若图像优化方式为“瘦脸”,且语音指令为“脸稍微小一点”,则可以根据语音指令设置数值N2,并对电子设备的“瘦脸参数”调整N2得到“当前瘦脸参数”,若图像优化方式为“瘦脸”,且语音指令为“脸多小一点”,则可以根据语音指令设置数值N3,并对电子设备的“瘦脸参数”调整N3得到“当前瘦脸参数”等,在此不做限定,其中,数值N2小于数值N3,即通过数值N2调整得到的“当前瘦脸参数”小于通过数值N3调整得到的“当前瘦脸参数”。
步骤S140:显示与所述拍照参数对应的预览图像。
在本实施例中,在基于图像优化方式调整电子设备的拍照参数后,可以基于该拍照参数对电子设备的拍照界面进行参数调整,并显示与该拍照参数对应的预览界面。
在一些实施方式中,电子设备在显示与拍照参数对应的预览图像的过程中,若用户认为该预览图像不满足其拍摄要求,还可以继续向电子设备输入语音指令,以使电子设备重新调整拍照参数,以获取更符合用户需求的预览图像,若用户认为该预览图像满足其拍摄要求,则可以向电子设备输入语音指令,以指示电子设备进行拍照,采集该预览图像对应的照片,以在拍照全程都通过语音控制,简化用户操作,提升用户的拍照体验。
在一些实施方式中,电子设备还可以基于接收到的语音指令,控制其前置摄像头和后置摄像头的切换开启和关闭,在此不再赘述。
本申请一个实施例提供的拍照方法,在电子设备处于拍照模式的过程中,接收语音指令并获取语音指令对应的处理意图,从语音指令中获取与处理意图对应的图像优化方式,基于图像优化方式调整电子设备的拍照参数,显示与拍照参数对应的预览图像,从而通过在电子设备处于拍照模式的过程中,对接收到的语音指令进行意图分析,并获取与意图对应的图像优化方式对拍照参数进行调整,以在拍照场景中简化用户操作,提升用户的拍照体验。
请参阅图2,图2示出了本申请又一个实施例提供的拍照方法的流程示意图。该方法应用于上述电子设备,下面将针对图2所示的流程进行详细的阐述,所述拍照方法具体可以包括以下步骤:
步骤S210:在所述电子设备处于拍照模式的过程中,启动全双工模式。
在一些实施方式中,在电子设备处于拍照模式的过程中,可以启动全双工模式,其中,全双工模式是指当数据的发送和接收分流,分别由两根不同的传输线传送时,通信双方都能在同一时刻进行发送和接收操作的传送方式。因此,在本实施例中,通过在电子设备处于拍照模式的过程中启动全双工模式的方式,可以实现电子设备的持续收音和反馈,即,在电子设备启动全双工模式后,***开启持续的收音状态,用户在拍照环境下可以持续发出语音指令,***可以连续响应语音指令对应的诉求。
步骤S220:在所述全双工模式下,持续接收多个语音指令并分别获取所述多个语音指令中的每个语音指令对应的处理意图。
在本实施例中,在启动全双工模式后,可以基于该全双工模式所支持的功能,持续接收多个语音指令并分别获取多个语音指令中的每个语音指令对应的处理意图。在一些实施方式中,电子设备可以在每接收到一个语音时,便直接获取该语音指令对应的处理意图,也可以在预设时间段内接收到多个语音指令时,再获取该多个语音指令对应的处理意图,在此不做限定。
步骤S230:对所述处理意图进行识别。
在本实施例中,电子设备在获取语音指令对应的处理意图后,可以对处理意图进行识别,以识别判断该语音指令是否与拍照相关。在一些实施方式中,电子设备在获取语音指令对应的处理意图后,可以对处理意图进行识别,判断该处理意图是否涉及拍照功能,其中,当确定该处理意图涉及拍照功能时,表征该处理意图与拍照相关,当确定该处理意图不涉及拍照功能时,表征该处理意图与拍照不相关。例如,在一些实施方式中,若该处理意图涉及“瘦脸”、“磨皮”、“滤镜”等时,可以确定该处理意图涉及拍照功能,表征该处理意图与拍照相关,若该处理意图涉及“查看天气”、“查看日历”等时,可以确定该处理意图不涉及拍照功能,表征该处理意图与拍照不相关。
步骤S240:当识别到所述处理意图与拍照相关时,从所述语音指令中获取与所述处理意图对应图像优化方式。
在本实施例中,在识别到该处理意图与拍照相关时,则电子设备可以响应该语音指令从语音指令中获取与该处理意图对应的图像优化方式。例如,当识别到该处理意图涉及“瘦脸”、“磨皮”、“滤镜”等时,电子设备可以响应该语音指令从语音指令中获取与该处理意图对应的图像优化方式。
步骤S250:基于所述图像优化方式调整所述电子设备的拍照参数。
步骤S260:显示与所述拍照参数对应的预览图像。
其中,步骤S240-步骤S260的具体描述请参阅步骤S130-步骤S140,在此不再赘述。
步骤S270:当识别到所述处理意图与拍照不相关时,不响应所述语音指令。
在本实施例中,在识别到该处理意图与拍照不相关时,可以不响应该语音指令。在一些实施方式中,在识别到该处理意图与拍照不相关时,电子设备可以不作出任何反应,并保持接收到语音指令之前的显示状态。在一些实施方式中,在识别到该处理意图与拍照不相关时,可以显示提示信息,该提示信息可以用于提示语音指令错误,以指示用户重新输入与拍照相关的语音指令,其中,该提示信息可以为语音提示信息、可以为文本提示信息、可以为弹窗提示信息、可以为闪烁灯提示信息等,在此不做限定。
步骤S280:当识别到所述处理意图与拍照不相关时,退出所述拍照模式。
在本实施例中,在识别到该处理意图与拍照不相关时,可以响应该语音指令退出拍照模式。在一些实施方式中,在识别到该处理意图与拍照不相关时,可以认为用户期望通过语音实现与拍照不相关的其他任务,则电子设备作为响应可以退出拍照模式,以便用户通过语音实现与拍照不相关的其他任务。
在一些实施方式中,退出拍照模式可以包括:将拍照应用程序切换到电子设备的后台运行,或者停止运行该拍照应用程序。
请参阅图3,图3示出了本申请的图2所示的拍照方法的步骤S280的流程示意图。下面将针对图3所示的流程进行详细的阐述,所述方法具体可以包括以下步骤:
步骤S281:当识别到所述处理意图与拍照不相关时,获取所述处理意图对应的应用程序。
在本实施例中,当识别到该处理意图与拍照不相关时,可以获取该处理意图对应的应用程序。在一些实施方式中,当识别到该处理意图与拍照不相关时,可以认为用户期望通过语音实现与拍照不相关的其他任务,则可以获取与拍照不相关的其他任务对应的应用程序,作为该处理意图对应的应用程序。例如,假设该处理意图为“查看天气”,则表征该处理意图与拍照不相关,因此,可以获取与该处理意图“查看天气”对应的应用程序。又例如,假设该处理意图为“查看日历”,则表征该处理意图与拍照不相关,因此,可以获取与该处理意图“查看日历”对应的应用程序。
步骤S282:退出所述拍照模式,并调用所述处理意图对应的应用程序。
在本实施例中,在获取处理意图对应的应用程序后,可以退出拍照模式,并调用处理意图对应的应用程序,以根据语音指令自动切换前台运行的应用程序,提升用户的使用体验。在一些实施方式中,在获取处理意图对应的应用程序后,可以将拍照应用程序切换到电子设备的后台运行,并在电子设备的前台运行处理意图对应的应用程序,或者,在获取处理意图对应的应用程序后,可以停止运行该拍照应用程序,并在电子设备的前台运行处理意图对应的应用程序。
在一些实施方式中,若处理意图对应的应用程序为聊天类应用程序,则电子设备可以退出拍照模式,并在电子设备的前台运行聊天类应用程序;若处理意图对应的应用程序为视频类应用程序,则电子设备可以退出拍照模式,并在电子设备的前台运行视频类应用程序等,在此不做限定。
在一些实施方式中,电子设备在调用处理意图对应的应用程序后,可以继续接收语音指令,并基于接收到的语音指令对应用程序进行对应的处理。在一些实施方式中,电子设备在调用处理意图对应的应用程序后,可以接收触控操作,并基于接收到的触控操作对应用程序进行对应的处理。
本申请又一个实施例提供的拍照方法,在电子设备处于拍照模式的过程中,启动全双工模式,在全双工模式下,持续接收多个语音指令并分别获取多个语音指令中的每个语音指令对应的处理意图,对处理意图进行识别,当识别到处理意图与拍照相关时,从语音指令中获取与处理意图对应的图像优化方式,基于图像优化方式调整电子设备的拍照参数,显示与拍照参数对应的预览图像,当识别到处理意图与拍照不相关时,不响应语音指令,或者,当识别到处理意图与拍照不相关时,退出拍照模式。相较于图1所示的拍照方法,本实施例还通过全双工模式在电子设备处于拍照模式的过程中持续接收语音指令,以满足用户连续发送的诉求,提升用户体验。另外,本实施例还对语音指令对应的处理意图是否与拍照相关进行识别,并进行相对应的处理,以提升语音拍照处理的智能性。
请参阅图4,图4示出了本申请再一个实施例提供的拍照方法的流程示意图。该方法应用于上述电子设备,下面将针对图4所示的流程进行详细的阐述,所述拍照方法具体可以包括以下步骤:
步骤S310:在所述电子设备处于拍照模式的过程中,接收所述语音指令。
其中,步骤S310的具体描述请参阅步骤S110,在此不再赘述。
步骤S320:对所述语音指令进行实体识别,获取所述语音指令中的实体。
其中,实体识别也称命名实体识别(named entity,NE),是指在语音指令中识别出特定类型的事物名称或符号的过程。在一些实施方式中,电子设备可以通过命名实体识别(named-entity recognition,NER)对语音指令进行实体识别,以获取该语音指令中的实体,以解决仅通过词典匹配造成上下文不相关的问题,提升目标实体获取的准确率。
步骤S330:对所述实体与知识图谱进行实体链接,获得与所述实体对应的实体内容。
其中,知识图谱(knowledge graph/vault)是显示知识发展进程与结构关系的一系列不同的图形,通过可视化技术描述知识资源对应的特征信息,挖掘、分析、构建、绘制和显示特征信息及它们之间的相互联系,知识图谱中,各个特征之间形成网状结构,以清楚表达各个领域中对应实体之间的关联和实体所对应分类之间的关联。
其中,实体链接(entity linking,EL)是指将语音指令中的实体提及映射到给定的知识库(KB),于本实施例中,是指将实体映射到知识图谱。在一些实施方式中,各个领域的知识图谱不同,因此,在将实体与知识图谱进行实体链接之前,可以先识别该实体所属的领域,并获取与该实体所属的领域对应的知识图谱,再将该实体与对应领域的知识图谱进行实体链接,以获得与该实体对应的实体内容。例如,若实体所属的领域为拍照领域,则可以获取拍照领域的知识图谱,再将该实体与拍照领域的知识图谱进行实体链接,以获得与该实体对应的实体内容。
在一些实施方式中,电子设备可以通过实体链接(named-entity linking,NEL)将实体与知识图谱进行实体链接,以获得与实体对应的实体内容。可以理解的是,在本实施例中,是通过将实体与知识图谱进行实体链接,相较于将语音指令与知识图谱进行识别链接的方式,可以降低资源过召回的问题。另外,本实施例通过抽象出NEL模块,使得整体架构在不更改模型的情况下能够快速支持资源更新、干预资源类别等。
步骤S340:基于所述实体内容对所述语音指令进行意图分析,获取所述语音指令对应的处理意图。
在一些实施方式中,可以将实体内容输入已训练的意图分类模型,获得该已训练的意图分类模型输出的至少一个分类结果,将该至少一个分类结果作为语音指令对应的处理意图,以实现获得语音指令对应的处理意图。具体地,该已训练的意图分类模型可以由SVM(Support Vector Machine,支持向量机)模型、神经网络模型或者随机森林模型等分类模型训练获得,通过机器学习实现用户意图分类,有效提高用户意图分类的准确性,从而提高智能问答的准确度。例如,将实体内容作为模型输入单层神经网络模型的输入,所述实体内容对应的意图分类作为所述单层神经网络模型的输出,基于多组所述实体内容和对应的意图类别对所述单层神经网络模型进行训练,得到所述意图分类模型。
步骤S350:从所述语音指令中获取与所述处理意图对应的图像优化方式。
步骤S360:基于所述图像优化方式调整所述电子设备的拍照参数。
步骤S370:显示与所述拍照参数对应的预览图像。
其中,步骤S350-步骤S370的具体描述请参阅步骤S120-步骤S140,在此不再赘述。
本申请再一个实施例提供的拍照方法,在电子设备处于拍照模式的过程中,接收语音指令,对语音指令进行实体识别,获取语音指令中的实体,对实体与知识图谱进行实体链接,获得与实体对应的实体内容,基于实体内容对语音指令进行意图分析,获取语音指令对应的处理意图,从语音指令中获取与处理意图对应的图像优化方式,基于图像优化方式调整电子设备的拍照参数,显示与拍照参数对应的预览图像。相较于图1所示的拍照方法,本实施例还对接收到的语音指令进行实体识别获取语音指令中的实体,并将获取的实体与知识图谱进行实体链接获得实体内容进行意图分析,获取语音指令对应的处理意图,以提升语音指令识别的准确性的成功率。
请参阅图5,图5示出了本申请实施例提供的拍照装置200的模块框图。该拍照装置200应用于上述电子设备,下面将针对图5所示的框图进行阐述,所示拍照装置200包括:处理意图获取模块210、图像优化方式获取模块220、拍照参数调整模块230以及预览图像显示模块240,其中:
处理意图获取模块210,用于在所述电子设备处于拍照模式的过程中,接收语音指令并获取所述语音指令对应的处理意图。
进一步地,所述处理意图获取模块210包括:全双工模式启动子模块和第一处理意图获取子模块,其中:
全双工模式启动子模块,用于在所述电子设备处于拍照模式的过程中,启动全双工模式。
第一处理意图获取子模块,用于在所述全双工模式下,持续接收多个语音指令并分别获取所述多个语音指令中的每个语音指令对应的处理意图。
进一步地,所述处理意图获取模块210包括:语音指令接收子模块、实体获取子模块、实体内容获得子模块以及第二处理意图获取子模块,其中:
语音指令接收子模块,用于在所述电子设备处于拍照模式的过程中,接收所述语音指令。
实体获取子模块,用于对所述语音指令进行实体识别,获取所述语音指令中的实体。
实体内容获得子模块,用于对所述实体与知识图谱进行实体链接,获得与所述实体对应的实体内容。
第二处理意图获取子模块,用于基于所述实体内容对所述语音指令进行意图分析,获取所述语音指令对应的处理意图。
图像优化方式获取模块220,用于,用于从所述语音指令中获取与所述处理意图对应的图像优化方式。
进一步地,所述图像优化方式获取模块220包括:处理意图识别子模块和图像优化方式获取子模块,其中:
处理意图识别子模块,用于对所述处理意图进行识别。
图像优化方式获取子模块,用于当识别到所述处理意图与拍照相关时,从所述语音指令中获取与所述处理意图对应图像优化方式。
进一步地,所述图像优化方式获取模块220还包括:不响应子模块,其中:
不响应子模块,用于当识别到所述处理意图与拍照不相关时,不响应所述语音指令。
进一步地,所述图像优化方式获取模块220还包括:拍照模式退出子模块,其中:
拍照模式退出子模块,用于当识别到所述处理意图与拍照不相关时,退出所述拍照模式。
进一步地,所述拍照模式退出子模块包括:应用程序获取单元和应用程序调用单元,其中:
应用程序获取单元,用于当识别到所述处理意图与拍照不相关时,获取所述处理意图对应的应用程序。
应用程序调用单元,用于退出所述拍照模式,并调用所述处理意图对应的应用程序。
拍照参数调整模块230,用于基于所述图像优化方式调整所述电子设备的拍照参数。
预览图像显示模块240,用于显示与所述拍照参数对应的预览图像。
所属领域的技术人员可以清楚地了解到,为描述的方便和简洁,上述描述装置和模块的具体工作过程,可以参考前述方法实施例中的对应过程,在此不再赘述。
在本申请所提供的几个实施例中,模块相互之间的耦合可以是电性,机械或其它形式的耦合。
另外,在本申请各个实施例中的各功能模块可以集成在一个处理模块中,也可以是各个模块单独物理存在,也可以两个或两个以上模块集成在一个模块中。上述集成的模块既可以采用硬件的形式实现,也可以采用软件功能模块的形式实现。
请参阅图6,其示出了本申请实施例提供的一种电子设备100的结构框图。该电子设备100可以是智能手机、平板电脑、电子书等能够运行应用程序的电子设备。本申请中的电子设备100可以包括一个或多个如下部件:处理器110、存储器120、触摸屏130、摄像头140以及一个或多个应用程序,其中一个或多个应用程序可以被存储在存储器120中并被配置为由一个或多个处理器110执行,一个或多个程序配置用于执行如前述方法实施例所描述的方法。
其中,处理器110可以包括一个或者多个处理核。处理器110利用各种接口和线路连接整个电子设备100内的各个部分,通过运行或执行存储在存储器120内的指令、程序、代码集或指令集,以及调用存储在存储器120内的数据,执行电子设备100的各种功能和处理数据。可选地,处理器110可以采用数字信号处理(Digital Signal Processing,DSP)、现场可编程门阵列(Field-Programmable Gate Array,FPGA)、可编程逻辑阵列(ProgrammableLogic Array,PLA)中的至少一种硬件形式来实现。处理器110可集成中央处理器(CentralProcessing Unit,CPU)、图形处理器(Graphics Processing Unit,GPU)和调制解调器等中的一种或几种的组合。其中,CPU主要处理操作***、用户界面和应用程序等;GPU用于负责待显示内容的渲染和绘制;调制解调器用于处理无线通信。可以理解的是,上述调制解调器也可以不集成到处理器110中,单独通过一块通信芯片进行实现。
存储器120可以包括随机存储器(Random Access Memory,RAM),也可以包括只读存储器(Read-Only Memory)。存储器120可用于存储指令、程序、代码、代码集或指令集。存储器120可包括存储程序区和存储数据区,其中,存储程序区可存储用于实现操作***的指令、用于实现至少一个功能的指令(比如触控功能、声音播放功能、图像播放功能等)、用于实现下述各个方法实施例的指令等。存储数据区还可以存储电子设备100在使用中所创建的数据(比如电话本、音视频数据、聊天记录数据)等。
触摸屏130用于显示由用户输入的信息、提供给用户的信息以及所述电子设备100的各种图形用户接口,这些图形用户接口可以由图形、文本、图标、数字、视频和其任意组合来构成,在一个实例中,该触摸屏130可以为液晶显示器(Liquid Crystal Display,LCD),也可以为有机发光二极管(Organic Light-Emitting Diode,OLED),在此不做限定。
摄像头140可以包括前置摄像头、后置摄像头等,且摄像头140可以固定于电子设备的本体上、可以相对电子设备的本体滑动、可以相对电子设备的本地翻转、也可以相对电子设备的本体转动等,在此不做限定。
请参阅图7,其示出了本申请实施例提供的一种计算机可读存储介质的结构框图。该计算机可读介质300中存储有程序代码,所述程序代码可被处理器调用执行上述方法实施例中所描述的方法。
计算机可读存储介质300可以是诸如闪存、EEPROM(电可擦除可编程只读存储器)、EPROM、硬盘或者ROM之类的电子存储器。可选地,计算机可读存储介质300包括非易失性计算机可读介质(non-transitory computer-readable storage medium)。计算机可读存储介质300具有执行上述方法中的任何方法步骤的程序代码310的存储空间。这些程序代码可以从一个或者多个计算机程序产品中读出或者写入到这一个或者多个计算机程序产品中。程序代码310可以例如以适当形式进行压缩。
综上所述,本申请实施例提供的拍照方法、装置、电子设备以及存储介质,在电子设备处于拍照模式的过程中,接收语音指令并获取语音指令对应的处理意图,从语音指令中获取与处理意图对应的图像优化方式,基于图像优化方式调整电子设备的拍照参数,显示与拍照参数对应的预览图像,从而通过在电子设备处于拍照模式的过程中,对接收到的语音指令进行意图分析,并获取与意图对应的图像优化方式对拍照参数进行调整,以在拍照场景中简化用户操作,提升用户的拍照体验。
最后应说明的是:以上实施例仅用以说明本申请的技术方案,而非对其限制;尽管参照前述实施例对本申请进行了详细的说明,本领域的普通技术人员当理解:其依然可以对前述各实施例所记载的技术方案进行修改,或者对其中部分技术特征进行等同替换;而这些修改或者替换,并不驱使相应技术方案的本质脱离本申请各实施例技术方案的精神和范围。

Claims (10)

1.一种拍照方法,其特征在于,应用于电子设备,所述方法包括:
在所述电子设备处于拍照模式的过程中,接收语音指令并获取所述语音指令对应的处理意图;
从所述语音指令中获取与所述处理意图对应的图像优化方式;
基于所述图像优化方式调整所述电子设备的拍照参数;
显示与所述拍照参数对应的预览图像。
2.根据权利要求1所述的方法,其特征在于,所述在所述电子设备处于拍照模式的过程中,接收语音指令并获取所述语音指令对应的处理意图,包括:
在所述电子设备处于拍照模式的过程中,启动全双工模式;
在所述全双工模式下,持续接收多个语音指令并分别获取所述多个语音指令中的每个语音指令对应的处理意图。
3.根据权利要求1所述的方法,其特征在于,所述从所述语音指令中获取与所述处理意图对应的图像优化方式,包括:
对所述处理意图进行识别;
当识别到所述处理意图与拍照相关时,从所述语音指令中获取与所述处理意图对应图像优化方式。
4.根据权利要求3所述的方法,其特征在于,所述方法还包括:
当识别到所述处理意图与拍照不相关时,不响应所述语音指令。
5.根据权利要求3所述的方法,其特征在于,所述方法还包括:
当识别到所述处理意图与拍照不相关时,退出所述拍照模式。
6.根据权利要求5所述的方法,其特征在于,所述当识别到所述处理意图与拍照不相关时,退出所述拍照模式,包括:
当识别到所述处理意图与拍照不相关时,获取所述处理意图对应的应用程序;
退出所述拍照模式,并调用所述处理意图对应的应用程序。
7.根据权利要求1-6任一项所述的方法,其特征在于,所述在所述电子设备处于拍照模式的过程中,接收语音指令并获取所述语音指令对应的处理意图,包括:
在所述电子设备处于拍照模式的过程中,接收所述语音指令;
对所述语音指令进行实体识别,获取所述语音指令中的实体;
对所述实体与知识图谱进行实体链接,获得与所述实体对应的实体内容;
基于所述实体内容对所述语音指令进行意图分析,获取所述语音指令对应的处理意图。
8.一种拍照装置,其特征在于,应用于电子设备,所述装置包括:
处理意图获取模块,用于在所述电子设备处于拍照模式的过程中,接收语音指令并获取所述语音指令对应的处理意图;
图像优化方式获取模块,用于,用于从所述语音指令中获取与所述处理意图对应的图像优化方式;
拍照参数调整模块,用于基于所述图像优化方式调整所述电子设备的拍照参数;
预览图像显示模块,用于显示与所述拍照参数对应的预览图像。
9.一种电子设备,其特征在于,包括存储器和处理器,所述存储器耦接到所述处理器,所述存储器存储指令,当所述指令由所述处理器执行时所述处理器执行如权利要求1-7任一项所述的方法。
10.一种计算机可读取存储介质,其特征在于,所述计算机可读取存储介质中存储有程序代码,所述程序代码可被处理器调用执行如权利要求1-7任一项所述的方法。
CN202010378771.XA 2020-05-07 2020-05-07 拍照方法、装置、电子设备以及存储介质 Pending CN111565281A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202010378771.XA CN111565281A (zh) 2020-05-07 2020-05-07 拍照方法、装置、电子设备以及存储介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202010378771.XA CN111565281A (zh) 2020-05-07 2020-05-07 拍照方法、装置、电子设备以及存储介质

Publications (1)

Publication Number Publication Date
CN111565281A true CN111565281A (zh) 2020-08-21

Family

ID=72073233

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202010378771.XA Pending CN111565281A (zh) 2020-05-07 2020-05-07 拍照方法、装置、电子设备以及存储介质

Country Status (1)

Country Link
CN (1) CN111565281A (zh)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113542611A (zh) * 2021-07-30 2021-10-22 西安中诺通讯有限公司 一种基于语音控制启动拍照的方法
CN114173061A (zh) * 2021-12-13 2022-03-11 深圳万兴软件有限公司 一种多模态摄像控制方法、装置、计算机设备及存储介质

Citations (14)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20090322915A1 (en) * 2008-06-27 2009-12-31 Microsoft Corporation Speaker and Person Backlighting For Improved AEC and AGC
CN103702028A (zh) * 2013-12-19 2014-04-02 小米科技有限责任公司 一种控制拍摄的方法、装置及终端设备
CN104092932A (zh) * 2013-12-03 2014-10-08 腾讯科技(深圳)有限公司 一种声控拍摄方法及装置
CN104270569A (zh) * 2014-10-16 2015-01-07 成都思迈科技发展有限责任公司 一种声控拍照***
CN104615358A (zh) * 2015-02-06 2015-05-13 掌赢信息科技(上海)有限公司 一种应用程序启动方法和电子设备
CN106231197A (zh) * 2016-08-16 2016-12-14 北京金山安全软件有限公司 一种视频拍摄控制方法、装置及电子设备
CN106231196A (zh) * 2016-08-16 2016-12-14 北京金山安全软件有限公司 一种视频拍摄控制方法、装置及电子设备
CN106303253A (zh) * 2016-08-28 2017-01-04 广安奥海通讯电子科技有限公司 一种语音控制拍照的拍照方法
CN108428451A (zh) * 2018-03-12 2018-08-21 联想(北京)有限公司 语音控制方法、电子设备和语音控制***
CN109302528A (zh) * 2018-08-21 2019-02-01 努比亚技术有限公司 一种拍照方法、移动终端及计算机可读存储介质
CN109859752A (zh) * 2019-01-02 2019-06-07 珠海格力电器股份有限公司 一种语音控制方法、装置、存储介质及语音联控***
US20190290121A1 (en) * 2018-03-22 2019-09-26 Norlase Aps Body mounted Laser Indirect Ophthalmoscope (LIO) system
CN110602391A (zh) * 2019-08-30 2019-12-20 Oppo广东移动通信有限公司 拍照控制方法、装置、存储介质及电子设备
CN110659366A (zh) * 2019-09-24 2020-01-07 Oppo广东移动通信有限公司 语义解析方法、装置、电子设备以及存储介质

Patent Citations (14)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20090322915A1 (en) * 2008-06-27 2009-12-31 Microsoft Corporation Speaker and Person Backlighting For Improved AEC and AGC
CN104092932A (zh) * 2013-12-03 2014-10-08 腾讯科技(深圳)有限公司 一种声控拍摄方法及装置
CN103702028A (zh) * 2013-12-19 2014-04-02 小米科技有限责任公司 一种控制拍摄的方法、装置及终端设备
CN104270569A (zh) * 2014-10-16 2015-01-07 成都思迈科技发展有限责任公司 一种声控拍照***
CN104615358A (zh) * 2015-02-06 2015-05-13 掌赢信息科技(上海)有限公司 一种应用程序启动方法和电子设备
CN106231196A (zh) * 2016-08-16 2016-12-14 北京金山安全软件有限公司 一种视频拍摄控制方法、装置及电子设备
CN106231197A (zh) * 2016-08-16 2016-12-14 北京金山安全软件有限公司 一种视频拍摄控制方法、装置及电子设备
CN106303253A (zh) * 2016-08-28 2017-01-04 广安奥海通讯电子科技有限公司 一种语音控制拍照的拍照方法
CN108428451A (zh) * 2018-03-12 2018-08-21 联想(北京)有限公司 语音控制方法、电子设备和语音控制***
US20190290121A1 (en) * 2018-03-22 2019-09-26 Norlase Aps Body mounted Laser Indirect Ophthalmoscope (LIO) system
CN109302528A (zh) * 2018-08-21 2019-02-01 努比亚技术有限公司 一种拍照方法、移动终端及计算机可读存储介质
CN109859752A (zh) * 2019-01-02 2019-06-07 珠海格力电器股份有限公司 一种语音控制方法、装置、存储介质及语音联控***
CN110602391A (zh) * 2019-08-30 2019-12-20 Oppo广东移动通信有限公司 拍照控制方法、装置、存储介质及电子设备
CN110659366A (zh) * 2019-09-24 2020-01-07 Oppo广东移动通信有限公司 语义解析方法、装置、电子设备以及存储介质

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113542611A (zh) * 2021-07-30 2021-10-22 西安中诺通讯有限公司 一种基于语音控制启动拍照的方法
CN114173061A (zh) * 2021-12-13 2022-03-11 深圳万兴软件有限公司 一种多模态摄像控制方法、装置、计算机设备及存储介质
CN114173061B (zh) * 2021-12-13 2023-09-29 深圳万兴软件有限公司 一种多模态摄像控制方法、装置、计算机设备及存储介质

Similar Documents

Publication Publication Date Title
CN111858522B (zh) 文件分享方法、装置、终端及存储介质
CN111782102B (zh) 窗口的显示方法及相关装置
CN112363842B (zh) 图形处理器的频率调整方法、装置、电子设备及存储介质
CN111368893A (zh) 图像识别方法、装置、电子设备及存储介质
CN111491102B (zh) 拍照场景的检测方法、***、移动终端及存储介质
US20100180202A1 (en) User Interfaces for Electronic Devices
CN108924420A (zh) 图像拍摄方法、装置、介质、电子设备及模型训练方法
CN111818263B (zh) 拍摄参数的处理方法、装置、移动终端及存储介质
CN111899150A (zh) 数据处理方法、装置、电子设备及存储介质
CN111752460B (zh) 屏幕控制方法、装置、电子设备及计算机可读取存储介质
CN111565281A (zh) 拍照方法、装置、电子设备以及存储介质
CN109963072B (zh) 对焦方法、装置、存储介质及电子设备
CN111881862B (zh) 手势识别方法及相关装置
CN112035042A (zh) 应用程序控制方法、装置、电子设备及可读存储介质
CN111554278A (zh) 视频录制方法、装置、电子设备以及存储介质
CN112099702A (zh) 应用运行方法、装置和电子设备
CN115562771B (zh) 应用窗口管理方法、电子设备和计算机可读取存储介质
CN114205447B (zh) 电子设备的快捷设置方法、装置、存储介质及电子设备
CN116229188B (zh) 图像处理显示方法、分类模型的生成方法及其设备
CN115412634B (zh) 消息显示方法和装置
CN112000766A (zh) 一种数据处理方法、装置和介质
CN111880714B (zh) 页面控制方法及相关装置
CN115237323A (zh) 界面显示方法、装置、电子设备及存储介质
CN108647097B (zh) 文本图像处理方法、装置、存储介质及终端
CN115079810A (zh) 信息处理方法与装置、主控设备和受控设备

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
RJ01 Rejection of invention patent application after publication

Application publication date: 20200821

RJ01 Rejection of invention patent application after publication