CN112102821B - 应用于电子设备的数据处理方法、装置、***、介质 - Google Patents
应用于电子设备的数据处理方法、装置、***、介质 Download PDFInfo
- Publication number
- CN112102821B CN112102821B CN201910530553.0A CN201910530553A CN112102821B CN 112102821 B CN112102821 B CN 112102821B CN 201910530553 A CN201910530553 A CN 201910530553A CN 112102821 B CN112102821 B CN 112102821B
- Authority
- CN
- China
- Prior art keywords
- voice data
- historical
- current
- score
- target voice
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 238000003672 processing method Methods 0.000 title claims abstract description 22
- 238000012545 processing Methods 0.000 claims abstract description 50
- 238000000034 method Methods 0.000 claims description 32
- 230000004044 response Effects 0.000 claims description 24
- 230000003247 decreasing effect Effects 0.000 claims description 10
- 230000002618 waking effect Effects 0.000 claims description 7
- 238000004364 calculation method Methods 0.000 claims description 6
- 238000010586 diagram Methods 0.000 description 14
- 238000004590 computer program Methods 0.000 description 11
- 230000003993 interaction Effects 0.000 description 9
- 230000015654 memory Effects 0.000 description 9
- 238000004891 communication Methods 0.000 description 7
- 230000000694 effects Effects 0.000 description 7
- 230000006870 function Effects 0.000 description 6
- 230000008569 process Effects 0.000 description 6
- 238000005516 engineering process Methods 0.000 description 2
- 238000009472 formulation Methods 0.000 description 2
- 230000014509 gene expression Effects 0.000 description 2
- 239000000203 mixture Substances 0.000 description 2
- 238000012986 modification Methods 0.000 description 2
- 230000004048 modification Effects 0.000 description 2
- 230000003287 optical effect Effects 0.000 description 2
- 239000000758 substrate Substances 0.000 description 2
- 238000012935 Averaging Methods 0.000 description 1
- 108010001267 Protein Subunits Proteins 0.000 description 1
- 230000008859 change Effects 0.000 description 1
- 238000011161 development Methods 0.000 description 1
- 239000000835 fiber Substances 0.000 description 1
- 239000004973 liquid crystal related substance Substances 0.000 description 1
- 238000003062 neural network model Methods 0.000 description 1
- 238000004806 packaging method and process Methods 0.000 description 1
- 238000011160 research Methods 0.000 description 1
- 239000004065 semiconductor Substances 0.000 description 1
Classifications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/22—Procedures used during a speech recognition process, e.g. man-machine dialogue
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/06—Creation of reference templates; Training of speech recognition systems, e.g. adaptation to the characteristics of the speaker's voice
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/06—Creation of reference templates; Training of speech recognition systems, e.g. adaptation to the characteristics of the speaker's voice
- G10L15/063—Training
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/06—Creation of reference templates; Training of speech recognition systems, e.g. adaptation to the characteristics of the speaker's voice
- G10L15/063—Training
- G10L2015/0635—Training updating or merging of old and new templates; Mean values; Weighting
- G10L2015/0636—Threshold criteria for the updating
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/06—Creation of reference templates; Training of speech recognition systems, e.g. adaptation to the characteristics of the speaker's voice
- G10L15/063—Training
- G10L2015/0638—Interactive procedures
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/22—Procedures used during a speech recognition process, e.g. man-machine dialogue
- G10L2015/223—Execution procedure of a spoken command
-
- Y—GENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
- Y02—TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
- Y02D—CLIMATE CHANGE MITIGATION TECHNOLOGIES IN INFORMATION AND COMMUNICATION TECHNOLOGIES [ICT], I.E. INFORMATION AND COMMUNICATION TECHNOLOGIES AIMING AT THE REDUCTION OF THEIR OWN ENERGY USE
- Y02D30/00—Reducing energy consumption in communication networks
- Y02D30/70—Reducing energy consumption in communication networks in wireless communication networks
Landscapes
- Engineering & Computer Science (AREA)
- Computational Linguistics (AREA)
- Health & Medical Sciences (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Human Computer Interaction (AREA)
- Physics & Mathematics (AREA)
- Acoustics & Sound (AREA)
- Multimedia (AREA)
- Artificial Intelligence (AREA)
- Telephone Function (AREA)
Abstract
本公开提供一种应用于电子设备的数据处理方法,包括:获取多个第一历史语音数据;确定所述多个第一历史语音数据中的至少一个第一目标语音数据,其中,所述至少一个第一目标语音数据的每个第一目标语音数据的第一分值大于或等于预设阈值;获取当前阈值条件,所述当前阈值条件用于所述电子设备是否响应当前语音数据进行操作的条件;以及基于所述至少一个第一目标语音数据的数量,调整所述当前阈值条件。本公开还提供一种应用于电子设备的数据处理装置、一种数据处理***以及一种计算机可读存储介质。
Description
技术领域
本公开涉及计算机技术领域,更具体地,涉及一种应用于电子设备的数据处理方法、一种应用于电子设备的数据处理装置、一种数据处理***、以及一种计算机可读存储介质。
背景技术
随着计算机技术发展,电子设备趋向智能化,各种各样的智能设备广泛应用于诸多领域,例如智能家居、智能车辆等得到广泛应用。语音是人类的最常使用的交互方式,所以通过语音唤醒智能设备的技术成为研究热点。相关技术中的电子设备在接收到唤醒语音时,通常需要判断唤醒语音是否满足唤醒条件,在满足唤醒条件的情况下,电子设备才能响应唤醒语音进行相关操作。
在实现本公开构思的过程中,发明人发现相关技术中至少存在如下问题,相关技术中电子设备用于确定是否响应唤醒语音的唤醒条件通常是固定不变的,导致唤醒效果差、误唤醒率大。
发明内容
有鉴于此,本公开提供了一种优化的应用于电子设备的数据处理方法和装置、***、介质。
本公开的一个方面提供了一种应用于电子设备的数据处理方法,包括:获取多个第一历史语音数据,确定所述多个第一历史语音数据中的至少一个第一目标语音数据,其中,所述至少一个第一目标语音数据的每个第一目标语音数据的第一分值大于或等于预设阈值,获取当前阈值条件,所述当前阈值条件用于所述电子设备是否响应当前语音数据进行操作的条件,基于所述至少一个第一目标语音数据的数量,调整所述当前阈值条件。
根据本公开实施例,上述方法还包括:获取多个第二历史语音数据,确定所述多个第二历史语音数据中的至少一个第二目标语音数据的数量,所述至少一个第二目标语音数据的每个第二目标语音数据的第二分值大于或等于所述预设阈值。
根据本公开实施例,上述至少一个第一目标语音数据的数量为第一数量,所述至少一个第二目标语音数据的数量为第二数量。所述基于所述至少一个第一目标语音数据的数量,调整所述当前阈值条件,包括:比较所述第一数量与所述第二数量以得到比较结果,根据所述比较结果调整所述当前阈值条件,其中,所述当前阈值条件包括第一阈值,所述调整所述当前阈值条件包括增大所述第一阈值或减小所述第一阈值。
根据本公开实施例,上述方法还包括:获取所述当前语音数据以及多个第三历史语音数据,其中,所述多个第三历史语音数据的数量为第三数量,根据所述第三历史语音数据处理所述当前语音数据以得到所述当前语音数据的第三分值,响应于所述当前语音数据的第三分值满足所述当前阈值条件,确定所述电子设备响应所述当前语音数据进行操作。
根据本公开实施例,上述方法还包括:根据所述比较结果调整所述第三数量。其中,所述根据所述比较结果调整所述第三数量,包括以下至少一项:响应于所述比较结果表征第一数量大于第二数量,增大所述第三数量,响应于所述比较结果表征第一数量小于第二数量,减小所述第三数量。
根据本公开实施例,上述第一分值包括根据所述多个第一历史语音数据中的至少一个历史语音数据处理所述至少一个第一目标语音数据得到的分值。
本公开的另一个方面提供了应用于电子设备的数据处理装置,包括:第一获取模块、第一确定模块、第二获取模块以及第一调整模块。其中,第一获取模块获取多个第一历史语音数据,第一确定模块确定所述多个第一历史语音数据中的至少一个第一目标语音数据,其中,所述至少一个第一目标语音数据的每个第一目标语音数据的第一分值大于或等于预设阈值,第二获取模块获取当前阈值条件,所述当前阈值条件用于所述电子设备响应当前语音数据进行操作的条件,第一调整模块基于所述至少一个第一目标语音数据的数量,调整所述当前阈值条件。
根据本公开实施例,上述装置,还包括:第三获取模块以及第二确定模块。其中,第三获取模块获取多个第二历史语音数据,第二确定模块确定所述多个第二历史语音数据中的至少一个第二目标语音数据的数量,所述至少一个第二目标语音数据的每个第二目标语音数据的第二分值大于或等于所述预设阈值。
根据本公开实施例,上述至少一个第一目标语音数据的数量为第一数量。所述至少一个第二目标语音数据的数量为第二数量。所述基于所述至少一个第一目标语音数据的数量,调整所述当前阈值条件,包括:比较所述第一数量与所述第二数量以得到比较结果,根据所述比较结果调整所述当前阈值条件,其中,所述当前阈值条件包括第一阈值,所述调整所述当前阈值条件包括增大所述第一阈值或减小所述第一阈值。
根据本公开实施例,上述装置还包括:第四获取模块、处理模块以及第三确定模块。其中,第四获取模块,获取所述当前语音数据以及多个第三历史语音数据,其中,所述多个第三历史语音数据的数量为第三数量,处理模块根据所述第三历史语音数据处理所述当前语音数据以得到所述当前语音数据的第三分值,第三确定模块响应于所述当前语音数据的第三分值满足所述当前阈值条件,确定所述电子设备响应所述当前语音数据进行操作。
根据本公开实施例,上述装置还包括:第二调整模块,根据所述比较结果调整所述第三数量。其中,所述根据所述比较结果调整所述第三数量,包括以下至少一项:响应于所述比较结果表征第一数量大于第二数量,增大所述第三数量,以及响应于所述比较结果表征第一数量小于第二数量,减小所述第三数量。
根据本公开实施例,上述第一分值包括根据所述多个第一历史语音数据中的至少一个历史语音数据处理所述至少一个第一目标语音数据得到的分值。
本公开的另一方面提供了一种数据处理***,包括:一个或多个处理器。存储装置用于存储一个或多个程序,其中,当所述一个或多个程序被所述一个或多个处理器执行时,使得所述一个或多个处理器执行如上所述的方法。
本公开的另一方面提供了一种计算机可读存储介质,存储有计算机可执行指令,所述指令在被执行时用于实现如上所述的方法。
本公开的另一方面提供了一种计算机程序,所述计算机程序包括计算机可执行指令,所述指令在被执行时用于实现如上所述的方法。
根据本公开的实施例,可以至少部分地解决相关技术中电子设备用于确定是否响应唤醒语音的唤醒条件通常是固定不变的,导致唤醒效果差、误唤醒率大的问题,并因此可以实现实时调整唤醒条件,以提高唤醒效果,降低误唤醒率的技术效果。
附图说明
通过以下参照附图对本公开实施例的描述,本公开的上述以及其他目的、特征和优点将更为清楚,在附图中:
图1示意性示出了根据本公开实施例的应用于电子设备的数据处理方法和数据处理装置的***架构;
图2A-2B示意性示出了根据本公开实施例的应用于电子设备的数据处理方法的应用场景;
图3示意性示出了根据本公开第一实施例的应用于电子设备的数据处理方法的流程图;
图4示意性示出了根据本公开第二实施例的应用于电子设备的数据处理方法的流程图;
图5示意性示出了根据本公开第三实施例的应用于电子设备的数据处理方法的流程图;
图6示意性示出了根据本公开第四实施例的应用于电子设备的数据处理方法的流程图;
图7示意性示出了根据本公开第一实施例的应用于电子设备的数据处理装置的框图;
图8示意性示出了根据本公开第二实施例的应用于电子设备的数据处理装置的框图;
图9示意性示出了根据本公开第三实施例的应用于电子设备的数据处理装置的框图;
图10示意性示出了根据本公开第四实施例的应用于电子设备的数据处理装置的框图;以及
图11示意性示出了根据本公开实施例的适于数据处理的计算机***的方框图。
具体实施方式
以下,将参照附图来描述本公开的实施例。但是应该理解,这些描述只是示例性的,而并非要限制本公开的范围。在下面的详细描述中,为便于解释,阐述了许多具体的细节以提供对本公开实施例的全面理解。然而,明显地,一个或多个实施例在没有这些具体细节的情况下也可以被实施。此外,在以下说明中,省略了对公知结构和技术的描述,以避免不必要地混淆本公开的概念。
在此使用的术语仅仅是为了描述具体实施例,而并非意在限制本公开。在此使用的术语“包括”、“包含”等表明了所述特征、步骤、操作和/或部件的存在,但是并不排除存在或添加一个或多个其他特征、步骤、操作或部件。
在此使用的所有术语(包括技术和科学术语)具有本领域技术人员通常所理解的含义,除非另外定义。应注意,这里使用的术语应解释为具有与本说明书的上下文相一致的含义,而不应以理想化或过于刻板的方式来解释。
在使用类似于“A、B和C等中至少一个”这样的表述的情况下,一般来说应该按照本领域技术人员通常理解该表述的含义来予以解释(例如,“具有A、B和C中至少一个的***”应包括但不限于单独具有A、单独具有B、单独具有C、具有A和B、具有A和C、具有B和C、和/或具有A、B、C的***等)。在使用类似于“A、B或C等中至少一个”这样的表述的情况下,一般来说应该按照本领域技术人员通常理解该表述的含义来予以解释(例如,“具有A、B或C中至少一个的***”应包括但不限于单独具有A、单独具有B、单独具有C、具有A和B、具有A和C、具有B和C、和/或具有A、B、C的***等)。
本公开的实施例提供了一种应用于电子设备的数据处理方法,包括:获取多个第一历史语音数据,确定多个第一历史语音数据中的至少一个第一目标语音数据,其中,至少一个第一目标语音数据的每个第一目标语音数据的第一分值大于或等于预设阈值,获取当前阈值条件,当前阈值条件用于电子设备是否响应当前语音数据进行操作的条件,基于至少一个第一目标语音数据的数量,调整当前阈值条件。
图1示意性示出了根据本公开实施例的应用于电子设备的数据处理方法和数据处理装置的***架构。需要注意的是,图1所示仅为可以应用本公开实施例的***架构的示例,以帮助本领域技术人员理解本公开的技术内容,但并不意味着本公开实施例不可以用于其他设备、***、环境或场景。
如图1所示,根据该实施例的***架构100可以包括终端设备101、102、103,网络104和服务器105。网络104用以在终端设备101、102、103和服务器105之间提供通信链路的介质。网络104可以包括各种连接类型,例如有线、无线通信链路或者光纤电缆等等。
用户可以使用终端设备101、102、103通过网络104与服务器105交互,以接收或发送消息等。终端设备101、102、103上可以安装有各种通讯客户端应用,例如购物类应用、网页浏览器应用、搜索类应用、即时通信工具、邮箱客户端、社交平台软件等(仅为示例)。
终端设备101、102、103可以是具有显示屏并且支持网页浏览的各种电子设备,包括但不限于智能手机、平板电脑、膝上型便携计算机和台式计算机等等。
服务器105可以是提供各种服务的服务器,例如对用户利用终端设备101、102、103所浏览的网站提供支持的后台管理服务器(仅为示例)。后台管理服务器可以对接收到的用户请求等数据进行分析等处理,并将处理结果(例如根据用户请求获取或生成的网页、信息、或数据等)反馈给终端设备。
需要说明的是,本公开实施例所提供的数据处理方法一般可以由服务器105执行。相应地,本公开实施例所提供的数据处理装置一般可以设置于服务器105中。本公开实施例所提供的数据处理方法也可以由不同于服务器105且能够与终端设备101、102、103和/或服务器105通信的服务器或服务器集群执行。相应地,本公开实施例所提供的数据处理装置也可以设置于不同于服务器105且能够与终端设备101、102、103和/或服务器105通信的服务器或服务器集群中。
例如,本公开实施例所获取的多个第一历史语音数据和当前阈值条件可以存储在终端设备101、102、103中,通过终端设备101、102、103将多个第一历史语音数据和当前阈值条件发送至服务器105中,服务器105可以确定多个第一历史语音数据中的至少一个第一目标语音数据,以及基于至少一个第一目标语音数据的数量,调整当前阈值条件。或者,终端设备101、102、103也可以直接多个第一历史语音数据和当前阈值条件,并确定多个第一历史语音数据中的至少一个第一目标语音数据,以及基于至少一个第一目标语音数据的数量,调整当前阈值条件。另外,获取的多个第一历史语音数据和当前阈值条件还可以直接存储在服务器105中,由服务器105直接确定多个第一历史语音数据中的至少一个第一目标语音数据,以及基于至少一个第一目标语音数据的数量,调整当前阈值条件。
应该理解,图1中的终端设备、网络和服务器的数目仅仅是示意性的。根据实现需要,可以具有任意数目的终端设备、网络和服务器。
图2A-2B示意性示出了根据本公开实施例的应用于电子设备的数据处理方法的应用场景。
如图2A所示,该应用场景200例如包括智能设备210和用户220。
其中,智能设备210例如可以是智能音箱、智能手机等等。用户220可以通过语音唤醒智能设备210。
其中,智能设备210例如在接收到语音数据时,通常需要判断语音数据是否满足唤醒条件,如果满足,则智能设备210响应语音数据进行相关操作。如果不满足,则智能设备210不响应该语音数据。
其中,当用户220在一段时间内唤醒智能设备210的次数较多时,表明用户220与智能设备210交互频繁,此时可以动态降低唤醒条件,以便用户220更容易唤醒智能设备210。例如,如果当前唤醒条件为语音数据与唤醒词的相似度为80%则唤醒,则可以降低唤醒条件为语音数据与唤醒词的相似度为70%则唤醒。
如图2B所示,该应用场景200例如包括智能设备210。
其中,当智能设备210长时间没有接收到满足唤醒条件的语音数据时,表明用户与智能设备210的交互次数较少。在此情况下,智能设备210接收到的语音数据为噪音的可能性较大,此时可以动态提高唤醒条件,防止噪音唤醒智能设备210造成误唤醒。例如,如果当前唤醒条件为语音数据与唤醒词的相似度为80%则唤醒,则可以提高唤醒条件为语音数据与唤醒词的相似度为90%则唤醒。
本公开实施例可以动态调整唤醒条件,以提高用户唤醒智能设备210的唤醒率,并且降低误唤醒率。
图3示意性示出了根据本公开第一实施例的应用于电子设备的数据处理方法的流程图。
如图3所示,该方法包括操作S310~S340。
在操作S310,获取多个第一历史语音数据。
根据本公开实施例,电子设备可以是智能设备,例如可以是智能音箱、智能手机等等。其中,电子设备可以实时采集语音数据,并基于采集的语音数据确定是否唤醒。其中,多个第一历史语音数据例如包括电子设备在当前时间之前所采集的语音数据,该多个第一历史语音数据中例如包括成功唤醒电子设备的语音数据以及未成功唤醒电子设备的语音数据。其中,电子设备在接收到语音数据后,可以通过相应的语音模型判断接收到的语音数据是否能够唤醒电子设备,其中,语音模型可以是神经网络模型。
在操作S320,确定多个第一历史语音数据中的至少一个第一目标语音数据,其中,至少一个第一目标语音数据的每个第一目标语音数据的第一分值大于或等于预设阈值。
其中,第一分值包括根据多个第一历史语音数据中的至少一个历史语音数据(例如至少一个历史语音数据为n1个历史语音数据)处理至少一个第一目标语音数据得到的分值。第一分值例如可以用于作为电子设备响应至少一个第一目标语音的依据。
例如,以一个第一历史语音数据A为例。将第一历史语音数据A输入语音模型中进行分类,语音模型的输出结果例如为第一历史语音数据A属于第一类别的得分以及属于第二类别的得分。第一类别例如为唤醒词类别,第二类别例如为不是唤醒词类别。在第一历史语音数据A属于第一类别的得分高于属于第二类别的得分时,初步判定第一历史语音数据属于第一类别,即第一历史语音数据A属于唤醒词类别。
为了计算第一历史语音数据A的第一分值,可以获取第一历史语音数据A之前的n1个历史语音数据(该n1个历史语音数据可以是多个第一历史语音数据中的一部分)。并将n1个历史语音数据分别输入语音模型得到n1个历史语音数据属于第一类别的n1个得分,并对第一历史语音数据A属于第一类别的得分以及n1个得分进行加权平均计算得到第一历史语音数据A的第一分值。与计算第一历史语音数据A的第一分值类似,可以计算得到多个第一历史语音数据中每个第一历史语音数据的第一分值。并且,本公开实施例通过加权平均计算可以适当减小第一历史语音数据受到噪音的干扰,确保第一分值较为准确地反映第一历史语音数据与唤醒词的相似程度。
根据本公开实施例,预设阈值例如可以是具体的数值。其中,在计算得到每个第一历史语音数据的第一分值后,将第一分值大于或等于预设阈值的第一历史语音数据作为第一目标语音数据。
在操作S330,获取当前阈值条件,当前阈值条件用于电子设备是否响应当前语音数据进行操作的条件。例如,在实时采集的当前语音数据满足当前阈值条件时,该当前语音数据能够唤醒设备。
在操作S340,基于至少一个第一目标语音数据的数量,调整当前阈值条件。
其中,至少一个第一目标语音数据的数量能够表征用户唤醒电子设备的频繁程度。例如,至少一个第一目标语音数据的数量越大,则表示用户唤醒电子设备的频率越高,数量越小则表示用户与电子设备进行的语音交互频率越低。因此,本公开实施例可以根据至少一个第一目标语音数据的数量来调整当前阈值条件,即,可以在至少一个第一目标语音数据的数量越大时,降低当前阈值条件,以便用户更容易唤醒电子设备。在数量越小时,可以提高当前阈值条件,以便在用户长时间不与电子设备进行语音交互时,避免噪音造成不必要的误唤醒。
图4示意性示出了根据本公开第二实施例的应用于电子设备的数据处理方法的流程图。
如图4所示,该方法包括操作S310~S340以及S410~S420。其中,操作S310~S340如上参考图3描述的操作相同或类似,在此不再赘述。
在操作S410,获取多个第二历史语音数据。
根据本公开实施例,多个第一历史语音数据例如可以是预设时间段内所采集的语音数据。例如当前时间为10:00,则多个第一历史语音数据可以是从9:00~10:00所采集的语音数据。
类似地,多个第二历史语音数据例如也可以是预设时间段内所采集的语音数据。例如当前时间为10:00,多个第二历史语音数据可以是从8:00~9:00所采集的语音数据。多个第二历史语音数据的采集时间例如在多个第一历史语音数据的采集时间之前。
在操作S420,确定多个第二历史语音数据中的至少一个第二目标语音数据的数量,至少一个第二目标语音数据的每个第二目标语音数据的第二分值大于或等于预设阈值。
根据本公开实施例,上述已经描述如何获取每个第一历史语音数据的第一分值的方式。基于相同或类似的方式,可以获取每个第二历史语音数据的第二分值,并将第二分值大于或等于预设阈值的第二历史语音数据作为至少一个第二目标语音数据。
在本公开实施例中,至少一个第一目标语音数据的数量为第一数量,至少一个第二目标语音数据的数量为第二数量。
其中,当第一数量大于第二数量时,表示过去一段时间内(例如9:00~10:00)第一分值大于或等于预设阈值的第一目标语音数据的数量比之前增多了,表示用户唤醒电子设备的次数增大。当第一数量小于第二数量时,表示用户与电子设备进行的语音交互频率降低。
根据本公开实施例,基于至少一个第一目标语音数据的数量,调整当前阈值条件,包括:比较第一数量与第二数量以得到比较结果,根据比较结果调整当前阈值条件。其中,当前阈值条件包括第一阈值,调整当前阈值条件包括增大第一阈值或减小第一阈值。
例如,当前阈值条件包括第一阈值v,当第一数量大于第二数量时,表示用户唤醒电子设备的频率较高,此时可以减小第一阈值v,以便用户更容易唤醒电子设备。当第一数量小于第二数量时,表示用户与电子设备进行的语音交互频率降低,此时可以增大第一阈值v,以便在用户长时间不与电子设备进行语音交互时,避免噪音造成不必要的误唤醒。
其中,例如可以在预设范围内调整第一阈值v的取值。预设范围可以是[m,M],其中,m表示第一阈值v可取的最小值,M表示第一阈值v可取的最大值。因此,本公开实施例可以根据第一数量和第二数量的比较结果在预设范围[m,M]内调整第一阈值v的取值。
例如,第一阈值v的初始值可以是M,本公开实施例可以通过增加一个变动率r(0<r<1)来调整第一阈值v。具体地,当第一数量大于第二数量时,通过v=v*r来减小第一阈值v。当第一数量小于第二数量时,通过v=v/r来增大第一阈值v。当第一数量等于第二数量时,可以不调整第一阈值v。
其中,上述所涉及到的预设阈值可以是此处的最小值m。
本公开实施例通过第一数量和第二数量的比较结果确定用户与电子设备进行语言交互的频繁程度,并根据频繁程度动态调整当前阈值条件(第一阈值),实现了在用户与电子设备的交互频率较高或较低时,电子设备都能有稳定良好的唤醒率和很低的误唤醒。因此,通过本公开实施例的技术方案能提高唤醒效果,尽可能避免误唤醒。
图5示意性示出了根据本公开第三实施例的应用于电子设备的数据处理方法的流程图。
如图5所示,该方法包括操作S310~S340、S410~S420以及S510~S530。其中,操作S310~S340如上参考图3描述的操作相同或类似,操作S410~S420如上参考图4描述的操作相同或类似,在此不再赘述。
根据本公开实施例,在实际使用过程中,电子设备通过实时采集当前语音数据,并判断当前语音数据对应的第三分值是否满足当前阈值条件来确定是否响应当前语音数据进行操作。例如,可以通过将当前语音数据输入语音模型中得到第三分值,当前语音数据可以是对初始语音进行处理后得到的MFCC(Mel Frequency Cepstral Coefficents,梅尔频率倒谱系数)特征数据。
在操作S510,获取当前语音数据以及多个第三历史语音数据,其中,多个第三历史语音数据的数量为第三数量。
在操作S520,根据第三历史语音数据处理当前语音数据以得到当前语音数据的第三分值。
例如,当前时间为11:00,当前语音数据为在当前时间所获取的语音数据,将当前语音数据输入语音模型可初步得到当前语音数据属于第一类别的得分。为了计算当前语音数据的第三分值,可以在当前时间之前获取n2个第三历史语音数据(n2个第三历史语音数据为在11:00之前的数据),此时第三数量为n2。将n2个第三历史语音数据分别输入语音模型得到n2个第三历史语音数据属于第一类别的n2个得分,并对当前语音数据属于第一类别的得分和n2个得分进行加权平均计算得到第三分值(其中,第三分值的计算方式与第一分值或第二分值的计算方式相同或类似)。
在操作S530,响应于当前语音数据的第三分值满足当前阈值条件,确定电子设备响应当前语音数据进行操作。
例如,当第三分值大于第一阈值时,电子设备可以响应当前语音数据进行相关操作。
根据本公开实施例,由于当前语音数据的第三分值是基于n2个第三历史语音数据属于第一类别的n2个得分进行加权平均计算得到的,因此,第三数量n2的大小直接影响第三分值的准确程度,基于此,本公开实施例可以通过动态调整第三数量n2的大小来提高第三分值的准确程度,以提高唤醒效果。
参见以下图6,图6的实施例用于对动态调整第三数量n2的过程进行描述。
图6示意性示出了根据本公开第四实施例的应用于电子设备的数据处理方法的流程图。
如图6所示,该方法包括操作S310~S340、S410~S420、S510~S530以及S610。其中,操作S310~S340如上参考图3描述的操作相同或类似,操作S410~S420如上参考图4描述的操作相同或类似,操作S510~S530如上参考图4描述的操作相同或类似,在此不再赘述。
在操作S610,根据比较结果调整第三数量。
其中,比较结果例如包括第一数量大于第二数量,或者第一数量小于第二数量。
其中,根据比较结果调整第三数量n2,包括以下至少一项:
(1)响应于比较结果表征第一数量大于第二数量,增大第三数量。
(2)响应于比较结果表征第一数量小于第二数量,减小第三数量。
例如,当第一数量大于第二数量时,由于减小了第一阈值v,导致当前语音数据更加容易唤醒电子设备,此时,可以通过增大第三数量n2来提高经由加权平均计算得到的第三分值的准确程度,以减小当前语音数据受到噪音的干扰,降低误唤醒的可能性。当第一数量小于第二数量时,由于增大了第一阈值v,导致当前语音数据唤醒电子设备的条件提高了(此时误唤醒的可能性降低),此时,可以通过减小第三数量n2来适当降低经由加权平均计算第三分值过程中的计算量。另外,当第一数量等于第二数量时可以不调整第三数量n2。
例如,可以给定一个第三数量n2的取值范围[a,b]。因此,可以根据第一数量和第二数量的比较结果在取值范围[a,b]内调整第三数量n2的取值。
例如,通过增加一个变动步长s来调整第三数量n2。即,当第一数量大于第二数量时,通过n2=n2+s来增大第三数量n2。当第一数量小于第二数量时,通过n2=n2-s来减小第三数量n2。其中,通过调整第三数量n2,便于后续获取语音数据时,可以基于调整后的第三数量n2计算该后续获取的语音数据的第三分值。
本公开实施例可以通过动态调整当前阈值条件和第三数量,使得语音唤醒***(电子设备)在变动的环境中能保持稳定良好的唤醒率和较低的误唤醒。例如,在用户与电子设备的交互频率较高或较低时,电子设备都能有稳定良好的唤醒率和很低的误唤醒。因此,通过本公开实施例的技术方案能提高唤醒效果,尽可能避免误唤醒。
图7示意性示出了根据本公开第一实施例的应用于电子设备的数据处理装置的框图。
如图7所示,应用于电子设备的数据处理装置700包括第一获取模块710、第一确定模块720、第二获取模块730以及第一调整模块740。
第一获取模块710可以用于获取多个第一历史语音数据。根据本公开实施例,第一获取模块710例如可以执行上文参考图3描述的操作S310,在此不再赘述。
第一确定模块720可以用于确定多个第一历史语音数据中的至少一个第一目标语音数据,其中,至少一个第一目标语音数据的每个第一目标语音数据的第一分值大于或等于预设阈值。
根据本公开实施例,第一分值包括根据多个第一历史语音数据中的至少一个历史语音数据处理至少一个第一目标语音数据得到的分值。
根据本公开实施例,第一确定模块720例如可以执行上文参考图3描述的操作S320,在此不再赘述。
第二获取模块730可以用于获取当前阈值条件,当前阈值条件用于电子设备响应当前语音数据进行操作的条件。根据本公开实施例,第二获取模块730例如可以执行上文参考图3描述的操作S330,在此不再赘述。
第一调整模块740可以用于基于至少一个第一目标语音数据的数量,调整当前阈值条件。根据本公开实施例,第一调整模块740例如可以执行上文参考图3描述的操作S340,在此不再赘述。
图8示意性示出了根据本公开第二实施例的应用于电子设备的数据处理装置的框图。
如图8所示,应用于电子设备的数据处理装置800包括第一获取模块710、第一确定模块720、第二获取模块730、第一调整模块740、第三获取模块810以及第二确定模块820。其中,第一获取模块710、第一确定模块720、第二获取模块730以及第一调整模块740与上参考图7描述的模块相同或类似,在此不再赘述。
第三获取模块810可以用于获取多个第二历史语音数据。根据本公开实施例,第三获取模块810例如可以执行上文参考图4描述的操作S410,在此不再赘述。
第二确定模块820可以用于确定多个第二历史语音数据中的至少一个第二目标语音数据的数量,至少一个第二目标语音数据的每个第二目标语音数据的第二分值大于或等于预设阈值。根据本公开实施例,第二确定模块820例如可以执行上文参考图4描述的操作S420,在此不再赘述。
根据本公开实施例,至少一个第一目标语音数据的数量为第一数量,至少一个第二目标语音数据的数量为第二数量。基于至少一个第一目标语音数据的数量,调整当前阈值条件,包括:比较第一数量与第二数量以得到比较结果,根据比较结果调整当前阈值条件,其中,当前阈值条件包括第一阈值,调整当前阈值条件包括增大第一阈值或减小第一阈值。
图9示意性示出了根据本公开第三实施例的应用于电子设备的数据处理装置的框图。
如图9所示,应用于电子设备的数据处理装置900包括第一获取模块710、第一确定模块720、第二获取模块730、第一调整模块740、第三获取模块810、第二确定模块820、第四获取模块910、处理模块920以及第三确定模块930。其中,第一获取模块710、第一确定模块720、第二获取模块730以及第一调整模块740与上参考图7描述的模块相同或类似,第三获取模块810以及第二确定模块820与上参考图8描述的模块相同或类似,在此不再赘述。
第四获取模块910可以用于获取当前语音数据以及多个第三历史语音数据,其中,多个第三历史语音数据的数量为第三数量。根据本公开实施例,第四获取模块910例如可以执行上文参考图5描述的操作S510,在此不再赘述。
处理模块920可以用于根据第三历史语音数据处理当前语音数据以得到当前语音数据的第三分值。根据本公开实施例,处理模块920例如可以执行上文参考图5描述的操作S520,在此不再赘述。
第三确定模块930可以用于响应于当前语音数据的第三分值满足当前阈值条件,确定电子设备响应当前语音数据进行操作。根据本公开实施例,第三确定模块930例如可以执行上文参考图5描述的操作S530,在此不再赘述。
图10示意性示出了根据本公开第四实施例的应用于电子设备的数据处理装置的框图。
如图10所示,应用于电子设备的数据处理装置1000包括第一获取模块710、第一确定模块720、第二获取模块730、第一调整模块740、第三获取模块810、第二确定模块820、第四获取模块910、处理模块920、第三确定模块930以及第二调整模块1010。其中,第一获取模块710、第一确定模块720、第二获取模块730以及第一调整模块740与上参考图7描述的模块相同或类似,第三获取模块810以及第二确定模块820与上参考图8描述的模块相同或类似,第四获取模块910、处理模块920以及第三确定模块930与上参考图9描述的模块相同或类似,在此不再赘述。
第二调整模块1010可以用于根据比较结果调整第三数量。
根据本公开实施例,根据比较结果调整第三数量,包括以下至少一项:响应于比较结果表征第一数量大于第二数量,增大第三数量,响应于比较结果表征第一数量小于第二数量,减小第三数量。
根据本公开实施例,第二调整模块1010例如可以执行上文参考图6描述的操作S610,在此不再赘述。
根据本公开的实施例的模块、子模块、单元、子单元中的任意多个、或其中任意多个的至少部分功能可以在一个模块中实现。根据本公开实施例的模块、子模块、单元、子单元中的任意一个或多个可以被拆分成多个模块来实现。根据本公开实施例的模块、子模块、单元、子单元中的任意一个或多个可以至少被部分地实现为硬件电路,例如现场可编程门阵列(FPGA)、可编程逻辑阵列(PLA)、片上***、基板上的***、封装上的***、专用集成电路(ASIC),或可以通过对电路进行集成或封装的任何其他的合理方式的硬件或固件来实现,或以软件、硬件以及固件三种实现方式中任意一种或以其中任意几种的适当组合来实现。或者,根据本公开实施例的模块、子模块、单元、子单元中的一个或多个可以至少被部分地实现为计算机程序模块,当该计算机程序模块被运行时,可以执行相应的功能。
例如,第一获取模块710、第一确定模块720、第二获取模块730、第一调整模块740、第三获取模块810、第二确定模块820、第四获取模块910、处理模块920、第三确定模块930以及第二调整模块1010中的任意多个可以合并在一个模块中实现,或者其中的任意一个模块可以被拆分成多个模块。或者,这些模块中的一个或多个模块的至少部分功能可以与其他模块的至少部分功能相结合,并在一个模块中实现。根据本公开的实施例,第一获取模块710、第一确定模块720、第二获取模块730、第一调整模块740、第三获取模块810、第二确定模块820、第四获取模块910、处理模块920、第三确定模块930以及第二调整模块1010中的至少一个可以至少被部分地实现为硬件电路,例如现场可编程门阵列(FPGA)、可编程逻辑阵列(PLA)、片上***、基板上的***、封装上的***、专用集成电路(ASIC),或可以通过对电路进行集成或封装的任何其他的合理方式等硬件或固件来实现,或以软件、硬件以及固件三种实现方式中任意一种或以其中任意几种的适当组合来实现。或者,第一获取模块710、第一确定模块720、第二获取模块730、第一调整模块740、第三获取模块810、第二确定模块820、第四获取模块910、处理模块920、第三确定模块930以及第二调整模块1010中的至少一个可以至少被部分地实现为计算机程序模块,当该计算机程序模块被运行时,可以执行相应的功能。
图11示意性示出了根据本公开实施例的适于数据处理的计算机***的方框图。图11示出的计算机***仅仅是一个示例,不应对本公开实施例的功能和使用范围带来任何限制。
如图11所示,根据本公开实施例的计算机***1100包括处理器1101,其可以根据存储在只读存储器(ROM)1102中的程序或者从存储部分1108加载到随机访问存储器(RAM)1103中的程序而执行各种适当的动作和处理。处理器1101例如可以包括通用微处理器(例如CPU)、指令集处理器和/或相关芯片组和/或专用微处理器(例如,专用集成电路(ASIC)),等等。处理器1101还可以包括用于缓存用途的板载存储器。处理器1101可以包括用于执行根据本公开实施例的方法流程的不同动作的单一处理单元或者是多个处理单元。
在RAM 1103中,存储有***1100操作所需的各种程序和数据。处理器1101、ROM1102以及RAM 1103通过总线1104彼此相连。处理器1101通过执行ROM 1102和/或RAM 1103中的程序来执行根据本公开实施例的方法流程的各种操作。需要注意,所述程序也可以存储在除ROM 1102和RAM 1103以外的一个或多个存储器中。处理器1101也可以通过执行存储在所述一个或多个存储器中的程序来执行根据本公开实施例的方法流程的各种操作。
根据本公开的实施例,***1100还可以包括输入/输出(I/O)接口1105,输入/输出(I/O)接口1105也连接至总线1104。***1100还可以包括连接至I/O接口1105的以下部件中的一项或多项:包括键盘、鼠标等的输入部分1106;包括诸如阴极射线管(CRT)、液晶显示器(LCD)等以及扬声器等的输出部分1107;包括硬盘等的存储部分1108;以及包括诸如LAN卡、调制解调器等的网络接口卡的通信部分1109。通信部分1109经由诸如因特网的网络执行通信处理。驱动器1110也根据需要连接至I/O接口1105。可拆卸介质1111,诸如磁盘、光盘、磁光盘、半导体存储器等等,根据需要安装在驱动器1110上,以便于从其上读出的计算机程序根据需要被安装入存储部分1108。
根据本公开的实施例,根据本公开实施例的方法流程可以被实现为计算机软件程序。例如,本公开的实施例包括一种计算机程序产品,其包括承载在计算机可读存储介质上的计算机程序,该计算机程序包含用于执行流程图所示的方法的程序代码。在这样的实施例中,该计算机程序可以通过通信部分1109从网络上被下载和安装,和/或从可拆卸介质1111被安装。在该计算机程序被处理器1101执行时,执行本公开实施例的***中限定的上述功能。根据本公开的实施例,上文描述的***、设备、装置、模块、单元等可以通过计算机程序模块来实现。
本公开还提供了一种计算机可读存储介质,该计算机可读存储介质可以是上述实施例中描述的设备/装置/***中所包含的;也可以是单独存在,而未装配入该设备/装置/***中。上述计算机可读存储介质承载有一个或者多个程序,当上述一个或者多个程序被执行时,实现根据本公开实施例的方法。
根据本公开的实施例,计算机可读存储介质可以是计算机非易失性的计算机可读存储介质,例如可以可以包括但不限于:便携式计算机磁盘、硬盘、随机访问存储器(RAM)、只读存储器(ROM)、可擦式可编程只读存储器(EPROM或闪存)、便携式紧凑磁盘只读存储器(CD-ROM)、光存储器件、磁存储器件、或者上述的任意合适的组合。在本公开中,计算机可读存储介质可以是任何包含或存储程序的有形介质,该程序可以被指令执行***、装置或者器件使用或者与其结合使用。
例如,根据本公开的实施例,计算机可读存储介质可以包括上文描述的ROM 1102和/或RAM 1103和/或ROM 1102和RAM 1103以外的一个或多个存储器。
附图中的流程图和框图,图示了按照本公开各种实施例的***、方法和计算机程序产品的可能实现的体系架构、功能和操作。在这点上,流程图或框图中的每个方框可以代表一个模块、程序段、或代码的一部分,上述模块、程序段、或代码的一部分包含一个或多个用于实现规定的逻辑功能的可执行指令。也应当注意,在有些作为替换的实现中,方框中所标注的功能也可以以不同于附图中所标注的顺序发生。例如,两个接连地表示的方框实际上可以基本并行地执行,它们有时也可以按相反的顺序执行,这依所涉及的功能而定。也要注意的是,框图或流程图中的每个方框、以及框图或流程图中的方框的组合,可以用执行规定的功能或操作的专用的基于硬件的***来实现,或者可以用专用硬件与计算机指令的组合来实现。
本领域技术人员可以理解,本公开的各个实施例和/或权利要求中记载的特征可以进行多种组合和/或结合,即使这样的组合或结合没有明确记载于本公开中。特别地,在不脱离本公开精神和教导的情况下,本公开的各个实施例和/或权利要求中记载的特征可以进行多种组合和/或结合。所有这些组合和/或结合均落入本公开的范围。
以上对本公开的实施例进行了描述。但是,这些实施例仅仅是为了说明的目的,而并非为了限制本公开的范围。尽管在以上分别描述了各实施例,但是这并不意味着各个实施例中的措施不能有利地结合使用。本公开的范围由所附权利要求及其等同物限定。不脱离本公开的范围,本领域技术人员可以做出多种替代和修改,这些替代和修改都应落在本公开的范围之内。
Claims (12)
1.一种应用于电子设备的数据处理方法,包括:
获取多个第一历史语音数据;
确定所述多个第一历史语音数据中的至少一个第一目标语音数据,其中,所述至少一个第一目标语音数据的每个第一目标语音数据的第一分值大于或等于预设阈值;
获取当前阈值条件,所述当前阈值条件用于所述电子设备是否响应当前语音数据进行操作的条件;以及
基于所述至少一个第一目标语音数据的数量,调整所述当前阈值条件,所述至少一个第一目标语音数据的数量用于表征用户唤醒电子设备的频繁程度;
其中,所述第一分值包括根据所述多个第一历史语音数据中的至少一个历史语音数据处理所述至少一个第一目标语音数据得到的分值;
所述确定所述多个第一历史语音数据中的至少一个第一目标语音数据包括:
针对每个第一历史语音数据,
获取所述第一历史语音数据之前的n1个历史语音数据;
将所述n1个历史语音数据分别输入语音模型,得到所述n1个历史语音数据属于第一类别的n1个得分,所述第一类别为唤醒词类别;
对所述第一历史语音数据属于第一类别的得分以及n1个得分进行加权平均计算,得到所述第一历史语音数据的第一分值;
在计算得到每个第一历史语音数据的第一分值后,将第一分值大于或等于预设阈值的第一历史语音数据作为第一目标语音数据。
2.根据权利要求1所述的方法,还包括:
获取多个第二历史语音数据;
确定所述多个第二历史语音数据中的至少一个第二目标语音数据的数量,所述至少一个第二目标语音数据的每个第二目标语音数据的第二分值大于或等于所述预设阈值。
3.根据权利要求2所述的方法,其中,所述至少一个第一目标语音数据的数量为第一数量;所述至少一个第二目标语音数据的数量为第二数量;所述基于所述至少一个第一目标语音数据的数量,调整所述当前阈值条件,包括:
比较所述第一数量与所述第二数量以得到比较结果;以及
根据所述比较结果调整所述当前阈值条件;
其中,所述当前阈值条件包括第一阈值,所述调整所述当前阈值条件包括增大所述第一阈值或减小所述第一阈值。
4.根据权利要求3所述的方法,还包括:
获取所述当前语音数据以及多个第三历史语音数据,其中,所述多个第三历史语音数据的数量为第三数量;
根据所述第三历史语音数据处理所述当前语音数据以得到所述当前语音数据的第三分值;以及
响应于所述当前语音数据的第三分值满足所述当前阈值条件,确定所述电子设备响应所述当前语音数据进行操作。
5.根据权利要求4所述的方法,还包括:根据所述比较结果调整所述第三数量;其中,所述根据所述比较结果调整所述第三数量,包括以下至少一项:
响应于所述比较结果表征第一数量大于第二数量,增大所述第三数量;以及
响应于所述比较结果表征第一数量小于第二数量,减小所述第三数量。
6.一种应用于电子设备的数据处理装置,包括:
第一获取模块,获取多个第一历史语音数据;
第一确定模块,确定所述多个第一历史语音数据中的至少一个第一目标语音数据,其中,所述至少一个第一目标语音数据的每个第一目标语音数据的第一分值大于或等于预设阈值;
第二获取模块,获取当前阈值条件,所述当前阈值条件用于所述电子设备响应当前语音数据进行操作的条件;以及
第一调整模块,基于所述至少一个第一目标语音数据的数量,调整所述当前阈值条件,所述至少一个第一目标语音数据的数量用于表征用户唤醒电子设备的频繁程度;
其中,所述第一分值包括根据所述多个第一历史语音数据中的至少一个历史语音数据处理所述至少一个第一目标语音数据得到的分值;
所述第一确定模块用于:
针对每个第一历史语音数据,
获取所述第一历史语音数据之前的n1个历史语音数据;
将所述n1个历史语音数据分别输入语音模型,得到所述n1个历史语音数据属于第一类别的n1个得分,所述第一类别为唤醒词类别;
对所述第一历史语音数据属于第一类别的得分以及n1个得分进行加权平均计算,得到所述第一历史语音数据的第一分值;
在计算得到每个第一历史语音数据的第一分值后,将第一分值大于或等于预设阈值的第一历史语音数据作为第一目标语音数据。
7.根据权利要求6所述的装置,还包括:
第三获取模块,获取多个第二历史语音数据;
第二确定模块,确定所述多个第二历史语音数据中的至少一个第二目标语音数据的数量,所述至少一个第二目标语音数据的每个第二目标语音数据的第二分值大于或等于所述预设阈值。
8.根据权利要求7所述的装置,其中,所述至少一个第一目标语音数据的数量为第一数量;所述至少一个第二目标语音数据的数量为第二数量;所述基于所述至少一个第一目标语音数据的数量,调整所述当前阈值条件,包括:
比较所述第一数量与所述第二数量以得到比较结果;以及
根据所述比较结果调整所述当前阈值条件;
其中,所述当前阈值条件包括第一阈值,所述调整所述当前阈值条件包括增大所述第一阈值或减小所述第一阈值。
9.根据权利要求8所述的装置,还包括:
第四获取模块,获取所述当前语音数据以及多个第三历史语音数据,其中,所述多个第三历史语音数据的数量为第三数量;
处理模块,根据所述第三历史语音数据处理所述当前语音数据以得到所述当前语音数据的第三分值;以及
第三确定模块,响应于所述当前语音数据的第三分值满足所述当前阈值条件,确定所述电子设备响应所述当前语音数据进行操作。
10.根据权利要求9所述的装置,还包括:第二调整模块,根据所述比较结果调整所述第三数量;其中,所述根据所述比较结果调整所述第三数量,包括以下至少一项:
响应于所述比较结果表征第一数量大于第二数量,增大所述第三数量;以及
响应于所述比较结果表征第一数量小于第二数量,减小所述第三数量。
11.一种数据处理***,包括:
一个或多个处理器;
存储装置,用于存储一个或多个程序,
其中,当所述一个或多个程序被所述一个或多个处理器执行时,使得所述一个或多个处理器执行根据权利要求1~5中任一项所述的方法。
12.一种计算机可读存储介质,其上存储有可执行指令,该指令被处理器执行时使处理器执行根据权利要求1~5中任一项所述的方法。
Priority Applications (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201910530553.0A CN112102821B (zh) | 2019-06-18 | 2019-06-18 | 应用于电子设备的数据处理方法、装置、***、介质 |
PCT/CN2020/077609 WO2020253265A1 (zh) | 2019-06-18 | 2020-03-03 | 应用于电子设备的数据处理方法、装置、***、介质 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201910530553.0A CN112102821B (zh) | 2019-06-18 | 2019-06-18 | 应用于电子设备的数据处理方法、装置、***、介质 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN112102821A CN112102821A (zh) | 2020-12-18 |
CN112102821B true CN112102821B (zh) | 2024-01-12 |
Family
ID=73748478
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201910530553.0A Active CN112102821B (zh) | 2019-06-18 | 2019-06-18 | 应用于电子设备的数据处理方法、装置、***、介质 |
Country Status (2)
Country | Link |
---|---|
CN (1) | CN112102821B (zh) |
WO (1) | WO2020253265A1 (zh) |
Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN104010074A (zh) * | 2014-04-21 | 2014-08-27 | 联想(北京)有限公司 | 信息处理方法和装置 |
CN106297777A (zh) * | 2016-08-11 | 2017-01-04 | 广州视源电子科技股份有限公司 | 一种唤醒语音服务的方法和装置 |
CN107924687A (zh) * | 2015-09-23 | 2018-04-17 | 三星电子株式会社 | 语音识别设备、用户设备的语音识别方法和非暂时性计算机可读记录介质 |
CN108564951A (zh) * | 2018-03-02 | 2018-09-21 | 北京云知声信息技术有限公司 | 智能降低语音控制设备误唤醒概率的方法 |
CN108847219A (zh) * | 2018-05-25 | 2018-11-20 | 四川斐讯全智信息技术有限公司 | 一种唤醒词预设置信度阈值调节方法及*** |
Family Cites Families (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN105654949B (zh) * | 2016-01-07 | 2019-05-07 | 北京云知声信息技术有限公司 | 一种语音唤醒方法及装置 |
KR102623272B1 (ko) * | 2016-10-12 | 2024-01-11 | 삼성전자주식회사 | 전자 장치 및 이의 제어 방법 |
JP6772916B2 (ja) * | 2017-03-21 | 2020-10-21 | トヨタ自動車株式会社 | 対話装置および対話方法 |
US10170137B2 (en) * | 2017-05-18 | 2019-01-01 | International Business Machines Corporation | Voice signal component forecaster |
CN108509225B (zh) * | 2018-03-28 | 2021-07-16 | 联想(北京)有限公司 | 一种信息处理方法及电子设备 |
CN108766443A (zh) * | 2018-05-30 | 2018-11-06 | Oppo广东移动通信有限公司 | 匹配阈值的调整方法、装置、存储介质及电子设备 |
-
2019
- 2019-06-18 CN CN201910530553.0A patent/CN112102821B/zh active Active
-
2020
- 2020-03-03 WO PCT/CN2020/077609 patent/WO2020253265A1/zh active Application Filing
Patent Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN104010074A (zh) * | 2014-04-21 | 2014-08-27 | 联想(北京)有限公司 | 信息处理方法和装置 |
CN107924687A (zh) * | 2015-09-23 | 2018-04-17 | 三星电子株式会社 | 语音识别设备、用户设备的语音识别方法和非暂时性计算机可读记录介质 |
CN106297777A (zh) * | 2016-08-11 | 2017-01-04 | 广州视源电子科技股份有限公司 | 一种唤醒语音服务的方法和装置 |
CN108564951A (zh) * | 2018-03-02 | 2018-09-21 | 北京云知声信息技术有限公司 | 智能降低语音控制设备误唤醒概率的方法 |
CN108847219A (zh) * | 2018-05-25 | 2018-11-20 | 四川斐讯全智信息技术有限公司 | 一种唤醒词预设置信度阈值调节方法及*** |
Also Published As
Publication number | Publication date |
---|---|
WO2020253265A1 (zh) | 2020-12-24 |
CN112102821A (zh) | 2020-12-18 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN109378000B (zh) | 语音唤醒方法、装置、***、设备、服务器及存储介质 | |
US10747771B2 (en) | Method and apparatus for determining hot event | |
US9589560B1 (en) | Estimating false rejection rate in a detection system | |
US20180248879A1 (en) | Method and apparatus for setting access privilege, server and storage medium | |
US11610578B2 (en) | Automatic hotword threshold tuning | |
CN109933610B (zh) | 数据处理方法、装置、计算机设备及存储介质 | |
CN107392259B (zh) | 构建不均衡样本分类模型的方法和装置 | |
CN115841366B (zh) | 物品推荐模型训练方法、装置、电子设备及存储介质 | |
US20170193987A1 (en) | Speech recognition method and device | |
CN114882321A (zh) | 深度学习模型的训练方法、目标对象检测方法和装置 | |
WO2013124527A1 (en) | Method and apparatus for enhancing context intelligence in random index based system | |
US20220337606A1 (en) | Identifying fraudulent requests for content | |
CN110245684B (zh) | 数据处理方法、电子设备和介质 | |
CN113657249B (zh) | 训练方法、预测方法、装置、电子设备以及存储介质 | |
JP2015004756A (ja) | 判定装置、判定方法及び判定プログラム | |
CN112214770B (zh) | 恶意样本的识别方法、装置、计算设备以及介质 | |
CN113823282A (zh) | 语音处理方法、***和装置 | |
CN112102821B (zh) | 应用于电子设备的数据处理方法、装置、***、介质 | |
CN111858916B (zh) | 用于聚类句子的方法和装置 | |
CN109960905B (zh) | 信息处理方法、***、介质和电子设备 | |
CN113590447B (zh) | 埋点处理方法和装置 | |
JP2019091012A (ja) | 情報認識方法および装置 | |
CN116781568A (zh) | 数据监控告警方法、装置、设备及存储介质 | |
CN111930604B (zh) | 联机交易性能分析方法及装置、电子设备和可读存储介质 | |
CN115203564A (zh) | 信息流推荐方法、装置及计算机程序产品 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |