CN108509225A - 一种信息处理方法及电子设备 - Google Patents
一种信息处理方法及电子设备 Download PDFInfo
- Publication number
- CN108509225A CN108509225A CN201810262323.6A CN201810262323A CN108509225A CN 108509225 A CN108509225 A CN 108509225A CN 201810262323 A CN201810262323 A CN 201810262323A CN 108509225 A CN108509225 A CN 108509225A
- Authority
- CN
- China
- Prior art keywords
- electronic equipment
- voice messaging
- word
- wake
- user
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 230000010365 information processing Effects 0.000 title claims abstract description 14
- 238000003672 processing method Methods 0.000 title claims abstract description 14
- 230000002618 waking effect Effects 0.000 claims abstract description 48
- 238000000034 method Methods 0.000 claims abstract description 28
- 238000012512 characterization method Methods 0.000 claims description 21
- 230000005059 dormancy Effects 0.000 claims description 3
- 238000012545 processing Methods 0.000 description 14
- 238000010586 diagram Methods 0.000 description 12
- 230000006870 function Effects 0.000 description 6
- 230000002452 interceptive effect Effects 0.000 description 4
- 238000004364 calculation method Methods 0.000 description 2
- 230000001755 vocal effect Effects 0.000 description 2
- 238000013461 design Methods 0.000 description 1
- 238000011161 development Methods 0.000 description 1
- 230000005611 electricity Effects 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 230000000750 progressive effect Effects 0.000 description 1
- 238000012360 testing method Methods 0.000 description 1
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F9/00—Arrangements for program control, e.g. control units
- G06F9/06—Arrangements for program control, e.g. control units using stored programs, i.e. using an internal store of processing equipment to receive or retain programs
- G06F9/44—Arrangements for executing specific programs
- G06F9/4401—Bootstrapping
- G06F9/4418—Suspend and resume; Hibernate and awake
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F1/00—Details not covered by groups G06F3/00 - G06F13/00 and G06F21/00
- G06F1/26—Power supply means, e.g. regulation thereof
- G06F1/32—Means for saving power
- G06F1/3203—Power management, i.e. event-based initiation of a power-saving mode
- G06F1/3206—Monitoring of events, devices or parameters that trigger a change in power modality
- G06F1/3231—Monitoring the presence, absence or movement of users
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F1/00—Details not covered by groups G06F3/00 - G06F13/00 and G06F21/00
- G06F1/26—Power supply means, e.g. regulation thereof
- G06F1/32—Means for saving power
- G06F1/3203—Power management, i.e. event-based initiation of a power-saving mode
- G06F1/3234—Power saving characterised by the action undertaken
- G06F1/3287—Power saving characterised by the action undertaken by switching off individual functional units in the computer system
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F3/00—Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
- G06F3/16—Sound input; Sound output
- G06F3/167—Audio in a user interface, e.g. using voice commands for navigating, audio feedback
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/20—Natural language analysis
- G06F40/279—Recognition of textual entities
- G06F40/289—Phrasal analysis, e.g. finite state techniques or chunking
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/30—Semantic analysis
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L17/00—Speaker identification or verification techniques
- G10L17/22—Interactive procedures; Man-machine interfaces
-
- Y—GENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
- Y02—TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
- Y02D—CLIMATE CHANGE MITIGATION TECHNOLOGIES IN INFORMATION AND COMMUNICATION TECHNOLOGIES [ICT], I.E. INFORMATION AND COMMUNICATION TECHNOLOGIES AIMING AT THE REDUCTION OF THEIR OWN ENERGY USE
- Y02D10/00—Energy efficient computing, e.g. low power processors, power management or thermal management
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- General Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- Health & Medical Sciences (AREA)
- Audiology, Speech & Language Pathology (AREA)
- General Health & Medical Sciences (AREA)
- Human Computer Interaction (AREA)
- Multimedia (AREA)
- Software Systems (AREA)
- Artificial Intelligence (AREA)
- Computational Linguistics (AREA)
- Computer Hardware Design (AREA)
- Computing Systems (AREA)
- Acoustics & Sound (AREA)
- Computer Security & Cryptography (AREA)
- Telephone Function (AREA)
- Electric Clocks (AREA)
Abstract
本申请公开了一种信息处理方法和电子设备,所述方法包括:采集用户在唤醒电子设备前,对电子设备输入的语音信息,存储语音信息,基于存储的语音信息生成备选唤醒词,备选唤醒词用于将电子设备由休眠状态切换至唤醒状态。本申请能够实现对唤醒词进行自动扩展,通过扩展后的唤醒词,用户能够更加快捷的唤醒电子设备,提升了用户体验。
Description
技术领域
本申请涉及电子技术领域,尤其涉及一种信息处理方法及电子设备。
背景技术
随着电子技术的不断发展,电子设备具有越来越多的功能。其中,大多数的电子设备都具备语音交互功能。
目前,电子设备的语音交互功能,普遍采用语音唤醒词将电子设备从低功耗模式唤醒,以完成与用户复杂的语音交互任务。其中,唤醒词可以是电子设备预先设定的唤醒词,也可以是用户自定义设置的唤醒词。无论是电子设备预先设定的唤醒词还是用户自定义设置的唤醒词,都需要用户记忆该唤醒词,并且能够精确的说出该唤醒词,否则无法唤醒电子设备进行语音交互。
但是,在实际应用过程中,用户很可能对唤醒词的记忆并不完全准确,反复尝试说出若干个与设定唤醒词在语音或语义层面相似的词后,并不能唤醒设备,从而影响用户体验。
发明内容
有鉴于此,本申请提供一种信息处理方法,能够实现对唤醒词进行自动扩展,通过扩展后的唤醒词,用户能够更加快捷的唤醒电子设备,提升了用户体验。
本申请提供了一种信息处理方法,应用于电子设备,所述方法包括:
采集用户在唤醒所述电子设备前,对所述电子设备输入的语音信息;
存储所述语音信息;
基于所述存储的语音信息生成备选唤醒词,所述备选唤醒词用于将所述电子设备由休眠状态切换至唤醒状态。
优选地,所述采集用户在唤醒所述电子设备前,对所述电子设备输入的语音信息后,还包括:
判断所述语音信息表征的语义信息是否满足预设条件,所述预设条件为所述电子设备由休眠状态切换至唤醒状态;
当所述语音信息表征的语义信息不满足预设条件时,存储所述语音信息。
优选地,所述基于所述存储的语音信息生成备选唤醒词包括:
在所述电子设备唤醒状态下的空闲时段,基于所述存储的语音信息生成备选唤醒词。
优选地,所述基于所述存储的语音信息生成备选唤醒词包括:
将所述语音信息切分为至少一个待处理信息;
计算每个所述待处理信息与目标唤醒词的相似度;
判断所述待处理信息与所述目标唤醒词的相似度是否大于预设阈值;
当所述待处理信息与所述目标唤醒词的相似度大于预设阈值时,将所述待处理信息确定为所述备选唤醒词。
优选地,所述当所述待处理信息与所述目标唤醒词的相似度大于预设阈值时,还包括:
判断所述待处理信息的字数是否满足预设字数范围;
当所述待处理信息的字数满足预设字数范围时,将所述待处理信息确定为所述备选唤醒词。
优选地,所述采集用户在唤醒所述电子设备前,对所述电子设备输入的语音信息后,还包括:
对所述语音信息进行声纹识别;
基于声纹识别特征对所述语音信息进行分类,将具有相同声纹识别特征的语音信息归为一类;
相应的,基于所述存储的语音信息生成备选唤醒词包括:
分别基于每一类中的所述语音信息生成备选唤醒词。
一种电子设备,包括:
存储器,用于存储应用程序与应用程序运行所产生的数据;
音频采集装置,用于采集用户在唤醒所述电子设备前,对所述电子设备输入的语音信息;
所述存储器,还用于存储所述语音信息;
处理器,用于运行所述应用程序以基于所述存储的语音信息生成备选唤醒词,所述备选唤醒词用于将所述电子设备由休眠状态切换至唤醒状态。
优选地,所述在所述音频采集装置采集用户在唤醒所述电子设备前,对所述电子设备输入的语音信息后,所述处理器,还用于:
判断所述语音信息表征的语义信息是否满足预设条件,所述预设条件为所述电子设备由休眠状态切换至唤醒状态;
当所述语音信息表征的语义信息不满足预设条件时,所述存储器存储所述语音信息。
优选地,所述处理器在基于所述存储的语音信息生成备选唤醒词时,具体用于:
在所述电子设备唤醒状态下的空闲时段,基于所述存储的语音信息生成备选唤醒词。
优选地,在所述音频采集装置采集用户在唤醒所述电子设备前,对所述电子设备输入的语音信息后,所述处理器,还用于:
对所述语音信息进行声纹识别;
基于声纹识别特征对所述语音信息进行分类,将具有相同声纹识别特征的语音信息归为一类;
分别基于每一类中的所述语音信息生成备选唤醒词。
从上述技术方案可以看出,本申请公开的一种信息处理方法,当需要对电子设备的唤醒词进行自动扩展时,采集用户在唤醒电子设备前对电子设备输入的语音信息,并将采集到的语音信息进行存储,然后根据存储的语音信息生成用于将电子设备由休眠状态切换至唤醒状态的唤醒词。本申请能够实现对唤醒词进行自动扩展,通过扩展后的唤醒词,用户能够更加快捷的唤醒电子设备,提升了用户体验。
附图说明
为了更清楚地说明本申请实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本申请的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1为本申请公开的一种信息处理方法实施例1的方法流程图;
图2为本申请公开的一种信息处理方法实施例2的方法流程图;
图3为本申请公开的一种信息处理方法实施例3的方法流程图;
图4为本申请公开的一种电子设备实施例1的结构示意图;
图5为本申请公开的一种电子设备实施例2的结构示意图;
图6为本申请公开的一种电子设备实施例3的结构示意图。
具体实施方式
下面将结合本申请实施例中的附图,对本申请实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本申请一部分实施例,而不是全部的实施例。基于本申请中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本申请保护的范围。
如图1所示,为本申请公开的一种信息处理方法实施例1的方法流程图,所述方法应用于电子设备,所述方法可以包含以下步骤:
S101、采集用户在唤醒电子设备前,对电子设备输入的语音信息;
当需要对电子设备的唤醒词进行自动扩展时,在电子设备被唤醒前,采集用户对电子设备输入的语音信息。例如,在电子设备被唤醒前,用户A对电子设备输入“今天天气怎么样”的语音信息,则将用户输出的“今天天气怎么样”的语音信息进行采集。在采集用户对电子设备输入的语音信息时,可以通过电子设备中的麦克风进行采集。另外,在采集电子设备被唤醒前用户对电子设备输入的语音信息时,可以设置一定的采集频率。例如,每间隔10分钟采集一次。
S102、存储语音信息;
由于电子设备在唤醒前的处理能力较弱,因此将采集到的用户在唤醒电子设备前对电子设备输入的语音信息进行存储。
S103、基于存储的语音信息生成备选唤醒词,备选唤醒词用于将电子设备由休眠状态切换至唤醒状态。
当电子设备具有较强的处理能力时,例如,当电子设备被唤醒后,对存储的语音信息进行处理,生成能够用于将电子设备由休眠状态切换至唤醒状态的唤醒词。例如,将“今天天气”作为电子设备的备选唤醒词。
综上所述,在上述实施例中,当需要对电子设备的唤醒词进行自动扩展时,采集用户在唤醒电子设备前对电子设备输入的语音信息,并将采集到的语音信息进行存储,然后根据存储的语音信息生成用于将电子设备由休眠状态切换至唤醒状态的唤醒词。本申请能够实现对唤醒词进行自动扩展,通过扩展后的唤醒词,用户能够更加快捷的唤醒电子设备,提升了用户体验。
如图2所示,为本申请公开的一种信息处理方法实施例2的方法流程图,所述方法应用于电子设备,所述方法可以包含以下步骤:
S201、采集用户在唤醒电子设备前,对电子设备输入的语音信息;
当需要对电子设备的唤醒词进行自动扩展时,在电子设备被唤醒前,采集用户对电子设备输入的语音信息。例如,在电子设备被唤醒前,用户A对电子设备输入“今天天气怎么样”的语音信息,则将用户输出的“今天天气怎么样”的语音信息进行采集。在采集用户对电子设备输入的语音信息时,可以通过电子设备中的麦克风进行采集。另外,在采集电子设备被唤醒前用户对电子设备输入的语音信息时,可以设置一定的采集频率。例如,每间隔10分钟采集一次。
S202、判断语音信息表征的语义信息是否满足预设条件,预设条件为电子设备由休眠状态切换至唤醒状态;
当采集到用户在唤醒电子设备前对电子设备输入的语音信息后,进一步判断获取到的语音信息表征的语义信息是否能将电子设备由休眠状态切换至唤醒状态。需要说明的是,在判断获取到的语音信息表征的语义信息是否能将电子设备由休眠状态切换至唤醒状态时,可以对获取到的语音信息进行语义理解,得到与所述语音信息对应的语义信息。
S203、当语音信息表征的语义信息不满足预设条件时,存储语音信息;
当语音信息表征的语音信息不能将电子设备由休眠状态切换至唤醒状态时,由于电子设备在唤醒前的处理能力较弱,因此将采集到的用户在唤醒电子设备前对电子设备输入的语音信息进行存储。例如,将用户输出的“今天天气怎么样”进行存储。
S204、基于存储的语音信息生成备选唤醒词,备选唤醒词用于将电子设备由休眠状态切换至唤醒状态。
当电子设备具有较强的处理能力时,例如,当电子设备被唤醒后,对存储的语音信息进行处理,生成能够用于将电子设备由休眠状态切换至唤醒状态的唤醒词。例如,将“今天天气怎么样”中的“今天天气”作为电子设备的备选唤醒词。
综上所述,在上述实施例中,当需要对电子设备的唤醒词进行自动扩展时,采集用户在唤醒电子设备前对电子设备输入的语音信息,并进一步判断采集到的语音信息表征的语音信息是否能将电子设备由休眠状态切换至唤醒状态,当语音信息表征的语义信息不能将电子设备由休眠状态切换至唤醒状态时,将采集到的语音信息进行存储,然后根据存储的语音信息生成用于将电子设备由休眠状态切换至唤醒状态的唤醒词。本申请能够实现对唤醒词进行自动扩展,通过扩展后的唤醒词,用户能够更加快捷的唤醒电子设备,提升了用户体验。
具体的,在上述的实施例中,步骤S103和步骤S204中基于存储的语音信息生成备选唤醒词的其中一种实现方式可以是:在电子设备唤醒状态下的空闲时段,基于存储的语音信息生成备选唤醒词。通过在电子设备唤醒状态下的空闲时段对存储的语音信息进行处理,能够加大电子设备对语音信息的处理能力。
具体的,在上述的实施例中,在基于存储的语音信息生成备选唤醒词的其中一种实现方式可以包括以下步骤:
S1、将语音信息切分为至少一个待处理信息;
在根据存储的语音信息生成备选唤醒词时,可以将获取到的语音信息切分为至少一个待处理信息。例如,将语音信息“今天天气怎么样”切分成“今天天气”和“怎么样”两个待处理信息。
S2、计算每个待处理信息与目标唤醒词的相似度;
然后分别计算每个待处理信息与目标唤醒词的相似度,其中,目标唤醒词为能够将电子设备唤醒的词。例如,假设目标唤醒词为“天气”,计算待处理信息“今天天气”和“天气”与目标唤醒词“天气”的相似度。
S3、判断待处理信息与目标唤醒词的相似度是否大于预设阈值;
根据计算结果,判断待处理信息与目标唤醒词的相似度是否大于预设阈值,例如,是否大于60%等。
S4、当待处理信息与目标唤醒词的相似度大于预设阈值时,将待处理信息确定为备选唤醒词。
通过判断,当待处理信息与目标唤醒词的相似度大于预设阈值时,将待处理信息确定为备选唤醒词。例如,当待处理信息“今天天气”与目标唤醒词“天气”的相似度大于预设阈值时,将“今天天气”确定为备选唤醒词。
具体的,在上述实施例中,为了使确定的备选唤醒词更有利于用户唤醒电子设备,在待处理信息与目标唤醒词的相似度大于预设阈值后,还可以进一步包括:
S5、判断待处理信息的字数是否满足预设字数范围;
即进一步判断与目标唤醒词的相似度大于预设阈值的待处理信息的字数是否满足预设字数范围,例如,是否在3~5个字范围内。
S6、当待处理信息的字数满足预设字数范围时,将待处理信息确定为备选唤醒词。
当待处理信息的相似度大于预设阈值,且字数满足预设字数范围时,将待处理信息确定为备选唤醒词。例如,将“今天天气”确定为备选唤醒词。
如图3所示,为本申请公开的一种信息处理方法实施例3的方法流程图,所述方法应用于电子设备,所述方法可以包含以下步骤:
S301、采集用户在唤醒电子设备前,对电子设备输入的语音信息;
当需要对电子设备的唤醒词进行自动扩展时,在电子设备被唤醒前,采集用户对电子设备输入的语音信息。例如,在电子设备被唤醒前,用户A对电子设备输入“今天天气怎么样”的语音信息,则将用户输出的“今天天气怎么样”的语音信息进行采集。在采集用户对电子设备输入的语音信息时,可以通过电子设备中的麦克风进行采集。另外,在采集电子设备被唤醒前用户对电子设备输入的语音信息时,可以设置一定的采集频率。例如,每间隔10分钟采集一次。
S302、对语音信息进行声纹识别;
由于在电子设备唤醒前,对电子设备输入语音信息的可能不止一个用户。例如,用户A输入了“今天天气怎么样”、“北京天气怎么样”的语音信息,用户B输入了“到北京怎么走”、“距离北京多远”的语音信息。为了提升用户体验,针对不同的用户扩展不同的唤醒词,当采集到用户在唤醒电子设备前,对电子设备输入的语音信息后,对获取到的语音信息进行声纹识别,通过声纹识别能够识别出语音信息中不同的用户。
S303、基于声纹识别特征对语音信息进行分类,将具有相同声纹识别特征的语音信息归为一类;
通过声纹识别,将具有相同声纹识别特征的语音信息归为一类,即将同一用户的语音信息归为一类。例如,将用户A输出的“今天天气怎么样”、“北京天气怎么样”的语音信息归为一类,将用户B输出的“到北京怎么走”、“距离北京多远”的语音信息归为一类。
S304、存储经过分类的语音信息;
由于电子设备在唤醒前的处理能力较弱,因此将采集到的经过分类的用户在唤醒电子设备前对电子设备输入的语音信息进行存储。
S305、分别基于每一类中的所述语音信息生成备选唤醒词,备选唤醒词用于将电子设备由休眠状态切换至唤醒状态。
当电子设备具有较强的处理能力时,例如,当电子设备被唤醒后,对存储的每一类语音信息分别进行处理,生成能够用于将电子设备由休眠状态切换至唤醒状态的唤醒词。例如,将“今天天气”作为电子设备的备选唤醒词。
综上所述,在上述实施例中,当需要对电子设备的唤醒词进行自动扩展时,采集用户在唤醒电子设备前对电子设备输入的语音信息,并对语音信息进行声纹识别,基于声纹识别特征对语音信息进行分类,将具有相同声纹识别特征的语音信息归为一类,并将经过分类后的语音信息进行存储,然后分别基于每一类中的语音信息生成用于将电子设备由休眠状态切换至唤醒状态的唤醒词。本申请能够实现对唤醒词进行自动扩展,通过扩展后的唤醒词,用户能够更加快捷的唤醒电子设备,提升了用户体验。
如图4所示,为本申请公开的一种电子设备实施例1的结构示意图,所述电子设备可以包含:
存储器401,用于存储应用程序与应用程序运行所产生的数据;
音频采集装置402,用于采集用户在唤醒电子设备前,对电子设备输入的语音信息;
当需要对电子设备的唤醒词进行自动扩展时,在电子设备被唤醒前,采集用户对电子设备输入的语音信息。例如,在电子设备被唤醒前,用户A对电子设备输入“今天天气怎么样”的语音信息,则将用户输出的“今天天气怎么样”的语音信息进行采集。在采集用户对电子设备输入的语音信息时,可以通过电子设备中的麦克风进行采集。另外,在采集电子设备被唤醒前用户对电子设备输入的语音信息时,可以设置一定的采集频率。例如,每间隔10分钟采集一次。
存储器401,还用于存储语音信息;
由于电子设备在唤醒前的处理能力较弱,因此将采集到的用户在唤醒电子设备前对电子设备输入的语音信息进行存储。
处理器403,用于运行所述应用程序以基于存储的语音信息生成备选唤醒词,备选唤醒词用于将电子设备由休眠状态切换至唤醒状态。
当电子设备具有较强的处理能力时,例如,当电子设备被唤醒后,对存储的语音信息进行处理,生成能够用于将电子设备由休眠状态切换至唤醒状态的唤醒词。例如,将“今天天气”作为电子设备的备选唤醒词。
综上所述,在上述实施例中,当需要对电子设备的唤醒词进行自动扩展时,采集用户在唤醒电子设备前对电子设备输入的语音信息,并将采集到的语音信息进行存储,然后根据存储的语音信息生成用于将电子设备由休眠状态切换至唤醒状态的唤醒词。本申请能够实现对唤醒词进行自动扩展,通过扩展后的唤醒词,用户能够更加快捷的唤醒电子设备,提升了用户体验。
如图5所示,为本申请公开的一种电子设备实施例2的结构示意图,所述电子设备可以包含:
存储器501,用于存储应用程序与应用程序运行所产生的数据;
音频采集装置502,用于采集用户在唤醒电子设备前,对电子设备输入的语音信息;
当需要对电子设备的唤醒词进行自动扩展时,在电子设备被唤醒前,采集用户对电子设备输入的语音信息。例如,在电子设备被唤醒前,用户A对电子设备输入“今天天气怎么样”的语音信息,则将用户输出的“今天天气怎么样”的语音信息进行采集。在采集用户对电子设备输入的语音信息时,可以通过电子设备中的麦克风进行采集。另外,在采集电子设备被唤醒前用户对电子设备输入的语音信息时,可以设置一定的采集频率。例如,每间隔10分钟采集一次。
处理器503,用于运行所述应用程序以判断语音信息表征的语义信息是否满足预设条件,预设条件为电子设备由休眠状态切换至唤醒状态;
当采集到用户在唤醒电子设备前对电子设备输入的语音信息后,进一步判断获取到的语音信息表征的语义信息是否能将电子设备由休眠状态切换至唤醒状态。需要说明的是,在判断获取到的语音信息表征的语义信息是否能将电子设备由休眠状态切换至唤醒状态时,可以对获取到的语音信息进行语义理解,得到与所述语音信息对应的语义信息。
存储器501,还用于当语音信息表征的语义信息不满足预设条件时,存储语音信息;
当语音信息表征的语音信息不能将电子设备由休眠状态切换至唤醒状态时,由于电子设备在唤醒前的处理能力较弱,因此将采集到的用户在唤醒电子设备前对电子设备输入的语音信息进行存储。例如,将用户输出的“今天天气怎么样”进行存储。
处理器503,还用于基于存储的语音信息生成备选唤醒词,备选唤醒词用于将电子设备由休眠状态切换至唤醒状态。
当电子设备具有较强的处理能力时,例如,当电子设备被唤醒后,对存储的语音信息进行处理,生成能够用于将电子设备由休眠状态切换至唤醒状态的唤醒词。例如,将“今天天气怎么样”中的“今天天气”作为电子设备的备选唤醒词。
综上所述,在上述实施例中,当需要对电子设备的唤醒词进行自动扩展时,采集用户在唤醒电子设备前对电子设备输入的语音信息,并进一步判断采集到的语音信息表征的语音信息是否能将电子设备由休眠状态切换至唤醒状态,当语音信息表征的语义信息不能将电子设备由休眠状态切换至唤醒状态时,将采集到的语音信息进行存储,然后根据存储的语音信息生成用于将电子设备由休眠状态切换至唤醒状态的唤醒词。本申请能够实现对唤醒词进行自动扩展,通过扩展后的唤醒词,用户能够更加快捷的唤醒电子设备,提升了用户体验。
具体的,在上述的实施例中,处理器基于存储的语音信息生成备选唤醒词的其中一种实现方式可以是:在电子设备唤醒状态下的空闲时段,基于存储的语音信息生成备选唤醒词。通过在电子设备唤醒状态下的空闲时段对存储的语音信息进行处理,能够加大电子设备对语音信息的处理能力。
具体的,在上述的实施例中,处理器在基于存储的语音信息生成备选唤醒词的其中一种实现方式可以包括以下步骤:
S1、将语音信息切分为至少一个待处理信息;
在根据存储的语音信息生成备选唤醒词时,可以将获取到的语音信息切分为至少一个待处理信息。例如,将语音信息“今天天气怎么样”切分成“今天天气”和“怎么样”两个待处理信息。
S2、计算每个待处理信息与目标唤醒词的相似度;
然后分别计算每个待处理信息与目标唤醒词的相似度,其中,目标唤醒词为能够将电子设备唤醒的词。例如,假设目标唤醒词为“天气”,计算待处理信息“今天天气”和“天气”与目标唤醒词“天气”的相似度。
S3、判断待处理信息与目标唤醒词的相似度是否大于预设阈值;
根据计算结果,判断待处理信息与目标唤醒词的相似度是否大于预设阈值,例如,是否大于60%等。
S4、当待处理信息与目标唤醒词的相似度大于预设阈值时,将待处理信息确定为备选唤醒词。
通过判断,当待处理信息与目标唤醒词的相似度大于预设阈值时,将待处理信息确定为备选唤醒词。例如,当待处理信息“今天天气”与目标唤醒词“天气”的相似度大于预设阈值时,将“今天天气”确定为备选唤醒词。
具体的,在上述实施例中,为了使确定的备选唤醒词更有利于用户唤醒电子设备,在待处理信息与目标唤醒词的相似度大于预设阈值后,还可以进一步包括:
S5、判断待处理信息的字数是否满足预设字数范围;
即进一步判断与目标唤醒词的相似度大于预设阈值的待处理信息的字数是否满足预设字数范围,例如,是否在3~5个字范围内。
S6、当待处理信息的字数满足预设字数范围时,将待处理信息确定为备选唤醒词。
当待处理信息的相似度大于预设阈值,且字数满足预设字数范围时,将待处理信息确定为备选唤醒词。例如,将“今天天气”确定为备选唤醒词。
如图6所示,为本申请公开的一种电子设备实施例3的结构示意图,所述电子设备可以包含:
存储器601,用于存储应用程序与应用程序运行所产生的数据;
音频采集装置602,用于采集用户在唤醒电子设备前,对电子设备输入的语音信息;
当需要对电子设备的唤醒词进行自动扩展时,在电子设备被唤醒前,采集用户对电子设备输入的语音信息。例如,在电子设备被唤醒前,用户A对电子设备输入“今天天气怎么样”的语音信息,则将用户输出的“今天天气怎么样”的语音信息进行采集。在采集用户对电子设备输入的语音信息时,可以通过电子设备中的麦克风进行采集。另外,在采集电子设备被唤醒前用户对电子设备输入的语音信息时,可以设置一定的采集频率。例如,每间隔10分钟采集一次。
处理器603,用于运行所述应用程序以对语音信息进行声纹识别;
由于在电子设备唤醒前,对电子设备输入语音信息的可能不止一个用户。例如,用户A输入了“今天天气怎么样”、“北京天气怎么样”的语音信息,用户B输入了“到北京怎么走”、“距离北京多远”的语音信息。为了提升用户体验,针对不同的用户扩展不同的唤醒词,当采集到用户在唤醒电子设备前,对电子设备输入的语音信息后,对获取到的语音信息进行声纹识别,通过声纹识别能够识别出语音信息中不同的用户。
处理器603,还用于基于声纹识别特征对语音信息进行分类,将具有相同声纹识别特征的语音信息归为一类;
通过声纹识别,将具有相同声纹识别特征的语音信息归为一类,即将同一用户的语音信息归为一类。例如,将用户A输出的“今天天气怎么样”、“北京天气怎么样”的语音信息归为一类,将用户B输出的“到北京怎么走”、“距离北京多远”的语音信息归为一类。
存储器601,还用于存储经过分类的语音信息;
由于电子设备在唤醒前的处理能力较弱,因此将采集到的经过分类的用户在唤醒电子设备前对电子设备输入的语音信息进行存储。
处理器603,还用于分别基于每一类中的所述语音信息生成备选唤醒词,备选唤醒词用于将电子设备由休眠状态切换至唤醒状态。
当电子设备具有较强的处理能力时,例如,当电子设备被唤醒后,对存储的每一类语音信息分别进行处理,生成能够用于将电子设备由休眠状态切换至唤醒状态的唤醒词。例如,将“今天天气”作为电子设备的备选唤醒词。
综上所述,在上述实施例中,当需要对电子设备的唤醒词进行自动扩展时,采集用户在唤醒电子设备前对电子设备输入的语音信息,并对语音信息进行声纹识别,基于声纹识别特征对语音信息进行分类,将具有相同声纹识别特征的语音信息归为一类,并将经过分类后的语音信息进行存储,然后分别基于每一类中的语音信息生成用于将电子设备由休眠状态切换至唤醒状态的唤醒词。本申请能够实现对唤醒词进行自动扩展,通过扩展后的唤醒词,用户能够更加快捷的唤醒电子设备,提升了用户体验。
本说明书中各个实施例采用递进的方式描述,每个实施例重点说明的都是与其他实施例的不同之处,各个实施例之间相同相似部分互相参见即可。对于实施例公开的装置而言,由于其与实施例公开的方法相对应,所以描述的比较简单,相关之处参见方法部分说明即可。
专业人员还可以进一步意识到,结合本文中所公开的实施例描述的各示例的单元及算法步骤,能够以电子硬件、计算机软件或者二者的结合来实现,为了清楚地说明硬件和软件的可互换性,在上述说明中已经按照功能一般性地描述了各示例的组成及步骤。这些功能究竟以硬件还是软件方式来执行,取决于技术方案的特定应用和设计约束条件。专业技术人员可以对每个特定的应用来使用不同方法来实现所描述的功能,但是这种实现不应认为超出本申请的范围。
结合本文中所公开的实施例描述的方法或算法的步骤可以直接用硬件、处理器执行的软件模块,或者二者的结合来实施。软件模块可以置于随机存储器(RAM)、内存、只读存储器(ROM)、电可编程ROM、电可擦除可编程ROM、寄存器、硬盘、可移动磁盘、CD-ROM、或技术领域内所公知的任意其它形式的存储介质中。
对所公开的实施例的上述说明,使本领域专业技术人员能够实现或使用本申请。对这些实施例的多种修改对本领域的专业技术人员来说将是显而易见的,本文中所定义的一般原理可以在不脱离本申请的精神或范围的情况下,在其它实施例中实现。因此,本申请将不会被限制于本文所示的这些实施例,而是要符合与本文所公开的原理和新颖特点相一致的最宽的范围。
Claims (10)
1.一种信息处理方法,其特征在于,应用于电子设备,所述方法包括:
采集用户在唤醒所述电子设备前,对所述电子设备输入的语音信息;
存储所述语音信息;
基于所述存储的语音信息生成备选唤醒词,所述备选唤醒词用于将所述电子设备由休眠状态切换至唤醒状态。
2.根据权利要求1所述的方法,其特征在于,所述采集用户在唤醒所述电子设备前,对所述电子设备输入的语音信息后,还包括:
判断所述语音信息表征的语义信息是否满足预设条件,所述预设条件为所述电子设备由休眠状态切换至唤醒状态;
当所述语音信息表征的语义信息不满足预设条件时,存储所述语音信息。
3.根据权利要求1或2所述的方法,其特征在于,所述基于所述存储的语音信息生成备选唤醒词包括:
在所述电子设备唤醒状态下的空闲时段,基于所述存储的语音信息生成备选唤醒词。
4.根据权利要求1所述的方法,其特征在于,所述基于所述存储的语音信息生成备选唤醒词包括:
将所述语音信息切分为至少一个待处理信息;
计算每个所述待处理信息与目标唤醒词的相似度;
判断所述待处理信息与所述目标唤醒词的相似度是否大于预设阈值;
当所述待处理信息与所述目标唤醒词的相似度大于预设阈值时,将所述待处理信息确定为所述备选唤醒词。
5.根据权利要求4所述的方法,其特征在于,所述当所述待处理信息与所述目标唤醒词的相似度大于预设阈值时,还包括:
判断所述待处理信息的字数是否满足预设字数范围;
当所述待处理信息的字数满足预设字数范围时,将所述待处理信息确定为所述备选唤醒词。
6.根据权利要求1所述的方法,其特征在于,所述采集用户在唤醒所述电子设备前,对所述电子设备输入的语音信息后,还包括:
对所述语音信息进行声纹识别;
基于声纹识别特征对所述语音信息进行分类,将具有相同声纹识别特征的语音信息归为一类;
相应的,基于所述存储的语音信息生成备选唤醒词包括:
分别基于每一类中的所述语音信息生成备选唤醒词。
7.一种电子设备,其特征在于,包括:
存储器,用于存储应用程序与应用程序运行所产生的数据;
音频采集装置,用于采集用户在唤醒所述电子设备前,对所述电子设备输入的语音信息;
所述存储器,还用于存储所述语音信息;
处理器,用于运行所述应用程序以基于所述存储的语音信息生成备选唤醒词,所述备选唤醒词用于将所述电子设备由休眠状态切换至唤醒状态。
8.根据权利要求7所述的电子设备,其特征在于,所述在所述音频采集装置采集用户在唤醒所述电子设备前,对所述电子设备输入的语音信息后,所述处理器,还用于:
判断所述语音信息表征的语义信息是否满足预设条件,所述预设条件为所述电子设备由休眠状态切换至唤醒状态;
当所述语音信息表征的语义信息不满足预设条件时,所述存储器存储所述语音信息。
9.根据权利要求7或8所述的电子设备,其特征在于,所述处理器在基于所述存储的语音信息生成备选唤醒词时,具体用于:
在所述电子设备唤醒状态下的空闲时段,基于所述存储的语音信息生成备选唤醒词。
10.根据权利要求7所述的电子设备,其特征在于,在所述音频采集装置采集用户在唤醒所述电子设备前,对所述电子设备输入的语音信息后,所述处理器,还用于:
对所述语音信息进行声纹识别;
基于声纹识别特征对所述语音信息进行分类,将具有相同声纹识别特征的语音信息归为一类;
分别基于每一类中的所述语音信息生成备选唤醒词。
Priority Applications (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201810262323.6A CN108509225B (zh) | 2018-03-28 | 2018-03-28 | 一种信息处理方法及电子设备 |
US16/367,235 US11194378B2 (en) | 2018-03-28 | 2019-03-27 | Information processing method and electronic device |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201810262323.6A CN108509225B (zh) | 2018-03-28 | 2018-03-28 | 一种信息处理方法及电子设备 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN108509225A true CN108509225A (zh) | 2018-09-07 |
CN108509225B CN108509225B (zh) | 2021-07-16 |
Family
ID=63378877
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201810262323.6A Active CN108509225B (zh) | 2018-03-28 | 2018-03-28 | 一种信息处理方法及电子设备 |
Country Status (2)
Country | Link |
---|---|
US (1) | US11194378B2 (zh) |
CN (1) | CN108509225B (zh) |
Cited By (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN110246495A (zh) * | 2019-06-28 | 2019-09-17 | 联想(北京)有限公司 | 信息处理方法和电子设备 |
WO2020253265A1 (zh) * | 2019-06-18 | 2020-12-24 | 北京京东尚科信息技术有限公司 | 应用于电子设备的数据处理方法、装置、***、介质 |
CN112164395A (zh) * | 2020-09-18 | 2021-01-01 | 北京百度网讯科技有限公司 | 车载语音启动方法、装置、电子设备和存储介质 |
WO2024051611A1 (zh) * | 2022-09-05 | 2024-03-14 | 华为技术有限公司 | 人机交互方法及相关装置 |
Families Citing this family (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN111767083A (zh) * | 2020-02-03 | 2020-10-13 | 北京沃东天骏信息技术有限公司 | 误唤醒音频数据的收集方法、播放设备、电子设备、介质 |
Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN1416560A (zh) * | 2000-03-08 | 2003-05-07 | 西门子公司 | 由有限的用户圈用语音控制启动可在设备内执行的动作的方法 |
CN104424290A (zh) * | 2013-09-02 | 2015-03-18 | 佳能株式会社 | 基于语音的问答***和用于交互式语音***的方法 |
US20160086603A1 (en) * | 2012-06-15 | 2016-03-24 | Cypress Semiconductor Corporation | Power-Efficient Voice Activation |
CN106297777A (zh) * | 2016-08-11 | 2017-01-04 | 广州视源电子科技股份有限公司 | 一种唤醒语音服务的方法和装置 |
CN107147618A (zh) * | 2017-04-10 | 2017-09-08 | 北京猎户星空科技有限公司 | 一种用户注册方法、装置及电子设备 |
Family Cites Families (9)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US9275637B1 (en) * | 2012-11-06 | 2016-03-01 | Amazon Technologies, Inc. | Wake word evaluation |
US20140365225A1 (en) * | 2013-06-05 | 2014-12-11 | DSP Group | Ultra-low-power adaptive, user independent, voice triggering schemes |
CN105283836B (zh) * | 2013-07-11 | 2019-06-04 | 英特尔公司 | 用于设备唤醒的设备、方法、装置及计算机可读存储介质 |
US9548047B2 (en) * | 2013-07-31 | 2017-01-17 | Google Technology Holdings LLC | Method and apparatus for evaluating trigger phrase enrollment |
US8768712B1 (en) * | 2013-12-04 | 2014-07-01 | Google Inc. | Initiating actions based on partial hotwords |
US9697828B1 (en) * | 2014-06-20 | 2017-07-04 | Amazon Technologies, Inc. | Keyword detection modeling using contextual and environmental information |
KR102357321B1 (ko) * | 2014-08-27 | 2022-02-03 | 삼성전자주식회사 | 음성 인식이 가능한 디스플레이 장치 및 방법 |
KR102623272B1 (ko) * | 2016-10-12 | 2024-01-11 | 삼성전자주식회사 | 전자 장치 및 이의 제어 방법 |
EP3564949A1 (en) * | 2018-04-23 | 2019-11-06 | Spotify AB | Activation trigger processing |
-
2018
- 2018-03-28 CN CN201810262323.6A patent/CN108509225B/zh active Active
-
2019
- 2019-03-27 US US16/367,235 patent/US11194378B2/en active Active
Patent Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN1416560A (zh) * | 2000-03-08 | 2003-05-07 | 西门子公司 | 由有限的用户圈用语音控制启动可在设备内执行的动作的方法 |
US20160086603A1 (en) * | 2012-06-15 | 2016-03-24 | Cypress Semiconductor Corporation | Power-Efficient Voice Activation |
CN104424290A (zh) * | 2013-09-02 | 2015-03-18 | 佳能株式会社 | 基于语音的问答***和用于交互式语音***的方法 |
CN106297777A (zh) * | 2016-08-11 | 2017-01-04 | 广州视源电子科技股份有限公司 | 一种唤醒语音服务的方法和装置 |
CN107147618A (zh) * | 2017-04-10 | 2017-09-08 | 北京猎户星空科技有限公司 | 一种用户注册方法、装置及电子设备 |
Cited By (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2020253265A1 (zh) * | 2019-06-18 | 2020-12-24 | 北京京东尚科信息技术有限公司 | 应用于电子设备的数据处理方法、装置、***、介质 |
CN110246495A (zh) * | 2019-06-28 | 2019-09-17 | 联想(北京)有限公司 | 信息处理方法和电子设备 |
CN112164395A (zh) * | 2020-09-18 | 2021-01-01 | 北京百度网讯科技有限公司 | 车载语音启动方法、装置、电子设备和存储介质 |
WO2024051611A1 (zh) * | 2022-09-05 | 2024-03-14 | 华为技术有限公司 | 人机交互方法及相关装置 |
Also Published As
Publication number | Publication date |
---|---|
US20190302869A1 (en) | 2019-10-03 |
CN108509225B (zh) | 2021-07-16 |
US11194378B2 (en) | 2021-12-07 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN108509225A (zh) | 一种信息处理方法及电子设备 | |
CN106297777B (zh) | 一种唤醒语音服务的方法和装置 | |
CN107799120A (zh) | 服务机器人识别唤醒方法及装置 | |
CN111312222B (zh) | 一种唤醒、语音识别模型训练方法及装置 | |
CN110428810A (zh) | 一种语音唤醒的识别方法、装置及电子设备 | |
CN110047485B (zh) | 识别唤醒词的方法和装置、介质以及设备 | |
CN106653022A (zh) | 基于人工智能的语音唤醒方法和装置 | |
CN111880856A (zh) | 语音唤醒方法、装置、电子设备及存储介质 | |
CN103077721A (zh) | 移动终端的语音备忘方法及移动终端 | |
CN110060693A (zh) | 模型训练方法、装置、电子设备及存储介质 | |
CN110349579B (zh) | 语音唤醒处理方法及装置、电子设备及存储介质 | |
CN108847216B (zh) | 语音处理方法及电子设备、存储介质 | |
CN108761345A (zh) | 智能锁提醒电池电量方法及装置 | |
CN105844130A (zh) | 待机状态下的指纹解锁方法 | |
CN110673821A (zh) | 一种智能设备唤醒反馈方法及智能设备 | |
CN109215293A (zh) | 一种疲劳驾驶检测方法、装置及车载终端设备 | |
CN108766431A (zh) | 一种基于语音识别的自动唤醒方法及电子设备 | |
CN113238804A (zh) | 一种基于智能终端息屏状态下指定应用唤醒***及方法 | |
CN104598192B (zh) | 信息处理方法及电子设备 | |
CN103186326A (zh) | 一种应用对象操作方法及电子设备 | |
CN104063316B (zh) | 一种应用的测试方法及装置 | |
CN116386676B (zh) | 语音唤醒方法、语音唤醒装置及存储介质 | |
CN111179924B (zh) | 一种基于模式切换的唤醒性能优化的方法及*** | |
CN112951243A (zh) | 语音唤醒方法、装置、芯片、电子设备及存储介质 | |
CN106020426B (zh) | 一种唤醒锁的释放方法和装置 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |