CN109412544B - 一种智能穿戴设备的语音采集方法、装置及相关组件 - Google Patents

一种智能穿戴设备的语音采集方法、装置及相关组件 Download PDF

Info

Publication number
CN109412544B
CN109412544B CN201811565715.6A CN201811565715A CN109412544B CN 109412544 B CN109412544 B CN 109412544B CN 201811565715 A CN201811565715 A CN 201811565715A CN 109412544 B CN109412544 B CN 109412544B
Authority
CN
China
Prior art keywords
voice
data
bone vibration
vibration data
preset value
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201811565715.6A
Other languages
English (en)
Other versions
CN109412544A (zh
Inventor
张士林
陈维亮
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Goertek Techology Co Ltd
Original Assignee
Goertek Techology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Goertek Techology Co Ltd filed Critical Goertek Techology Co Ltd
Priority to CN201811565715.6A priority Critical patent/CN109412544B/zh
Publication of CN109412544A publication Critical patent/CN109412544A/zh
Application granted granted Critical
Publication of CN109412544B publication Critical patent/CN109412544B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • HELECTRICITY
    • H03ELECTRONIC CIRCUITRY
    • H03GCONTROL OF AMPLIFICATION
    • H03G3/00Gain control in amplifiers or frequency changers
    • H03G3/20Automatic control
    • H03G3/30Automatic control in amplifiers having semiconductor devices
    • H03G3/32Automatic control in amplifiers having semiconductor devices the control being dependent upon ambient noise level or sound level
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y02TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
    • Y02DCLIMATE CHANGE MITIGATION TECHNOLOGIES IN INFORMATION AND COMMUNICATION TECHNOLOGIES [ICT], I.E. INFORMATION AND COMMUNICATION TECHNOLOGIES AIMING AT THE REDUCTION OF THEIR OWN ENERGY USE
    • Y02D30/00Reducing energy consumption in communication networks
    • Y02D30/70Reducing energy consumption in communication networks in wireless communication networks

Landscapes

  • User Interface Of Digital Computer (AREA)

Abstract

本申请公开了一种智能穿戴设备的语音采集方法,应用于智能穿戴设备技术领域,用于解决智能穿戴设备采集语音数据的便捷性较低的问题,所述语音采集方法包括当接收到骨振动数据时,生成与骨振动数据对应的数字信号;判断数字信号的幅值是否大于预设值;若是,则启动语音接收组件,并利用语音接收组件采集语音数据。本申请能够在不主动触碰智能穿戴设备的前提下启动语音接收组件,提高语音数据采集流程的便捷性。本申请还公开了一种智能穿戴设备的语音采集装置、一种计算机可读存储介质及一种智能穿戴设备,具有以上有益效果。

Description

一种智能穿戴设备的语音采集方法、装置及相关组件
技术领域
本申请涉及智能穿戴设备技术领域,特别涉及一种智能穿戴设备的语音采集方法、装置、一种计算机可读存储介质及一种智能穿戴设备。
背景技术
智能穿戴设备为应用穿戴式技术对日常穿戴进行智能化设计、开发出可以穿戴的设备的总称,如手表、手环、眼镜、服饰等。随着技术的进步以及用户需求的变迁,可穿戴式智能设备的形态与应用热点也在不断变化,无线蓝牙耳机已经成为当前较为热门的智能穿戴设备研发方向。
无线蓝牙耳机大多通过touch或者双击等物理反应进行麦克风的控制,然后进行语音识别,但是上述操作会导致佩戴者在使用过程中包含不必要的动作,当佩戴者不方便触碰无线蓝牙耳机时无法实现蓝牙的耳机的控制。
因此,如何在不主动触碰智能穿戴设备的前提下启动语音接收组件,提高语音数据采集流程的便捷性是本领域技术人员目前需要解决的技术问题。
发明内容
本申请的目的是提供一种智能穿戴设备的语音采集方法、装置、一种计算机可读存储介质及一种智能穿戴设备,能够在不主动触碰智能穿戴设备的前提下启动语音接收组件,提高语音数据采集流程的便捷性。
为解决上述技术问题,本申请提供一种智能穿戴设备的语音采集方法,该语音采集方法包括:
当接收到骨振动数据时,生成与骨振动数据对应的数字信号;
判断数字信号的幅值是否大于预设值;
若是,则启动语音接收组件,并利用语音接收组件采集语音数据。
可选的,在判断数字信号的幅值是否大于预设值之前,还包括:
获取当前环境的噪声信息,并根据噪声信息确定预设值;其中,噪声信息的振动幅值与预设值正相关。
可选的,还包括:
获取智能穿戴设备的剩余电量,并判断剩余电量是否小于预设电量;
若是,则根据剩余电量调整预设值;其中,智能穿戴设备的剩余电量与预设值负相关。
可选的,在利用语音接收组件采集语音数据之后,还包括:
当当前的骨振动数据对应的数字信号幅值小于预设值时,记录当前的骨振动数据对应的数字信号幅值持续小于或等于预设值的持续时长;
判断持续时长是否大于预设时长;
若是,则关闭语音接收组件。
可选的,还包括:
当启动语音接收组件时,控制音频播放组件播放第一提示音;
当关闭语音接收组件时,控制音频播放组件播放第二提示音。
可选的,在利用语音接收组件采集语音数据之后,还包括:
将语音数据发送至语音识别模块,以便语音识别模块对语音数据执行语音识别操作。
可选的,在启动语音接收组件时,还包括:
记录目标时间段内的骨振动数据;其中,目标时间段为语音接收组件的启动时刻至关闭时刻对应的时间段;
将目标时间段内的骨振动数据与语音数据发送至语音识别模块,以便语音识别模块根据目标时间段内的骨振动数据与语音数据执行语音识别操作。
可选的,还包括:
当接收到语音识别模块发送的识别失败信息时,控制音频播放组件播放语音数据,以便佩戴者核对语音数据。
可选的,在将目标时间段内的骨振动数据与语音数据发送至语音识别模块时,还包括:
计算语音接收组件的启动时刻与语音数据的起始时刻的延迟时长;
将延迟时长发送至语音识别模块,以便语音识别模块在执行语音识别操作之前对目标时间段内的骨振动数据执行截取操作得到与语音数据具有相同起始时刻的骨振动数据。
本申请还提供了一种智能穿戴设备的语音采集装置,该语音采集装置包括:
模数转换模块,用于当接收到骨振动数据时,生成与骨振动数据对应的数字信号;
幅值判断模块,用于判断数字信号的幅值是否大于预设值;
语音采集模块,用于当数字信号的幅值大于预设值时,启动语音接收组件,并利用语音接收组件采集语音数据。
本申请还提供了一种计算机可读存储介质,其上存储有计算机程序,计算机程序执行时实现上述智能穿戴设备的语音采集方法执行的步骤。
本申请还提供了一种智能穿戴设备,包括存储器和处理器,存储器中存储有计算机程序,处理器调用存储器中的计算机程序时实现上述智能穿戴设备的语音采集方法执行的步骤。
本申请提供了一种智能穿戴设备的语音采集方法,包括当接收到骨振动数据时,生成与骨振动数据对应的数字信号;判断数字信号的幅值是否大于预设值;若是,则启动语音接收组件,并利用语音接收组件采集语音数据。
本申请在接收骨振动数据时,生成骨振动数据对应的数字信号,通过判断数字信号的幅值大于预设值来判断骨振动数据是否符合预设标准。由于佩戴者在说话时一定会伴随有骨的振动,因此可以将骨振动信号作为判断佩戴者是否在说话的参考条件。由于佩戴者所处环境的噪声同样会使佩戴者的骨骼存在一定的振动,本申请通过设置预设值使得只有在接收到骨振动数据且骨振动数据对应的数字信号的幅值大于预设值时才启动语音接收组件,实现利用语音接收组件采集语音数据的目的。在本申请的语音数据采集过程中,无需佩戴者用手触碰设备,只要佩戴者说话且说话时的骨振动数据符合相关标准会即可启动语音接收组件。因此,本申请可以在不主动触碰智能穿戴设备的前提下启动语音接收组件,提高语音数据采集流程的便捷性。本申请同时还提供了一种智能穿戴设备的语音采集装置、一种计算机可读存储介质和一种智能穿戴设备,具有上述有益效果,在此不再赘述。
附图说明
为了更清楚地说明本申请实施例,下面将对实施例中所需要使用的附图做简单的介绍,显而易见地,下面描述中的附图仅仅是本申请的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1为本申请实施例所提供的一种智能穿戴设备的语音采集方法的流程图;
图2为本申请实施例所提供的一种调整预设值的方法的流程图;
图3为本申请实施例所提供的一种语音识别方法的流程图;
图4为本申请实施例所提供的一种智能穿戴设备的语音采集装置的结构示意图。
具体实施方式
为使本申请实施例的目的、技术方案和优点更加清楚,下面将结合本申请实施例中的附图,对本申请实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本申请一部分实施例,而不是全部的实施例。基于本申请中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本申请保护的范围。
当前的智能穿戴设备都具有语音采集功能,智能穿戴设备通过采集佩戴者的语音数据实现通话、语音识别、声纹解锁等多种功能。当前的智能穿戴设备往往需要佩戴者触碰或双击智能穿戴设备才可以启动语音接收组件,但是上述方法需要佩戴者接触智能穿戴组件,当佩戴者不方便接触智能穿戴设备时则无法实现语音采集。现有技术中还存在智能穿戴设备一直保持语音接收组件开启状态的语音采集方案,但是一直开启语音接收组件对功耗的要求很高,会让智能穿戴设备在短时间内消耗掉全部电量。因此,这种方式尽管一直保持语音接收组件开启能够不接触智能穿戴设备即可实现语音采集,但是将会导致设备续航能力严重不足。基于上述现有技术在智能穿戴设备采集语音数据过程中的种种不足,本文通过以下几个实施例提供新的智能穿戴设备的语音采集方法,以达到提高语音数据采集流程的便捷性的目的。
下面请参见图1,图1为本申请实施例所提供的一种智能穿戴设备的语音采集方法的流程图。
具体步骤可以包括:
S101:当接收到骨振动数据时,生成与骨振动数据对应的数字信号;
其中,本实施例的执行主体可以为智能穿戴设备的处理芯片,此处不限定智能穿戴设备的种类,智能穿戴设备可以为智能眼镜、头戴显示器、无线蓝牙耳机等。
智能穿戴设备是应用穿戴式技术对日常穿戴进行智能化设计、开发出可以穿戴的设备的总称,因此智能穿戴设备可以与佩戴者直接接触,智能穿戴设备可以通过各种传感器采集佩戴者的生理信息(如心率信息、体温信息、骨振信息等)或智能穿戴设备所处环境的环境信息(如噪声信息、温湿度信息等)。
本步骤中所提到的骨振动数据可以为骨导传感器所采集的数据,因此在接收骨振动数据之前,默认可以存在采集骨振动数据的操作,也就是说存在利用骨导传感器(bonesensor)采集骨振动数据的过程。本实施例提到的智能穿戴设备可以为包括骨导传感器的智能穿戴设备。
需要说明的是,本实施例提到的骨振动数据为佩戴者佩戴智能穿戴设备的部位的骨振动数据,此处不限定骨振动数据来源于佩戴者的哪个身体部位。作为可行的实施方案,由于骨振动数据为判断是否启动语音接收组件的参考数据,因此骨振动数据可以是佩戴者说话时产生骨振动较为明显的身体部位的数据,如靠近头骨或上下颌骨等位置。
可以理解的是,导致智能穿戴设备佩戴者的骨骼产生振动的因素可以分为内在因素和外在因素,内在因素是指佩戴者自身某些生理活动引起骨骼发生振动的因素,如:打喷嚏、咳嗽、说话等;外在因素是指佩戴者所处环境中使骨骼发生振动的因素,如:外放音响、汽车引擎的轰鸣声等。在S101中并不限定产生骨振动数据的本源,只要能使智能穿戴设备的佩戴处的骨骼振动即可。
在接收到骨振动数据之后,可以通过ADC模数转换的方式生成骨振动信号对应的数字信号,以便进行后续的分析来判断骨振动数据是否符合开启语音接收组件的相关条件。具体的,在本实施例所提到的智能穿戴设备中可以存在骨导传感器采集骨振动数据并将采集的骨振动数据发送至处理芯片的操作,再由处理芯片执行S101、S102和S103中的相关操作。此处不限定骨导传感器对于骨振动数据的采集方式,骨导传感器可以按照预设周期阶段性采集骨振动数据,也可以持续性采集骨振动数据。当然,为了实现语音采集的实时性,骨导传感器可以实时采集骨振动数据并将实时采集的骨振动数据发送给处理芯片。
S102:判断数字信号的幅值是否大于预设值;若是,则进入S103;若否,则结束流程;
其中,本步骤的目的在于判断骨振动信号对应的数字信号是否符合预设条件,如果符合预设条件则可以进行S103中所描述的启动语音接收组件并采集语音数据的操作,如果不符合预设条件则可以结束本实施例所描述的处理流程。作为一种可行的实施方式,当本步骤判断数字信号的幅值不大于预设值时,可以在结束本实施例的流程后重新通过骨导传感器采集新的骨振动数据进行下一次判断。
可以理解的是,当智能穿戴设备的佩戴者说话时,骨导传感器可以采集到骨振动数据,当环境中的噪声引起的佩戴者骨骼振动时,骨导传感器同样可以采集到骨振动数据。但是,在相同环境内佩戴者说话和不说话时采集到的骨振动数据是不同的,具体的,在相同环境下佩戴者不说话时产生的骨振动信号仅为环境噪音作用的结果,佩戴者说话时产生的骨振动信号为佩戴者生理振动加上环境噪音作用的叠加结果。因此,当佩戴者说话时产生的骨振动数据对应的数字信号幅值大于仅有环境噪音产生的骨振动数据对应的数据信号幅值。本步骤所提到的预设值为用于区分佩戴者说话时产生的骨振动数据和仅有环境噪声时产生的骨振动数据的幅值,因此预设值可以根据智能穿戴设备的具体使用环境灵活设置,此处不对预设值的具体数值进行限定。当数字信号的幅值大于预设值时,判定佩戴者当前时刻正在说话且可以启动语音接收组件来采集语音数据。当数据信号的幅值小于或等于该预设值时,可以判定佩戴者当前时刻并没有说话,无需开启语音接收组件。
在本实施例中不限定该预设值的具体数值,在S102之前可以存在设置或调整预设值的操作,只要本步骤中的预设值为可以区分智能穿戴设备佩戴者说话时的骨振动数据和佩戴者未说话时的骨振动数据的值即可。进一步的,预设值相当于判断佩戴者是否说话的参考标准,预设值越大意味着该参考判断标准越严苛,本实施例还可以通过调整预设值的大小调整判断佩戴者是否说话的严苛程度。关于设置和调整该预设值的具体流程将在后面的实施例进行介绍。
需要说明的是,本实施例默认智能穿戴设备的语音接收组件不是以常开的方式等待语音信号的来临,在S103之前语音接收组件一直处于关闭状态,只有满足S102中的判断条件的情况下才启动语音接收组件,这样可以有效的节约电能,提升智能穿戴设备的续航能力。
S103:启动语音接收组件,并利用语音接收组件采集语音数据。
其中,本步骤建立在S102已经判断骨振动数据对应的数字信号的幅值大于预设值的基础上,首先启动在本步骤之前一直处于关闭状态的语音接收组件。在本实施例中默认语音接收组件与智能穿戴设备的处理芯片存在信号上的交互,例如:处理芯片在判断数字信号的幅值大于预设值时产生中断以便启动语音接收组件。在本实施例中不限定语音接收组件的具体种类,只要是能够接收处理芯片的启动指令后采集语音数据的装置都可以视为本实施例所提到的语音接收组件。
可以理解的是,在S102与S103之间可以存在处理芯片生成启动信号并将启动信号发送至语音接收组件的操作。在启动语音接收组件后,语音接收组件可以采集一定时间内的语音数据,在采集语音数据结束后还可以存在处理芯片生成关闭信号并将关闭信号发送至语音接收组件的操作,以便及时关闭语音接收组件,减少不必要的电能消耗。
通过实际应用中的例子说明S101、S102和S103的处理过程:首先骨导传感器感受到骨导振动,通过ADC转化成数字信号,将该数字信号输送给DA14195芯片(即智能穿戴设备的处理芯片)。当DA14195芯片判断数字信息的幅值大于预设值时,DA14195芯片与mic(即语音接收组件)连接的引脚由低电平转化成高电平,产生中断输入给mic,mic接收到中断后上电开始采集语音数据。
本实施例在接收骨振动数据时,生成骨振动数据对应的数字信号,通过判断数字信号的幅值大于预设值来判断骨振动数据是否符合预设标准。由于佩戴者在说话时一定会伴随有骨的振动,因此可以将骨振动信号作为判断佩戴者是否在说话的参考条件。由于佩戴者所处环境的噪声同样会使佩戴者的骨骼存在一定的振动,本实施例通过设置预设值使得只有在接收到骨振动数据且骨振动数据对应的数字信号的幅值大于预设值时才启动语音接收组件,实现利用语音接收组件采集语音数据的目的。在本实施例的语音数据采集过程中,无需佩戴者用手触碰设备,只要佩戴者说话且说话时的骨振动数据符合相关标准会即可启动语音接收组件。因此,本实施例可以在不主动触碰智能穿戴设备的前提下启动语音接收组件,提高语音数据采集流程的便捷性。
作为对于图1对应的实施例的进一步的补充,可以在S102之前存在设置预设值的操作:获取当前环境的噪声信息,并根据噪声信息确定预设值;其中,噪声信息的振动幅值与预设值正相关。
为了提高判断佩戴者是否正在说话的准确率,需要对佩戴者说话引起的骨振动和环境噪声引起的骨振动进行区分,若想进行有效的区分则需要将预设值的设置为合适的数值。上述设置预设值的操作给出了准确的设置预设值的方案:即先获取佩戴者当前所处环境的噪声信息,根据环境噪声信息的强弱确定预设值。在设置过程中默认存在噪声信息的振动幅值与预设值的对应关系,根据该对应关系可以完成预设值的设置操作,以使当前环境的噪声信息的振动幅值与预设值正相关。
当然,可以预先将环境噪声的振动幅值的最大值与最小值之间划分为多个幅值区间,每一幅值区间对应一个预设值且幅值区间的区间中值越大其对应的预设值也越大。可以在S102之前确定当前环境的噪声信息振动幅值对应的幅值区间,根据该幅值区间确定对应的预设值。
通过上述预设值的设置操作,可以达到以下效果:当佩戴者处于安静环境中时,预设值相对较小,佩戴者小声说话即可启动语音接收组件完成语音数据的采集;当佩戴者处于嘈杂环境中时,预设值相对较大,佩戴者需要大声说话才可以启动语音接收组件完成语音数据的采集。进一步的,佩戴者说话声音越大引起的骨振动越明显,若当前环境相对安静,佩戴者小声说话即可被语音接收组件采集到,若当前环境相对嘈杂,佩戴者需要大声说话才能被语音接收组件采集到。因此,根据当前环境的噪声信息的嘈杂程度设置预设值,不但可以有效区分佩戴者说话引起的骨振动和环境噪声引起的骨振动,还有利于根据语音接收组件采集的语音数据确定佩戴者的说话内容。
具体的,当前环境的噪音信息可以通过环境噪音学习流程确定,具体过程如下:首先设置较小的预设值,当环境噪声的幅值大于该预设值时启动语音接收组件,若接收到的语音数据中不存在有效的语音信息时,则可以判定当前接收到的骨振动信号由环境噪音引起,此时可以根据当前环境噪音信息设置为预设值,以使当环境噪声的幅值小于或等于新的预设值。当然,还可以存在主动设定预设值的操作,即:当接收到预设值重新设定指令时,获取当前环境的噪声信息,根据噪声信息与预设值的对应关系设置噪声信息对应的预设值。
上述对于图1对应的实施例的进一步补充是从判断准确性的角度对图1的智能穿戴设备的语音采集方法的改进,下面请参见图2,图2为本申请实施例所提供的一种调整预设值的方法的流程图;图2对应的实施例从智能穿戴设备续航能力的角度提出了预设值的调整方案。本实施例是对图1对应的实施例中提到的预设值的调整方法,可以将本实施例与图1对应的实施例相结合得到更为优选的实施方式,具体步骤可以包括:
S201:获取智能穿戴设备的剩余电量;
S202:判断剩余电量是否小于预设电量;若是,则进入S203;若否,则结束流程;
S203:根据剩余电量调整预设值;其中,智能穿戴设备的剩余电量与预设值负相关。
一般的,智能穿戴设备都设有电源模块,用于为智能穿戴设备中的各个装置提供电能。本实施例中提到的剩余电量具体指智能穿戴设备的电源模块的当前剩余电量,此处不限定电源模块的种类,电源模块可以为可充电锂电池,也可以为太阳能电池板。
其中,S202中判断剩余电量是否小于预设电量的意义在于确定智能穿戴设备的电能状态,当剩余电量小于预设电量时说明智能穿戴设备当前处于低电量状态,即智能穿戴设备的当前可用时长小于目标时长。本实施例中不对预设电量的具体取值进行限定,只要当剩余电量小于预设电量时说明智能穿戴设备处于低电量状态即可,作为一种可选的实施方案,预设电量可以为智能穿戴设备最大剩余电量的百分之二十。该预设电量也可以根据实际应用场景灵活调整,如在佩戴者的工作时间设置较高的预设电量,在佩戴者睡眠时间设置较低的预设电量。
需要说明的是,在剩余电量小于预设电量的前提下,剩余电量与调整后的预设值为负相关关系,即剩余电量越低需要启动语音接收组件对应的数字信号幅值越大,剩余电量越高需要启动语音接收组件对应的数字信号幅值越小。通过本实施例的设置能够减少智能穿戴设备剩余电量较低时因环境噪声启动语音接收组件的几率,当剩余电量较低时需要佩戴者以更大的声音才可以启动语音接收组件。因此当剩余电量较低时采用本实施例提供的预设值调整方案能够提高有效语音数据(即佩戴者的语音数据)的采集几率,降低由于环境噪声误启动的几率,可以有效的延长智能穿戴设备的续航时长。
作为对于图1对应的实施例的进一步的补充,在利用语音接收组件采集语音数据之后,还包括以下四种语音接收组件关闭方式:
(1)第一类语音接收组件关闭方式:
步骤1:当当前的骨振动数据对应的数字信号幅值小于预设值时,记录当前的骨振动数据对应的数字信号幅值持续小于或等于预设值的持续时长;
步骤2:判断持续时长是否大于预设时长;若是,则关闭语音接收组件。
正常人说话时两句话之间存在一定的时间间隔(通常为500ms),上述第一种语音接收组件关闭方式提到的预设时长为两句话之间的标准时间间隔,当持续时长大于预设时长时,说明佩戴者已经停止说话,可以关闭语音接收组件。例如,若预设时长为500ms,在第2300ms检测到骨振动数据对应的数字信号幅值小于预设值,则可以判断从第2300ms至第2800ms之间任意时刻的骨振动数据对应的数字信号幅值是否大于预设值,若否则可以关闭语音接收组件。
(2)第二类语音接收组件关闭方式:
步骤1:记录语音数据的时长,并判断语音数据的时长是否大于标准时长;若是,则进入步骤2;若否,则进入步骤1;
步骤2:判断当前的骨振动数据对应的数字信号幅值是否小于标准值;若是,则进入步骤3;若否,则进入步骤2;
步骤3:关闭语音接收组件。
第二类语音接收组件关闭方式对于图1对应的实施例的补充将语音数据的时长和当前骨振动数据对应的数字信号幅值作为参考值,只有在语音数据时长大于标准时长且当前的骨振动数据对应的数字信号幅值小于预设值时才关闭语音接收组件。上述关闭语音接收组件的条件可以有效避免由于佩戴者说话时两个字存在时间间隔或说话内容过长带来的语音数据采集缺失问题。
(3)第三类语音接收组件关闭方式:
在启动语音接收组件之后,处理芯片可以记录语音接收组件的启动时长,当启动时长大于预设时长时生成关闭信号并将关闭信号发送至语音接收组件,以便语音接收组件可以采集预设时长的语音数据。
(4)第四类语音接收组件关闭方式:
在启动语音接收组件之后,处理芯片可以一直检测当前的骨振动信号对应的数字信号幅值是否大于预设值,当检测到当前的骨振动信号对应的数字信号幅值或小于或等于预设值时说明佩戴者已经停止说话,此时处理芯片可以生成关闭信号并将关闭信号发送至语音接收组件,以便语音接收组件可以采集佩戴者处于说话状态时的语音数据。
进一步的,作为对于语音采集过程中的进一步优化,在上述补充的基础上还可以存在以下操作:
操作1:当启动语音接收组件时,控制音频播放组件播放第一提示音;
操作2:当关闭语音接收组件时,控制音频播放组件播放第二提示音。
通过在启动语音接收组件时播放第一提示音,在关闭语音接收组件是播放第二提示音,帮助佩戴者了解语音采集开始和结束的时间点,优化智能穿戴设备与佩戴者之间的交互性,提升佩戴者的用户体验。
作为对于图1对应的实施例的进一步的补充,在利用语音接收组件采集语音数据之后,还包括以下操作:将语音数据发送至语音识别模块,以便语音识别模块对语音数据执行语音识别操作。
此处不限定语音识别模块为智能穿戴设备上的装置还是与智能穿戴设备存在数据交互的终端设备中的装置。当智能穿戴设备包括该语音识别模块时,智能穿戴设备的处理芯片可以通过有线传输的方式将采集的语音数据传输至语音识别模块,由语音识别模块对语音数据进行识别得到识别结果,以便执行识别结果对应的操作。当该语音识别模块为与智能穿戴设备存在数据交互的终端设备中的装置时,智能穿戴设备的处理芯片可以将采集的语音数据通过无线传输的方式传输至包括语音识别模块的终端设备,在终端设备中执行语音识别操作得到识别结果,以便终端设备根据语音识别结果执行对应的操作。具体的,语音识别模块在接收到语音数据后,可以确定语音参考模型库中与该语音数据匹配的关键词并将该关键词作为识别结果。进一步的,本实施例还可以存在关键词与控制命令的对照关系,根据该对照关系生成控制命令以便执行相关操作。
下面请参见图3,图3为本申请实施例所提供的一种语音识别方法的流程图;本实施例是对图1对应的实施例中在启动语音接收组件时执行的处理操作,可以将本实施例与图1对应的实施例相结合得到更为优选的实施方式,具体步骤可以包括:
S301:在启动语音接收组件时记录目标时间段内的骨振动数据;
其中,目标时间段为语音接收组件的启动时刻至关闭时刻对应的时间段;
S302:将目标时间段内的骨振动数据与语音数据发送至语音识别模块,以便语音识别模块根据目标时间段内的骨振动数据与语音数据执行语音识别操作。
上述实施例将目标时间内的骨振动数据和语音数据均作为语音识别过程中的待处理对象发送至语音识别模块。语音识别模块可以根据目标时间段内的骨振动数据和语音数据生成关键词特征信息;还可以确定数据库中与关键词特征信息匹配的标准特征信息对应的关键词,以便执行关键词对应的操作。本实施例中结合骨振动数据和语音数据进行语音识别可以有效地提高语音识别结果的准确性,相对于仅通过语音数据进行语音识别得到的识别结果更为可靠。
作为对于图3对应实施例的进一步优化,可以在将目标时间段内的骨振动数据与语音数据发送至语音识别模块时执行以下步骤:
步骤1、计算语音接收组件的启动时刻与语音数据的起始时刻的延迟时长;
步骤2、将延迟时长发送至语音识别模块,以便语音识别模块在执行语音识别操作之前对目标时间段内的骨振动数据执行截取操作得到与语音数据具有相同起始时刻的骨振动数据。
上述优化是针对语音接收组件采集语音数据存在延迟的问题,因为在处理芯片的判断过程需要一定时间,随后给语音接收组件上电启动也会存在延迟,语音接收组件上电后到能够稳定工作同样存在延迟。因此需要注意延迟时长导致的骨振动数据和语音数据不对齐的问题,例如当佩戴者说“播放音乐”的时候,骨振动数据就是完整拼音为:bo fangyin yue,而语音数据可能为:o fang yin yue,在缓冲数据后,需要将数据进行截取,即需要保证两个数据都是o fang yin yue。
举例说明上述过程因为在处理芯片的DSP中语音检测算法的处理过程需要5.5ms,随后给语音接收组件上电启动存在2.5ms的延迟,语音接收组件上电后到能够稳定工作的延迟为30ms,所以语音接收组件数据要大约延迟骨振动数据38ms。所以在使用过程中,要注意延迟不对齐的问题,例如当佩戴者说播放音乐的时候,骨振动数据就是完整拼音为:bofang yin yue,而语音数据可能就是存在语音数据为:o fang yin yue,在缓冲数据后,需要将数据进行截取,即需要保证两个数据都是o fang yin yue。语音接收组件的波特率为16Kbps,截取公式为
Figure BDA0001914468330000131
len为骨振动数据以开始时刻为起点需要截取的时长。
上述提到的延迟时长为骨振动数据与语音数据起始时刻的差值,将延迟时长发送至语音识别模块,以便语音识别模块根据延迟时长截取骨振动数据,对具有相同起始时刻的骨振动数据和语音数据进行语音识别操作。
作为一种可选的实施方式,在将相关数据发送至语音识别模块进行语音识别操作之后,还可以存在以下操作:当接收到语音识别模块发送的识别失败信息时,控制音频播放组件播放语音数据,以便佩戴者核对语音数据。
此处默认当语音识别模块无法识别接收到的数据或得到的识别结果有误时,语音识别模块向智能穿戴设备的处理芯片返回识别失败信息。当处理芯片接收到识别失败信息后控制音频播放组件播放之前记录的语音数据,以便佩戴者收听刚才的说话内容,确定语音识别失败的原因,让佩戴者调整自己的说话内容以便再次进行语音采集和语音识别的过程。
进一步的,上述任意一种实施例描述的智能穿戴设备的语音接收组件可以为具有降噪功能的语音接收组件,可以对接收到的语音数据执行回音消除和/或降噪消减处理。
例如,语音接收组件可以内置2个麦克风,通过alango双mic降噪算法进行降噪处理,一个麦克风稳定保持清晰通话,另一个麦克风物理主动消除噪音,通过收集外界的声音进行处理后,发出与噪音相反的声波,利用抵消原理消除噪音,有利于提高后面语音识别的识别率。
请参见图4,图4为本申请实施例所提供的一种智能穿戴设备的语音采集装置的结构示意图;
该装置可以包括:
模数转换模块100,用于当接收到骨振动数据时,生成与骨振动数据对应的数字信号;
幅值判断模块200,用于判断数字信号的幅值是否大于预设值;
语音采集模块300,用于当数字信号的幅值大于预设值时,启动语音接收组件,并利用语音接收组件采集语音数据。
本实施例在接收骨振动数据时,生成骨振动数据对应的数字信号,通过判断数字信号的幅值大于预设值来判断骨振动数据是否符合预设标准。由于佩戴者在说话时一定会伴随有骨的振动,因此可以将骨振动信号作为判断佩戴者是否在说话的参考条件。由于佩戴者所处环境的噪声同样会使佩戴者的骨骼存在一定的振动,本实施例通过设置预设值使得只有在接收到骨振动数据且骨振动数据对应的数字信号的幅值大于预设值时才启动语音接收组件,实现利用语音接收组件采集语音数据的目的。在本实施例的语音数据采集过程中,无需佩戴者用手触碰设备,只要佩戴者说话且说话时的骨振动数据符合相关标准会即可启动语音接收组件。因此,本实施例可以在不主动触碰智能穿戴设备的前提下启动语音接收组件,提高语音数据采集流程的便捷性。
进一步的,该语音采集装置还包括:
预设值设置模块,用于获取当前环境的噪声信息,并根据噪声信息确定预设值;其中,噪声信息的振动幅值与预设值正相关。
进一步的,该语音采集装置还包括:
预设值调整模块,用于获取智能穿戴设备的剩余电量,并判断剩余电量是否小于预设电量;若是,则根据剩余电量调整预设值;其中,智能穿戴设备的剩余电量与预设值负相关。
进一步的,该语音采集装置还包括:
语音接收组件关闭模块,用于当当前的骨振动数据对应的数字信号幅值小于预设值时,记录当前的骨振动数据对应的数字信号幅值持续小于或等于预设值的持续时长;还用于判断持续时长是否大于预设时长;若是,则关闭语音接收组件。
进一步的,该语音采集装置还包括:
第一提示模块,用于当启动语音接收组件时,控制音频播放组件播放第一提示音;
第二提示模块,用于当关闭语音接收组件时,控制音频播放组件播放第二提示音。
进一步的,该语音采集装置还包括:
第一数据发送模块,用于将语音数据发送至语音识别模块,以便语音识别模块对语音数据执行语音识别操作。
进一步的,该语音采集装置还包括:
骨振动数据记录模块,用于记录目标时间段内的骨振动数据;其中,目标时间段为语音接收组件的启动时刻至关闭时刻对应的时间段;
第二数据发送模块,用于将目标时间段内的骨振动数据与语音数据发送至语音识别模块,以便语音识别模块根据目标时间段内的骨振动数据与语音数据执行语音识别操作。
进一步的,该语音采集装置还包括:
核对模块,用于当接收到语音识别模块发送的识别失败信息时,控制音频播放组件播放语音数据,以便佩戴者核对语音数据。
进一步的,该语音采集装置还包括:
延时修正模块,用于计算语音接收组件的启动时刻与语音数据的起始时刻的延迟时长;还用于将延迟时长发送至语音识别模块,以便语音识别模块在执行语音识别操作之前对目标时间段内的骨振动数据执行截取操作得到与语音数据具有相同起始时刻的骨振动数据。
由于***部分的实施例与方法部分的实施例相互对应,因此***部分的实施例请参见方法部分的实施例的描述,这里暂不赘述。
本申请还提供了一种计算机可读存储介质,其上存有计算机程序,该计算机程序被执行时可以实现上述实施例所提供的步骤。该存储介质可以包括:U盘、移动硬盘、只读存储器(Read-Only Memory,ROM)、随机存取存储器(Random Access Memory,RAM)、磁碟或者光盘等各种可以存储程序代码的介质。
本申请还提供了一种智能穿戴设备,可以包括骨导传感器、语音接收组件、存储器和处理器,骨导传感器用于接收骨振动数据;语音接收组件用于采集语音数据;存储器中存有计算机程序,处理器调用存储器中的计算机程序时,可以实现上述实施例所提供的步骤。当然智能穿戴设备还可以包括各种接口、电源、音频播放组件、蓝牙模块、语音识别模块等组件。
说明书中各个实施例采用递进的方式描述,每个实施例重点说明的都是与其他实施例的不同之处,各个实施例之间相同相似部分互相参见即可。对于实施例公开的***而言,由于其与实施例公开的方法相对应,所以描述的比较简单,相关之处参见方法部分说明即可。应当指出,对于本技术领域的普通技术人员来说,在不脱离本申请原理的前提下,还可以对本申请进行若干改进和修饰,这些改进和修饰也落入本申请权利要求的保护范围内。
还需要说明的是,在本说明书中,诸如第一和第二等之类的关系术语仅仅用来将一个实体或者操作与另一个实体或操作区分开来,而不一定要求或者暗示这些实体或操作之间存在任何这种实际的关系或者顺序。而且,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、物品或者设备不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、物品或者设备所固有的要素。在没有更多限制的状况下,由语句“包括一个……”限定的要素,并不排除在包括所述要素的过程、方法、物品或者设备中还存在另外的相同要素。

Claims (10)

1.一种智能穿戴设备的语音采集方法,其特征在于,包括:
当接收到骨振动数据时,生成与所述骨振动数据对应的数字信号;
判断所述数字信号的幅值是否大于预设值;
若是,则启动语音接收组件,并利用所述语音接收组件采集语音数据;
其中,在启动语音接收组件时,还包括:
记录目标时间段内的骨振动数据;其中,所述目标时间段为所述语音接收组件的启动时刻至关闭时刻对应的时间段;
将所述目标时间段内的骨振动数据与所述语音数据发送至语音识别模块,以便所述语音识别模块根据所述目标时间段内的骨振动数据与所述语音数据执行语音识别操作;
其中,在将所述目标时间段内的骨振动数据与所述语音数据发送至语音识别模块时,还包括:
计算所述语音接收组件的启动时刻与所述语音数据的起始时刻的延迟时长;
将所述延迟时长发送至所述语音识别模块,以便所述语音识别模块在执行所述语音识别操作之前对所述目标时间段内的骨振动数据执行截取操作得到与所述语音数据具有相同起始时刻的骨振动数据。
2.根据权利要求1所述语音采集方法,其特征在于,在判断所述数字信号的幅值是否大于预设值之前,还包括:
获取当前环境的噪声信息,并根据所述噪声信息确定所述预设值;其中,所述噪声信息的振动幅值与所述预设值正相关。
3.根据权利要求1所述语音采集方法,其特征在于,还包括:
获取智能穿戴设备的剩余电量,并判断所述剩余电量是否小于预设电量;
若是,则根据所述剩余电量调整所述预设值;其中,所述智能穿戴设备的剩余电量与所述预设值负相关。
4.根据权利要求1所述语音采集方法,其特征在于,在利用所述语音接收组件采集语音数据之后,还包括:
当当前的骨振动数据对应的数字信号幅值小于所述预设值时,记录当前的骨振动数据对应的数字信号幅值持续小于或等于所述预设值的持续时长;
判断所述持续时长是否大于预设时长;
若是,则关闭所述语音接收组件。
5.根据权利要求1至4任一项所述语音采集方法,其特征在于,还包括:
当启动所述语音接收组件时,控制音频播放组件播放第一提示音;
当关闭所述语音接收组件时,控制所述音频播放组件播放第二提示音。
6.根据权利要求1所述语音采集方法,其特征在于,在利用所述语音接收组件采集语音数据之后,还包括:
将所述语音数据发送至语音识别模块,以便所述语音识别模块对所述语音数据执行语音识别操作。
7.根据权利要求6所述语音采集方法,其特征在于,还包括:
当接收到所述语音识别模块发送的识别失败信息时,控制音频播放组件播放所述语音数据,以便佩戴者核对所述语音数据。
8.一种智能穿戴设备的语音采集装置,其特征在于,包括:
模数转换模块,用于当接收到骨振动数据时,生成与所述骨振动数据对应的数字信号;
幅值判断模块,用于判断所述数字信号的幅值是否大于预设值;
语音采集模块,用于当所述数字信号的幅值大于所述预设值时,启动语音接收组件,并利用所述语音接收组件采集语音数据;
其中,所述语音采集装置还包括:
骨振动数据记录模块,用于记录目标时间段内的骨振动数据;其中,目标时间段为语音接收组件的启动时刻至关闭时刻对应的时间段;
第二数据发送模块,用于将目标时间段内的骨振动数据与语音数据发送至语音识别模块,以便语音识别模块根据目标时间段内的骨振动数据与语音数据执行语音识别操作;
延时修正模块,用于在将所述目标时间段内的骨振动数据与所述语音数据发送至语音识别模块时,计算语音接收组件的启动时刻与语音数据的起始时刻的延迟时长;还用于将延迟时长发送至语音识别模块,以便语音识别模块在执行语音识别操作之前对目标时间段内的骨振动数据执行截取操作得到与语音数据具有相同起始时刻的骨振动数据。
9.一种智能穿戴设备,其特征在于,包括:
骨导传感器,用于接收骨振动数据;
语音接收组件,用于采集语音数据;
存储器,用于存储计算机程序;
处理器,用于执行所述计算机程序时实现如权利要求1至7任一项所述智能穿戴设备的语音采集方法的步骤。
10.一种计算机可读存储介质,其特征在于,所述计算机可读存储介质上存储有计算机程序,所述计算机程序被处理器执行时实现如权利要求1至7任一项所述智能穿戴设备的语音采集方法的步骤。
CN201811565715.6A 2018-12-20 2018-12-20 一种智能穿戴设备的语音采集方法、装置及相关组件 Active CN109412544B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201811565715.6A CN109412544B (zh) 2018-12-20 2018-12-20 一种智能穿戴设备的语音采集方法、装置及相关组件

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201811565715.6A CN109412544B (zh) 2018-12-20 2018-12-20 一种智能穿戴设备的语音采集方法、装置及相关组件

Publications (2)

Publication Number Publication Date
CN109412544A CN109412544A (zh) 2019-03-01
CN109412544B true CN109412544B (zh) 2022-07-08

Family

ID=65460328

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201811565715.6A Active CN109412544B (zh) 2018-12-20 2018-12-20 一种智能穿戴设备的语音采集方法、装置及相关组件

Country Status (1)

Country Link
CN (1) CN109412544B (zh)

Families Citing this family (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110896511A (zh) * 2019-12-10 2020-03-20 深圳市沃特沃德股份有限公司 一种耳机控制方法、装置、存储介质及计算机设备
CN111028838A (zh) * 2019-12-17 2020-04-17 苏州思必驰信息科技有限公司 一种语音唤醒方法、设备及计算机可读存储介质
CN113377225B (zh) * 2020-03-10 2024-04-26 北京钛方科技有限责任公司 一种触发动作识别方法、识别***和存储介质
CN113220073B (zh) * 2021-05-06 2023-07-28 恒玄科技(上海)股份有限公司 一种控制方法、装置以及可穿戴设备
CN115641882B (zh) * 2022-10-27 2023-05-12 深圳市移文科技有限公司 一种穿戴设备的录音智能启动方法、装置及穿戴设备

Family Cites Families (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP3674990B2 (ja) * 1995-08-21 2005-07-27 セイコーエプソン株式会社 音声認識対話装置および音声認識対話処理方法
US20110110534A1 (en) * 2009-11-12 2011-05-12 Apple Inc. Adjustable voice output based on device status
US20150106089A1 (en) * 2010-12-30 2015-04-16 Evan H. Parker Name Based Initiation of Speech Recognition
US9135915B1 (en) * 2012-07-26 2015-09-15 Google Inc. Augmenting speech segmentation and recognition using head-mounted vibration and/or motion sensors
CN103888587B (zh) * 2012-12-19 2016-01-20 ***通信集团公司 一种唤醒终端的方法、dsp芯片及终端
EP2801974A3 (en) * 2013-05-09 2015-02-18 DSP Group Ltd. Low power activation of a voice activated device
CN106686494A (zh) * 2016-12-27 2017-05-17 广东小天才科技有限公司 一种可穿戴设备的语音输入控制方法及可穿戴设备
CN108882087A (zh) * 2018-06-12 2018-11-23 歌尔科技有限公司 一种智能语音检测方法、无线耳机、tws耳机及终端
CN108810280B (zh) * 2018-06-19 2021-01-08 Oppo广东移动通信有限公司 语音采集频率的处理方法、装置、存储介质及电子设备

Also Published As

Publication number Publication date
CN109412544A (zh) 2019-03-01

Similar Documents

Publication Publication Date Title
CN109412544B (zh) 一种智能穿戴设备的语音采集方法、装置及相关组件
CN108962240B (zh) 一种基于耳机的语音控制方法及***
CN106714023B (zh) 一种基于骨传导耳机的语音唤醒方法、***及骨传导耳机
EP3547659B1 (en) Method for processing audio signal and related products
CN106910500B (zh) 对带麦克风阵列的设备进行语音控制的方法及设备
US11830479B2 (en) Voice recognition method and apparatus, and air conditioner
EP3547711B1 (en) Method for input operation control and related products
CN108710615B (zh) 翻译方法及相关设备
WO2020228270A1 (zh) 语音处理方法、装置、计算机设备及存储介质
CN107564523B (zh) 一种耳机接听方法、装置以及耳机
WO2021114953A1 (zh) 语音信号的采集方法、装置、电子设备以及存储介质
CN108681440A (zh) 一种智能设备音量控制方法及***
WO2020244257A1 (zh) 语音唤醒方法、***、电子设备及计算机可读存储介质
CN110070863A (zh) 一种语音控制方法及装置
CN106782519A (zh) 一种机器人
CN110364156A (zh) 语音交互方法、***、终端及可读存储介质
US11348584B2 (en) Method for voice recognition via earphone and earphone
CN110968353A (zh) 中央处理器的唤醒方法、装置、语音处理器以及用户设备
CN110234044A (zh) 一种语音唤醒方法、语音唤醒装置及耳机
CN112399297A (zh) 一种耳机及其语音唤醒方法、计算机存储介质
CN110992953A (zh) 一种语音数据处理方法、装置、***及存储介质
GB2526980A (en) Sensor input recognition
CN208538474U (zh) 语音识别***
CN215647269U (zh) 穿戴式装置
US20230376118A1 (en) Earphone, earphone control method and earphone control device

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant