CN110278205B

CN110278205B - 蓝牙音箱底座及其控制方法和***

Info

Publication number: CN110278205B
Application number: CN201910532552.XA
Authority: CN
Inventors: 朱旭杰; 李憬然; 田超; 王守宽; 王丽丽; 刘伟
Original assignee: Beijing Baidu Netcom Science and Technology Co Ltd
Current assignee: Beijing Baidu Netcom Science and Technology Co Ltd
Priority date: 2019-06-19
Filing date: 2019-06-19
Publication date: 2021-05-28
Anticipated expiration: 2039-06-19
Also published as: US20210166697A1; US20200402513A1; US11501779B2; CN110278205A; US10950238B2

Abstract

本发明提出一种蓝牙音箱底座及其控制方法和***，其中，方法包括：当蓝牙音箱底座上放置有蓝牙音箱时，采集语音数据并判断语音数据中是否包含唤醒词；若包含唤醒词，则控制蓝牙音箱底座进入唤醒识别状态，并按照预先协商的压缩倍数对语音数据进行压缩；将压缩后的语音信号通过预先建立的第一协议发送至移动终端，以使得移动终，通过预先建立的第二协议将音频数据发送至蓝牙音箱播放。由此，采用蓝牙双向高速传输协议来实现移动终端与蓝牙音箱及其底座之间的语音数据双向高速传输功能，在不改变蓝牙音箱的构造的基础上，可以大幅提升蓝牙音箱的远场语音交互体验。

Description

蓝牙音箱底座及其控制方法和***

技术领域

本发明涉及通信技术领域，尤其涉及一种蓝牙音箱底座及其控制方法和***。

背景技术

相关技术中，现有的蓝牙音箱通常采用标准蓝牙4.2和BLE(Bluetooh LowEnergy，蓝牙低能耗)技术进行双向通信。在普通播放模式下，大多数采用A2DP(AdvancedAudio Distribution Profile，蓝牙音频传输模型协定)协议进行音频播放，此时上行只能用BLE传输数据。为保证蓝牙播放稳定性，BLE传输速率通常会被限制到16kbps(其中，kbps又称比特率，指的是数字信号的传输速率)。在通话状态下，大多数采用HFP(Hands-freeProfile，蓝牙免提应用协议)协议进行通信，此时上下行传输速率均只有16kbps。

但是，目前存在的问题是：由于上下行总平均数据传输带宽是固定的，所以如果保证下行音频播放质量(即提高下行传输速率)，则会导致语音交互从唤醒到识别的延迟变长，一般在2秒以上，影响用户体验；如果保证语音交互从唤醒到识别的响应速度以使得用户无感知(即提高上行传输速率)，则需要大幅降低下行音频播放质量；另外，采用HFP协议实现蓝牙双向传输时，由于HFP协议仅支持通话数据的传输，且上行下行传输速率均只有16kbps，所以也不能满足语音交互的实时性要求，并且会影响下行内容播放质量。

发明内容

本发明旨在至少在一定程度上解决相关技术中的技术问题之一。

为此，本发明的第一个目的在于提出一种蓝牙音箱底座的控制方法，该方法采用蓝牙双向高速传输协议来实现移动终端与蓝牙音箱及其底座之间的语音数据双向高速传输功能，在不改变蓝牙音箱的构造的基础上，可以大幅提升蓝牙音箱的远场语音交互体验。

本发明的第二个目的在于提出一种蓝牙音箱底座。

本发明的第三个目的在于提出一种蓝牙音箱底座的控制***。

本发明的第四个目的在于提出另一种蓝牙音箱底座。

本发明的第五个目的在于提出一种计算机可读存储介质。

为达到上述目的，本发明第一方面实施例提出的蓝牙音箱底座的控制方法，包括以下步骤：当所述蓝牙音箱底座与对应的蓝牙音箱所处位置满足预设条件时，采集语音数据并判断所述语音数据中是否包含唤醒词；若包含所述唤醒词，则控制所述蓝牙音箱底座进入唤醒识别状态，并按照预先协商的压缩倍数对所述语音数据进行压缩；将压缩后的语音信号通过预先建立的第一协议发送至移动终端，以使得移动终端对接收到的语音数据进行解压缩，并将解压缩后得到的语音数据发送给服务器进行语音识别以得到识别后的音频数据，通过预先建立的第二协议将所述音频数据发送至所述蓝牙音箱播放。

为达到上述目的，本发明第二方面实施例提出的蓝牙音箱底座，包括：声音采集模块、数字信号处理模块、蓝牙芯片和音频输出模块，其中，所述声音采集模块，用于当所述蓝牙音箱底座与对应的蓝牙音箱所处位置满足预设条件时，采集周围环境的声音；所述数字信号处理模块，用于接收所述声音采集模块采集到的声音，并对所述采集到的声音进行信号处理以得到语音数据，并在判断所述语音数据中包含唤醒词后将所述语音数据发送给所述蓝牙芯片；所述蓝牙芯片，用于按照预先协商的压缩倍数对所述语音数据进行压缩，将压缩后的语音信号通过预先建立的第一协议发送至移动终端，以使得移动终端对接收到的语音数据进行解压缩，并将解压缩后得到的语音数据发送给服务器进行语音识别以得到识别后的音频数据，通过预先建立的第二协议将所述音频数据发送至所述蓝牙音箱播放。

为达到上述目的，本发明第三方面实施例提出的蓝牙音箱底座的控制***，包括：蓝牙音箱、蓝牙音箱底座、移动终端和服务器，其中，所述蓝牙音箱底座，用于当所述蓝牙音箱底座上放置有蓝牙音箱时，采集语音数据并判断所述语音数据中是否包含唤醒词，并在所述语音数据中包含唤醒词时，按照预先协商的压缩倍数对所述语音数据进行压缩后通过预先建立的第一协议将压缩后的语音信号发送至移动终端，以使得移动终端对接收到的语音数据进行解压缩，并将解压缩后得到的语音数据发送给服务器进行语音识别以得到识别后的音频数据，通过预先建立的第二协议将所述音频数据发送至所述蓝牙音箱播放；所述移动终端，用于对接收到的语音数据进行解压缩，并将解压缩后得到的语音数据发送给服务器；所述服务器，用于对所述移动终端发送的语音数据进行语音识别，得到识别后的音频数据，并将所述音频数据返回给所述移动终端；所述蓝牙音箱，用于基于所述第二协议连接接收所述移动终端返回的音频数据，并控制所述蓝牙音箱中的音频输出模块播放所述音频数据。

为达到上述目的，本发明第四方面实施例提出的蓝牙音箱底座，包括：存储器、处理器及存储在所述存储器上并可在所述处理器上运行的计算机程序，所述处理器执行所述计算机程序时，实现如实现本发明第一方面实施例所述的蓝牙音箱底座的控制方法。

为达到上述目的，本发明第五方面实施例提出的计算机可读存储介质，其上存储有计算机程序，所述计算机程序被处理器执行时实现本发明第一方面实施例所述的蓝牙音箱底座的控制方法。

本发明实施例的技术方案至少具有如下技术效果：

可通过蓝牙音箱底座和蓝牙音箱分别建立与移动终端的第一协议连接和第二协议连接，并获取通过蓝牙音箱底座采集到的语音数据，并按照预先协商的压缩倍数对采集到的语音数据进行压缩，将压缩后的语音数据通过第一协议连接发送给移动终端，其中，移动终端对接收到的语音数据进行解压缩，并将解压缩后得到的语音数据发送给服务器进行语音识别以得到识别后的音频数据，可基于第二协议连接接收移动终端返回的音频数据，并控制蓝牙音箱中的音频输出模块播放音频数据，从而实现了蓝牙音箱及其底座与移动终端之间的语音识别和交互功能。即通过第一协议连接和第二协议连接来实现蓝牙音箱及其底座与移动终端之间蓝牙语音数据的双向传输，由于第一协议连接是蓝牙底座与移动终端的连接，不影响蓝牙音箱与其他设备之间的语音交互音频信号的传输，并且，通过第一协议连接传输数据时会与终端设备相互协商压缩倍数，通过动态协商压缩数据的方式实现对语音音频数据的压缩，可以使得在当前环境下能够保证最大数据传输量，从而可以大幅提高蓝牙语音数据双向传输率，即实现了蓝牙语音数据的双向高速传输功能，并提高了语音识别率，在保证蓝牙音箱的下行音频播放质量的同时，在不改变蓝牙音箱的构造的基础上，也能够减小语音交互从唤醒到识别的时延，使得用户无感知，提升了用户的使用体验。

本发明附加的方面和优点将在下面的描述中部分给出，部分将从下面的描述中变得明显，或通过本发明的实践了解到。

附图说明

本发明上述的和/或附加的方面和优点从下面结合附图对实施例的描述中将变得明显和容易理解，其中：

图1为本发明实施例所提供的一种蓝牙音箱底座的控制方法的流程示意图；

图2为本发明实施例所提供的一种蓝牙音箱底座的控制方法的应用场景示意图；

图3为本发明实施例的蓝牙芯片中蓝牙协议栈的设计示意图；

图4为本发明实施例的RMP协议模块的具体状态切换的示例图；

图5是根据本发明一个实施例的蓝牙音箱底座的结构示意图；

图6是根据本发明实施例的蓝牙音箱底座的控制***的结构示意图；以及

图7是根据本发明另一个实施例的蓝牙音箱底座的结构示意图。

具体实施方式

下面详细描述本发明的实施例，所述实施例的示例在附图中示出，其中自始至终相同或类似的标号表示相同或类似的元件或具有相同或类似功能的元件。下面通过参考附图描述的实施例是示例性的，旨在用于解释本发明，而不能理解为对本发明的限制。

下面参考附图描述本发明实施例的蓝牙音箱底座及其控制方法和***。

其中，在本发明的实施例中，蓝牙音箱底座是承载蓝牙音箱的硬件设备，可以是任意与蓝牙音箱配套使用的设备，比如可以是具有本发明蓝牙音箱底座功能的承载底座，也可以是具有本发明蓝牙音箱底座功能的伺蓝牙音箱充电器等。使用蓝牙音箱底座，可以在不改变原有的蓝牙音箱结构的基础上，扩展蓝牙音箱的远场交互体验。并且，蓝牙音箱底座只有数据处理模块和蓝牙芯片，这种组合成本较低，实现较低成本增加蓝牙音箱的功能。

图1为本发明实施例所提供的一种蓝牙音箱底座的控制方法的流程示意图。需要说明的是，本发明实施例的蓝牙音箱底座的控制方法可应用于蓝牙音箱底座上。

如图1所示，该蓝牙音箱底座的控制方法包括：

步骤101，当蓝牙音箱底座与对应的蓝牙音箱所处位置满足预设条件时，采集语音数据并判断语音数据中是否包含唤醒词。

步骤102，若包含唤醒词，则控制蓝牙音箱底座进入唤醒识别状态，并按照预先协商的压缩倍数对语音数据进行压缩。

应当理解的是，本发明实施例中的蓝牙音箱底座用于扩展蓝牙音箱的功能，但是也依赖于蓝牙音箱的原有的播放功能，因此，为了实现二者功能的相互配合，检测蓝牙音箱底座与对应的蓝牙音箱的位置是否满足预设条件，以判断二者是否属于可以配合工作，避免蓝牙音箱底座或者蓝牙音箱单独工作，导致资源的浪费。

其中，一方面，为了保证蓝牙音箱底座和蓝牙音箱满足同一个区域的场景需要(比如音乐播放场景，用户输入的请求语音信号所在位置与接收到的音乐播放位置必处于一个区域范围内)，预设条件可以对应于判断蓝牙音箱与蓝牙底座是否在一个较近的距离，比如检测蓝牙音箱是否放置在蓝牙音箱底座上，或者，蓝牙音箱底座与蓝牙音箱电路连接，或者蓝牙音箱与蓝牙音箱底座的范围处于预设范围。

另一方面，为了保证蓝牙音箱底座和蓝牙音箱满足不同区域的场景需要(比如，用户A希望将对另一个地方的用户B播放某个音频，则可以将蓝牙音箱设在B所在位置，将蓝牙音箱底座设置在用户A所在位置)，预设条件可以对应于判断蓝牙音箱与蓝牙底座是否两个预设的位置，比如，用户A希望给另一个房间的用户播放某个歌曲，则可以将蓝牙音箱放置在另一个用户的房间，将蓝牙音箱底座放置在本地，由此，将语音信息的采集和播放分开，满足了更多场景的需要。

在本实施例中，为了避免资源的浪费，以及为了提升用户使用体验，保证蓝牙音箱底座的有效语音互动，在获取通过蓝牙音箱底座采集到的语音数据之后，可判断采集到的语音数据中是否包含唤醒词，若是，则控制蓝牙音箱底座进入唤醒识别状态，并按照预先协商的压缩倍数对采集到的语音数据进行压缩。也就是说，在获取通过蓝牙音箱底座采集到的语音数据之后，蓝牙音箱底座可判断该采集到的语音数据中是否包含了唤醒词，比如“唤醒”、“你好”、“打开”或“启动”等词，若包含了该预设唤醒词，则可控制蓝牙音箱底座进入唤醒识别状态，此时可按照预先协商的压缩倍数对该采集到的语音数据进行压缩。

在本发明的一个实施例中，在判断采集到的语音数据中未包含唤醒词时，可控制RMP协议模块继续保持休眠状态，并控制蓝牙音箱继续下行音频数据的播放，从而可以不影响用户体验。

其中，预先协商的压缩倍数是蓝牙音箱底座和移动终端预先协商的，该移动终端可以是手机、平板电脑、个人数字助理等具有各种操作***的硬件设备。其中，压缩倍数的设置与蓝牙音箱底座所处的环境蓝牙信道的质量和蓝牙芯片的信号有关系，例如，干净的环境可设置低倍压缩(比如2倍，4倍)，嘈杂的环境可设置高倍压缩(比如8倍，16倍)。一般情况下，如果只有蓝牙工作可认为环境是干净的。如果蓝牙和WiFi一起工作，并且WiFi吞吐量大则两者会互相干扰，此时可认为环境是嘈杂的。具体嘈杂或者干净的与具体环境有关系，需要判断和调试使用环境的来设置具体的压缩倍数。可理解，压缩倍数越低声音的识别率表现将会更好。

在本发明的实施例中，蓝牙音箱底座中可包括声音采集模块和数字信号处理模块，其中，该声音采集模块可为麦克风阵列，通过该麦克风阵列采集周围环境的声音，并通过数字信号处理模块对采集到的声音进行信号处理以得到采集到的语音数据。在得到采集到的语音数据之后，此时可检测蓝牙音箱底座所处的环境蓝牙信道的质量和蓝牙芯片的信号，并根据检测到的环境蓝牙信道的质量和蓝牙芯片的信号，与移动终端协商压缩倍数，按照协商的压缩倍数压缩该采集到的语音数据。

步骤103，将压缩后的语音信号通过预先建立的第一协议发送至移动终端，以使得移动终端对接收到的语音数据进行解压缩，并将解压缩后得到的语音数据发送给服务器进行语音识别以得到识别后的音频数据，通过预先建立的第二协议将音频数据发送至蓝牙音箱播放。

需要说明的是，在本发明的实施例中，如图2所示，需要预先建立移动终端与蓝牙音箱底座之间的第一协议连接，以及移动终端与蓝牙音箱之间的第二协议连接，在实际执行中，移动终端可扫描蓝牙音箱底座和蓝牙音箱，如果扫描到则向蓝牙音箱及其底座发送连接建立请求，蓝牙音箱及其底座在接收到该请求时，可分别建立与移动终端的第一协议连接和第二协议连接。其中，在本发明的一个实施例中，蓝牙音箱底座可包括但不限于第一协议对应的协议模块，蓝牙音箱可包括但不限于第二协议对应的协议模块。在本发明的实施例中，可通过第一协议对应的协议模块建立蓝牙音箱底座与移动终端的第一协议连接，并通过第二协议的协议模块建立该蓝牙音箱与移动终端的第二协议连接。作为一种示例，该第一协议为私有协议RMP(Remote Mic Profile，远程麦克风配置文件)协议；第二协议为标准A2DP协议。

也就是说，蓝牙音箱底座可通过该第一协议来建立第一协议连接(如私有协议RMP协议)，蓝牙音箱通过第二协议来建立第二协议连接(如标准A2DP协议)，从而基于该第一协议连接和第二协议连接实现与移动终端的蓝牙语音数据的双向传输。其中，在本发明的实施例中，该蓝牙音箱底座可基于该第一协议连接来实现与移动终端的蓝牙语音数据的双向传输中的上行数据传输，蓝牙音箱可基于该第二协议连接来实现与移动终端的蓝牙语音数据的双向传输中的下行数据传输。

继续参照图2，假设移动终端为智能手机，蓝牙音箱底座与手机之间实施蓝牙双向数据传输中的上行数据传输，蓝牙音箱底座与手机之间实施蓝牙双向数据传输中的下行数据传输，其中，上行数据传输部分由私有协议RMP协议完成，下行数据传输部分由标准A2DP协议完成。

还需要说明的是，在本发明的一个实施例中，该第一协议的协议模块可设置在蓝牙音箱底座中的蓝牙芯片的串行电缆仿真协议RFCOMM层和应用Application层之间。也就是说，该第一协议对应的协议模块提供的第一协议可运行在蓝牙芯片中的串行电缆仿真协议RFCOMM层和应用Application层之间。例如，如图3所示，该蓝牙芯片的蓝牙协议栈可包括基带协议(BaseBand)、链路管理协议(LMP)、逻辑链路控制和适配协议(L2CAP)、串行电缆仿真协议(RFCOMM)、私有协议RMP协议和应用层协议(Application)，其中，私有协议RMP协议运行在蓝牙芯片的串行电缆仿真协议RFCOMM层和应用Application层之间。

进而，在将采集到的语音数据进行压缩之后，可通过第一协议连接将该压缩后的语音数据发送给移动终端。移动终端在接收到该语音数据时，可对该语音数据进行解压缩，并将该解压缩后的语音数据转发给服务器，以使服务器对该语音数据进行语音识别，并根据识别结果生成对应的音频数据，以得到识别后的音频数据。服务器在得到识别后的音频数据之后，可将该音频数据返回给移动终端，以使移动终端通过第二协议连接将该音频数据发送给蓝牙音箱。例如，假设蓝牙音箱底座采集到语音数据为“请播放歌曲A”语音，则蓝牙音箱底座可将该语音数据通过第一协议连接发送给移动终端。移动终端将该语音数据转发给服务器，以使服务器对该语音数据进行识别，并根据识别结果获取对应的响应数据，即“歌曲A”的音频数据，此时可将该“歌曲A”的音频数据通过移动终端发送给蓝牙音箱进行“歌曲A”的音频播放。

例如，如图2所示，服务器可将识别后的音频数据发送给移动终端，以使移动终端通过A2DP协议将该音频数据发送给蓝牙音箱。蓝牙音箱在接收到移动终端下发的音频数据时，可通过自身的音频输出模块(比如功放模块、扬声器等)播放该音频数据，从而实现了蓝牙音箱与移动终端之间的语音识别和交互功能。

需要说明的是，在本发明的实施例中，RMP协议模块可分为两个子模块，即指令传输子模块和语音链路子模块。其中，指令传输子模块可用于设备信息交互和语音唤醒的中断处理；语音链路子模块可用于稳定的声音数据传输，并在长时间没有数据传输时断开RFCOMM(蓝牙虚拟串口)、SPP(Serial Port Profile，串行端口配置文件)的链路，RMP协议模块进入休眠。其中，该RMP协议模块可具有多种状态，例如，该RMP协议模块可具有空闲状态、等待唤醒识别状态、唤醒识别状态和忙状态，该RMP协议模块的具体状态切换可如图4所示，其中，空闲状态可表示初始化状态，应用初始化，为建立连接；等待唤醒识别状态可表示蓝牙RMP协议模块、A2DP协议模块和网络链路已建立连接，准备工作完成，蓝牙音箱空闲等待唤醒；唤醒识别状态可表示在收到唤醒事件时开始识别，如接收待识别语音数据，并对该待识别语音数据进行解码，响应识别并进入忙状态，如果长时间未接收到移动终端的响应，则可认为链路已断开，可进入空闲状态；忙状态可表示识别响应状态，此时蓝牙音箱的音频输出单元正在播放响应后的声音，识别结束后重新进入等待唤醒状态。

由此，本发明实施例的RMP协议可现有的BLE协议和HFP协议的区别在于：RMP协议可支持蓝牙音箱底座与其他设备之间的语音交互音频信号的传输，并且，在与其他设备进行语音数据传输时，通过第一协议连接传输数据时会与终端设备相互协商压缩倍数，通过动态协商压缩数据的方式实现对语音音频数据的压缩，可以使得在当前环境下能够保证最大数据传输量，从而可以提高蓝牙音箱的上行语音传输率，同时由于将上行数据和下行数据放在不同的设备中实施，不影响蓝牙音箱的下行数据传输率，从而达到了蓝牙双向高速传输的目的。

综上，本发明实施例的蓝牙音箱底座的控制方法，可通过蓝牙音箱底座和蓝牙音箱分别建立与移动终端的第一协议连接和第二协议连接，并获取通过蓝牙音箱底座采集到的语音数据，并按照预先协商的压缩倍数对采集到的语音数据进行压缩，将压缩后的语音数据通过第一协议连接发送给移动终端，其中，移动终端对接收到的语音数据进行解压缩，并将解压缩后得到的语音数据发送给服务器进行语音识别以得到识别后的音频数据，可基于第二协议连接接收移动终端返回的音频数据，并控制蓝牙音箱中的音频输出模块播放音频数据，从而实现了蓝牙音箱及其底座与移动终端之间的语音识别和交互功能。即通过第一协议连接和第二协议连接来实现蓝牙音箱及其底座与移动终端之间蓝牙语音数据的双向传输，由于第一协议连接是蓝牙底座与移动终端的连接，不影响蓝牙音箱与其他设备之间的语音交互音频信号的传输，并且，通过第一协议连接传输数据时会与终端设备相互协商压缩倍数，通过动态协商压缩数据的方式实现对语音音频数据的压缩，可以使得在当前环境下能够保证最大数据传输量，从而可以大幅提高蓝牙语音数据双向传输率，即实现了蓝牙语音数据的双向高速传输功能，并提高了语音识别率，在保证蓝牙音箱的下行音频播放质量的同时，在不改变蓝牙音箱的构造的基础上，也能够减小语音交互从唤醒到识别的时延，使得用户无感知，提升了用户的使用体验。

为了实现上述实施例，本发明还提供了一种蓝牙音箱底座，图5是根据本发明一个实施例的蓝牙音箱底座的结构示意图，如图5所示，该蓝牙音箱底座包括：声音采集模块510、数字信号处理模块520、蓝牙芯片530和音频输出模块540。

具体地，声音采集模块510可用于当蓝牙音箱底座与对应的蓝牙音箱所处位置满足预设条件时，采集周围环境的声音。作为一种示例，声音采集模块510可为麦克风阵列，该麦克风阵列可对周围环境的声音进行采集。其中，在本发明的实施例中，该麦克风阵列的个数可为多个，比如两个以及以上。

数字信号处理模块520，用于接收声音采集模块采集到的声音，并对采集到的声音进行信号处理以得到语音数据，并在判断语音数据中包含唤醒词后将语音数据发送给蓝牙芯片530。

蓝牙芯片530，用于按照预先协商的压缩倍数对语音数据进行压缩，将压缩后的语音信号通过预先建立的第一协议发送至移动终端，以使得移动终端对接收到的语音数据进行解压缩，并将解压缩后得到的语音数据发送给服务器进行语音识别以得到识别后的音频数据，通过预先建立的第二协议将音频数据发送至蓝牙音箱播放。

其中，蓝牙芯片530包括第一协议模块，其中，蓝牙芯片530通过第一协议对应的协议模块建立蓝牙音箱底座与移动终端的第一协议连接。作为一种示例，第一协议为私有协议RMP协议，第二协议为标准A2DP协议。

需要说明的是，在本发明的一个实施例中，该移动终端可以是手机、平板电脑、个人数字助理等具有各种操作***的硬件设备。举例而言，假设移动终端为智能手机，以蓝牙音箱端为中心，蓝牙音箱与手机之间的蓝牙双向数据传输可分为上行数据传输和下行数据传输，其中，上行数据传输部分由私有协议RMP协议完成，下行数据传输部分由标准A2DP协议完成。

还需要说明的是，在本发明的一个实施例中，所述第一协议模块设置在所述蓝牙芯片中的串行电缆仿真协议RFCOMM层和应用Application层之间。

为了进一步提高蓝牙音箱的上行数据传输率，提高语音识别率，可选地，在本发明的一个实施例中，数字信号处理模块520可采用RMP协议对所述语音数据进行所述预先协商的压缩倍数的压缩，并将压缩后的语音数据发送给所述蓝牙芯片530。也就是说，数字信号处理模块520在向蓝牙芯片530发送针对唤醒的中断标志时，可按照RMP协议发送该语音数据给蓝牙芯片530，即可按照预先协商的压缩倍数对该语音数据进行压缩，并将压缩后的语音数据发送给蓝牙芯片530，从而可以提高语音数据的传输率。

综上，本发明实施例的蓝牙音箱底座，可通过蓝牙音箱底座和蓝牙音箱分别建立与移动终端的第一协议连接和第二协议连接，并获取通过蓝牙音箱底座采集到的语音数据，并按照预先协商的压缩倍数对采集到的语音数据进行压缩，将压缩后的语音数据通过第一协议连接发送给移动终端，其中，移动终端对接收到的语音数据进行解压缩，并将解压缩后得到的语音数据发送给服务器进行语音识别以得到识别后的音频数据，可基于第二协议连接接收移动终端返回的音频数据，并控制蓝牙音箱中的音频输出模块播放音频数据，从而实现了蓝牙音箱及其底座与移动终端之间的语音识别和交互功能。即通过第一协议连接和第二协议连接来实现蓝牙音箱及其底座与移动终端之间蓝牙语音数据的双向传输，由于第一协议连接是蓝牙底座与移动终端的连接，不影响蓝牙音箱与其他设备之间的语音交互音频信号的传输，并且，通过第一协议连接传输数据时会与终端设备相互协商压缩倍数，通过动态协商压缩数据的方式实现对语音音频数据的压缩，可以使得在当前环境下能够保证最大数据传输量，从而可以大幅提高蓝牙语音数据双向传输率，即实现了蓝牙语音数据的双向高速传输功能，并提高了语音识别率，在保证蓝牙音箱的下行音频播放质量的同时，在不改变蓝牙音箱的构造的基础上，也能够减小语音交互从唤醒到识别的时延，使得用户无感知，提升了用户的使用体验。

为了实现上述实施例，本发明还提出了一种蓝牙音箱底座的控制***。

图6是根据本发明一个实施例的蓝牙音箱底座的控制***的结构示意图，如图6所示，该蓝牙音箱底座的控制***包括：蓝牙音箱610、蓝牙音箱底座500、移动终端620和服务器630，其中，

蓝牙音箱底座500，用于当蓝牙音箱底座上放置有蓝牙音箱时，采集语音数据并判断语音数据中是否包含唤醒词，并在语音数据中包含唤醒词时，按照预先协商的压缩倍数对语音数据进行压缩后通过预先建立的第一协议将压缩后的语音信号发送至移动终端，以使得移动终端对接收到的语音数据进行解压缩，并将解压缩后得到的语音数据发送给服务器进行语音识别以得到识别后的音频数据，通过预先建立的第二协议将音频数据发送至蓝牙音箱播放。

移动终端620，用于对接收到的语音数据进行解压缩，并将解压缩后得到的语音数据发送给服务器。

服务器630，用于对移动终端发送的语音数据进行语音识别，得到识别后的音频数据，并将音频数据返回给移动终端。

蓝牙音箱610，用于基于第二协议连接接收移动终端返回的音频数据，并控制蓝牙音箱中的音频输出模块播放音频数据。

举例而言，如图6所示，蓝牙音箱底座500可包括声音采集模块510、数字信号处理模块520、蓝牙芯片530和音频输出模块540。其中，数字信号处理模块520可接收声音采集模块510采集到的声音，并对采集到的声音进行回声消除、声源定位、波束形成、降噪等信号处理，最终得到清晰的语音数据，并判断该采集到的语音数据中是否包含唤醒词，以判断是否需要进入唤醒流程，若包含唤醒词，则进入唤醒流程，此时可向蓝牙芯片530发送针对唤醒的中断标识，并按照RMP协议发送语音数据给蓝牙芯片530。

蓝牙芯片530运行私有协议RMP以建立蓝牙音箱底座与移动终端之间的RMP协议连接，并在接收到数字信号处理模块520发送的所述针对唤醒的中断标识之后，RMP协议模块触发上行高速数据传输进程，即按照预先协商的压缩倍数对数字信号处理模块520发送的语音数据进行压缩，并将压缩后的语音数据发送给移动终端620。

移动终端620在接收到蓝牙芯片530发送的语音数据之后，可将接收到语音数据转发给服务器630。服务器630可对接收到的语音数据进行语音识别，并根据识别结果生成对应的音频数据，并将该音频数据返回给移动终端620，以使移动终端620可通过第二协议连接将该音频数据下发给智能音箱的蓝牙芯片611。蓝牙芯片611在接收到移动终端发送的音频数据时，可通过音频输出模块612播放该音频数据。

综上，本发明实施例的蓝牙音箱底座的控制***，可通过蓝牙音箱底座和蓝牙音箱分别建立与移动终端的第一协议连接和第二协议连接，并获取通过蓝牙音箱底座采集到的语音数据，并按照预先协商的压缩倍数对采集到的语音数据进行压缩，将压缩后的语音数据通过第一协议连接发送给移动终端，其中，移动终端对接收到的语音数据进行解压缩，并将解压缩后得到的语音数据发送给服务器进行语音识别以得到识别后的音频数据，可基于第二协议连接接收移动终端返回的音频数据，并控制蓝牙音箱中的音频输出模块播放音频数据，从而实现了蓝牙音箱及其底座与移动终端之间的语音识别和交互功能。即通过第一协议连接和第二协议连接来实现蓝牙音箱及其底座与移动终端之间蓝牙语音数据的双向传输，由于第一协议连接是蓝牙底座与移动终端的连接，不影响蓝牙音箱与其他设备之间的语音交互音频信号的传输，并且，通过第一协议连接传输数据时会与终端设备相互协商压缩倍数，通过动态协商压缩数据的方式实现对语音音频数据的压缩，可以使得在当前环境下能够保证最大数据传输量，从而可以大幅提高蓝牙语音数据双向传输率，即实现了蓝牙语音数据的双向高速传输功能，并提高了语音识别率，在保证蓝牙音箱的下行音频播放质量的同时，在不改变蓝牙音箱的构造的基础上，也能够减小语音交互从唤醒到识别的时延，使得用户无感知，提升了用户的使用体验。

为了实现上述实施例，本发明还提出了另一种蓝牙音箱。

图7是根据本发明另一个实施例的蓝牙音箱的结构示意图。如图7所示，该蓝牙音箱700可以包括：存储器710、处理器720及存储在存储器710上并可在处理器720上运行的计算机程序730，处理器720执行计算机程序730时，实现本发明上述任一个实施例所述的蓝牙音箱底座的控制方法。

为了实现上述实施例，本发明还提出了一种计算机可读存储介质，其上存储有计算机程序，所述计算机程序被处理器执行时实现本发明上述任一个实施例所述的蓝牙音箱底座的控制方法。

在本说明书的描述中，参考术语“一个实施例”、“一些实施例”、“示例”、“具体示例”、或“一些示例”等的描述意指结合该实施例或示例描述的具体特征、结构、材料或者特点包含于本发明的至少一个实施例或示例中。在本说明书中，对上述术语的示意性表述不必须针对的是相同的实施例或示例。而且，描述的具体特征、结构、材料或者特点可以在任一个或多个实施例或示例中以合适的方式结合。此外，在不相互矛盾的情况下，本领域的技术人员可以将本说明书中描述的不同实施例或示例以及不同实施例或示例的特征进行结合和组合。

此外，术语“第一”、“第二”仅用于描述目的，而不能理解为指示或暗示相对重要性或者隐含指明所指示的技术特征的数量。由此，限定有“第一”、“第二”的特征可以明示或者隐含地包括至少一个该特征。在本发明的描述中，“多个”的含义是至少两个，例如两个，三个等，除非另有明确具体的限定。

流程图中或在此以其他方式描述的任何过程或方法描述可以被理解为，表示包括一个或更多个用于实现定制逻辑功能或过程的步骤的可执行指令的代码的模块、片段或部分，并且本发明的优选实施方式的范围包括另外的实现，其中可以不按所示出或讨论的顺序，包括根据所涉及的功能按基本同时的方式或按相反的顺序，来执行功能，这应被本发明的实施例所属技术领域的技术人员所理解。

在流程图中表示或在此以其他方式描述的逻辑和/或步骤，例如，可以被认为是用于实现逻辑功能的可执行指令的定序列表，可以具体实现在任何计算机可读介质中，以供指令执行***、装置或设备(如基于计算机的***、包括处理器的***或其他可以从指令执行***、装置或设备取指令并执行指令的***)使用，或结合这些指令执行***、装置或设备而使用。就本说明书而言，"计算机可读介质"可以是任何可以包含、存储、通信、传播或传输程序以供指令执行***、装置或设备或结合这些指令执行***、装置或设备而使用的装置。计算机可读介质的更具体的示例(非穷尽性列表)包括以下：具有一个或多个布线的电连接部(电子装置)，便携式计算机盘盒(磁装置)，随机存取存储器(RAM)，只读存储器(ROM)，可擦除可编辑只读存储器(EPROM或闪速存储器)，光纤装置，以及便携式光盘只读存储器(CDROM)。另外，计算机可读介质甚至可以是可在其上打印所述程序的纸或其他合适的介质，因为可以例如通过对纸或其他介质进行光学扫描，接着进行编辑、解译或必要时以其他合适方式进行处理来以电子方式获得所述程序，然后将其存储在计算机存储器中。

应当理解，本发明的各部分可以用硬件、软件、固件或它们的组合来实现。在上述实施方式中，多个步骤或方法可以用存储在存储器中且由合适的指令执行***执行的软件或固件来实现。如，如果用硬件来实现和在另一实施方式中一样，可用本领域公知的下列技术中的任一项或他们的组合来实现：具有用于对数据信号实现逻辑功能的逻辑门电路的离散逻辑电路，具有合适的组合逻辑门电路的专用集成电路，可编程门阵列(PGA)，现场可编程门阵列(FPGA)等。

本技术领域的普通技术人员可以理解实现上述实施例方法携带的全部或部分步骤是可以通过程序来指令相关的硬件完成，所述的程序可以存储于一种计算机可读存储介质中，该程序在执行时，包括方法实施例的步骤之一或其组合。

此外，在本发明各个实施例中的各功能单元可以集成在一个处理模块中，也可以是各个单元单独物理存在，也可以两个或两个以上单元集成在一个模块中。上述集成的模块既可以采用硬件的形式实现，也可以采用软件功能模块的形式实现。所述集成的模块如果以软件功能模块的形式实现并作为独立的产品销售或使用时，也可以存储在一个计算机可读取存储介质中。

上述提到的存储介质可以是只读存储器，磁盘或光盘等。尽管上面已经示出和描述了本发明的实施例，可以理解的是，上述实施例是示例性的，不能理解为对本发明的限制，本领域的普通技术人员在本发明的范围内可以对上述实施例进行变化、修改、替换和变型。

Claims

1.一种蓝牙音箱底座的控制方法，其特征在于，包括以下步骤：

当所述蓝牙音箱底座与对应的蓝牙音箱所处位置满足预设条件时，采集语音数据并判断所述语音数据中是否包含唤醒词；

若包含所述唤醒词，则控制所述蓝牙音箱底座进入唤醒识别状态，并按照预先协商的压缩倍数对所述语音数据进行压缩；

将压缩后的语音信号通过预先建立的第一协议发送至移动终端，以使得移动终端对接收到的语音数据进行解压缩，并将解压缩后得到的语音数据发送给服务器进行语音识别以得到识别后的音频数据，通过预先建立的第二协议将所述音频数据发送至所述蓝牙音箱播放，其中，所述蓝牙音箱底座基于第一协议连接实现与所述移动终端的蓝牙语音数据的双向传输中的上行数据传输，所述蓝牙音箱基于第二协议连接实现与所述移动终端的蓝牙语音数据的双向传输中的下行数据传输，所述第一协议为私有协议RMP协议；所述第二协议为标准A2DP协议，所述第一协议对应的协议模块设置在所述蓝牙音箱底座中的蓝牙芯片的串行电缆仿真协议RFCOMM层和应用Application层之间；

所述并按照预先协商的压缩倍数对所述语音数据进行压缩，包括：

检测所述蓝牙音箱底座所处的环境蓝牙信道的质量和蓝牙芯片的信号；

根据检测到的环境蓝牙信道的质量和蓝牙芯片的信号，与所述移动终端协商压缩倍数；

按照协商的压缩倍数对采集到的语音数据进行压缩。

2.如权利要求1所述的方法，其特征在于，在所述若包含所述唤醒词之后，还包括：

通过所述第一协议向所述移动终端发送唤醒指令，以使得所述移动终端进入语音信号接收状态。

3.一种蓝牙音箱底座，其特征在于，包括：声音采集模块、数字信号处理模块、蓝牙芯片和音频输出模块，其中，

所述声音采集模块，用于当所述蓝牙音箱底座与对应的蓝牙音箱所处位置满足预设条件时，采集周围环境的声音；

所述数字信号处理模块，用于接收所述声音采集模块采集到的声音，并对所述采集到的声音进行信号处理以得到语音数据，并在判断所述语音数据中包含唤醒词后将所述语音数据发送给所述蓝牙芯片；

所述蓝牙芯片，用于按照预先协商的压缩倍数对所述语音数据进行压缩，将压缩后的语音信号通过预先建立的第一协议发送至移动终端，以使得移动终端对接收到的语音数据进行解压缩，并将解压缩后得到的语音数据发送给服务器进行语音识别以得到识别后的音频数据，通过预先建立的第二协议将所述音频数据发送至所述蓝牙音箱播放，其中，所述蓝牙音箱底座基于第一协议连接实现与所述移动终端的蓝牙语音数据的双向传输中的上行数据传输，所述蓝牙音箱基于第二协议连接实现与所述移动终端的蓝牙语音数据的双向传输中的下行数据传输，所述第一协议为私有协议RMP协议；所述第二协议为标准A2DP协议，所述第一协议对应的协议模块设置在所述蓝牙音箱底座中的蓝牙芯片的串行电缆仿真协议RFCOMM层和应用Application层之间；

所述蓝牙芯片具体用于：

按照协商的压缩倍数对采集到的语音数据进行压缩。

4.如权利要求3所述的蓝牙音箱底座，其特征在于，所述蓝牙芯片包括第一协议模块，其中，所述蓝牙芯片通过所述第一协议对应的协议模块建立所述蓝牙音箱底座与所述移动终端的第一协议连接。

5.一种蓝牙音箱底座的控制***，其特征在于，包括：蓝牙音箱、蓝牙音箱底座、移动终端和服务器，其中，

所述蓝牙音箱底座，用于当所述蓝牙音箱底座上放置有蓝牙音箱时，采集语音数据并判断所述语音数据中是否包含唤醒词，并在所述语音数据中包含唤醒词时，按照预先协商的压缩倍数对所述语音数据进行压缩后通过预先建立的第一协议将压缩后的语音信号发送至移动终端，以使得移动终端对接收到的语音数据进行解压缩，并将解压缩后得到的语音数据发送给服务器进行语音识别以得到识别后的音频数据，通过预先建立的第二协议将所述音频数据发送至所述蓝牙音箱播放，其中，所述蓝牙音箱底座基于第一协议连接实现与所述移动终端的蓝牙语音数据的双向传输中的上行数据传输，所述蓝牙音箱基于第二协议连接实现与所述移动终端的蓝牙语音数据的双向传输中的下行数据传输，所述第一协议为私有协议RMP协议；所述第二协议为标准A2DP协议，所述第一协议对应的协议模块设置在所述蓝牙音箱底座中的蓝牙芯片的串行电缆仿真协议RFCOMM层和应用Application层之间；

所述并按照预先协商的压缩倍数对所述语音数据进行压缩，包括：检测所述蓝牙音箱底座所处的环境蓝牙信道的质量和蓝牙芯片的信号；根据检测到的环境蓝牙信道的质量和蓝牙芯片的信号，与所述移动终端协商压缩倍数；按照协商的压缩倍数对采集到的语音数据进行压缩；

所述移动终端，用于对接收到的语音数据进行解压缩，并将解压缩后得到的语音数据发送给服务器；

所述服务器，用于对所述移动终端发送的语音数据进行语音识别，得到识别后的音频数据，并将所述音频数据返回给所述移动终端；

所述蓝牙音箱，用于基于所述第二协议连接接收所述移动终端返回的音频数据，并控制所述蓝牙音箱中的音频输出模块播放所述音频数据。

6.一种蓝牙音箱底座，其特征在于，包括：存储器、处理器及存储在所述存储器上并可在所述处理器上运行的计算机程序，所述处理器执行所述计算机程序时，实现如权利要求1至2中任一项所述的蓝牙音箱底座的控制方法。

7.一种计算机可读存储介质，其上存储有计算机程序，其特征在于，所述计算机程序被处理器执行时实现如权利要求1至2中任一项所述的蓝牙音箱底座的控制方法。