CN111081238B - 一种蓝牙音箱语音交互控制方法、装置及*** - Google Patents

一种蓝牙音箱语音交互控制方法、装置及*** Download PDF

Info

Publication number
CN111081238B
CN111081238B CN201811231063.2A CN201811231063A CN111081238B CN 111081238 B CN111081238 B CN 111081238B CN 201811231063 A CN201811231063 A CN 201811231063A CN 111081238 B CN111081238 B CN 111081238B
Authority
CN
China
Prior art keywords
voice
terminal equipment
analysis result
sound box
voice channel
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201811231063.2A
Other languages
English (en)
Other versions
CN111081238A (zh
Inventor
林敏洁
吴海全
姜德军
张恩勤
曹磊
师瑞文
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Shenzhen Grandsun Electronics Co Ltd
Original Assignee
Shenzhen Grandsun Electronics Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Shenzhen Grandsun Electronics Co Ltd filed Critical Shenzhen Grandsun Electronics Co Ltd
Priority to CN201811231063.2A priority Critical patent/CN111081238B/zh
Priority to PCT/CN2019/084835 priority patent/WO2020082710A1/zh
Publication of CN111081238A publication Critical patent/CN111081238A/zh
Application granted granted Critical
Publication of CN111081238B publication Critical patent/CN111081238B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/22Procedures used during a speech recognition process, e.g. man-machine dialogue
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/28Constructional details of speech recognition systems
    • G10L15/30Distributed recognition, e.g. in client-server systems, for mobile phones or network applications
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L67/00Network arrangements or protocols for supporting network services or applications
    • H04L67/01Protocols
    • H04L67/06Protocols specially adapted for file transfer, e.g. file transfer protocol [FTP]
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L67/00Network arrangements or protocols for supporting network services or applications
    • H04L67/01Protocols
    • H04L67/10Protocols in which an application is distributed across nodes in the network
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04RLOUDSPEAKERS, MICROPHONES, GRAMOPHONE PICK-UPS OR LIKE ACOUSTIC ELECTROMECHANICAL TRANSDUCERS; DEAF-AID SETS; PUBLIC ADDRESS SYSTEMS
    • H04R1/00Details of transducers, loudspeakers or microphones
    • H04R1/20Arrangements for obtaining desired frequency or directional characteristics
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04WWIRELESS COMMUNICATION NETWORKS
    • H04W4/00Services specially adapted for wireless communication networks; Facilities therefor
    • H04W4/80Services using short range communication, e.g. near-field communication [NFC], radio-frequency identification [RFID] or low energy communication
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04WWIRELESS COMMUNICATION NETWORKS
    • H04W76/00Connection management
    • H04W76/10Connection setup
    • H04W76/14Direct-mode setup

Landscapes

  • Engineering & Computer Science (AREA)
  • Signal Processing (AREA)
  • Computer Networks & Wireless Communication (AREA)
  • Physics & Mathematics (AREA)
  • Acoustics & Sound (AREA)
  • Computational Linguistics (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Multimedia (AREA)
  • Telephone Function (AREA)

Abstract

本发明适用于语音交互控制技术领域,提供了一种蓝牙音箱语音交互控制方法、装置及***,所述方法包括:与终端设备建立语音通道连接,并采集语音信息;通过所述语音通道将所述语音信息发送至终端设备,以使得终端设备将所述语音信息上传至云端,并在所述云端返回语音解析结果至终端设备之时,保持所述语音通道连接;通过所述语音通道接收终端设备发送的语音解析结果,并播放所述语音解析结果。通过本发明实施例提高蓝牙音箱语音交互的响应速度,减少了采集完语音信息后的语音通道建立的延时。

Description

一种蓝牙音箱语音交互控制方法、装置及***
技术领域
本发明属于语音交互控制技术领域,尤其涉及一种蓝牙音箱语音交互控制方法、装置及***。
背景技术
当蓝牙音箱准备播放音频数据时,需要与终端设备建立同步定向SCO连接或者高级音频传输A2DP连接,终端设备通过该链接方式把音频数据传输到蓝牙音箱端,经过解码,放大等步骤,将语音播放出来;比如,手机在电话通话时,电话里的声音是通过同步定向SCO连接进行传输的,手机在播放音乐时,是通过高级音频传输A2DP连接进行播放音乐的。
目前在蓝牙音箱与用户进行语音交互时,终端设备与蓝牙音箱建立连接,接收语音数据,语音数据接收结束后断开连接,在终端设备返回云端的语音分析结果后再一次与蓝牙音箱建立连接,连接建立成功,将语音分析结果传输至蓝牙音箱,进行语音播放;终端设备与蓝牙音箱建立连接需要一定的时间,在等待语音在云端分析结束后,还要继续等待终端设备与蓝牙音箱建立连接的时间,导致在语音交互时蓝牙音箱播放的延时,响应速度慢。
发明内容
有鉴于此,本发明实施例提供了一种语音交互控制方法、装置及***,以解决现有技术中与蓝牙音箱语音交互时,响应速度慢,存在语音播放延时的问题。
本发明实施例的第一方面提供了一种语音交互控制方法,应用于蓝牙音箱,包括:
与终端设备建立语音通道连接,并采集语音信息;
通过所述语音通道将所述语音信息发送至终端设备,以使得终端设备将所述语音信息上传至云端,并在所述云端返回语音解析结果至终端设备之时,保持所述语音通道连接;
通过所述语音通道接收终端设备发送的语音解析结果,并播放所述语音解析结果。
本发明实施例的第二方面提供了另一种语音交互控制方法,包括:
与蓝牙音箱建立语音通道连接,并通过所述语音通道接收蓝牙音箱发送的语音信息;
将所述语音信息上传至云端,以使得云端对所述语音信息进行解析,并在获取语音解析结果时,保持与所述蓝牙音箱的语音通道连接;
通过所述语音通道将所述语音解析结果发送至蓝牙音箱,以使得蓝牙音箱播放所述语音解析结果。
本发明实施例的第三方面提供了一种语音交互控制装置,包括:
语音采集模块,用于采集语音信息;
第一通道建立模块,用于与终端设备建立语音通道连接,并在所述语音解析结果返回至终端设备之时,保持所述语音通道连接;
第一语音发送模块,用于通过所述语音通道将所述语音信息发送至终端设备,以使得终端设备将所述语音信息上传至云端解析,返回语音解析结果;
语音播放模块,用于通过所述语音通道接收终端设备发送的语音解析结果,并播放所述语音解析结果。
本发明实施例的第四方面提供了一种终端设备,包括:
第二通道建立模块,用于与蓝牙音箱建立语音通道连接;
数据接收模块,用于通过所述语音通道接收蓝牙音箱发送的语音信息;
第二数据发送模块,用于将所述语音信息上传至云端,以使得云端对所述语音信息进行解析,获取语音解析结果;
第三数据发送模块,用于通过所述语音通道将所述语音解析结果发送至蓝牙音箱,以使得蓝牙音箱播放所述语音解析结果。
本发明实施例的第五方面提供可一种语音交互控制***,包括:
蓝牙音箱,用于与终端设备建立语音通道连接,采集语音信息,通过所述语音通道将所述语音信息发送至终端设备,通过所述语音通道接收终端设备发送的语音解析结果,并播放所述语音解析结果;
终端设备,用于与蓝牙音箱建立语音通道连接,并通过所述语音通道接收蓝牙音箱发送的语音信息;保持与蓝牙音箱的语音通道的连接,并将所述语音信息上传至云端,以使得云端对所述语音信息进行解析,获取语音解析结果;通过所述语音通道将所述语音解析结果发送至蓝牙音箱,以使得蓝牙音箱播放所述语音解析结果;
云端,用于接收终端设备发送的语音信息,对所述语音信息进行解析,并返回语音解析结果至终端设备。
本发明实施例的第四方面提供了一种计算机可读存储介质,所述计算机可读存储介质存储有计算机程序,所述计算机程序被处理器执行时实现上述语音交互控制方法的步骤。
本发明实施例与现有技术相比存在的有益效果是:通过本发明实施例在通过蓝牙音箱语音交互时,建立持蓝牙音箱与终端设备的语音通道的连接,并在终端设备上传至云端进行语音解析时,以及语音解析结果返回至终端设备时,保持语音通道连接,蓝牙音箱直接通过语音通道接收终端设备发送的语音解析结果,并播放语音解析结果,提高蓝牙音箱语音交互的响应速度,减少了采集完语音信息后的延时。
附图说明
为了更清楚地说明本发明实施例中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动性的前提下,还可以根据这些附图获得其他的附图。
图1是本发明实施例提供的语音交互控制的***应用场景示意图;
图2是本发明实施例提供的语音交互控制方法的实现流程示意图;
图3是本发明实施例提供的另一语音交互控制方法的实现流程示意图;
图4是本发明实施例提供的语音交互控制方法的交互流程示意图;
图5是本发明实施例提供的语音交互控制装置的示意图;
图6是本发明实施例提供的终端设备的示意图。
具体实施方式
以下描述中,为了说明而不是为了限定,提出了诸如特定***结构、技术之类的具体细节,以便透彻理解本发明实施例。然而,本领域的技术人员应当清楚,在没有这些具体细节的其它实施例中也可以实现本发明。在其它情况中,省略对众所周知的***、装置、电路以及方法的详细说明,以免不必要的细节妨碍本发明的描述。
应当理解,当在本说明书和所附权利要求书中使用时,术语“包括”指示所描述特征、整体、步骤、操作、元素和/或组件的存在,但并不排除一个或多个其它特征、整体、步骤、操作、元素、组件和/或其集合的存在或添加。
还应当理解,在此本发明说明书中所使用的术语仅仅是出于描述特定实施例的目的而并不意在限制本发明。如在本发明说明书和所附权利要求书中所使用的那样,除非上下文清楚地指明其它情况,否则单数形式的“一”、“一个”及“该”意在包括复数形式。
还应当进一步理解,在本发明说明书和所附权利要求书中使用的术语“和/或”是指相关联列出的项中的一个或多个的任何组合以及所有可能组合,并且包括这些组合。
为了说明本发明所述的技术方案,下面通过具体实施例来进行说明。
图1示出了本发明实施例提供的语音交互控制的***的应用场景的示意图,为了便于说明,仅示出了与本实施例相关的部分。
参照图1,该***由蓝牙音箱11采集语音信息,将语音信息通过建立的语音通道发送至终端设备12,终端设备12将语音信息上传至云端13,由云端13进行语音解析;在终端设备12上传语音信息至云端13以及云端13进行语音解析过程中,保持语音通道连接不断开,由终端设备12接收云端13返回的语音解析结果,并通过语音通道发送至蓝牙音箱11,由蓝牙音箱11播放语音解析结果。
下面对图1所示的***场景下的语音交互控制方法进行详细阐述:
图2示出了本发明实施例提供的语音交互控制方法的实现流程示意图。在本实施例中,该流程的执行主体为图1所示的蓝牙音箱11,该方法实现流程的执行主体也可以是其它实现语音信息网络交互的蓝牙设备,例如蓝牙耳机、车载蓝牙设备等,详述如下:
步骤S201,与终端设备建立语音通道连接,并采集语音信息。
在本发明实施例中,所述终端设备可以是手机、笔记本、掌上电脑及桌上型计算机等可以实现蓝牙连接的任一设备;蓝牙音箱通过麦克风采集语音信息,蓝牙音箱可以内置麦克风阵列,进行远距离拾音;所述的蓝牙音箱包括但不仅限于:普通单筒蓝牙音箱、户外单筒蓝牙音箱、家居型双筒蓝牙音箱、户外运动型蓝牙音箱或大型多筒家居蓝牙音箱,均可采集语音信息;当蓝牙音箱进行语音信息传输时,需要与终端设备建立语音通道连接,所述的语音通道可以是同步定向SCO连接,也可以是高级音频传输模型A2DP连接。
步骤S202,通过所述语音通道将所述语音信息发送至终端设备,以使得终端设备将所述语音信息上传至云端,并在所述云端返回语音解析结果至终端设备之时,保持所述语音通道连接。
在本发明实施例中,蓝牙音箱将采集到的语音信息通过语音通道发送至终端设备,所述的终端设备可以是手机、笔记本、掌上电脑及桌上型计算机等可以实现蓝牙连接的任一设备;由终端设备通过互联网或物联网将语音数据上传至云端进行语音解析,包括语音识别以及特征提取,生成对应的语音解析结果,并在返回语音解析结果至终端设备时,保持蓝牙音箱与终端设备的语音通道的连接。
进一步的,在与终端设备建立语音通道连接,并采集语音信息之后,还包括:
A1、通过所述语音通道将所述语音信息发送至终端设备,并在终端设备将所述语音信息上传至云端结束后断开所述语音通道连接;
A2、在云端返回语音解析结果至终端设备之前,再次与终端设备建立语音通道连接。
在本发明实施例中,当蓝牙音箱采集语音信息结束,并将语音信息通过语音通道发送至终端设备,终端设备将语音信息上传至云端后,蓝牙音箱将断开与终端设备的语音通道连接;在等待云端解析语音信息并返回语音解析结果之前,蓝牙音箱与终端设备再次建立语音通道连接;在等待云端返回所需要的时间是秒级的,可以是1秒,2秒等,建立语音通道连接所需要的时间是100毫秒级的,可以是0.3秒或0.4秒等,从而在等待云端返回语音解析结果之前或返回语音解析结果的过程中,可以完成语音通道连接的建立。
其中,所述的语音通道连接可以是同步定向SCO连接。
进一步的,在与终端设备建立语音通道连接,并采集语音信息之后,还包括:
通过所述语音通道将所述语音信息发送至终端设备,并在所述终端设备将所述语音信息上传至云端以及云端返回语音解析结果之前,保持与终端设备建立的所述语音通道连接。
在本发明实施例中,蓝牙音箱与终端设备建立语音通道连接后,所建立的语音通道连接不再断开,在终端设备将语音信息上传至云端,云端对语音信息进行解析过程,以及云端返回语音解析结果之前,一直保持语音通道连接。
步骤S203,通过所述语音通道接收终端设备发送的语音解析结果,并播放所述语音解析结果。
在本发明实施例中,所述语音通道可以是建立的同步面向SCO连接通道,也可以是高级音频传输模型A2DP连接通道;所述的终端设备可以是手机、电脑等可以支持蓝牙连接的联网设备;蓝牙音箱可以通过语音通道接收终端设备发送的语音解析结果,经过解码,放大等步骤从蓝牙音箱端的扬声器播放出来,例如:采集到的语音信息为:“今天天气怎么样”,由音箱端返回:“今天天气晴,气温21度,偏北风2到3级”。
图3示出了本发明实施例提供的另一语音交互控制方法的实现流程示意图;在本实施例中,该流程的执行主体为图1所示的终端设备12,该方法实现流程的执行主体也可以是其它支持蓝牙连接的联网设备,例如手机、电脑、平板等,详述如下:
步骤S301,与蓝牙音箱建立语音通道连接,并通过所述语音通道接收蓝牙音箱发送的语音信息。
在本发明实施例中,当需要通过蓝牙音箱接收一段数据或通过蓝牙音箱播放一段音频数据时,都需要与蓝牙音箱音箱建立语音通道的连接,所述的语音通道可以是同步定向SCO连接或高级音频传输模型A2DP连接;所述的蓝牙音箱可以是内置麦克风阵列,进行远距离拾音;所述的蓝牙音箱包括但不仅限于:普通单筒蓝牙音箱、户外单筒蓝牙音箱、家居型双筒蓝牙音箱、户外运动型蓝牙音箱或大型多筒家居蓝牙音箱。
另外,所述的蓝牙音箱也可以是其它采集语音信息的设备,可以是任何支持语音通道连接并实现语音信息网络交互的蓝牙设备,比如耳机、车载蓝牙等。
步骤S302,将所述语音信息上传至云端,以使得云端对所述语音信息进行解析,并在获取语音解析结果时,保持与所述蓝牙音箱的语音通道连接。
在本发明实施例中,所述的终端设备可以是手机、笔记本、掌上电脑及桌上型计算机等可以实现蓝牙连接的任一设备;由终端设备将语音信息上传至云端或服务器,由云端或服务器对用于语音进行解析,包括语音识别以及特征提取,生成对应的语音解析结果;在云端返回语音解析结果时,所述的语音通道保持连接,可以不用再次进行终端设备与蓝牙音箱的连接,避免再次建立连接产生的延时,直接通过所述的语音通道将语音结果发送至蓝牙音箱端。
进一步的,在与蓝牙音箱建立语音通道连接,并通过所述语音通道接收蓝牙音箱发送的语音信息之后,还包括:
B1、将所述语音信息上传至云端,并在上传至云端结束后断开与蓝牙音箱的所述语音通道连接;
B2、在云端对所述语音信息进行解析且返回语音解析结果之前,再次与蓝牙音箱建立语音通道连接,并接收云端发送的语音解析结果。
在本发明实施例中,当终端设备接收到语音信息,并将语音信息上传至云端后,将断开与蓝牙音箱的语音通道连接;在等待云端解析语音信息并返回语音解析结果之前,终端设备与蓝牙音箱再次建立语音通道连接;等待云端返回所需要的时间是秒级的,可以是1秒,2秒等,建立语音通道连接所需要的时间是100毫秒级的,可以是0.3秒或0.4秒等,从而在等待云端返回语音解析结果之前或返回语音解析结果的过程中,可以完成语音通道连接的建立。
其中,所述的语音通道连接可以是同步定向SCO连接或高级音频传输模型A2DP连接。
进一步的,在与蓝牙音箱建立语音通道连接,并通过所述语音通道接收蓝牙音箱发送的语音信息之后,还包括:
通过所述语音通道接收蓝牙音箱发送的语音信息,在将所述语音信息上传至云端以及云端返回语音解析结果之前,保持与所述蓝牙音箱建立的所述语音通道连接。
在本发明实施例中,终端设备与蓝牙音箱建立语音通道连接后,所建立的语音通道连接不再断开,在终端设备将语音信息上传至云端,云端对语音信息进行解析过程,以及云端返回语音解析结果之前,一直保持语音通道连接。
另外,接收蓝牙音箱发送的语音信息可以建立同步定向SCO通道,将语音解析结果发送至蓝牙音箱端,也可以通过同步定向SCO通道,因为两次都是通过建立的同步定向SCO连接来传输的语音数据,不需要进行其他类型的语音通道的转换与建立,中间一直保持同步定向SCO连接对于终端设备或蓝牙音箱端均没有其它影响。
步骤S303,通过所述语音通道将所述语音解析结果发送至蓝牙音箱,以使得蓝牙音箱播放所述语音解析结果。
在本发明实施例中,所述语音通道可以是建立的同步面向SCO连接通道,也可以是高级音频传输模型A2DP连接通道;所述的终端设备可以是手机、电脑等可以支持蓝牙连接的联网设备;蓝牙音箱可以通过语音通道接收终端设备发送的语音解析结果,经过解码,放大等步骤从蓝牙音箱端的扬声器播放出来,例如:采集到的语音信息为:“今天天气怎么样”,由音箱端返回:“今天天气晴,气温21度,偏北风2到3级”。
通过本发明实施例,通过蓝牙音箱语音交互时,建立持蓝牙音箱与终端设备的语音通道的连接,并在终端设备上传至云端进行语音解析时,以及语音解析结果返回至终端设备时,保持语音通道连接,蓝牙音箱直接通过语音通道接收终端设备发送的语音解析结果,并播放语音解析结果,提高蓝牙音箱语音交互的响应速度,减少了采集完语音信息后的延时;通过本发明的实施例,采集完语音信息后,回复语音解析结果的时间比传统方案要快了约20%左右,这对用户的感知具有明显的提升;另外进一步充分优化了同步定向SCO连接,避免了不必要的建立同步定向SCO连接的过程,从而减少了语音交互所需要的时间,提升了用户体验。
图4示出了本发明实施例提供的语音交互控制方法的交互流程示意图,为了便于说明,仅示出了与本发明实施例相关的部分;参与该交互流程的执行主体包括蓝牙音箱、终端设备、云端,该交互流程的实现原理与图2、图3所述的每个执行主体侧的实现原理相一致,因此仅简要地描述该交互流程,不赘述:
1、与蓝牙音箱建立语音通道;
2、由蓝牙音箱采集语音信息;
3、将语音信息通过语音通道发送至终端设备;
4、将语音信息上传至云端;
5、云端对语音信息进行语音解析获取语音解析结果;
6、将语音解析结果返回至终端设备;
7、终端设备将语音解析结果通过语音通道发送至蓝牙音箱;
8、由蓝牙音箱播放语音解析结果。
需要说明的是,本领域技术人员在本发明揭露的技术范围内,可容易想到的其他排序方案也应在本发明的保护范围之内,在此不一一赘述。
应理解,上述实施例中各步骤的序号的大小并不意味着执行顺序的先后,各过程的执行顺序应以其功能和内在逻辑确定,而不应对本发明实施例的实施过程构成任何限定。
图5示出了本发明实施例提供的语音交互控制装置的示意图,为了便于说明,仅示出了与本发明实施例相关的部分。
所述语音交互控制装置,包括:
语音采集模块51,用于采集语音信息;
第一通道建立模块52,用于与终端设备建立语音通道连接,并在所述语音解析结果返回至终端设备之时,保持所述语音通道连接;
第一语音发送模块53,用于通过所述语音通道将所述语音信息发送至终端设备,以使得终端设备将所述语音信息上传至云端解析,返回语音解析结果;
语音播放模块54,用于通过所述语音通道接收终端设备发送的语音解析结果,并播放所述语音解析结果。
进一步的,本发明实施例还提供了一种终端设备,包括:
第二通道建立模块61,用于与蓝牙音箱建立语音通道连接;
数据接收模块62,用于通过所述语音通道接收蓝牙音箱发送的语音信息;
第二数据发送模块63,用于将所述语音信息上传至云端,以使得云端对所述语音信息进行解析,获取语音解析结果;
第三数据发送模块64,用于通过所述语音通道将所述语音解析结果发送至蓝牙音箱,以使得蓝牙音箱播放所述语音解析结果。
进一步的,本发明实施例还提供了一种语音交互***,包括:
蓝牙音箱,用于与终端设备建立语音通道连接,采集语音信息,通过所述语音通道将所述语音信息发送至终端设备,通过所述语音通道接收终端设备发送的语音解析结果,并播放所述语音解析结果;
终端设备,用于与蓝牙音箱建立语音通道连接,并通过所述语音通道接收蓝牙音箱发送的语音信息;保持与蓝牙音箱的语音通道的连接,并将所述语音信息上传至云端,以使得云端对所述语音信息进行解析,获取语音解析结果;通过所述语音通道将所述语音解析结果发送至蓝牙音箱,以使得蓝牙音箱播放所述语音解析结果;
云端,用于接收终端设备发送的语音信息,对所述语音信息进行解析,并返回语音解析结果至终端设备。
所属领域的技术人员可以清楚地了解到,为了描述的方便和简洁,仅以上述各功能模块的划分进行举例说明,实际应用中,可以根据需要而将上述功能分配由不同的功能单元、模块完成,即将所述移动终端的内部结构划分成不同的功能单元或模块,以完成以上描述的全部或者部分功能。实施例中的各功能模块可以集成在一个处理单元中,也可以是各个单元单独物理存在,也可以两个或两个以上单元集成在一个单元中,上述集成的单元既可以采用硬件的形式实现,也可以采用软件功能单元的形式实现。另外,各功能模块的具体名称也只是为了便于相互区分,并不用于限制本申请的保护范围。上述移动终端中模块的具体工作过程,可以参考前述方法实施例中的对应过程,在此不再赘述。
所属领域的技术人员可以清楚地了解到,为了描述的方便和简洁,仅以上述各功能单元、模块的划分进行举例说明,实际应用中,可以根据需要而将上述功能分配由不同的功能单元、模块完成,即将所述装置的内部结构划分成不同的功能单元或模块,以完成以上描述的全部或者部分功能。实施例中的各功能单元、模块可以集成在一个处理单元中,也可以是各个单元单独物理存在,也可以两个或两个以上单元集成在一个单元中,上述集成的单元既可以采用硬件的形式实现,也可以采用软件功能单元的形式实现。另外,各功能单元、模块的具体名称也只是为了便于相互区分,并不用于限制本发明的保护范围。上述***中单元、模块的具体工作过程,可以参考前述方法实施例中的对应过程,在此不再赘述。
在上述实施例中,对各个实施例的描述都各有侧重,某个实施例中没有详述或记载的部分,可以参见其它实施例的相关描述。
本领域普通技术人员可以意识到,结合本文中所公开的实施例描述的各示例的单元及算法步骤,能够以电子硬件、或者计算机软件和电子硬件的结合来实现。这些功能究竟以硬件还是软件方式来执行,取决于技术方案的特定应用和设计约束条件。专业技术人员可以对每个特定的应用来使用不同方法来实现所描述的功能,但是这种实现不应认为超出本发明的范围。
在本发明所提供的实施例中,应该理解到,所揭露的装置/终端设备和方法,可以通过其它的方式实现。例如,以上所描述的装置/终端设备实施例仅仅是示意性的,例如,所述模块或单元的划分,仅仅为一种逻辑功能划分,实际实现时可以有另外的划分方式,例如多个单元或组件可以结合或者可以集成到另一个***,或一些特征可以忽略,或不执行。另一点,所显示或讨论的相互之间的耦合或直接耦合或通讯连接可以是通过一些接口,装置或单元的间接耦合或通讯连接,可以是电性,机械或其它的形式。
所述作为分离部件说明的单元可以是或者也可以不是物理上分开的,作为单元显示的部件可以是或者也可以不是物理单元,即可以位于一个地方,或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部单元来实现本实施例方案的目的。
另外,在本发明各个实施例中的各功能单元可以集成在一个处理单元中,也可以是各个单元单独物理存在,也可以两个或两个以上单元集成在一个单元中。上述集成的单元既可以采用硬件的形式实现,也可以采用软件功能单元的形式实现。
所述集成的模块/单元如果以软件功能单元的形式实现并作为独立的产品销售或使用时,可以存储在一个计算机可读取存储介质中。基于这样的理解,本发明实现上述实施例方法中的全部或部分流程,也可以通过计算机程序来指令相关的硬件来完成,所述的计算机程序可存储于一计算机可读存储介质中,该计算机程序在被处理器执行时,可实现上述各个方法实施例的步骤。其中,所述计算机程序包括计算机程序代码,所述计算机程序代码可以为源代码形式、对象代码形式、可执行文件或某些中间形式等。所述计算机可读介质可以包括:能够携带所述计算机程序代码的任何实体或装置、记录介质、U盘、移动硬盘、磁碟、光盘、计算机存储器、只读存储器(ROM,Read-Only Memory)、随机存取存储器(RAM,Random Access Memory)、电载波信号、电信信号以及软件分发介质等。需要说明的是,所述计算机可读介质包含的内容可以根据司法管辖区内立法和专利实践的要求进行适当的增减,例如在某些司法管辖区,根据立法和专利实践,计算机可读介质不包括是电载波信号和电信信号。
以上所述实施例仅用以说明本发明的技术方案,而非对其限制;尽管参照前述实施例对本发明进行了详细的说明,本领域的普通技术人员应当理解:其依然可以对前述各实施例所记载的技术方案进行修改,或者对其中部分技术特征进行等同替换;而这些修改或者替换,并不使相应技术方案的本质脱离本发明各实施例技术方案的精神和范围,均应包含在本发明的保护范围之内。

Claims (8)

1.一种语音交互控制方法,应用于蓝牙音箱,其特征在于,包括:
与终端设备建立语音通道连接,并采集语音信息;所述语音通道是高级音频传输模型A2DP连接;
通过所述语音通道将所述语音信息发送至终端设备,以使得终端设备将所述语音信息上传至云端,并在所述云端返回语音解析结果至终端设备之时,保持所述语音通道连接;
通过所述语音通道接收终端设备发送的语音解析结果,并播放所述语音解析结果;
在与终端设备建立语音通道连接,并采集语音信息之后,还包括:
通过所述语音通道将所述语音信息发送至终端设备,并在所述终端设备将所述语音信息上传至云端结束后断开所述语音通道连接;
在云端返回语音解析结果至终端设备之前,再次与终端设备建立语音通道连接。
2.如权利要求1所述的语音交互控制方法,其特征在于,在与终端设备建立语音通道连接,并采集语音信息之后,还包括:
通过所述语音通道将所述语音信息发送至终端设备,并在所述终端设备将所述语音信息上传至云端以及云端返回语音解析结果之前,保持与所述终端设备建立的所述语音通道连接。
3.一种语音交互控制方法,其特征在于,包括:
与蓝牙音箱建立语音通道连接,并通过所述语音通道接收蓝牙音箱发送的语音信息;所述语音通道是高级音频传输模型A2DP连接;
将所述语音信息上传至云端,以使得云端对所述语音信息进行解析,并在获取语音解析结果时,保持与所述蓝牙音箱的语音通道连接;
通过所述语音通道将所述语音解析结果发送至蓝牙音箱,以使得蓝牙音箱播放所述语音解析结果;
在与蓝牙音箱建立语音通道连接,并通过所述语音通道接收蓝牙音箱发送的语音信息之后,还包括:
将所述语音信息上传至云端,并在上传至云端结束后断开与蓝牙音箱的所述语音通道连接;
在云端对所述语音信息进行解析且返回语音解析结果之前,再次与蓝牙音箱建立语音通道连接,并接收云端发送的语音解析结果。
4.如权利要求3所述的语音交互控制方法,其特征在于,在与蓝牙音箱建立语音通道连接,并通过所述语音通道接收蓝牙音箱发送的语音信息之后,还包括:
通过所述语音通道接收蓝牙音箱发送的语音信息,在将所述语音信息上传至云端以及云端返回语音解析结果之前,保持与所述蓝牙音箱建立的所述语音通道连接。
5.一种语音交互控制装置,其特征在于,包括:
语音采集模块,用于采集语音信息;
第一通道建立模块,用于与终端设备建立语音通道连接,并在所述语音解析结果返回至终端设备之时,保持所述语音通道连接;所述语音通道是高级音频传输模型A2DP连接;
第一语音发送模块,用于通过所述语音通道将所述语音信息发送至终端设备,以使得终端设备将所述语音信息上传至云端解析,返回语音解析结果;
语音播放模块,用于通过所述语音通道接收终端设备发送的语音解析结果,并播放所述语音解析结果;
所述语音交互控制装置还用于:
在采集语音信息之后,通过所述语音通道将所述语音信息发送至终端设备,并在所述终端设备将所述语音信息上传至云端结束后断开所述语音通道连接;
在云端返回语音解析结果至终端设备之前,再次与终端设备建立语音通道连接。
6.一种终端设备,其特征在于,包括:
第二通道建立模块,用于与蓝牙音箱建立语音通道连接;所述语音通道是高级音频传输模型A2DP连接;
数据接收模块,用于通过所述语音通道接收蓝牙音箱发送的语音信息;
第二数据发送模块,用于将所述语音信息上传至云端,以使得云端对所述语音信息进行解析,获取语音解析结果;
第三数据发送模块,用于通过所述语音通道将所述语音解析结果发送至蓝牙音箱,以使得蓝牙音箱播放所述语音解析结果;
所述终端设备还用于:
在与蓝牙音箱建立语音通道连接,并通过所述语音通道接收蓝牙音箱发送的语音信息之后,将所述语音信息上传至云端,并在上传至云端结束后断开与蓝牙音箱的所述语音通道连接;
在云端对所述语音信息进行解析且返回语音解析结果之前,再次与蓝牙音箱建立语音通道连接,并接收云端发送的语音解析结果。
7.一种语音交互控制***,其特征在于,包括:
蓝牙音箱,用于与终端设备建立语音通道连接,采集语音信息,通过所述语音通道将所述语音信息发送至终端设备,通过所述语音通道接收终端设备发送的语音解析结果,并播放所述语音解析结果;所述语音通道是高级音频传输模型A2DP连接;
终端设备,用于与蓝牙音箱建立语音通道连接,并通过所述语音通道接收蓝牙音箱发送的语音信息;保持与蓝牙音箱的语音通道的连接,并将所述语音信息上传至云端,以使得云端对所述语音信息进行解析,获取语音解析结果;通过所述语音通道将所述语音解析结果发送至蓝牙音箱,以使得蓝牙音箱播放所述语音解析结果;
云端,用于接收终端设备发送的语音信息,对所述语音信息进行解析,并返回语音解析结果至终端设备;
所述语音交互控制***还用于:
在采集语音信息,通过所述语音通道将所述语音信息发送至终端设备之后,在所述终端设备将所述语音信息上传至云端结束后断开所述语音通道连接;
在云端返回语音解析结果至终端设备之前,再次与终端设备建立语音通道连接。
8.一种计算机可读存储介质,所述计算机可读存储介质存储有计算机程序,其特征在于,所述计算机程序被处理器执行时实现如权利要求1至4任一项所述方法的步骤。
CN201811231063.2A 2018-10-22 2018-10-22 一种蓝牙音箱语音交互控制方法、装置及*** Active CN111081238B (zh)

Priority Applications (2)

Application Number Priority Date Filing Date Title
CN201811231063.2A CN111081238B (zh) 2018-10-22 2018-10-22 一种蓝牙音箱语音交互控制方法、装置及***
PCT/CN2019/084835 WO2020082710A1 (zh) 2018-10-22 2019-04-28 一种蓝牙音箱语音交互控制方法、装置及***

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201811231063.2A CN111081238B (zh) 2018-10-22 2018-10-22 一种蓝牙音箱语音交互控制方法、装置及***

Publications (2)

Publication Number Publication Date
CN111081238A CN111081238A (zh) 2020-04-28
CN111081238B true CN111081238B (zh) 2022-09-23

Family

ID=70308349

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201811231063.2A Active CN111081238B (zh) 2018-10-22 2018-10-22 一种蓝牙音箱语音交互控制方法、装置及***

Country Status (2)

Country Link
CN (1) CN111081238B (zh)
WO (1) WO2020082710A1 (zh)

Families Citing this family (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113852937A (zh) * 2020-06-28 2021-12-28 阿里巴巴集团控股有限公司 建立蓝牙连接的方法、装置和车载设备
CN113709558A (zh) * 2021-10-09 2021-11-26 立讯电子科技(昆山)有限公司 多媒体处理方法及多媒体交互***
CN114253148A (zh) * 2021-12-09 2022-03-29 英华达(上海)科技有限公司 一种智能设备控制方法、网关设备和智能设备控制***

Family Cites Families (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20120253823A1 (en) * 2004-09-10 2012-10-04 Thomas Barton Schalk Hybrid Dialog Speech Recognition for In-Vehicle Automated Interaction and In-Vehicle Interfaces Requiring Minimal Driver Processing
WO2014075301A1 (zh) * 2012-11-16 2014-05-22 华为终端有限公司 一种蓝牙建立连接的方法、移动终端、蓝牙设备及***
CN103095813A (zh) * 2012-12-31 2013-05-08 威盛电子股份有限公司 语音交互***、移动终端装置及语音通信的方法
CA2891742C (en) * 2014-05-15 2023-11-28 Tyco Safety Products Canada Ltd. System and method for processing control commands in a voice interactive system
CN104202488B (zh) * 2014-09-29 2018-09-14 广东欧珀移动通信有限公司 一种通过蓝牙耳机与移动终端进行语音交互的方法及***
CN105161111B (zh) * 2015-08-25 2017-09-26 百度在线网络技术(北京)有限公司 基于蓝牙连接的语音识别方法和装置
CN106878850A (zh) * 2017-03-13 2017-06-20 歌尔股份有限公司 利用无线耳机实现语音交互的方法、***及无线耳机
CN107277272A (zh) * 2017-07-25 2017-10-20 深圳市芯中芯科技有限公司 一种基于软件app的蓝牙设备语音交互方法及***
CN108492823A (zh) * 2018-03-07 2018-09-04 广东思派康电子科技有限公司 一种语音点歌交互***及语音点歌交互方法
CN108428452B (zh) * 2018-03-14 2019-12-13 百度在线网络技术(北京)有限公司 终端支架和远场语音交互***

Also Published As

Publication number Publication date
CN111081238A (zh) 2020-04-28
WO2020082710A1 (zh) 2020-04-30

Similar Documents

Publication Publication Date Title
CN108428452B (zh) 终端支架和远场语音交互***
CN106878533B (zh) 一种移动终端的通信方法和装置
CN111081238B (zh) 一种蓝牙音箱语音交互控制方法、装置及***
US20180293982A1 (en) Voice assistant extension device and working method therefor
CN103402171B (zh) 在通话中分享背景音乐的方法和终端
CN101668085A (zh) 一种调节移动终端语音输出的方法及移动终端
CN109817238A (zh) 音频信号采集装置、音频信号处理方法和装置
CN106126165B (zh) 一种音频流处理方法及移动终端
CN104010226A (zh) 基于音频的多终端互动播放的方法和***
CN105847566A (zh) 移动终端音频的音量调节方法及装置
CN104092809A (zh) 通话录音方法、通话录音播放方法及其相应装置
CN103281425A (zh) 一种通过通话声音分析联系人的方法及装置
CN105260159A (zh) 一种音频播放方法和装置
CN113992965A (zh) 一种低延迟传输方法及***
CN206640742U (zh) 无线耳机及语音交互***
CN201750564U (zh) 一种音频播放***及其移动终端、音频播放设备
CN108154886A (zh) 噪声抑制方法及装置、电子装置及计算机可读存储介质
CN105554230A (zh) 一种语音通信电路和手持终端
CN112394771A (zh) 通信方法、装置、穿戴设备及可读存储介质
CN110970032A (zh) 一种音箱语音交互控制的方法及装置
CN110971744B (zh) 一种蓝牙音箱语音播放控制的方法及装置
CN104506588B (zh) 一种实现乐队的移动排练的方法及装置
CN106385517A (zh) 一种音频通话的实现方法、***及智能会议设备
CN104253943B (zh) 使用移动终端的视频拍摄方法和装置
CN106911978A (zh) 声音信号再输入型智能设备用耳机

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant