CN111464644B - 一种数据传输方法及电子设备 - Google Patents

一种数据传输方法及电子设备 Download PDF

Info

Publication number
CN111464644B
CN111464644B CN202010250839.6A CN202010250839A CN111464644B CN 111464644 B CN111464644 B CN 111464644B CN 202010250839 A CN202010250839 A CN 202010250839A CN 111464644 B CN111464644 B CN 111464644B
Authority
CN
China
Prior art keywords
audio data
uploading
data
voice
user
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN202010250839.6A
Other languages
English (en)
Other versions
CN111464644A (zh
Inventor
袁路路
李智勇
常乐
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Beijing SoundAI Technology Co Ltd
Original Assignee
Beijing SoundAI Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Beijing SoundAI Technology Co Ltd filed Critical Beijing SoundAI Technology Co Ltd
Priority to CN202010250839.6A priority Critical patent/CN111464644B/zh
Publication of CN111464644A publication Critical patent/CN111464644A/zh
Application granted granted Critical
Publication of CN111464644B publication Critical patent/CN111464644B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L67/00Network arrangements or protocols for supporting network services or applications
    • H04L67/01Protocols
    • H04L67/02Protocols based on web technology, e.g. hypertext transfer protocol [HTTP]
    • H04L67/025Protocols based on web technology, e.g. hypertext transfer protocol [HTTP] for remote control or remote monitoring of applications
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/26Speech to text systems
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/28Constructional details of speech recognition systems
    • G10L15/30Distributed recognition, e.g. in client-server systems, for mobile phones or network applications
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L67/00Network arrangements or protocols for supporting network services or applications
    • H04L67/01Protocols
    • H04L67/06Protocols specially adapted for file transfer, e.g. file transfer protocol [FTP]
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L67/00Network arrangements or protocols for supporting network services or applications
    • H04L67/2866Architectures; Arrangements
    • H04L67/30Profiles
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y02TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
    • Y02DCLIMATE CHANGE MITIGATION TECHNOLOGIES IN INFORMATION AND COMMUNICATION TECHNOLOGIES [ICT], I.E. INFORMATION AND COMMUNICATION TECHNOLOGIES AIMING AT THE REDUCTION OF THEIR OWN ENERGY USE
    • Y02D30/00Reducing energy consumption in communication networks
    • Y02D30/70Reducing energy consumption in communication networks in wireless communication networks

Landscapes

  • Engineering & Computer Science (AREA)
  • Computer Networks & Wireless Communication (AREA)
  • Signal Processing (AREA)
  • Computational Linguistics (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Physics & Mathematics (AREA)
  • Acoustics & Sound (AREA)
  • Multimedia (AREA)
  • Telephonic Communication Services (AREA)

Abstract

本发明涉及通信技术领域,提供一种数据传输方法及电子设备,以解决数据上传过程中容易导致数据缺失的问题。该方法包括:检测用户是否结束本轮语音输入;在检测到用户结束本轮语音输入的情况下,若电子设备满足预设上传条件,将本轮的第一组音频数据上传至服务器。即只要本轮的语音输入结束,电子设备满足处于待唤醒状态,其上行宽带存在空闲,存在未上传的音频数据和用于上传数据的上传服务处于活动且空闲的状态中的至少一项,则可将本轮的第一组音频数据上传至服务器,可减少由于电子设备保存的语音数据有限,在超出预设可保存的数据量的情况下,最早保存的数据将被清除导致数据缺失的情况发生,提高上传数据完整性。

Description

一种数据传输方法及电子设备
技术领域
本发明涉及通信技术领域,尤其涉及一种数据传输方法及电子设备。
背景技术
随着智能技术的不断发展,各种智能产品应运而生,智能产品的功能也越来越强大,为用户生活和工作带来了极大便利。例如,用户通过智能设备可进行语音交互,电子设备可将采集的用户输入的语音数据上传给服务器。
然而,目前在上传过程中,为不影响正常的交互,首先将采集的语音数据进行保存,在预设的时间将采集的语音数据上传。如此,对电子设备内存以及硬件等要求较高,电子设备保存的语音数据有限,在超出预设可保存的数据量的情况下,最早保存的数据将被清除无法上传给服务器,即在上传数据过程中,容易导致数据缺失。
发明内容
本发明实施例提供一种数据传输方法及电子设备,以解决现有数据上传过程中容易导致数据缺失的问题。
为了解决上述技术问题,本发明是这样实现的:
第一方面,本发明实施例提供了一种数据传输方法,所述方法包括:
检测用户是否结束本轮语音输入;
在检测到用户结束本轮语音输入的情况下,若电子设备满足预设上传条件,则将本轮的第一组音频数据上传至服务器;
其中,所述预设上传条件包括如下至少一项:
所述电子设备处于待唤醒状态;
上行宽带存在空闲;
存在未上传的音频数据;
用于上传数据的上传服务处于活动且空闲的状态。
第二方面,本发明实施例还提供一种电子设备,包括:
检测模块,用于检测用户是否结束本轮语音输入;
上传模块,用于在检测到用户结束本轮语音输入的情况下,若所述电子设备满足预设上传条件,则将本轮的第一组音频数据上传至服务器;
其中,所述预设上传条件包括如下至少一项:
所述电子设备处于待唤醒状态;
上行宽带存在空闲;
存在未上传的音频数据;
用于上传数据的上传服务处于活动且空闲的状态。
第三方面,本发明实施例还提供一种电子设备,包括:存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,所述处理器执行所述计算机程序时实现如上所述的数据传输方法中的步骤。
第四方面,本发明实施例还提供一种可读存储介质,所述计算机可读存储介质上存储计算机程序,所述计算机程序被处理器执行时实现如上所述的数据传输方法中的步骤。
本实施例的数据传输方法,在检测到用户结束本轮语音输入的情况下,若电子设备满足预设上传条件,则将本轮的第一组音频数据上传至服务器,即只要本轮的语音输入结束,电子设备满足处于待唤醒状态,其上行宽带存在空闲,存在未上传的音频数据和用于上传数据的上传服务处于活动且空闲的状态中的至少一项,则可将本轮的第一组音频数据上传至服务器,无需等到预设的时间将保存的数据一次性上传,可减少由于电子设备保存的语音数据有限,在超出预设可保存的数据量的情况下,最早保存的数据将被清除导致数据缺失的情况发生,从而可提高上传给服务器的数据的完整性。
附图说明
为了更清楚地说明本发明实施例的技术方案,下面将对本发明实施例描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动性的前提下,还可以根据这些附图获得其他的附图。
图1是本发明实施例提供的数据传输方法的流程图之一;
图2是本发明实施例提供的数据传输方法中数据保存原理图;
图3是本发明实施例提供的数据传输方法的流程图之二;
图4是本发明实施例提供的电子设备的模块示意图。
具体实施方式
下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
参见图1,图1是本发明实施例提供的数据传输方法的流程图,该方法可应用于电子设备,如图1所示,该方法包括以下步骤:
步骤101:检测用户是否结束本轮语音输入。
用户可在电子设备输入语音,用户与电子设备可进行多轮语音输入,每轮语音输入结束后,均保存有对应的第一组音频数据。需要说明的是,每轮语音输入过程中,均在电子设备输入唤醒语音,例如,输入有预设关键词(例如,输入“XX”关键词的唤醒语音)的唤醒语音,实现对电子设备的唤醒,唤醒之后电子设备可输出提示信息,已提示用户已唤醒,例如,输出“在呢”提示信息。唤醒之后,用户在电子设备输入语音数据,输入语音数据结束后,本轮语音输入即结束。例如,用户输入“播放音乐A”的语音,输入该语音后,本轮语音输入即结束。电子设备将该语音数据降噪后发送给服务器后,服务器可该降噪后的语音数据进行识别后可根据识别结果进行响应,将识别结果对应的响应信息返回给电子设备,电子设备接收响应信息后输出,如此实现语音交互。比如,针对用户输入的“播放音乐A”的语音,将其降噪后发送给服务器,服务器响应即可将音乐A的源数据下发给电子设备,通过电子设备播放。
步骤102:在检测到用户结束本轮语音输入的情况下,若电子设备满足预设上传条件,则将本轮的第一组音频数据上传至服务器。
在检测到用户结束本轮语音输入的情况下,需对电子设备是否满足数据上传条件进行判断,若电子设备满足预设上传条件,则将本轮语音输入过程中产生的第一组音频数据上传至服务器。其中,预设上传条件包括如下至少一项:电子设备处于待唤醒状态;上行宽带存在空闲;存在未上传的音频数据;用于上传数据的上传服务处于活动且空闲的状态。
对于电子设备处于待唤醒状态,可以理解为电子设备未被唤醒,处于未唤醒状态,即使用户在电子设备输入语音,电子设备可采集到用户输入的语音,但却未给出响应。待唤醒状态与唤醒状态相对,在唤醒状态下,电子设备不但可采集到用户输入的语音,还可给出响应,具体可是接收服务器返回的额响应信息输出,即实现针对用户输入的语音的响应。若预设上传条件包括电子设备处于待唤醒状态,即表示需要电子设备为待唤醒状态的情况下,才能进行数据上传,而在唤醒状态,通过电子设备可进行语音交互,如此,电子设备处于待唤醒状态下方可进行数据上传,以免影响正常的语音交互。对于电子设备的上行宽带存在空闲,在上行宽带存在空闲的情况下,可确保数据的正常上传。对于存在未上传的音频数据,可以理解音频数据是逐一上传,针对本轮的语音输入过程中产生的音频数据中还有未上传的音频数据,初始时,本轮的第一组音频数据均未上传,表示存在未上传的音频数据,此时,未上传的音频数据包括本轮的第一组音频数据。若本轮的第一组音频数据包括多段音频数据,例如,包括唤醒前的一段音频数据和唤醒后的一段音频数据,多段音频数据逐一上传,比如,先上传唤醒前的一段音频数据,上传完毕后,还存在未上传的音频数据,即唤醒后的一段音频数据,后续再上传该唤醒后的一段音频数据。对于用于上传数据的上传服务处于活动且空闲的状态,上传服务即表示用于上传数据的服务,具体可以理解为用户上传第一组音频数据的服务,上传服务处于活动且空闲的状态,可提高数据上传的顺畅。
本实施例的数据传输方法,在检测到用户结束本轮语音输入的情况下,若电子设备满足预设上传条件,则将本轮的第一组音频数据上传至服务器,即只要本轮的语音输入结束,电子设备满足处于待唤醒状态,其上行宽带存在空闲,存在未上传的音频数据和用于上传数据的上传服务处于活动且空闲的状态中的至少一项,则可将本轮的第一组音频数据上传至服务器,无需等到预设的时间将保存的数据一次性上传,可减少由于电子设备保存的语音数据有限,在超出预设可保存的数据量的情况下,最早保存的数据将被清除导致数据缺失的情况发生,从而可提高上传给服务器的数据的完整性。
在一个示例中,将本轮的第一组音频数据上传至服务器之后,还可以包括:将本轮的第一组音频数据删除。如此,避免已上传的音频数据对电子设备存储空间的占用,节省存储空间。
在一个示例中,在检测到用户结束本轮语音输入的情况下,若电子设备中还包括目标轮的未上传的音频数据,则在电子设备满足预设上传条件的情况下,将目标轮的未上传的音频数据以及本轮的第一组音频数据上传至服务器。目标轮为本轮之前的轮次。电子设备中还包括目标轮的未上传的音频数据,表示目标轮的一组音频数据中还存在未上传的音频数据。作为一个示例,根据采集的时间先后顺序,将目标轮的未上传的音频数据以及本轮的第一组音频数据上传至服务器。
在一个实施例中,第一组音频数据包括第一音频数据和第二音频数据中的至少一项;
其中,第一音频数据为电子设备在第一时刻之前的第一预设时长内采集的音频数据,第一时刻为电子设备基于用户输入的第一唤醒语音转换为唤醒状态的时刻,第一音频数据包括第一唤醒语音,第二音频数据包括第一时刻到第二时刻之间采集的音频数据,第二时刻为检测到用户结束语音输入的时刻。
第一音频数据可以理解为第一原始音频数据,为唤醒前采集的用户输入的一段音频数据,第二音频数据可以理解为第二原始音频数据,为唤醒后采集的用户输入的一段音频数据。在检测到用户结束本轮语音输入的情况下,若电子设备满足预设上传条件,即可将第一音频数据和第二音频数据中的至少一项上传给服务器,以便服务器根据第一音频数据和第二音频数据中的至少一项进行语音识别方法的优化等,由于电子设备的唤醒过程是电子设备将降噪后的唤醒语音发送给服务器,由服务器根据该降噪后的唤醒语音进行识别,根据识别结果对电子设备进行唤醒;例如,若识别结果为识别到有预设关键词,则向电子设备发送唤醒指令,电子设备接收唤醒指令后切换为唤醒状态,即实现唤醒。如此,服务器根据第一音频数据和第二音频数据中的至少一项进行语音识别方法的优化后,可减少误唤醒的情况以及提高识别准确性。作为一个示例,第一时刻到第二时刻之间采集的音频数据包括在第一时刻到第二时刻之间用户输入的第二语音数据。
在一个实施例中,第一组音频数据包括第一音频数据和第二音频数据;
若电子设备满足预设上传条件,则将本轮的第一组音频数据上传至服务器,包括:若电子设备满足预设上传条件,按照采集时间的先后顺序,向服务器上传第一音频数据以及第二音频数据。
即在本实施例中,根据采集时间的先后顺序依次上传第一音频数据以及第二音频数据,以减少第一音频数据以及第二音频数据上传错误的情况,从而减少传输错误的情况,提高传输准确性。
在一个实施例中,若电子设备满足预设上传条件,按照采集时间的先后顺序,向服务器上传第一音频数据以及第二音频数据,包括:
在电子设备满足预设上传条件的情况下,将第一音频数据上传至服务器;
第一音频数据上传完毕后,在电子设备满足预设上传条件的情况下,将第二音频数据上传至服务器。
在本实施例中,在电子设备满足预设上传条件的情况下,先将第一音频数据上传至服务器,且在第一音频数据上传完毕后,需电子设备仍然满足预设上传条件的情况下,再将第二音频数据上传至服务器。即每进行一次数据传输后,均需要满足预设上传条件,以免对影响正常的语音交互或/和提高数据上传的准确性。
在一个实施例中,在检测到用户结束语音输入的情况下,若电子设备满足预设上传条件,则将本轮的第一组音频数据上传至服务器之前,还包括:在电子设备处于待唤醒状态,接收到用户输入的第一唤醒语音的情况下,基于第一唤醒语音,切换为唤醒状态;在电子设备处于唤醒状态下,若接收到用户输入的第二语音数据之后的第二预设时长内未接收到用户输入的语音数据,确定用户结束语音输入,其中,第二音频数据包括第二语音数据。
即在本实施例中,通过检测在唤醒状态下,接收到用户输入的第二语音数据之后的第二预设时长内是否接收到用户输入的语音数据,来判断用户是否结束语音输入,若接收到用户输入的第二语音数据之后的第二预设时长内未接收到用户输入的语音数据,表示用户结束本轮的语音输入。
需要说明的是,检测到用户结束语音输入的时刻可以理解为确定用户结束语音输入的时刻。作为一个示例,在电子设备处于唤醒状态下,若在第一时刻后的第三预设时长内接收到用户输入的第二语音数据之后的第二预设时长内未接收到用户输入的语音数据,确定用户结束语音输入,其中,第三预设时长小于第一时刻与第二时刻之间的时长。作为一个示例,第二预设时长的范围可以为300毫秒-500毫秒。
在一个示例中,在电子设备处于唤醒状态下,若接收到用户输入的第二语音数据之后的第二预设时长内未接收到用户输入的语音数据,确定用户结束语音输入之后,还可以包括:将电子设备切换为待唤醒状态。如此,以便后续对第一组音频数据的上传。
下面以一个具体实施例对上述数据传输方法的过程加以说明。
对于本发明实施例的电子设备,可以是智能音箱,具有两路上传过程,即包括两个上传服务,对于其中的一个上传服务,一方面,电子设备在待唤醒状态时,采集用户输入的唤醒语音,将其降噪后上传给服务器,服务器对降噪后的唤醒语音进行识别,并给出唤醒语音相应的响应信息,电子设备接收响应信息后输出,若服务器对唤醒语音识别,识别到预设的关键词后,给电子设备的响应信息中包括提示信息之外,还包括唤醒指令,可用于唤醒电子设备,电子设备接收响应信息后播放提示信息,且切换为唤醒状态。在唤醒状态下,接收用户输入的第二语音数据,将降噪后的第二语音数据上传给服务器,服务器对降噪后的第二语音数据进行识别,并给出降噪后的第二语音数据相应的响应信息,电子设备接收响应信息后输出。例如,用户输入“播放音乐A”的第二语音数据,将其降噪后上传给服务器,服务器给出的响应信息可包括音乐A的源数据,电子设备接收后即可播放,即实现音乐A的播放。通过上述过程,实现用户的正常语音交互。
另一方面,除了上述语音交互过程外,电子设备还包括另一个上传服务,即为上述数据传输方法中预设条件中的上传服务,在满足预设上传条件的情况下,通过该上传服务可将第一组音频数据上传给服务器,实现上述各实施例的数据传输方法中数据上传。可将在待唤醒状态时,采集用户输入的唤醒语音,直接将包括唤醒语音的第一音频数据上传给服务器,无需进行降噪,该第一音频数据用于所述服务器基于该第一音频数据进行语音识别方法的优化等。在唤醒状态下,接收用户输入的第二语音数据,将包括第二语音数据的第二音频数据直接上传给服务器,无需进行降噪,该第二音频数据也可用于所述服务器基于第二音频数据进行语音识别方法的优化等。在本发明的实施例中,若预设上传条件包括电子设备处于待唤醒状态时,即在检测到用户结束本轮语音输入的情况下,需电子设备处于待唤醒状态的情况下,方可进行上述数据传输,以免在唤醒状态下进行第一音频数据和第二音频数传输而影响正常的语音交互。
如图2所示,电子设备空闲情况下,保留最新的1s的音频数据。如果检测到电子设备被唤醒(即对应图2中的WakeUp),会产生具有唯一性的标识(dialogId)用作本轮语音输入的标识,保存最新的1s音频数据为原始唤醒数据(即第一音频数据,包括用户输入的唤醒语音),图2中用户开始唤醒,即表示用户输入唤醒语音,以唤醒电子设备。唤醒后,接下来的音频数据保存为原始ASR数据(即第二音频数据),一直保存到检测到VAD end(即一直保存到检测到用户结束本轮语音结束),图2中,在唤醒后的VAD start,用户开始语音,默认该段数据最长保存为5s时间长度的音频数据,如果保存5s音频数据长度用户还在说话,则将本轮原始ASR数据最早的一段删除,实现更新。将本轮的原始唤醒数据和原始ASR数据保存为上述标识对应的一组音频数据(即第一组音频数据),在用户语音输入结束后通知上传服务进行上传数据。
如图3所示,本实施例的数据传输方法的过程如下:
上传服务初始状态处于等待状态,收到上传数据的通知时,检查此刻是否可以上传数据。在一个示例中,在检测到用户结束本轮语音输入情况下,可向上传服务传递通知,通知上传数据。或者,在上传本轮的原始唤醒数据后,由于还剩余原始ASR数据,也可向上传服务传递通知,通知上传数据。
需要同时满足以下预设上传条件(即以下四项条件)才可以上传数据,否则继续等待,直到满足预设上传条件:
(1)当前存在还未上传的音频数据;
(2)电子设备当前处于未唤醒状态;
(3)上行宽带空闲;
(4)上传服务处于活动状态,且处于空闲状态。
上传服务处于活动状态下,上传服务的上传进程开启,以上四项条件均满足时,如果原始唤醒音频未上传,则先上传原始唤醒音频,上传结束通知继续上传,满足上传条件则继续上传原始ASR音频,否则继续等待,等待下轮语音输入结束后再继续上传,即等待下一轮的上传数据通知。上传服务可以通过libCurl或webSocket等方式实现。
是否开启原始音频(包括原始唤醒数据和原始ASR音频)上传、原始唤醒数据可以保存的数据长度、原始ASR数据可以保存的数据长度、最大保存的组数都可以通过外置配置文件动态配置,电子设备上电后读取即可,无需修改程序。
本实施例上述数据传输过程中,每组音频数据均有对应的标识,并且上传及时,方便直接获取对应的原始音频数据进行分析,优化Debug流程(即调试流程)。通过实施例的上述数据传输过程,便于将获取的原始唤醒数据和原始ASR音频上传给服务器,解决缺失数据难以分析出现误唤醒和识别准确性较低的原因的问题。利用上传宽带空闲时刻上传原始音频,不影响交互体验。大部分情况下只需要保存一组数据,并且上传后及时删除,对内存和硬盘空间占用很少。
参见图4,图4是本发明实施例提供的电子设备400的模块示意图,如图1所示,电子设备400包括:
检测模块401,用于检测用户是否结束本轮语音输入;
上传模块402,用于在检测到用户结束本轮语音输入的情况下,若电子设备满足预设上传条件,则将本轮的第一组音频数据上传至服务器;
其中,预设上传条件包括如下至少一项:
电子设备处于待唤醒状态;
上行宽带存在空闲;
存在未上传的音频数据;
用于上传数据的上传服务处于活动且空闲的状态。
在一个实施例中,第一组音频数据包括第一音频数据和第二音频数据中的至少一项;
其中,第一音频数据为电子设备在第一时刻之前的第一预设时长内采集的音频数据,第一时刻为电子设备基于用户输入的第一唤醒语音转换为唤醒状态的时刻,第一音频数据包括第一唤醒语音,第二音频数据包括第一时刻到第二时刻之间采集的音频数据,第二时刻为检测到用户结束语音输入的时刻。
在一个实施例中,第一组音频数据包括第一音频数据和第二音频数据;
上传模块,包括:
数据上传模块,用于若电子设备满足预设上传条件,按照采集时间的先后顺序,向服务器上传第一音频数据以及第二音频数据。
在一个实施例中,数据上传模块,包括:
第一数据上传子模块,用于在电子设备满足预设上传条件的情况下,将第一音频数据上传至服务器;
第二数据上传子模块,用于第一音频数据上传完毕后,在电子设备满足预设上传条件的情况下,将第二音频数据上传至服务器。
在一个实施例中,电子设备400,还包括:
第一切换模块,用于在电子设备处于待唤醒状态,接收到用户输入的第一唤醒语音的情况下,基于第一唤醒语音,切换为唤醒状态;
确定模块,用于在电子设备处于唤醒状态下,若接收到用户输入的第二语音数据之后的第二预设时长内未接收到用户输入的语音数据,确定用户结束语音输入,其中,第二音频数据包括第二语音数据。
电子设备400能够实现上述方法实施例中方法实现的各个过程,为避免重复,这里不再赘述。
在一个实施例中,本发明实施例还提供一种电子设备,包括处理器,存储器,存储在存储器上并可在处理器上运行的计算机程序,该计算机程序被处理器执行时实现上述数据传输方法实施例中的各个过程,且能达到相同的技术效果,为避免重复,这里不再赘述。
本发明实施例还提供一种计算机可读存储介质,计算机可读存储介质上存储有计算机程序,该计算机程序被处理器执行时实现上述数据传输方法实施例的各个过程,且能达到相同的技术效果,为避免重复,这里不再赘述。其中,的计算机可读存储介质,如只读存储器(Read-Only Memory,简称ROM)、随机存取存储器(Random Access Memory,简称RAM)、磁碟或者光盘等。
需要说明的是,在本文中,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、物品或者装置不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、物品或者装置所固有的要素。在没有更多限制的情况下,由语句“包括一个……”限定的要素,并不排除在包括该要素的过程、方法、物品或者装置中还存在另外的相同要素。
通过以上的实施方式的描述,本领域的技术人员可以清楚地了解到上述实施例方法可借助软件加必需的通用硬件平台的方式来实现,当然也可以通过硬件,但很多情况下前者是更佳的实施方式。基于这样的理解,本发明的技术方案本质上或者说对现有技术做出贡献的部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质(如ROM/RAM、磁碟、光盘)中,包括若干指令用以使得一台电子设备(可以是手机,计算机,服务器,空调器,或者网络设备等)执行本发明各个实施例的方法。
上面结合附图对本发明的实施例进行了描述,但是本发明并不局限于上述的具体实施方式,上述的具体实施方式仅仅是示意性的,而不是限制性的,本领域的普通技术人员在本发明的启示下,在不脱离本发明宗旨和权利要求所保护的范围情况下,还可做出很多形式,均属于本发明的保护之内。

Claims (8)

1.一种数据传输方法,其特征在于,所述方法包括:
检测用户是否结束本轮语音输入;
在检测到用户结束本轮语音输入的情况下,若电子设备满足预设上传条件,则将本轮的第一组音频数据上传至服务器;
其中,所述预设上传条件包括如下至少一项:
所述电子设备处于待唤醒状态,其中,所述待唤醒状态为可采集用户输入的语音且不响应所述语音的状态;
上行宽带存在空闲;
存在未上传的音频数据;
用于上传数据的上传服务处于活动且空闲的状态;
所述第一组音频数据包括第一音频数据和第二音频数据中的至少一项;
其中,所述第一音频数据为所述电子设备在第一时刻之前的第一预设时长内采集的音频数据,所述第一时刻为所述电子设备基于用户输入的第一唤醒语音转换为唤醒状态的时刻,所述第一音频数据包括所述第一唤醒语音,所述第二音频数据包括所述第一时刻到第二时刻之间采集的音频数据,所述第二时刻为检测到用户结束语音输入的时刻;
其中,所述若所述电子设备满足预设上传条件,则将本轮的第一组音频数据上传至服务器,包括:
在所述电子设备满足所述预设上传条件的情况下,将所述第一音频数据上传至所述服务器;
所述第一音频数据上传完毕后,在所述电子设备满足所述预设上传条件的情况下,将所述第二音频数据上传至所述服务器。
2.如权利要求1所述的方法,其特征在于,所述第一组音频数据包括第一音频数据和第二音频数据;
所述若所述电子设备满足预设上传条件,则将本轮的第一组音频数据上传至服务器,包括:
若所述电子设备满足所述预设上传条件,按照采集时间的先后顺序,向所述服务器上传所述第一音频数据以及第二音频数据。
3.如权利要求1所述的方法,其特征在于,所述在检测到用户结束语音输入的情况下,若所述电子设备满足预设上传条件,则将本轮的第一组音频数据上传至服务器之前,还包括:
在所述电子设备处于待唤醒状态,接收到用户输入的所述第一唤醒语音的情况下,基于所述第一唤醒语音,切换为所述唤醒状态;
在所述电子设备处于所述唤醒状态下,若接收到用户输入的第二语音数据之后的第二预设时长内未接收到用户输入的语音数据,确定用户结束语音输入,其中,所述第二音频数据包括所述第二语音数据。
4.一种电子设备,其特征在于,包括:
检测模块,用于检测用户是否结束本轮语音输入;
上传模块,用于在检测到用户结束本轮语音输入的情况下,若所述电子设备满足预设上传条件,则将本轮的第一组音频数据上传至服务器;
其中,所述预设上传条件包括如下至少一项:
所述电子设备处于待唤醒状态,其中,所述待唤醒状态为可采集用户输入的语音且不响应所述语音的状态;
上行宽带存在空闲;
存在未上传的音频数据;
用于上传数据的上传服务处于活动且空闲的状态;
所述第一组音频数据包括第一音频数据和第二音频数据中的至少一项;
其中,所述第一音频数据为所述电子设备在第一时刻之前的第一预设时长内采集的音频数据,所述第一时刻为所述电子设备基于用户输入的第一唤醒语音转换为唤醒状态的时刻,所述第一音频数据包括所述第一唤醒语音,所述第二音频数据包括所述第一时刻到第二时刻之间采集的音频数据,所述第二时刻为检测到用户结束语音输入的时刻;
其中,所述上传模块,包括:
第一数据上传子模块,用于在所述电子设备满足所述预设上传条件的情况下,将所述第一音频数据上传至所述服务器;
第二数据上传子模块,用于所述第一音频数据上传完毕后,在所述电子设备满足所述预设上传条件的情况下,将所述第二音频数据上传至所述服务器。
5.如权利要求4所述的电子设备,其特征在于,所述第一组音频数据包括第一音频数据和第二音频数据;
所述上传模块,包括:
数据上传模块,用于若所述电子设备满足所述预设上传条件,按照采集时间的先后顺序,向所述服务器上传所述第一音频数据以及第二音频数据。
6.如权利要求4所述的电子设备,其特征在于,还包括:
第一切换模块,用于在所述电子设备处于待唤醒状态,接收到用户输入的所述第一唤醒语音的情况下,基于所述第一唤醒语音,切换为所述唤醒状态;
确定模块,用于在所述电子设备处于所述唤醒状态下,若接收到用户输入的第二语音数据之后的第二预设时长内未接收到用户输入的语音数据,确定用户结束语音输入,其中,所述第二音频数据包括所述第二语音数据。
7.一种电子设备,其特征在于,包括:存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,所述处理器执行所述计算机程序时实现如权利要求1-3中任意一项所述的数据传输方法中的步骤。
8.一种计算机可读存储介质,其特征在于,所述计算机可读存储介质上存储计算机程序,所述计算机程序被处理器执行时实现如权利要求1-3中任意一项所述的数据传输方法中的步骤。
CN202010250839.6A 2020-04-01 2020-04-01 一种数据传输方法及电子设备 Active CN111464644B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202010250839.6A CN111464644B (zh) 2020-04-01 2020-04-01 一种数据传输方法及电子设备

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202010250839.6A CN111464644B (zh) 2020-04-01 2020-04-01 一种数据传输方法及电子设备

Publications (2)

Publication Number Publication Date
CN111464644A CN111464644A (zh) 2020-07-28
CN111464644B true CN111464644B (zh) 2023-04-28

Family

ID=71678907

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202010250839.6A Active CN111464644B (zh) 2020-04-01 2020-04-01 一种数据传输方法及电子设备

Country Status (1)

Country Link
CN (1) CN111464644B (zh)

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112820296B (zh) * 2021-01-06 2022-05-20 北京声智科技有限公司 一种数据传输方法及电子设备

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2002098007A1 (en) * 2001-05-25 2002-12-05 Semtech Corporation Signaling method and apparatus
CN1537368A (zh) * 2001-05-15 2004-10-13 �����ɷ� 提供组通信网的有效休眠模式的通信装置
WO2013069188A1 (ja) * 2011-11-09 2013-05-16 日本電気株式会社 送信音声モニタ方法、音声入出力装置および送信音声モニタ用プログラム
CN110211589A (zh) * 2019-06-05 2019-09-06 广州小鹏汽车科技有限公司 车载***的唤醒方法、装置以及车辆、机器可读介质

Family Cites Families (12)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102984244A (zh) * 2012-11-21 2013-03-20 用友软件股份有限公司 单据数据的上传***和上传方法
CN104795066A (zh) * 2014-01-17 2015-07-22 株式会社Ntt都科摩 语音识别方法和装置
CN104506923B (zh) * 2014-12-31 2017-11-28 华为技术有限公司 一种多媒体处理装置、多媒体处理服务器及其方法
CN107395352B (zh) * 2016-05-16 2019-05-07 腾讯科技(深圳)有限公司 基于声纹的身份识别方法及装置
CN106302437A (zh) * 2016-08-11 2017-01-04 北京云知声信息技术有限公司 语音处理方法及装置
CN107863113A (zh) * 2017-11-08 2018-03-30 天脉聚源(北京)传媒科技有限公司 一种语音上传方法及装置
CN110097876A (zh) * 2018-01-30 2019-08-06 阿里巴巴集团控股有限公司 语音唤醒处理方法和被唤醒设备
CN109050396A (zh) * 2018-07-16 2018-12-21 浙江合众新能源汽车有限公司 一种车载智能机器人
CN109147779A (zh) * 2018-08-14 2019-01-04 苏州思必驰信息科技有限公司 语音数据处理方法和装置
CN109378000B (zh) * 2018-12-19 2022-06-07 科大讯飞股份有限公司 语音唤醒方法、装置、***、设备、服务器及存储介质
CN109903761A (zh) * 2019-01-02 2019-06-18 百度在线网络技术(北京)有限公司 语音交互方法、装置和存储介质
CN109599111A (zh) * 2019-01-02 2019-04-09 百度在线网络技术(北京)有限公司 语音交互方法、装置和存储介质

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN1537368A (zh) * 2001-05-15 2004-10-13 �����ɷ� 提供组通信网的有效休眠模式的通信装置
WO2002098007A1 (en) * 2001-05-25 2002-12-05 Semtech Corporation Signaling method and apparatus
WO2013069188A1 (ja) * 2011-11-09 2013-05-16 日本電気株式会社 送信音声モニタ方法、音声入出力装置および送信音声モニタ用プログラム
CN110211589A (zh) * 2019-06-05 2019-09-06 广州小鹏汽车科技有限公司 车载***的唤醒方法、装置以及车辆、机器可读介质

Also Published As

Publication number Publication date
CN111464644A (zh) 2020-07-28

Similar Documents

Publication Publication Date Title
CN108962262B (zh) 语音数据处理方法和装置
KR102437944B1 (ko) 음성 웨이크업 방법 및 장치
CN107220532B (zh) 用于通过声音识别用户身份的方法及设备
CN109671426B (zh) 一种语音控制方法、装置、存储介质及空调
CN109326289A (zh) 免唤醒语音交互方法、装置、设备及存储介质
CN111161714B (zh) 一种语音信息处理方法、电子设备及存储介质
CN108694947B (zh) 语音控制方法、装置、存储介质及电子设备
CN112634897B (zh) 设备唤醒方法、装置和存储介质及电子装置
CN112837686A (zh) 唤醒响应操作的执行方法、装置、存储介质及电子装置
CN111464644B (zh) 一种数据传输方法及电子设备
CN112767916A (zh) 智能语音设备的语音交互方法、装置、设备、介质及产品
CN111933149A (zh) 语音交互方法、穿戴式设备、终端及语音交互***
CN112242135A (zh) 一种语音数据的处理方法及智能客服装置
CN111862965A (zh) 唤醒处理方法、装置、智能音箱及电子设备
CN113205809A (zh) 语音唤醒方法和装置
CN112837694B (zh) 设备唤醒方法、装置、存储介质及电子装置
CN113889116A (zh) 语音信息的处理方法和装置、存储介质及电子装置
CN114077840A (zh) 语音对话***的优化方法、装置、设备及存储介质
CN114155857A (zh) 语音唤醒方法、电子设备和存储介质
CN110430508A (zh) 麦克风降噪处理方法及计算机存储介质
CN112151028A (zh) 一种语音识别的方法及装置
CN111785277B (zh) 语音识别方法、装置、计算机可读存储介质以及处理器
US20220139379A1 (en) Wake word method to prolong the conversational state between human and a machine in edge devices
CN112885341A (zh) 一种语音唤醒方法、装置、电子设备和存储介质
CN117894321B (zh) 一种语音交互方法、语音交互提示***、装置

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant