CN112820296B - 一种数据传输方法及电子设备 - Google Patents

一种数据传输方法及电子设备 Download PDF

Info

Publication number
CN112820296B
CN112820296B CN202110011895.9A CN202110011895A CN112820296B CN 112820296 B CN112820296 B CN 112820296B CN 202110011895 A CN202110011895 A CN 202110011895A CN 112820296 B CN112820296 B CN 112820296B
Authority
CN
China
Prior art keywords
audio data
segment
sending
awakening
time
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN202110011895.9A
Other languages
English (en)
Other versions
CN112820296A (zh
Inventor
陈孝良
李晓
冯大航
常乐
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Beijing SoundAI Technology Co Ltd
Original Assignee
Beijing SoundAI Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Beijing SoundAI Technology Co Ltd filed Critical Beijing SoundAI Technology Co Ltd
Priority to CN202110011895.9A priority Critical patent/CN112820296B/zh
Publication of CN112820296A publication Critical patent/CN112820296A/zh
Application granted granted Critical
Publication of CN112820296B publication Critical patent/CN112820296B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/28Constructional details of speech recognition systems
    • G10L15/30Distributed recognition, e.g. in client-server systems, for mobile phones or network applications
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/22Procedures used during a speech recognition process, e.g. man-machine dialogue
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L67/00Network arrangements or protocols for supporting network services or applications
    • H04L67/01Protocols
    • H04L67/10Protocols in which an application is distributed across nodes in the network
    • H04L67/104Peer-to-peer [P2P] networks
    • H04L67/1074Peer-to-peer [P2P] networks for supporting data block transmission mechanisms
    • H04L67/1078Resource delivery mechanisms
    • H04L67/108Resource delivery mechanisms characterised by resources being split in blocks or fragments
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/22Procedures used during a speech recognition process, e.g. man-machine dialogue
    • G10L2015/223Execution procedure of a spoken command
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y02TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
    • Y02DCLIMATE CHANGE MITIGATION TECHNOLOGIES IN INFORMATION AND COMMUNICATION TECHNOLOGIES [ICT], I.E. INFORMATION AND COMMUNICATION TECHNOLOGIES AIMING AT THE REDUCTION OF THEIR OWN ENERGY USE
    • Y02D30/00Reducing energy consumption in communication networks
    • Y02D30/70Reducing energy consumption in communication networks in wireless communication networks

Landscapes

  • Engineering & Computer Science (AREA)
  • Computational Linguistics (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Physics & Mathematics (AREA)
  • Acoustics & Sound (AREA)
  • Multimedia (AREA)
  • Computer Networks & Wireless Communication (AREA)
  • Signal Processing (AREA)
  • Telephonic Communication Services (AREA)

Abstract

本发明涉及通信技术领域,提供一种数据传输方法及电子设备,以解决数据上传过程中容易导致数据传输延时较大的问题。该方法包括:向服务器发送待识别音频数据中的第一音频数据片段;基于发送耗时,向服务器发送待识别音频数据中的第二音频数据片段或唤醒音频数据中的第一唤醒片段,其中,发送耗时为第一音频数据片段的发送时长,唤醒音频数据用于唤醒电子设备。在本申请实施例的数据传输方法中,首先向服务器发送待识别音频数据中的第一音频数据片段,待发送完毕后,根据发送耗时,向服务器发送待识别音频数据中的第二音频数据片段或唤醒音频数据中的第一唤醒片段,即实现数据的分片段发送,可减少瞬时数据发送量的大小,减少数据传输延时。

Description

一种数据传输方法及电子设备
技术领域
本发明涉及通信技术领域,尤其涉及一种数据传输方法及电子设备。
背景技术
随着智能技术的不断发展,各种智能产品应运而生,智能产品的功能也越来越强大,为用户生活和工作带来了极大便利。例如,用户通过智能电子设备可进行语音交互,首先可通过用户输入的唤醒语音唤醒电子设备,然后电子设备可接收用户输入的控制语音(即待识别语音),电子设备可将采集的用户输入的语音数据(包括唤醒语音和控制语音)上传给服务器。
然而,目前在上传过程中,首先将采集的语音数据进行保存,在预设的时间同时将采集的语音数据上传,如此,瞬时发送数据量较大,容易导致数据传输延时较大。
发明内容
本发明实施例提供一种数据传输方法及电子设备,以解决现有数据上传过程中容易导致数据传输延时较大的问题。
为了解决上述技术问题,本发明是这样实现的:
第一方面,本发明实施例提供了一种数据传输方法,应用于电子设备,所述方法包括:
向服务器发送待识别音频数据中的第一音频数据片段;
基于发送耗时,向所述服务器发送所述待识别音频数据中的第二音频数据片段或唤醒音频数据中的第一唤醒片段,其中,所述发送耗时为所述第一音频数据片段的发送时长,所述唤醒音频数据用于唤醒所述电子设备。
第二方面,本发明实施例还提供一种电子设备,包括:
第一发送模块,用于向服务器发送待识别音频数据中的第一音频数据片段;
第二发送模块,用于基于发送耗时,向所述服务器发送所述待识别音频数据中的第二音频数据片段或唤醒音频数据中的第一唤醒片段,其中,所述发送耗时为所述第一音频数据片段的发送时长,所述唤醒音频数据用于唤醒所述电子设备。
第三方面,本发明实施例还提供一种电子设备,包括:存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,所述处理器执行所述计算机程序时实现如上所述的数据传输方法中的步骤。
第四方面,本发明实施例还提供一种可读存储介质,所述计算机可读存储介质上存储计算机程序,所述计算机程序被处理器执行时实现如上所述的数据传输方法中的步骤。
在本申请实施例的数据传输方法中,首先向服务器发送待识别音频数据中的第一音频数据片段,待发送完毕后,根据发送耗时,向服务器发送待识别音频数据中的第二音频数据片段或唤醒音频数据中的第一唤醒片段,即实现数据的分片段发送,可减少瞬时数据发送量的大小,减少数据传输延时。
附图说明
为了更清楚地说明本发明实施例的技术方案,下面将对本发明实施例描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动性的前提下,还可以根据这些附图获得其他的附图。
图1是本发明实施例提供的数据传输方法的流程图之一;
图2是本发明实施例提供的数据传输方法中数据传输的原理图之一;
图3是本发明实施例提供的数据传输方法中数据传输的原理图之一;
图4是本发明实施例提供的数据传输方法中数据传输的原理图之一;
图5是本发明实施例提供的数据传输方法的流程图之二;
图6是本发明实施例提供的电子设备的模块示意图。
具体实施方式
下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
参见图1,图1是本发明实施例提供的数据传输方法的流程图,该方法可应用于电子设备,如图1所示,该方法包括以下步骤:
步骤101:向服务器发送待识别音频数据中的第一音频数据片段。
待识别音频数据为待语音识别的音频数据,可以为控制音频数据,语音识别技术是以音频(例如,语音)为研究对象,通过语音信号处理和模式识别使机器自动识别和理解人类口述的语音的技术,语音识别技术是让机器通过识别和理解过程把语音转换为相应的文本或命令的技术。例如,用户输入“播放音乐A”的控制音频数据,将发送给服务器,服务器响应即可将音乐A的源数据下发给电子设备,电子设备接收音乐A的源数据后即可播放音乐。
待识别音频数据可包括多个音频数据片段,首先可将其中的第一音频数据片段上传至服务器。需要说明的是,第一音频数据片段为待识别音频数据中未发送过的音频数据片段中的片段。作为一个示例,第一音频数据片段为待识别音频数据中未发送过的音频数据片段中输入电子设备的输入时间最早的片段。
步骤102:基于发送耗时,向服务器发送待识别音频数据中的第二音频数据片段或唤醒音频数据中的第一唤醒片段,其中,发送耗时为第一音频数据片段的发送时长,唤醒音频数据用于唤醒电子设备。
需要说明的是,唤醒音频数据先于待识别音频数据输入电子设备,可包括多个唤醒数据片段,用于唤醒电子设备,在唤醒电子设备后可接收用户输入电子设备的待识别音频数据。例如,输入有预设唤醒词(例如,输入包括“XX”关键词的唤醒语音数据)的唤醒语音数据,实现对电子设备的唤醒,唤醒之后电子设备可输出提示信息,已提示用户已唤醒,例如,输出“在呢”提示信息。唤醒之后,用户在电子设备输入待识别语音数据,电子设备接收用户输入的待识别语音数据。
在发送第一音频数据片段完毕后,可根据发送耗时,向服务器发送待识别音频数据中的第二音频数据片段或唤醒音频数据中的第一唤醒片段。即可分片段发送,可减少瞬时数据发送量的大小。需要说明的是,第二音频数据片段为待识别音频数据中未发送过的音频数据片段,第一唤醒片段为唤醒音频数据中的中未发送过的数据片段中的片段。作为一个示例,第一唤醒片段为唤醒音频数据中未发送过的数据片段中输入电子设备的输入时间最早的片段。
在本申请实施例的数据传输方法中,首先向服务器发送待识别音频数据中的第一音频数据片段,待发送完毕后,根据发送耗时,向服务器发送待识别音频数据中的第二音频数据片段或唤醒音频数据中的第一唤醒片段,即实现数据的分片段发送,可减少瞬时数据发送量的大小,减少数据传输延时。
在一个实施例中,基于发送耗时,向服务器发送待识别音频数据中的第二音频数据片段或唤醒音频数据中的第一唤醒片段,包括:
在发送耗时大于第一预设时长的情况下,向服务器发送第二音频数据片段,其中,第二音频数据片段与第一音频数据片段相邻,且第二音频数据片段在电子设备中的输入时刻在第一音频数据片段的输入时刻之后;或者,
在发送耗时小于或等于第一预设时长的情况下,向服务器发送第一唤醒片段。
也即是,若发送耗时大于第一预设时长,接着发送的仍然是所述待识别音频数据中的片段,若发送耗时小于或等于第一预设时长,表示发送过程中待识别音频数据中的第一音频数据片段发送较快,接着可发送唤醒音频数据中的片段。作为一个示例,第一预设时长可以为0.1毫秒。
即在本实施例中,可通过发送耗时与第一预设时长之间的比较,根据比较结果决定发送待识别音频数据中的第二音频数据片段还是唤醒音频数据中的第一唤醒片段,即考虑了网络状况,可调整待识别音频数据和唤醒音频数据中片段的发送顺序,降低网络负载,减少瞬时发送的数据量大小,减少发送延时,提高数据传输性能。
在一个实施例中,基于发送耗时,向服务器发送待识别音频数据中的第二音频数据片段或唤醒音频数据中的第一唤醒片段之后,还包括:利用第二音频数据片段的发送时长或第一唤醒片段的发送时长,更新发送耗时。
即若向服务器发送的是待识别音频数据中的第二音频数据片段,则是利用第二音频数据片段的发送时长更新发送耗时,即更新后的发送耗时为第二音频数据片段的发送时长。若向服务器发送的是唤醒音频数据中的第一唤醒片段,则是利用第一唤醒片段的发送时长更新发送耗时,即更新后的发送耗时为第一唤醒片段的发送时长。后续基于更新后的发送耗时,决定发送待识别音频数据中的片段还是唤醒音频数据中的唤醒片段。如此,可及时更新发送耗时,以提高后续发送待识别音频数据中片段或唤醒音频数据中唤醒片段的准确性。
在一个实施例中,利用第二音频数据片段的发送时长或第一唤醒片段的发送时长,更新发送耗时之后,还可包括:利用待识别音频数据中未发送过的数据片段中输入电子设备的输入时间最早的片段更新第二音频数据或利用唤醒音频数据中未发送过的数据片段中输入电子设备的输入时间最早的片段更新第一唤醒片段;返回基于发送耗时,向所述服务器发送所述待识别音频数据中的第二音频数据片段或唤醒音频数据中的第一唤醒片段的步骤,直到所述待识别音频数据和唤醒音频数据发送完毕。
对于基于发送耗时,向所述服务器发送所述待识别音频数据中的第二音频数据片段的情况,由于利用第二音频数据片段的发送时长更新发送耗时之前,已发送过一次所述待识别音频数据中的第二音频数据片段,即待识别音频数据中未发送过的数据片段相较于向所述服务器发送所述待识别音频数据中的第二音频数据片段之前待识别音频数据中的未发送过的数据片段会更新,即第二音频数据片段变为已发送的数据片段,下一次若发送待识别音频数据中的片段,即是发送待识别音频数据中为发送过的数据片段中输入时间最早的片段,如此,可利用待识别音频数据中未发送过的数据片段中输入电子设备的输入时间最早的片段更新第二音频数据,返回的基于发送耗时,向所述服务器发送所述待识别音频数据中的第二音频数据片段或唤醒音频数据中的第一唤醒片段的步骤中。类似地,对于基于发送耗时,向所述服务器发送唤醒音频数据中的第一唤醒片段的情况,由于利用第一唤醒片段的发送时长更新发送耗时之前,已发送过一次所述唤醒音频数据中的第一唤醒片段,即唤醒音频数据中未发送过的数据片段相较于向所述服务器发送所述唤醒音频数据中的第一唤醒片段之前唤醒音频数据中的未发送过的数据片段会更新,即第一唤醒片段变为已发送的数据片段,下一次若发送唤醒音频数据中的片段,即是发送唤醒音频数据中为发送过的数据片段中输入时间最早的片段,如此,可利用唤醒音频数据中未发送过的数据片段中输入电子设备的输入时间最早的片段更新第一唤醒片段,返回的基于发送耗时,向所述服务器发送所述待识别音频数据中的第二音频数据片段或唤醒音频数据中的第一唤醒片段的步骤中。
通过上述循环发送过程,直到所述待识别音频数据和唤醒音频数据发送完毕,即是完成一轮音频数据的发送。下一轮音频数据的发送过程与上述发送过程类似。通过本申请实施例的数据传输方法,可降低瞬时发送数据的数量,整合唤醒音频数据和待识别音频数据的发送顺序,降低网络负载,降低网络延时等。
在一个实施例中,向服务器发送待识别音频数据中的第一音频数据片段之前,还包括:接收用户输入的唤醒音频数据;对唤醒音频数据进行分段处理,得到多个唤醒数据片段,其中,多个唤醒数据片段包括第一唤醒片段。
即在接收到唤醒音频数据之后,为避免瞬时上传整个唤醒音频数据容易导致传输延时较长的问题,可将其进行分段处理,得到多个唤醒数据片段,后续根据本申请实施例的分段发送过程进行分段发送,降低网络负载,从而降低传输延时。
在一个实施例中,接收用户输入的唤醒音频数据之后,还包括:
在检测到唤醒音频数据中包括预设唤醒词的情况下,将电子设备转换为唤醒状态;
接收在电子设备为唤醒状态的情况下用户输入的待识别音频数据;
对待识别音频数据进行分段处理,得到多个音频数据片段,其中,多个音频数据片段包括第一音频数据片段和第二音频数据片段。
也即是电子设备是在唤醒状态下接收输入的待识别音频数据,然后对待识别音频数据进行分段处理,得到多个音频数据片段,后续根据本申请实施例的分段发送过程进行分段发送,降低网络负载,从而降低传输延时。
需要说明的是,唤醒状态可以理解为运行状态,转换为唤醒状态则可以理解为从休眠状态激活至运行状态,电子设备进入唤醒状态后在一定的有效时长内若未收到用户输入的待识别音频数据,则会转换为休眠状态。
下面以一个具体实施例对上述数据传输方法的过程加以说明,以音频为语音、第一预设时长为0.1ms为例。
首先,将接收的多通道的唤醒语音数据经过降噪处理,得到单通道的唤醒语音数据。
然后,将单通道的唤醒语音数据输入到电子设备的唤醒引擎,如果唤醒语音数据满足唤醒条件(例如,包括预设唤醒词),则唤醒,得到此时的语音唤醒数据,可将其分段得到n个唤醒数据片段,n为大于1的整数,语音唤醒数据的长度为n,n个唤醒数据片段可按照输入电子设备的输入时间从早到晚的顺序依次排列,其格式如下:
kw_1 kw_2 kw_3 kw_n-2 kw_n-1 kw_n
其次,当唤醒引擎检测到语音唤醒时唤醒电子设备,在唤醒状态下,可接收用于用户输入的待识别的语音识别数据即待识别语音数据,可将其分段得到m个语音数据片段,m为大于1的整数,待识别语音数据的长度为m,m个语音数据片段可按照输入电子设备的输入时间从早到晚的顺序依次排列,其格式如下:
asr_1 asr_2 asr_3 asr_m-2 asr_m-1 asr_m
首先发送待识别语音数据中的语音数据片段asr_1到服务器,如图2所示。根据发送的耗时时长t(即发送耗时)来决定下一次发送唤醒语音数据中的片段还是待识别语音数据中的片段,如果t<0.1ms或t=0.1ms,则下一次发送唤醒语音数据中的唤醒数据片段kw_1,如图3所示,并将耗时时长更新为kw_1的发送时长。如果t>0.1ms,则下一次发送待识别语音数据中的片段asr_2,如图4所示,并将耗时时长更新为asr_2的发送时长。然后下一次的片段发送过程与上述过程类似,例如,上述发送了片段asr_2,将耗时时长更新为asr_2的发送时长之后,再判断耗时时长是否大于0.1ms,如果t<0.1ms或t=0.1ms,则下一次发送唤醒语音数据中的片段kw_1,并将耗时时长更新为kw_1的发送时长;如果t>0.1ms,则下一次发送待识别语音数据中的片段asr_3,并将耗时时长更新为asr_3的发送时长。或者,例如,上述发送了片段kw_1,将耗时时长更新为kw_1的发送时长之后,再判断耗时时长是否大于0.1ms,如果t<0.1ms或t=0.1ms,则下一次发送唤醒语音数据中的片段kw_2,并将耗时时长更新为kw_1的发送时长;如果t>0.1ms,则下一次发送待识别语音数据中的片段asr_2,并将耗时时长更新为asr_2的发送时长。通过上述循环发送过程,直到待识别音频数据和唤醒语音数据中各数据片段全部发送完毕,即直到asr_1、asr_2、asr_3、…、asr_m-2、asr_m-1和asr_m,以及kw_1、kw_2、kw_3、…、kw_n-2、kw_n-1和kw_n全部发送完毕。
也就是,如图5所示,本申请实施例提供一种数据传输方法,该方法可包括:
步骤501:向服务器发送待识别语音数据中的语音数据片段asr_i(i初始时为1,i≤m);
步骤502:判断发送耗时t是否大于0.1ms;
若发送耗时t大于0.1ms,则执行步骤503:向所述服务器发送未发送过的语音数据片段asr_i+1;
发送音频数据片段asr_i+1之后,执行以下步骤:
步骤504:利用语音数据片段asr_i+1的发送时长更新所述发送耗时t;
步骤505:判断待识别语音数据中是否包括未发送过的数据片段;
若待识别语音数据中包括未发送过的数据片段,则执行步骤506:将i增加1。并返回步骤502。
若待识别音频数据中不包括未发送过的数据片段(即i等于m),则执行步骤507:判断唤醒语音数据中是否包括未发送过的数据片段;
若唤醒语音数据中包括未发送过的数据片段,则执行步骤508:将唤醒语音数据中的未发送过的数据判断依次发送至服务器。然后传输流程结束。若唤醒语音数据中不包括未发送过的数据片段,传输流程结束。
若通过步骤502判定发送耗时t小于或等于0.1ms,则执行步骤509:向所述服务器发送未发送过的唤醒数据片段kw_j(j初始时为1,j≤n);
发送唤醒数据片段kw_j之后,执行以下步骤:
步骤510:利用唤醒数据片段kw_j的发送时长更新所述发送耗时t;
步骤511:判断唤醒语音数据中是否包括未发送过的数据片段;
若唤醒语音数据中包括未发送过的数据片段,则执行步骤512:将j增加1。并返回步骤502。
若唤醒语音数据中不包括未发送过的数据片段(即j等于n),则执行步骤513:判断待识别语音数据中是否包括未发送过的数据片段;
若步骤513判定判断待识别语音数据中包括未发送过的数据片段,则执行步骤514:将待识别语音数据中的未发送过的数据判断依次发送至服务器。然后传输流程结束。若待识别语音数据中不包括未发送过的数据片段,传输流程结束。
在本申请实施例的输出传输过程中,根据网络状况调整待识别语音数据和唤醒语音数据的发送顺序,降低瞬时的数据发送量,降低网络负载。
参见图6,图6是本发明实施例提供的电子设备600的模块示意图,如图1所示,电子设备600包括:
第一发送模块601,用于向服务器发送待识别音频数据中的第一音频数据片段;
第二发送模块602,用于基于发送耗时,向服务器发送待识别音频数据中的第二音频数据片段或唤醒音频数据中的第一唤醒片段,其中,发送耗时为第一音频数据片段的发送时长,唤醒音频数据用于唤醒电子设备。
在一个实施例中,基于发送耗时,向服务器发送待识别音频数据中的第二音频数据片段或唤醒音频数据中的第一唤醒片段,包括:
在发送耗时大于第一预设时长的情况下,向服务器发送第二音频数据片段,其中,第二音频数据片段与第一音频数据片段相邻,且第二音频数据片段在电子设备中的输入时刻在第一音频数据片段的输入时刻之后;或者,
在发送耗时小于或等于第一预设时长的情况下,向服务器发送第一唤醒片段。
在一个实施例中,电子设备还包括:
第一更新模块,用于利用第二音频数据片段的发送时长或第一唤醒片段的发送时长,更新发送耗时。
在一个实施例中,电子设备还包括:
第一接收模块,用于接收用户输入的唤醒音频数据;
第一分段模块,用于对唤醒音频数据进行分段处理,得到多个唤醒数据片段,其中,多个唤醒数据片段包括第一唤醒片段。
在一个实施例中,电子设备还包括:
转换模块,用于在检测到唤醒音频数据中包括预设唤醒词的情况下,将电子设备转换为唤醒状态;
第二接收模块,用于接收在电子设备为唤醒状态的情况下用户输入的待识别音频数据;
第二分段模块,用于对待识别音频数据进行分段处理,得到多个音频数据片段,其中,多个音频数据片段包括第一音频数据片段和第二音频数据片段。
电子设备400能够实现上述方法实施例中方法实现的各个过程,为避免重复,这里不再赘述。
在一个实施例中,本发明实施例还提供一种电子设备,包括处理器,存储器,存储在存储器上并可在处理器上运行的计算机程序,该计算机程序被处理器执行时实现上述数据传输方法实施例中的各个过程,且能达到相同的技术效果,为避免重复,这里不再赘述。
本发明实施例还提供一种计算机可读存储介质,计算机可读存储介质上存储有计算机程序,该计算机程序被处理器执行时实现上述数据传输方法实施例的各个过程,且能达到相同的技术效果,为避免重复,这里不再赘述。其中,的计算机可读存储介质,如只读存储器(Read-Only Memory,简称ROM)、随机存取存储器(Random Access Memory,简称RAM)、磁碟或者光盘等。
需要说明的是,在本文中,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、物品或者装置不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、物品或者装置所固有的要素。在没有更多限制的情况下,由语句“包括一个……”限定的要素,并不排除在包括该要素的过程、方法、物品或者装置中还存在另外的相同要素。
通过以上的实施方式的描述,本领域的技术人员可以清楚地了解到上述实施例方法可借助软件加必需的通用硬件平台的方式来实现,当然也可以通过硬件,但很多情况下前者是更佳的实施方式。基于这样的理解,本发明的技术方案本质上或者说对现有技术做出贡献的部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质(如ROM/RAM、磁碟、光盘)中,包括若干指令用以使得一台电子设备(可以是手机,计算机,服务器,空调器,或者网络设备等)执行本发明各个实施例的方法。
上面结合附图对本发明的实施例进行了描述,但是本发明并不局限于上述的具体实施方式,上述的具体实施方式仅仅是示意性的,而不是限制性的,本领域的普通技术人员在本发明的启示下,在不脱离本发明宗旨和权利要求所保护的范围情况下,还可做出很多形式,均属于本发明的保护之内。

Claims (10)

1.一种数据传输方法,其特征在于,应用于电子设备,所述方法包括:
向服务器发送待识别音频数据中的第一音频数据片段;
基于发送耗时,向所述服务器发送所述待识别音频数据中的第二音频数据片段或唤醒音频数据中的第一唤醒片段,其中,所述发送耗时为所述第一音频数据片段的发送时长,所述唤醒音频数据用于唤醒所述电子设备;
其中,所述基于发送耗时,向所述服务器发送所述待识别音频数据中的第二音频数据片段或唤醒音频数据中的第一唤醒片段,包括:
在所述发送耗时大于第一预设时长的情况下,向所述服务器发送所述第二音频数据片段,其中,所述第二音频数据片段与所述第一音频数据片段相邻,且所述第二音频数据片段在所述电子设备中的输入时刻在所述第一音频数据片段的输入时刻之后;或者,
在所述发送耗时小于或等于第一预设时长的情况下,向所述服务器发送所述第一唤醒片段。
2.如权利要求1所述的方法,其特征在于,所述基于发送耗时,向所述服务器发送所述待识别音频数据中的第二音频数据片段或唤醒音频数据中的第一唤醒片段之后,还包括:
利用所述第二音频数据片段的发送时长或所述第一唤醒片段的发送时长,更新所述发送耗时。
3.如权利要求1-2中任一所述的方法,其特征在于,所述向服务器发送待识别音频数据中的第一音频数据片段之前,还包括:
接收用户输入的所述唤醒音频数据;
对所述唤醒音频数据进行分段处理,得到多个唤醒数据片段,其中,所述多个唤醒数据片段包括所述第一唤醒片段。
4.如权利要求3所述的方法,其特征在于,所述接收用户输入的所述唤醒音频数据之后,还包括:
在检测到所述唤醒音频数据中包括预设唤醒词的情况下,将所述电子设备转换为唤醒状态;
接收在所述电子设备为唤醒状态的情况下用户输入的所述待识别音频数据;
对所述待识别音频数据进行分段处理,得到多个音频数据片段,其中,所述多个音频数据片段包括所述第一音频数据片段和所述第二音频数据片段。
5.一种电子设备,其特征在于,所述电子设备包括:
第一发送模块,用于向服务器发送待识别音频数据中的第一音频数据片段;
第二发送模块,用于基于发送耗时,向所述服务器发送所述待识别音频数据中的第二音频数据片段或唤醒音频数据中的第一唤醒片段,其中,所述发送耗时为所述第一音频数据片段的发送时长,所述唤醒音频数据用于唤醒所述电子设备;
所述基于发送耗时,向所述服务器发送所述待识别音频数据中的第二音频数据片段或唤醒音频数据中的第一唤醒片段,包括:
在所述发送耗时大于第一预设时长的情况下,向所述服务器发送所述第二音频数据片段,其中,所述第二音频数据片段与所述第一音频数据片段相邻,且所述第二音频数据片段在所述电子设备中的输入时刻在所述第一音频数据片段的输入时刻之后;或者,
在所述发送耗时小于或等于第一预设时长的情况下,向所述服务器发送所述第一唤醒片段。
6.如权利要求5所述的电子设备,其特征在于,所述电子设备还包括:
第一更新模块,用于利用所述第二音频数据片段的发送时长或所述第一唤醒片段的发送时长,更新所述发送耗时。
7.如权利要求5-6中任一所述的电子设备,其特征在于,所述电子设备还包括:
第一接收模块,用于接收用户输入的所述唤醒音频数据;
第一分段模块,用于对所述唤醒音频数据进行分段处理,得到多个唤醒数据片段,其中,所述多个唤醒数据片段包括所述第一唤醒片段。
8.如权利要求7所述的电子设备,其特征在于,所述电子设备还包括:
转换模块,用于在检测到所述唤醒音频数据中包括预设唤醒词的情况下,将所述电子设备转换为唤醒状态;
第二接收模块,用于接收在所述电子设备为唤醒状态的情况下用户输入的所述待识别音频数据;
第二分段模块,用于对所述待识别音频数据进行分段处理,得到多个音频数据片段,其中,所述多个音频数据片段包括所述第一音频数据片段和所述第二音频数据片段。
9.一种电子设备,其特征在于,包括:存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,所述处理器执行所述计算机程序时实现如权利要求1-4中任意一项所述的数据传输方法中的步骤。
10.一种计算机可读存储介质,其特征在于,所述计算机可读存储介质上存储计算机程序,所述计算机程序被处理器执行时实现如权利要求1-4中任意一项所述的数据传输方法中的步骤。
CN202110011895.9A 2021-01-06 2021-01-06 一种数据传输方法及电子设备 Active CN112820296B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202110011895.9A CN112820296B (zh) 2021-01-06 2021-01-06 一种数据传输方法及电子设备

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202110011895.9A CN112820296B (zh) 2021-01-06 2021-01-06 一种数据传输方法及电子设备

Publications (2)

Publication Number Publication Date
CN112820296A CN112820296A (zh) 2021-05-18
CN112820296B true CN112820296B (zh) 2022-05-20

Family

ID=75857699

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202110011895.9A Active CN112820296B (zh) 2021-01-06 2021-01-06 一种数据传输方法及电子设备

Country Status (1)

Country Link
CN (1) CN112820296B (zh)

Family Cites Families (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN109817220A (zh) * 2017-11-17 2019-05-28 阿里巴巴集团控股有限公司 语音识别方法、装置及***
CN110097876A (zh) * 2018-01-30 2019-08-06 阿里巴巴集团控股有限公司 语音唤醒处理方法和被唤醒设备
CN109147779A (zh) * 2018-08-14 2019-01-04 苏州思必驰信息科技有限公司 语音数据处理方法和装置
CN109378000B (zh) * 2018-12-19 2022-06-07 科大讯飞股份有限公司 语音唤醒方法、装置、***、设备、服务器及存储介质
CN109727602A (zh) * 2018-12-29 2019-05-07 苏州思必驰信息科技有限公司 一种移动设备终端的声纹识别方法及装置
CN110060685B (zh) * 2019-04-15 2021-05-28 百度在线网络技术(北京)有限公司 语音唤醒方法和装置
CN111464644B (zh) * 2020-04-01 2023-04-28 北京声智科技有限公司 一种数据传输方法及电子设备
CN112382285B (zh) * 2020-11-03 2023-08-15 北京百度网讯科技有限公司 语音控制方法、装置、电子设备和存储介质

Also Published As

Publication number Publication date
CN112820296A (zh) 2021-05-18

Similar Documents

Publication Publication Date Title
CN109378000B (zh) 语音唤醒方法、装置、***、设备、服务器及存储介质
CN107704275B (zh) 智能设备唤醒方法、装置、服务器及智能设备
CN109584876B (zh) 语音数据的处理方法、装置和语音空调
CN111223497A (zh) 一种终端的就近唤醒方法、装置、计算设备及存储介质
CN111916082B (zh) 语音交互方法、装置、计算机设备和存储介质
CN111161714B (zh) 一种语音信息处理方法、电子设备及存储介质
CN110111789B (zh) 语音交互方法、装置、计算设备和计算机可读介质
CN111179944B (zh) 语音唤醒及年龄检测方法、装置及计算机可读存储介质
CN113327610A (zh) 一种语音唤醒方法、装置及设备
CN112820296B (zh) 一种数据传输方法及电子设备
CN113470646A (zh) 一种语音唤醒方法、装置及设备
CN111081251B (zh) 语音唤醒方法及装置
CN111508481A (zh) 语音唤醒模型的训练方法、装置、电子设备及存储介质
CN112306560B (zh) 用于唤醒电子设备的方法和装置
CN111464644B (zh) 一种数据传输方法及电子设备
CN112687293B (zh) 一种基于机器学习及数据挖掘的智能坐席训练方法和***
CN109493863A (zh) 一种智能唤醒方法和装置
CN110784885A (zh) 通信网络的功耗调整方法、装置及计算机可读存储介质
CN110956964B (zh) 提供语音服务的方法、装置、存储介质和终端
CN111899737B (zh) 音频数据处理方法、装置、服务器及存储介质
CN111566727A (zh) 全双工语音对话中的多阶段响应
CN117854526B (zh) 语音增强方法、装置、电子设备及计算机可读存储介质
CN114115789B (zh) 芯片插件化实现方法、装置、电子设备及存储介质
CN109785836B (zh) 交互方法和装置
CN114495924A (zh) 智慧随访语音唤醒方法及装置、电子设备

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant