CN114553622A - 语音数据传输方法、装置及语音终端设备 - Google Patents
语音数据传输方法、装置及语音终端设备 Download PDFInfo
- Publication number
- CN114553622A CN114553622A CN202210118087.7A CN202210118087A CN114553622A CN 114553622 A CN114553622 A CN 114553622A CN 202210118087 A CN202210118087 A CN 202210118087A CN 114553622 A CN114553622 A CN 114553622A
- Authority
- CN
- China
- Prior art keywords
- voice
- voice packet
- request
- packet
- request voice
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 230000005540 biological transmission Effects 0.000 title claims abstract description 113
- 238000000034 method Methods 0.000 title claims abstract description 60
- 238000004891 communication Methods 0.000 claims abstract description 91
- 230000006835 compression Effects 0.000 claims abstract description 48
- 238000007906 compression Methods 0.000 claims abstract description 48
- 230000005236 sound signal Effects 0.000 claims abstract description 46
- 238000004806 packaging method and process Methods 0.000 claims abstract description 11
- 238000007781 pre-processing Methods 0.000 claims abstract description 11
- 230000004044 response Effects 0.000 claims description 44
- 238000012545 processing Methods 0.000 claims description 3
- 230000003993 interaction Effects 0.000 abstract description 15
- 230000000694 effects Effects 0.000 abstract description 7
- 238000005538 encapsulation Methods 0.000 abstract description 5
- 230000008569 process Effects 0.000 description 10
- 230000006870 function Effects 0.000 description 9
- 238000005516 engineering process Methods 0.000 description 6
- 230000007246 mechanism Effects 0.000 description 6
- 238000005070 sampling Methods 0.000 description 3
- 238000009825 accumulation Methods 0.000 description 2
- 238000013473 artificial intelligence Methods 0.000 description 2
- 238000004590 computer program Methods 0.000 description 2
- 238000011161 development Methods 0.000 description 2
- 238000010586 diagram Methods 0.000 description 2
- 240000007594 Oryza sativa Species 0.000 description 1
- 235000007164 Oryza sativa Nutrition 0.000 description 1
- 230000003044 adaptive effect Effects 0.000 description 1
- 238000006243 chemical reaction Methods 0.000 description 1
- 238000001514 detection method Methods 0.000 description 1
- 239000000428 dust Substances 0.000 description 1
- 238000000605 extraction Methods 0.000 description 1
- 238000001914 filtration Methods 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 235000009566 rice Nutrition 0.000 description 1
- 238000005406 washing Methods 0.000 description 1
Images
Classifications
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04L—TRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
- H04L12/00—Data switching networks
- H04L12/28—Data switching networks characterised by path configuration, e.g. LAN [Local Area Networks] or WAN [Wide Area Networks]
- H04L12/2803—Home automation networks
- H04L12/2816—Controlling appliance services of a home automation network by calling their functionalities
- H04L12/282—Controlling appliance services of a home automation network by calling their functionalities based on user interaction within the home
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/22—Procedures used during a speech recognition process, e.g. man-machine dialogue
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04L—TRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
- H04L12/00—Data switching networks
- H04L12/28—Data switching networks characterised by path configuration, e.g. LAN [Local Area Networks] or WAN [Wide Area Networks]
- H04L12/2803—Home automation networks
- H04L12/2838—Distribution of signals within a home automation network, e.g. involving splitting/multiplexing signals to/from different paths
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04L—TRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
- H04L12/00—Data switching networks
- H04L12/28—Data switching networks characterised by path configuration, e.g. LAN [Local Area Networks] or WAN [Wide Area Networks]
- H04L12/2803—Home automation networks
- H04L2012/284—Home automation networks characterised by the type of medium used
- H04L2012/2841—Wireless
-
- Y—GENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
- Y02—TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
- Y02P—CLIMATE CHANGE MITIGATION TECHNOLOGIES IN THE PRODUCTION OR PROCESSING OF GOODS
- Y02P90/00—Enabling technologies with a potential contribution to greenhouse gas [GHG] emissions mitigation
- Y02P90/02—Total factory control, e.g. smart factories, flexible manufacturing systems [FMS] or integrated manufacturing systems [IMS]
Landscapes
- Engineering & Computer Science (AREA)
- Signal Processing (AREA)
- Human Computer Interaction (AREA)
- Multimedia (AREA)
- Computational Linguistics (AREA)
- Health & Medical Sciences (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Physics & Mathematics (AREA)
- Acoustics & Sound (AREA)
- Automation & Control Theory (AREA)
- Computer Networks & Wireless Communication (AREA)
- Mobile Radio Communication Systems (AREA)
Abstract
本申请涉及一种语音数据传输方法、装置及语音终端设备,包括采集语音信号并进行预处理,得到音频信号;将音频信号进行压缩编码,得到压缩编码后的语音数据;依次从压缩编码后的语音数据中提取预设数据量的语音数据,封装得到至少一个请求语音包;将请求语音包通过Wifi‑P2P通讯方式传输至电器设备。将采集与预处理后的音频信号进行压缩编码,按预设数据量对压缩编码后的语音数据切分提取,再封装得到多个请求语音包,然后采用Wifi‑P2P通讯方式将多个请求语音包依次发送至电器设备,上述分包流式的传输方式保证了语音音频数据传输的可靠性与稳定性,可有效减少传输过程中的数据丢失以及传输错误的问题,使电器设备的语音交互控制功能保持良好效果。
Description
技术领域
本申请涉及语音数据传输技术领域,特别是涉及一种语音数据传输方法、装置及语音终端设备。
背景技术
随着物联网与人工智能技术的快速发展,越来越多的创新功能融入家庭生活中,例如用户终端与智能家居设备采用人机交互实现控制等。其中,通过语音交互对智能家居设备进行控制,以其便利性逐渐成为一种重要的交互方式,在实际家居产品中应用较多。
目前,智能家居设备所采用的语音交互方案大多为近场语音,近场语音识别方案中需要进行音频信号采集、压缩以及音频数据传输等一系列步骤。其中,在将音频数据传输至智能家居设备时,由于现有语音交互方案中传输带宽或传输方式的限制,会存在传输的数据丢包或数据流错误的现象,直接导致对智能家居设备的语音控制功能失效。
发明内容
基于此,有必要针对上述问题,提供一种语音数据传输方法、装置及语音终端设备,保证语音数据传输的稳定性与高效性,提升对智能家居设备的语音控制效果。
一种语音数据传输方法,所述的方法包括:
采集语音信号并进行预处理,得到音频信号;
将所述音频信号进行压缩编码,得到压缩编码后的语音数据;
依次从所述压缩编码后的语音数据中提取预设数据量的语音数据,封装得到至少一个所述请求语音包;
将所述请求语音包通过Wifi-P2P通讯方式传输至电器设备。
在其中一个实施例中,所述将所述音频信号进行压缩编码,生成请求语音包,包括:
将所述音频信号进行压缩编码,得到压缩编码后的语音数据;
依次从所述压缩编码后的语音数据中提取预设数据量的语音数据,封装得到至少一个所述请求语音包。
在其中一个实施例中,所述将所述音频信号进行压缩编码,得到压缩编码后的语音数据,包括:
将所述音频信号采用AMR编码格式进行压缩编码,得到压缩编码后的语音数据。
在其中一个实施例中,在所述压缩编码后的语音数据的总数据量大于所述预设数据量时,所述请求语音包至少包括开头请求语音包与结尾请求语音包;所述将所述请求语音包通过Wifi-P2P通讯方式传输至电器设备,包括:
将所述开头请求语音包通过Wifi-P2P通讯方式传输至所述电器设备;
在接收到所述电器设备根据所述开头请求语音包返回的开头应答信息后,将所述结尾请求语音包通过Wifi-P2P通讯方式传输至所述电器设备;
在接收到所述电器设备根据所述结尾请求语音包返回的结尾应答信息后,所述请求语音包传输结束。
在其中一个实施例中,在所述将所述开头请求语音包通过Wifi-P2P通讯方式传输至所述电器设备之后,还包括:
在未接收到所述电器设备根据所述开头请求语音包返回的开头应答信息时,返回所述将所述开头请求语音包通过Wifi-P2P通讯方式传输至所述电器设备的步骤,直至所述开头请求语音包的重传次数大于第一预设最大重传次数。
在其中一个实施例中,在所述将所述结尾请求语音包通过Wifi-P2P通讯方式传输至所述电器设备之后,还包括:
在未接收到所述电器设备根据所述结尾请求语音包返回的结尾应答信息时,返回所述将所述结尾请求语音包通过Wifi-P2P通讯方式传输至所述电器设备的步骤,直至所述结尾请求语音包的重传次数大于第二预设最大重传次数。
在其中一个实施例中,在所述压缩编码后的语音数据的总数据量大于所述预设数据量的两倍时,所述请求语音包还包括至少一个中间请求语音包;在所述接收到所述电器设备根据所述开头请求语音包返回的开头应答信息之后,以及在所述将所述结尾请求语音包通过Wifi-P2P通讯方式传输至所述电器设备之前,还包括:
将所述中间请求语音包通过Wifi-P2P通讯方式传输至所述电器设备。
在其中一个实施例中,在所述压缩编码后的语音数据的总数据量大于所述预设数据量的两倍时,所述请求语音包还包括至少一个中间请求语音包;在所述接收到所述电器设备根据所述开头请求语音包返回的开头应答信息之后,还包括:
将所述中间请求语音包通过Wifi-P2P通讯方式传输至所述电器设备;
在接收到所述电器设备根据所述中间请求语音包返回的中间应答信息后,执行所述将所述结尾请求语音包通过Wifi-P2P通讯方式传输至所述电器设备的步骤。
在其中一个实施例中,在所述将所述中间请求语音包通过Wifi-P2P通讯方式传输至所述电器设备之后,还包括:
在未接收到所述电器设备根据所述中间请求语音包返回的中间应答信息时,返回所述将所述中间请求语音包通过Wifi-P2P通讯方式传输至所述电器设备的步骤,直至所述中间请求语音包的重传次数大于第三预设最大重传次数;其中,所述第三预设最大重传次数小于所述第一预设最大重传次数与第二预设最大重传次数。
在其中一个实施例中,提供一种语音数据传输装置,所述的装置包括:
语音数据获取模块,用于采集语音信号并进行预处理,得到音频信号;
语音数据编码模块,用于将所述音频信号进行压缩编码,得到压缩编码后的语音数据;还用于依次从所述压缩编码后的语音数据中提取预设数据量的语音数据,封装得到至少一个所述请求语音包;
语音数据传输模块,用于将所述请求语音包通过Wifi-P2P通讯方式传输至电器设备。
在其中一个实施例中,提供一种语音终端设备,包括上述的语音数据传输装置。
上述语音数据传输方法、装置及语音终端设备,将采集与预处理后的音频信号进行压缩编码,按预设数据量对压缩编码后的语音数据切分提取,再封装得到多个请求语音包,然后采用Wifi-P2P通讯方式将多个请求语音包依次发送至电器设备,上述分包流式的传输方式保证了语音音频数据传输的可靠性与稳定性,可有效减少传输过程中的数据丢失以及传输错误的问题,使电器设备的语音交互控制功能保持良好效果。
附图说明
图1为一实施例中语音数据传输方法的流程图;
图2为另一实施例中语音数据传输方法的流程图;
图3为另一实施例中语音数据传输方法的流程图;
图4为另一实施例中语音数据传输方法的流程图;
图5为一实施例中语音数据传输装置的***框图;
图6为一实施例中语音终端设备与电器设备的通讯示意图;
图7为一实施例中语音终端设备的数据传输流程图。
具体实施方式
为了使本申请的目的、技术方案及优点更加清楚明白,以下结合附图及实施例,对本申请进行进一步详细说明。应当理解,此处描述的具体实施例仅仅用以解释本申请,并不用于限定本申请。
除非另有定义,本文所使用的所有的技术和科学术语与属于本申请的技术领域的技术人员通常理解的含义相同。本文中在本申请的说明书中所使用的术语只是为了描述具体的实施例的目的,不是旨在于限制本申请。
可以理解,本申请所使用的术语“第一”、“第二”等可在本文中用于描述各种元件,但这些元件不受这些术语限制。这些术语仅用于将第一个元件与另一个元件区分。举例来说,在不脱离本申请的范围的情况下,可以将第一电阻称为第二电阻,且类似地,可将第二电阻称为第一电阻。第一电阻和第二电阻两者都是电阻,但其不是同一电阻。
可以理解,以下实施例中的“连接”,如果被连接的电路、模块、单元等相互之间具有电信号或数据的传递,则应理解为“电连接”、“通信连接”等。
在此使用时,单数形式的“一”、“一个”和“所述/该”也可以包括复数形式,除非上下文清楚指出另外的方式。还应当理解的是,术语“包括/包含”或“具有”等指定所陈述的特征、整体、步骤、操作、组件、部分或它们的组合的存在,但是不排除存在或添加一个或更多个其他特征、整体、步骤、操作、组件、部分或它们的组合的可能性。
随着物联网与人工智能技术的快速发展,越来越多的创新功能融入家庭生活中,例如通过语音交互对智能家居设备进行控制,以其便利性逐渐成为一种重要的交互方式,在实际家居产品中应用较多。目前,智能家居设备所采用的语音交互方案大多为近场语音,近场语音识别方案中需要进行音频信号采集、压缩以及音频数据传输等一系列步骤。其中,在将音频数据传输至智能家居设备时,由于现有语音交互方案中传输带宽或传输方式的限制,会存在传输的数据丢包或数据流错误的现象,直接导致对智能家居设备的语音控制功能失效。
因此,本申请提供一种基于Wifi-P2P通讯技术的语音数据传输方法,可应用于空调、洗衣机、吸尘器、电饭煲以及电视机等根据用户的操作来执行固有的功能和动作的电器设备。采用语音终端设备与电器设备进行语音交互控制时,语音终端设备的请求语音包通过Wifi-P2P通讯技术进行分包流式传输,同时采用对应的闭环通讯和重传机制以保证音频数据的稳定及可靠传输,使电器设备的语音交互控制功能保持良好效果。
在一个实施例中,如图1所示,提供一种语音数据传输方法,包括:
步骤102:采集语音信号并进行预处理,得到音频信号。
具体地,语音终端设备采用麦克风采集用户的语音信号并进行预处理,得到的音频信号。其中,语音信号的内容不作限定,可以是用户为了控制电器设备的运行状态而输入的语音信号,也可以是用户为了得到相关信息而输入的语音信号,还可以是用户为了设定电器设备的事件而输入的语音信号。例如“将温度调高10度”、“开机”、“播报今天的天气”或“定时10点开机”等等语音输入。可以理解,语音信号为近场语音信号,即采集语音信号的语音终端设备设置于用户端,用户在对语音终端设备发出语音信号采集开始指令后,通过说话的方式输入。另外,预处理的方式并不唯一,例如可包括对语音信号进行滤波、放大与模数转换等,预处理成后续机器能识别的数字信号形式的音频信号,再将音频信号发给下一步进行压缩编码。
步骤104:将音频信号进行压缩编码,得到压缩编码后的语音数据。
具体地,由于音频信号中的数据实质是信息与数据冗余之和,因此为了减少音频信号中的冗余,使音频信号有效、高质量的被传输,需要对其进行压缩编码。其中,压缩编码的格式并不唯一,可以是采用PCM(Pulse Code Modulation,脉冲编码调制)编码,也可以是采用MP3(Moving Picture Experts Group,Audio Layer III)编码,还可以是采用WMA(Windows Media Audio)编码等可变速率语音编码技术。
优选地,在一个实施例中,音频信号采用AMR(Adaptive Multi-Rate,自适应多速率)编码格式进行压缩编码,得到压缩编码后的语音数据。具体地,AMR编码格式的压缩比非常高且可有效应用于压缩语音类音频数据的压缩。另外,AMR编码格式的语音带宽范围和采样频率还达到了节省传输频带资源、保持线路通信的高效率的目的。其中,AMR编码格式分为AMR-NB(AMR-NarrowBind)和AMR-WB(AMR WideBand)两大类。AMR-NB的语音带宽范围为300-3700Hz,采样频率为8KHz;AMR-WB的语音带宽范围为50-7000Hz,采样频率为16KHz。在本实施例中,音频信号采用AMR-NB编码格式进行压缩编码,得到压缩编码后的语音数据。AMR-NB编码资源占用小,选用其中语音比特率为12.2kbit/s的第7种编码模型对音频信号进行压缩编码,得到压缩编码后的语音数据以满足语音音频传输要求。
步骤106:依次从压缩编码后的语音数据中提取预设数据量的语音数据,封装得到至少一个请求语音包。
其中,为了提升音频信号的传输效率,本申请采用将压缩编码后的语音数据封装成多个请求语音包通过分包流式传输的方式进行传输。
具体地,对压缩编码后的语音数据进行分包提取的方式为依次从压缩编码后的语音数据中提取预设数据量的语音数据。在对音频信号进行压缩编码的过程中,当压缩编码的语音数据的数据量达到预设数据量时,对应提取封装得到一个请求语音包。其中,预设数据量的取值并不唯一,可根据历史音频信号传输过程中的经验值设定,以满足在提取工作量较小的情况下达到音频信号的传输效率最高。例如本实施例中,可设定为640字节,当压缩编码的语音数据的数据量达到640字节时,对应提取封装得到一个请求语音包。
可以理解,请求语音包由文件头、文件尾以及按预设数据量提取的中间语音数据封装得到。文件头位于上述中间语音数据之前,用于指示请求语音包的编码格式以及数据量等相关信息。文件尾位于上述中间语音数据之后,是请求语音包的结束表示,用于指示请求语音包是一个完整的文件。
进一步地,压缩编码后的语音数据的总数据量不同时,可对应得到封装后不同数量的请求语音包。在压缩编码后的语音数据的总数据量小于预设数据量时,请求语音包仅可封装得到一个开头请求语音包。在一个实施例中,在压缩编码后的语音数据的总数据量大于预设数据量时,分包后的请求语音包至少包括开头请求语音包与结尾请求语音包。进一步地,当压缩编码后的语音数据的总数据量大于预设数据量的两倍时,分包后的请求语音包还包括至少一个中间请求语音包。可以理解,每次传输的中间请求语音包的数量并不固定,会根据压缩编码后的语音数据的总数据量变化,压缩编码后的语音数据的总数据量越大,中间请求语音包的数量越多。此外,开头请求语音包、中间请求语音包与结尾请求语音包的顺序编号同样也是在其文件头中进行指示。
步骤108:将请求语音包通过Wifi-P2P通讯方式传输至电器设备。
其中,Wifi-P2P(peer-to-peer)通讯方式为一种点对点的通讯技术,即使在没有传统的Wi-Fi网络或Wi-Fi接入点的环境中,仍然能在两个设备之间直接建立tcp/ip链接,并不需要AP(Wireless Access Point,无线访问接入点)的参与。也称为Wi-Fi Direct,相比蓝牙、ZigBee等无线通信模块,其传输速度更快可以达到1M/s,传输带宽更大。采用Wifi-P2P通讯方式将请求语音包传输至电器设备,能有效避免传输效率低、丢包或数据流错误等现象。
具体地,在将请求语音包传输至电器设备的过程中,采用对开头请求语音包与结尾请求语音包进行闭环传输,对中间请求语音包进行非闭环传输,同时在进行闭环传输中未接收到应答信息的情况下,根据最大重传次数设定重传至电器设备的机制。
上述语音数据传输方法,将采集与预处理后的音频信号进行压缩编码,按预设数据量对压缩编码后的语音数据切分提取,再封装得到多个请求语音包,然后采用Wifi-P2P通讯方式将多个请求语音包依次发送至电器设备,上述分包流式的传输方式保证了语音音频数据传输的可靠性与稳定性,可有效减少传输过程中的数据丢失以及传输错误的问题,使电器设备的语音交互控制功能保持良好效果。
在一个实施例中,如图2所示,步骤108的将请求语音包通过Wifi-P2P通讯方式传输至电器设备,包括:
步骤201:将开头请求语音包通过Wifi-P2P通讯方式传输至电器设备。
具体地,当用户在对语音终端设备发出语音信号采集开始指令后,语音信号开始采集并进行预处理得到音频信号,然后在音频信号进行压缩编码的过程中,当压缩编码的语音数据的数据量第一次达到预设数据量时,对应提取并封装得到开头请求语音包。然后将该开头请求语音包通过Wifi-P2P通讯方式传输至电器设备。
进一步地,为了保证音频信号的起始过程可靠的传输,开头请求语音包为闭环传输,即在将该开头请求语音包通过Wifi-P2P通讯方式传输至电器设备后,需等待接收到电器设备根据开头请求语音包返回的开头应答信息,再进行下一请求语音包的传输。
因此,在一个实施例中,如图2所示,在步骤201之后,还包括:
步骤202:在未接收到电器设备根据开头请求语音包返回的开头应答信息时,返回将开头请求语音包通过Wifi-P2P通讯方式传输至电器设备的步骤,直至开头请求语音包的重传次数大于第一预设最大重传次数。
具体地,由于数据传输需要时间,请求语音包在通过Wifi-P2P通讯方式传输至电器设备后,通讯正常的情况下,电器设备将在预设反馈时间内返回应答信息。那么,在经过预设反馈时间后,未接收到电器设备根据开头请求语音包返回的开头应答信息时,将开头请求语音包通过Wifi-P2P通讯方式重传至电器设备。其中,预设反馈时间的取值并不唯一,可根据两边设备的实际通讯情况设定,一般设置为几十毫秒。可以理解,如果重新传输开头请求语音包后还是未在预设反馈时间内接收到应答信息,则继续重传开头请求语音包,直至重传连续第一预设最大重传次数均未接收到应答信息,则停止重传开头请求语音包。
进一步地,在开头请求语音包的重传次数大于第一预设最大重传次数时,表示语音终端设备与电器设备的通讯存在错误,将中止传输,并反馈对应开头请求语音包传输失败的错误码。其中,第一预设最大重传次数为开头请求语音包的最大重传次数,取值并不固定,可根据实际通讯方式进行设定,例如本实施例设置为三次。
此外,在语音终端设备与电器设备进行Wifi-P2P通讯进行数据传输时,均可自主选择多个信道中的一个,但只有两个P2P设备在同一个信道上时才可交换信息。因此,开头请求语音包通过Wifi-P2P通讯方式传输至电器设备的过程中还需进行两个P2P设备的信道匹配。在一个实施例中,将开头请求语音包通过Wifi-P2P通讯方式重传至电器设备时,包括:将开头请求语音包通过Wifi-P2P通讯方式在同一信道内重传至电器设备,或将开头请求语音包通过Wifi-P2P通讯方式在不同信道内重传至电器设备。具体地,开头请求语音包在本实施例中采用相同的第一预设最大重传次数进行重传。此外,当在某一信道内开头请求语音包通过Wifi-P2P通讯方式传输至电器设备,且接收到电器设备根据开头请求语音包返回的开头应答信息时,该信道即作为后续请求语音包传输的锁定信道,后续请求语音包仅在该锁定信道内进行重传。
进一步地,接收到电器设备根据开头请求语音包返回的开头应答信息后,表示开头请求语音包传输成功,可进行后续传输过程。其中,在接收到电器设备根据开头请求语音包返回的开头应答信息后,可根据是否存在中间请求语音包确定后续的传输过程。在一个实施例中,假设不包括中间请求语音包,则如图2所示,在步骤201之后,包括:
步骤205:将结尾请求语音包通过Wifi-P2P通讯方式传输至电器设备。
具体地,当用户通过语音终端设备发出语音信号结束,预处理得到音频信号,再进行压缩编码得到语音数据,对应根据预设数据量提取并封装得到的最后一个请求语音包为结尾请求语音包。为了保证音频信号的起始过程可靠的传输,结尾请求语音包也为闭环传输,即在将该结尾请求语音包通过Wifi-P2P通讯方式传输至电器设备后,需等待接收到电器设备根据结尾请求语音包返回的结尾应答信息,整个传输过程才结束。
因此,在一个实施例中,如图2所示,在步骤205之后,还包括:
步骤206:在未接收到电器设备根据结尾请求语音包返回的结尾应答信息时,返回将结尾请求语音包通过Wifi-P2P通讯方式传输至电器设备的步骤,直至结尾请求语音包的重传次数大于第二预设最大重传次数。
具体地,与开头请求语音包重传机制类似,在经过预设反馈时间后,未接收到电器设备根据结尾请求语音包返回的结尾应答信息时,将结尾请求语音包通过Wifi-P2P通讯方式在锁定信道内重传至电器设备。在结尾请求语音包的重传次数大于第二预设最大重传次数时,表示语音终端设备与电器设备在结尾请求语音包传输时通讯存在错误,将中止传输,并反馈对应结尾请求语音包传输失败的错误码。其中,第二预设最大重传次数为结尾请求语音包的最大重传次数,取值并不固定,可根据实际通讯方式进行设定,可设置为与第一预设最大重传次数一致,也可以设定为比第一预设最大重传次数少的数字。
步骤207:在接收到电器设备根据结尾请求语音包返回的结尾应答信息后,请求语音包传输结束。
具体地,接收到电器设备根据结尾请求语音包返回的结尾应答信息后,表示结尾请求语音包传输成功。当结尾请求语音包传输成功后,即表示用户当前输入的语音信号均传输成功,请求语音包传输结束。
在一个实施例中,假设包括中间请求语音包,则如图3所示,在步骤201之后,步骤205之前,还包括:
步骤203:将中间请求语音包通过Wifi-P2P通讯方式传输至电器设备。
具体地,在音频信号进行压缩编码的过程中,每一次压缩编码的语音数据的数据量达到预设数据量时,对应提取并封装得到一个中间请求语音包,然后将该中间请求语音包通过Wifi-P2P通讯方式传输至电器设备。进一步地,为了更快的将大量请求语音包传送出去,避免语音数据在语音终端设备中堆积,在本实施例中,中间请求语音包为非闭环传输,即在将该中间请求语音包通过Wifi-P2P通讯方式传输至电器设备后,无需等待接收到电器设备根据中间请求语音包返回的中间应答信息,即可进行下一中间请求语音包的传输。当所有中间请求语音包均传输完毕后,直接进入步骤205。
在其他实施例中,如图4所示,中间请求语音包可同样为闭环传输,即在将该中间请求语音包通过Wifi-P2P通讯方式传输至电器设备后,需等待接收到电器设备根据中间请求语音包返回的中间应答信息,才能进入下一中间请求语音包的传输。只有接收到电器设备根据最后一个中间请求语音包返回的中间应答信息时,才进入步骤205,执行将结尾请求语音包通过Wifi-P2P通讯方式传输至电器设备的步骤。
在一个实施例中,如图4所示,在步骤203之后,步骤205之前,还包括:
步骤204:在未接收到电器设备根据中间请求语音包返回的中间应答信息时,返回将中间请求语音包通过Wifi-P2P通讯方式传输至电器设备的步骤,直至中间请求语音包的重传次数大于第三预设最大重传次数;其中,第三预设最大重传次数小于第一预设最大重传次数与第二预设最大重传次数。
具体地,与上述开头以及结尾请求语音包重传机制类似,在经过预设反馈时间后,未接收到电器设备根据结尾请求语音包返回的结尾应答信息时,将对应的中间请求语音包通过Wifi-P2P通讯方式在锁定信道内重传至电器设备。在中间请求语音包的重传次数大于第三预设最大重传次数时,表示语音终端设备与电器设备在中间请求语音包传输时通讯存在错误,将反馈对应中间请求语音包传输失败的错误码。其中,第三预设最大重传次数为中间请求语音包的最大重传次数,取值可设定为比第一预设最大重传次数与第二预设最大重传次数均小的数字,以便更快的将大量语音数据包传送出去。
优选地,在对上述中间请求语音包进行压缩编码的过程中,可通过对其音频中含有的有效信息进行检测,只有当有效帧占比大于预设占比阈值时,才将对应的中间请求语音包采用闭环传输,否则采用非闭环传输。其中,有效帧占比为其有效帧占总帧数的比例,预设占比阈值的取值并不唯一,例如可以设定为80%。有效帧的检测方式可采用例如语音频带能量熵、编码码率等参数进行检测得到。
上述实施例中,通过对依次传输的各请求语音包设置对应的传输与重传机制,既能保证音频数据起始过程以及中间有效信息的稳定及可靠传输,还能避免浪费音频数据传输时的带宽,起到降低功耗以及降低时延的作用,避免大量音频数据在语音终端设备处堆积。
应该理解的是,虽然如上所述的各实施例所涉及的流程图中的各个步骤按照箭头的指示依次显示,但是这些步骤并不是必然按照箭头指示的顺序依次执行。除非本文中有明确的说明,这些步骤的执行并没有严格的顺序限制,这些步骤可以以其它的顺序执行。而且,如上所述的各实施例所涉及的流程图中的至少一部分步骤可以包括多个步骤或者多个阶段,这些步骤或者阶段并不必然是在同一时刻执行完成,而是可以在不同的时刻执行,这些步骤或者阶段的执行顺序也不必然是依次进行,而是可以与其它步骤或者其它步骤中的步骤或者阶段的至少一部分轮流或者交替地执行。
基于同样的发明构思,本申请实施例还提供了一种用于实现上述所涉及的语音数据传输方法的语音数据传输装置。该装置所提供的解决问题的实现方案与上述方法中所记载的实现方案相似,故下面所提供的一个或多个语音数据传输装置实施例中的具体限定可以参见上文中对于语音数据传输方法的限定,在此不再赘述。
在一个实施例中,如图5所示,提供一种语音数据传输装置500,包括:语音数据获取模块510、语音数据编码模块520以及语音数据传输模块530,其中:
语音数据获取模块510,用于采集语音信号并进行预处理,得到音频信号;
语音数据编码模块520,用于将音频信号进行压缩编码,得到压缩编码后的语音数据;还用于依次从压缩编码后的语音数据中提取预设数据量的语音数据,封装得到至少一个请求语音包;
语音数据传输模块530,用于将请求语音包通过Wifi-P2P通讯方式传输至电器设备。
在一个实施例中,语音数据编码模块520还用于将音频信号采用AMR编码格式进行压缩编码,得到压缩编码后的语音数据。
在一个实施例中,在压缩编码后的语音数据的总数据量大于预设数据量时,请求语音包至少包括开头请求语音包与结尾请求语音包。则语音数据传输模块530还用于将开头请求语音包通过Wifi-P2P通讯方式传输至电器设备;并在接收到电器设备根据开头请求语音包返回的开头应答信息后,将结尾请求语音包通过Wifi-P2P通讯方式传输至电器设备;然后在接收到电器设备根据结尾请求语音包返回的结尾应答信息后,请求语音包传输结束。
在一个实施例中,语音数据传输模块530,还用于在未接收到电器设备根据开头请求语音包返回的开头应答信息时,返回将开头请求语音包通过Wifi-P2P通讯方式传输至电器设备的步骤,直至开头请求语音包的重传次数大于第一预设最大重传次数。
在一个实施例中,语音数据传输模块530,还用于在未接收到电器设备根据结尾请求语音包返回的结尾应答信息时,返回将结尾请求语音包通过Wifi-P2P通讯方式传输至电器设备的步骤,直至结尾请求语音包的重传次数大于第二预设最大重传次数。
在一个实施例中,在压缩编码后的语音数据的总数据量大于预设数据量的两倍时,请求语音包还包括至少一个中间请求语音包。语音数据传输模块530,还用于在接收到电器设备根据开头请求语音包返回的开头应答信息之后,以及在将结尾请求语音包通过Wifi-P2P通讯方式传输至电器设备之前,将中间请求语音包通过Wifi-P2P通讯方式传输至电器设备。
在一个实施例中,在压缩编码后的语音数据的总数据量大于预设数据量的两倍时,请求语音包还包括至少一个中间请求语音包。语音数据传输模块530,还用于在接收到电器设备根据开头请求语音包返回的开头应答信息之后,将中间请求语音包通过Wifi-P2P通讯方式传输至电器设备;并在接收到电器设备根据中间请求语音包返回的中间应答信息后,执行将结尾请求语音包通过Wifi-P2P通讯方式传输至电器设备的步骤。
在一个实施例中,语音数据传输模块530,还用于在未接收到电器设备根据中间请求语音包返回的中间应答信息时,返回将中间请求语音包通过Wifi-P2P通讯方式传输至电器设备的步骤,直至中间请求语音包的重传次数大于第三预设最大重传次数;其中,第三预设最大重传次数小于第一预设最大重传次数与第二预设最大重传次数。
上述实施例中,将采集与预处理后的音频信号进行压缩编码,按预设数据量对压缩编码后的语音数据切分提取,再封装得到多个请求语音包,然后采用Wifi-P2P通讯方式将多个请求语音包依次发送至电器设备,分包流式的传输方式保证了语音音频数据传输的可靠性与稳定性,可有效减少传输过程中的数据丢失以及传输错误的问题,使电器设备的语音交互控制功能保持良好效果。
上述语音数据传输装置中的各个模块可全部或部分通过软件、硬件及其组合来实现。上述各模块可以硬件形式内嵌于或独立于计算机设备中的处理器中,也可以以软件形式存储于计算机设备中的存储器中,以便于处理器调用执行以上各个模块对应的操作。
在一个实施例中,提供一种语音终端设备,包括上述的语音数据传输装置。
具体地,语音终端设备为实现电器设备的近场语音控制的采集端,可以是电器设备对应的遥控器,也可以是采用手机、平板电脑以及可穿戴设备等移动终端。如图6以及图7所示,语音终端设备中的语音数据传输装置采用麦克风采集近场语音,然后采用音频ADC芯片实现对语音信号的预处理,采用Wifi模块对预处理后的数据进行编码、分包压缩,最后根据控制器的逻辑控制与调度,Wifi模块通过Wifi-P2P通讯将流式语音数据包采用闭环通讯和重传机制传输数据,最终实现电器设备稳定及可靠的接收语音数据。其中。控制器采用微控制单元(Microcontroller Unit,MCU)实现。
可以理解,在采集语音信号时,发出语音信号采集开始指令以及采集结束指令的方式可根据采用的不同语音终端设备有所不同。例如,当语音终端设备采用的是电器设备对应的遥控器,发出语音信号采集开始指令以及采集结束指令可以是通过按下遥控器的语音采集按键以及松开遥控器的语音采集按键来实现。当语音终端设备采用的手机上的小程序时,发出语音信号采集开始指令以及采集结束指令可以是通过按一次以及再按一次的方式实现,不作次限定,可根据实际情况设定。
在一个实施例中,语音终端设备还包括存储器,存储器存储有计算机程序,控制器执行计算机程序时实现将请求语音包通过Wifi-P2P通讯方式传输至电器设备的步骤。
以上所述实施例的各技术特征可以进行任意的组合,为使描述简洁,未对上述实施例中的各个技术特征所有可能的组合都进行描述,然而,只要这些技术特征的组合不存在矛盾,都应当认为是本说明书记载的范围。
以上所述实施例仅表达了本申请的几种实施方式,其描述较为具体和详细,但并不能因此而理解为对发明专利范围的限制。应当指出的是,对于本领域的普通技术人员来说,在不脱离本申请构思的前提下,还可以做出若干变形和改进,这些都属于本申请的保护范围。因此,本申请专利的保护范围应以所附权利要求为准。
Claims (10)
1.一种语音数据传输方法,其特征在于,所述的方法包括:
采集语音信号并进行预处理,得到音频信号;
将所述音频信号进行压缩编码,得到压缩编码后的语音数据;
依次从所述压缩编码后的语音数据中提取预设数据量的语音数据,封装得到至少一个所述请求语音包;
将所述请求语音包通过Wifi-P2P通讯方式传输至电器设备。
2.根据权利要求1所述的语音数据传输方法,其特征在于,所述将所述音频信号进行压缩编码,得到压缩编码后的语音数据,包括:
将所述音频信号采用AMR编码格式进行压缩编码,得到压缩编码后的语音数据。
3.根据权利要求1所述的语音数据传输方法,其特征在于,在所述压缩编码后的语音数据的总数据量大于所述预设数据量时,所述请求语音包至少包括开头请求语音包与结尾请求语音包;所述将所述请求语音包通过Wifi-P2P通讯方式传输至电器设备,包括:
将所述开头请求语音包通过Wifi-P2P通讯方式传输至所述电器设备;
在接收到所述电器设备根据所述开头请求语音包返回的开头应答信息后,将所述结尾请求语音包通过Wifi-P2P通讯方式传输至所述电器设备;
在接收到所述电器设备根据所述结尾请求语音包返回的结尾应答信息后,所述请求语音包传输结束。
4.根据权利要求3所述的语音数据传输方法,其特征在于,在所述将所述开头请求语音包通过Wifi-P2P通讯方式传输至所述电器设备之后,还包括:
在未接收到所述电器设备根据所述开头请求语音包返回的开头应答信息时,返回所述将所述开头请求语音包通过Wifi-P2P通讯方式传输至所述电器设备的步骤,直至所述开头请求语音包的重传次数大于第一预设最大重传次数。
5.根据权利要求3所述的语音数据传输方法,其特征在于,在所述将所述结尾请求语音包通过Wifi-P2P通讯方式传输至所述电器设备之后,还包括:
在未接收到所述电器设备根据所述结尾请求语音包返回的结尾应答信息时,返回所述将所述结尾请求语音包通过Wifi-P2P通讯方式传输至所述电器设备的步骤,直至所述结尾请求语音包的重传次数大于第二预设最大重传次数。
6.根据权利要求5所述的语音数据传输方法,其特征在于,在所述压缩编码后的语音数据的总数据量大于所述预设数据量的两倍时,所述请求语音包还包括至少一个中间请求语音包;在所述接收到所述电器设备根据所述开头请求语音包返回的开头应答信息之后,以及在所述将所述结尾请求语音包通过Wifi-P2P通讯方式传输至所述电器设备之前,还包括:
将所述中间请求语音包通过Wifi-P2P通讯方式传输至所述电器设备。
7.根据权利要求5所述的语音数据传输方法,其特征在于,在所述压缩编码后的语音数据的总数据量大于所述预设数据量的两倍时,所述请求语音包还包括至少一个中间请求语音包;在所述接收到所述电器设备根据所述开头请求语音包返回的开头应答信息之后,还包括:
将所述中间请求语音包通过Wifi-P2P通讯方式传输至所述电器设备;
在接收到所述电器设备根据所述中间请求语音包返回的中间应答信息后,执行所述将所述结尾请求语音包通过Wifi-P2P通讯方式传输至所述电器设备的步骤。
8.根据权利要求7所述的语音数据传输方法,其特征在于,在所述将所述中间请求语音包通过Wifi-P2P通讯方式传输至所述电器设备之后,还包括:
在未接收到所述电器设备根据所述中间请求语音包返回的中间应答信息时,返回所述将所述中间请求语音包通过Wifi-P2P通讯方式传输至所述电器设备的步骤,直至所述中间请求语音包的重传次数大于第三预设最大重传次数;其中,所述第三预设最大重传次数小于所述第一预设最大重传次数与第二预设最大重传次数。
9.一种语音数据传输装置,其特征在于,所述的装置包括:
语音数据获取模块,用于采集语音信号并进行预处理,得到音频信号;
语音数据编码模块,用于将所述音频信号进行压缩编码,得到压缩编码后的语音数据;还用于依次从所述压缩编码后的语音数据中提取预设数据量的语音数据,封装得到至少一个所述请求语音包;
语音数据传输模块,用于将所述请求语音包通过Wifi-P2P通讯方式传输至电器设备。
10.一种语音终端设备,其特征在于,包括权利要求9所述的语音数据传输装置。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202210118087.7A CN114553622A (zh) | 2022-02-08 | 2022-02-08 | 语音数据传输方法、装置及语音终端设备 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202210118087.7A CN114553622A (zh) | 2022-02-08 | 2022-02-08 | 语音数据传输方法、装置及语音终端设备 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN114553622A true CN114553622A (zh) | 2022-05-27 |
Family
ID=81674545
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202210118087.7A Pending CN114553622A (zh) | 2022-02-08 | 2022-02-08 | 语音数据传输方法、装置及语音终端设备 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN114553622A (zh) |
Citations (8)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN101179362A (zh) * | 2006-11-07 | 2008-05-14 | 中兴通讯股份有限公司 | 适宜移动流媒体应用的自动重传请求机制 |
CN101621368A (zh) * | 2009-08-13 | 2010-01-06 | 北京必创科技有限公司 | 一种重传数据包的方法、装置及*** |
CN101699532A (zh) * | 2009-09-17 | 2010-04-28 | 陕西科技大学 | 一种家用电器的智能远程遥控装置及控制方法 |
CN102111314A (zh) * | 2010-12-30 | 2011-06-29 | 广州市聚晖电子科技有限公司 | 一种基于蓝牙传输的智能家居语音控制***及方法 |
CN103208285A (zh) * | 2012-09-07 | 2013-07-17 | 深圳市信利康电子有限公司 | 基于移动通讯终端语音交互的家电控制方法及*** |
CN108831448A (zh) * | 2018-03-22 | 2018-11-16 | 北京小米移动软件有限公司 | 语音控制智能设备的方法、装置及存储介质 |
CN112751644A (zh) * | 2019-10-29 | 2021-05-04 | 腾讯科技(深圳)有限公司 | 数据传输方法、装置及***、电子设备 |
CN113539264A (zh) * | 2021-07-13 | 2021-10-22 | 广东金鸿星智能科技有限公司 | 一种语音控制电动门的语音指令数据传输方法及*** |
-
2022
- 2022-02-08 CN CN202210118087.7A patent/CN114553622A/zh active Pending
Patent Citations (8)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN101179362A (zh) * | 2006-11-07 | 2008-05-14 | 中兴通讯股份有限公司 | 适宜移动流媒体应用的自动重传请求机制 |
CN101621368A (zh) * | 2009-08-13 | 2010-01-06 | 北京必创科技有限公司 | 一种重传数据包的方法、装置及*** |
CN101699532A (zh) * | 2009-09-17 | 2010-04-28 | 陕西科技大学 | 一种家用电器的智能远程遥控装置及控制方法 |
CN102111314A (zh) * | 2010-12-30 | 2011-06-29 | 广州市聚晖电子科技有限公司 | 一种基于蓝牙传输的智能家居语音控制***及方法 |
CN103208285A (zh) * | 2012-09-07 | 2013-07-17 | 深圳市信利康电子有限公司 | 基于移动通讯终端语音交互的家电控制方法及*** |
CN108831448A (zh) * | 2018-03-22 | 2018-11-16 | 北京小米移动软件有限公司 | 语音控制智能设备的方法、装置及存储介质 |
CN112751644A (zh) * | 2019-10-29 | 2021-05-04 | 腾讯科技(深圳)有限公司 | 数据传输方法、装置及***、电子设备 |
CN113539264A (zh) * | 2021-07-13 | 2021-10-22 | 广东金鸿星智能科技有限公司 | 一种语音控制电动门的语音指令数据传输方法及*** |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN109785841B (zh) | 一种蓝牙智能设备语音交互***及方法 | |
CN104917671B (zh) | 基于移动终端的音频处理方法和装置 | |
WO2019052582A1 (zh) | 音频编码方法、解码方法、装置及音频编解码*** | |
WO2014023257A1 (zh) | 指令处理方法、装置和*** | |
CN110121114A (zh) | 发送流数据的方法及数据发送设备 | |
CN102905128B (zh) | 编解码处理器在无线视频传输过程中码率控制的方法 | |
CN102868939A (zh) | 一种实时视频监控***中音视频数据的同步方法 | |
CN207558417U (zh) | 智能家居控制*** | |
CN110177363B (zh) | 蓝牙数据传输方法、装置、蓝牙芯片和存储介质 | |
CN106658369B (zh) | 一种双向语音通信设备、通信***及通信方法 | |
CN104506287A (zh) | 一种td-lte应急通信下的实时语音通信方法 | |
CN102968897A (zh) | 基于手持设备的家电遥控方法 | |
CN101931799A (zh) | 一种视频码流的平滑方法及装置 | |
CN102088593A (zh) | 基于蓝牙3.0规范的mpeg4压缩视频传输通信***及方法 | |
WO2019196158A1 (zh) | 一种转码任务的处理方法、***及任务管理服务器 | |
CN108632679B (zh) | 一种多媒体数据传输的方法和一种视联网终端 | |
CN104656905A (zh) | 语音遥控器的语音启动方法和装置 | |
CN114553622A (zh) | 语音数据传输方法、装置及语音终端设备 | |
CN102790671A (zh) | 一种基于ZigBee技术的无线全双工实时语音传输装置和方法 | |
CN104050968B (zh) | 一种嵌入式音频采集端aac音频编码方法 | |
CN105450980A (zh) | 一种高清航拍控制与视频回传方法及*** | |
CN105187688A (zh) | 一种对手机采集的实时视频和音频进行同步的方法及*** | |
CN113141520A (zh) | 视频流传输方法、装置、电子设备及存储介质 | |
CN114024787B (zh) | 智能家居的远程控制方法、装置、设备和存储介质 | |
CN105306964A (zh) | 一种视频流转码故障快速恢复***及恢复方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
RJ01 | Rejection of invention patent application after publication | ||
RJ01 | Rejection of invention patent application after publication |
Application publication date: 20220527 |