CN105429855A - 一种基于语音的通信方法 - Google Patents

一种基于语音的通信方法 Download PDF

Info

Publication number
CN105429855A
CN105429855A CN201510844983.1A CN201510844983A CN105429855A CN 105429855 A CN105429855 A CN 105429855A CN 201510844983 A CN201510844983 A CN 201510844983A CN 105429855 A CN105429855 A CN 105429855A
Authority
CN
China
Prior art keywords
voice
data
signal
filter function
cloud platform
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201510844983.1A
Other languages
English (en)
Inventor
王天宇
宋雷
刘爽
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Chengdu Wishcloud Technology Co Ltd
Original Assignee
Chengdu Wishcloud Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Chengdu Wishcloud Technology Co Ltd filed Critical Chengdu Wishcloud Technology Co Ltd
Priority to CN201510844983.1A priority Critical patent/CN105429855A/zh
Publication of CN105429855A publication Critical patent/CN105429855A/zh
Pending legal-status Critical Current

Links

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L51/00User-to-user messaging in packet-switching networks, transmitted according to store-and-forward or real-time protocols, e.g. e-mail
    • H04L51/07User-to-user messaging in packet-switching networks, transmitted according to store-and-forward or real-time protocols, e.g. e-mail characterised by the inclusion of specific contents
    • H04L51/10Multimedia information
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L65/00Network arrangements, protocols or services for supporting real-time applications in data packet communication
    • H04L65/60Network streaming of media packets
    • H04L65/70Media network packetisation

Landscapes

  • Engineering & Computer Science (AREA)
  • Multimedia (AREA)
  • Computer Networks & Wireless Communication (AREA)
  • Signal Processing (AREA)
  • Telephonic Communication Services (AREA)

Abstract

本发明提供了一种基于语音的通信方法,该方法包括:现场终端对语音数据进行去噪处理,将去噪后的数据上传到所述云平台,并通过所述云平台传送到监控终端。本发明提出了一种基于语音的通信方法,在语音传输中提高了网络稳定性,提升了通话质量,取得了较高的信噪比增量和降噪效果。

Description

一种基于语音的通信方法
技术领域
本发明涉及即时通讯,特别涉及一种语音通讯实现方法。
背景技术
基于移动设备的监控通讯***,在企业日常工作中由相关工作人员随身携带或是手持设备位于现场,通过3G或WiFi信号进行即时通讯,将现场的实时语音和音频信息及时回传到监控人员,由于设备简单,易于携带等优点,因此得到广泛应用,例如勘察、传媒、物流运输等行业。对于企业及时了解现场情况作出有效解决方案具有极大的意义。加入语音和音频传输之后将会极大地提高终端人员的应用范围与效率。然而现有的通讯***普遍多为端到端的直接通信,各个终端所在现场的网络状况不确定的情况下,流媒体传输缺乏稳定性,容易发生数据包丢失和延迟,导致通话质量显著下降,并且对复杂的环境噪声没有针对性的控制手段,难以达到较好的主观体验。
发明内容
为解决上述现有技术所存在的问题,本发明提出了一种基于语音的通信方法,包括:
现场终端对语音数据进行去噪处理,将去噪后的数据上传到所述云平台,并通过所述云平台传送到监控终端。
优选地,所述云平台包括通信服务器和数据传输服务器,云平台通信服务器进行信令的解析与转发,处理来自监控终端的对语音操作的会话连接信令;而云平台数据传输服务器提供语音的上行通道,把现场终端的语音转发给监控终端用户,同时提供语音的下行通道,从监控终端到现场终端的语音信号转发;在现场终端,语音数据按8000Hz采样,16位单声道PCM数据,将采集到的数据根据G723算法进行压缩,在多播或单播的网络服务上提供端对端的网络传输,对于接收的音频数据,经过G723算法解压,将音频播放设备的参数设置成8000Hz采样,16位单声道PCM数据执行播放。
优选地,所述对语音数据进行去噪处理,进一步包括:
在第一级滤波中,将输入信号x(t)分为s0(t)+u(t);其中s0(t)为参考信号,u(t)为低幅噪声信号;将与参考信号s0(t)相关的信号s1(t)作为第一级滤波函数的参考信号,经第一级滤波函数后将其权重向量调整后为s’1(t);
计算第一级滤波输出的误差信号为:
e1(t)=x(t)-s’1(t)=s0(t)+u(t)-s’1(t)
当e1(t)的均方差达到最小值时,调节滤波函数的权重系数,使之满足e”(t)=s0(t)-s’1(t),其中e”(t)的值逼近0;
将第一级滤波的输出y1(t)=e”(t)+u(t)直接作为第二级滤波函数的参考信号,将x(t)作为第二级滤波函数的输入,调节e”(t)和u(t)权重系数分别为e”’(t)和u’(t),第二级滤波函数输出的误差信号为:
y2(t)=x(t)-[e”’(t)+u’(t)]=[s0(t)-e”’(t)]+[u(t)-u’(t)]
其中e”’(t)逼近e”(t),并且u’(t)逼近u(t),通过第二级滤波函数输出去噪之后的音频信号。。
本发明相比现有技术,具有以下优点:
本发明提出了一种基于语音的通信方法,在语音传输中提高了网络稳定性,提升了通话质量,取得了较高的信噪比增量和降噪效果。
附图说明
图1是根据本发明实施例的一种基于语音的通信方法的流程图。
具体实施方式
下文与图示本发明原理的附图一起提供对本发明一个或者多个实施例的详细描述。结合这样的实施例描述本发明,但是本发明不限于任何实施例。本发明的范围仅由权利要求书限定,并且本发明涵盖诸多替代、修改和等同物。在下文描述中阐述诸多具体细节以便提供对本发明的透彻理解。出于示例的目的而提供这些细节,并且无这些具体细节中的一些或者所有细节也可以根据权利要求书实现本发明。
本发明的一方面提供了一种基于语音的通信方法。图1是根据本发明实施例的一种基于语音的通信方法流程图。
本发明在基于移动终端进行双向语音传输的即时通讯,即从现场终端经云平台转发到监控终端,从监控终端经云平台转发到现场终端的语音传输。其中现场终端用于语音数据的采集、编码压缩、去噪与实时播放,对信息进行存储并将语音数据上传到云平台;云平台包括通信服务器和数据传输服务器,通信服务器用于转发连接消息,数据传输服务器用于转发语音数据;监控终端则是用来接收从现场终端上传的语音,因此需要接收解码并播放接收到的语音信息,并且可以实现控制、数据存储以及用户设备管理。
现场终端将需要传送的语音数据分割成固定大小的数据段,利用序列号和时间戳对每个数据段进行标识,将数据段封装到数据包中。现场终端统计传输过程中丢包率,并检测当前可用带宽;在检测链路的带宽过程中,记录连续数据包之间的间隔时间,通过均值滤波函数过滤后,使用平均值估计带宽容量。现场终端基于当前丢包率和所检测的带宽来调整发送速度;为了减轻现场终端的工作,降低数据传输服务器的资源开销,本发明采用数据传输服务器定期应答的方式对发送速度进行反馈,数据传输服务器每隔预定时间向现场终端发送一个反馈信号,现场终端根据收到的反馈信号调节数据发送速度。反馈信号中包含如下内容:该反馈间隔内收到的数据包总数量;该反馈间隔内丢失的数据包总数量;检测得到的网络带宽;该反馈间隔内发生的丢包事件数量。在每个传输周期完成时,服务器将丢失的数据段的标识信息反馈给现场终端,请求重新发送。现场终端在下一个传输周期重新发送这些丢失的数据包,整个过程反复进行,直到所有的数据包都被成功接收。
在第一个传输周期,数据传输服务器通过序列号判断数据包有无丢失,如果一次丢包事件内连续丢失了多个数据包,则记录丢失的第一个和最后一个数据包的序列号,并加上连续丢包的标志位,以降低反馈的数据量。在传输周期结束时,现场终端向数据传输服务器发送传送完成的信号,数据传输服务器收到信号后,将丢包链表反馈给现场终端。现场终端重新发送丢失的数据包,整个过程循环进行,直到数据传输服务器成功接收到所有的数据包。
本发明中语音数据按8000Hz采样,16位单声道PCM数据,采集到的数据根据G723算法进行压缩。在发送之前还需要将语音数据进行去噪和RTSP打包,在多播或单播的网络服务上提供端对端的网络传输功能,适合传输实时数据。而接收的音频数据,经过G723算法解压,将音频播放设备的参数设置成8000Hz采样,16位单声道PCM数据即可正常播放。
云平台的通信服务器实现信令的解析与转发,处理来自监控终端的对语音操作的会话连接信令,如打开语音双向或仅开单向语音等。数据传输服务器提供语音的上行通道,把现场终端的语音转发给监控终端用户,同时提供语音的下行通道,从监控终端到现场终端一对一的语音信号的转发。
当现场终端的数据上传时,数据传输服务器将该数据直接转发给请求的用户;对于语音下行,因为在现场终端,目前直接接收RTSP数据,然后进行解码。所以,采用跟上行一样的方式,采用G723数据,进行RTSP打包发送,数据传输服务器直接用于转发,到某一台设备,在终端接收,解码播放。
监控终端的音频处理包括音频上行处理和音频下行处理。上行语音数据的处理包括接收、解压和播放。监控终端运行过程中,多路语音同时播放,每路音频数据也同时接收,但是考虑到多路声音同时播放会造成听觉上的干扰,所以用户可根据需要随时切换收听任意一路音频,其他路的音频则采用静音处理。
由于网络的不稳定,RTSP语音包可能会出现乱序,因此会首先对RTSP数据包进行排序,将排序好的数据存入一级缓存中;然后从一级缓存中取出语音包,利用G723解压算法对其进行解压,将解压好的数据放入二级缓存中;最后从二级缓存中取出语音数据,设置语音数据播放格式,即8000Hz采样、16位单声道PCM数据,并嵌入时间戳。完成以上操作,将数据推送到一级缓存中,便可以实现语音数据的播放。
语音下行包括语音的采集、编码和发送。监控终端音频采集首先初始化音频采集设备、音频采集格式等具体参数。然后通过设备对象创建采集缓冲区对象并初始化通知机制。最后在需要音频采集时触发音频采集主程序,设备将数据写入缓冲区,应用程序主动从缓冲区将数据读出,这样就实现了音频采集的功能。为保持与终端发送的数据的一致性,因此监控终端语音数据也是按照8000Hz采样的16位单声道PCM语音数据。采集到语音数据之后便是对数据进行G723编码。
在上述监控终端和现场终端向云平台上传语音数据过程中,不同的现场设备难免处于多种噪声源的环境,给提取和处理带来的极大的困难,造成巨大的影响。对于信噪比较大的情况,也即如果噪声信号很小,这时候如果选取噪声信号作为参考,对噪声的消除就无法达到很好的效果。本发明采用以下去噪过程。
第一级滤波中,输入信号x(t)为s0(t)+u(t);
其中s0(t)为参考信号,u(t)为低幅噪声信号。s1(t)与参考信号s0(t)相关,并且是第一级滤波函数的参考信号,与噪声信号u(t)无关,经第一级滤波函数,权重向量调整后得到s’1(t)。
第一级滤波输出的误差信号为:
e1(t)=x(t)-s’1(t)=s0(t)+u(t)-s’1(t)
e1(t)是调节第一级滤波函数权重系数的估计误差。e1(t)的均方差估计为:
E [ e 1 2 ( t ) ] = E [ u 2 ( t ) ] + E [ s 0 ( t ) - s , 1 ( t ) ] 2
当输出信号的均方误差最小时,若噪声信号u(t)的功率固定,则若想保证达到最小值,则s’1(t)必须无限逼近s0(t),又因为s0(t)与s1(t)为统计相关,因此调节滤波函数的权重系数,使之满足
e”(t)=s0(t)-s’1(t)
e”(t)的值逼近0值。此时第一级的输出为
y1(t)=e”(t)+u(t)≈u(t)
u(t)也正是在***输入端不易获得的噪声小信号,因此第一级滤波函数就是利用较容易获得的参考信号,调节权重系数,从而得到噪声信号,继而在第二级滤波函数中,最终得到可以信噪比较高的音频信号。
第二级输入信号依然为x(t),参考信号为y1(t),y1(t)主要由u(t)构成,即主要由整个算法的输入噪声信号组成。y1(t)经第二级滤波函数,权重系数调整后得到e”’(t)+u’(t)。
第二级滤波函数输出的误差信号为:
y2(t)=x(t)-[e”’(t)+u’(t)]=[s0(t)-e”’(t)]+[u(t)-u’(t)]
为了能让y2(t)均方差达到最小值,调整权重系数的使得[s0(t)-e”’(t)],[u(t)-u’(t)]两项的均方差获得最小值。
为最终输出最佳的s0(t),第一级滤波函数的最佳权重系数,使得e”逼近0。第二级滤波函数的最佳权重系数,使得e”’(t)逼近e”(t)逼近0,u’(t)逼近u(t)。
综上所述,本发明提出了一种基于语音的通信方法,在语音传输中提高了网络稳定性,提升了通话质量,取得了较高的信噪比增量和降噪效果。
显然,本领域的技术人员应该理解,上述的本发明的各模块或各步骤可以用通用的计算***来实现,它们可以集中在单个的计算***上,或者分布在多个计算***所组成的网络上,可选地,它们可以用计算***可执行的程序代码来实现,从而,可以将它们存储在存储***中由计算***来执行。这样,本发明不限制于任何特定的硬件和软件结合。
应当理解的是,本发明的上述具体实施方式仅仅用于示例性说明或解释本发明的原理,而不构成对本发明的限制。因此,在不偏离本发明的精神和范围的情况下所做的任何修改、等同替换、改进等,均应包含在本发明的保护范围之内。此外,本发明所附权利要求旨在涵盖落入所附权利要求范围和边界、或者这种范围和边界的等同形式内的全部变化和修改例。

Claims (3)

1.一种基于语音的通信方法,用于在云平台环境下实现多个移动终端的语音传输,其特征在于,包括:
现场终端对语音数据进行去噪处理,将去噪后的数据上传到所述云平台,并通过所述云平台传送到监控终端。
2.根据权利要求1所述的方法,其特征在于,所述云平台包括通信服务器和数据传输服务器,云平台通信服务器进行信令的解析与转发,处理来自监控终端的对语音操作的会话连接信令;而云平台数据传输服务器提供语音的上行通道,把现场终端的语音转发给监控终端用户,同时提供语音的下行通道,从监控终端到现场终端的语音信号转发;在现场终端,语音数据按8000Hz采样,16位单声道PCM数据,将采集到的数据根据G723算法进行压缩,在多播或单播的网络服务上提供端对端的网络传输,对于接收的音频数据,经过G723算法解压,将音频播放设备的参数设置成8000Hz采样,16位单声道PCM数据执行播放。
3.根据权利要求2所述的方法,其特征在于,所述对语音数据进行去噪处理,进一步包括:
在第一级滤波中,将输入信号x(t)分为s0(t)+u(t);其中s0(t)为参考信号,u(t)为低幅噪声信号;将与参考信号s0(t)相关的信号s1(t)作为第一级滤波函数的参考信号,经第一级滤波函数后将其权重向量调整后为s’1(t);
计算第一级滤波输出的误差信号为:
e1(t)=x(t)-s’1(t)=s0(t)+u(t)-s’1(t)
当e1(t)的均方差达到最小值时,调节滤波函数的权重系数,使之满足e”(t)=s0(t)-s’1(t),其中e”(t)的值逼近0;
将第一级滤波的输出y1(t)=e”(t)+u(t)直接作为第二级滤波函数的参考信号,将x(t)作为第二级滤波函数的输入,调节e”(t)和u(t)权重系数分别为e”’(t)和u’(t),第二级滤波函数输出的误差信号为:
y2(t)=x(t)-[e”’(t)+u’(t)]=[s0(t)-e”’(t)]+[u(t)-u’(t)]
其中e”’(t)逼近e”(t),并且u’(t)逼近u(t),通过第二级滤波函数输出去噪之后的音频信号。
CN201510844983.1A 2015-11-26 2015-11-26 一种基于语音的通信方法 Pending CN105429855A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201510844983.1A CN105429855A (zh) 2015-11-26 2015-11-26 一种基于语音的通信方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201510844983.1A CN105429855A (zh) 2015-11-26 2015-11-26 一种基于语音的通信方法

Publications (1)

Publication Number Publication Date
CN105429855A true CN105429855A (zh) 2016-03-23

Family

ID=55507802

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201510844983.1A Pending CN105429855A (zh) 2015-11-26 2015-11-26 一种基于语音的通信方法

Country Status (1)

Country Link
CN (1) CN105429855A (zh)

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN105489223A (zh) * 2015-11-26 2016-04-13 成都微讯云通科技有限公司 一种语音实时传输方法
CN106296609A (zh) * 2016-08-09 2017-01-04 北京智联安科技有限公司 用于容栅的全波和数字滤波去噪方法和电路
CN111526148B (zh) * 2020-04-26 2022-02-25 中山大学 一种云计算环境下加密音频的安全去噪***及方法

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN202889466U (zh) * 2012-09-25 2013-04-17 浙江图讯科技有限公司 一种用于面向工矿企业的安全生产云服务平台的应急通信***
CN103295572A (zh) * 2012-08-13 2013-09-11 深圳市路畅科技股份有限公司 一种语音识别方法及具有语音识别的车载多媒体导航仪***
CN104461525A (zh) * 2014-11-27 2015-03-25 韩慧健 一种可自定义的智能咨询平台生成***
CN104902013A (zh) * 2015-05-14 2015-09-09 上海互说信息科技有限公司 具有闭环服务质量回馈的服务管理***及方法

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103295572A (zh) * 2012-08-13 2013-09-11 深圳市路畅科技股份有限公司 一种语音识别方法及具有语音识别的车载多媒体导航仪***
CN202889466U (zh) * 2012-09-25 2013-04-17 浙江图讯科技有限公司 一种用于面向工矿企业的安全生产云服务平台的应急通信***
CN104461525A (zh) * 2014-11-27 2015-03-25 韩慧健 一种可自定义的智能咨询平台生成***
CN104902013A (zh) * 2015-05-14 2015-09-09 上海互说信息科技有限公司 具有闭环服务质量回馈的服务管理***及方法

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
张引合: "语音压缩编码G.723.1标准的研究", 《中国优秀硕士学位论文全文数据库(电子期刊)》 *
王虹: "DSP实现G.729 语音编解码的方法及关键技术研究", 《信息技术》 *

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN105489223A (zh) * 2015-11-26 2016-04-13 成都微讯云通科技有限公司 一种语音实时传输方法
CN106296609A (zh) * 2016-08-09 2017-01-04 北京智联安科技有限公司 用于容栅的全波和数字滤波去噪方法和电路
CN106296609B (zh) * 2016-08-09 2023-09-12 广东盈动高科自动化有限公司 用于容栅的全波和数字滤波去噪方法和电路
CN111526148B (zh) * 2020-04-26 2022-02-25 中山大学 一种云计算环境下加密音频的安全去噪***及方法

Similar Documents

Publication Publication Date Title
Cui et al. Analysis and optimization of caching and multicasting in large-scale cache-enabled wireless networks
Lee et al. PERCEIVE: Deep learning-based cellular uplink prediction using real-time scheduling patterns
CN101588595B (zh) 一种无线应用服务***动态调整数据传输速率的方法
Han et al. AMVS-NDN: Adaptive mobile video streaming and sharing in wireless named data networking
CN105515943A (zh) 一种即时通讯实现方法
CN106375790B (zh) 一种QoE驱动的多频道HAS码率自适应调度方法
Araniti et al. Joint coding and multicast subgrouping over satellite-eMBMS networks
CN103248964A (zh) 基于rtp/rtcp的车载视频传输***
CN106817721B (zh) 一种流媒体业务带宽估算的方法、装置、终端及服务器
CN102868666A (zh) 基于用户体验交互的流媒体质量监测报告的实现方法
CN108322708A (zh) 一种基于多路并行传输技术的实时视频传输***及其方法
CN105429855A (zh) 一种基于语音的通信方法
US20120124633A1 (en) Wireless Video Streaming Quality Management for Bandwidth Constrained Cellular Network
CN105227552A (zh) 一种td-lte应急终端语音业务质量保障方法
CN105681817A (zh) 一种智能终端视音频采集传输播放***和方法
CN102439935B (zh) 媒体适配的方法和装置
US8856267B2 (en) Network audio directory server and method
CN108476176A (zh) 在视频电话中的实时传输协议拥塞控制技术
Oh et al. An effective mesh-pull-based P2P video streaming system using fountain codes with variable symbol sizes
CN105379267B (zh) 用于提供视频质量管理的方法和装置
CN107277064A (zh) 一种基于流媒体技术的实时地震数据传输***及传输方法
CN102164276A (zh) 一种流媒体处理方法及***
CN104469538A (zh) 面向画面画质较小损失的rtp视频流数据包重组方法
CN105489223A (zh) 一种语音实时传输方法
CN108614820A (zh) 实现流式源数据解析的方法和装置

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
RJ01 Rejection of invention patent application after publication
RJ01 Rejection of invention patent application after publication

Application publication date: 20160323