CN111048103A - 一种处理播放器音频数据爆音的方法 - Google Patents

一种处理播放器音频数据爆音的方法 Download PDF

Info

Publication number
CN111048103A
CN111048103A CN201911157687.9A CN201911157687A CN111048103A CN 111048103 A CN111048103 A CN 111048103A CN 201911157687 A CN201911157687 A CN 201911157687A CN 111048103 A CN111048103 A CN 111048103A
Authority
CN
China
Prior art keywords
audio data
pcm audio
data segment
player
value
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201911157687.9A
Other languages
English (en)
Inventor
赵俊淞
肖戈
张万忠
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Hunan Bowan Technology Co Ltd
Original Assignee
Hunan Bowan Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Hunan Bowan Technology Co Ltd filed Critical Hunan Bowan Technology Co Ltd
Priority to CN201911157687.9A priority Critical patent/CN111048103A/zh
Publication of CN111048103A publication Critical patent/CN111048103A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/04Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
    • G10L19/16Vocoder architecture
    • G10L19/167Audio streaming, i.e. formatting and decoding of an encoded audio signal representation into a data stream for transmission or storage purposes
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/04Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
    • G10L19/16Vocoder architecture
    • G10L19/18Vocoders using multiple modes
    • G10L19/24Variable rate codecs, e.g. for generating different qualities using a scalable representation such as hierarchical encoding or layered encoding
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L21/00Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
    • G10L21/003Changing voice quality, e.g. pitch or formants
    • G10L21/007Changing voice quality, e.g. pitch or formants characterised by the process used

Landscapes

  • Engineering & Computer Science (AREA)
  • Computational Linguistics (AREA)
  • Signal Processing (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Physics & Mathematics (AREA)
  • Acoustics & Sound (AREA)
  • Multimedia (AREA)
  • Quality & Reliability (AREA)
  • Signal Processing For Digital Recording And Reproducing (AREA)

Abstract

本发明涉及领域,具体涉及一种处理播放器音频数据爆音的方法,通过使播放器在播放PCM音频数据发生中断的时候继续播放一段中断缓冲PCM音频数据段,使得播放中断时PCM数据波形不会从一个较高的值突变到零点,而是从中断点平滑地过度到零点,避免了中断时爆音的现象;通过使播放器在开始播放PCM音频数据之前***一段续播缓冲PCM音频数据段,使得开始播放时PCM数据波形不会从零点突变到一个较高点,而是从零点平滑地过度到播放开始点,避免了在开始播放时爆音的现象。

Description

一种处理播放器音频数据爆音的方法
技术领域
本发明涉及音频数据处理技术领域,具体是一种处理播放器音频数据爆音的方法。
背景技术
脉冲编码调制(Pulse Code ModulatioN,PCM)就是把一个时间连续,取值连续的模拟信号变换成时间离散,取值离散的数字信号后在信道中传输。脉冲编码调制就是对模拟信号先抽样,再对样值幅度量化,编码的过程。音频数据通常以PCM数字格式进行存储,播放器在播放音频数据的时候,如果执行暂停、播放等操作,音频数据突然中断,声音可能会出现爆音,将PCM数据送入声卡,即可以让声卡发声。当送入声卡的PCM数据波形发生突变的情况下,喇叭可能会发生啪的一声爆音。这种现象出现尤其出现在播放器暂停或播放等操作,导致送入声卡的数据发生变化的情景下。
发明内容
有鉴于此,本发明的目的是提供一种处理播放器音频数据爆音的方法,使得播放器在暂停或播放等操作时送入播放器的PCM数据波形不会发生突变,从而避免了播放器在暂停或播放等操作时发生爆音的现象。
为了实现上述目的,本发明的一种处理播放器音频数据爆音的方法,包括步骤:
(1)在播放器中对PCM音频数据段进行解码,获取该PCM音频数据段的采样率fs和对应的编码数据串;
(2a)当所述播放器在播放所述PCM音频数据段产生中断时,记录中断产生最后最后一刻的PCM音频数据的对应中断编码值X,并生成持续时间为t的中断缓冲PCM音频数据段,所述中断缓冲PCM音频数据段在持续时间t内对应的编码值从所述中断编码值X逐步下降至0;
(3a)使所述播放器在中断产生播放所述中断缓冲PCM音频数据段;
(2b)当所述播放器在开始播放所述PCM音频数据时,记录开始播放时第一个所述PCM音频数据的对应续播编码值Y,并生成持续时间同样为t的续播缓冲 PCM音频数据段,所述续播缓冲PCM音频数据段在持续时间t内对应的编码值从0 逐步上升到所述续播编码值Y;
(3b)使所述播放器在开始播放时,在将要播放的PCM音频数据段前***所述续播缓冲PCM音频数据段。
本发明进一步的,所述持续时间t的值为50ms。
本发明进一步的,所述中断缓冲PCM音频数据段的产生步骤包括:
将所述中断编码值X作为初始值,生成一个子项数为N的递减的等差数列A,其中N=采样率fs*持续时间t,公差
Figure BDA0002285244670000021
将所述等差数列A作为PCM编码值获得所述中断缓冲PCM音频数据段。
本发明进一步的,所述续播缓冲PCM音频数据段的产生步骤包括:
将0作为初始值,Y作为结束值,生成一个子项数为N的递增的等差数列B,其中N=采样率fs*持续时间t,公差
Figure BDA0002285244670000022
将所述等差数列B作为PCM编码值获得所述续播缓冲PCM音频数据段。
本发明进一步的,所述播放器的播放中断情形包括但不限于暂停、数据中断和播放结束;所述播放器的开始播放情形包括但不限于继续播放和播放开始。
本发明进一步的,所述编码数据串、中断编码值X、中断缓冲PCM音频数据段、续播编码值Y、续播缓冲PCM音频数据段以及出现的PCM编码值均为二进制编码或者二进制编码串。
本发明的有益效果是:本发明的一种处理播放器音频数据爆音的方法,通过使播放器在播放PCM音频数据发生中断的时候继续播放一段中断缓冲PCM音频数据段,使得播放中断时PCM数据波形不会从一个较高的值突变到零点,而是从中断点平滑地过度到零点,避免了中断时爆音的现象;通过使播放器在开始播放PCM音频数据之前***一段续播缓冲PCM音频数据段,使得开始播放时 PCM数据波形不会从零点突变到一个较高点,而是从零点平滑地过度到播放开始点,避免了在开始播放时爆音的现象。
附图说明
下面结合附图和实施例对本发明作进一步描述:
图1为本发明的工作流程图;
图2为本发明实施例中一端模拟音频曲线;
图3为本发明实施例中PCM音频曲线以及中断PCM缓冲数据段曲线。
具体实施方式
如图1所示:本实施例的一种处理播放器音频数据爆音的方法,包括步骤:
(1)在播放器中对PCM音频数据段进行解码,获取该PCM音频数据段的采样率fs和对应的编码数据串;
(2a)当播放器在播放PCM音频数据段产生中断时,记录中断产生最后最后一刻的PCM音频数据的对应中断编码值X,并生成持续时间为t的中断缓冲PCM音频数据段,中断缓冲PCM音频数据段在持续时间t内对应的编码值从中断编码值X 逐步下降至0;
(3a)使播放器在中断产生播放中断缓冲PCM音频数据段;
(2b)当播放器在开始播放PCM音频数据时,记录开始播放时第一个PCM音频数据的对应续播编码值Y,并生成持续时间同样为t的续播缓冲PCM音频数据段,续播缓冲PCM音频数据段在持续时间t内对应的编码值从0逐步上升到续播编码值Y;
(3b)使播放器在开始播放时,在将要播放的PCM音频数据段前***续播缓冲PCM音频数据段。
本实施例中,持续时间t的值为50ms,声音对人的听觉器官的作用效果并不随声音的消失而立即消除,而会暂留一短促时间,也就是说为了使中断缓冲PCM 音频数据段和续播缓冲PCM音频数据段对人耳产生的影响足够小,使得听者不会在中断播放时产生明显的声音拖延现象,或者在开始播放时产生明显的延迟播放现象,将中断缓冲PCM音频数据段和续播缓冲PCM音频数据段的持续时间设置为50ms。
本实施例中,中断缓冲PCM音频数据段的产生步骤包括:
将中断编码值X作为初始值,生成一个子项数为N的递减的等差数列A,其中 N=采样率fs*持续时间t,公差
Figure BDA0002285244670000041
生成的等差数列A作为中断缓冲PCM音频数据段的对应编码,转化为机器能够识别的二进制编码后,就可以使得播放器在中断发生之后不会马上突变至零值,而是线性变化,声音波动曲线在50ms 内振幅线性地递减至0,从而避免音爆的现象。
本实施例中,续播缓冲PCM音频数据段的产生步骤包括:
将0作为初始值,Y作为结束值,生成一个子项数为N的递增的等差数列B,其中N=采样率fs*持续时间t,公差
Figure BDA0002285244670000042
生成的等差数列B作为续播缓冲PCM 音频数据段的对应编码,转化为机器能够识别的二进制编码后,就可以使得播放器在播放开始之前不会马上从零值突变到某个特定值(PCM音频数据段的开始值),而是线性变化,声音波动曲线在50ms内振幅线性地由0递增值某个特定值,从而避免音爆的现象。
本实施例中,播放器的播放中断情形包括但不限于暂停、数据中断和播放结束;播放器的开始播放情形包括但不限于继续播放和播放开始。
本实施例中,编码数据串、中断编码值X、中断缓冲PCM音频数据段、续播编码值Y、续播缓冲PCM音频数据段以及出现的PCM编码值均为二进制编码或者二进制编码串,本发明的所有过程均在播放器中进行,因此机器识别的只能是二进制编码,本发明的所有编码均为二进制编码。
具体实施方式如下:
以电脑播放一段音频数据为例,将PCM音频数据输入至声卡中,对应喇叭就会发声,如图2所示,模拟音频数据一般是连续的,而PCM音频数据是采样之后呈离散状态的,以MP3格式为例,采样率为44100Hz,也就是说,MP3格式的音频数据每秒采样44100次,每22.7μS采样一次。
为了便于展示,如图3所示中的PCM音频数据曲线横坐标为时间轴,纵坐标为PCM编码数值(十进制),假定采样率fs=200Hz,每5ms采样一次,请参照图2和图3,PCM音频数据断点的坐标为(150ms.10),因此生成的中断缓冲PCM 数据段的对应数列为:(155ms.9)(160ms.8)(165ms.7)(170ms.6)(175ms.5) (180ms.4)(185ms.3)(190ms.2)(195ms.1)(200ms.0),音频信号的对应值线性递减至零坐标,因此在中断发生,原PCM数据段终止时,电脑向声卡继续输入上述坐标值的中断缓冲PCM数据段,从而避免了音爆的现象,为便于展示,本实施例中的值均为真实值乘以特定倍数后的对应值;开始播放的情况与上述同理,如果PCM音频的第一个采样点的对应总坐标值为(150ms.10),那么对应的,电脑在PCM音频播放之前就应该预先向声卡输入续播PCM音频数据段,坐标为(100ms.0)(105ms.1)(110ms.2)(115ms.3)(120ms.4)(125ms.5) (130ms.6)(135ms.7)(140ms.8)(145ms.9),声卡在驱动原PCM数据段发声之前,预先播放续播PCM音频数据段,对应编码值从0线性递增至10,避免了音爆现象。需要说明的是,为了便于展示本实施例中展示的纵坐标值为十进制,在电脑或者声卡中为二进制,并且横坐标的采样时间也是倍化之后的时间,否者以22.7μS为横坐标,50ms的中断缓冲PCM数据段或者续播缓冲PCM数据段在图不便于显示。
本发明通过使播放器在播放PCM音频数据发生中断的时候继续播放一段中断缓冲PCM音频数据段,使得播放中断时PCM数据波形不会从一个较高的值突变到零点,而是从中断点平滑地过度到零点,避免了中断时爆音的现象;通过使播放器在开始播放PCM音频数据之前***一段续播缓冲PCM音频数据段,使得开始播放时PCM数据波形不会从零点突变到一个较高点,而是从零点平滑地过度到播放开始点,避免了在开始播放时爆音的现象。
最后说明的是,以上实施例仅用以说明本发明的技术方案而非限制,尽管参照较佳实施例对本发明进行了详细说明,本领域的普通技术人员应当理解,可以对本发明的技术方案进行修改或者等同替换,而不脱离本发明技术方案的宗旨和范围,其均应涵盖在本发明的权利要求范围当中。

Claims (6)

1.一种处理播放器音频数据爆音的方法,其特征在于:包括步骤:
在播放器中对PCM音频数据段进行解码,获取该PCM音频数据段的采样率fs和对应的编码数据串;
当所述播放器在播放所述PCM音频数据段产生中断时,记录中断产生最后最后一刻的PCM音频数据的对应中断编码值X,并生成持续时间为t的中断缓冲PCM音频数据段,所述中断缓冲PCM音频数据段在持续时间t内对应的编码值从所述中断编码值X逐步下降至0;
使所述播放器在中断产生播放所述中断缓冲PCM音频数据段;
当所述播放器在开始播放所述PCM音频数据时,记录开始播放时第一个所述PCM音频数据的对应续播编码值Y,并生成持续时间同样为t的续播缓冲PCM音频数据段,所述续播缓冲PCM音频数据段在持续时间t内对应的编码值从0逐步上升到所述续播编码值Y;
使所述播放器在开始播放时,在将要播放的PCM音频数据段前***所述续播缓冲PCM音频数据段。
2.根据权利要求1所述的一种处理播放器音频数据爆音的方法,其特征在于:所述持续时间t的值为50ms。
3.根据权利要求1所述的一种处理播放器音频数据爆音的方法,其特征在于:所述中断缓冲PCM音频数据段的产生步骤包括:
将所述中断编码值X作为初始值,生成一个子项数为N的递减的等差数列A,其中N=采样率fs*持续时间t,公差
Figure FDA0002285244660000011
将所述等差数列A作为PCM编码值获得所述中断缓冲PCM音频数据段。
4.根据权利要求1所述的一种处理播放器音频数据爆音的方法,其特征在于:所述续播缓冲PCM音频数据段的产生步骤包括:
将0作为初始值,Y作为结束值,生成一个子项数为N的递增的等差数列B,其中N=采样率fs*持续时间t,公差
Figure FDA0002285244660000012
将所述等差数列B作为PCM编码值获得所述续播缓冲PCM音频数据段。
5.根据权利要求1所述的一种处理播放器音频数据爆音的方法,其特征在于:所述播放器的播放中断情形包括但不限于暂停、数据中断和播放结束;所述播放器的开始播放情形包括但不限于继续播放和播放开始。
6.根据权利要求1-5任一项所述的一种处理播放器音频数据爆音的方法,其特征在于:所述编码数据串、中断编码值X、中断缓冲PCM音频数据段、续播编码值Y、续播缓冲PCM音频数据段以及出现的PCM编码值均为二进制编码或者二进制编码串。
CN201911157687.9A 2019-11-22 2019-11-22 一种处理播放器音频数据爆音的方法 Pending CN111048103A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201911157687.9A CN111048103A (zh) 2019-11-22 2019-11-22 一种处理播放器音频数据爆音的方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201911157687.9A CN111048103A (zh) 2019-11-22 2019-11-22 一种处理播放器音频数据爆音的方法

Publications (1)

Publication Number Publication Date
CN111048103A true CN111048103A (zh) 2020-04-21

Family

ID=70233150

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201911157687.9A Pending CN111048103A (zh) 2019-11-22 2019-11-22 一种处理播放器音频数据爆音的方法

Country Status (1)

Country Link
CN (1) CN111048103A (zh)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN116092507A (zh) * 2023-03-22 2023-05-09 广州感音科技有限公司 一种音频混音方法、设备及介质

Citations (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20070229717A1 (en) * 2006-03-29 2007-10-04 Tatung Company Circuit for eliminating abnormal sound
CN101409094A (zh) * 2008-10-30 2009-04-15 炬力集成电路设计有限公司 一种消除音效切换噪声的方法和音频播放设备
US20130294615A1 (en) * 2012-05-03 2013-11-07 Hyundai Mobis Co., Ltd. Pop-noise removing method
CN104240716A (zh) * 2014-06-11 2014-12-24 杭州联汇数字科技有限公司 一种音频数据质量优化方法
CN104683920A (zh) * 2015-01-30 2015-06-03 惠州市德赛西威汽车电子有限公司 一种实现音量平滑升降的方法及装置
CN105828255A (zh) * 2016-05-12 2016-08-03 深圳市金立通信设备有限公司 一种优化音频设备爆音的方法及终端
CN106170113A (zh) * 2016-09-29 2016-11-30 北京奇艺世纪科技有限公司 一种消除噪声的方法和装置以及电子设备
CN106228993A (zh) * 2016-09-29 2016-12-14 北京奇艺世纪科技有限公司 一种消除噪声的方法和装置以及电子设备
CN106775551A (zh) * 2016-10-31 2017-05-31 乐视控股(北京)有限公司 音频播放方法和***
CN108922551A (zh) * 2017-05-16 2018-11-30 博通集成电路(上海)股份有限公司 用于补偿丢失帧的电路及方法

Patent Citations (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20070229717A1 (en) * 2006-03-29 2007-10-04 Tatung Company Circuit for eliminating abnormal sound
CN101409094A (zh) * 2008-10-30 2009-04-15 炬力集成电路设计有限公司 一种消除音效切换噪声的方法和音频播放设备
US20130294615A1 (en) * 2012-05-03 2013-11-07 Hyundai Mobis Co., Ltd. Pop-noise removing method
CN104240716A (zh) * 2014-06-11 2014-12-24 杭州联汇数字科技有限公司 一种音频数据质量优化方法
CN104683920A (zh) * 2015-01-30 2015-06-03 惠州市德赛西威汽车电子有限公司 一种实现音量平滑升降的方法及装置
CN105828255A (zh) * 2016-05-12 2016-08-03 深圳市金立通信设备有限公司 一种优化音频设备爆音的方法及终端
CN106170113A (zh) * 2016-09-29 2016-11-30 北京奇艺世纪科技有限公司 一种消除噪声的方法和装置以及电子设备
CN106228993A (zh) * 2016-09-29 2016-12-14 北京奇艺世纪科技有限公司 一种消除噪声的方法和装置以及电子设备
CN106775551A (zh) * 2016-10-31 2017-05-31 乐视控股(北京)有限公司 音频播放方法和***
CN108922551A (zh) * 2017-05-16 2018-11-30 博通集成电路(上海)股份有限公司 用于补偿丢失帧的电路及方法

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN116092507A (zh) * 2023-03-22 2023-05-09 广州感音科技有限公司 一种音频混音方法、设备及介质

Similar Documents

Publication Publication Date Title
US9978395B2 (en) Method and system for mitigating delay in receiving audio stream during production of sound from audio stream
US20190079586A1 (en) Systems and methods for enhanced haptic effects
US20050222843A1 (en) System for permanent alignment of text utterances to their associated audio utterances
US5943648A (en) Speech signal distribution system providing supplemental parameter associated data
TW401671B (en) Silence compression for recorded voice messages
US20140372117A1 (en) Transcription support device, method, and computer program product
US20130144626A1 (en) Rap music generation
US20180166073A1 (en) Speech Recognition Without Interrupting The Playback Audio
JP2013025299A (ja) 書き起こし支援システムおよび書き起こし支援方法
CN111048103A (zh) 一种处理播放器音频数据爆音的方法
CN111105776A (zh) 有声播放装置及其播放方法
US11594113B2 (en) Decoding device, decoding method, and program
JP2007041302A (ja) 音声再生装置および音声再生処理プログラム
US7092884B2 (en) Method of nonvisual enrollment for speech recognition
JP3620787B2 (ja) 音声データの符号化方法
KR100330779B1 (ko) 디지털 음성 속도가변 재생방법
JP6486582B2 (ja) 電子機器、音声制御方法、およびプログラム
WO2006030860A1 (ja) 電子機器、デジタル信号生成方法、デジタル信号記録媒体、および信号処理装置
JP2007256815A (ja) 音声再生装置、音声再生方法、音声再生プログラム
JPH0713596A (ja) 音声速度変換方法
JP6387044B2 (ja) テキスト処理装置、テキスト処理方法およびテキスト処理プログラム
CN117708492A (zh) 振动控制方法、装置、电子设备和计算机可读存储介质
US9264818B2 (en) Digital signal processor with search function
US20120226372A1 (en) Audio-signal correction apparatus, audio-signal correction method and audio-signal correction program
EP2149881A1 (en) Signal processing device

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
RJ01 Rejection of invention patent application after publication

Application publication date: 20200421

RJ01 Rejection of invention patent application after publication