CN111048103A - 一种处理播放器音频数据爆音的方法 - Google Patents
一种处理播放器音频数据爆音的方法 Download PDFInfo
- Publication number
- CN111048103A CN111048103A CN201911157687.9A CN201911157687A CN111048103A CN 111048103 A CN111048103 A CN 111048103A CN 201911157687 A CN201911157687 A CN 201911157687A CN 111048103 A CN111048103 A CN 111048103A
- Authority
- CN
- China
- Prior art keywords
- audio data
- pcm audio
- data segment
- player
- value
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000000034 method Methods 0.000 title claims abstract description 20
- 238000005070 sampling Methods 0.000 claims description 14
- 230000003139 buffering effect Effects 0.000 claims description 7
- 230000003247 decreasing effect Effects 0.000 claims description 4
- 230000007423 decrease Effects 0.000 claims description 2
- 238000004880 explosion Methods 0.000 description 2
- 208000037656 Respiratory Sounds Diseases 0.000 description 1
- 230000009286 beneficial effect Effects 0.000 description 1
- 230000003111 delayed effect Effects 0.000 description 1
- 230000008034 disappearance Effects 0.000 description 1
- 230000000694 effects Effects 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 210000000056 organ Anatomy 0.000 description 1
- 230000005236 sound signal Effects 0.000 description 1
- 238000006467 substitution reaction Methods 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/04—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
- G10L19/16—Vocoder architecture
- G10L19/167—Audio streaming, i.e. formatting and decoding of an encoded audio signal representation into a data stream for transmission or storage purposes
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/04—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
- G10L19/16—Vocoder architecture
- G10L19/18—Vocoders using multiple modes
- G10L19/24—Variable rate codecs, e.g. for generating different qualities using a scalable representation such as hierarchical encoding or layered encoding
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L21/00—Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
- G10L21/003—Changing voice quality, e.g. pitch or formants
- G10L21/007—Changing voice quality, e.g. pitch or formants characterised by the process used
Landscapes
- Engineering & Computer Science (AREA)
- Computational Linguistics (AREA)
- Signal Processing (AREA)
- Health & Medical Sciences (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Human Computer Interaction (AREA)
- Physics & Mathematics (AREA)
- Acoustics & Sound (AREA)
- Multimedia (AREA)
- Quality & Reliability (AREA)
- Signal Processing For Digital Recording And Reproducing (AREA)
Abstract
本发明涉及领域,具体涉及一种处理播放器音频数据爆音的方法,通过使播放器在播放PCM音频数据发生中断的时候继续播放一段中断缓冲PCM音频数据段,使得播放中断时PCM数据波形不会从一个较高的值突变到零点,而是从中断点平滑地过度到零点,避免了中断时爆音的现象;通过使播放器在开始播放PCM音频数据之前***一段续播缓冲PCM音频数据段,使得开始播放时PCM数据波形不会从零点突变到一个较高点,而是从零点平滑地过度到播放开始点,避免了在开始播放时爆音的现象。
Description
技术领域
本发明涉及音频数据处理技术领域,具体是一种处理播放器音频数据爆音的方法。
背景技术
脉冲编码调制(Pulse Code ModulatioN,PCM)就是把一个时间连续,取值连续的模拟信号变换成时间离散,取值离散的数字信号后在信道中传输。脉冲编码调制就是对模拟信号先抽样,再对样值幅度量化,编码的过程。音频数据通常以PCM数字格式进行存储,播放器在播放音频数据的时候,如果执行暂停、播放等操作,音频数据突然中断,声音可能会出现爆音,将PCM数据送入声卡,即可以让声卡发声。当送入声卡的PCM数据波形发生突变的情况下,喇叭可能会发生啪的一声爆音。这种现象出现尤其出现在播放器暂停或播放等操作,导致送入声卡的数据发生变化的情景下。
发明内容
有鉴于此,本发明的目的是提供一种处理播放器音频数据爆音的方法,使得播放器在暂停或播放等操作时送入播放器的PCM数据波形不会发生突变,从而避免了播放器在暂停或播放等操作时发生爆音的现象。
为了实现上述目的,本发明的一种处理播放器音频数据爆音的方法,包括步骤:
(1)在播放器中对PCM音频数据段进行解码,获取该PCM音频数据段的采样率fs和对应的编码数据串;
(2a)当所述播放器在播放所述PCM音频数据段产生中断时,记录中断产生最后最后一刻的PCM音频数据的对应中断编码值X,并生成持续时间为t的中断缓冲PCM音频数据段,所述中断缓冲PCM音频数据段在持续时间t内对应的编码值从所述中断编码值X逐步下降至0;
(3a)使所述播放器在中断产生播放所述中断缓冲PCM音频数据段;
(2b)当所述播放器在开始播放所述PCM音频数据时,记录开始播放时第一个所述PCM音频数据的对应续播编码值Y,并生成持续时间同样为t的续播缓冲 PCM音频数据段,所述续播缓冲PCM音频数据段在持续时间t内对应的编码值从0 逐步上升到所述续播编码值Y;
(3b)使所述播放器在开始播放时,在将要播放的PCM音频数据段前***所述续播缓冲PCM音频数据段。
本发明进一步的,所述持续时间t的值为50ms。
本发明进一步的,所述中断缓冲PCM音频数据段的产生步骤包括:
将所述等差数列A作为PCM编码值获得所述中断缓冲PCM音频数据段。
本发明进一步的,所述续播缓冲PCM音频数据段的产生步骤包括:
将所述等差数列B作为PCM编码值获得所述续播缓冲PCM音频数据段。
本发明进一步的,所述播放器的播放中断情形包括但不限于暂停、数据中断和播放结束;所述播放器的开始播放情形包括但不限于继续播放和播放开始。
本发明进一步的,所述编码数据串、中断编码值X、中断缓冲PCM音频数据段、续播编码值Y、续播缓冲PCM音频数据段以及出现的PCM编码值均为二进制编码或者二进制编码串。
本发明的有益效果是:本发明的一种处理播放器音频数据爆音的方法,通过使播放器在播放PCM音频数据发生中断的时候继续播放一段中断缓冲PCM音频数据段,使得播放中断时PCM数据波形不会从一个较高的值突变到零点,而是从中断点平滑地过度到零点,避免了中断时爆音的现象;通过使播放器在开始播放PCM音频数据之前***一段续播缓冲PCM音频数据段,使得开始播放时 PCM数据波形不会从零点突变到一个较高点,而是从零点平滑地过度到播放开始点,避免了在开始播放时爆音的现象。
附图说明
下面结合附图和实施例对本发明作进一步描述:
图1为本发明的工作流程图;
图2为本发明实施例中一端模拟音频曲线;
图3为本发明实施例中PCM音频曲线以及中断PCM缓冲数据段曲线。
具体实施方式
如图1所示:本实施例的一种处理播放器音频数据爆音的方法,包括步骤:
(1)在播放器中对PCM音频数据段进行解码,获取该PCM音频数据段的采样率fs和对应的编码数据串;
(2a)当播放器在播放PCM音频数据段产生中断时,记录中断产生最后最后一刻的PCM音频数据的对应中断编码值X,并生成持续时间为t的中断缓冲PCM音频数据段,中断缓冲PCM音频数据段在持续时间t内对应的编码值从中断编码值X 逐步下降至0;
(3a)使播放器在中断产生播放中断缓冲PCM音频数据段;
(2b)当播放器在开始播放PCM音频数据时,记录开始播放时第一个PCM音频数据的对应续播编码值Y,并生成持续时间同样为t的续播缓冲PCM音频数据段,续播缓冲PCM音频数据段在持续时间t内对应的编码值从0逐步上升到续播编码值Y;
(3b)使播放器在开始播放时,在将要播放的PCM音频数据段前***续播缓冲PCM音频数据段。
本实施例中,持续时间t的值为50ms,声音对人的听觉器官的作用效果并不随声音的消失而立即消除,而会暂留一短促时间,也就是说为了使中断缓冲PCM 音频数据段和续播缓冲PCM音频数据段对人耳产生的影响足够小,使得听者不会在中断播放时产生明显的声音拖延现象,或者在开始播放时产生明显的延迟播放现象,将中断缓冲PCM音频数据段和续播缓冲PCM音频数据段的持续时间设置为50ms。
本实施例中,中断缓冲PCM音频数据段的产生步骤包括:
将中断编码值X作为初始值,生成一个子项数为N的递减的等差数列A,其中 N=采样率fs*持续时间t,公差生成的等差数列A作为中断缓冲PCM音频数据段的对应编码,转化为机器能够识别的二进制编码后,就可以使得播放器在中断发生之后不会马上突变至零值,而是线性变化,声音波动曲线在50ms 内振幅线性地递减至0,从而避免音爆的现象。
本实施例中,续播缓冲PCM音频数据段的产生步骤包括:
将0作为初始值,Y作为结束值,生成一个子项数为N的递增的等差数列B,其中N=采样率fs*持续时间t,公差生成的等差数列B作为续播缓冲PCM 音频数据段的对应编码,转化为机器能够识别的二进制编码后,就可以使得播放器在播放开始之前不会马上从零值突变到某个特定值(PCM音频数据段的开始值),而是线性变化,声音波动曲线在50ms内振幅线性地由0递增值某个特定值,从而避免音爆的现象。
本实施例中,播放器的播放中断情形包括但不限于暂停、数据中断和播放结束;播放器的开始播放情形包括但不限于继续播放和播放开始。
本实施例中,编码数据串、中断编码值X、中断缓冲PCM音频数据段、续播编码值Y、续播缓冲PCM音频数据段以及出现的PCM编码值均为二进制编码或者二进制编码串,本发明的所有过程均在播放器中进行,因此机器识别的只能是二进制编码,本发明的所有编码均为二进制编码。
具体实施方式如下:
以电脑播放一段音频数据为例,将PCM音频数据输入至声卡中,对应喇叭就会发声,如图2所示,模拟音频数据一般是连续的,而PCM音频数据是采样之后呈离散状态的,以MP3格式为例,采样率为44100Hz,也就是说,MP3格式的音频数据每秒采样44100次,每22.7μS采样一次。
为了便于展示,如图3所示中的PCM音频数据曲线横坐标为时间轴,纵坐标为PCM编码数值(十进制),假定采样率fs=200Hz,每5ms采样一次,请参照图2和图3,PCM音频数据断点的坐标为(150ms.10),因此生成的中断缓冲PCM 数据段的对应数列为:(155ms.9)(160ms.8)(165ms.7)(170ms.6)(175ms.5) (180ms.4)(185ms.3)(190ms.2)(195ms.1)(200ms.0),音频信号的对应值线性递减至零坐标,因此在中断发生,原PCM数据段终止时,电脑向声卡继续输入上述坐标值的中断缓冲PCM数据段,从而避免了音爆的现象,为便于展示,本实施例中的值均为真实值乘以特定倍数后的对应值;开始播放的情况与上述同理,如果PCM音频的第一个采样点的对应总坐标值为(150ms.10),那么对应的,电脑在PCM音频播放之前就应该预先向声卡输入续播PCM音频数据段,坐标为(100ms.0)(105ms.1)(110ms.2)(115ms.3)(120ms.4)(125ms.5) (130ms.6)(135ms.7)(140ms.8)(145ms.9),声卡在驱动原PCM数据段发声之前,预先播放续播PCM音频数据段,对应编码值从0线性递增至10,避免了音爆现象。需要说明的是,为了便于展示本实施例中展示的纵坐标值为十进制,在电脑或者声卡中为二进制,并且横坐标的采样时间也是倍化之后的时间,否者以22.7μS为横坐标,50ms的中断缓冲PCM数据段或者续播缓冲PCM数据段在图不便于显示。
本发明通过使播放器在播放PCM音频数据发生中断的时候继续播放一段中断缓冲PCM音频数据段,使得播放中断时PCM数据波形不会从一个较高的值突变到零点,而是从中断点平滑地过度到零点,避免了中断时爆音的现象;通过使播放器在开始播放PCM音频数据之前***一段续播缓冲PCM音频数据段,使得开始播放时PCM数据波形不会从零点突变到一个较高点,而是从零点平滑地过度到播放开始点,避免了在开始播放时爆音的现象。
最后说明的是,以上实施例仅用以说明本发明的技术方案而非限制,尽管参照较佳实施例对本发明进行了详细说明,本领域的普通技术人员应当理解,可以对本发明的技术方案进行修改或者等同替换,而不脱离本发明技术方案的宗旨和范围,其均应涵盖在本发明的权利要求范围当中。
Claims (6)
1.一种处理播放器音频数据爆音的方法,其特征在于:包括步骤:
在播放器中对PCM音频数据段进行解码,获取该PCM音频数据段的采样率fs和对应的编码数据串;
当所述播放器在播放所述PCM音频数据段产生中断时,记录中断产生最后最后一刻的PCM音频数据的对应中断编码值X,并生成持续时间为t的中断缓冲PCM音频数据段,所述中断缓冲PCM音频数据段在持续时间t内对应的编码值从所述中断编码值X逐步下降至0;
使所述播放器在中断产生播放所述中断缓冲PCM音频数据段;
当所述播放器在开始播放所述PCM音频数据时,记录开始播放时第一个所述PCM音频数据的对应续播编码值Y,并生成持续时间同样为t的续播缓冲PCM音频数据段,所述续播缓冲PCM音频数据段在持续时间t内对应的编码值从0逐步上升到所述续播编码值Y;
使所述播放器在开始播放时,在将要播放的PCM音频数据段前***所述续播缓冲PCM音频数据段。
2.根据权利要求1所述的一种处理播放器音频数据爆音的方法,其特征在于:所述持续时间t的值为50ms。
5.根据权利要求1所述的一种处理播放器音频数据爆音的方法,其特征在于:所述播放器的播放中断情形包括但不限于暂停、数据中断和播放结束;所述播放器的开始播放情形包括但不限于继续播放和播放开始。
6.根据权利要求1-5任一项所述的一种处理播放器音频数据爆音的方法,其特征在于:所述编码数据串、中断编码值X、中断缓冲PCM音频数据段、续播编码值Y、续播缓冲PCM音频数据段以及出现的PCM编码值均为二进制编码或者二进制编码串。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201911157687.9A CN111048103A (zh) | 2019-11-22 | 2019-11-22 | 一种处理播放器音频数据爆音的方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201911157687.9A CN111048103A (zh) | 2019-11-22 | 2019-11-22 | 一种处理播放器音频数据爆音的方法 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN111048103A true CN111048103A (zh) | 2020-04-21 |
Family
ID=70233150
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201911157687.9A Pending CN111048103A (zh) | 2019-11-22 | 2019-11-22 | 一种处理播放器音频数据爆音的方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN111048103A (zh) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN116092507A (zh) * | 2023-03-22 | 2023-05-09 | 广州感音科技有限公司 | 一种音频混音方法、设备及介质 |
Citations (10)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20070229717A1 (en) * | 2006-03-29 | 2007-10-04 | Tatung Company | Circuit for eliminating abnormal sound |
CN101409094A (zh) * | 2008-10-30 | 2009-04-15 | 炬力集成电路设计有限公司 | 一种消除音效切换噪声的方法和音频播放设备 |
US20130294615A1 (en) * | 2012-05-03 | 2013-11-07 | Hyundai Mobis Co., Ltd. | Pop-noise removing method |
CN104240716A (zh) * | 2014-06-11 | 2014-12-24 | 杭州联汇数字科技有限公司 | 一种音频数据质量优化方法 |
CN104683920A (zh) * | 2015-01-30 | 2015-06-03 | 惠州市德赛西威汽车电子有限公司 | 一种实现音量平滑升降的方法及装置 |
CN105828255A (zh) * | 2016-05-12 | 2016-08-03 | 深圳市金立通信设备有限公司 | 一种优化音频设备爆音的方法及终端 |
CN106170113A (zh) * | 2016-09-29 | 2016-11-30 | 北京奇艺世纪科技有限公司 | 一种消除噪声的方法和装置以及电子设备 |
CN106228993A (zh) * | 2016-09-29 | 2016-12-14 | 北京奇艺世纪科技有限公司 | 一种消除噪声的方法和装置以及电子设备 |
CN106775551A (zh) * | 2016-10-31 | 2017-05-31 | 乐视控股(北京)有限公司 | 音频播放方法和*** |
CN108922551A (zh) * | 2017-05-16 | 2018-11-30 | 博通集成电路(上海)股份有限公司 | 用于补偿丢失帧的电路及方法 |
-
2019
- 2019-11-22 CN CN201911157687.9A patent/CN111048103A/zh active Pending
Patent Citations (10)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20070229717A1 (en) * | 2006-03-29 | 2007-10-04 | Tatung Company | Circuit for eliminating abnormal sound |
CN101409094A (zh) * | 2008-10-30 | 2009-04-15 | 炬力集成电路设计有限公司 | 一种消除音效切换噪声的方法和音频播放设备 |
US20130294615A1 (en) * | 2012-05-03 | 2013-11-07 | Hyundai Mobis Co., Ltd. | Pop-noise removing method |
CN104240716A (zh) * | 2014-06-11 | 2014-12-24 | 杭州联汇数字科技有限公司 | 一种音频数据质量优化方法 |
CN104683920A (zh) * | 2015-01-30 | 2015-06-03 | 惠州市德赛西威汽车电子有限公司 | 一种实现音量平滑升降的方法及装置 |
CN105828255A (zh) * | 2016-05-12 | 2016-08-03 | 深圳市金立通信设备有限公司 | 一种优化音频设备爆音的方法及终端 |
CN106170113A (zh) * | 2016-09-29 | 2016-11-30 | 北京奇艺世纪科技有限公司 | 一种消除噪声的方法和装置以及电子设备 |
CN106228993A (zh) * | 2016-09-29 | 2016-12-14 | 北京奇艺世纪科技有限公司 | 一种消除噪声的方法和装置以及电子设备 |
CN106775551A (zh) * | 2016-10-31 | 2017-05-31 | 乐视控股(北京)有限公司 | 音频播放方法和*** |
CN108922551A (zh) * | 2017-05-16 | 2018-11-30 | 博通集成电路(上海)股份有限公司 | 用于补偿丢失帧的电路及方法 |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN116092507A (zh) * | 2023-03-22 | 2023-05-09 | 广州感音科技有限公司 | 一种音频混音方法、设备及介质 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US9978395B2 (en) | Method and system for mitigating delay in receiving audio stream during production of sound from audio stream | |
US20190079586A1 (en) | Systems and methods for enhanced haptic effects | |
US20050222843A1 (en) | System for permanent alignment of text utterances to their associated audio utterances | |
US5943648A (en) | Speech signal distribution system providing supplemental parameter associated data | |
TW401671B (en) | Silence compression for recorded voice messages | |
US20140372117A1 (en) | Transcription support device, method, and computer program product | |
US20130144626A1 (en) | Rap music generation | |
US20180166073A1 (en) | Speech Recognition Without Interrupting The Playback Audio | |
JP2013025299A (ja) | 書き起こし支援システムおよび書き起こし支援方法 | |
CN111048103A (zh) | 一种处理播放器音频数据爆音的方法 | |
CN111105776A (zh) | 有声播放装置及其播放方法 | |
US11594113B2 (en) | Decoding device, decoding method, and program | |
JP2007041302A (ja) | 音声再生装置および音声再生処理プログラム | |
US7092884B2 (en) | Method of nonvisual enrollment for speech recognition | |
JP3620787B2 (ja) | 音声データの符号化方法 | |
KR100330779B1 (ko) | 디지털 음성 속도가변 재생방법 | |
JP6486582B2 (ja) | 電子機器、音声制御方法、およびプログラム | |
WO2006030860A1 (ja) | 電子機器、デジタル信号生成方法、デジタル信号記録媒体、および信号処理装置 | |
JP2007256815A (ja) | 音声再生装置、音声再生方法、音声再生プログラム | |
JPH0713596A (ja) | 音声速度変換方法 | |
JP6387044B2 (ja) | テキスト処理装置、テキスト処理方法およびテキスト処理プログラム | |
CN117708492A (zh) | 振动控制方法、装置、电子设备和计算机可读存储介质 | |
US9264818B2 (en) | Digital signal processor with search function | |
US20120226372A1 (en) | Audio-signal correction apparatus, audio-signal correction method and audio-signal correction program | |
EP2149881A1 (en) | Signal processing device |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
RJ01 | Rejection of invention patent application after publication |
Application publication date: 20200421 |
|
RJ01 | Rejection of invention patent application after publication |