RU2016119010A - Принцип для кодирования аудиосигнала и декодирования аудиосигнала с использованием информации формирования речевого спектра - Google Patents

Принцип для кодирования аудиосигнала и декодирования аудиосигнала с использованием информации формирования речевого спектра Download PDF

Info

Publication number
RU2016119010A
RU2016119010A RU2016119010A RU2016119010A RU2016119010A RU 2016119010 A RU2016119010 A RU 2016119010A RU 2016119010 A RU2016119010 A RU 2016119010A RU 2016119010 A RU2016119010 A RU 2016119010A RU 2016119010 A RU2016119010 A RU 2016119010A
Authority
RU
Russia
Prior art keywords
signal
noise
information
encoding
gain
Prior art date
Application number
RU2016119010A
Other languages
English (en)
Other versions
RU2646357C2 (ru
Inventor
Гийом ФУКС
Маркус МУЛЬТРУС
Эммануэль РАВЕЛЛИ
Маркус ШНЕЛЛЬ
Original Assignee
Фраунхофер-Гезелльшафт Цур Фердерунг Дер Ангевандтен Форшунг Е.Ф.
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Фраунхофер-Гезелльшафт Цур Фердерунг Дер Ангевандтен Форшунг Е.Ф. filed Critical Фраунхофер-Гезелльшафт Цур Фердерунг Дер Ангевандтен Форшунг Е.Ф.
Publication of RU2016119010A publication Critical patent/RU2016119010A/ru
Application granted granted Critical
Publication of RU2646357C2 publication Critical patent/RU2646357C2/ru

Links

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/04Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
    • G10L19/08Determination or coding of the excitation function; Determination or coding of the long-term prediction parameters
    • G10L19/12Determination or coding of the excitation function; Determination or coding of the long-term prediction parameters the excitation function being a code excitation, e.g. in code excited linear prediction [CELP] vocoders
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/02Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/02Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
    • G10L19/032Quantisation or dequantisation of spectral components
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/04Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
    • G10L19/06Determination or coding of the spectral characteristics, e.g. of the short-term prediction coefficients
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/04Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
    • G10L19/06Determination or coding of the spectral characteristics, e.g. of the short-term prediction coefficients
    • G10L19/07Line spectrum pair [LSP] vocoders
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/04Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
    • G10L19/08Determination or coding of the excitation function; Determination or coding of the long-term prediction parameters
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/04Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
    • G10L19/08Determination or coding of the excitation function; Determination or coding of the long-term prediction parameters
    • G10L19/083Determination or coding of the excitation function; Determination or coding of the long-term prediction parameters the excitation function being an excitation gain
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/04Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
    • G10L19/16Vocoder architecture
    • G10L19/18Vocoders using multiple modes
    • G10L19/20Vocoders using multiple modes using sound class specific coding, hybrid encoders or object based coding
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L25/00Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
    • G10L25/93Discriminating between voiced and unvoiced parts of speech signals
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L2019/0001Codebooks
    • G10L2019/0016Codebook for LPC parameters

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Computational Linguistics (AREA)
  • Signal Processing (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Acoustics & Sound (AREA)
  • Multimedia (AREA)
  • Spectroscopy & Molecular Physics (AREA)
  • Compression, Expansion, Code Conversion, And Decoders (AREA)

Claims (47)

1. Кодер (100; 200; 300) для кодирования аудиосигнала (102), причем кодер содержит:
- анализатор (120; 320), выполненный с возможностью извлечения коэффициентов (122; 322) прогнозирования и остаточного сигнала (124; 324) из кадра аудиосигнала (102);
- модуль (160) вычисления информации формант, выполненный с возможностью вычисления информации (162) формирования речевого спектра из коэффициентов (122; 322) прогнозирования;
- модуль (150; 350; 350'; 550) вычисления параметров усиления, выполненный с возможностью вычисления параметра (gn; gc) усиления из невокализованного остаточного сигнала и информации (162) формирования спектра; и
- модуль (190; 690) формирования потоков битов, выполненный с возможностью формирования выходного сигнала (192; 692) на основе информации (142), связанной с вокализованным кадром сигнала, параметром (gn; gc) усиления или параметром (
Figure 00000001
;
Figure 00000002
) квантованного усиления и коэффициентами (122; 322) прогнозирования.
2. Кодер по п. 1, дополнительно содержащий решающий модуль (130), выполненный с возможностью определения того, определен или нет остаточный сигнал из аудиокадра невокализованного сигнала;
3. Кодер по п. 1 или 2, в котором модуль (150; 350; 350'; 550) вычисления параметров усиления содержит:
- генератор (350a) шума, выполненный с возможностью формирования шумоподобного сигнала (n(n)) для кодирования;
- формирователь (350c), выполненный с возможностью усиления (350e) и формирования (350d) спектра шумоподобного сигнала (n(n)) для кодирования с использованием информации (162) формирования речевого спектра и параметра (gn) усиления в качестве временного параметра (gn(temp)) усиления, чтобы получать усиленный шумоподобный сигнал (350g) для кодирования определенной формы;
- модуль (350h) сравнения, выполненный с возможностью сравнения невокализованного остаточного сигнала и усиленного шумоподобного сигнала (350g) для кодирования определенной формы, чтобы получать показатель для сходства между невокализованным остаточным сигналом и усиленным шумоподобным сигналом (350g) для кодирования определенной формы; и
- контроллер (350k), выполненный с возможностью определения параметра (gn) усиления и адаптации временного параметра (gn(temp)) усиления на основе результата сравнения;
- при этом контроллер (350k; 550n) выполнен с возможностью предоставлять параметр (gn) усиления при кодировании в модуль формирования потоков битов, когда значение показателя для сходства выше порогового значения.
4. Кодер по п. 1 или 2, в котором модуль (150; 350; 350'; 550) вычисления параметров усиления содержит:
- генератор (350a) шума, выполненный с возможностью формирования шумоподобного сигнала для кодирования;
- формирователь (350c), выполненный с возможностью усиления (350e) и формирования (350d) спектра шумоподобного сигнала (n(n)) для кодирования с использованием информации (162) формирования речевого спектра и параметра (gn) усиления в качестве временного параметра (gn(temp)) усиления, чтобы получать усиленный шумоподобный сигнал (350g) для кодирования определенной формы;
- синтезатор (350m'), выполненный с возможностью синтезирования синтезированного сигнала (350l') из усиленного шумоподобного сигнала (350g) для кодирования определенной формы и коэффициентов (122; 322) прогнозирования и предоставлять синтезированный сигнал (350l');
- модуль (350h') сравнения, выполненный с возможностью сравнения аудиосигнала (102) и синтезированного сигнала (350l'), чтобы получать показатель для сходства между аудиосигналом (102) и синтезированным сигналом (350l'); и
- контроллер (350k), выполненный с возможностью определения параметра (gn) усиления и адаптации временного параметра (gn(temp)) усиления на основе результата сравнения;
- при этом контроллер (350k) выполнен с возможностью предоставлять параметр (gn) усиления при кодировании в модуль формирования потоков битов, когда значение показателя для сходства выше порогового значения.
5. Кодер по п. 4, дополнительно содержащий запоминающее устройство (350n') усилений, выполненное с возможностью записи информации кодирования, содержащей параметр (gn; gc) усиления при кодировании или информацию
Figure 00000002
, связанную с ним, при этом контроллер (350k) выполнен с возможностью записи информации кодирования во время обработки аудиокадра и определения параметра (gn; gc) усиления для последующего кадра аудиосигнала (102) на основе информации кодирования предшествующего кадра аудиосигнала (102).
6. Кодер по одному из пп. 3-5, в котором генератор (350a) шума выполнен с возможностью формирования множества случайных сигналов и комбинирования множества случайных сигналов, чтобы получать шумоподобный сигнал (n(n)) для кодирования.
7. Кодер по одному из предшествующих пунктов, дополнительно содержащий квантователь (170), выполненный с возможностью приема параметра (gn; gc) усиления, квантования параметра (gn; gc) усиления, чтобы получать параметр (
Figure 00000001
;
Figure 00000002
) квантованного усиления.
8. Кодер по одному из предшествующих пунктов, в котором формирователь (350; 350') выполнен с возможностью комбинирования спектра шумоподобного сигнала (n(n)) для кодирования или спектра, извлекаемого из него, и передаточной функции (Ffe(z)), содержащей:
Figure 00000003
,
при этом A(z) соответствует полиному фильтра кодирующего фильтра для фильтрации адаптированного шумоподобного сигнала для кодирования определенной формы, взвешенного посредством весовых коэффициентов w1 или w2, при этом w1 содержит положительное ненулевое скалярное значение самое большее в 1,0, и при этом w2 содержит положительное ненулевое скалярное значение самое большее в 1,00, при этом w2 превышает w1.
9. Кодер по одному из предшествующих пунктов, в котором формирователь (350; 350') выполнен с возможностью комбинирования спектра шумоподобного сигнала для кодирования или спектра, извлекаемого из него, с передаточной функцией (Ft(z)), содержащей:
Figure 00000004
,
при этом z указывает представление в z-области, при этом β представляет показатель (вокализацию) для вокализации, определенной посредством связи энергии предыдущего кадра аудиосигнала и энергии текущего кадра аудиосигнала, при этом показатель β определяется в функции значения вокализации.
10. Декодер (200) для декодирования принимаемого сигнала (202), содержащего информацию, связанную с коэффициентами (122; 322) прогнозирования, причем декодер (200) содержит:
- модуль (220) вычисления информации формант, выполненный с возможностью вычисления информации (222) формирования речевого спектра из коэффициентов прогнозирования;
- генератор (240) шума, выполненный с возможностью формирования шумоподобного сигнала (n(n)) для декодирования;
- формирователь (250), выполненный с возможностью формирования (252) спектра шумоподобного сигнала (n(n)) для декодирования или его усиленного представления с использованием информации (222) формирования спектра, чтобы получать шумоподобный сигнал (258) для декодирования определенной формы; и
- синтезатор (260), выполненный с возможностью синтезирования синтезированного сигнала (262) из усиленного шумоподобного сигнала (258) для кодирования определенной формы и коэффициентов (122; 322) прогнозирования.
11. Декодер по п. 10, в котором принимаемый сигнал (202) содержит информацию, связанную с параметром (gn; gc) усиления, при этом формирователь (250) содержит усилитель (254), выполненный с возможностью усиления шумоподобного сигнала (n(n)) для декодирования или шумоподобного сигнала (256) для декодирования определенной формы.
12. Декодер по п. 10 или 11, в котором принимаемый сигнал (202) дополнительно содержит вокализованную информацию (142), связанную с вокализованным кадром кодированного аудиосигнала (102), при этом декодер (200) дополнительно содержит процессор (270) вокализованных кадров, выполненный с возможностью определения вокализованного сигнала (272) на основе вокализованной информации (142), при этом декодер (200) дополнительно содержит модуль (280) комбинирования, выполненный с возможностью комбинирования синтезированного сигнала (262) и вокализованного сигнала (272), чтобы получать кадр последовательности (282) аудиосигналов.
13. Кодированный аудиосигнал (192; 202; 692), содержащий информацию коэффициентов (122; 322) прогнозирования для вокализованного кадра и невокализованного кадра, дополнительную информацию (142), связанную с вокализованным кадром сигнала, и информацию, связанную с параметром (gn; gc) усиления или параметром (
Figure 00000001
;
Figure 00000002
) квантованного усиления для невокализованного кадра.
14. Способ (1200) для кодирования аудиосигнала (102), содержащий этапы, на которых:
- извлекают (1210) коэффициенты (122; 322) прогнозирования и остаточный сигнал из кадра (102) аудиосигнала;
- вычисляют (1220) информацию (162) формирования речевого спектра из коэффициентов (122; 322) прогнозирования;
- вычисляют (1230) параметр (gn; gc) усиления из невокализованного остаточного сигнала и информации (162) формирования спектра; и
- формируют (1240) выходной сигнал (192; 692) на основе информации (142), связанной с вокализованным кадром сигнала, параметром (gn; gc) усиления или параметром (
Figure 00000001
;
Figure 00000002
) квантованного усиления и коэффициентами (122; 322) прогнозирования.
15. Способ (1300) для декодирования принимаемого аудиосигнала (202), содержащего информацию, связанную с коэффициентам прогнозирования и параметрами (gn; gc) усиления, при этом способ содержит этапы, на которых:
- вычисляют (1310) информацию (222) формирования речевого спектра из коэффициентов (122; 322) прогнозирования;
- формируют (1320) шумоподобный сигнал (n(n)) для декодирования;
- формируют (1330) спектр шумоподобного сигнала (n(n)) для декодирования или его усиленное представление с использованием информации (222) формирования спектра, чтобы получать шумоподобный сигнал (258) для декодирования определенной формы; и
- синтезируют (1340) синтезированный сигнал (262) из усиленного шумоподобного сигнала (258) для кодирования определенной формы и коэффициентов (122; 322) прогнозирования.
16. Компьютерная программа, имеющая программный код для осуществления, при выполнении на компьютере, способа по п. 14 или 15.
RU2016119010A 2013-10-18 2014-10-10 Принцип для кодирования аудиосигнала и декодирования аудиосигнала с использованием информации формирования речевого спектра RU2646357C2 (ru)

Applications Claiming Priority (5)

Application Number Priority Date Filing Date Title
EP13189392 2013-10-18
EPEP13189392.7 2013-10-18
EP14178788.7 2014-07-28
EP14178788 2014-07-28
PCT/EP2014/071767 WO2015055531A1 (en) 2013-10-18 2014-10-10 Concept for encoding an audio signal and decoding an audio signal using speech related spectral shaping information

Publications (2)

Publication Number Publication Date
RU2016119010A true RU2016119010A (ru) 2017-11-23
RU2646357C2 RU2646357C2 (ru) 2018-03-02

Family

ID=51691033

Family Applications (1)

Application Number Title Priority Date Filing Date
RU2016119010A RU2646357C2 (ru) 2013-10-18 2014-10-10 Принцип для кодирования аудиосигнала и декодирования аудиосигнала с использованием информации формирования речевого спектра

Country Status (17)

Country Link
US (3) US10373625B2 (ru)
EP (2) EP3058568B1 (ru)
JP (1) JP6366706B2 (ru)
KR (1) KR101849613B1 (ru)
CN (2) CN111370009B (ru)
AU (1) AU2014336356B2 (ru)
BR (1) BR112016008662B1 (ru)
CA (1) CA2927716C (ru)
ES (1) ES2856199T3 (ru)
MX (1) MX355091B (ru)
MY (1) MY180722A (ru)
PL (1) PL3058568T3 (ru)
RU (1) RU2646357C2 (ru)
SG (1) SG11201603000SA (ru)
TW (1) TWI575512B (ru)
WO (1) WO2015055531A1 (ru)
ZA (1) ZA201603158B (ru)

Families Citing this family (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
PL2951819T3 (pl) * 2013-01-29 2017-08-31 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Urządzenie, sposób i nośnik komputerowy do syntetyzowania sygnału audio
BR112016008662B1 (pt) * 2013-10-18 2022-06-14 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V Método, decodificador e codificador para codificação e decodificação de um sinal de áudio utilizando informação de modulação espectral relacionada com a fala
BR112016008544B1 (pt) * 2013-10-18 2021-12-21 Fraunhofer-Gesellschaft Zur Forderung Der Angewandten Forschung E.V. Codificador para codificar e decodificador para decodificar um sinal de áudio, método para codificar e método para decodificar um sinal de áudio.
KR101870962B1 (ko) * 2014-05-01 2018-06-25 니폰 덴신 덴와 가부시끼가이샤 부호화 장치, 복호 장치 및 그 방법, 프로그램, 기록 매체
US20190051286A1 (en) * 2017-08-14 2019-02-14 Microsoft Technology Licensing, Llc Normalization of high band signals in network telephony communications
WO2020164752A1 (en) 2019-02-13 2020-08-20 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Audio transmitter processor, audio receiver processor and related methods and computer programs
CN112002338B (zh) * 2020-09-01 2024-06-21 北京百瑞互联技术股份有限公司 一种优化音频编码量化次数的方法及***

Family Cites Families (43)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CA2010830C (en) 1990-02-23 1996-06-25 Jean-Pierre Adoul Dynamic codebook for efficient speech coding based on algebraic codes
CA2108623A1 (en) * 1992-11-02 1994-05-03 Yi-Sheng Wang Adaptive pitch pulse enhancer and method for use in a codebook excited linear prediction (celp) search loop
JP3099852B2 (ja) * 1993-01-07 2000-10-16 日本電信電話株式会社 励振信号の利得量子化方法
US5864797A (en) * 1995-05-30 1999-01-26 Sanyo Electric Co., Ltd. Pitch-synchronous speech coding by applying multiple analysis to select and align a plurality of types of code vectors
US5732389A (en) * 1995-06-07 1998-03-24 Lucent Technologies Inc. Voiced/unvoiced classification of speech for excitation codebook selection in celp speech decoding during frame erasures
GB9512284D0 (en) * 1995-06-16 1995-08-16 Nokia Mobile Phones Ltd Speech Synthesiser
JP3747492B2 (ja) 1995-06-20 2006-02-22 ソニー株式会社 音声信号の再生方法及び再生装置
JPH1020891A (ja) * 1996-07-09 1998-01-23 Sony Corp 音声符号化方法及び装置
JP3707153B2 (ja) * 1996-09-24 2005-10-19 ソニー株式会社 ベクトル量子化方法、音声符号化方法及び装置
US6131084A (en) * 1997-03-14 2000-10-10 Digital Voice Systems, Inc. Dual subframe quantization of spectral magnitudes
JPH11122120A (ja) * 1997-10-17 1999-04-30 Sony Corp 符号化方法及び装置、並びに復号化方法及び装置
WO1999021174A1 (en) * 1997-10-22 1999-04-29 Matsushita Electric Industrial Co., Ltd. Sound encoder and sound decoder
EP1686563A3 (en) 1997-12-24 2007-02-07 Mitsubishi Denki Kabushiki Kaisha Method and apparatus for speech decoding
US6415252B1 (en) 1998-05-28 2002-07-02 Motorola, Inc. Method and apparatus for coding and decoding speech
CN1167048C (zh) 1998-06-09 2004-09-15 松下电器产业株式会社 语音编码设备和语音解码设备
US6067511A (en) * 1998-07-13 2000-05-23 Lockheed Martin Corp. LPC speech synthesis using harmonic excitation generator with phase modulator for voiced speech
US6192335B1 (en) 1998-09-01 2001-02-20 Telefonaktieboiaget Lm Ericsson (Publ) Adaptive combining of multi-mode coding for voiced speech and noise-like signals
US6463410B1 (en) 1998-10-13 2002-10-08 Victor Company Of Japan, Ltd. Audio signal processing apparatus
CA2252170A1 (en) * 1998-10-27 2000-04-27 Bruno Bessette A method and device for high quality coding of wideband speech and audio signals
US6311154B1 (en) 1998-12-30 2001-10-30 Nokia Mobile Phones Limited Adaptive windows for analysis-by-synthesis CELP-type speech coding
JP3451998B2 (ja) * 1999-05-31 2003-09-29 日本電気株式会社 無音声符号化を含む音声符号化・復号装置、復号化方法及びプログラムを記録した記録媒体
US6615169B1 (en) * 2000-10-18 2003-09-02 Nokia Corporation High frequency enhancement layer coding in wideband speech codec
DE10124420C1 (de) 2001-05-18 2002-11-28 Siemens Ag Verfahren zur Codierung und zur Übertragung von Sprachsignalen
US6871176B2 (en) * 2001-07-26 2005-03-22 Freescale Semiconductor, Inc. Phase excited linear prediction encoder
CN100583241C (zh) 2003-04-30 2010-01-20 松下电器产业株式会社 音频编码设备、音频解码设备、音频编码方法和音频解码方法
RU2316059C2 (ru) 2003-05-01 2008-01-27 Нокиа Корпорейшн Способ и устройство для квантования усиления в широкополосном речевом кодировании с переменной битовой скоростью передачи
KR100651712B1 (ko) * 2003-07-10 2006-11-30 학교법인연세대학교 광대역 음성 부호화기 및 그 방법과 광대역 음성 복호화기및 그 방법
JP4899359B2 (ja) * 2005-07-11 2012-03-21 ソニー株式会社 信号符号化装置及び方法、信号復号装置及び方法、並びにプログラム及び記録媒体
US8271274B2 (en) 2006-02-22 2012-09-18 France Telecom Coding/decoding of a digital audio signal, in CELP technique
US8712766B2 (en) * 2006-05-16 2014-04-29 Motorola Mobility Llc Method and system for coding an information signal using closed loop adaptive bit allocation
MY146431A (en) 2007-06-11 2012-08-15 Fraunhofer Ges Forschung Audio encoder for encoding an audio signal having an impulse-like portion and stationary portion, encoding methods, decoder, decoding method, and encoded audio signal
US8392179B2 (en) 2008-03-14 2013-03-05 Dolby Laboratories Licensing Corporation Multimode coding of speech-like and non-speech-like signals
EP2144231A1 (en) * 2008-07-11 2010-01-13 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Low bitrate audio encoding/decoding scheme with common preprocessing
JP5148414B2 (ja) * 2008-08-29 2013-02-20 株式会社東芝 信号帯域拡張装置
RU2400832C2 (ru) 2008-11-24 2010-09-27 Государственное образовательное учреждение высшего профессионального образования Академия Федеральной службы охраны Российской Федерации (Академия ФCО России) Способ формирования сигнала возбуждения в низкоскоростных вокодерах с линейным предсказанием
GB2466671B (en) 2009-01-06 2013-03-27 Skype Speech encoding
JP4932917B2 (ja) * 2009-04-03 2012-05-16 株式会社エヌ・ティ・ティ・ドコモ 音声復号装置、音声復号方法、及び音声復号プログラム
MX2013009295A (es) 2011-02-15 2013-10-08 Voiceage Corp Dispositivo y método para cuantificar ganancias de contribuciones adaptativas y fijas de una excitación en un codec celp.
US9972325B2 (en) 2012-02-17 2018-05-15 Huawei Technologies Co., Ltd. System and method for mixed codebook excitation for speech coding
CN105469805B (zh) 2012-03-01 2018-01-12 华为技术有限公司 一种语音频信号处理方法和装置
PT3058568T (pt) 2013-10-18 2021-03-04 Fraunhofer Ges Forschung Conceito para codificar um sinal de áudio e descodificar um sinal de áudio usando informação de modelação espectral relacionada com a fala
BR112016008662B1 (pt) * 2013-10-18 2022-06-14 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V Método, decodificador e codificador para codificação e decodificação de um sinal de áudio utilizando informação de modulação espectral relacionada com a fala
BR112016008544B1 (pt) * 2013-10-18 2021-12-21 Fraunhofer-Gesellschaft Zur Forderung Der Angewandten Forschung E.V. Codificador para codificar e decodificador para decodificar um sinal de áudio, método para codificar e método para decodificar um sinal de áudio.

Also Published As

Publication number Publication date
JP6366706B2 (ja) 2018-08-01
US10909997B2 (en) 2021-02-02
WO2015055531A1 (en) 2015-04-23
SG11201603000SA (en) 2016-05-30
PL3058568T3 (pl) 2021-07-05
MX2016004923A (es) 2016-07-11
EP3058568A1 (en) 2016-08-24
BR112016008662A2 (ru) 2017-08-01
BR112016008662B1 (pt) 2022-06-14
US20210098010A1 (en) 2021-04-01
KR101849613B1 (ko) 2018-04-18
MX355091B (es) 2018-04-04
JP2016533528A (ja) 2016-10-27
RU2646357C2 (ru) 2018-03-02
ZA201603158B (en) 2017-11-29
MY180722A (en) 2020-12-07
CN105745705A (zh) 2016-07-06
KR20160073398A (ko) 2016-06-24
CN111370009B (zh) 2023-12-22
US20190333529A1 (en) 2019-10-31
TWI575512B (zh) 2017-03-21
AU2014336356B2 (en) 2017-04-06
CN111370009A (zh) 2020-07-03
EP3806094A1 (en) 2021-04-14
CA2927716A1 (en) 2015-04-23
CA2927716C (en) 2020-09-01
US11881228B2 (en) 2024-01-23
CN105745705B (zh) 2020-03-20
ES2856199T3 (es) 2021-09-27
US10373625B2 (en) 2019-08-06
AU2014336356A1 (en) 2016-05-19
US20160232909A1 (en) 2016-08-11
EP3058568B1 (en) 2021-01-13
TW201528255A (zh) 2015-07-16

Similar Documents

Publication Publication Date Title
RU2016119010A (ru) Принцип для кодирования аудиосигнала и декодирования аудиосигнала с использованием информации формирования речевого спектра
TW200737738A (en) Apparatus and method for encoding and decoding signal
DK1879179T3 (da) Fremgangsmåde og anordning til kodning af audiodata baseret på vektorkvantisering
RU2012150075A (ru) Передатчик сигнала активации с деформацией по времени, кодер звукового сигнала, способ преобразования сигнала активации с деформацией по времени, способ кодирования звукового сигнала и компьютерные программы
RU2020125468A (ru) Способ и система для кодирования стереофонического звукового сигнала с использованием параметров кодирования первичного канала для кодирования вторичного канала
WO2011059254A3 (en) An apparatus for processing a signal and method thereof
JP2009134303A5 (ru)
RU2015142108A (ru) Устройство и способ для уменьшения шума квантования в декодере временной области
RU2016118979A (ru) Принцип для кодирования аудиосигнала и декодирования аудиосигнала с использованием детерминированной и шумоподобной информации
JP2010210680A5 (ru)
JP2013044921A5 (ja) 符号化装置および方法、復号装置および方法、並びにプログラム
FI3751566T3 (fi) Menetelmiä, kooderi ja dekooderi äänisignaalien lineaariseen ennakoivaan koodaukseen ja dekoodaukseen näytteistystaajuudeltaan erilaisten kehysten välillä siirryttäessä
RU2648953C2 (ru) Наполнение шумом без побочной информации для celp-подобных кодеров
JP6616470B2 (ja) 符号化方法、復号化方法、符号化装置及び復号化装置
DE69923079D1 (de) Kodierung von stimmlosen sprachsegmenten mit niedriger datenrate
RU2017129552A (ru) Звуковые кодирующее устройство и декодирующее устройство
US11694701B2 (en) Low-complexity tonality-adaptive audio signal quantization
KR20150070398A (ko) 오디오 신호 인코딩/디코딩 방법 및 오디오 신호 인코딩/디코딩 장치
KR101350285B1 (ko) 신호를 부호화 및 복호화하는 방법, 장치 및 시스템
KR20150110708A (ko) 주파수 도메인 내의 선형 예측 코딩 기반 코딩을 위한 저주파수 강조
RU2016136008A (ru) Улучшенное расширение диапазона частот в декодере звукового сигнала
CN104269173A (zh) 切换模式的音频带宽扩展装置与方法
KR20170098278A (ko) 부호화 장치, 복호 장치, 이들의 방법, 프로그램 및 기록 매체
KR101807683B1 (ko) 손실 프레임을 처리하는 방법, 및 디코더
KR101413969B1 (ko) 오디오 신호의 복호화 방법 및 장치