RU2010100875A - Кодирование сигнала с использованием кодирования с регуляризацией основных тонов и без регуляризации основных тонов - Google Patents
Кодирование сигнала с использованием кодирования с регуляризацией основных тонов и без регуляризации основных тонов Download PDFInfo
- Publication number
- RU2010100875A RU2010100875A RU2010100875/09A RU2010100875A RU2010100875A RU 2010100875 A RU2010100875 A RU 2010100875A RU 2010100875/09 A RU2010100875/09 A RU 2010100875/09A RU 2010100875 A RU2010100875 A RU 2010100875A RU 2010100875 A RU2010100875 A RU 2010100875A
- Authority
- RU
- Russia
- Prior art keywords
- frame
- signal
- segment
- remainder
- temporarily
- Prior art date
Links
- 230000005236 sound signal Effects 0.000 claims abstract 53
- 238000000034 method Methods 0.000 claims abstract 45
- 238000012986 modification Methods 0.000 claims abstract 13
- 230000004048 modification Effects 0.000 claims abstract 13
- 230000002123 temporal effect Effects 0.000 claims abstract 11
- 239000003607 modifier Substances 0.000 claims 15
- 230000003044 adaptive effect Effects 0.000 claims 2
- 230000002238 attenuated effect Effects 0.000 claims 2
- 238000013507 mapping Methods 0.000 claims 2
Classifications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/04—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
- G10L19/16—Vocoder architecture
- G10L19/18—Vocoders using multiple modes
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/02—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
- G10L19/022—Blocking, i.e. grouping of samples in time; Choice of analysis windows; Overlap factoring
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/04—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
- G10L19/08—Determination or coding of the excitation function; Determination or coding of the long-term prediction parameters
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/04—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
- G10L19/08—Determination or coding of the excitation function; Determination or coding of the long-term prediction parameters
- G10L19/09—Long term prediction, i.e. removing periodical redundancies, e.g. by using adaptive codebook or pitch predictor
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/04—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
- G10L19/08—Determination or coding of the excitation function; Determination or coding of the long-term prediction parameters
- G10L19/12—Determination or coding of the excitation function; Determination or coding of the long-term prediction parameters the excitation function being a code excitation, e.g. in code excited linear prediction [CELP] vocoders
Landscapes
- Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- Computational Linguistics (AREA)
- Signal Processing (AREA)
- Health & Medical Sciences (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Human Computer Interaction (AREA)
- Acoustics & Sound (AREA)
- Multimedia (AREA)
- Spectroscopy & Molecular Physics (AREA)
- Compression, Expansion, Code Conversion, And Decoders (AREA)
Abstract
1. Способ обработки кадров аудиосигнала, причем упомянутый способ состоит в том, что: ! кодируют первый кадр аудиосигнала согласно схеме кодирования с регуляризацией основных тонов (PR); и ! кодируют второй кадр аудиосигнала согласно схеме кодирования без PR, ! при этом второй кадр следует и является последующим за первым кадром в аудиосигнале, и ! при этом упомянутое кодирование первого кадра включает в себя временное модифицирование, на основании сдвига во времени, сегмента первого сигнала, который основан на первом кадре, причем упомянутое временное модифицирование включает в себя одно из (A) временного сдвига сегмента первого кадра согласно упомянутому сдвигу во времени и (B) изменения шкалы времени сегмента первого сигнала на основании упомянутого сдвига во времени, и ! при этом упомянутое временное модифицирование сегмента первого сигнала включает в себя изменение положения импульса основного тона сегмента относительно другого импульса основного тона первого сигнала, и ! при этом упомянутое кодирование второго кадра включает в себя временное модифицирование, на основании сдвига во времени, сегмента второго сигнала, который основан на втором кадре, причем упомянутое временное модифицирование включает в себя одно из (A) временного сдвига сегмента второго кадра согласно упомянутому сдвигу во времени и (B) изменения шкалы времени сегмента второго сигнала на основании упомянутого сдвига во времени. ! 2. Способ по п.1, в котором упомянутое кодирование первого кадра включает в себя создание первого кодированного кадра, который основан на подвергнутом временному модифицированию сегменте первого сигнала, и ! п
Claims (71)
1. Способ обработки кадров аудиосигнала, причем упомянутый способ состоит в том, что:
кодируют первый кадр аудиосигнала согласно схеме кодирования с регуляризацией основных тонов (PR); и
кодируют второй кадр аудиосигнала согласно схеме кодирования без PR,
при этом второй кадр следует и является последующим за первым кадром в аудиосигнале, и
при этом упомянутое кодирование первого кадра включает в себя временное модифицирование, на основании сдвига во времени, сегмента первого сигнала, который основан на первом кадре, причем упомянутое временное модифицирование включает в себя одно из (A) временного сдвига сегмента первого кадра согласно упомянутому сдвигу во времени и (B) изменения шкалы времени сегмента первого сигнала на основании упомянутого сдвига во времени, и
при этом упомянутое временное модифицирование сегмента первого сигнала включает в себя изменение положения импульса основного тона сегмента относительно другого импульса основного тона первого сигнала, и
при этом упомянутое кодирование второго кадра включает в себя временное модифицирование, на основании сдвига во времени, сегмента второго сигнала, который основан на втором кадре, причем упомянутое временное модифицирование включает в себя одно из (A) временного сдвига сегмента второго кадра согласно упомянутому сдвигу во времени и (B) изменения шкалы времени сегмента второго сигнала на основании упомянутого сдвига во времени.
2. Способ по п.1, в котором упомянутое кодирование первого кадра включает в себя создание первого кодированного кадра, который основан на подвергнутом временному модифицированию сегменте первого сигнала, и
при этом упомянутое кодирование второго кадра включает в себя создание второго кодированного кадра, который основан на подвергнутом временному модифицированию сегменте второго сигнала.
3. Способ по п.1, в котором первый сигнал является остатком первого кадра, и при этом второй сигнал является остатком второго кадра.
4. Способ по п.1, в котором первый и второй сигналы являются взвешенными аудиосигналами.
5. Способ по п.1, в котором упомянутое кодирование первого кадра включает в себя расчет сдвига во времени на основании информации из остатка третьего кадра, который предшествует первому кадру в аудиосигнале.
6. Способ по п.5, в котором упомянутый расчет сдвига во времени включает в себя отображение выборок остатка третьего кадра в профиль задержки аудиосигнала.
7. Способ по п.6, в котором упомянутое кодирование первого кадра включает в себя вычисление профиля задержки на основании информации, относящейся к периоду основного тона аудиосигнала.
8. Способ по п.1, в котором схема кодирования PR является схемой кодирования ослабленного линейного предсказания с кодовым возбуждением, и
при этом схема кодирования без PR является одной из (A) схемы кодирования линейного предсказания с шумовым возбуждением, (B) схемы кодирования с модифицированным дискретным косинусным преобразованием и (C) схемы кодирования с интерполяцией волновым сигналом-прототипом.
9. Способ по п.1, в котором схема кодирования без PR является схемой кодирования с модифицированным дискретным косинусным преобразованием.
10. Способ по п.1, в котором упомянутое кодирование второго кадра заключается в том, что:
выполняют операцию модифицированного дискретного косинусного преобразования (MDCT) над остатком второго кадра, чтобы получить кодированный остаток; и
выполняют операцию обратного MDCT над сигналом, который основан на кодированном остатке, чтобы получить декодированный остаток,
при этом второй сигнал основан на декодированном остатке.
11. Способ по п.1, в котором упомянутое кодирование второго кадра включает в себя:
формируют остаток второго кадра, при этом второй сигнал является сформированным остатком;
вслед за упомянутым временным модифицированием сегмента второго сигнала выполняют операцию модифицированного дискретного косинусного преобразования над сформированным остатком, включающим в себя подвергнутый временному модифицированию сегмент для получения кодированного остатка; и
создают второй кодированный кадр на основании кодированного остатка.
12. Способ по п.1, при этом упомянутый способ содержит осуществление временного сдвига согласно упомянутому сдвигу во времени, сегмента остатка кадра, который следует за вторым кадром в аудиосигнале.
13. Способ по п.1, при этом упомянутый способ включает в себя временное модифицирование на основании упомянутого сдвига во времени сегмента третьего сигнала, который основан на третьем кадре аудиосигнала, который следует за вторым кадром, и
при этом упомянутое кодирование второго кадра включает в себя выполнение операции модифицированного дискретного косинусного преобразования (MDCT) над окном, которое включает в себя выборки подвергнутых временному модифицированию сегментов второго и третьего сигналов.
14. Способ по п.13, в котором второй сигнал имеет длину в M выборок, и третий сигнал имеет длину в M выборок, и
при этом упомянутое выполнение операции MDCT включает в себя создание набора из M коэффициентов MDCT, которые основаны на (A) M выборках второго сигнала, включающего в себя подвергнутый временному модифицированию сегмент, и (B) не более чем 3M/4 выборках третьего сигнала.
15. Способ по п.13, в котором второй сигнал имеет длину в M выборок, и третий сигнал имеет длину в M выборок, и
при этом упомянутое выполнение операции MDCT включает в себя создание набора из M коэффициентов MDCT, которые основаны на последовательности из 2M выборок, которая (A) включает в себя M выборок второго сигнала, включающего в себя подвергнутый временному модифицированию сегмент, (B) начинается с последовательности из по меньшей мере M/8 выборок с нулевым значением и (C) заканчивается последовательностью из по меньшей мере M/8 выборок с нулевым значением.
16. Устройство для обработки кадров аудиосигнала, упомянутое устройство содержит:
средство для кодирования первого кадра аудиосигнала согласно схеме кодирования с регуляризацией основных тонов (PR); и
средство для кодирования второго кадра аудиосигнала согласно схеме кодирования без PR,
при этом второй кадр следует и является последующим за первым кадром в аудиосигнале, и
при этом упомянутое средство для кодирования первого кадра включает в себя средство для временного модифицирования, на основании сдвига во времени, сегмента первого сигнала, который основан на первом кадре, причем упомянутое средство для временного модифицирования сконфигурировано для выполнения одного из (A) временного сдвига сегмента первого кадра согласно упомянутому сдвигу во времени и (B) изменения шкалы времени сегмента первого сигнала на основании упомянутого сдвига во времени, и
при этом упомянутое средство для временного модифицирования сегмента первого сигнала сконфигурировано для изменения положения импульса основного тона сегмента относительно другого импульса основного тона первого сигнала, и
при этом упомянутое средство для кодирования первого кадра включает в себя средство для временного модифицирования, на основании сдвига во времени, сегмента второго сигнала, который основан на втором кадре, причем упомянутое средство для временного модифицирования сконфигурировано для выполнения одного из (A) временного сдвига сегмента второго кадра согласно упомянутому сдвигу во времени и (B) изменения шкалы времени сегмента второго сигнала на основании упомянутого сдвига во времени.
17. Устройство по п.16, при этом первый сигнал является остатком первого кадра, и при этом второй сигнал является остатком второго кадра.
18. Устройство по п.16, при этом первый и второй сигналы являются взвешенными аудиосигналами.
19. Устройство по п.16, в котором упомянутое средство для кодирования первого кадра включает в себя средство для расчета сдвига во времени на основании информации из остатка третьего кадра, который предшествует первому кадру в аудиосигнале.
20. Устройство по п.16, в котором упомянутое средство для кодирования второго кадра включает в себя:
средство для формирования остатка второго кадра, при этом второй сигнал является сформированным остатком; и
средство для выполнения операции модифицированного дискретного косинусного преобразования над сформированным остатком, включающим в себя подвергнутый временному модифицированию сегмент, чтобы получить кодированный остаток,
при этом упомянутое средство для кодирования второго кадра сконфигурировано для создания второго кодированного кадра на основании кодированного остатка.
21. Устройство по п.16, в котором упомянутое средство для временного модифицирования сегмента второго сигнала сконфигурировано для осуществления временного сдвига согласно упомянутому сдвигу во времени сегмента остатка кадра, который следует за вторым кадром в аудиосигнале.
22. Устройство по п.16, в котором упомянутое средство для временного модифицирования сегмента второго сигнала сконфигурировано для временного модифицирования на основании упомянутого сдвига во времени сегмента третьего сигнала, который основан на третьем кадре аудиосигнала, который следует за вторым кадром, и
при этом упомянутое средство для кодирования второго кадра включает в себя средство для выполнения операции модифицированного дискретного косинусного преобразования (MDCT) над окном, которое включает в себя выборки подвергнутых временному модифицированию сегментов второго и третьего сигналов.
23. Устройство по п.22, при этом второй сигнал имеет длину в M выборок, и третий сигнал имеет длину в M выборок, и
при этом упомянутое средство для выполнения операции MDCT сконфигурировано для создания набора из M коэффициентов MDCT, которые основаны на (A) M выборках второго сигнала, включающего в себя подвергнутый временному модифицированию сегмент, и (B) не более чем 3M/4 выборках третьего сигнала.
24. Устройство для обработки кадров аудиосигнала, упомянутое устройство содержит:
кодер первого кадра, сконфигурированный для кодирования первого кадра аудиосигнала согласно схеме кодирования с регуляризацией основных тонов (PR); и
кодер второго кадра, сконфигурированный для кодирования второго кадра аудиосигнала согласно схеме кодирования без PR,
при этом второй кадр следует и является последующим за первым кадром в аудиосигнале, и
при этом упомянутый кодер первого кадра включает в себя первый временной модификатор, сконфигурированный для временного модифицирования, на основании сдвига во времени, сегмента первого сигнала, который основан на первом кадре, причем упомянутый первый временной модификатор сконфигурирован для выполнения одного из (A) временного сдвига сегмента первого кадра согласно упомянутому сдвигу во времени и (B) изменения шкалы времени сегмента первого сигнала на основании упомянутого сдвига во времени, и
при этом упомянутый первый временной модификатор сконфигурирован для изменения положения импульса основного тона сегмента относительно другого импульса основного тона первого сигнала, и
при этом упомянутый кодер второго кадра включает в себя второй временной модификатор, сконфигурированный для временного модифицирования, на основании сдвига во времени, сегмента второго сигнала, который основан на втором кадре, причем упомянутый второй временной модификатор сконфигурирован для выполнения одного из (A) временного сдвига сегмента второго кадра согласно упомянутому сдвигу во времени и (B) изменения шкалы времени сегмента второго сигнала на основании упомянутого сдвига во времени.
25. Устройство по п.24, при этом первый сигнал является остатком первого кадра, и при этом второй сигнал является остатком второго кадра.
26. Устройство по п.24, при этом первый и второй сигналы являются взвешенными аудиосигналами.
27. Устройство по п.24, в котором упомянутый кодер первого кадра включает в себя вычислитель сдвига во времени, сконфигурированный для расчета сдвига во времени на основании информации из остатка третьего кадра, который предшествует первому кадру в аудиосигнале.
28. Устройство по п.24, в котором упомянутый кодер второго кадра включает в себя:
формирователь остатка, сконфигурированный для формирования остатка второго кадра, при этом второй сигнал является сформированным остатком; и
модуль модифицированного дискретного косинусного преобразования (MDCT), сконфигурированный для выполнения операции MDCT над сформированным остатком, включающим в себя подвергнутый временному модифицированию сегмент, чтобы получить кодированный остаток,
при этом упомянутый кодер второго кадра сконфигурирован для создания второго кодированного кадра на основании кодированного остатка.
29. Устройство по п.24, в котором упомянутый второй временной модификатор сконфигурирован для осуществления временного сдвига согласно упомянутому сдвигу во времени сегмента остатка кадра, который следует за вторым кадром в аудиосигнале.
30. Устройство по п.24, в котором упомянутый второй временной модификатор сконфигурирован для временного модифицирования на основании упомянутого сдвига во времени сегмента третьего сигнала, который основан на третьем кадре аудиосигнала, который следует за вторым кадром, и
при этом упомянутый кодер второго кадра включает в себя модуль модифицированного дискретного косинусного преобразования (MDCT), сконфигурированный для выполнения операции MDCT над окном, которое включает в себя выборки подвергнутых временному модифицированию сегментов второго и третьего сигналов.
31. Устройство по п.30, при этом второй сигнал имеет длину в M выборок, и третий сигнал имеет длину в M выборок, и
при этом упомянутый модуль MDCT сконфигурирован для создания набора из M коэффициентов MDCT, которые основаны на (A) M выборках второго сигнала, включающего в себя подвергнутый временному модифицированию сегмент, и (B) не более чем 3M/4 выборках третьего сигнала.
32. Машиночитаемый носитель, содержащий команды, которые при исполнении их процессором побуждают процессор:
кодировать первый кадр аудиосигнала согласно схеме кодирования с регуляризацией основных тонов (PR); и
кодировать второй кадр аудиосигнала согласно схеме кодирования без PR,
при этом второй кадр следует и является последующим за первым кадром в аудиосигнале, и
при этом упомянутые команды, которые, при их исполнении, побуждают процессор кодировать первый кадр, включают в себя команды для временного модифицирования, на основании сдвига во времени, сегмента первого сигнала, который основан на первом кадре, причем упомянутые команды для временного модифицирования включают в себя одну из (A) команд для временного сдвига сегмента первого кадра согласно упомянутому сдвигу во времени и (B) команд для изменения шкалы времени сегмента первого сигнала на основании упомянутого сдвига во времени, и
при этом упомянутые команды для временного модифицирования сегмента первого сигнала включают в себя команды для изменения положения импульса основного тона сегмента относительно другого импульса основного тона первого сигнала, и
при этом упомянутые команды, которые, при их исполнении, побуждают процессор кодировать второй кадр, включают в себя команды для временного модифицирования, на основании сдвига во времени, сегмента второго сигнала, который основан на втором кадре, причем упомянутые команды для временного модифицирования включают в себя одну из (A) команд для временного сдвига сегмента второго кадра согласно упомянутому сдвигу во времени и (B) команд для изменения шкалы времени сегмента второго сигнала на основании упомянутого сдвига во времени.
33. Способ обработки кадров аудиосигнала, причем упомянутый способ состоит в том, что:
кодируют первый кадр аудиосигнала согласно первой схеме кодирования; и
кодируют второй кадр аудиосигнала согласно схеме кодирования с регуляризацией основных тонов (PR),
при этом второй кадр следует и является последующим за первым кадром в аудиосигнале, и
при этом первая схема кодирования является схемой кодировании без PR, и
при этом упомянутое кодирование первого кадра включает в себя временное модифицирование, на основании первого сдвига во времени, сегмента первого сигнала, который основан на первом кадре, причем упомянутое временное модифицирование включает в себя один из (A) временного сдвига сегмента первого сигнала согласно первому сдвигу во времени и (B) изменения шкалы времени сегмента первого сигнала на основании первого сдвига во времени; и
при этом упомянутое кодирование второго кадра включает в себя временное модифицирование, на основании второго сдвига во времени, сегмента второго сигнала, который основан на втором кадре, причем упомянутое временное модифицирование включает в себя один из (A) временного сдвига сегмента второго сигнала согласно второму сдвигу во времени и (B) изменения шкалы времени сегмента второго сигнала на основании второго сдвига во времени,
при этом упомянутое временное модифицирование сегмента второго сигнала включает в себя изменение положения импульса основного тона сегмента относительно другого импульса основного тона второго сигнала, и
при этом второй сдвиг во времени основан на информации из подвергнутого временному модифицированию сегмента первого сигнала.
34. Способ по п.33, в котором упомянутое кодирование первого кадра включает в себя создание первого кодированного кадра, который основан на подвергнутом временному модифицированию сегменте первого сигнала, и
при этом упомянутое кодирование второго кадра включает в себя создание второго кодированного кадра, который основан на подвергнутом временному модифицированию сегменте второго сигнала.
35. Способ по п.33, в котором первый сигнал является остатком первого кадра, и при этом второй сигнал является остатком второго кадра.
36. Способ по п.33, в котором первый и второй сигналы являются взвешенными аудиосигналами.
37. Способ по п.33, в котором упомянутое временное модифицирование сегмента второго сигнала включает в себя расчет второго сдвига во времени на основании информации из подвергнутого временному модифицированию сегмента первого сигнала, и
при этом упомянутый расчет второго сдвига во времени включает в себя отображение подвергнутого временному модифицированию сегмента первого сигнала в профиль задержки, который основан на информации из второго кадра.
38. Способ по п.37, в котором упомянутый второй сдвиг во времени основан на корреляции между выборками отображенного сегмента и выборками подвергнутого временному модифицированию остатка, и
при этом подвергнутый временному модифицированию остаток основан на (A) выборках остатка второго кадра и (B) первом сдвиге во времени.
39. Способ по п.33, в котором второй сигнал является остатком второго кадра, и
при этом упомянутое временное модифицирование сегмента второго сигнала включает в себя временной сдвиг первого сегмента остатка согласно второму сдвигу во времени, и при этом упомянутый способ содержит этапы, на которых:
рассчитывают третий сдвиг во времени, который является иным, чем второй сдвиг во времени, на основании информации из подвергнутого временному модифицированию сегмента первого сигнала; и
осуществляют временной сдвиг второго сегмента остатка согласно третьему сдвигу во времени.
40. Способ по п.33, в котором второй сигнал является остатком второго кадра, и
при этом упомянутое временное модифицирование сегмента второго сигнала включает в себя временной сдвиг первого сегмента остатка согласно второму сдвигу во времени, и при этом упомянутый способ содержит этапы, на которых:
рассчитывают третий сдвиг во времени, который является иным, чем второй сдвиг во времени, на основании информации из подвергнутого временному модифицированию первого сегмента остатка; и
осуществляют временной сдвиг второго сегмента остатка согласно третьему сдвигу во времени.
41. Способ по п.33, в котором упомянутое временное модифицирование сегмента второго сигнала включает в себя отображение выборок подвергнутого временному модифицированию сегмента первого сигнала в профиль задержки, который основан на информации из второго кадра.
42. Способ по п.33, причем упомянутый способ содержит этапы, на которых:
сохраняют последовательность, основанную на подвергнутом временному модифицированию сегменте первого сигнала, в буфер адаптивного словаря кодов; и
вслед за упомянутым сохранением отображают выборки буфера адаптивного словаря кодов в профиль задержки, который основан на информации из второго кадра.
43. Способ по п.33, в котором второй сигнал является остатком второго кадра, и при этом упомянутое временное модифицирование сегмента второго сигнала включает в себя изменение шкалы времени остатка второго кадра, и
при этом упомянутый способ содержит изменение шкалы времени остатка третьего кадра аудиосигнала на основании информации из подвергнутого изменению шкалы времени остатка второго кадра, при этом третий кадр является следующим за вторым кадром в аудиосигнале.
44. Способ по п.33, в котором второй сигнал является остатком второго кадра, и при этом упомянутое временное модифицирование сегмента второго сигнала включает в себя расчет второго сдвига во времени на основании (A) информации из подвергнутого временному модифицированию сегмента первого сигнала и (B) информации из остатка второго кадра.
45. Способ по п.33, в котором схема кодирования с PR является схемой кодирования ослабленного линейного предсказания с кодовым возбуждением, и при этом схема кодирования без PR является одной из (A) схемы кодирования линейного предсказания с шумовым возбуждением, (B) схемы кодирования с модифицированным дискретным косинусным преобразованием и (C) схемы кодирования с интерполяцией волновым сигналом-прототипом.
46. Способ по п.33, в котором схема кодирования без PR является схемой кодирования модифицированного дискретного косинусного преобразования.
47. Способ по п.33, в котором упомянутое кодирование первого кадра включает в себя этапы, на которых:
выполняют операцию модифицированного дискретного косинусного преобразования (MDCT) над остатком первого кадра, чтобы получить кодированный остаток; и
выполняют операцию обратного MDCT над сигналом, который основан на кодированном остатке, чтобы получить декодированный остаток,
при этом первый сигнал основан на декодированном остатке.
48. Способ по п.33, в котором упомянутое кодирование первого кадра включает в себя этапы, на которых:
формируют остаток первого кадра, при этом первый сигнал является сформированным остатком;
вслед за упомянутым временным модифицированием сегмента первого сигнала выполняют операцию модифицированного дискретного косинусного преобразования над сформированным остатком, включающим в себя подвергнутый временному модифицированию сегмент, для получения кодированного остатка; и
создают первый кодированный кадр на основании кодированного остатка.
49. Способ по п.33, в котором первый сигнал имеет длину в M выборок, и второй сигнал имеет длину в M выборок, и
при этом упомянутое кодирование первого кадра включает в себя создание набора из M коэффициентов модифицированного дискретного косинусного преобразования (MDCT), которые основаны на M выборках первого сигнала, включающего в себя подвергнутый временному модифицированию сегмент, и не более чем 3M/4 выборках второго сигнала.
50. Способ по п.33, в котором первый сигнал имеет длину в M выборок, и второй сигнал имеет длину в M выборок, и
при этом упомянутое кодирование первого кадра включает в себя создание набора из M коэффициентов модифицированного дискретного косинусного преобразования (MDCT), которые основаны на последовательности 2M выборок, которая (A) включает в себя M выборок первого сигнала, включающего в себя подвергнутый временному модифицированию сегмент, (B) начинается с последовательности из по меньшей мере M/8 выборок с нулевым значением и (C) заканчивается последовательностью из по меньшей мере M/8 выборок с нулевым значением.
51. Устройство для обработки кадров аудиосигнала, упомянутое устройство содержит:
средство для кодирования первого кадра аудиосигнала согласно первой схеме кодирования; и
средство для кодирования второго кадра аудиосигнала согласно схеме кодирования с регуляризацией основных тонов (PR),
при этом второй кадр следует и является последующим за первым кадром в аудиосигнале, и
при этом первая схема кодирования является схемой кодировании без PR, и
при этом упомянутое средство для кодирования первого кадра включает в себя средство для временного модифицирования, на основании первого сдвига во времени, сегмента первого сигнала, который основан на первом кадре, причем упомянутое средство для временного модифицирования сконфигурировано для выполнения одного из (A) временного сдвига сегмента первого сигнала согласно первому сдвигу во времени и (B) изменения шкалы времени сегмента первого сигнала на основании первого сдвига во времени; и
при этом упомянутое средство для кодирования второго кадра включает в себя средство для временного модифицирования, на основании второго сдвига во времени, сегмента второго сигнала, который основан на втором кадре, причем упомянутое средство для временного модифицирования сконфигурировано для выполнения одного из (A) временного сдвига сегмента второго сигнала согласно второму сдвигу во времени и (B) изменения шкалы времени сегмента второго сигнала на основании второго сдвига во времени,
при этом упомянутое средство для временного модифицирования сегмента второго сигнала сконфигурировано для изменения положения импульса основного тона сегмента относительно другого импульса основного тона второго сигнала, и
при этом второй сдвиг во времени основан на информации из подвергнутого временному модифицированию сегмента первого сигнала.
52. Устройство по п.51, при этом первый сигнал является остатком первого кадра, и при этом второй сигнал является остатком второго кадра.
53. Устройство по п.51, при этом первый и второй сигналы являются взвешенными аудиосигналами.
54. Устройство по п.51, в котором упомянутое средство для временного модифицирования сегмента второго сигнала включает в себя средство для расчета второго сдвига во времени на основании информации из подвергнутого временному модифицированию сегмента первого сигнала, и
при этом упомянутое средство для расчета второго сдвига во времени включает в себя средство для отображения подвергнутого временному модифицированию сегмента первого сигнала в профиль задержки, который основан на информации из второго кадра.
55. Устройство по п.54, при этом упомянутый второй сдвиг во времени основан на корреляции между выборками отображенного сегмента и выборками подвергнутого временному модифицированию остатка, и
при этом подвергнутый временному модифицированию остаток основан на (A) выборках остатка второго кадра и (B) первом сдвиге во времени.
56. Устройство по п.51, в котором второй сигнал является остатком второго кадра, и при этом упомянутое средство для временного модифицирования сегмента второго сигнала сконфигурировано для временного сдвига первого сегмента остатка согласно второму сдвигу во времени, и при этом упомянутый способ содержит:
средство для расчета третьего сдвига во времени, который является иным, чем второй сдвиг во времени, на основании информации из подвергнутого временному модифицированию первого сегмента остатка; и
средство для временного сдвига второго сегмента остатка согласно третьему сдвигу во времени.
57. Устройство по п.51, при этом второй сигнал является остатком второго кадра, и при этом упомянутое средство для временного модифицирования сегмента второго сигнала включает в себя средство для расчета второго сдвига во времени на основании (A) информации из подвергнутого временному модифицированию сегмента первого сигнала и (B) информации из остатка второго кадра.
58. Устройство по п.51, в котором упомянутое средство для кодирования первого кадра включает в себя:
средство для формирования остатка первого кадра, при этом первый сигнал является сформированным остатком; и
средство для выполнения операции модифицированного дискретного косинусного преобразования над сформированным остатком, включающим в себя подвергнутый временному модифицированию сегмент, чтобы получить кодированный остаток, и
при этом упомянутое средство для кодирования первого кадра сконфигурировано для создания первого кодированного кадра на основании кодированного остатка.
59. Устройство по п.51, в котором первый сигнал имеет длину в M выборок, и второй сигнал имеет длину в M выборок, и
при этом упомянутое средство для кодирования первого кадра включает в себя средство для создания набора из M коэффициентов модифицированного дискретного косинусного преобразования (MDCT), которые основаны на M выборках первого сигнала, включающего в себя подвергнутый временному модифицированию сегмент, и не более чем 3M/4 выборках второго сигнала.
60. Устройство по п.51, в котором первый сигнал имеет длину в M выборок, и второй сигнал имеет длину в M выборок, и
при этом упомянутое средство для кодирования первого кадра включает в себя средство для создания набора из M коэффициентов модифицированного дискретного косинусного преобразования (MDCT), которые основаны на последовательности из 2M выборок, которая (A) включает в себя M выборок первого сигнала, включающего в себя подвергнутый временному модифицированию сегмент, (B) начинается с последовательности из по меньшей мере M/8 выборок с нулевым значением и (C) заканчивается последовательностью из по меньшей мере M/8 выборок с нулевым значением.
61. Устройство для обработки кадров аудиосигнала, упомянутое устройство содержит:
кодер первого кадра, сконфигурированный для кодирования первого кадра аудиосигнала согласно первой схеме кодирования; и
кодер второго кадра, сконфигурированный для кодирования второго кадра аудиосигнала согласно схеме кодирования с регуляризацией основных тонов (PR),
при этом второй кадр следует и является последующим за первым кадром в аудиосигнале, и
при этом первая схема кодирования является схемой кодировании без PR, и
при этом упомянутый кодер первого кадра включает в себя первый временной модификатор, сконфигурированный для временного модифицирования, на основании первого сдвига во времени сегмента первого сигнала, который основан на первом кадре, причем упомянутый первый временной модификатор сконфигурирован для выполнения одного из (A) временного сдвига сегмента первого сигнала согласно первому сдвигу во времени и (B) изменения шкалы времени сегмента первого сигнала на основании первого сдвига во времени; и
при этом упомянутый кодер второго кадра включает в себя второй временной модификатор, сконфигурированный для временного модифицирования, на основании второго сдвига во времени, сегмента второго сигнала, который основан на втором кадре, причем упомянутый второй временной модификатор сконфигурирован для выполнения одного из (A) временного сдвига сегмента второго сигнала согласно второму сдвигу во времени и (B) изменения шкалы времени сегмента второго сигнала на основании второго сдвига во времени,
при этом упомянутый второй временной модификатор сконфигурирован для изменения положения импульса основного тона сегмента второго сигнала относительно другого импульса основного тона второго сигнала, и
при этом второй сдвиг во времени основан на информации из подвергнутого временному модифицированию сегмента первого сигнала.
62. Устройство по п.61, при этом первый сигнал является остатком первого кадра, и при этом второй сигнал является остатком второго кадра.
63. Устройство по п.61, при этом первый и второй сигналы являются взвешенными аудиосигналами.
64. Устройство по п.61, в котором упомянутый второй временной модификатор включает в себя вычислитель сдвига во времени, сконфигурированный для расчета второго сдвига во времени на основании информации из подвергнутого временному модифицированию сегмента первого сигнала, и
при этом упомянутый вычислитель сдвига во времени включает в себя модуль отображения, сконфигурированный для отображения подвергнутого временному модифицированию сегмента первого сигнала в профиль задержки, который основан на информации из второго кадра.
65. Устройство по п.64, при этом упомянутый второй сдвиг во времени основан на корреляции между выборками отображенного сегмента и выборками подвергнутого временному модифицированию остатка, и
при этом подвергнутый временному модифицированию остаток основан на (A) выборках остатка второго кадра и (B) первом сдвиге во времени.
66. Устройство по п.61, в котором второй сигнал является остатком второго кадра, и
при этом упомянутый второй временной модификатор сконфигурирован для временного сдвига первого сегмента остатка согласно второму сдвигу во времени, и
при этом упомянутый вычислитель сдвига во времени сконфигурирован для расчета третьего сдвига во времени, который является иным, чем второй сдвиг во времени, на основании информации из подвергнутого временному модифицированию первого сегмента остатка, и
при этом упомянутый второй временной преобразователь сконфигурирован для временного сдвига второго сегмента остатка согласно третьему сдвигу во времени.
67. Устройство по п.61, в котором второй сигнал является остатком второго кадра, и при этом упомянутый второй временной модификатор включает в себя вычислитель сдвига во времени, сконфигурированный для расчета второго сдвига во времени на основании (A) информации из подвергнутого временному модифицированию сегмента первого сигнала и (B) информации из остатка второго кадра.
68. Устройство по п.61, в котором упомянутый кодер первого кадра включает в себя:
формирователь остатка, сконфигурированный для формирования остатка первого кадра, при этом первый сигнал является сформированным остатком; и
модуль модифицированного дискретного косинусного преобразования (MDCT), сконфигурированный для выполнения операции MDCT над сформированным остатком, включающим в себя подвергнутый временному модифицированию сегмент, чтобы получить кодированный остаток, и
при этом упомянутый кодер первого кадра сконфигурирован для создания первого кодированного кадра на основании кодированного остатка.
69. Устройство по п.61, в котором первый сигнал имеет длину в M выборок, и второй сигнал имеет длину в M выборок, и
при этом упомянутый кодер первого кадра включает в себя модуль модифицированного дискретного косинусного преобразования (MDCT), сконфигурированный для создания набора из M коэффициентов MDCT, которые основаны на M выборках первого сигнала, включающего в себя подвергнутый временному модифицированию сегмент, и не более чем 3M/4 выборках второго сигнала.
70. Устройство по п.61, в котором первый сигнал имеет длину в M выборок, и второй сигнал имеет длину в M выборок, и
при этом упомянутый кодер первого кадра включает в себя модуль модифицированного дискретного косинусного преобразования (MDCT), сконфигурированный для создания набора из M коэффициентов MDCT, которые основаны на последовательности из 2M выборок, которая (A) включает в себя M выборок первого сигнала, включающего в себя подвергнутый временному модифицированию сегмент, (B) начинается с последовательности из по меньшей мере M/8 выборок с нулевым значением и (C) заканчивается последовательностью из по меньшей мере M/8 выборок с нулевым значением.
71. Машиночитаемый носитель, содержащий команды, которые при исполнении их процессором побуждают процессор:
кодировать первый кадр аудиосигнала согласно первой схеме кодирования; и
кодировать второй кадр аудиосигнала согласно схеме кодирования с регуляризацией основных тонов (PR),
при этом второй кадр следует и является последующим за первым кадром в аудиосигнале, и
при этом первая схема кодирования является схемой кодировании без PR, и
при этом упомянутые команды, которые при исполнении их процессором побуждают процессор кодировать первый кадр, включают в себя команды для временного модифицирования на основании первого сдвига во времени, сегмента первого сигнала, который основан на первом кадре, причем упомянутые команды для временного модифицирования включают в себя одну из (A) команд для временного сдвига сегмента первого сигнала согласно первому сдвигу во времени и (B) команд для изменения шкалы времени сегмента первого сигнала на основании первого сдвига во времени; и
при этом упомянутые команды, которые при исполнении их процессором побуждают процессор кодировать второй кадр, включают в себя команды для временного модифицирования на основании второго сдвига во времени, сегмента второго сигнала, который основан на втором кадре, причем упомянутые команды для временного модифицирования включают в себя одну из (A) команд для временного сдвига сегмента второго сигнала согласно второму сдвигу во времени и (B) команд для изменения шкалы времени сегмента второго сигнала на основании второго сдвига во времени,
при этом упомянутые команды для временного модифицирования сегмента второго сигнала включают в себя команды для изменения положения импульса основного тона сегмента относительно другого импульса основного тона второго сигнала, и
при этом второй сдвиг во времени основан на информации из подвергнутого временному модифицированию сегмента первого сигнала.
Applications Claiming Priority (4)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
US94355807P | 2007-06-13 | 2007-06-13 | |
US60/943,558 | 2007-06-13 | ||
US12/137,700 US9653088B2 (en) | 2007-06-13 | 2008-06-12 | Systems, methods, and apparatus for signal encoding using pitch-regularizing and non-pitch-regularizing coding |
US12/137,700 | 2008-06-12 |
Related Child Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
RU2011134203/08A Division RU2470384C1 (ru) | 2007-06-13 | 2011-08-15 | Кодирование сигнала с использованием кодирования с регуляризацией основных тонов и без регуляризации основных тонов |
Publications (1)
Publication Number | Publication Date |
---|---|
RU2010100875A true RU2010100875A (ru) | 2011-07-20 |
Family
ID=40133142
Family Applications (2)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
RU2010100875/09A RU2010100875A (ru) | 2007-06-13 | 2008-06-13 | Кодирование сигнала с использованием кодирования с регуляризацией основных тонов и без регуляризации основных тонов |
RU2011134203/08A RU2470384C1 (ru) | 2007-06-13 | 2011-08-15 | Кодирование сигнала с использованием кодирования с регуляризацией основных тонов и без регуляризации основных тонов |
Family Applications After (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
RU2011134203/08A RU2470384C1 (ru) | 2007-06-13 | 2011-08-15 | Кодирование сигнала с использованием кодирования с регуляризацией основных тонов и без регуляризации основных тонов |
Country Status (10)
Country | Link |
---|---|
US (1) | US9653088B2 (ru) |
EP (1) | EP2176860B1 (ru) |
JP (2) | JP5405456B2 (ru) |
KR (1) | KR101092167B1 (ru) |
CN (1) | CN101681627B (ru) |
BR (1) | BRPI0812948A2 (ru) |
CA (1) | CA2687685A1 (ru) |
RU (2) | RU2010100875A (ru) |
TW (1) | TWI405186B (ru) |
WO (1) | WO2008157296A1 (ru) |
Families Citing this family (62)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
KR100788706B1 (ko) * | 2006-11-28 | 2007-12-26 | 삼성전자주식회사 | 광대역 음성 신호의 부호화/복호화 방법 |
US9653088B2 (en) * | 2007-06-13 | 2017-05-16 | Qualcomm Incorporated | Systems, methods, and apparatus for signal encoding using pitch-regularizing and non-pitch-regularizing coding |
US8527265B2 (en) * | 2007-10-22 | 2013-09-03 | Qualcomm Incorporated | Low-complexity encoding/decoding of quantized MDCT spectrum in scalable speech and audio codecs |
US8254588B2 (en) | 2007-11-13 | 2012-08-28 | Stmicroelectronics Asia Pacific Pte., Ltd. | System and method for providing step size control for subband affine projection filters for echo cancellation applications |
KR101400484B1 (ko) | 2008-07-11 | 2014-05-28 | 프라운호퍼 게젤샤프트 쭈르 푀르데룽 데어 안겐반텐 포르슝 에. 베. | 시간 워프 활성 신호의 제공 및 이를 이용한 오디오 신호의 인코딩 |
MY154452A (en) * | 2008-07-11 | 2015-06-15 | Fraunhofer Ges Forschung | An apparatus and a method for decoding an encoded audio signal |
KR101381513B1 (ko) * | 2008-07-14 | 2014-04-07 | 광운대학교 산학협력단 | 음성/음악 통합 신호의 부호화/복호화 장치 |
KR101170466B1 (ko) | 2008-07-29 | 2012-08-03 | 한국전자통신연구원 | Mdct 영역에서의 후처리 방법, 및 장치 |
KR101670063B1 (ko) * | 2008-09-18 | 2016-10-28 | 한국전자통신연구원 | Mdct 기반의 코더와 이종의 코더 간 변환에서의 인코딩 장치 및 디코딩 장치 |
US20100114568A1 (en) * | 2008-10-24 | 2010-05-06 | Lg Electronics Inc. | Apparatus for processing an audio signal and method thereof |
CN101604525B (zh) * | 2008-12-31 | 2011-04-06 | 华为技术有限公司 | 基音增益获取方法、装置及编码器、解码器 |
EP2407963B1 (en) * | 2009-03-11 | 2015-05-13 | Huawei Technologies Co., Ltd. | Linear prediction analysis method, apparatus and system |
CN102460574A (zh) * | 2009-05-19 | 2012-05-16 | 韩国电子通信研究院 | 用于使用层级正弦脉冲编码对音频信号进行编码和解码的方法和设备 |
KR20110001130A (ko) * | 2009-06-29 | 2011-01-06 | 삼성전자주식회사 | 가중 선형 예측 변환을 이용한 오디오 신호 부호화 및 복호화 장치 및 그 방법 |
JP5304504B2 (ja) * | 2009-07-17 | 2013-10-02 | ソニー株式会社 | 信号符号化装置、信号復号装置、信号処理システム、これらにおける処理方法およびプログラム |
FR2949582B1 (fr) * | 2009-09-02 | 2011-08-26 | Alcatel Lucent | Procede pour rendre un signal musical compatible avec un codec a transmission discontinue ; et dispositif pour la mise en ?uvre de ce procede |
KR101309671B1 (ko) | 2009-10-21 | 2013-09-23 | 돌비 인터네셔널 에이비 | 결합된 트랜스포저 필터 뱅크에서의 오버샘플링 |
US8682653B2 (en) * | 2009-12-15 | 2014-03-25 | Smule, Inc. | World stage for pitch-corrected vocal performances |
US9147385B2 (en) | 2009-12-15 | 2015-09-29 | Smule, Inc. | Continuous score-coded pitch correction |
CN102884572B (zh) * | 2010-03-10 | 2015-06-17 | 弗兰霍菲尔运输应用研究公司 | 音频信号解码器、音频信号编码器、用以将音频信号解码的方法、及用以将音频信号编码的方法 |
GB2546687B (en) | 2010-04-12 | 2018-03-07 | Smule Inc | Continuous score-coded pitch correction and harmony generation techniques for geographically distributed glee club |
US10930256B2 (en) | 2010-04-12 | 2021-02-23 | Smule, Inc. | Social music system and method with continuous, real-time pitch correction of vocal performance and dry vocal capture for subsequent re-rendering based on selectively applicable vocal effect(s) schedule(s) |
US9601127B2 (en) | 2010-04-12 | 2017-03-21 | Smule, Inc. | Social music system and method with continuous, real-time pitch correction of vocal performance and dry vocal capture for subsequent re-rendering based on selectively applicable vocal effect(s) schedule(s) |
RU2582061C2 (ru) | 2010-06-09 | 2016-04-20 | Панасоник Интеллекчуал Проперти Корпорэйшн оф Америка | Способ расширения ширины полосы, устройство расширения ширины полосы, программа, интегральная схема и устройство декодирования аудио |
US9236063B2 (en) | 2010-07-30 | 2016-01-12 | Qualcomm Incorporated | Systems, methods, apparatus, and computer-readable media for dynamic bit allocation |
US9208792B2 (en) | 2010-08-17 | 2015-12-08 | Qualcomm Incorporated | Systems, methods, apparatus, and computer-readable media for noise injection |
US20120089390A1 (en) * | 2010-08-27 | 2012-04-12 | Smule, Inc. | Pitch corrected vocal capture for telephony targets |
US8924200B2 (en) * | 2010-10-15 | 2014-12-30 | Motorola Mobility Llc | Audio signal bandwidth extension in CELP-based speech coder |
US20120143611A1 (en) * | 2010-12-07 | 2012-06-07 | Microsoft Corporation | Trajectory Tiling Approach for Text-to-Speech |
EP2676266B1 (en) | 2011-02-14 | 2015-03-11 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Linear prediction based coding scheme using spectral domain noise shaping |
AR085218A1 (es) | 2011-02-14 | 2013-09-18 | Fraunhofer Ges Forschung | Aparato y metodo para ocultamiento de error en voz unificada con bajo retardo y codificacion de audio |
TWI476760B (zh) | 2011-02-14 | 2015-03-11 | Fraunhofer Ges Forschung | 用以使用暫態檢測及品質結果將音訊信號的部分編碼之裝置與方法 |
AU2012217269B2 (en) | 2011-02-14 | 2015-10-22 | Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. | Apparatus and method for processing a decoded audio signal in a spectral domain |
AR085361A1 (es) | 2011-02-14 | 2013-09-25 | Fraunhofer Ges Forschung | Codificacion y decodificacion de posiciones de los pulsos de las pistas de una señal de audio |
JP5712288B2 (ja) | 2011-02-14 | 2015-05-07 | フラウンホーファー−ゲゼルシャフト・ツール・フェルデルング・デル・アンゲヴァンテン・フォルシュング・アインゲトラーゲネル・フェライン | 重複変換を使用した情報信号表記 |
SG192721A1 (en) * | 2011-02-14 | 2013-09-30 | Fraunhofer Ges Forschung | Apparatus and method for encoding and decoding an audio signal using an aligned look-ahead portion |
TWI591468B (zh) | 2011-03-30 | 2017-07-11 | 仁寶電腦工業股份有限公司 | 電子裝置與風扇控制方法 |
US9866731B2 (en) | 2011-04-12 | 2018-01-09 | Smule, Inc. | Coordinating and mixing audiovisual content captured from geographically distributed performers |
CN102800317B (zh) * | 2011-05-25 | 2014-09-17 | 华为技术有限公司 | 信号分类方法及设备、编解码方法及设备 |
CN104012037A (zh) * | 2011-10-27 | 2014-08-27 | 远程通讯发展中心(C-Dot) | 一种用于无线失效时管理租用线路网络的通信*** |
GB2510075A (en) * | 2011-10-27 | 2014-07-23 | Ct For Dev Of Telematics C Dot | A communication system for managing leased line network and a method thereof |
KR101390551B1 (ko) * | 2012-09-24 | 2014-04-30 | 충북대학교 산학협력단 | 저 지연 변형된 이산 코사인 변환 방법 |
CN108074579B (zh) | 2012-11-13 | 2022-06-24 | 三星电子株式会社 | 用于确定编码模式的方法以及音频编码方法 |
EP2757558A1 (en) | 2013-01-18 | 2014-07-23 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Time domain level adjustment for audio signal decoding or encoding |
CN110223704B (zh) | 2013-01-29 | 2023-09-15 | 弗劳恩霍夫应用研究促进协会 | 对音频信号的频谱执行噪声填充的装置 |
US9514761B2 (en) * | 2013-04-05 | 2016-12-06 | Dolby International Ab | Audio encoder and decoder for interleaved waveform coding |
CN104301064B (zh) * | 2013-07-16 | 2018-05-04 | 华为技术有限公司 | 处理丢失帧的方法和解码器 |
US9984706B2 (en) | 2013-08-01 | 2018-05-29 | Verint Systems Ltd. | Voice activity detection using a soft decision mechanism |
CN104681032B (zh) * | 2013-11-28 | 2018-05-11 | ***通信集团公司 | 一种语音通信方法和设备 |
EP3095269B1 (en) * | 2014-01-13 | 2020-10-07 | Nokia Solutions and Networks Oy | Method, apparatus and computer program |
WO2015174912A1 (en) | 2014-05-15 | 2015-11-19 | Telefonaktiebolaget L M Ericsson (Publ) | Audio signal classification and coding |
CN106683681B (zh) | 2014-06-25 | 2020-09-25 | 华为技术有限公司 | 处理丢失帧的方法和装置 |
CN106228991B (zh) | 2014-06-26 | 2019-08-20 | 华为技术有限公司 | 编解码方法、装置及*** |
PL3163571T3 (pl) * | 2014-07-28 | 2020-05-18 | Nippon Telegraph And Telephone Corporation | Kodowanie sygnału dźwiękowego |
JP6086999B2 (ja) | 2014-07-28 | 2017-03-01 | フラウンホーファー−ゲゼルシャフト・ツール・フェルデルング・デル・アンゲヴァンテン・フォルシュング・アインゲトラーゲネル・フェライン | ハーモニクス低減を使用して第1符号化アルゴリズムと第2符号化アルゴリズムの一方を選択する装置及び方法 |
EP3230980B1 (en) * | 2014-12-09 | 2018-11-28 | Dolby International AB | Mdct-domain error concealment |
CN104616659B (zh) * | 2015-02-09 | 2017-10-27 | 山东大学 | 相位对重构语音声调感知影响方法及在人工耳蜗中应用 |
WO2016142002A1 (en) | 2015-03-09 | 2016-09-15 | Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. | Audio encoder, audio decoder, method for encoding an audio signal and method for decoding an encoded audio signal |
US11488569B2 (en) | 2015-06-03 | 2022-11-01 | Smule, Inc. | Audio-visual effects system for augmentation of captured performance based on content thereof |
US11032602B2 (en) | 2017-04-03 | 2021-06-08 | Smule, Inc. | Audiovisual collaboration method with latency management for wide-area broadcast |
US10210871B2 (en) * | 2016-03-18 | 2019-02-19 | Qualcomm Incorporated | Audio processing for temporally mismatched signals |
US11310538B2 (en) | 2017-04-03 | 2022-04-19 | Smule, Inc. | Audiovisual collaboration system and method with latency management for wide-area broadcast and social media-type user interface mechanics |
Family Cites Families (64)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US5384891A (en) | 1988-09-28 | 1995-01-24 | Hitachi, Ltd. | Vector quantizing apparatus and speech analysis-synthesis system using the apparatus |
US5357594A (en) | 1989-01-27 | 1994-10-18 | Dolby Laboratories Licensing Corporation | Encoding and decoding using specially designed pairs of analysis and synthesis windows |
JPH0385398A (ja) | 1989-08-30 | 1991-04-10 | Omron Corp | 扇風機の送風量ファジイ制御装置 |
CN1062963C (zh) | 1990-04-12 | 2001-03-07 | 多尔拜实验特许公司 | 用于产生高质量声音信号的解码器和编码器 |
FR2675969B1 (fr) | 1991-04-24 | 1994-02-11 | France Telecom | Procede et dispositif de codage-decodage d'un signal numerique. |
US5455888A (en) | 1992-12-04 | 1995-10-03 | Northern Telecom Limited | Speech bandwidth extension method and apparatus |
JP3531177B2 (ja) | 1993-03-11 | 2004-05-24 | ソニー株式会社 | 圧縮データ記録装置及び方法、圧縮データ再生方法 |
TW271524B (ru) | 1994-08-05 | 1996-03-01 | Qualcomm Inc | |
DE69619284T3 (de) | 1995-03-13 | 2006-04-27 | Matsushita Electric Industrial Co., Ltd., Kadoma | Vorrichtung zur Erweiterung der Sprachbandbreite |
US5704003A (en) * | 1995-09-19 | 1997-12-30 | Lucent Technologies Inc. | RCELP coder |
KR100389895B1 (ko) * | 1996-05-25 | 2003-11-28 | 삼성전자주식회사 | 음성 부호화 및 복호화방법 및 그 장치 |
US6134518A (en) | 1997-03-04 | 2000-10-17 | International Business Machines Corporation | Digital audio signal coding using a CELP coder and a transform coder |
WO1999010719A1 (en) * | 1997-08-29 | 1999-03-04 | The Regents Of The University Of California | Method and apparatus for hybrid coding of speech at 4kbps |
US6169970B1 (en) | 1998-01-08 | 2001-01-02 | Lucent Technologies Inc. | Generalized analysis-by-synthesis speech coding method and apparatus |
EP0932141B1 (en) * | 1998-01-22 | 2005-08-24 | Deutsche Telekom AG | Method for signal controlled switching between different audio coding schemes |
US6449590B1 (en) | 1998-08-24 | 2002-09-10 | Conexant Systems, Inc. | Speech encoder using warping in long term preprocessing |
US6754630B2 (en) * | 1998-11-13 | 2004-06-22 | Qualcomm, Inc. | Synthesis of speech from pitch prototype waveforms by time-synchronous waveform interpolation |
US6456964B2 (en) * | 1998-12-21 | 2002-09-24 | Qualcomm, Incorporated | Encoding of periodic speech using prototype waveforms |
US6691084B2 (en) * | 1998-12-21 | 2004-02-10 | Qualcomm Incorporated | Multiple mode variable rate speech coding |
EP1126620B1 (en) | 1999-05-14 | 2005-12-21 | Matsushita Electric Industrial Co., Ltd. | Method and apparatus for expanding band of audio signal |
US6330532B1 (en) | 1999-07-19 | 2001-12-11 | Qualcomm Incorporated | Method and apparatus for maintaining a target bit rate in a speech coder |
JP4792613B2 (ja) | 1999-09-29 | 2011-10-12 | ソニー株式会社 | 情報処理装置および方法、並びに記録媒体 |
JP4211166B2 (ja) * | 1999-12-10 | 2009-01-21 | ソニー株式会社 | 符号化装置及び方法、記録媒体、並びに復号装置及び方法 |
US7386444B2 (en) * | 2000-09-22 | 2008-06-10 | Texas Instruments Incorporated | Hybrid speech coding and system |
US6947888B1 (en) * | 2000-10-17 | 2005-09-20 | Qualcomm Incorporated | Method and apparatus for high performance low bit-rate coding of unvoiced speech |
EP1199711A1 (en) | 2000-10-20 | 2002-04-24 | Telefonaktiebolaget Lm Ericsson | Encoding of audio signal using bandwidth expansion |
US6694293B2 (en) * | 2001-02-13 | 2004-02-17 | Mindspeed Technologies, Inc. | Speech coding system with a music classifier |
US7461002B2 (en) | 2001-04-13 | 2008-12-02 | Dolby Laboratories Licensing Corporation | Method for time aligning audio signals using characterizations based on auditory events |
US7136418B2 (en) | 2001-05-03 | 2006-11-14 | University Of Washington | Scalable and perceptually ranked signal coding and decoding |
US6658383B2 (en) | 2001-06-26 | 2003-12-02 | Microsoft Corporation | Method for coding speech and music signals |
US6879955B2 (en) | 2001-06-29 | 2005-04-12 | Microsoft Corporation | Signal modification based on continuous time warping for low bit rate CELP coding |
CA2365203A1 (en) | 2001-12-14 | 2003-06-14 | Voiceage Corporation | A signal modification method for efficient coding of speech signals |
EP1341160A1 (en) | 2002-03-01 | 2003-09-03 | Deutsche Thomson-Brandt Gmbh | Method and apparatus for encoding and for decoding a digital information signal |
US7116745B2 (en) | 2002-04-17 | 2006-10-03 | Intellon Corporation | Block oriented digital communication system and method |
JP4649208B2 (ja) | 2002-07-16 | 2011-03-09 | コーニンクレッカ フィリップス エレクトロニクス エヌ ヴィ | オーディオコーディング |
US8090577B2 (en) * | 2002-08-08 | 2012-01-03 | Qualcomm Incorported | Bandwidth-adaptive quantization |
JP4178319B2 (ja) * | 2002-09-13 | 2008-11-12 | インターナショナル・ビジネス・マシーンズ・コーポレーション | 音声処理におけるフェーズ・アライメント |
US20040098255A1 (en) | 2002-11-14 | 2004-05-20 | France Telecom | Generalized analysis-by-synthesis speech coding method, and coder implementing such method |
AU2003208517A1 (en) * | 2003-03-11 | 2004-09-30 | Nokia Corporation | Switching between coding schemes |
GB0321093D0 (en) | 2003-09-09 | 2003-10-08 | Nokia Corp | Multi-rate coding |
US7412376B2 (en) * | 2003-09-10 | 2008-08-12 | Microsoft Corporation | System and method for real-time detection and preservation of speech onset in a signal |
FR2867649A1 (fr) | 2003-12-10 | 2005-09-16 | France Telecom | Procede de codage multiple optimise |
US7516064B2 (en) | 2004-02-19 | 2009-04-07 | Dolby Laboratories Licensing Corporation | Adaptive hybrid transform for signal analysis and synthesis |
FI118834B (fi) * | 2004-02-23 | 2008-03-31 | Nokia Corp | Audiosignaalien luokittelu |
WO2005099243A1 (ja) | 2004-04-09 | 2005-10-20 | Nec Corporation | 音声通信方法及び装置 |
US8032360B2 (en) * | 2004-05-13 | 2011-10-04 | Broadcom Corporation | System and method for high-quality variable speed playback of audio-visual media |
US7739120B2 (en) * | 2004-05-17 | 2010-06-15 | Nokia Corporation | Selection of coding models for encoding an audio signal |
MXPA06012617A (es) * | 2004-05-17 | 2006-12-15 | Nokia Corp | Codificacion de audio con diferentes longitudes de cuadro de codificacion. |
CN101061533B (zh) | 2004-10-26 | 2011-05-18 | 松下电器产业株式会社 | 语音编码装置和语音编码方法 |
US20070147518A1 (en) * | 2005-02-18 | 2007-06-28 | Bruno Bessette | Methods and devices for low-frequency emphasis during audio compression based on ACELP/TCX |
US8155965B2 (en) | 2005-03-11 | 2012-04-10 | Qualcomm Incorporated | Time warping frames inside the vocoder by modifying the residual |
AU2006232364B2 (en) | 2005-04-01 | 2010-11-25 | Qualcomm Incorporated | Systems, methods, and apparatus for wideband speech coding |
US7991610B2 (en) | 2005-04-13 | 2011-08-02 | Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. | Adaptive grouping of parameters for enhanced coding efficiency |
US7751572B2 (en) | 2005-04-15 | 2010-07-06 | Dolby International Ab | Adaptive residual audio coding |
FR2891100B1 (fr) * | 2005-09-22 | 2008-10-10 | Georges Samake | Codec audio utilisant la transformation de fourier rapide, le recouvrement partiel et une decomposition en deux plans basee sur l'energie. |
US7720677B2 (en) | 2005-11-03 | 2010-05-18 | Coding Technologies Ab | Time warped modified transform coding of audio signals |
KR100715949B1 (ko) * | 2005-11-11 | 2007-05-08 | 삼성전자주식회사 | 고속 음악 무드 분류 방법 및 그 장치 |
US8032369B2 (en) | 2006-01-20 | 2011-10-04 | Qualcomm Incorporated | Arbitrary average data rates for variable rate coders |
KR100717387B1 (ko) * | 2006-01-26 | 2007-05-11 | 삼성전자주식회사 | 유사곡 검색 방법 및 그 장치 |
KR100774585B1 (ko) * | 2006-02-10 | 2007-11-09 | 삼성전자주식회사 | 변조 스펙트럼을 이용한 음악 정보 검색 방법 및 그 장치 |
US7987089B2 (en) | 2006-07-31 | 2011-07-26 | Qualcomm Incorporated | Systems and methods for modifying a zero pad region of a windowed frame of an audio signal |
US8239190B2 (en) | 2006-08-22 | 2012-08-07 | Qualcomm Incorporated | Time-warping frames of wideband vocoder |
US8126707B2 (en) * | 2007-04-05 | 2012-02-28 | Texas Instruments Incorporated | Method and system for speech compression |
US9653088B2 (en) * | 2007-06-13 | 2017-05-16 | Qualcomm Incorporated | Systems, methods, and apparatus for signal encoding using pitch-regularizing and non-pitch-regularizing coding |
-
2008
- 2008-06-12 US US12/137,700 patent/US9653088B2/en active Active
- 2008-06-13 KR KR1020107000788A patent/KR101092167B1/ko active IP Right Grant
- 2008-06-13 CA CA002687685A patent/CA2687685A1/en not_active Abandoned
- 2008-06-13 CN CN2008800195483A patent/CN101681627B/zh active Active
- 2008-06-13 RU RU2010100875/09A patent/RU2010100875A/ru not_active Application Discontinuation
- 2008-06-13 WO PCT/US2008/066840 patent/WO2008157296A1/en active Application Filing
- 2008-06-13 TW TW097122276A patent/TWI405186B/zh not_active IP Right Cessation
- 2008-06-13 JP JP2010512371A patent/JP5405456B2/ja not_active Expired - Fee Related
- 2008-06-13 EP EP08770949.9A patent/EP2176860B1/en active Active
- 2008-06-13 BR BRPI0812948-7A2A patent/BRPI0812948A2/pt not_active IP Right Cessation
-
2011
- 2011-08-15 RU RU2011134203/08A patent/RU2470384C1/ru active
-
2013
- 2013-07-05 JP JP2013141575A patent/JP5571235B2/ja not_active Expired - Fee Related
Also Published As
Publication number | Publication date |
---|---|
US9653088B2 (en) | 2017-05-16 |
RU2470384C1 (ru) | 2012-12-20 |
EP2176860A1 (en) | 2010-04-21 |
BRPI0812948A2 (pt) | 2014-12-09 |
CN101681627B (zh) | 2013-01-02 |
TWI405186B (zh) | 2013-08-11 |
JP2010530084A (ja) | 2010-09-02 |
KR101092167B1 (ko) | 2011-12-13 |
TW200912897A (en) | 2009-03-16 |
JP2013242579A (ja) | 2013-12-05 |
CA2687685A1 (en) | 2008-12-24 |
WO2008157296A1 (en) | 2008-12-24 |
US20080312914A1 (en) | 2008-12-18 |
KR20100031742A (ko) | 2010-03-24 |
CN101681627A (zh) | 2010-03-24 |
JP5571235B2 (ja) | 2014-08-13 |
EP2176860B1 (en) | 2014-12-03 |
JP5405456B2 (ja) | 2014-02-05 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
RU2010100875A (ru) | Кодирование сигнала с использованием кодирования с регуляризацией основных тонов и без регуляризации основных тонов | |
CN102089758B (zh) | 用于对采样音频信号的帧进行编码和解码的音频编码器和解码器 | |
KR101831289B1 (ko) | 오디오 신호의 스펙트럼의 스펙트럼 계수들의 코딩 | |
TWI449033B (zh) | 用以編碼係數節段之音訊編碼器和方法、用以解碼已編碼音訊流之音訊解碼器和方法、及電腦程式 | |
KR101441896B1 (ko) | 적응적 lpc 계수 보간을 이용한 오디오 신호의 부호화,복호화 방법 및 장치 | |
RU2557455C2 (ru) | Прямая компенсация наложения спектров во временной области с применением в области взвешенного или исходного сигнала | |
CA2831176C (en) | Apparatus and method for audio encoding and decoding employing sinusoidal substitution | |
CN102770912B (zh) | 使用线性预测滤波的前向时域混叠消除 | |
RU2742460C2 (ru) | Предсказание на основе модели в наборе фильтров с критической дискретизацией | |
JP5530454B2 (ja) | オーディオ符号化装置、復号装置、方法、回路およびプログラム | |
KR101748517B1 (ko) | 제 1 인코딩 알고리즘 및 고조파 감소를 이용하는 제 2 인코딩 알고리즘 중 하나를 선택하기 위한 장치 및 방법 | |
RU2006139794A (ru) | Поддержка переключения между режимами звукового кодера | |
KR20130133848A (ko) | 스펙트럼 도메인 잡음 형상화를 사용하는 선형 예측 기반 코딩 방식 | |
RU2016121172A (ru) | Аудиодекодер и способ обеспечения декодированной аудиоинформации с использованием маскирования ошибки на основании сигнала возбуждения во временной области | |
RU2012127132A (ru) | Способ кодирования, способ декодирования, устройство кодера, устройство декодера, программа и носитель записи | |
CN102859588A (zh) | 音频信号编码器、音频信号译码器、用以提供音频内容的编码表示型态的方法、用以提供音频内容的译码表示型态的方法及用于低延迟应用的计算机程序 | |
RU2009117569A (ru) | Кодер, декодер и методы кодирования и декодирования сегментов данных, представляющих собой поток данных временного интервала | |
RU2007137643A (ru) | Изменение масштаба времени кадров в вокодере посредством изменения остатка | |
RU2012143340A (ru) | Декодер звукового сигнала, кодирующее устройство звукового сигнала, способы и компьютерная программа, использующие зависящее от частоты выборки кодирование контура деформации времени | |
RU2008148560A (ru) | Декодирование кодированных с предсказанием данных с использованием адаптации буфера | |
JP2019164367A (ja) | 低複雑度の調性適応音声信号量子化 | |
JP2956068B2 (ja) | 音声符号化復号化方式 | |
JP3166697B2 (ja) | 音声符号化・復号装置及びシステム | |
KR100310930B1 (ko) | 음성합성장치및그방법 | |
KR102008488B1 (ko) | 편안한 잡음 생성 모드 선택을 위한 장치 및 방법 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
FA94 | Acknowledgement of application withdrawn (non-payment of fees) |
Effective date: 20120410 |