RU2445719C2 - Способ улучшения восприятия синтезированной речи при реализации процедуры анализа через синтез в вокодерах с линейным предсказанием - Google Patents

Способ улучшения восприятия синтезированной речи при реализации процедуры анализа через синтез в вокодерах с линейным предсказанием Download PDF

Info

Publication number
RU2445719C2
RU2445719C2 RU2010115914/08A RU2010115914A RU2445719C2 RU 2445719 C2 RU2445719 C2 RU 2445719C2 RU 2010115914/08 A RU2010115914/08 A RU 2010115914/08A RU 2010115914 A RU2010115914 A RU 2010115914A RU 2445719 C2 RU2445719 C2 RU 2445719C2
Authority
RU
Russia
Prior art keywords
speech
synthesis
linear prediction
iteration
vocoders
Prior art date
Application number
RU2010115914/08A
Other languages
English (en)
Other versions
RU2010115914A (ru
Inventor
Андрей Алексеевич Афанасьев (RU)
Андрей Алексеевич Афанасьев
Михаил Владимирович Илюшин (RU)
Михаил Владимирович Илюшин
Олег Николаевич Титов (RU)
Олег Николаевич Титов
Original Assignee
Государственное образовательное учреждение высшего профессионального образования Академия Федеральной службы охраны Российской Федерации (Академия ФСО России)
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Государственное образовательное учреждение высшего профессионального образования Академия Федеральной службы охраны Российской Федерации (Академия ФСО России) filed Critical Государственное образовательное учреждение высшего профессионального образования Академия Федеральной службы охраны Российской Федерации (Академия ФСО России)
Priority to RU2010115914/08A priority Critical patent/RU2445719C2/ru
Publication of RU2010115914A publication Critical patent/RU2010115914A/ru
Application granted granted Critical
Publication of RU2445719C2 publication Critical patent/RU2445719C2/ru

Links

Images

Landscapes

  • Compression, Expansion, Code Conversion, And Decoders (AREA)

Abstract

Изобретение относится к области цифровой связи и может быть использовано в системах телеинформационных коммуникаций для эффективного кодирования речевых сигналов. Техническим результатом является улучшение восприятия синтезированной речи при реализации процедуры анализа через синтез в вокодерах с линейным предсказанием. Указанный результат достигается тем, что в способе улучшения восприятия синтезированной речи при реализации процедуры анализа через синтез в вокодерах с линейным предсказанием на передающей стороне итерационно синтезируют речевой сигнал на длительности участка квазистационарности речи, изменяя при каждой итерации параметры кодека в соответствии с используемым алгоритмом линейного предсказания для вычисления наилучших в рамках заданных ограничений параметров кодека с линейным предсказанием. Вводят итерационный расчет критерия модифицированного искажения спектра барков, изменяя при каждой итерации параметры кодека в соответствии с используемым алгоритмом линейного предсказания. Далее вычисляют минимальное перцептуальное искажение, при этом параметры кодека, соответствующие данной итерации, считают наилучшими и используют для синтеза речевого сигнала на длительности участка квазистационарности речи на приемной стороне. 2 ил.

Description

Изобретение относится к области цифровой связи и может быть использовано в системах телеинформационных коммуникаций при реализации процедуры анализа через синтез в вокодерах с линейным предсказанием.
В настоящее время наблюдается широкое использование информационных технологий в телекоммуникационных сетях связи. Переход к цифровой обработке сигналов и пакетной передаче данных позволил предоставить пользователям более широкий спектр инфокоммуникационных услуг. При этом достаточно большую часть телетрафика в различных приложениях составляет передача речевых сигналов.
Основной проблемой цифрового представления речевого сигнала является задача качественного и компактного кодирования данных для их передачи по цифровым каналам связи. Решение этой проблемы позволит в условиях заданного критерия качества связи увеличить пропускную способность линейных трактов и каналов передачи. Часто в некоторых задачах кодирования речевого сигнала предполагается снизить скорость передачи при сохранении качественных показателей ее восприятия. В кодеках речевых сигналов с переменной скоростью передачи, ориентированных на использование в системах связи основанных на принципе коммутации пакетов уместно говорить о снижении средней скорости передачи при сохранении качественных показателей синтезированного речевого сигнала.
Среди многообразия методов кодирования речевых сигналов одним из наиболее эффективных является метод линейного предсказания. Метод линейного предсказания речи принадлежит к классу методов, использующих модель речевого сигнала в виде отклика линейной системы с переменными параметрами (голосового тракта) на соответствующий сигнал возбуждения (порождающий сигнал). Анализатор речепреобразующего устройства выделяет из короткого сегмента речевого сигнала параметры состояния линейной системы и сигнала возбуждения, позволяющие синтезатору восстановить исходный сигнал с требуемой степенью верности. Для повышения качества синтезированного речевого сигнала во многих алгоритмах кодирования речи на основе линейного предсказания усложняют представления сигнала возбуждения для того, чтобы с одной стороны компактно передать его на приемную сторону, а с другой - приблизить его к виду ошибки предсказания как идеальному сигналу воздействия на фильтр синтеза. Дополнительно вводятся разные варианты квантования различных параметров липредера (скалярное, векторное и каскадное векторное).
Известны различные алгоритмы низкоскоростного кодирования речи в вокодерах с линейным предсказанием (О.И.Шелухин, Н.Ф.Лукьянцев Цифровая обработка и передача речи. - М.: Радио и Связь, 2000 г. - С.102-166; Рабинер Л.Р., Шафер Р.В. Цифровая обработка речевых сигналов. - М.: Радио и связь, 1981. - С.365-428). Во многих из них одной из базовых операций при низкоскоростном кодировании является процедура анализа через синтез. Достаточно подробно ее описание представлено в (О.И.Шелухин, Н.Ф.Лукьянцев Цифровая обработка и передача речи. - М.: Радио и Связь, 2000 г. - С.108-112).
Данная процедура является итерационной и направлена на вычисление наилучших в рамках заданных ограничений параметров кодека с линейным предсказанием, при этом V - количество возможных итераций. При этом в кодере реализуется синтез речевого сигнала и дальнейший анализ пригодности выбранных параметров с целью их передачи по каналу связи на приемную сторону, где будет реализована процедура синтеза. Отсюда и название данной процедуры.
Исследования в области речевого кодирования указали на необходимость использования перцептуальных особенностей слуха человека (Попов О.Б., Рихтер С.Г. Цифровая обработка сигналов в трактах звукового вещания. Учебное пособие для вузов. - М.: Горячая линия - Телеком, 2007. - С.13-21, 123-132). Однако до сих пор в качестве критерия выбора параметров кодека с линейным предсказанием при реализации процедуры анализа через синтез используются либо среднеквадратическое отклонение (1), либо суммарное (2) или сегментированное (3) отношение сигнал/шум (ОСШ), основанные на метрике Евклида и не учитывающие перцептуальную важность параметров кодека при синтезе речевого сигнала (патенты US №5235669 от 10.08.1993, RU №2248619 от 20.03.2005, RU №2331933 от 20.08.2008, RU №2343564 от 10.01.2009, US №6859775 от 22.02.2005).
Figure 00000001
где S(i) - вектор входных значений;
S'(i) - вектор оценок;
N - общее количество отсчетов в исследуемом речевом фрагменте.
В выражении (1) допускается, что искажения, вносимые каждым элементом вектора
Figure 00000002
, имеют равный вес. В общем случае для отражения вклада отдельных элементов в искажение вводятся неравные веса в виде взвешивающей матрицы. Указанный метод позволяет лишь сравнить форму огибающих исходного и синтезированного речевого сигнала. Поэтому для количественной оценки качества звучания синтезированного речевого сигнала во временной области чаще используют критерий отношения сигнал/шум:
Figure 00000003
S(i) и S'(i)-i-e отсчеты исходной и синтезированной речи;
N - общее количество отсчетов в исследуемом речевом фрагменте.
ОСШ учитывает общие мощности сигнала и шума на всей длительности испытательного сигнала. При исследовании некоторых речевых кодеков большое значение имеют кратковременные отношения сигнал/шум, вычисленные на коротких сегментах речевого сигнала. Таким образом, учитывается сегментный характер слухового восприятия элементов речи. Критерий сегментного отношения сигнал/шум (ОСШсег,) имеет вид:
Figure 00000004
где S(i) и S'(i) - вычисленные на m-м сегменте i-е отсчеты исходного и синтезированного речевых сигналов;
N - длина сегмента;
М - число сегментов в речевом фрагменте.
Однако приведенные критерии объективного метода оценивания, отражают степень зашумленности речевого сигнала и показывают слабую корреляцию с результатами субъективных тестов при прослушивании речевых сегментов. Следует отметить, что если качество кодеров формы речевой волны может быть оценено по степени соответствия формы огибающей восстановленного речевого сигнала исходному с помощью названных критериев, то для алгоритмов низкоскоростного параметрического сжатия на основе линейного предсказания точное восстановление формы сигнала является сложной задачей. Следовательно, методы оценивания качества звучания синтезированного речевого сигнала во временной области малоприменимы. Для того чтобы оценка качества звучания речевого сигнала отражала критерии слухового восприятия, принципы ее формирования должны быть основаны на анализе спектрально-корреляционных характеристик речи.
Наиболее близким по технической сущности к заявленному изобретению является патент US №6073092 от 6.06.2000, в котором производится расчет и минимизация среднеквадратической ошибки при реализации процедуры анализа через синтез в вокодере с линейным предсказанием.
Недостатком используемой процедуры анализа через синтез является несоответствие слухового аппарата человека при восприятии синтезированной речи и используемых критериев близости, определяющих правила анализа пригодности выбранных параметров кодека.
Согласно известному способу для выполнения процедуры анализ через синтез в вокодере с линейным предсказанием на передающей стороне итерационно синтезируют речевой сигнал на длительности участка квазистационарности речи, изменяя при каждой итерации параметры кодека в соответствии с используемым алгоритмом линейного предсказания, на каждой итерации вычисляют среднеквадратическую ошибку между оригинальным и синтезированным речевым сигналом, находят итерацию, соответствующую наименьшей среднеквадратической ошибке, при этом параметры кодека соответствующие данной итерации считают наилучшими и на основе их формируют кадр передачи кодека и производят синтез речевого сигнала на длительности участка квазистационарности речи на приемной стороне.
Задачей изобретения, определяющей его технический результат, является улучшение восприятия синтезированной речи при реализации процедуры анализа через синтез в вокодерах с линейным предсказанием.
Эта задача решается тем, что в способе улучшения восприятия синтезированной речи при реализации процедуры анализа через синтез в вокодерах с линейным предсказанием анализ и выбор наилучших в рамках заданных ограничений параметров кодека с линейным предсказанием будет производиться на основе вычисления оценок по критерию модифицированного искажения спектра барков MBSD (Modified Bark Spectral Distortion) (4):
Figure 00000005
где M(n,i) и D(n,i) - значения искажений уровня ощущения и разницы интенсивности ощущения сигнала n-го сегмента речи в i-й критической полосе;
N - число сегментов в речевом фрагменте;
К - общее количество критических полос.
Данный критерий является наиболее предпочтительным, так как в нем происходит анализ спектрально-корреляционных характеристик речи, учитываются модели слуха человека, а также он показывает высокую корреляцию с оценками, полученными на основе субъективных тестов прослушивания. Экспериментальные исследования показали, что в случае применения низкоскоростных липредерных систем слуховой аппарат человека более чувствителен к возникающим при этом частотным искажениям, нежели к амплитудным и фазовым (Павловец А.Н., Петровский А.А. Использование закономерностей психоакустики в процедуре квантования параметров гармонической модели речевого сигнала. // Речевые технологии. 4, 2008, с.55-60).
Расчет спектра барков производится согласно выражению (5):
Figure 00000006
где f - частота, измеренная в Герцах;
b - частота, измеренная в барках.
Более подробно данный вопрос изложен в (Радзишевский А.Ю. Основы аналогового и цифрового звука. - М.: Изд. дом "Вильямс", 2006 - с.105-109). Подробное описание критерия MBSD можно найти в (W.Yang. Enhanced Modified Bark Spectral Distortion (EMBSD): An Objective Speech Quality Measure Based On Audible Distortion And Cognition Model / A Dissertation of the Requirement for the Degree Doctor of Philosophy - May, 1999. pp.63-75).
Согласно данному критерию синтезированный и оригинальный речевые сигналы на сегменте квазистационарности подвергают делению на критические полосы, в каждой из которых вычисляют интенсивность ощущения сигнала и порог шумового маскирования, далее в каждой полосе определяют разность между оригинальным и искаженным значением интенсивности ощущения. Если полученное значение D(n,i) превышает вычисленный порог шумового маскирования NMT(n,i), то уровню ощущения M(n,i) присваивают значение 1, в противном случае значение 0.
Сущность предлагаемого способа заключается в следующем. При реализации процедуры анализа через синтез в вокодерах с линейным предсказанием на передающей стороне итерационно синтезируют речевой сигнал на длительности участка квазистационарности речи, изменяя при каждой итерации параметры кодека в соответствии с используемым алгоритмом линейного предсказания для вычисления наилучших в рамках заданных ограничений параметров кодека с линейным предсказанием, вводят итерационный расчет критерия модифицированного искажения спектра барков, изменяя при каждой итерации параметры кодека в соответствии с используемым алгоритмом линейного предсказания, далее вычисляют минимальное перцептуальное искажение, при этом параметры кодека, соответствующие данной итерации, считают наилучшими и используют для синтеза речевого сигнала на длительности участка квазистационарности речи на приемной стороне.
Алгоритм функционирования предложенной системы, реализующей способ улучшения восприятия синтезированной речи при реализации процедуры анализа через синтез в вокодерах с линейным предсказанием, представлен на фиг.1.
Проведенный анализ уровня техники позволил установить, что аналоги, характеризующиеся совокупностью признаков, тождественных всем признакам заявленного изобретения, отсутствуют, что указывает на соответствие заявленного способа условию патентоспособности "новизна".
Благодаря новой совокупности существенных признаков системы, обеспечивающих введение итерационного расчета критерия модифицированного искажения спектра барков, вычисление минимального перцептуального искажения и определение наилучших в рамках заданных ограничений параметров кодека для передачи по каналу связи в вокодерах с линейным предсказанием, использующих процедуру анализа через синтез, достигается значительное улучшение качества восприятия синтезированной речи на приемной стороне.
Анализ существующих технических решений в данной и смежных областях техники показал, что введенные отличительные признаки в них отсутствуют и не следуют явным образом из уровня техники. Из уровня техники также не выявлена известность влияния предусматриваемых существенными признаками заявленного изобретения преобразований на достижение указанного технического результата. Следовательно, заявленное техническое решение удовлетворяет критерию "изобретательский уровень".
Заявленное техническое решение поясняется чертежом (фиг.2), на котором показана функциональная схема устройства, реализующего способ улучшения восприятия синтезированной речи при реализации процедуры анализа через синтез в вокодерах с линейным предсказанием.
Устройство, реализующее данный способ, состоит из блока формирования сегмента синтезированного речевого сигнала 1, на который непосредственно поступает синтезированный речевой сигнал. Он соединен с блоком вычисления значений спектра барков в критических полосах сегмента синтезированного речевого сигнала 3, в котором происходит формирование совокупности параметров, описывающих спектр барков. Выход блока 3 соединен со входом блока расчета интенсивности ощущения синтезированного речевого сигнала в критических полосах сегмента 5. Оригинальный сегмент речевого сигнала поступает на блок формирования сегмента оригинального речевого сигнала 2. Его выход соединен со входом блока вычисления значений спектра барков в критических полосах сегмента оригинального речевого сигнала 4.
Формирование сегментов речевого сигнала, осуществляемое в блоках 1 и 2, представлено в (Быков С.В., Журавлев В.И., Шалимов И.А. Цифровая телефония: Учеб. пособие для вузов. - М.: Радио и связь, 2003. - с.66-72).
Вычисление значений спектра барков, осуществляемое в блоках 3 и 4, подробно описано в (Радзишевский А.Ю. Основы аналогового и цифрового звука. - М.: Изд. дом «Вильяме», 2006 - с.105-109).
Выход блока 4 соединен со входами блока расчета интенсивности ощущения оригинального речевого сигнала в критических полосах сегмента 6 и блока вычисления порогов шумового маскирования в критических полосах сегмента оригинального речевого сигнала 7. Выходы блоков 5 и 6 соединены со входом блока вычисления разности между оригинальным и искаженным значениями интенсивности ощущения 8. Выходы блоков 7 и 8 соединены со входом блока расчета модифицированного искажения спектра барков 9.
Функционирование блоков 5, 6, 7 и 8 описано в (W.Yang. Enhanced Modified Bark Spectral Distortion (EMBSD): An Objective Speech Quality Measure Based On Audible Distortion And Cognition Model. / A Dissertation of the Requirement for the Degree Doctor of Philosophy. - May, 1999, pp.63-75).
Процедура вычисления MBSD в блоке 9 описывается в (W.Yang, M.Benbouchta and R.Yantomo Performance of a modified bark spectral distortion measure as an objective speech quality measure, IEEE ICASSP, pp.541-544, Seattle, 1998).
Выход блока 9 соединен со входом блока вычисления минимального модифицированного искажения спектра барков 10.
Выход блока 10 соединен со входом блока хранения параметров кодека 11.
Процедуры, описывающие функционирование блоков 10 и 11, представлены в (О.И.Шелухин, Н.Ф.Лукьянцев Цифровая обработка и передача речи. - M.: Радио и Связь, 2000 г. - С.108-112).
Промышленная применимость введенных элементов обусловлена наличием элементной базы, на основе которой они могут быть выполнены.
Устройство, реализующее заявленный способ, функционирует следующим образом. В блоке 1 происходит формирование очередного сегмента синтезированного речевого сигнала на участке квазистационарности, далее он поступает на блок 3 в котором происходит вычисление значений спектра барков в критических полосах сегмента синтезированного речевого сигнала, информация о данных значениях поступает на вход блока 5 в котором производится расчет интенсивности ощущения синтезированного речевого сигнала в критических полосах сегмента. Информация об интенсивности ощущения синтезированного речевого сигнала в критических полосах сегмента с блока 5 далее поступает на первый вход блока 8. В блоке 2 происходит формирование очередного сегмента оригинального речевого сигнала на участке квазистационарности, далее он поступает на блок 4, в котором происходит вычисление значений спектра барков в критических полосах сегмента оригинального речевого сигнала, информация о данных значениях поступает на входы блоков 6 и 7 в котором производится расчет интенсивности ощущения и порогов шумового маскирования в критических полосах сегмента оригинального речевого сигнала соответственно.
Информация об интенсивности ощущения оригинального сигнала в критических полосах сегмента с блока 6 далее поступает на второй вход блока 8, в котором вычисляется разность между оригинальным и искаженным значениями интенсивности ощущения. С блока 8 информация о разности между оригинальным и искаженным значениями интенсивности ощущения подается на первый вход блока 9, на второй его вход подается информация о порогах шумового маскирования в критических полосах сегмента оригинального речевого сигнала, поступающая с блока 7. В блоке 9 осуществляется вычисление оценки MBSD, информация о данной оценке подается на блок 10, в котором производится накопление и расчет минимальной из оценок MBSD в процессе итерационного поиска. С блока 10 информация о номере итерации соответствующей минимальной оценке MBSD на блок 11, который предназначен для хранения наилучших в рамках заданных ограничений параметров кодека с линейным предсказанием.
К достоинствам способа следует отнести тот факт, что в вокодерах с линейным предсказанием устраняется несоответствие слухового аппарата человека при восприятии синтезированной речи и используемых критериев близости, определяющих правила анализа пригодности выбранных параметров кодека при реализации процедуры анализа через синтез. Были проведены экспериментальные испытания согласно (ГОСТ Р 51061-97. Системы низкоскоростной передачи речи по цифровым каналам. Параметры качества речи и методы измерений. - М.: Госстандарт России, 1997. - 230 с.), которые показали, что применение данного способа позволяет повысить субъективное качество восприятия синтезированной речи в среднем на 0,11 балла.
Приведенные технические решения показывают, что устройство, воплощающее изобретение при его осуществлении, способно обеспечить более качественное восприятие синтезированной речи в вокодерах с линейным предсказанием, реализация которых основана на выполнении процедуры анализа через синтез.

Claims (1)

  1. Способ улучшения восприятия синтезированной речи при реализации процедуры анализа через синтез в вокодерах с линейным предсказанием, основанный на том, что на передающей стороне итерационно синтезируют речевой сигнал на длительности участка квазистационарности речи, изменяя при каждой итерации параметры кодека в соответствии с используемым алгоритмом линейного предсказания для вычисления наилучших в рамках заданных ограничений параметров кодека с линейным предсказанием, отличающийся тем, что вводят итерационный расчет критерия модифицированного искажения спектра барков, изменяя при каждой итерации параметры кодека в соответствии с используемым алгоритмом линейного предсказания, далее вычисляют минимальное перцептуальное искажение, при этом параметры кодека, соответствующие данной итерации, считают наилучшими и используют для синтеза речевого сигнала на длительности участка квазистационарности речи на приемной стороне.
RU2010115914/08A 2010-04-21 2010-04-21 Способ улучшения восприятия синтезированной речи при реализации процедуры анализа через синтез в вокодерах с линейным предсказанием RU2445719C2 (ru)

Priority Applications (1)

Application Number Priority Date Filing Date Title
RU2010115914/08A RU2445719C2 (ru) 2010-04-21 2010-04-21 Способ улучшения восприятия синтезированной речи при реализации процедуры анализа через синтез в вокодерах с линейным предсказанием

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
RU2010115914/08A RU2445719C2 (ru) 2010-04-21 2010-04-21 Способ улучшения восприятия синтезированной речи при реализации процедуры анализа через синтез в вокодерах с линейным предсказанием

Publications (2)

Publication Number Publication Date
RU2010115914A RU2010115914A (ru) 2011-10-27
RU2445719C2 true RU2445719C2 (ru) 2012-03-20

Family

ID=44997801

Family Applications (1)

Application Number Title Priority Date Filing Date
RU2010115914/08A RU2445719C2 (ru) 2010-04-21 2010-04-21 Способ улучшения восприятия синтезированной речи при реализации процедуры анализа через синтез в вокодерах с линейным предсказанием

Country Status (1)

Country Link
RU (1) RU2445719C2 (ru)

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2000011655A1 (en) * 1998-08-24 2000-03-02 Conexant Systems, Inc. Low complexity random codebook structure
US6073092A (en) * 1997-06-26 2000-06-06 Telogy Networks, Inc. Method for speech coding based on a code excited linear prediction (CELP) model
WO2006030340A2 (en) * 2004-09-17 2006-03-23 Koninklijke Philips Electronics N.V. Combined audio coding minimizing perceptual distortion
EP1798724A1 (en) * 2004-11-05 2007-06-20 Matsushita Electric Industrial Co., Ltd. Encoder, decoder, encoding method, and decoding method
EP1990799A1 (en) * 2006-06-30 2008-11-12 Fraunhofer-Gesellschaft zur Förderung der Angewandten Forschung e.V. Audio encoder, audio decoder and audio processor having a dynamically variable warping characteristic

Patent Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6073092A (en) * 1997-06-26 2000-06-06 Telogy Networks, Inc. Method for speech coding based on a code excited linear prediction (CELP) model
WO2000011655A1 (en) * 1998-08-24 2000-03-02 Conexant Systems, Inc. Low complexity random codebook structure
WO2006030340A2 (en) * 2004-09-17 2006-03-23 Koninklijke Philips Electronics N.V. Combined audio coding minimizing perceptual distortion
EP1798724A1 (en) * 2004-11-05 2007-06-20 Matsushita Electric Industrial Co., Ltd. Encoder, decoder, encoding method, and decoding method
RU2387024C2 (ru) * 2004-11-05 2010-04-20 Панасоник Корпорэйшн Кодер, декодер, способ кодирования и способ декодирования
EP1990799A1 (en) * 2006-06-30 2008-11-12 Fraunhofer-Gesellschaft zur Förderung der Angewandten Forschung e.V. Audio encoder, audio decoder and audio processor having a dynamically variable warping characteristic

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
ШУЛЬГИН В. Основы теории передачи информации. Часть 1 Экономное кодирование. - Харьков: ХАЙ, 2003, с.93-97. WONHO Y., YANTORNO R., Improvement of MBSD by scaling noise masking threshold and correlation analysis with MOS difference instead of MOS, Acoustics, Speech, and Signal Processing, IEEE International Conference, 15.03.1999-19.03.1999, vol.2, с.с.673-676. *

Also Published As

Publication number Publication date
RU2010115914A (ru) 2011-10-27

Similar Documents

Publication Publication Date Title
ES2809677T3 (es) Método y sistema para codificar una señal de sonido estéreo utilizando parámetros de codificación de un canal primario para codificar un canal secundario
EP3118849B1 (en) Encoding device, decoding device, and method thereof
EP3414761B1 (en) Inter-channel encoding of a high-band audio signal
TWI559298B (zh) 用於音訊信號之諧波頻寬延展之方法、裝置及電腦可讀儲存器件
EP2209114B1 (en) Speech coding/decoding apparatus/method
US8386267B2 (en) Stereo signal encoding device, stereo signal decoding device and methods for them
US10311879B2 (en) Audio signal coding apparatus, audio signal decoding apparatus, audio signal coding method, and audio signal decoding method
CN107112027B (zh) 增益形状电路的按比例缩放
US10410652B2 (en) Estimation of mixing factors to generate high-band excitation signal
US20140229170A1 (en) Systems and Methods of Performing Gain Control
CN102576535A (zh) 用于确定音频***的感知质量的方法和***
EP3550563B1 (en) Encoder, decoder, encoding method, decoding method, and associated programs
US20150149157A1 (en) Frequency domain gain shape estimation
US7603271B2 (en) Speech coding apparatus with perceptual weighting and method therefor
TW202215417A (zh) 多聲道信號產生器、音頻編碼器及依賴混合噪音信號的相關方法
RU2445719C2 (ru) Способ улучшения восприятия синтезированной речи при реализации процедуры анализа через синтез в вокодерах с линейным предсказанием
US8655650B2 (en) Multiple stream decoder
US10950251B2 (en) Coding of harmonic signals in transform-based audio codecs
Tahilramani et al. A hybrid scheme of information hiding incorporating steganography as well as watermarking in the speech signal using Quantization index modulation (QIM)
Li et al. A low-delay audio coder with constrained-entropy quantization
Kleijn Principles of speech coding
RU2631968C2 (ru) Способ низкоскоростного кодирования и декодирования речевого сигнала
RU2419169C1 (ru) Способ кодирования широкополосного речевого сигнала
Vieira Filho et al. Comparative analysis of objective distortion measures for speech signals degraded by noise
Li et al. A Low-Complexity 3.6 kbps Speech Coding Algorithm Based on Mixed Excitation

Legal Events

Date Code Title Description
MM4A The patent is invalid due to non-payment of fees

Effective date: 20120422