RU2400832C2 - Способ формирования сигнала возбуждения в низкоскоростных вокодерах с линейным предсказанием - Google Patents

Способ формирования сигнала возбуждения в низкоскоростных вокодерах с линейным предсказанием Download PDF

Info

Publication number
RU2400832C2
RU2400832C2 RU2008146294/09A RU2008146294A RU2400832C2 RU 2400832 C2 RU2400832 C2 RU 2400832C2 RU 2008146294/09 A RU2008146294/09 A RU 2008146294/09A RU 2008146294 A RU2008146294 A RU 2008146294A RU 2400832 C2 RU2400832 C2 RU 2400832C2
Authority
RU
Russia
Prior art keywords
excitation signal
parameters
information
linear prediction
signal
Prior art date
Application number
RU2008146294/09A
Other languages
English (en)
Other versions
RU2008146294A (ru
Inventor
Андрей Алексеевич Афанасьев (RU)
Андрей Алексеевич Афанасьев
Михаил Юрьевич Конышев (RU)
Михаил Юрьевич Конышев
Илья Владимирович Ульянов (RU)
Илья Владимирович Ульянов
Original Assignee
Государственное образовательное учреждение высшего профессионального образования Академия Федеральной службы охраны Российской Федерации (Академия ФCО России)
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Государственное образовательное учреждение высшего профессионального образования Академия Федеральной службы охраны Российской Федерации (Академия ФCО России) filed Critical Государственное образовательное учреждение высшего профессионального образования Академия Федеральной службы охраны Российской Федерации (Академия ФCО России)
Priority to RU2008146294/09A priority Critical patent/RU2400832C2/ru
Publication of RU2008146294A publication Critical patent/RU2008146294A/ru
Application granted granted Critical
Publication of RU2400832C2 publication Critical patent/RU2400832C2/ru

Links

Images

Landscapes

  • Compression, Expansion, Code Conversion, And Decoders (AREA)
  • Transmission Systems Not Characterized By The Medium Used For Transmission (AREA)

Abstract

Изобретение относится к области цифровой связи и может быть использовано в системах телеинформационных коммуникаций для эффективного кодирования речевых сигналов. Техническим результатом является уменьшение скорости передачи данных по каналам связи за счет эффективного кодирования речевых сигналов на основе линейного предсказания. Указанный технический результат достигается посредством отказа от передачи по каналу связи информации о сигнале возбуждения, который синтезируют непосредственно на приеме по данным о параметрах синтезирующей модели. По каналу связи передают информацию о параметрах синтезирующего фильтра, содержащих информацию о коэффициентах предсказания или линейных спектральных частотах, а также значение коэффициента усиления сигнала возбуждения. На приеме по данным параметрам рассчитывают амплитудно-частотную характеристику синтезирующего фильтра на фазовых углах его полюсов и формируют спектр амплитуд и фаз сигнала возбуждения. Сигнал возбуждения формируют на основе данных о спектрах его амплитуд и фаз и коэффициенте усиления. 2 ил.

Description

Изобретение относится к области цифровой связи и может быть использовано в системах телеинформационных коммуникаций для эффективного кодирования речевых сигналов.
Основной проблемой цифрового представления речевого сигнала является задача качественного и компактного кодирования данных для их передачи по цифровым каналам связи. Решение этой проблемы позволит в условиях заданного критерия качества связи увеличить пропускную способность линейных трактов и каналов передачи. Часто в некоторых задачах кодирования речевого сигнала предполагается снизить скорость передачи при сохранении качественных показателей ее восприятия.
Среди многообразия методов кодирования речевых сигналов одним из наиболее эффективных является метод линейного предсказания. Метод линейного предсказания речи принадлежит к классу методов, использующих модель речевого сигнала в виде отклика линейной системы с переменными параметрами (голосового тракта) на соответствующий сигнал возбуждения (порождающий сигнал). Анализатор речепреобразующего устройства выделяет из короткого сегмента речевого сигнала параметры состояния линейной системы и сигнала возбуждения, позволяющие синтезатору восстановить исходный сигнал с требуемой степенью верности.
Известны способы синтеза сигналов возбуждения в вокодерах с линейным предсказанием, основанные на анализе остатка линейного предсказания (О.И.Шелухин, Н.Ф.Лукьянцев. Цифровая обработка и передача речи. М., Радио и Связь, 2000 г. - С.102-166; Рабинер Л.Р., Шафер Р.В. Цифровая обработка речевых сигналов. - М.: Радио и связь, 1981. - С.365-428).
В устройствах, реализующих данные способы, осуществляется анализ остатка линейного предсказания с целью синтеза сигналов возбуждения на приеме. При этом по каналу связи передается информация о коэффициентах формирующей модели, параметрах, характеризующих сигнал возбуждения и кодируемый речевой сигнал.
Для эффективного представления сигнала возбуждения в таких устройствах используются различные способы снижения информативной избыточности данных последовательностей (патенты US №7289952 от 30.10.2007, US №7233896 от 10.07.2007, US №7133823 от 7.11.2006, US №5963897 от 5.10.1999, US №6757650 от 29.06.2004, RU №2163399 от 22.10.1997, RU №97117357 от 20.02.2001).
Недостатком данных способов является значительное расходование информационного ресурса на представление сигнала возбуждения при его передаче по каналу связи, и, следовательно, относительно высокая скорость передачи данных по каналам связи при эффективном кодировании речи.
Техническим результатом предлагаемого способа является уменьшение скорости передачи данных по каналам связи при эффективном кодировании речевых сигналов на основе линейного предсказания.
Для достижения данного технического результата в вокодере с линейным предсказанием предлагается исключить передачу по каналу связи информации о сигнале возбуждения. Формирование сигнала возбуждения можно реализовать непосредственно на приеме по данным о синтезирующей модели. При этом по каналу связи передается информация только о параметрах формирующей модели, коэффициенте усиления и параметрах, характеризующих кодируемый речевой сигнал, которые должны быть рассчитаны на каждом квазистационарном сегменте анализа речевого сигнала.
Экспериментальные исследования модели линейного предсказания речи показали, что если подвергнуть анализу остаток линейного предсказания, то ясно прослеживается практически незначительно искаженный речевой сигнал. Данный факт указывает на схожесть нормированных спектральных плотностей мощности реального речевого сигнала и остатка линейного предсказания, и дальнейшие исследования подтвердили данное предположение. В качестве синтезирующего фильтра при линейном предсказании используют рекурсивный фильтр, при этом его полюсы отражают максимумы формируемой амплитудно-частотной характеристики (АЧХ), которые соответствуют максимумам спектральной плотности мощности анализируемого сегмента речевого сигнала на участке квазистационарности. Параметры синтезирующей системы при линейном предсказании отражают формантную структуру речи на участке квазистационарности. В качестве таких параметров используют линейные спектральные частоты. При этом достаточно передавать и принимать данные о значениях линейных спектральных частот и их амплитудах. Сигнал возбуждения в таком вокодере с линейным предсказанием формируется как суперпозиция формантных частот спектральной плотности мощности речевого сигнала на участке квазистационарности. При этом начальные фазы соответствующих частот рассчитывают в предположении о равномерном распределении. В литературе, посвященной анализу и восприятию речевого сигнала, указывается на тот факт, что информация о фазовом спектре речевого сигнала является несущественной для его разборчивости и на ухудшение его восприятия влияет незначительно (Маркел Дж.Д., А.Х.Грэй. Линейное предсказание речи. - М.: Связь, 1980. - С.166-196).
Сущность предлагаемого способа заключается в следующем. Для формирования сигнала возбуждения в вокодере на основе линейного предсказания на приеме из кадра передачи выделяют параметры синтезирующего фильтра, содержащие информацию о коэффициентах предсказания или линейных спектральных частотах, а также значение коэффициента усиления сигнала возбуждения. По данным параметрам рассчитывают АЧХ синтезирующего фильтра на фазовых углах его полюсов и формируют спектр амплитуд и фаз сигнала возбуждения. Затем формируют сигнал возбуждения на основе данных о коэффициенте усиления и спектрах его амплитуд и фаз, который используют в синтезирующем фильтре липредера для формирования цифрового речевого сигнала на участке квазистационарности.
Алгоритм функционирования предложенной системы, реализующей способ формирования сигнала возбуждения в низкоскоростных вокодерах с линейным предсказанием, представлен на фиг.1.
Проведенный анализ уровня техники позволил установить, что аналоги, характеризующиеся совокупностью признаков, тождественных всем признакам заявленного технического решения, отсутствуют, что указывает на соответствие заявленного способа условию патентоспособности "новизна".
Благодаря новой совокупности существенных признаков системы, обеспечивающих исключение информации о сигнале возбуждения из формата кадра передачи и его формирование на приеме по значениям параметров синтезирующей модели, достигается значительное снижение скорости передачи данных в канале связи.
Анализ существующих технических решений в данной области показал, что введенные отличительные признаки в них отсутствуют и не следуют явным образом из уровня техники. Следовательно, заявленное техническое решение удовлетворяет критерию "изобретательский уровень".
Промышленная применимость введенных элементов обусловлена наличием элементной базы, на основе которой они могут быть выполнены.
Заявленное техническое решение поясняется чертежом (фиг.2), на котором показана функциональная схема устройства, реализующего способ формирования сигнала возбуждения в низкоскоростных вокодерах с линейным предсказанием посредством использования информации о параметрах синтезирующей модели.
Устройство, реализующее данный способ, состоит из блока приема кадра передачи вокодера с линейным предсказанием 1, на который непосредственно поступает информационная последовательность кадра передачи. Он соединен с блоком выделения параметров синтезирующего фильтра 2, в котором происходит формирование совокупности параметров, описывающих данный фильтр. Сформированные параметры подаются на блок расчета значений АЧХ синтезирующего фильтра на фазовых углах его полюсов 3. Данный блок соединен с блоком формирования сигнала возбуждения 4. На другие входы блока 4 подается сигнал с блока формирования начальных фаз спектральных составляющих сигнала возбуждения 5, а также поступает сигнал от блока 1, в котором содержится дополнительная информация для формирования сигнала возбуждения, например значение коэффициента усиления. Сформированный сигнал возбуждения подается на блок 6 - получатель сигнала возбуждения низкоскоростного вокодера с линейным предсказанием, где используется для возбуждения синтезирующего фильтра приемной части вокодера с линейным предсказанием.
Устройство, реализующее заявленный способ, работает следующим образом. Кадр передачи вокодера с линейным предсказанием, сформированный на участке квазистационарности речевого сигнала, поступает на блок 1, в котором происходит его анализ и выделение информационной составляющей, описывающей формирующий фильтр. Данный сигнал поступает на блок 2, в котором вычисляются значения полюсов передаточной функции синтезирующего фильтра, по которым в блоке 3 рассчитывается значения его АЧХ на соответствующих фазовых углах. В блоке 4 происходит формирование сигнала возбуждения синтезирующего фильтра по данным о его спектре амплитуд, полученным с блока 3, спектре фаз и коэффициенте усиления, полученных с блоков 5 и 1 соответственно. Данный сигнал возбуждения далее подается в блок 6, где используется для возбуждения синтезирующего фильтра приемной части вокодера с линейным предсказанием.
К достоинствам способа следует отнести тот факт, что устранение из кадра передачи информации о сигнале возбуждения позволяет значительно снизить скорость передачи данных в канале связи, а также уменьшить вычислительную сложность алгоритма кодирования речевого сигнала на передающей стороне. Использование предлагаемого технического решения для формирования сигнала возбуждения в вокодерах с линейным предсказанием позволит понизить скорость передачи данных в канале связи на 40-50% от известных решений, либо перераспределить информационный ресурс, предоставляемый каналом связи, на формирование дополнительных сервисов абонентского обслуживания.
Приведенные технические решения показывают, что устройство, воплощающее изобретение при его осуществлении, способно обеспечить более низкую скорость передачи данных за счет устранения из кадра передачи информации о сигнале возбуждения и формировании его на приеме по параметрам, описывающим модель голосового тракта.

Claims (1)

  1. Способ синтеза сигналов возбуждения в вокодерах с линейным предсказанием, основанный на формировании сигнала возбуждения путем использования параметров синтезирующего фильтра, отличающийся тем, что для формирования сигнала возбуждения в вокодере на основе линейного предсказания на приеме из кадра передачи выделяют параметры синтезирующего фильтра, содержащие информацию о коэффициентах предсказания или линейных спектральных частотах, а также значение коэффициента усиления сигнала возбуждения, по данным параметрам рассчитывают амплитудно-частотную характеристику синтезирующего фильтра на фазовых углах его полюсов и формируют спектр амплитуд и фаз сигнала возбуждения, затем формируют сигнал возбуждения на основе данных о коэффициенте усиления и спектрах его амплитуд и фаз, который используют в синтезирующем фильтре вокодера с линейным предсказанием для формирования сегмента речевого сигнала на участке квазистационарности.
RU2008146294/09A 2008-11-24 2008-11-24 Способ формирования сигнала возбуждения в низкоскоростных вокодерах с линейным предсказанием RU2400832C2 (ru)

Priority Applications (1)

Application Number Priority Date Filing Date Title
RU2008146294/09A RU2400832C2 (ru) 2008-11-24 2008-11-24 Способ формирования сигнала возбуждения в низкоскоростных вокодерах с линейным предсказанием

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
RU2008146294/09A RU2400832C2 (ru) 2008-11-24 2008-11-24 Способ формирования сигнала возбуждения в низкоскоростных вокодерах с линейным предсказанием

Publications (2)

Publication Number Publication Date
RU2008146294A RU2008146294A (ru) 2010-05-27
RU2400832C2 true RU2400832C2 (ru) 2010-09-27

Family

ID=42680070

Family Applications (1)

Application Number Title Priority Date Filing Date
RU2008146294/09A RU2400832C2 (ru) 2008-11-24 2008-11-24 Способ формирования сигнала возбуждения в низкоскоростных вокодерах с линейным предсказанием

Country Status (1)

Country Link
RU (1) RU2400832C2 (ru)

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
RU2495504C1 (ru) * 2012-06-25 2013-10-10 Государственное казенное образовательное учреждение высшего профессионального образования Академия Федеральной службы охраны Российской Федерации (Академия ФСО России) Способ снижения скорости передачи низкоскоростных вокодеров с линейным предсказанием
RU2644123C2 (ru) * 2013-10-18 2018-02-07 Фраунхофер-Гезелльшафт Цур Фердерунг Дер Ангевандтен Форшунг Е.Ф. Принцип для кодирования аудиосигнала и декодирования аудиосигнала с использованием детерминированной и шумоподобной информации
US10373625B2 (en) 2013-10-18 2019-08-06 Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. Concept for encoding an audio signal and decoding an audio signal using speech related spectral shaping information

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR101696632B1 (ko) 2010-07-02 2017-01-16 돌비 인터네셔널 에이비 선택적인 베이스 포스트 필터

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
РАБИНЕР Л.Р., ШАФЕР Р.В. Цифровая обработка речевых сигналов. - М.: Радио и связь, 1981, с.420-423. *

Cited By (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
RU2495504C1 (ru) * 2012-06-25 2013-10-10 Государственное казенное образовательное учреждение высшего профессионального образования Академия Федеральной службы охраны Российской Федерации (Академия ФСО России) Способ снижения скорости передачи низкоскоростных вокодеров с линейным предсказанием
RU2644123C2 (ru) * 2013-10-18 2018-02-07 Фраунхофер-Гезелльшафт Цур Фердерунг Дер Ангевандтен Форшунг Е.Ф. Принцип для кодирования аудиосигнала и декодирования аудиосигнала с использованием детерминированной и шумоподобной информации
US10304470B2 (en) 2013-10-18 2019-05-28 Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. Concept for encoding an audio signal and decoding an audio signal using deterministic and noise like information
US10373625B2 (en) 2013-10-18 2019-08-06 Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. Concept for encoding an audio signal and decoding an audio signal using speech related spectral shaping information
US10607619B2 (en) 2013-10-18 2020-03-31 Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. Concept for encoding an audio signal and decoding an audio signal using deterministic and noise like information
US10909997B2 (en) 2013-10-18 2021-02-02 Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. Concept for encoding an audio signal and decoding an audio signal using speech related spectral shaping information
US11798570B2 (en) 2013-10-18 2023-10-24 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Concept for encoding an audio signal and decoding an audio signal using deterministic and noise like information
US11881228B2 (en) 2013-10-18 2024-01-23 Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E. V. Concept for encoding an audio signal and decoding an audio signal using speech related spectral shaping information

Also Published As

Publication number Publication date
RU2008146294A (ru) 2010-05-27

Similar Documents

Publication Publication Date Title
RU2381571C2 (ru) Синтезирование монофонического звукового сигнала на основе кодированного многоканального звукового сигнала
US8738372B2 (en) Spectrum coding apparatus and decoding apparatus that respectively encodes and decodes a spectrum including a first band and a second band
US7529664B2 (en) Signal decomposition of voiced speech for CELP speech coding
KR101000345B1 (ko) 음성 부호화 장치, 음성 복호화 장치 및 그 방법
US8417515B2 (en) Encoding device, decoding device, and method thereof
US7630396B2 (en) Multichannel signal coding equipment and multichannel signal decoding equipment
JP3936139B2 (ja) オーバーサンプリングされた合成広帯域信号の高周波数成分回復の方法および装置
US7983904B2 (en) Scalable decoding apparatus and scalable encoding apparatus
EP2109861B1 (en) Audio decoder
EP1768105B1 (en) Speech coding
US20130230176A1 (en) Method and an Apparatus for Encoding/Decoding a Multichannel Audio Signal
EP0770987A2 (en) Method and apparatus for reproducing speech signals, method and apparatus for decoding the speech, method and apparatus for synthesizing the speech and portable radio terminal apparatus
EP1881488B1 (en) Encoder, decoder, and their methods
RU2007134215A (ru) Параметрическое совместное кодирование аудиоисточников
EP2071565B1 (en) Coding apparatus and decoding apparatus
JP4445328B2 (ja) 音声・楽音復号化装置および音声・楽音復号化方法
TW201301263A (zh) 聲音解碼裝置,聲音編碼裝置,聲音解碼方法,聲音編碼方法,聲音解碼程式,及聲音編碼程式
JPH0946233A (ja) 音声符号化方法とその装置、音声復号方法とその装置
RU2400832C2 (ru) Способ формирования сигнала возбуждения в низкоскоростных вокодерах с линейным предсказанием
US9118805B2 (en) Multi-point connection device, signal analysis and device, method, and program
Wilson et al. Adaptive tree encoding of speech at 8000 bits/s with a frequency-weighted error criterion
CN101689372B (zh) 信号分析装置、信号控制装置及其***、方法
RU2394284C1 (ru) Способ сжатия и восстановления речевых сигналов для систем кодирования с переменной скоростью передачи
RU2400831C1 (ru) Способ выделения сегментов квазистационарности при анализе речевого сигнала в вокодерах с линейным предсказанием
RU2432624C1 (ru) Способ уменьшения объема данных при широкополосном кодировании речевого сигнала

Legal Events

Date Code Title Description
MM4A The patent is invalid due to non-payment of fees

Effective date: 20101125