RU2008105555A - Синтез аудиосигнала - Google Patents

Синтез аудиосигнала Download PDF

Info

Publication number
RU2008105555A
RU2008105555A RU2008105555/09A RU2008105555A RU2008105555A RU 2008105555 A RU2008105555 A RU 2008105555A RU 2008105555/09 A RU2008105555/09 A RU 2008105555/09A RU 2008105555 A RU2008105555 A RU 2008105555A RU 2008105555 A RU2008105555 A RU 2008105555A
Authority
RU
Russia
Prior art keywords
parameter
phase
audio signal
frequency
generating
Prior art date
Application number
RU2008105555/09A
Other languages
English (en)
Inventor
БРИНКЕР Албертус С. ДЕН (NL)
БРИНКЕР Албертус С. ДЕН
Роберт Й. СЛЕЙЙТЕР (NL)
Роберт Й. СЛЕЙЙТЕР
Original Assignee
Конинклейке Филипс Электроникс Н.В. (Nl)
Конинклейке Филипс Электроникс Н.В.
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Конинклейке Филипс Электроникс Н.В. (Nl), Конинклейке Филипс Электроникс Н.В. filed Critical Конинклейке Филипс Электроникс Н.В. (Nl)
Publication of RU2008105555A publication Critical patent/RU2008105555A/ru

Links

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L13/00Speech synthesis; Text to speech systems
    • G10L13/02Methods for producing synthetic speech; Speech synthesisers
    • G10L13/033Voice editing, e.g. manipulating the voice of the synthesiser
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/04Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
    • G10L19/08Determination or coding of the excitation function; Determination or coding of the long-term prediction parameters
    • G10L19/093Determination or coding of the excitation function; Determination or coding of the long-term prediction parameters using sinusoidal excitation models
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L21/00Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
    • G10L21/003Changing voice quality, e.g. pitch or formants
    • G10L21/007Changing voice quality, e.g. pitch or formants characterised by the process used
    • G10L21/013Adapting to target pitch
    • G10L2021/0135Voice conversion or morphing

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Computational Linguistics (AREA)
  • Acoustics & Sound (AREA)
  • Multimedia (AREA)
  • Signal Processing (AREA)
  • Compression, Expansion, Code Conversion, And Decoders (AREA)
  • Stereophonic System (AREA)
  • Working-Up Tar And Pitch (AREA)
  • Measurement Of Mechanical Vibrations Or Ultrasonic Waves (AREA)
  • Input Circuits Of Receivers And Coupling Of Receivers And Audio Equipment (AREA)

Abstract

1. Устройство (20) синтеза сигнала для синтезирования аудиосигнала (r'), содержащее: ! блок (23) синтеза синусоид для синтезирования аудиосигнала (r') с помощью по меньшей мере одного частотного параметра (f), представляющего частоту аудиосигнала, и по меньшей мере одного фазового параметра (ϕ'), представляющего фазу аудиосигнала, отличающееся тем, что содержит ! блок (22) выработки параметров для выработки фазового параметра (ϕ') с помощью частотного параметра (f') и аудиосигнала (r'). ! 2. Устройство по п.1, в котором синтезированный аудиосигнал (r') содержит временные сегменты, и при этом блок (22) выработки параметров выполнен с возможностью выработки текущего фазового параметра (ϕ') с помощью предыдущего временного сегмента аудиосигнала (r'). ! 3. Устройство по п.1, в котором блок (22) выработки параметров содержит блок (21') нахождения фазы, выполненный с возможностью нахождения набора пар фаза-частота, причем каждая пара фаза-частота представляет фазу частоты аудиосигнала (r'). ! 4. Устройство по п.3, в котором блок (22) выработки параметров далее может содержать блок (28) предсказания фазы, выполненный с возможностью ! сравнения частотного параметра (f) с набором пар фаза-частота и выбора пары фаза-частота, ближайшей к частотному параметру (f), и ! выработки фазового параметра (ϕ') с помощью частотного параметра (f) и выбранной фазы. ! 5. Устройство по п.1, в котором блок (22) выработки параметров содержит блок (27) модификации частоты для модификации частотного параметра (f) в ответ на управляющий параметр (С). ! 6. Устройство по п.1, в котором блок (23) синтеза синусоид дополнительно использует амплитудный параметр (А). ! 7. Устройство по п.1, содержащее далее бл�

Claims (24)

1. Устройство (20) синтеза сигнала для синтезирования аудиосигнала (r'), содержащее:
блок (23) синтеза синусоид для синтезирования аудиосигнала (r') с помощью по меньшей мере одного частотного параметра (f), представляющего частоту аудиосигнала, и по меньшей мере одного фазового параметра (ϕ'), представляющего фазу аудиосигнала, отличающееся тем, что содержит
блок (22) выработки параметров для выработки фазового параметра (ϕ') с помощью частотного параметра (f') и аудиосигнала (r').
2. Устройство по п.1, в котором синтезированный аудиосигнал (r') содержит временные сегменты, и при этом блок (22) выработки параметров выполнен с возможностью выработки текущего фазового параметра (ϕ') с помощью предыдущего временного сегмента аудиосигнала (r').
3. Устройство по п.1, в котором блок (22) выработки параметров содержит блок (21') нахождения фазы, выполненный с возможностью нахождения набора пар фаза-частота, причем каждая пара фаза-частота представляет фазу частоты аудиосигнала (r').
4. Устройство по п.3, в котором блок (22) выработки параметров далее может содержать блок (28) предсказания фазы, выполненный с возможностью
сравнения частотного параметра (f) с набором пар фаза-частота и выбора пары фаза-частота, ближайшей к частотному параметру (f), и
выработки фазового параметра (ϕ') с помощью частотного параметра (f) и выбранной фазы.
5. Устройство по п.1, в котором блок (22) выработки параметров содержит блок (27) модификации частоты для модификации частотного параметра (f) в ответ на управляющий параметр (С).
6. Устройство по п.1, в котором блок (23) синтеза синусоид дополнительно использует амплитудный параметр (А).
7. Устройство по п.1, содержащее далее блок (24) управления усилением для перемножения синтезированного аудиосигнала (r') с параметром (G) усиления.
8. Устройство по п.1, содержащее далее блок (21) анализа синусоид для приема входного аудиосигнала (r) и выработки частотного параметра (f) и фазового параметра (ϕ').
9. Устройство по п.8, содержащее далее
дополнительный блок (23') синтеза синусоид для выработки синтезированного аудиосигнала и
блок (26) сравнения для сравнения синтезированного аудиосигнала и входного аудиосигнала, чтобы выработать параметр (G) усиления.
10. Устройство по п.2, содержащее далее блок (25) сегментации для разделения аудиосигнала (r) на временные сегменты.
11. Устройство по п.2, содержащее далее блок (25') перекрытия и добавления для соединения временных сегментов синтезированного аудиосигнала (r').
12. Устройство по п.10 или 11, в котором блок (25) сегментации управляется первым параметром (обнвх) перекрытия, а блок (25') перекрытия и добавления управляется вторым параметром (обнвых) перекрытия, и при этом устройство выполнено с возможностью временного масштабирования путем изменения параметров (обнвх, обнвых) перекрытия.
13. Устройство (1) преобразования речи, содержащее:
блок (10) анализа с линейным предсказанием для выработки параметров (р) предсказания и остаточного сигнала (r) в ответ на входной речевой сигнал (х),
блок (20) адаптации основного тона для адаптации основного тона остаточного сигнала (r), чтобы выработать остаточный сигнал (r') с адаптированным основным тоном, и
блок (30) синтеза с линейным предсказанием для синтезирования выходного речевого сигнала (у) в ответ на остаточный сигнал (r') с адаптированным основным тоном,
при этом блок (20) адаптации основного тона содержит устройство по п.5.
14. Устройство преобразования речи по п.13, содержащее далее блок (40) модификации для модификации параметров предсказания.
15. Аудиосистема, содержащая устройство по п.1.
16. Декодер (5) аудиосигнала, содержащий:
блок (23) синтеза синусоид для синтезирования аудиосигнала (r') с помощью по меньшей мере одного частотного параметра (f), представляющего частоту аудиосигнала, и по меньшей мере одного фазового параметра (ϕ'), представляющего фазу аудиосигнала, отличающийся тем, что содержит:
блок (22) выработки параметров для выработки фазового параметра (ϕ') с помощью частотного параметра (f) и аудиосигнала (r').
17. Способ синтезирования аудиосигнала (r'), содержащий этап, на котором
синтезируют аудиосигнал (r') с помощью по меньшей мере одного частотного параметра (f), представляющего частоту аудиосигнала, и по меньшей мере одного фазового параметра (ϕ'), представляющего фазу аудиосигнала, отличающийся тем, что содержит этап, на котором
вырабатывают фазовый параметр (ϕ') с помощью частотного параметра (f) и аудиосигнала (r').
18. Способ по п.17, в котором синтезированный аудиосигнал содержит временные сегменты, и при этом блок (22) выработки параметров выполнен с возможностью вырабатывать текущий фазовый параметр (ϕ') с помощью предыдущего временного сегмента аудиосигнала (r').
19. Способ по п.17, в котором этап предсказания фазы содержит подэтап, на котором находят набор пар фаза-частота, причем каждая пара фаза-частота представляет фазу частоты аудиосигнала (r').
20. Способ по п.19, в котором этап предсказания фазы может далее содержать подэтапы, на которых
сравнивают частотный параметр (f) с набором пар фаза-частота и выбирают пару фаза-частота, ближайшую к частотному параметру (f), и
вырабатывают фазовый параметр (ϕ') с помощью частотного параметра (f) и выбранной фазы.
21. Способ по п.17, в котором этап предсказания фазы содержит подэтап, на котором модифицируют частотный параметр (f) в ответ на управляющий параметр (С).
22. Способ преобразования речи, содержащий этапы, на которых
вырабатывают параметры (р) предсказания и остаточный сигнал (r) в ответ на входной речевой сигнал (х),
адаптируют основной тон остаточного сигнала (r), чтобы вырабатывать остаточный сигнал (r') с адаптированным основным тоном, и
синтезируют выходной речевой сигнал (у) в ответ на остаточный сигнал (r') с адаптированным основным тоном,
при этом этап адаптации основного тона содержит подэтап изменения частоты аудиосигнала по п.21.
23. Способ по п.17 или 22, содержащий далее этап временного масштабирования.
24. Компьютерный программный продукт для осуществления способа по п.17 или 22.
RU2008105555/09A 2005-07-14 2006-07-06 Синтез аудиосигнала RU2008105555A (ru)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
EP05106437 2005-07-14
EP05106437.6 2005-07-14

Publications (1)

Publication Number Publication Date
RU2008105555A true RU2008105555A (ru) 2009-08-20

Family

ID=37433812

Family Applications (1)

Application Number Title Priority Date Filing Date
RU2008105555/09A RU2008105555A (ru) 2005-07-14 2006-07-06 Синтез аудиосигнала

Country Status (9)

Country Link
US (1) US20100131276A1 (ru)
EP (1) EP1905009B1 (ru)
JP (1) JP2009501353A (ru)
CN (1) CN101223581A (ru)
AT (1) ATE443318T1 (ru)
DE (1) DE602006009271D1 (ru)
ES (1) ES2332108T3 (ru)
RU (1) RU2008105555A (ru)
WO (1) WO2007007253A1 (ru)

Families Citing this family (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR20080073925A (ko) 2007-02-07 2008-08-12 삼성전자주식회사 파라메트릭 부호화된 오디오 신호를 복호화하는 방법 및장치
ES2374008B1 (es) 2009-12-21 2012-12-28 Telefónica, S.A. Codificación, modificación y síntesis de segmentos de voz.
KR101333162B1 (ko) 2012-10-04 2013-11-27 부산대학교 산학협력단 Imdct 입력신호를 이용한 오디오 신호의 음정 및 속도 가변 장치 및 방법
CN104766612A (zh) * 2015-04-13 2015-07-08 李素平 基于乐音音色匹配的正弦模型分离方法
US10326469B1 (en) * 2018-03-26 2019-06-18 Qualcomm Incorporated Segmented digital-to-analog converter (DAC)
EP3573059B1 (en) * 2018-05-25 2021-03-31 Dolby Laboratories Licensing Corporation Dialogue enhancement based on synthesized speech

Family Cites Families (17)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5248845A (en) * 1992-03-20 1993-09-28 E-Mu Systems, Inc. Digital sampling instrument
US5734789A (en) * 1992-06-01 1998-03-31 Hughes Electronics Voiced, unvoiced or noise modes in a CELP vocoder
US5602961A (en) * 1994-05-31 1997-02-11 Alaris, Inc. Method and apparatus for speech compression using multi-mode code excited linear predictive coding
JP3437445B2 (ja) * 1998-05-22 2003-08-18 松下電器産業株式会社 線形信号予測を用いた受信装置及び方法
US6665638B1 (en) * 2000-04-17 2003-12-16 At&T Corp. Adaptive short-term post-filters for speech coders
WO2001082293A1 (en) * 2000-04-24 2001-11-01 Qualcomm Incorporated Method and apparatus for predictively quantizing voiced speech
JP5485488B2 (ja) * 2000-06-20 2014-05-07 コーニンクレッカ フィリップス エヌ ヴェ 正弦波符号化
KR100348899B1 (ko) * 2000-09-19 2002-08-14 한국전자통신연구원 캡스트럼 분석을 이용한 하모닉 노이즈 음성 부호화기 및부호화 방법
WO2002056298A1 (en) 2001-01-16 2002-07-18 Koninklijke Philips Electronics N.V. Linking of signal components in parametric encoding
ATE323935T1 (de) * 2001-04-09 2006-05-15 Koninkl Philips Electronics Nv Adpcm sprachkodiersystem mit phasenfaltungs und - entfaltungsfiltern
CA2365203A1 (en) * 2001-12-14 2003-06-14 Voiceage Corporation A signal modification method for efficient coding of speech signals
US7027979B2 (en) * 2003-01-14 2006-04-11 Motorola, Inc. Method and apparatus for speech reconstruction within a distributed speech recognition system
WO2005091275A1 (en) * 2004-03-17 2005-09-29 Koninklijke Philips Electronics N.V. Audio coding
CA2603246C (en) * 2005-04-01 2012-07-17 Qualcomm Incorporated Systems, methods, and apparatus for anti-sparseness filtering
US8155972B2 (en) * 2005-10-05 2012-04-10 Texas Instruments Incorporated Seamless audio speed change based on time scale modification
US20070083377A1 (en) * 2005-10-12 2007-04-12 Steven Trautmann Time scale modification of audio using bark bands
FI20060133A0 (fi) * 2006-02-13 2006-02-13 Juha Ruokangas Menetelmä ja järjestelmä äänisignaalien modifioimiseksi

Also Published As

Publication number Publication date
EP1905009A1 (en) 2008-04-02
ATE443318T1 (de) 2009-10-15
EP1905009B1 (en) 2009-09-16
JP2009501353A (ja) 2009-01-15
US20100131276A1 (en) 2010-05-27
ES2332108T3 (es) 2010-01-26
DE602006009271D1 (de) 2009-10-29
WO2007007253A1 (en) 2007-01-18
CN101223581A (zh) 2008-07-16

Similar Documents

Publication Publication Date Title
JP5467098B2 (ja) オーディオ信号をパラメータ化された表現に変換するための装置および方法、パラメータ化された表現を修正するための装置および方法、オーディオ信号のパラメータ化された表現を合成するための装置および方法
RU2008105555A (ru) Синтез аудиосигнала
JP4734961B2 (ja) 音響効果付与装置、及びプログラム
CN101399043A (zh) 一种自适应多速率窄带编码方法及编码器
JP2017513048A (ja) 情報符号化のコンセプト
WO2006070768A1 (ja) オーディオ波形処理装置、方式およびプログラム
JP2015161774A (ja) 音合成方法及び音合成装置
RU2682851C2 (ru) Усовершенствованная коррекция потери кадров с помощью речевой информации
JP4455701B2 (ja) 音声信号処理装置および音声信号処理方法
JP2003345400A (ja) ピッチ変換装置、ピッチ変換方法及びプログラム
JP4019824B2 (ja) 波形生成装置及び方法並びに復号装置
JP2015200685A (ja) アタック位置検出プログラムおよびアタック位置検出装置
US20220262376A1 (en) Signal processing device, method, and program
KR100821499B1 (ko) 정보 추출 장치
JP2004077918A (ja) 音声合成装置、方法及びプログラム
JPH11219199A (ja) 位相検出装置及び方法、並びに音声符号化装置及び方法
JP2011247921A (ja) 信号合成方法、信号合成装置及びプログラム
CN1708785A (zh) 带宽扩展装置及方法
Freed Spectral line broadening with transform domain additive synthesis
Röbel Adaptive additive synthesis of sound
JP2005084661A (ja) 音声分析生成装置、及びプログラム
JP5246208B2 (ja) 基音抽出装置、及びプログラム
JP2012113225A (ja) 復号装置、復号方法、およびプログラム
Triki Harmonize-Decompose Audio Signals with Global Amplitude and Frequency Modulations
JP2006010908A (ja) 音声効果付与装置及び音声効果付与プログラム

Legal Events

Date Code Title Description
FA92 Acknowledgement of application withdrawn (lack of supplementary materials submitted)

Effective date: 20101026