RU2008105555A - Синтез аудиосигнала - Google Patents
Синтез аудиосигнала Download PDFInfo
- Publication number
- RU2008105555A RU2008105555A RU2008105555/09A RU2008105555A RU2008105555A RU 2008105555 A RU2008105555 A RU 2008105555A RU 2008105555/09 A RU2008105555/09 A RU 2008105555/09A RU 2008105555 A RU2008105555 A RU 2008105555A RU 2008105555 A RU2008105555 A RU 2008105555A
- Authority
- RU
- Russia
- Prior art keywords
- parameter
- phase
- audio signal
- frequency
- generating
- Prior art date
Links
- 230000015572 biosynthetic process Effects 0.000 title claims abstract 8
- 238000003786 synthesis reaction Methods 0.000 title claims abstract 8
- 230000005236 sound signal Effects 0.000 claims abstract 31
- 230000002194 synthesizing effect Effects 0.000 claims abstract 8
- 238000000034 method Methods 0.000 claims 8
- 230000006978 adaptation Effects 0.000 claims 3
- 238000006243 chemical reaction Methods 0.000 claims 2
- 230000004048 modification Effects 0.000 claims 2
- 238000012986 modification Methods 0.000 claims 2
- 230000011218 segmentation Effects 0.000 claims 2
- 238000004590 computer program Methods 0.000 claims 1
- 238000004519 manufacturing process Methods 0.000 abstract 2
Classifications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L13/00—Speech synthesis; Text to speech systems
- G10L13/02—Methods for producing synthetic speech; Speech synthesisers
- G10L13/033—Voice editing, e.g. manipulating the voice of the synthesiser
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/04—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
- G10L19/08—Determination or coding of the excitation function; Determination or coding of the long-term prediction parameters
- G10L19/093—Determination or coding of the excitation function; Determination or coding of the long-term prediction parameters using sinusoidal excitation models
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L21/00—Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
- G10L21/003—Changing voice quality, e.g. pitch or formants
- G10L21/007—Changing voice quality, e.g. pitch or formants characterised by the process used
- G10L21/013—Adapting to target pitch
- G10L2021/0135—Voice conversion or morphing
Landscapes
- Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- Health & Medical Sciences (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Human Computer Interaction (AREA)
- Computational Linguistics (AREA)
- Acoustics & Sound (AREA)
- Multimedia (AREA)
- Signal Processing (AREA)
- Compression, Expansion, Code Conversion, And Decoders (AREA)
- Stereophonic System (AREA)
- Working-Up Tar And Pitch (AREA)
- Measurement Of Mechanical Vibrations Or Ultrasonic Waves (AREA)
- Input Circuits Of Receivers And Coupling Of Receivers And Audio Equipment (AREA)
Abstract
1. Устройство (20) синтеза сигнала для синтезирования аудиосигнала (r'), содержащее: ! блок (23) синтеза синусоид для синтезирования аудиосигнала (r') с помощью по меньшей мере одного частотного параметра (f), представляющего частоту аудиосигнала, и по меньшей мере одного фазового параметра (ϕ'), представляющего фазу аудиосигнала, отличающееся тем, что содержит ! блок (22) выработки параметров для выработки фазового параметра (ϕ') с помощью частотного параметра (f') и аудиосигнала (r'). ! 2. Устройство по п.1, в котором синтезированный аудиосигнал (r') содержит временные сегменты, и при этом блок (22) выработки параметров выполнен с возможностью выработки текущего фазового параметра (ϕ') с помощью предыдущего временного сегмента аудиосигнала (r'). ! 3. Устройство по п.1, в котором блок (22) выработки параметров содержит блок (21') нахождения фазы, выполненный с возможностью нахождения набора пар фаза-частота, причем каждая пара фаза-частота представляет фазу частоты аудиосигнала (r'). ! 4. Устройство по п.3, в котором блок (22) выработки параметров далее может содержать блок (28) предсказания фазы, выполненный с возможностью ! сравнения частотного параметра (f) с набором пар фаза-частота и выбора пары фаза-частота, ближайшей к частотному параметру (f), и ! выработки фазового параметра (ϕ') с помощью частотного параметра (f) и выбранной фазы. ! 5. Устройство по п.1, в котором блок (22) выработки параметров содержит блок (27) модификации частоты для модификации частотного параметра (f) в ответ на управляющий параметр (С). ! 6. Устройство по п.1, в котором блок (23) синтеза синусоид дополнительно использует амплитудный параметр (А). ! 7. Устройство по п.1, содержащее далее бл�
Claims (24)
1. Устройство (20) синтеза сигнала для синтезирования аудиосигнала (r'), содержащее:
блок (23) синтеза синусоид для синтезирования аудиосигнала (r') с помощью по меньшей мере одного частотного параметра (f), представляющего частоту аудиосигнала, и по меньшей мере одного фазового параметра (ϕ'), представляющего фазу аудиосигнала, отличающееся тем, что содержит
блок (22) выработки параметров для выработки фазового параметра (ϕ') с помощью частотного параметра (f') и аудиосигнала (r').
2. Устройство по п.1, в котором синтезированный аудиосигнал (r') содержит временные сегменты, и при этом блок (22) выработки параметров выполнен с возможностью выработки текущего фазового параметра (ϕ') с помощью предыдущего временного сегмента аудиосигнала (r').
3. Устройство по п.1, в котором блок (22) выработки параметров содержит блок (21') нахождения фазы, выполненный с возможностью нахождения набора пар фаза-частота, причем каждая пара фаза-частота представляет фазу частоты аудиосигнала (r').
4. Устройство по п.3, в котором блок (22) выработки параметров далее может содержать блок (28) предсказания фазы, выполненный с возможностью
сравнения частотного параметра (f) с набором пар фаза-частота и выбора пары фаза-частота, ближайшей к частотному параметру (f), и
выработки фазового параметра (ϕ') с помощью частотного параметра (f) и выбранной фазы.
5. Устройство по п.1, в котором блок (22) выработки параметров содержит блок (27) модификации частоты для модификации частотного параметра (f) в ответ на управляющий параметр (С).
6. Устройство по п.1, в котором блок (23) синтеза синусоид дополнительно использует амплитудный параметр (А).
7. Устройство по п.1, содержащее далее блок (24) управления усилением для перемножения синтезированного аудиосигнала (r') с параметром (G) усиления.
8. Устройство по п.1, содержащее далее блок (21) анализа синусоид для приема входного аудиосигнала (r) и выработки частотного параметра (f) и фазового параметра (ϕ').
9. Устройство по п.8, содержащее далее
дополнительный блок (23') синтеза синусоид для выработки синтезированного аудиосигнала и
блок (26) сравнения для сравнения синтезированного аудиосигнала и входного аудиосигнала, чтобы выработать параметр (G) усиления.
10. Устройство по п.2, содержащее далее блок (25) сегментации для разделения аудиосигнала (r) на временные сегменты.
11. Устройство по п.2, содержащее далее блок (25') перекрытия и добавления для соединения временных сегментов синтезированного аудиосигнала (r').
12. Устройство по п.10 или 11, в котором блок (25) сегментации управляется первым параметром (обнвх) перекрытия, а блок (25') перекрытия и добавления управляется вторым параметром (обнвых) перекрытия, и при этом устройство выполнено с возможностью временного масштабирования путем изменения параметров (обнвх, обнвых) перекрытия.
13. Устройство (1) преобразования речи, содержащее:
блок (10) анализа с линейным предсказанием для выработки параметров (р) предсказания и остаточного сигнала (r) в ответ на входной речевой сигнал (х),
блок (20) адаптации основного тона для адаптации основного тона остаточного сигнала (r), чтобы выработать остаточный сигнал (r') с адаптированным основным тоном, и
блок (30) синтеза с линейным предсказанием для синтезирования выходного речевого сигнала (у) в ответ на остаточный сигнал (r') с адаптированным основным тоном,
при этом блок (20) адаптации основного тона содержит устройство по п.5.
14. Устройство преобразования речи по п.13, содержащее далее блок (40) модификации для модификации параметров предсказания.
15. Аудиосистема, содержащая устройство по п.1.
16. Декодер (5) аудиосигнала, содержащий:
блок (23) синтеза синусоид для синтезирования аудиосигнала (r') с помощью по меньшей мере одного частотного параметра (f), представляющего частоту аудиосигнала, и по меньшей мере одного фазового параметра (ϕ'), представляющего фазу аудиосигнала, отличающийся тем, что содержит:
блок (22) выработки параметров для выработки фазового параметра (ϕ') с помощью частотного параметра (f) и аудиосигнала (r').
17. Способ синтезирования аудиосигнала (r'), содержащий этап, на котором
синтезируют аудиосигнал (r') с помощью по меньшей мере одного частотного параметра (f), представляющего частоту аудиосигнала, и по меньшей мере одного фазового параметра (ϕ'), представляющего фазу аудиосигнала, отличающийся тем, что содержит этап, на котором
вырабатывают фазовый параметр (ϕ') с помощью частотного параметра (f) и аудиосигнала (r').
18. Способ по п.17, в котором синтезированный аудиосигнал содержит временные сегменты, и при этом блок (22) выработки параметров выполнен с возможностью вырабатывать текущий фазовый параметр (ϕ') с помощью предыдущего временного сегмента аудиосигнала (r').
19. Способ по п.17, в котором этап предсказания фазы содержит подэтап, на котором находят набор пар фаза-частота, причем каждая пара фаза-частота представляет фазу частоты аудиосигнала (r').
20. Способ по п.19, в котором этап предсказания фазы может далее содержать подэтапы, на которых
сравнивают частотный параметр (f) с набором пар фаза-частота и выбирают пару фаза-частота, ближайшую к частотному параметру (f), и
вырабатывают фазовый параметр (ϕ') с помощью частотного параметра (f) и выбранной фазы.
21. Способ по п.17, в котором этап предсказания фазы содержит подэтап, на котором модифицируют частотный параметр (f) в ответ на управляющий параметр (С).
22. Способ преобразования речи, содержащий этапы, на которых
вырабатывают параметры (р) предсказания и остаточный сигнал (r) в ответ на входной речевой сигнал (х),
адаптируют основной тон остаточного сигнала (r), чтобы вырабатывать остаточный сигнал (r') с адаптированным основным тоном, и
синтезируют выходной речевой сигнал (у) в ответ на остаточный сигнал (r') с адаптированным основным тоном,
при этом этап адаптации основного тона содержит подэтап изменения частоты аудиосигнала по п.21.
23. Способ по п.17 или 22, содержащий далее этап временного масштабирования.
24. Компьютерный программный продукт для осуществления способа по п.17 или 22.
Applications Claiming Priority (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
EP05106437 | 2005-07-14 | ||
EP05106437.6 | 2005-07-14 |
Publications (1)
Publication Number | Publication Date |
---|---|
RU2008105555A true RU2008105555A (ru) | 2009-08-20 |
Family
ID=37433812
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
RU2008105555/09A RU2008105555A (ru) | 2005-07-14 | 2006-07-06 | Синтез аудиосигнала |
Country Status (9)
Country | Link |
---|---|
US (1) | US20100131276A1 (ru) |
EP (1) | EP1905009B1 (ru) |
JP (1) | JP2009501353A (ru) |
CN (1) | CN101223581A (ru) |
AT (1) | ATE443318T1 (ru) |
DE (1) | DE602006009271D1 (ru) |
ES (1) | ES2332108T3 (ru) |
RU (1) | RU2008105555A (ru) |
WO (1) | WO2007007253A1 (ru) |
Families Citing this family (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
KR20080073925A (ko) | 2007-02-07 | 2008-08-12 | 삼성전자주식회사 | 파라메트릭 부호화된 오디오 신호를 복호화하는 방법 및장치 |
ES2374008B1 (es) | 2009-12-21 | 2012-12-28 | Telefónica, S.A. | Codificación, modificación y síntesis de segmentos de voz. |
KR101333162B1 (ko) | 2012-10-04 | 2013-11-27 | 부산대학교 산학협력단 | Imdct 입력신호를 이용한 오디오 신호의 음정 및 속도 가변 장치 및 방법 |
CN104766612A (zh) * | 2015-04-13 | 2015-07-08 | 李素平 | 基于乐音音色匹配的正弦模型分离方法 |
US10326469B1 (en) * | 2018-03-26 | 2019-06-18 | Qualcomm Incorporated | Segmented digital-to-analog converter (DAC) |
EP3573059B1 (en) * | 2018-05-25 | 2021-03-31 | Dolby Laboratories Licensing Corporation | Dialogue enhancement based on synthesized speech |
Family Cites Families (17)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US5248845A (en) * | 1992-03-20 | 1993-09-28 | E-Mu Systems, Inc. | Digital sampling instrument |
US5734789A (en) * | 1992-06-01 | 1998-03-31 | Hughes Electronics | Voiced, unvoiced or noise modes in a CELP vocoder |
US5602961A (en) * | 1994-05-31 | 1997-02-11 | Alaris, Inc. | Method and apparatus for speech compression using multi-mode code excited linear predictive coding |
JP3437445B2 (ja) * | 1998-05-22 | 2003-08-18 | 松下電器産業株式会社 | 線形信号予測を用いた受信装置及び方法 |
US6665638B1 (en) * | 2000-04-17 | 2003-12-16 | At&T Corp. | Adaptive short-term post-filters for speech coders |
WO2001082293A1 (en) * | 2000-04-24 | 2001-11-01 | Qualcomm Incorporated | Method and apparatus for predictively quantizing voiced speech |
JP5485488B2 (ja) * | 2000-06-20 | 2014-05-07 | コーニンクレッカ フィリップス エヌ ヴェ | 正弦波符号化 |
KR100348899B1 (ko) * | 2000-09-19 | 2002-08-14 | 한국전자통신연구원 | 캡스트럼 분석을 이용한 하모닉 노이즈 음성 부호화기 및부호화 방법 |
WO2002056298A1 (en) | 2001-01-16 | 2002-07-18 | Koninklijke Philips Electronics N.V. | Linking of signal components in parametric encoding |
ATE323935T1 (de) * | 2001-04-09 | 2006-05-15 | Koninkl Philips Electronics Nv | Adpcm sprachkodiersystem mit phasenfaltungs und - entfaltungsfiltern |
CA2365203A1 (en) * | 2001-12-14 | 2003-06-14 | Voiceage Corporation | A signal modification method for efficient coding of speech signals |
US7027979B2 (en) * | 2003-01-14 | 2006-04-11 | Motorola, Inc. | Method and apparatus for speech reconstruction within a distributed speech recognition system |
WO2005091275A1 (en) * | 2004-03-17 | 2005-09-29 | Koninklijke Philips Electronics N.V. | Audio coding |
CA2603246C (en) * | 2005-04-01 | 2012-07-17 | Qualcomm Incorporated | Systems, methods, and apparatus for anti-sparseness filtering |
US8155972B2 (en) * | 2005-10-05 | 2012-04-10 | Texas Instruments Incorporated | Seamless audio speed change based on time scale modification |
US20070083377A1 (en) * | 2005-10-12 | 2007-04-12 | Steven Trautmann | Time scale modification of audio using bark bands |
FI20060133A0 (fi) * | 2006-02-13 | 2006-02-13 | Juha Ruokangas | Menetelmä ja järjestelmä äänisignaalien modifioimiseksi |
-
2006
- 2006-07-06 AT AT06766032T patent/ATE443318T1/de not_active IP Right Cessation
- 2006-07-06 JP JP2008521005A patent/JP2009501353A/ja not_active Withdrawn
- 2006-07-06 ES ES06766032T patent/ES2332108T3/es active Active
- 2006-07-06 DE DE602006009271T patent/DE602006009271D1/de active Active
- 2006-07-06 EP EP06766032A patent/EP1905009B1/en not_active Not-in-force
- 2006-07-06 WO PCT/IB2006/052291 patent/WO2007007253A1/en active Application Filing
- 2006-07-06 CN CN200680025590.7A patent/CN101223581A/zh active Pending
- 2006-07-06 RU RU2008105555/09A patent/RU2008105555A/ru not_active Application Discontinuation
- 2006-07-06 US US11/995,345 patent/US20100131276A1/en not_active Abandoned
Also Published As
Publication number | Publication date |
---|---|
EP1905009A1 (en) | 2008-04-02 |
ATE443318T1 (de) | 2009-10-15 |
EP1905009B1 (en) | 2009-09-16 |
JP2009501353A (ja) | 2009-01-15 |
US20100131276A1 (en) | 2010-05-27 |
ES2332108T3 (es) | 2010-01-26 |
DE602006009271D1 (de) | 2009-10-29 |
WO2007007253A1 (en) | 2007-01-18 |
CN101223581A (zh) | 2008-07-16 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP5467098B2 (ja) | オーディオ信号をパラメータ化された表現に変換するための装置および方法、パラメータ化された表現を修正するための装置および方法、オーディオ信号のパラメータ化された表現を合成するための装置および方法 | |
RU2008105555A (ru) | Синтез аудиосигнала | |
JP4734961B2 (ja) | 音響効果付与装置、及びプログラム | |
CN101399043A (zh) | 一种自适应多速率窄带编码方法及编码器 | |
JP2017513048A (ja) | 情報符号化のコンセプト | |
WO2006070768A1 (ja) | オーディオ波形処理装置、方式およびプログラム | |
JP2015161774A (ja) | 音合成方法及び音合成装置 | |
RU2682851C2 (ru) | Усовершенствованная коррекция потери кадров с помощью речевой информации | |
JP4455701B2 (ja) | 音声信号処理装置および音声信号処理方法 | |
JP2003345400A (ja) | ピッチ変換装置、ピッチ変換方法及びプログラム | |
JP4019824B2 (ja) | 波形生成装置及び方法並びに復号装置 | |
JP2015200685A (ja) | アタック位置検出プログラムおよびアタック位置検出装置 | |
US20220262376A1 (en) | Signal processing device, method, and program | |
KR100821499B1 (ko) | 정보 추출 장치 | |
JP2004077918A (ja) | 音声合成装置、方法及びプログラム | |
JPH11219199A (ja) | 位相検出装置及び方法、並びに音声符号化装置及び方法 | |
JP2011247921A (ja) | 信号合成方法、信号合成装置及びプログラム | |
CN1708785A (zh) | 带宽扩展装置及方法 | |
Freed | Spectral line broadening with transform domain additive synthesis | |
Röbel | Adaptive additive synthesis of sound | |
JP2005084661A (ja) | 音声分析生成装置、及びプログラム | |
JP5246208B2 (ja) | 基音抽出装置、及びプログラム | |
JP2012113225A (ja) | 復号装置、復号方法、およびプログラム | |
Triki | Harmonize-Decompose Audio Signals with Global Amplitude and Frequency Modulations | |
JP2006010908A (ja) | 音声効果付与装置及び音声効果付与プログラム |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
FA92 | Acknowledgement of application withdrawn (lack of supplementary materials submitted) |
Effective date: 20101026 |