JP2017182099A - 音声合成装置、音声合成方法および音声合成プログラム - Google Patents
音声合成装置、音声合成方法および音声合成プログラム Download PDFInfo
- Publication number
- JP2017182099A JP2017182099A JP2017131338A JP2017131338A JP2017182099A JP 2017182099 A JP2017182099 A JP 2017182099A JP 2017131338 A JP2017131338 A JP 2017131338A JP 2017131338 A JP2017131338 A JP 2017131338A JP 2017182099 A JP2017182099 A JP 2017182099A
- Authority
- JP
- Japan
- Prior art keywords
- speech
- sine wave
- subband
- waveform
- sound source
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
Images
Landscapes
- Compression, Expansion, Code Conversion, And Decoders (AREA)
Abstract
Description
(音声合成装置の構成)
図1は、音声合成装置100の基本構成を示すブロック図であり、図2は、音声合成装置100の具体的構成を示すブロック図である。音声合成装置100は、音源波形をサブバンド分割部110によりサブバンド分割して蓄積し、入力情報に応じてサブバンド毎に振幅を調整する。そして、振幅を調整されたサブバンド分割音源波形ベクトルを用いてサブバンド合成部140により合成し、目標となるスペクトル特性を近似的に有する音声波形を合成する。
フィルタバンクを構成するあるフィルタの係数に離散フーリエ変換(DFT)や離散コサイン変換(DCT)、あるいはそれらの逆変換の係数系列を掛けると、基となったフィルタの特性を、周波数軸上でシフトした形のフィルタ特性が得られる。そして、このようなフィルタでフィルタバンクを構成することで、フィルタバンクの処理で必要な計算に、FFT(高速フーリエ変換)等の高速化手法が利用可能となる。これにより、サブバンド分割・サブバンド合成の処理を高速化することができる。
次に、音源の制御方法について説明する。まず前提として、サブバンド分割・サブバンド合成の前後で処理の線形性が保証されているものとする。先述のDFTやDCTに基づくフィルタバンクは、線形な操作の組み合わせだけでその処理が構成されているので、この条件を満たす。
フィルタバンクにおける間引き率Mはその値が1(全く間引かない)からMまでの場合で、少なくとも再合成前に各サブバンドでパワー調整を行なわない場合、サブバンド合成結果がサブバンド分割前の入力信号と一致するようなフィルタバンクを構成することができることが理論上知られている。例えば、DFTやDCTのみでフィルタバンクを構成し、間引き率Lの間引きを行なう場合、計算誤差を無視すれば、それらの逆変換により入力波形が完全に復元できることは明らかである。
(正弦波合成を用いた装置の構成)
上記の実施形態は、音源ごとに乗算回路を設けてスペクトル包絡特性の再現と音源の混合比調整を同時に行なう構成であるが、例えば混合励振源の各帯域のパワーが等しくなるような条件の下でサブバンド分割された音源波形をまず作成し、それに対してサブバンドごとにパワー制御を行なうこともできる。
以下に、正弦波合成部232の動作の詳細を説明する。正弦波合成部232における処理は、例えば正弦波合成部232による最終出力波形と同じサンプリングレートで特定の周波数の正弦波を生成し、それらを組み合わせて周期性波形を構築して、サブバンド符号化を行なうことで実現できる。
次に、音声合成装置200の動作例を説明する。図8および図9は、音声合成装置200の動作の一例を示すフローチャートである。なお、図中のA、B、Cは、図8と図9との流れを結ぶ点を示している。本動作例では、フレームシフトがDサンプル、音源波形の1素片の長さがMサンプル、分割帯域数がMであることを前提条件としている。
110 サブバンド分割部
120 サブバンド分割音源生成部
121 蓄積部
122 選択部
130 サブバンドパワー調整部
140 サブバンド合成部
200 音声合成装置
210 サブバンド分割部
211a インパルス側分割部
211b 白色雑音側分割部
220 サブバンド分割音源生成部
220a インパルス側サブバンド分割音源生成部
220b 白色雑音側サブバンド分割音源生成部
221a インパルス側蓄積部
221b 白色雑音側蓄積部
222a インパルス側選択部
222b 白色雑音側選択部
223a インパルス側乗算部
223b 白色雑音側乗算部
224 加算部
232 正弦波合成部
236 サブバンド分割波形ベクトル生成部
Claims (6)
- 入力された時系列の音源制御情報およびスペクトル特性情報を基に、分割された複数の周波数帯域で音声波形を合成する音声合成装置であって、
1以上のサブバンドにおいて出力目標音声のスペクトル特性を模擬するように、振幅調整された複数の正弦波を足し合わせて合成した正弦波合成成分を出力する正弦波合成部と、
前記1以上のサブバンドにおいて前記出力された正弦波合成成分を単一の音声波形に合成するサブバンド合成部と、を備え、
前記正弦波合成部は、前記出力する正弦波合成成分が前記サブバンド合成部において原波形を完全もしくは近似的に復元できるようにダウンサンプリングされた際のサンプリングレートと等しいサンプリングレートで、前記1以上のサブバンドにおいて予めサブバンド符号化された前記正弦波合成成分を生成することを特徴とする音声合成装置。 - 前記正弦波合成部は、低い側の一部の帯域のサブバンドを前記1以上のサブバンドとして前記正弦波合成成分を生成することを特徴とする請求項1記載の音声合成装置。
- 前記正弦波合成部は、前記1以上のサブバンドにおいて入力された基本周波数から決定されるインパルスの位置に対応させて前記正弦波合成成分を生成することを特徴とする請求項1または請求項2記載の音声合成装置。
- 前記正弦波合成部は、前記1以上のサブバンドにおいて入力された基本周波数から決定されるインパルスの配置される時刻から遅延時間を加えた時刻に位相が0となるように前記正弦波合成成分を生成することを特徴とする請求項3記載の音声合成装置。
- 入力された時系列の音源制御情報およびスペクトル特性情報を基に、分割された複数の周波数帯域で音声波形を合成する音声合成方法であって、
1以上のサブバンドにおいて出力目標音声のスペクトル特性を模擬するように、振幅調整された複数の正弦波を足し合わせて合成した正弦波合成成分を出力するステップと、
前記1以上のサブバンドにおいて前記出力された正弦波合成成分を単一の音声波形に合成するステップと、を含み、
前記正弦波合成成分を出力するステップは、前記出力する正弦波合成成分が前記単一の音声波形に合成するステップにおいて原波形を完全もしくは近似的に復元できるようにダウンサンプリングされた際のサンプリングレートと等しいサンプリングレートで、前記1以上のサブバンドにおいて予めサブバンド符号化された前記正弦波合成成分を生成することを特徴とする音声合成方法。 - 入力された時系列の音源制御情報およびスペクトル特性情報を基に、分割された複数の周波数帯域で音声波形を合成する音声合成プログラムであって、
1以上のサブバンドにおいて出力目標音声のスペクトル特性を模擬するように、振幅調整された複数の正弦波を足し合わせて合成した正弦波合成成分を出力する処理と、
前記1以上のサブバンドにおいて前記出力された正弦波合成成分を単一の音声波形に合成する処理と、をコンピュータに実行させ、
前記正弦波合成成分を出力する処理は、前記出力する正弦波合成成分が前記単一の音声波形に合成する処理において原波形を完全もしくは近似的に復元できるようにダウンサンプリングされた際のサンプリングレートと等しいサンプリングレートで、前記1以上のサブバンドにおいて予めサブバンド符号化された前記正弦波合成成分を生成することを特徴とする音声合成プログラム。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2017131338A JP6410890B2 (ja) | 2017-07-04 | 2017-07-04 | 音声合成装置、音声合成方法および音声合成プログラム |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2017131338A JP6410890B2 (ja) | 2017-07-04 | 2017-07-04 | 音声合成装置、音声合成方法および音声合成プログラム |
Related Parent Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2012263574A Division JP6284298B2 (ja) | 2012-11-30 | 2012-11-30 | 音声合成装置、音声合成方法および音声合成プログラム |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2017182099A true JP2017182099A (ja) | 2017-10-05 |
JP6410890B2 JP6410890B2 (ja) | 2018-10-24 |
Family
ID=60004583
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2017131338A Active JP6410890B2 (ja) | 2017-07-04 | 2017-07-04 | 音声合成装置、音声合成方法および音声合成プログラム |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP6410890B2 (ja) |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN112863477A (zh) * | 2020-12-31 | 2021-05-28 | 出门问问(苏州)信息科技有限公司 | 一种语音合成方法、装置及存储介质 |
JP2022133447A (ja) * | 2021-09-27 | 2022-09-13 | ベイジン バイドゥ ネットコム サイエンス テクノロジー カンパニー リミテッド | 音声処理方法、装置、電子機器及び記憶媒体 |
Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2008530607A (ja) * | 2005-02-10 | 2008-08-07 | コーニンクレッカ フィリップス エレクトロニクス エヌ ヴィ | 音声合成方法 |
JP2012527637A (ja) * | 2009-05-19 | 2012-11-08 | エレクトロニクス アンド テレコミュニケーションズ リサーチ インスチチュート | 階層型正弦波パルスコーディングを用いるオーディオ信号の符号化及び復号化方法及び装置 |
-
2017
- 2017-07-04 JP JP2017131338A patent/JP6410890B2/ja active Active
Patent Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2008530607A (ja) * | 2005-02-10 | 2008-08-07 | コーニンクレッカ フィリップス エレクトロニクス エヌ ヴィ | 音声合成方法 |
JP2012527637A (ja) * | 2009-05-19 | 2012-11-08 | エレクトロニクス アンド テレコミュニケーションズ リサーチ インスチチュート | 階層型正弦波パルスコーディングを用いるオーディオ信号の符号化及び復号化方法及び装置 |
Cited By (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN112863477A (zh) * | 2020-12-31 | 2021-05-28 | 出门问问(苏州)信息科技有限公司 | 一种语音合成方法、装置及存储介质 |
CN112863477B (zh) * | 2020-12-31 | 2023-06-27 | 出门问问(苏州)信息科技有限公司 | 一种语音合成方法、装置及存储介质 |
JP2022133447A (ja) * | 2021-09-27 | 2022-09-13 | ベイジン バイドゥ ネットコム サイエンス テクノロジー カンパニー リミテッド | 音声処理方法、装置、電子機器及び記憶媒体 |
JP7412483B2 (ja) | 2021-09-27 | 2024-01-12 | ベイジン バイドゥ ネットコム サイエンス テクノロジー カンパニー リミテッド | 音声処理方法、装置、電子機器及び記憶媒体 |
Also Published As
Publication number | Publication date |
---|---|
JP6410890B2 (ja) | 2018-10-24 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
RU2586846C2 (ru) | Устройство и способ обработки входного звукового сигнала с помощью каскадированного банка фильтров | |
EP2486564B1 (en) | Apparatus and method for generating high frequency audio signal using adaptive oversampling | |
AU2011263191B2 (en) | Bandwidth Extension Method, Bandwidth Extension Apparatus, Program, Integrated Circuit, and Audio Decoding Apparatus | |
KR102014696B1 (ko) | 교차 곱 강화된 서브밴드 블록 기반 고조파 전위 | |
AU2013286049B2 (en) | Device, method and computer program for freely selectable frequency shifts in the sub-band domain | |
CA2784564C (en) | Improved subband block based harmonic transposition | |
CN108140396B (zh) | 音频信号处理 | |
US9837098B2 (en) | Reduced-delay subband signal processing system and method | |
JP6410890B2 (ja) | 音声合成装置、音声合成方法および音声合成プログラム | |
JP6284298B2 (ja) | 音声合成装置、音声合成方法および音声合成プログラム | |
JP6201205B2 (ja) | 音声合成装置、音声合成方法および音声合成プログラム | |
JP5763487B2 (ja) | 音声合成装置、音声合成方法および音声合成プログラム | |
RU2641253C2 (ru) | Устройство и способ для обработки звукового сигнала с использованием сигнала ошибки вследствие наложения спектров |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20170704 |
|
A521 | Written amendment |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20170906 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20180911 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20180925 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 6410890 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |