JP5763487B2 - 音声合成装置、音声合成方法および音声合成プログラム - Google Patents
音声合成装置、音声合成方法および音声合成プログラム Download PDFInfo
- Publication number
- JP5763487B2 JP5763487B2 JP2011205085A JP2011205085A JP5763487B2 JP 5763487 B2 JP5763487 B2 JP 5763487B2 JP 2011205085 A JP2011205085 A JP 2011205085A JP 2011205085 A JP2011205085 A JP 2011205085A JP 5763487 B2 JP5763487 B2 JP 5763487B2
- Authority
- JP
- Japan
- Prior art keywords
- sound source
- subband
- waveform
- speech
- vector
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
Images
Landscapes
- Compression, Expansion, Code Conversion, And Decoders (AREA)
Description
(音声合成装置の構成)
図1は、音声合成装置100の基本構成を示すブロック図であり、図2は、音声合成装置100の具体的構成を示すブロック図である。音声合成装置100は、音源波形をサブバンド分割部110によりサブバンド分割して蓄積し、入力情報に応じてサブバンド毎に振幅を調整する。そして、振幅を調整されたサブバンド分割音源波形ベクトルを用いてサブバンド合成部140により合成し、目標となるスペクトル特性を近似的に有する音声波形を合成する。
フィルタバンクを構成するあるフィルタの係数に離散フーリエ変換(DFT)や離散コサイン変換(DCT)、あるいはそれらの逆変換の係数系列を掛けると、基となったフィルタの特性を、周波数軸上でシフトした形のフィルタ特性が得られる。そして、このようなフィルタでフィルタバンクを構成することで、フィルタバンクの処理で必要な計算に、FFT(高速フーリエ変換)等の高速化手法が利用可能となる。これにより、サブバンド分割・サブバンド合成の処理を高速化することができる。
次に、音源の制御方法について説明する。まず前提として、サブバンド分割・サブバンド合成の前後で処理の線形性が保証されているものとする。先述のDFTやDCTに基づくフィルタバンクは、線形な操作の組み合わせだけでその処理が構成されているので、この条件を満たす。
フィルタバンクにおける間引き率Mはその値が1(全く間引かない)からMまでの場合で、少なくとも再合成前に各サブバンドでパワー調整を行なわない場合、サブバンド合成結果がサブバンド分割前の入力信号と一致するようなフィルタバンクを構成することができることが理論上知られている。例えば、DFTやDCTのみでフィルタバンクを構成し、間引き率Lの間引きを行なう場合、計算誤差を無視すれば、それらの逆変換により入力波形が完全に復元できることは明らかである。
(混合励振源を用いる音声合成装置の構成)
上記の実施形態は、音源ごとに乗算回路を設けてスペクトル包絡特性の再現と音源の混合比調整を同時に行なう構成であるが、例えば混合励振源の各帯域のパワーが等しくなるような条件の下でサブバンド分割された音源波形をまず作成し、それに対してサブバンドごとにパワー制御を行なっても良い。
次に、音声合成装置200の動作例を説明する。図8および図9は、音声合成装置200の動作の一例を示すフローチャートである。なお、図中のA、Bは、図8と図9との流れを結ぶ点を示している。本動作例では、フレームシフトがDサンプル、音源波形の1素片の長さがMサンプル、分割帯域数がMであることを前提条件としている。
(インパルス音源のみ動的生成する音声合成装置の構成)
上記の実施形態では、インパルス音源に基づくサブバンド分割音源波形ベクトルも、白色雑音源に基づくサブバンド分割音源波形ベクトルも、事前に蓄積しているが、インパルス側ではサブバンド分割音源波形ベクトルを蓄積しない形態も採用可能である。図10は、そのような音声合成装置300の基本構成を示すブロック図である。図10に示す音声合成装置300の構成は、基本的には音声合成装置200と同様であるが、サブバンド分割音源生成部320には、インパルス側のサブバンド分割音源波形ベクトルの蓄積、選択を行なう構成が無い。
110 サブバンド分割部
120 サブバンド分割音源生成部
121 蓄積部
122 選択部
130 サブバンドパワー調整部
140 サブバンド合成部
200 音声合成装置
210 サブバンド分割部
211a インパルス側分割部
211b 白色雑音側分割部
220 サブバンド分割音源生成部
220a インパルス側サブバンド分割音源生成部
220b 白色雑音側サブバンド分割音源生成部
221a インパルス側蓄積部
221b 白色雑音側蓄積部
222a インパルス側選択部
222b 白色雑音側選択部
223a インパルス側重み付け乗算部
223b 白色雑音側重み付け乗算部
224 加算部
300 音声合成装置
320 サブバンド分割音源生成部
Claims (7)
- 入力された時系列の音源制御情報およびスペクトル特性情報を基に、音声波形を合成する音声合成装置であって、
入力された音源制御情報としての目標音声の基本周波数を含む情報に対応させて、音源波形を複数の周波数帯域に分割して蓄積されたサブバンド分割音源波形ベクトルを選択し、前記選択されたサブバンド分割音源波形ベクトルにより前記入力された音源制御情報に対応するサブバンド分割音源波形ベクトルを生成するサブバンド分割音源生成部と、
前記生成されたサブバンド分割音源波形ベクトルに対して、入力されたスペクトル特性情報としての目標音声のスペクトル特性を表す情報に応じたサブバンド毎の振幅調整を行なうサブバンドパワー調整部と、
前記振幅調整がなされたサブバンド分割音源波形ベクトルを単一の音声波形に合成するサブバンド合成部と、を備えることを特徴とする音声合成装置。 - 前記サブバンド分割音源生成部は、前記蓄積されたサブバンド分割音源波形ベクトルのうち複数のサブバンド分割音源波形ベクトルを組み合わせて、前記入力された音源制御情報に対応するサブバンド分割音源波形ベクトルを生成することを特徴とする請求項1記載の音声合成装置。
- 前記サブバンド分割音源生成部は、インパルス音源に対応するサブバンド分割音源波形ベクトルと白色雑音音源に対応するサブバンド分割音源波形ベクトルとの重み付け和により前記生成されたサブバンド分割音源波形ベクトルを生成することを特徴とする請求項1または請求項2記載の音声合成装置。
- 前記サブバンド分割音源生成部は、白色雑音音源に対しては、前記蓄積されたサブバンド分割音源波形ベクトルに基づいて、入力された音源制御情報に対応するサブバンド分割音源波形ベクトルを生成し、インパルス音源に対しては、音源波形を複数の周波数帯域に分割してサブバンド分割音源波形ベクトルを生成することを特徴とする請求項1から請求項3のいずれかに記載の音声合成装置。
- 音源波形を複数の周波数帯域に分割し、前記音源波形の分割により得られたベクトル系列に対し、等時間間隔内のベクトル系列からベクトルを間引き、前記蓄積をするためのサブバンド分割音源波形ベクトルを生成するサブバンド分割部を更に備えることを特徴とする請求項1から請求項4のいずれかに記載の音声合成装置。
- 入力された時系列の音源制御情報およびスペクトル特性情報を基に、音声波形を合成する音声合成方法であって、
入力された音源制御情報としての目標音声の基本周波数を含む情報に対応させて、音源波形を複数の周波数帯域に分割して蓄積されたサブバンド分割音源波形ベクトルを選択し、前記選択されたサブバンド分割音源波形ベクトルにより前記入力された音源制御情報に対応するサブバンド分割音源波形ベクトルを生成するステップと、
前記生成されたサブバンド分割音源波形ベクトルに対して、入力されたスペクトル特性情報としての目標音声のスペクトル特性を表す情報に応じたサブバンド毎の振幅調整を行なうステップと、
前記振幅調整がなされたサブバンド分割音源波形ベクトルを単一の音声波形に合成するステップと、を含むことを特徴とする音声合成方法。 - 入力された時系列の音源制御情報およびスペクトル特性情報を基に、音声波形を合成する音声合成プログラムであって、
入力された音源制御情報としての目標音声の基本周波数を含む情報に対応させて、音源波形を複数の周波数帯域に分割して蓄積されたサブバンド分割音源波形ベクトルを選択し、前記選択されたサブバンド分割音源波形ベクトルにより前記入力された音源制御情報に対応するサブバンド分割音源波形ベクトルを生成する処理と、
前記生成されたサブバンド分割音源波形ベクトルに対して、入力されたスペクトル特性情報としての目標音声のスペクトル特性を表す情報に応じたサブバンド毎の振幅調整を行なう処理と、
前記振幅調整がなされたサブバンド分割音源波形ベクトルを単一の音声波形に合成する処理と、をコンピュータに実行させることを特徴とする音声合成プログラム。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2011205085A JP5763487B2 (ja) | 2011-09-20 | 2011-09-20 | 音声合成装置、音声合成方法および音声合成プログラム |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2011205085A JP5763487B2 (ja) | 2011-09-20 | 2011-09-20 | 音声合成装置、音声合成方法および音声合成プログラム |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2013068658A JP2013068658A (ja) | 2013-04-18 |
JP5763487B2 true JP5763487B2 (ja) | 2015-08-12 |
Family
ID=48474459
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2011205085A Active JP5763487B2 (ja) | 2011-09-20 | 2011-09-20 | 音声合成装置、音声合成方法および音声合成プログラム |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP5763487B2 (ja) |
Family Cites Families (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP4170459B2 (ja) * | 1998-08-28 | 2008-10-22 | ローランド株式会社 | 波形信号の時間軸圧縮伸長装置 |
JP3292711B2 (ja) * | 1999-08-06 | 2002-06-17 | 株式会社ワイ・アール・ピー高機能移動体通信研究所 | 音声符号化復号方法および装置 |
JP4476654B2 (ja) * | 2004-03-17 | 2010-06-09 | 旭化成株式会社 | 音声合成装置、音声合成方法及び音声合成装置制御プログラム |
US8532983B2 (en) * | 2008-09-06 | 2013-09-10 | Huawei Technologies Co., Ltd. | Adaptive frequency prediction for encoding or decoding an audio signal |
-
2011
- 2011-09-20 JP JP2011205085A patent/JP5763487B2/ja active Active
Also Published As
Publication number | Publication date |
---|---|
JP2013068658A (ja) | 2013-04-18 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP5341128B2 (ja) | 補聴器における安定性の改善 | |
KR101201167B1 (ko) | 압축된 서브밴드 필터 임펄스 응답들을 형성하는 필터 압축기 및 방법 | |
CN103325380B (zh) | 用于信号增强的增益后处理 | |
KR102014696B1 (ko) | 교차 곱 강화된 서브밴드 블록 기반 고조파 전위 | |
RU2586846C2 (ru) | Устройство и способ обработки входного звукового сигнала с помощью каскадированного банка фильтров | |
EP2486564B1 (en) | Apparatus and method for generating high frequency audio signal using adaptive oversampling | |
RU2595889C1 (ru) | Устройство, способ и компьютерная программа для свободно выбираемых сдвигов частоты в области поддиапазонов | |
CA3008914A1 (en) | Improved subband block based harmonic transposition | |
US9418677B2 (en) | Noise suppressing device, noise suppressing method, and a non-transitory computer-readable recording medium storing noise suppressing program | |
CN113299313A (zh) | 音频处理方法、装置及电子设备 | |
JP6410890B2 (ja) | 音声合成装置、音声合成方法および音声合成プログラム | |
JP6284298B2 (ja) | 音声合成装置、音声合成方法および音声合成プログラム | |
JP6201205B2 (ja) | 音声合成装置、音声合成方法および音声合成プログラム | |
JP5763487B2 (ja) | 音声合成装置、音声合成方法および音声合成プログラム | |
CN112908351A (zh) | 一种音频变调方法、装置、设备及存储介质 | |
RU2810281C1 (ru) | Гармоническое преобразование на основе блока поддиапазонов, усиленное перекрестными произведениями | |
US11838732B2 (en) | Adaptive filterbanks using scale-dependent nonlinearity for psychoacoustic frequency range extension | |
Bai et al. | Multirate synthesis of reverberators using subband filtering | |
RU2801960C1 (ru) | Гармоническое преобразование на основе блока поддиапазонов, усиленное перекрестными произведениями | |
Petrausch et al. | Sound synthesis by physical modeling using the functional transformation method: Efficient implementations with polyphase-filterbanks | |
CA3142163A1 (en) | Low latency audio filterbank having improved frequency resolution |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20140227 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20141106 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20141118 |
|
A521 | Written amendment |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20150116 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20150526 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20150611 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 5763487 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |