JP5224552B2 - 音声生成装置およびその制御プログラム - Google Patents
音声生成装置およびその制御プログラム Download PDFInfo
- Publication number
- JP5224552B2 JP5224552B2 JP2010183923A JP2010183923A JP5224552B2 JP 5224552 B2 JP5224552 B2 JP 5224552B2 JP 2010183923 A JP2010183923 A JP 2010183923A JP 2010183923 A JP2010183923 A JP 2010183923A JP 5224552 B2 JP5224552 B2 JP 5224552B2
- Authority
- JP
- Japan
- Prior art keywords
- sound
- formant
- formant frequency
- frequency
- coordinate value
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 238000001514 detection method Methods 0.000 claims description 22
- 238000000034 method Methods 0.000 claims description 14
- 230000008569 process Effects 0.000 claims description 13
- 238000009826 distribution Methods 0.000 claims description 3
- 230000002194 synthesizing effect Effects 0.000 claims description 3
- 230000001133 acceleration Effects 0.000 claims description 2
- 230000002238 attenuated effect Effects 0.000 claims 1
- 238000004519 manufacturing process Methods 0.000 description 11
- 238000010586 diagram Methods 0.000 description 10
- 230000001755 vocal effect Effects 0.000 description 9
- 230000006870 function Effects 0.000 description 5
- 238000003860 storage Methods 0.000 description 5
- 238000004891 communication Methods 0.000 description 4
- 208000037265 diseases, disorders, signs and symptoms Diseases 0.000 description 3
- 210000004072 lung Anatomy 0.000 description 3
- 230000007246 mechanism Effects 0.000 description 3
- 210000001260 vocal cord Anatomy 0.000 description 3
- 230000005540 biological transmission Effects 0.000 description 2
- 230000008859 change Effects 0.000 description 2
- 230000000694 effects Effects 0.000 description 2
- 210000000867 larynx Anatomy 0.000 description 2
- 210000000214 mouth Anatomy 0.000 description 2
- 210000003928 nasal cavity Anatomy 0.000 description 2
- 230000003287 optical effect Effects 0.000 description 2
- 210000003800 pharynx Anatomy 0.000 description 2
- 239000004065 semiconductor Substances 0.000 description 2
- 208000021642 Muscular disease Diseases 0.000 description 1
- 208000018737 Parkinson disease Diseases 0.000 description 1
- 230000005856 abnormality Effects 0.000 description 1
- 230000008901 benefit Effects 0.000 description 1
- 230000015572 biosynthetic process Effects 0.000 description 1
- 206010008129 cerebral palsy Diseases 0.000 description 1
- 208000026106 cerebrovascular disease Diseases 0.000 description 1
- 238000006243 chemical reaction Methods 0.000 description 1
- 230000007547 defect Effects 0.000 description 1
- 230000008451 emotion Effects 0.000 description 1
- 230000003203 everyday effect Effects 0.000 description 1
- 230000008921 facial expression Effects 0.000 description 1
- 239000004973 liquid crystal related substance Substances 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 201000006938 muscular dystrophy Diseases 0.000 description 1
- 238000003825 pressing Methods 0.000 description 1
- 230000000241 respiratory effect Effects 0.000 description 1
- 230000004044 response Effects 0.000 description 1
- 238000003786 synthesis reaction Methods 0.000 description 1
- 230000007704 transition Effects 0.000 description 1
- 230000000007 visual effect Effects 0.000 description 1
Images
Landscapes
- User Interface Of Digital Computer (AREA)
Description
図1は、母音の発声の仕組みについて説明するための図である。
図2は、本発明の第1の実施の形態としての音声生成装置1の構成例を示す図である。
以上のように、第1の実施の形態によれば、マウス11Aやタッチパッド11Bなどを用いて、直感的な操作で、疑似的な音声をリアルタイムに生成することが可能となる。
次に、本発明の第2の実施の形態について、図6および図7を参照して説明する。
以上のように、第2の実施の形態によれば、操作バー51を用いて、直感的な操作で、疑似的な音声をリアルタイムに生成することが可能となる。
1.以上においては、入力デバイスとして、マウス11A、タッチパッド11B、および操作バー51を用いる場合を例に説明したが、他にも、タッチペンやジョイスティックなどを利用することも勿論可能である。つまり、ユーザの症例に合わせて入力デバイスを切り替えるようにすることが好ましい。
11 入力デバイス
12 表示部
13 スピーカ
21 音源生成部
22 音声生成部
Claims (5)
- 基本周波数の音声データを生成する音源生成手段と、
入力手段の操作に基づいて第1ホルマント周波数と第2ホルマント周波数の2次元平面上におけるX座標値とY座標値および第3ホルマント周波数と第4ホルマント周波数の2次元平面上におけるX座標値とY座標値を検出する座標値検出手段と、
前記音源生成手段で生成された前記基本周波数の音声データを、前記第1ホルマント周波数と第2ホルマント周波数の2次元平面上における前記X座標値に対応する前記第1ホルマント周波数で共振させる第1の共振手段と、
前記第1の共振手段により共振された前記音声データを、前記第1ホルマント周波数と前記第2ホルマント周波数の2次元平面上における前記Y座標値に対応する前記第2ホルマント周波数で共振させる第2の共振手段と、
前記第2の共振手段により共振された前記音声データを、前記第3ホルマント周波数と前記第4ホルマント周波数の2次元平面上における前記X座標値に対応する前記第3ホルマント周波数で共振させる第3の共振手段と、
前記第3の共振手段により共振された前記音声データを、前記第3ホルマント周波数と前記第4ホルマント周波数の2次元平面上における前記Y座標値に対応する前記第4ホルマント周波数で共振させる第4の共振手段と、
前記第4の共振手段により共振された前記音声データを出力する出力手段と、
備えることを特徴とする音声生成装置。 - 請求項1に記載の音声生成装置であって、
前記座標値検出手段は、前記入力手段の操作に基づいて鼻音の有無を判定し、その判定結果を出力するものであり、
前記音源生成手段からの基本周波数の音声データのうち、高周波を通過させ、遮断周波数より低い周波数の帯域を減衰させて前記第1の共振手段に出力するハイパスフィルタと、
前記座標値検出手段から鼻音があるという判定結果が入力された場合に、前記ハイパスフィルタから出力された低周波成分が除去された音声データを、所定の共振周波数で共振させて鼻音となる音声データを生成して出力する鼻音生成手段と、
前記第4の共振手段により共振された音声データと前記鼻音生成手段により生成された音声データを加算して出力する第1の加算手段と、を有し、
前記出力手段は、前記第1の加算手段により出力された音声データを出力する
ことを特徴とする音声生成装置。 - 請求項1又は2に記載の音声生成装置であって、
前記座標値検出手段は、前記入力手段の操作に基づいて乱流音の有無を判定し、その判定結果を出力するものであり、
前記座標値検出手段から乱流音があるという判定結果が入力された場合に、子音を合成するための音源を、第1〜第4のホルマント周波数それぞれに対して個別に設けられた疑似乱数発生器によってそれぞれ生成すると共に、前記座標値検出手段からの入力情報に対応するホルマント周波数でそれぞれ共振させた音声データを出力する乱流音生成手段と、
前記乱流音生成手段から出力される音声データと前記第1の加算手段により出力される音声データを加算する第2の加算手段とを有し、
前記出力手段は、前記第2の加算手段により出力される音声データを出力することを特徴とする音声生成装置。 - 請求項1から3のいずれか1項に記載の音声生成装置であって、
前記音声生成装置は、ジャイロセンサを内蔵した操作バーから情報を受信できるように構成されると共に前記操作バーの空間上の動作に応じて、それぞれのホルマント周波数の2次元平面上における分布に対応させた情報を記憶しており、前記操作バーのジャイロセンサが検出したX軸、Y軸、Z軸方向の加速度に基づいて音声データを生成することを特徴とする音声生成装置。 - 基本周波数の音声データを生成する音源生成ステップと、
入力手段の操作に基づいて第1ホルマント周波数と第2ホルマント周波数の2次元平面上におけるX座標値とY座標値および第3ホルマント周波数と第4ホルマント周波数の2次元平面上におけるX座標値とY座標値を検出する座標値検出ステップと、
前記音源生成ステップで生成された前記基本周波数の音声データを、前記第1ホルマント周波数と第2ホルマント周波数の2次元平面上における前記X座標値に対応する前記第1ホルマント周波数で共振させる第1の共振ステップと、
前記第1の共振ステップにより共振された前記音声データを、前記第1ホルマント周波数と前記第2ホルマント周波数の2次元平面上における前記Y座標値に対応する前記第2ホルマント周波数で共振させる第2の共振ステップと、
前記第2の共振ステップにより共振された前記音声データを、前記第3ホルマント周波数と前記第4ホルマント周波数の2次元平面上における前記X座標値に対応する前記第3ホルマント周波数で共振させる第3の共振ステップと、
前記第3の共振ステップにより共振された前記音声データを、前記第3ホルマント周波数と前記第4ホルマント周波数の2次元平面上における前記Y座標値に対応する前記第4ホルマント周波数で共振させる第4の共振ステップと、
前記第4の共振ステップにより共振された前記音声データを出力する出力ステップと、
を含む処理をコンピュータに実行させることを特徴とするプログラム。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2010183923A JP5224552B2 (ja) | 2010-08-19 | 2010-08-19 | 音声生成装置およびその制御プログラム |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2010183923A JP5224552B2 (ja) | 2010-08-19 | 2010-08-19 | 音声生成装置およびその制御プログラム |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2012042722A JP2012042722A (ja) | 2012-03-01 |
JP5224552B2 true JP5224552B2 (ja) | 2013-07-03 |
Family
ID=45899114
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2010183923A Active JP5224552B2 (ja) | 2010-08-19 | 2010-08-19 | 音声生成装置およびその制御プログラム |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP5224552B2 (ja) |
Families Citing this family (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN106057192A (zh) * | 2016-07-07 | 2016-10-26 | Tcl集团股份有限公司 | 一种实时语音转换方法和装置 |
Family Cites Families (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
GB9600774D0 (en) * | 1996-01-15 | 1996-03-20 | British Telecomm | Waveform synthesis |
JP4906776B2 (ja) * | 2008-04-16 | 2012-03-28 | 株式会社アルカディア | 音声制御装置 |
-
2010
- 2010-08-19 JP JP2010183923A patent/JP5224552B2/ja active Active
Also Published As
Publication number | Publication date |
---|---|
JP2012042722A (ja) | 2012-03-01 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
Heidemann | A System for Describing Vocal Timbre in Popular Song. | |
JP4363590B2 (ja) | 音声合成 | |
Tran et al. | Improvement to a NAM-captured whisper-to-speech system | |
CN111418006B (zh) | 声音合成方法、声音合成装置及记录介质 | |
JP2011048335A (ja) | 歌声合成システム、歌声合成方法及び歌声合成装置 | |
JPWO2020145353A1 (ja) | コンピュータプログラム、サーバ装置、端末装置及び音声信号処理方法 | |
CN112289300B (zh) | 音频处理方法、装置及电子设备和计算机可读存储介质 | |
CN106205571A (zh) | 一种歌声语音的处理方法和装置 | |
Fine et al. | Making myself understood: perceived factors affecting the intelligibility of sung text | |
Potamianos et al. | A review of the acoustic and linguistic properties of children's speech | |
JP2008054850A (ja) | プログラム、情報記憶媒体及びゲーム装置 | |
US8938077B2 (en) | Sound source playing apparatus for compensating output sound source signal and method of compensating sound source signal output from sound source playing apparatus | |
JP5224552B2 (ja) | 音声生成装置およびその制御プログラム | |
US9531333B2 (en) | Formant amplifier | |
Rilliard et al. | Paradigmatic variation of vowels in expressive speech: Acoustic description and dimensional analysis | |
JP6044284B2 (ja) | 音声合成装置 | |
KR20120096880A (ko) | 사용자가 자신의 음성에 기초하여 디지털 악기를 연주할 수 있도록 하기 위한 방법, 시스템 및 컴퓨터 판독 가능한 기록 매체 | |
JP2020003762A (ja) | 簡易操作声質変換システム | |
JP7069386B1 (ja) | 音声変換装置、音声変換方法、プログラム、および記録媒体 | |
Oh et al. | LOLOL: Laugh Out Loud On Laptop. | |
JP2015102773A (ja) | 音声発生装置、音声変形装置及び方法 | |
WO2010084830A1 (ja) | 音声処理装置、チャットシステム、音声処理方法、情報記憶媒体、ならびに、プログラム | |
Howard | The vocal tract organ and the vox humana organ stop | |
Jones | Compositional control of phonetic/nonphonetic perception | |
CN113421544B (zh) | 歌声合成方法、装置、计算机设备及存储介质 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20120615 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20120626 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20120822 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20130219 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20130308 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 5224552 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20160322 Year of fee payment: 3 |
|
S531 | Written request for registration of change of domicile |
Free format text: JAPANESE INTERMEDIATE CODE: R313531 |
|
R350 | Written notification of registration of transfer |
Free format text: JAPANESE INTERMEDIATE CODE: R350 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
S533 | Written request for registration of change of name |
Free format text: JAPANESE INTERMEDIATE CODE: R313533 |
|
R350 | Written notification of registration of transfer |
Free format text: JAPANESE INTERMEDIATE CODE: R350 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
S111 | Request for change of ownership or part of ownership |
Free format text: JAPANESE INTERMEDIATE CODE: R313117 |
|
S531 | Written request for registration of change of domicile |
Free format text: JAPANESE INTERMEDIATE CODE: R313531 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R350 | Written notification of registration of transfer |
Free format text: JAPANESE INTERMEDIATE CODE: R350 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |