JP2002297199A - 合成音声判別方法と装置及び音声合成装置 - Google Patents

合成音声判別方法と装置及び音声合成装置

Info

Publication number
JP2002297199A
JP2002297199A JP2001097158A JP2001097158A JP2002297199A JP 2002297199 A JP2002297199 A JP 2002297199A JP 2001097158 A JP2001097158 A JP 2001097158A JP 2001097158 A JP2001097158 A JP 2001097158A JP 2002297199 A JP2002297199 A JP 2002297199A
Authority
JP
Japan
Prior art keywords
signal
synthesized
speech
voice
discriminating
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2001097158A
Other languages
English (en)
Inventor
Yoshinori Shiga
芳則 志賀
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Toshiba Corp
Original Assignee
Toshiba Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Toshiba Corp filed Critical Toshiba Corp
Priority to JP2001097158A priority Critical patent/JP2002297199A/ja
Publication of JP2002297199A publication Critical patent/JP2002297199A/ja
Pending legal-status Critical Current

Links

Abstract

(57)【要約】 【課題】入力された音声信号が合成音声信号かどうかを
判別するための方法を提供する。 【解決手段】音声合成装置12において入力される文字
列に従って音声合成を行うことにより生成された合成音
声信号に、合成音声信号であることを判別するための判
別情報を付加した音声信号18を出力し、音声信号を受
ける側に設けられた合成音声判別装置20において入力
音声信号から判別情報の有無を検出し、この判別情報を
検出したとき入力音声信号が合成音声信号18であると
判別する。

Description

【発明の詳細な説明】
【0001】
【発明の属する技術分野】本発明は、音声合成装置によ
る合成音声と人間による実際の発声音声とを判別するた
めの合成音声判別方法と装置及び音声合成装置に関す
る。
【0002】
【従来の技術】文字列であるテキストから音声を合成す
る、いわゆる音声規則合成技術の進歩は著しい。最近で
は、図1に示すようにアナウンサやナレータの発声を収
録し、この収録した発生音声1を計算機で利用できるよ
うにデータ化した音声データベース2から、音声の音色
(音韻情報)や抑揚(韻律情報)の制御情報を統計的学
習アルゴリズムを用いて学習処理部3により自動獲得し
て制御情報データベース4を作成し、この制御情報デー
タベース4を用いて入力テキスト5から音声規則合成処
理部6によって合成音声を生成する技術が確立されつつ
ある。
【0003】このような技術については、例えば、X.Ha
ng et al “ Recent Improvementson Microsoft's Trai
nable Text-To-Speech System-Whistler ”. IEEE Inte
rnational Conference on Acoustics, Speech, and Sig
nal Processing . pp.959-962, 1997などに詳しく述べ
られている。
【0004】こうした手法に基づいて得られた合成音声
は、収録したアナウンサやナレータなどの収録話者の特
徴を良く保持している。すなわち、収録話者による実際
の発声音声と、音声規則合成による合成音声は声質や抑
揚の特徴が良く似ており、少し聞いた程度では収録話者
の発生音声なのか合成音声なのかを簡単には区別できな
い。特に、音声を電話回線のような伝送系を通した場合
のように、音声が帯域制限などにより劣化している場合
には、実際の発生音声と合成音声との区別は難しくな
る。
【0005】さらに、音声規則合成技術を利用して、ユ
ーザもしくはユーザ以外の発声音声をパーソナルコンピ
ュータなどに取り込むことで、現実の発声音声を真似た
合成音声を生成する技術も研究されており、近い将来は
簡単に自分自身や他人の声を合成することが可能になる
と考えられる。
【0006】
【発明が解決しようとする課題】上述したように音声規
則合成技術の進歩は、収録話者による実際の発声音声と
に近い合成音声を生成できるため、有名人の発生と同じ
音声を合成したり、電子メールを送信者の声で読み上げ
るといったことを可能にするなど様々な利点を生む。
【0007】反面、音声規則合成技術を悪用すると、他
人への「なりすまし」が容易に可能となるため、例えば
音声で発声者を識別したり照合する話者識別あるいは話
者照合技術を意味のないものにしてしまい、声紋分析に
よる犯罪捜査などへも影響を与えることが懸念される。
【0008】本発明は、このような問題点を解消すべく
なされたもので、入力された音声信号が合成音声信号か
どうかを判別できる合成音声判別方法と装置及び音声合
成装置を提供することを目的とする。
【0009】
【課題を解決するための手段】上記課題を解決するた
め、本発明に係る合成音声判別方法は、入力される文字
列に従って音声合成を行うことにより生成された合成音
声信号に、合成音声信号であることを判別するための判
別情報を付加した音声信号を出力することを基本的な特
徴とする。合成音声信号へに付加される判別情報は、ア
ナログ信号による伝送や帯域制限、音質劣化によっても
失われない情報であることが望ましく、例えば、合成音
声信号の周波数特性に変更を加えることにより判別情報
の付加が行われる。より具体的には、合成音声信号に加
える周波数特性の変更としては、合成音声信号の主たる
周波数帯域外の周波数帯域における信号パワーの変更が
用いられる。そして、入力音声信号から判別情報の有無
を検出し、該判別情報を検出したとき入力音声信号が合
成音声信号であると判別する。
【0010】本発明に係る音声合成装置は、入力される
文字列に従って音声合成を行うことにより合成音声信号
を生成する音声合成部と、合成音声信号に合成音声信号
であることを判別するための判別情報を付加した音声信
号を出力する判別情報付加部とを有することを特徴とす
る。
【0011】この音声合成装置と組み合わせられる本発
明に係る合成音声判別装置は、入力音声信号から音声合
成装置において合成音声信号に付加された判別情報の有
無を検出し、この判別情報を検出したとき入力音声信号
が合成音声信号であると判別する判別部と、この判別部
の判別結果を表示する表示部とを有する。
【0012】また、本発明によれば入力される文字列に
従って音声合成を行うことにより合成音声信号を生成す
る処理と、合成音声信号に合成音声信号であることを判
別するための判別情報を付加した音声信号を出力する処
理とをコンピュータに実行させるためのプログラムまた
は該プログラムを記録した記録媒体を提供することがで
きる。
【0013】さらに、本発明によれば入力音声信号から
合成音声信号に付加された判別情報の有無を検出し、該
判別情報を検出したとき該入力音声信号が該合成音声信
号であると判別する処理と、この判別の結果を表示させ
る処理とをコンピュータに実行させるためのプログラム
または該プログラムを記録した記録媒体を提供すること
ができる。
【0014】このように本発明によると、合成音声信号
に合成信号であることを示す判別情報を付加した音声信
号を出力することにより、合成音声信号を入力する側で
は入力音声信号が合成音声信号か人間による発生音声信
号かの判別を行うことができる。従って、音声合成の犯
罪への悪用、すなわち他人へのなりすましによる、話者
識別あるいは話者照合システムにおける詐称や、音声に
基づく科学捜査のかく乱などを未然に防止することが可
能となる。また、判別情報を合成音声信号に付加するこ
とによって、音声信号を受け取った側で、入力音声信号
が合成音声信号であるか否かを容易に判定することがで
きるようにすることである。
【0015】
【発明の実施の形態】以下、本発明の実施の形態につき
図面を参照して説明する。図2は、本発明の一実施形態
に係る音声合成装置及び合成音声判別装置の概略構成を
示すブロック図である。
【0016】音声合成装置12は、例えばパーソナルコ
ンピュータのような情報処理装置上で、CD−ROM、
フレキシブルディスクまたはメモリカードなどの記録媒
体により、あるいはネットワークなどの通信媒体により
供給される専用のソフトウエア(文音声合成ソフトウエ
ア)を実行することにより実現されるもので、入力テキ
ストから音声を生成する文音声合成(TTS)処理機能
を有している。
【0017】音声合成装置12において、文音声合成
(読み上げ)の対象となる文字列であるテキストは、テ
キストファイル11として保存されている。文音声合成
ソフトウェアに従い、テキストファイル11から漢字か
な混じりテキストが読み出されて文音声合成処理部13
に入力され、この入力テキストに対応する音声が合成さ
れる。文音声合成処理部13は大きく分けて、入力テキ
ストを解析して発音記号を生成するテキスト解析部14
と、発音記号から音声を生成する音声生成部15から構
成されている。
【0018】音声生成部15は、特定話者の声質と韻律
特徴を保存した音声辞書16を参照して該話者の特徴を
持つ音声を合成する。特定話者の声質や韻律特徴の獲得
と、音声規則合成における利用の詳細については、例え
ば、先に示した文献:X.Huang et al.“Recent Improve
ments on Microsoft's Trainable Text-To-Speech Syst
em-Whistler”. IEEE International Conference on Ac
oustics, Speech, andSignal Processing . pp.959-96
2, 1997等に記載されているので、ここでは説明を省略
する。
【0019】従来の文音声合成装置では、合成音声信号
をそのまま出力する。話者の特徴を保持した音声を合成
できる最近の音声合成装置では、その高音質な音声を悪
用した同話者への「なりすまし」を容易に許してしまう
ことは前述した通りである。
【0020】この問題を回避するため、本実施形態の音
声合成装置12では、文音声合成処理部13から出力さ
れる合成音声信号を合成音声判別情報付加部17に通
し、人間(この場合、特定話者)が発声した音声信号と
は異なることを示す判別情報を合成音声信号に付加す
る。このようにして音声合成装置12から、合成音声判
別情報付加部17により判別情報が付加された後の音声
信号18が出力され、伝送路19を経て伝送される。
【0021】合成音声判別装置20では、伝送路19を
経て入力されてきた入力音声信号が合成音声信号である
か人間による発生音声信号18であるかが判別される。
この合成音声判別装置20は、判別部21と判別結果表
示部22から構成される。判別部21では、入力音声信
号から判別情報の有無を検出し、判別情報を検出したと
き入力音声信号が合成音声信号18であると判別され、
この判別結果が判別結果表示部22で可視表示または音
声表示によって表示される。
【0022】次に、合成音声判別情報付加部17につい
て具体的に説明する。合成音声判別情報付加部17にお
いて合成音声信号に付加される判別情報は、合成音声信
号が人間による発生音声信号とは異なることを判別する
ための情報であり、種々の形態が考えられる。例えば、
ディジタル映像やディジタル音声の伝送においては、不
正コピーを防止するための「電子透かし」といわれる技
術がある。電子透かしは、基本的には画像や音声が知覚
されない範囲で直接、画像データや音声データにディジ
タル的に別の情報を付加する。もし、音声がディジタル
信号としてのみ扱われる場合は、この電子透かし技術を
利用して合成音声の判別情報を付加するようにすること
も可能である。しかし、音声はアナログ信号で伝送され
たり、空気中を伝わった後に電気信号に変換されて伝送
されるケースが多いため、判別情報はアナログ信号の伝
送や、伝送路での帯域制限、あるいは音質劣化によって
失われないものでなければならない。
【0023】そこで、本実施形態においては、合成音声
判別情報付加部17を合成音声信号の周波数特性に変更
を加える構成とする。より具体的には、合成音声判別情
報付加部17が合成音声信号に加える周波数特性の変更
は、合成音声信号の主たる周波数帯域外の周波数帯域に
おける信号パワーの変更(減衰または増大)であり、こ
れは例えば合成音声判別情報付加部17にノッチフィル
タを用いることによって実現できる。
【0024】図3は、このノッチフィルタの周波数特性
の一例であり、比較的高周波数側で非常に帯域幅の狭い
周波数帯の信号パワーを大きく減衰させる特性を有す
る。ノッチフィルタの中心周波数、すなわちノッチフィ
ルタが合成音声信号の信号パワーを減衰させる周波数帯
域の中心周波数fdは、音声信号の主たる周波数帯であ
る2〜3kHzより高い4〜5kHz程度に選定され
る。
【0025】このようなノッチフィルタを用いると、合
成音声判別情報付加処理27を通して出力される合成音
声信号は、人間の耳に知覚できる音質の劣化は小さい
が、この合成音声信号を例えば周波数分析により解析す
れば、ノッチフィルタの中心周波数fdの信号パワーが
極端に小さくなっているので、音声が機械的に合成され
たものであることが容易に判断できる。
【0026】合成音声判別装置20では、このようなノ
ッチフィルタによる特定周波数成分の信号パワーの低下
を検出することにより、入力音声信号が合成音声信号か
人間による発生音声信号かを判別する。図4は、合成音
声判別装置20における判別部21の具体的な構成例で
あり、合成音声判別情報付加部17が上記のようなノッ
チフィルタで構成される場合の例を示している。
【0027】入力音声信号である合成音声信号18は二
分岐され、一方では合成音声判別情報付加部17を構成
するノッチフィルタの中心周波数fdと同じ中心周波数
を持つバンドパスフィルタ(BPF)31を介してパワ
ー演算部32に入力され、他方ではもう一つのパワー演
算部33に直接入力される。
【0028】パワー演算部32では、合成音声信号18
のうちバンドパスフィルタ31を通過した周波数成分の
信号パワーが求められる。パワー演算部33では、合成
音声信号18の全周波数帯域の信号パワーが求められ
る。割算部34では、パワー演算部32により求められ
た周波数成分の信号パワーをパワー演算部33により求
められた全周波数帯域の信号パワーによって割り算す
る。
【0029】割算部34の割り算結果は、閾値処理部3
5により所定の閾値と比較される。閾値処理部35にお
いて割り算結果が閾値より小さければ入力音声信号は合
成音声信号であると判定され、そうでなければ人間によ
る発声音声信号であると判定される。この判定結果は、
図2の判定結果表示部22によって表示される。
【0030】次に、本発明の他の実施形態について説明
する。本実施形態における音声合成装置12及び合成音
声判別装置20の基本構成は先の実施形態と同様であ
り、図2に示した通りである。
【0031】本実施形態では、合成音声判別情報付加部
17として中心周波数が所定の時間の関数に従った変化
をするノッチフィルタが用いられる。この変化の仕方
は、文音声合成装置12のメーカ名や機種名に応じて異
ならせるものとする。例えば、図5及び図6に示すよう
に、A社のX型音声合成装置ではノッチフィルタの中止
間周波数の時間関数はF(t)であり、Y型音声合成装置
ではノッチフィルタの中止間周波数の時間関数はG(t)
と異なり、またB社のZ型音声合成装置ではノッチフィ
ルタの中心周波数の時間関数はH(t)とさらに違った変
化をする。
【0032】図7に、本実施形態における合成音声判別
装置20内の判別部21の構成を示す。図7の判別部2
1では、合成音声判別情報付加部17のノッチフィルタ
における上述した3通りの関数に従う時間変化をする中
心周波数と同じ中心周波数をそれぞれ持つバンドパスフ
ィルタ(BPF)41,42,43に、伝送路19を経
て入力された音声信号が入力される。バンドパスフィル
タ41,42,43の出力信号は平均パワー計算部4
4,45,46に入力され、発声区間内の平均パワーが
計算される。一方、バンドパスフィルタを通さない入力
音声信号の全周波数帯域の発声区間内の平均パワーが平
均パワー計算部47によって計算される。
【0033】割算部48,49,50では、平均パワー
計算部44,45,46によりそれぞれ計算されたバン
ドパスフィルタ41,42,43の出力信号の発声区間
内の平均パワーを、平均パワー計算部47により計算さ
れた入力音声信号の全周波数帯域の発声区間内の平均パ
ワーによって割り算する。これらの割算部48,49,
50の割り算結果の最小値が最小値検出部50によって
求められ、その最小値が閾値処理部52で所定の閾値と
比較されることにより、割り算結果が閾値より小さく、
かつその値が最小となる関数に対応したメーカ名及び機
種名が判別される。この場合、判別部21では図5に示
したようなメーカ名と機種名に関数F(T),G(t),H
(t)を対応付けたテーブルを持っているものとする。
【0034】判別部21の判別結果であるメーカ名及び
機種名は、図2の判定結果表示部22によって表示され
る。図6に示したいずれの関数F(T),G(t),H(t)で
も割り算の結果が閾値より小さくならなければ、入力音
声信号は人間による発生音声信号と判別され、その旨が
表示部22で表示される。
【0035】このような本実施形態によれば、入力音声
信号が合成音声信号であることを判別できるだけでな
く、その合成音声信号を生成した音声合成装置のメーカ
名及び機種名までを特定することができ、犯罪防止によ
り有効となる。
【0036】以上、本発明の実施形態について説明して
きたが、本発明は上記の実施形態に限定されるものでは
ない。例えば、上記実施形態では合成音声判別情報とし
て音声信号の特定周波数帯域における信号パワーの変更
を用いたが、人間に知覚されにくい位相情報を人間の発
声音声とは異なるように操作して合成音声判別情報とす
る方法や、時間情報(ポーズ長、音韻継続時間長、発声
時刻など)を粗く量子化する方法、例えば、発声が50
[ms]刻みの時間長に正しく収まるように(人間が正
確な時間内で発声することは不可能である)合成する方
法などを用いてもよい。また、ノッチフィルタの中心周
波数を音韻毎に変えるなどの方法も可能であり、これに
よると聴感上の劣化を目立たなくすることができる。
【0037】要するに本発明は、合成音声信号を人間の
発声に近づけることを本来の目的としている音声合成装
置において、人間が知覚しにくい範囲で合成音声信号の
一部を故意に人間の発声音声信号とは異ならせることで
合成音声信号の判別を容易にするところに主眼があり、
このような主旨を逸脱しない範囲で種々変形して実施す
ることができる。
【0038】
【発明の効果】以上説明したように、本発明によれば入
力された音声信号が合成音声信号かどうかを判別するこ
とが可能であり、音声合成の犯罪への悪用、すなわち他
人へのなりすましによる、話者識別あるいは話者照合シ
ステムにおける詐称や、音声に基づく科学捜査のかく乱
を未然に防止することができる。
【図面の簡単な説明】
【図1】音声規則合成システムの構成を示すブロック図
【図2】本発明の一実施形態に係る音声合成装置及び合
成音声判別装置の構成を示すブロック図
【図3】同実施形態における合成音声判別情報付加部に
用いるノッチフィルタの周波数特性を示す図
【図4】同実施形態における合成音声判別装置内の判別
部の構成を示すブロック図
【図5】本発明の他の実施形態における合成音声判別情
報付加部に用いるノッチフィルタの音声合成装置のメー
カ名及び機種名に対応した中心周波数の時間関数につい
て説明する図
【図6】同実施形態における合成音声判別情報付加部に
用いるノッチフィルタの種々の時間関数に対応する周波
数特性を示す図
【図7】同実施形態における合成音声判別装置内の判別
部の構成を示すブロック図
【符号の説明】
11…テキストファイル 12…音声合成装置 13…文音声合成処理部 14…テキスト解析部 15…音声生成部 16…音声辞書 17…合成音声判別情報付加部 18…合成音声信号 19…伝送路 20…合成音声判別装置 21…判別部 22…判別結果表示部

Claims (8)

    【特許請求の範囲】
  1. 【請求項1】入力される文字列に従って音声合成を行う
    ことにより生成された合成音声信号に、合成音声信号で
    あることを判別するための判別情報を付加した音声信号
    を出力することを特徴とする合成音声判別方法。
  2. 【請求項2】前記合成音声信号の周波数特性に変更を加
    えることにより、前記判別情報を該合成音声信号に付加
    することを特徴とする請求項1記載の合成音声判別方
    法。
  3. 【請求項3】前記合成音声信号に加える周波数特性の変
    更は、前記合成音声信号の主たる周波数帯域外の周波数
    帯域における信号パワーの変更であることを特徴とする
    請求項2記載の合成音声判別方法。
  4. 【請求項4】入力音声信号から前記判別情報の有無を検
    出し、該判別情報を検出したとき該入力音声信号が前記
    合成音声信号であると判別することを特徴とする合成音
    声判別方法。
  5. 【請求項5】入力される文字列に従って音声合成を行う
    ことにより合成音声信号を生成する音声合成部と、 前記合成音声信号に合成音声信号であることを判別する
    ための判別情報を付加した音声信号を出力する判別情報
    付加部とを有することを特徴とする音声合成装置。
  6. 【請求項6】入力音声信号から、請求項5に記載の音声
    合成装置において前記合成音声信号に付加された前記判
    別情報の有無を検出し、該判別情報を検出したとき該入
    力音声信号が前記合成音声信号であると判別する判別部
    と、 前記判別部の判別結果を表示する表示部とを有すること
    を特徴とする合成音声判別装置。
  7. 【請求項7】入力される文字列に従って音声合成を行う
    ことにより合成音声信号を生成する処理と、 前記合成音声信号に合成音声信号であることを判別する
    ための判別情報を付加した音声信号を出力する処理とを
    コンピュータに実行させるためのプログラム。
  8. 【請求項8】入力音声信号から合成音声信号に付加され
    た判別情報の有無を検出し、該判別情報を検出したとき
    該入力音声信号が該合成音声信号であると判別する処理
    と、該判別の結果を表示させる処理とをコンピュータに
    実行させるためのプログラム。
JP2001097158A 2001-03-29 2001-03-29 合成音声判別方法と装置及び音声合成装置 Pending JP2002297199A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2001097158A JP2002297199A (ja) 2001-03-29 2001-03-29 合成音声判別方法と装置及び音声合成装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2001097158A JP2002297199A (ja) 2001-03-29 2001-03-29 合成音声判別方法と装置及び音声合成装置

Publications (1)

Publication Number Publication Date
JP2002297199A true JP2002297199A (ja) 2002-10-11

Family

ID=18950972

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2001097158A Pending JP2002297199A (ja) 2001-03-29 2001-03-29 合成音声判別方法と装置及び音声合成装置

Country Status (1)

Country Link
JP (1) JP2002297199A (ja)

Cited By (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2005119650A1 (ja) * 2004-06-04 2005-12-15 Matsushita Electric Industrial Co., Ltd. 音声合成装置
WO2006030498A1 (ja) * 2004-09-15 2006-03-23 Telemidic, Ltd. 電子透かしシステム
JP2014511154A (ja) * 2011-03-17 2014-05-12 インターナショナル・ビジネス・マシーンズ・コーポレーション 音声変換のための方法、システム、およびコンピュータ・プログラム製品、ならびに音声変換を再構築するための方法およびシステム
WO2014199450A1 (ja) * 2013-06-11 2014-12-18 株式会社東芝 電子透かし埋め込み装置、電子透かし埋め込み方法、及び電子透かし埋め込みプログラム
WO2020071213A1 (ja) * 2018-10-05 2020-04-09 日本電信電話株式会社 音響モデル学習装置、音声合成装置、及びプログラム
JP2020086096A (ja) * 2018-11-22 2020-06-04 国立大学法人東北大学 音声対話装置および音声対話システム
JP2020528566A (ja) * 2018-06-25 2020-09-24 グーグル エルエルシー ホットワード認識音声合成
CN112767913A (zh) * 2019-10-21 2021-05-07 百度(美国)有限责任公司 支持听不见的水印的文本到语音框架

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS4895707A (ja) * 1972-03-17 1973-12-07
JPH08286692A (ja) * 1995-04-12 1996-11-01 N T T Data Tsushin Kk 話者照合方法および装置
JPH09138767A (ja) * 1995-11-14 1997-05-27 Fujitsu Ten Ltd 感情表現の通信装置
JPH10133981A (ja) * 1996-10-31 1998-05-22 Nec Eng Ltd 仮想音声電子メールシステム
JPH11190996A (ja) * 1997-08-15 1999-07-13 Shingo Igarashi 合成音声判別システム

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS4895707A (ja) * 1972-03-17 1973-12-07
JPH08286692A (ja) * 1995-04-12 1996-11-01 N T T Data Tsushin Kk 話者照合方法および装置
JPH09138767A (ja) * 1995-11-14 1997-05-27 Fujitsu Ten Ltd 感情表現の通信装置
JPH10133981A (ja) * 1996-10-31 1998-05-22 Nec Eng Ltd 仮想音声電子メールシステム
JPH11190996A (ja) * 1997-08-15 1999-07-13 Shingo Igarashi 合成音声判別システム

Cited By (15)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2005119650A1 (ja) * 2004-06-04 2005-12-15 Matsushita Electric Industrial Co., Ltd. 音声合成装置
US7526430B2 (en) 2004-06-04 2009-04-28 Panasonic Corporation Speech synthesis apparatus
WO2006030498A1 (ja) * 2004-09-15 2006-03-23 Telemidic, Ltd. 電子透かしシステム
JP2014511154A (ja) * 2011-03-17 2014-05-12 インターナショナル・ビジネス・マシーンズ・コーポレーション 音声変換のための方法、システム、およびコンピュータ・プログラム製品、ならびに音声変換を再構築するための方法およびシステム
JPWO2014199450A1 (ja) * 2013-06-11 2017-02-23 株式会社東芝 電子透かし埋め込み装置、電子透かし埋め込み方法、及び電子透かし埋め込みプログラム
CN105283916A (zh) * 2013-06-11 2016-01-27 株式会社东芝 电子水印嵌入装置、电子水印嵌入方法及电子水印嵌入程序
WO2014199450A1 (ja) * 2013-06-11 2014-12-18 株式会社東芝 電子透かし埋め込み装置、電子透かし埋め込み方法、及び電子透かし埋め込みプログラム
US9881623B2 (en) 2013-06-11 2018-01-30 Kabushiki Kaisha Toshiba Digital watermark embedding device, digital watermark embedding method, and computer-readable recording medium
JP2020528566A (ja) * 2018-06-25 2020-09-24 グーグル エルエルシー ホットワード認識音声合成
WO2020071213A1 (ja) * 2018-10-05 2020-04-09 日本電信電話株式会社 音響モデル学習装置、音声合成装置、及びプログラム
JP2020060633A (ja) * 2018-10-05 2020-04-16 日本電信電話株式会社 音響モデル学習装置、音声合成装置、及びプログラム
JP7125608B2 (ja) 2018-10-05 2022-08-25 日本電信電話株式会社 音響モデル学習装置、音声合成装置、及びプログラム
JP2020086096A (ja) * 2018-11-22 2020-06-04 国立大学法人東北大学 音声対話装置および音声対話システム
JP7106120B2 (ja) 2018-11-22 2022-07-26 国立大学法人東北大学 音声対話装置および音声対話システム
CN112767913A (zh) * 2019-10-21 2021-05-07 百度(美国)有限责任公司 支持听不见的水印的文本到语音框架

Similar Documents

Publication Publication Date Title
US12026241B2 (en) Detection of replay attack
US10475467B2 (en) Systems, methods and devices for intelligent speech recognition and processing
Gabbay et al. Visual speech enhancement
Kamble et al. Advances in anti-spoofing: from the perspective of ASVspoof challenges
US8140326B2 (en) Systems and methods for reducing speech intelligibility while preserving environmental sounds
US7676372B1 (en) Prosthetic hearing device that transforms a detected speech into a speech of a speech form assistive in understanding the semantic meaning in the detected speech
US8589167B2 (en) Speaker liveness detection
JPH02242298A (ja) 声門波形に基づく話者識別装置
Maruri et al. V-Speech: noise-robust speech capturing glasses using vibration sensors
JP2008233672A (ja) マスキングサウンド生成装置、マスキングサウンド生成方法、プログラムおよび記録媒体
Gallardo Human and automatic speaker recognition over telecommunication channels
JP2008085421A (ja) テレビ電話機、通話方法、プログラム、声質変換・画像編集サービス提供システム、および、サーバ
JP2023536270A (ja) 拡張現実におけるバイノーラル再生のためのヘッドホン等化および室内適応のためのシステムおよび方法
JP2012163692A (ja) 音声信号処理システム、音声信号処理方法および音声信号処理方法プログラム
JP2002297199A (ja) 合成音声判別方法と装置及び音声合成装置
JP3838159B2 (ja) 音声認識対話装置およびプログラム
KR20220104693A (ko) 라이브 스피치 검출
JP2007025042A (ja) 音声合成装置および音声合成プログラム
Gao Audio deepfake detection based on differences in human and machine generated speech
JP2003157100A (ja) 音声通信方法及び装置、並びに音声通信プログラム
JP2000206986A (ja) 言語情報検出装置
JP7515128B2 (ja) 耳装着型デバイス、及び、再生方法
CN108632692B (zh) 一种麦克风设备的智能控制方法及麦克风设备
Cohen Forensic Applications of Automatic Speaker Verification
JP2017068153A (ja) 半導体装置、システム、電子機器、及び、音声認識方法

Legal Events

Date Code Title Description
A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20040810

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20040914

A02 Decision of refusal

Free format text: JAPANESE INTERMEDIATE CODE: A02

Effective date: 20050517