JP2007248750A - 音声再生装置 - Google Patents

音声再生装置 Download PDF

Info

Publication number
JP2007248750A
JP2007248750A JP2006071181A JP2006071181A JP2007248750A JP 2007248750 A JP2007248750 A JP 2007248750A JP 2006071181 A JP2006071181 A JP 2006071181A JP 2006071181 A JP2006071181 A JP 2006071181A JP 2007248750 A JP2007248750 A JP 2007248750A
Authority
JP
Japan
Prior art keywords
word
processing
data
target word
audio
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2006071181A
Other languages
English (en)
Inventor
Koji Toriyama
康治 鳥山
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Casio Computer Co Ltd
Original Assignee
Casio Computer Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Casio Computer Co Ltd filed Critical Casio Computer Co Ltd
Priority to JP2006071181A priority Critical patent/JP2007248750A/ja
Publication of JP2007248750A publication Critical patent/JP2007248750A/ja
Pending legal-status Critical Current

Links

Images

Landscapes

  • Electrically Operated Instructional Devices (AREA)

Abstract

【課題】聞き取りにくい単語を含む音声のヒアリング学習に貢献する。
【解決手段】複数のテキストデータから再生すべき文章が指定され(ステップS1)、テキストデータ中から音声加工の対象となる対象単語が抽出される(ステップS2)。次に、実際に音声加工を行う処理単語の語数が決定され(ステップS3)、抽出された対象単語から処理単語が決定される(ステップS4)。決定された処理単語の位置に、音声合成プログラムに対応したコマンドが挿入される(ステップS5)。例えば、コマンド[!mute]をテキストデータに挿入することにより、その直後の単語を消音させることができる。次に、コマンドが挿入された後のテキストデータが音声データに変換され(ステップS6)、音声データに基づいて音声が出力される(ステップS7)。
【選択図】図3

Description

本発明は、音声を出力する音声再生装置に関する。
近年、単語や文章を音声として再生する装置が外国語のヒアリングや発音の学習等に使用されている。例えば、文章中の重要な箇所を聞き取りやすくするために、特定のキーワードを強調して発音させる装置が提案されている(例えば、特許文献1、特許文献2参照。)。
特開平10−274999号公報 特開平5−27792号公報
しかし、実際の会話では、特別に意識しない限り、発音上聞き取りにくい単語を強調することはない。また、一般的に、外国語のヒアリングが苦手な人は、全ての語句を逃さずに聞き取らなければならないという意識が強く、会話中の聞き取れない単語に執着してしまい、その結果、文章全体を把握することができなくなるという傾向にある。したがって、ヒアリング能力を高めるためには、文章中の一部の単語が聞き取れなかった場合であっても、その単語を前後の関係から推測する能力を身に付けることが重要である。
本発明は、聞き取りにくい単語を含む音声のヒアリング学習に貢献することを課題とする。
上記課題を解決するために、請求項1に記載の音声再生装置は、テキストデータを記憶するテキストデータ記憶手段と、前記テキストデータを音声データに変換する音声合成手段と、前記音声データに基づいて音声を出力する音声出力手段と、音声加工の対象となる対象単語を記憶する対象単語記憶手段と、前記テキストデータから前記対象単語を抽出する抽出手段と、前記抽出手段により抽出された対象単語に対して消音処理、音量低下処理又は雑音付加処理を行う加工手段と、を備えたことを特徴とする。
請求項4に記載の音声再生装置は、音声データ、当該音声データに含まれる各単語、及び当該各単語それぞれに対応する時間データを記憶する再生データ記憶手段と、前記音声データに基づいて音声を出力する音声出力手段と、音声加工の対象となる対象単語を記憶する対象単語記憶手段と、前記音声データに含まれる各単語から前記対象単語を抽出する抽出手段と、前記抽出手段により抽出された対象単語に対応する時間データに基づいて、前記音声データ中の対象単語に対して消音処理、音量低下処理又は雑音付加処理を行う加工手段と、を備えたことを特徴とする。
請求項1に記載の発明によれば、テキストデータから対象単語を抽出し、抽出された対象単語に対して消音処理、音量低下処理又は雑音付加処理を行うので、聞き取りにくい単語を含む音声のヒアリング学習に貢献することができる。
請求項4に記載の発明によれば、音声データに含まれる各単語から対象単語を抽出し、抽出された対象単語に対応する時間データに基づいて、音声データ中の対象単語に対して消音処理、音量低下処理又は雑音付加処理を行うので、聞き取りにくい単語を含む音声のヒアリング学習に貢献することができる。
[第1の実施の形態]
まず、本発明の第1の実施の形態における音声再生装置10について説明する。
図1に、音声再生装置10の機能的構成を示す。図1に示すように、音声再生装置10は、制御部11、液晶表示部12、キー入力部13、RAM(Random Access Memory)14、記憶装置15、音声出力部16を備え、各部はバス17により接続されている。
制御部11は、CPU(Central Processing Unit)等を備え、記憶装置15に記憶されている各種プログラムの中から指定されたプログラムを読み出し、RAM14内のワークエリアに展開し、上記プログラムとの協働によって各種処理を実行し、その処理結果をRAM14の所定の領域に格納するとともに、液晶表示部12に表示させる。そして、RAM14に格納した処理結果を記憶装置15内の指定の保存先に保存させる。
液晶表示部12は、制御部11から入力される表示信号の指示に従って、各種指示に対応する操作画面や各種処理の結果等を表示する。
キー入力部13は、文字/英数字入力キー、カーソルキー、及び各種機能キー等を備えて構成され、押下されたキーの押下信号を制御部11に出力する。
RAM14は、データが一時的に保存される記憶媒体であり、制御部11により実行されるプログラムや各処理における処理中のデータ、処理結果等を一時的に記憶するワークエリアを形成する。
記憶装置15は、磁気的、光学的記憶媒体、若しくは半導体メモリ等、制御部11で読み取り可能な記憶媒体を含み、各種処理プログラムやデータ等を記憶する。具体的には、記憶装置15には、音声再生装置10において再生される複数のテキストデータ、音声加工の対象となる対象単語データ、テキストデータを音声データに変換するための音声合成プログラムが記憶されている。
図2に、記憶装置15内の対象単語メモリ15aの例を示す。対象単語メモリ15aには、例えば、“as”、“at”、“on”、“in”、“to”、“will”等の対象単語データが記憶されている。対象単語メモリ15aには、前置詞、助詞、助動詞、接続詞等、比較的弱く発音される単語を登録しておくことが望ましい。
音声出力部16は、スピーカ等を備え、音声データに基づいて音声を出力する。
制御部11は、対象単語メモリ15aを参照して、再生すべきテキストデータから対象単語を抽出し、抽出された対象単語から実際に音声加工を行う処理単語を決定する。そして、制御部11は、テキストデータ中の処理単語に対して、単語を消音させる消音処理、単語の音量を低下させる音量低下処理、又は単語に雑音を付加する雑音付加処理を行う。
また、制御部11は、記憶装置15に記憶されている音声合成プログラムに従って、ユーザに指定された再生すべきテキストデータを音声データに変換する(TTS:Text to Speech)。すなわち、制御部11と音声合成プログラムとの協働により、音声合成手段が実現される。
第1の実施の形態において、処理単語に対する消音処理、音量低下処理又は雑音付加処理は、テキストデータ中の処理単語の位置に、音声合成プログラムにおいて処理されるコマンドを挿入することにより行う。
次に、第1の実施の形態の音声再生装置10における動作について説明する。
図3は、音声再生装置10により実行される音声再生処理Aを示すフローチャートである。
まず、記憶装置15に記憶されている複数のテキストデータが液晶表示部12に表示され、キー入力部13からの操作により、再生すべき文章が指定される(ステップS1)。
次に、指定された文章のテキストデータ中から対象単語が抽出される(ステップS2)。
ここで、図4を参照して、対象単語抽出処理を説明する。
図4に示すように、指定された文章の前方から単語が抽出される(ステップS21)。具体的には、スペースの前までが1単語として判断される。次に、抽出された単語が対象単語メモリ15aに記憶されている対象単語であるか否かが判断される(ステップS22)。
抽出された単語が対象単語メモリ15aに記憶されている対象単語である場合には(ステップS22;Yes)、その単語の位置がRAM14に保存される(ステップS23)。そして、抽出された単語が再生すべき文章の最後であるか否かが判断される(ステップS24)。
ステップS22において、抽出された単語が対象単語メモリ15aに記憶されている対象単語でない場合(ステップS22;No)、又は、ステップS24において、抽出された単語が再生すべき文章の最後でない場合には(ステップS24;No)、次の単語が抽出され(ステップS25)、ステップS22に戻る。
ステップS24において、抽出された単語が再生すべき文章の最後である場合には(ステップS24;Yes)、対象単語であると判断された全ての単語の位置情報が出力され(ステップS26)、対象単語抽出処理が終了する。
例えば、ステップS1において、“I will write to you as soon as I arrive Tokyo.”という文章が指定された場合には、“will”、“to”、“as”、“as”が抽出される。
次に、図3に示すように、処理単語の語数が決定される(ステップS3)。
ここで、図5を参照して、処理単語の語数決定処理を説明する。
液晶表示部12に表示される操作画面において、ユーザがキー入力部13から指示することにより、音声再生処理Aのレベルが設定される(ステップS31)。音声再生処理Aのレベルは、レベル1、レベル2、レベル3、レベル4の中から選択される。
レベル1が選択された場合には(ステップS32;Yes)、処理単語の語数nが1に設定される(ステップS33)。
レベル2が選択された場合には(ステップS32;No,ステップS34;Yes)、処理単語の語数nが3に設定される(ステップS35)。
レベル3が選択された場合には(ステップS32;No,ステップS34;No,ステップS36;Yes)、処理単語の語数nが5に設定される(ステップS37)。
レベル4が選択された場合には(ステップS32;No,ステップS34;No,ステップS36;No,ステップS38;Yes)、全ての対象単語が処理単語に設定される(ステップS39)。
レベル1〜レベル4のいずれも選択されていない場合には(ステップS32;No,ステップS34;No,ステップS36;No,ステップS38;No)、ステップS31に戻る。
図3に示すように、ステップS3の後、処理単語が決定される(ステップS4)。
ここで、図6を参照して、処理単語の決定処理を説明する。
ステップS1において指定された文章中に対象単語がある場合には(ステップS41;Yes)、処理単語の語数決定処理において、処理単語の語数nが1、3、5のいずれかに設定されたか否かが判断される(ステップS42)。
処理単語の語数決定処理において、処理単語の語数nが1、3、5のいずれかに設定された場合には(ステップS42;Yes)、指定された文章から抽出された対象単語の語数がnより多いか否かが判断される(ステップS43)。
指定された文章から抽出された対象単語の語数がnより多い場合には(ステップS43;Yes)、対象単語からランダムにn個の処理単語が決定される(ステップS44)。なお、学習の重要度から予め対象単語に優先順位をつけておき、優先順位の高いものから処理単語に決定することとしてもよい。
ステップS42において、処理単語の語数nが1、3、5のいずれかに設定されていない場合(ステップS42;No)、又は、ステップS43において、指定された文章から抽出された対象単語の語数がn以下の場合には(ステップS43;No)、全ての対象単語が処理単語に決定される(ステップS45)。
ステップS44又はステップS45の後、実際に音声加工の対象となる処理単語の位置情報が出力される(ステップS46)。
なお、ステップS1において指定された文章中に対象単語がない場合には(ステップS41;No)、そのまま処理が終了する。
次に、図3に示すように、決定された処理単語の位置に、音声合成プログラムに対応したコマンドが挿入される(ステップS5)。
例えば、[!mute]は、その直後の単語を消音させるためのコマンドである。“I will write to you as soon as I arrive Tokyo.”という文章中の“will”を消音させる場合には、“will”の前にコマンド[!mute]を挿入し、“I [!mute]will write to you as soon as I arrive Tokyo.”とする。
[!vol xxx]は、その直後の単語の音量を調整するためのコマンドである。通常の音量レベルを100として、“I will write to you as soon as I arrive Tokyo.”という文章中の“to”の音量を50に設定する場合には、“to”の前にコマンド[!vol 50]を挿入し、“I will write [!vol 50]to you as soon as I arrive Tokyo.”とする。
[!noise]は、その直後の単語に雑音を付加するためのコマンドである。“I will write to you as soon as I arrive Tokyo.”という文章中の“to”に雑音を付加する場合には、“to”の前にコマンド[!noise]を挿入し、“I will write [!noise]to you as soon as I arrive Tokyo.”とする。
次に、音声合成プログラムに基づいて、コマンドが挿入された後のテキストデータが音声データに変換される(音声合成処理)(ステップS6)。そして、音声出力部16により、音声データに基づいて音声が出力される(ステップS7)。
以上説明したように、第1の実施の形態における音声再生装置10によれば、再生すべきテキストデータから対象単語を抽出し、抽出された対象単語に対して消音処理、音量低下処理又は雑音付加処理を行うので、聞き取りにくい単語を含む音声のヒアリング学習に貢献することができる。
また、テキストデータ中の対象単語の位置に、音声合成プログラムにおいて処理されるコマンド([!mute]、[!vol xxx]、[!noise]等)を挿入することにより、簡単に対象単語の音声合成処理を変更することができる。
なお、第1の実施の形態では、各コマンドが、そのコマンドの直後の単語のみを加工する場合について説明したが、コマンド[!mute on]で消音開始を指定し、コマンド[!mute off]で消音終了を指定する等、消音させる期間を指定することとしてもよい。例えば、“I will write [!mute on]to[!mute off] you as soon as I arrive Tokyo.”とすることにより、“to”を消音させることができる。
同様に、コマンド[!vol xxx]で、その単語以降の音量を調整することとしてもよい。例えば、“I will write to you [!vol 30]as soon as [!vol 100]I arrive Tokyo.”とすることにより、“as soon as”に対して、音量を30に設定し、次の“I”以降は、音量を100に設定する。
また、コマンド[!speed xxx]で、その単語以降の再生速度を調整することとしてもよい。例えば、通常の速度レベルを100として、“I will write to you [!speed 150]as soon as [!speed 100]I arrive Tokyo.”とすることにより、“as soon as”に対して、速度を150に設定し、次の“I”以降は、速度を100に設定する。
また、対象単語に対して消音処理、音量低下処理又は雑音付加処理を行う代わりに、同一の単語で名詞と動詞の発音が異なる単語等の発音を変更して、発音の誤りを聞き分ける訓練に応用することとしてもよい。
[第2の実施の形態]
次に、本発明を適用した第2の実施の形態について説明する。
第2の実施の形態における音声再生装置は、第1の実施の形態に示した音声再生装置10と同様の構成によってなるため、同一の構成部分については同一の符号を付し、その構成については図示及び説明を省略する。以下、第2の実施の形態に特徴的な構成及び処理について説明する。
制御部11は、対象単語メモリ15aを参照して、再生すべきテキストデータから対象単語を抽出し、抽出された対象単語から実際に音声加工を行う処理単語を決定する。
また、制御部11は、記憶装置15に記憶されている音声合成プログラムに従って、ユーザに指定されたテキストデータを音声データに変換する。その際、制御部11は、処理単語に対応する音声データを他の音声データと置き換える。
次に、第2の実施の形態の音声再生装置における動作について説明する。
図7は、第2の実施の形態の音声再生装置により実行される音声再生処理Bを示すフローチャートである。
ステップS51〜ステップS54の処理は、第1の実施の形態の音声再生処理AにおけるステップS1〜ステップS4の処理と同様であるため、説明を省略する。
ステップS54の後、音声合成プログラムに基づいて、指定された文章のテキストデータが音声データに変換される(ステップS55)。ここで、処理単語に対応する音声データは他の音声データと置き換えられる。具体的には、処理単語を消音させる場合には、無音データに置き換えられ、処理単語の音量を低下させる場合には、音量を低下させた音声データに置き換えられ、処理単語に雑音を付加する場合には、雑音が付加された音声データに置き換えられる。なお、処理単語部分の音声の繋ぎ目を滑らかにするために、音声データを置き換える際に、フェードイン・フェードアウト処理を行ってもよい。
そして、音声出力部16により、音声データに基づいて音声が出力される(ステップS56)。
以上説明したように、第2の実施の形態における音声再生装置によれば、再生すべきテキストデータから対象単語を抽出し、抽出された対象単語に対応する音声データを他の音声データと置き換えることにより、対象単語に対して消音処理、音量低下処理又は雑音付加処理を行うので、聞き取りにくい単語を含む音声のヒアリング学習に貢献することができる。
なお、対象単語に対して消音処理、音量低下処理又は雑音付加処理を行う代わりに、対象単語を他の単語に置き換えて(例えば、前置詞の“on”を“in”に置き換える等)、文章の間違いを聞き分ける訓練に応用することとしてもよい。
[第3の実施の形態]
次に、本発明を適用した第3の実施の形態について説明する。
第3の実施の形態における音声再生装置は、第1の実施の形態に示した音声再生装置10と同様の構成によってなるため、同一の構成部分については同一の符号を付し、その構成については図示及び説明を省略する。以下、第3の実施の形態に特徴的な構成及び処理について説明する。
記憶装置15には、音声再生装置において再生される音声データ、音声データに含まれる各単語、及び各単語それぞれに対応する時間データが記憶されている。例えば、記憶装置15に、“I will write to you as soon as I arrive Tokyo.”という文章の音声データが記憶されている場合には、図8に示すように、この音声データに含まれる各単語と、各単語の再生開始からの時間データとが対応付けられて記憶されている。図8の例では、“I”は再生開始から26ms後、“will”は再生開始から125ms後、“write”は再生開始から300ms後に、各単語の音声が再生される。
また、第1の実施の形態と同様に、記憶装置15内の対象単語メモリ15aには、音声加工の対象となる対象単語データが記憶されている。
制御部11は、対象単語メモリ15aを参照して、再生すべき音声データに含まれる各単語から対象単語を抽出し、抽出された対象単語から実際に音声加工を行う処理単語を決定する。そして、制御部11は、処理単語に対応する時間データに基づいて、音声データ中の処理単語に対して消音処理、音量低下処理又は雑音付加処理を行う。
次に、第3の実施の形態の音声再生装置における動作について説明する。
図9は、第3の実施の形態の音声再生装置により実行される音声再生処理Cを示すフローチャートである。
ステップS61〜ステップS64の処理は、第1の実施の形態の音声再生処理AにおけるステップS1〜ステップS4の処理と同様であるため、説明を省略する。
ステップS64の後、記憶装置15に記憶されている音声データに含まれる各単語と時間データとの関係(図8参照)から、処理単語位置の時間データが取得される(ステップS65)。例えば、図8に示す例において、“will”が処理単語である場合には、“will”の再生開始からの時間である125msと、“will”の次の単語である“write”の再生開始からの時間である300msとが取得される。
次に、処理単語に対応する音声データが他の音声データと置き換えられる(ステップS66)。図10(a)は、“I will write to you as soon as I arrive Tokyo.”を示す音声データの例であり、図10(b)は、処理単語に対応する音声データを他の音声データと置き換えた後の音声データの例である。図10(b)に示すように、“will”を消音させる場合には、125ms〜300msの音声データを無音データ(00h)に置き換えればよい。16kHzで16bitのPCMデータの場合には、再生開始からカウントして2000〜4800サンプルのPCMデータを無音データに置き換える。
同様に、処理単語の音量を低下させる場合には、処理単語に対応する音声データが音量を低下させた音声データに置き換えられ、処理単語に雑音を付加する場合には、処理単語に対応する音声データが雑音が付加された音声データに置き換えられる。
そして、音声出力部16により、音声データに基づいて音声が出力される(ステップS67)。
以上説明したように、第3の実施の形態における音声再生装置によれば、再生すべき音声データに含まれる各単語から対象単語を抽出し、抽出された対象単語に対応する時間データに基づいて、抽出された対象単語に対応する音声データを他の音声データと置き換えることにより、対象単語に対して消音処理、音量低下処理又は雑音付加処理を行うので、聞き取りにくい単語を含む音声のヒアリング学習に貢献することができる。
なお、対象単語に対して消音処理、音量低下処理又は雑音付加処理を行う代わりに、対象単語を他の単語に置き換えたり(例えば、前置詞の“on”を“in”に置き換える等)、間違った発音の音声データと置き換えたりして、文法の間違いや発音の誤りを聞き分ける訓練に応用することとしてもよい。
[第4の実施の形態]
次に、本発明を適用した第4の実施の形態について説明する。
第4の実施の形態における音声再生装置は、第1の実施の形態に示した音声再生装置と同様の構成によってなるため、同一の構成部分については同一の符号を付し、その構成については図示及び説明を省略する。以下、第4の実施の形態に特徴的な構成及び処理について説明する。
第4の実施の形態では、第3の実施の形態と同様、記憶装置15には、音声再生装置において再生される音声データ、音声データに含まれる各単語、及び各単語それぞれに対応する時間データが記憶されている。また、第1の実施の形態と同様に、記憶装置15内の対象単語メモリ15aには、音声加工の対象となる対象単語データが記憶されている。
図11に、第4の実施の形態における音声再生装置の回路例を示す。図11に示すように、制御部11は、音声出力部16、ミュート回路18と接続されている。
音声出力部16は、アンプ16a及びスピーカ16bを備え、制御部11により出力された音声データに基づいて、音声を出力する。
ミュート回路18は、制御部11から出力されるタイミングに基づいて、音声出力部16により出力される音声を消音させる。
制御部11は、対象単語メモリ15aを参照して、再生すべき音声データに含まれる各単語から対象単語を抽出し、抽出された対象単語から実際に音声加工を行う処理単語を決定する。そして、制御部11は、処理単語に対応する時間データに基づいて、処理単語に対応する音声データが出力されるタイミングで、ミュート回路18にハイレベルの信号を出力し、処理単語に対応する音声を消音させる。
図12に、音声データと、ミュート回路18をONにするタイミングの例を示す。図12に示す例では、“I will write to you as soon as I arrive Tokyo.”の“will”が出力される期間(再生開始から125ms〜300ms)にミュート回路18がONになるため、“will”は音声として出力されない。
以上説明したように、第4の実施の形態における音声再生装置によれば、再生すべき音声データに含まれる各単語から対象単語を抽出し、抽出された対象単語に対応する時間データに基づいて、出力される対象単語の音声を消音させるので、聞き取りにくい単語を含む音声のヒアリング学習に貢献することができる。
なお、第4の実施の形態では、ミュート回路18を用いて対象単語の音声を消音させることとしたが、音声再生装置が電子ボリューム機能を備えている場合には、対象単語の音量レベルを低下させることとしてもよい。
第1〜第4の実施の形態に示した音声再生装置を使用することにより、ユーザは、ヒアリング時に文章の前後関係や文法知識から聞き取りにくい単語を判断し、一部が聞き取れないような音声でも、内容を把握する訓練を行うことができる。
なお、上記各実施の形態における記述は、本発明に係る音声再生装置の例であり、これに限定されるものではない。音声再生装置を構成する各部の細部構成及び細部動作に関しても本発明の趣旨を逸脱することのない範囲で適宜変更可能である。
上記各実施の形態では、レベルに応じて処理単語の語数を変更することとしたが、例えば、レベル1では音量80、レベル2では音量60、レベル3では音量40、レベル4では音量20に設定する等、レベルに応じて音量を変更することとしてもよい。
また、音声加工の対象となる対象単語は、前置詞、助詞、助動詞、接続詞、関係代名詞等、品詞の種類で設定可能としてもよい。また、対象単語は、文章の文頭、文末等、文章における位置で設定可能としてもよい。また、単語だけでなく、熟語単位で音声加工の対象に設定し、その一部を任意に加工することができるようにしてもよい。
第1の実施の形態における音声再生装置10の機能的構成を示すブロック図である。 記憶装置15内の対象単語メモリ15aの例を示す図である。 第1の実施の形態の音声再生装置10により実行される音声再生処理Aを示すフローチャートである。 対象単語抽出処理を示すフローチャートである。 処理単語の語数決定処理を示すフローチャートである。 処理単語の決定処理を示すフローチャートである。 第2の実施の形態の音声再生装置により実行される音声再生処理Bを示すフローチャートである。 音声データに含まれる各単語と、各単語の再生開始からの時間データの例である。 第3の実施の形態の音声再生装置により実行される音声再生処理Cを示すフローチャートである。 (a)は、音声データの例である。(b)は、処理単語に対応する音声データを他の音声データと置き換えた後の音声データの例である。 第4の実施の形態における音声再生装置の回路例である。 音声データと、ミュート回路18をONにするタイミングの例を示す図である。
符号の説明
10 音声再生装置
11 制御部
12 液晶表示部
13 キー入力部
14 RAM
15 記憶装置
15a 対象単語メモリ
16 音声出力部
17 バス
18 ミュート回路

Claims (6)

  1. テキストデータを記憶するテキストデータ記憶手段と、
    前記テキストデータを音声データに変換する音声合成手段と、
    前記音声データに基づいて音声を出力する音声出力手段と、
    音声加工の対象となる対象単語を記憶する対象単語記憶手段と、
    前記テキストデータから前記対象単語を抽出する抽出手段と、
    前記抽出手段により抽出された対象単語に対して消音処理、音量低下処理又は雑音付加処理を行う加工手段と、
    を備えたことを特徴とする音声再生装置。
  2. 前記加工手段は、前記テキストデータ中の前記抽出手段により抽出された対象単語の位置に、前記音声合成手段により処理されるコマンドを挿入することを特徴とする請求項1に記載の音声再生装置。
  3. 前記加工手段は、前記抽出手段により抽出された対象単語に対応する音声データを他の音声データと置き換えることを特徴とする請求項1に記載の音声再生装置。
  4. 音声データ、当該音声データに含まれる各単語、及び当該各単語それぞれに対応する時間データを記憶する再生データ記憶手段と、
    前記音声データに基づいて音声を出力する音声出力手段と、
    音声加工の対象となる対象単語を記憶する対象単語記憶手段と、
    前記音声データに含まれる各単語から前記対象単語を抽出する抽出手段と、
    前記抽出手段により抽出された対象単語に対応する時間データに基づいて、前記音声データ中の対象単語に対して消音処理、音量低下処理又は雑音付加処理を行う加工手段と、
    を備えたことを特徴とする音声再生装置。
  5. 前記加工手段は、前記抽出手段により抽出された対象単語に対応する音声データを他の音声データと置き換えることを特徴とする請求項4に記載の音声再生装置。
  6. 前記加工手段は、前記抽出手段により抽出された対象単語に対応する時間データに基づいて、前記音声出力手段により出力される音声を消音させることを特徴とする請求項4に記載の音声再生装置。
JP2006071181A 2006-03-15 2006-03-15 音声再生装置 Pending JP2007248750A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2006071181A JP2007248750A (ja) 2006-03-15 2006-03-15 音声再生装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2006071181A JP2007248750A (ja) 2006-03-15 2006-03-15 音声再生装置

Publications (1)

Publication Number Publication Date
JP2007248750A true JP2007248750A (ja) 2007-09-27

Family

ID=38593130

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2006071181A Pending JP2007248750A (ja) 2006-03-15 2006-03-15 音声再生装置

Country Status (1)

Country Link
JP (1) JP2007248750A (ja)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2021043306A (ja) * 2019-09-10 2021-03-18 カシオ計算機株式会社 電子機器、音声再生方法、およびプログラム
WO2023095222A1 (ja) * 2021-11-24 2023-06-01 国立大学法人 東京大学 情報処理システム、情報処理方法及びプログラム

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2021043306A (ja) * 2019-09-10 2021-03-18 カシオ計算機株式会社 電子機器、音声再生方法、およびプログラム
JP7379968B2 (ja) 2019-09-10 2023-11-15 カシオ計算機株式会社 学習支援装置、学習支援方法及びプログラム
WO2023095222A1 (ja) * 2021-11-24 2023-06-01 国立大学法人 東京大学 情報処理システム、情報処理方法及びプログラム

Similar Documents

Publication Publication Date Title
KR101826714B1 (ko) 말하기 학습 기능을 구비한 외국어 학습 시스템 및 외국어 학습 방법
US11488620B2 (en) Fast playback in media files with reduced impact to speech quality
JP3248981B2 (ja) 計算機
JP4336580B2 (ja) 認識されたテキストの一部をマークする補正装置
JP2009506356A (ja) サウンド及び手作業により転写されるテキストを同期させるシステム及び方法
AU2003200507B2 (en) Method and apparatus for rapid language acquisition
WO2011135770A1 (ja) 電子書籍装置、電子書籍再生方法、及び電子書籍再生プログラム
JP2007248750A (ja) 音声再生装置
JP2001184100A (ja) 話速変換装置
KR100695209B1 (ko) 전자책의 녹음 내용을 저장하는 이동통신 단말기 및 방법
JP3617603B2 (ja) 音声情報の符号化方法及びその生成方法
JP2007041302A (ja) 音声再生装置および音声再生処理プログラム
JP2008175851A (ja) 録音時間算出装置、発音練習装置および録音時間算出方法、発音練習処理方法、ならびにそのプログラム、電子辞書
JP2016012315A (ja) テキストデータの分かち書き単位分割プログラム及び電子図書再生装置
KR100383061B1 (ko) 디지털 오디오와 그의 캡션 데이터를 이용한 학습방법
JP4979336B2 (ja) 音声出力装置
JP4970392B2 (ja) 音声の録音と再生方法及び該方法を用いる電子辞書
KR20080113844A (ko) 전자기기에서 음성 파일 재생 방법 및 장치
JP2001331092A (ja) 語学学習システム
JP2005077678A (ja) テキスト音声同期装置およびテキスト音声同期処理プログラム
JP2001154684A (ja) 話速変換装置
JP2007256815A (ja) 音声再生装置、音声再生方法、音声再生プログラム
Neff et al. User modeling to support the development of an auditory help system
JP2005165120A (ja) 録音再生装置
JP2004133231A (ja) 外国語会話学習用記憶媒体,音出力装置及び配信装置