JPH11143496A - 音声録音再生装置 - Google Patents

音声録音再生装置

Info

Publication number
JPH11143496A
JPH11143496A JP9309128A JP30912897A JPH11143496A JP H11143496 A JPH11143496 A JP H11143496A JP 9309128 A JP9309128 A JP 9309128A JP 30912897 A JP30912897 A JP 30912897A JP H11143496 A JPH11143496 A JP H11143496A
Authority
JP
Japan
Prior art keywords
sound
voice
data
external
recorded
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP9309128A
Other languages
English (en)
Inventor
Haruko Kimura
晴子 木村
Kunihiro Seno
訓啓 瀬野
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Fujifilm Business Innovation Corp
Original Assignee
Fuji Xerox Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Fuji Xerox Co Ltd filed Critical Fuji Xerox Co Ltd
Priority to JP9309128A priority Critical patent/JPH11143496A/ja
Publication of JPH11143496A publication Critical patent/JPH11143496A/ja
Pending legal-status Critical Current

Links

Landscapes

  • Electrically Operated Instructional Devices (AREA)

Abstract

(57)【要約】 【課題】 模範音声と学習者の録音音声との聞き比べを
しやすくすること。 【解決手段】 本発明の音声録音再生装置は、1つ以上
の語句から成る文に対応した音声を記憶するROM11
と、ROM11に記憶された音声と対応する外部音声を
入力して記憶するRAM12と、RAM12に記憶され
た外部音声の有音部分を検出し、検出した外部音声の有
音部分の再生タイミングと、ROM11に記憶されたそ
の外部音声と対応する音声の有音部分の再生タイミング
とを制御するCPU10とを備えている。

Description

【発明の詳細な説明】
【0001】
【発明の属する技術分野】本発明は、内部に記憶された
音声と、外部から録音した音声との再生タイミングを制
御する音声録音再生装置に関する。
【0002】
【従来の技術】従来より、外国語の学習において発音は
重要な課題であるが、この発音練習における有効な手段
として、学習者の発音と模範発音(ネイティブ発音)と
を聞き比べることがよく行われている。
【0003】図14は、この音声の聞き比べ操作の手順
を説明するフローチャートである。すなわち、先ず機械
の電源を入れ、操作者は自分の練習したい文例を選択す
る(ステップS701)。次に、操作者は、ICメモリ
等に記憶されたネイティブ等の模範音声を音声再生機器
で発音させ(ステップS702)、その音声を真似しな
がら自分で発音して、それをテープレコーダー等の音声
録音機器に録音する(ステップS703)。
【0004】次に、再度ネイティブの発音を音声再生機
器で再生し、その発音を覚え(ステップS704)、先
に録音した自分の発音を再生してアクセント等を聞き比
べる(ステップS705)。
【0005】このような発音の練習を行う装置として
は、特開昭60−123884号公報、特開平7−21
9418号公報、特開平8−195067号公報、特開
平8−278743号公報などがある。
【0006】特開昭60−123884号公報では、音
声合成LSI、録音再生LSIを用いて、学習者が自分
の音声を録音・再生する機能を持った英語学習機が開示
されている。
【0007】また、特開平7−219418号公報で
は、2つ以上の別個の音声再生プレーヤにより再生され
た相互に異なる音声信号に基づいて、各音声信号に対応
する2つの音声を同時に発生する携帯用音声発生装置等
が開示されている。
【0008】また、特開平8−195067号公報で
は、音声プログラムを再生および入力音声データを蓄積
再生可能とした記録再生装置等が開示されている。
【0009】さらに、特開平8−278743号公報で
は、模範音声の直後にこれに倣って学習者が発音した音
声を記録して、再生時には模範音声と記録された学習者
の音声を同時に再生して発音確認する記録再生装置等が
開示されている。
【0010】
【発明が解決しようとする課題】しかしながら、いずれ
の装置においても、学習者の音声を録音して再生した
り、その録音した音声と模範音声とを同時に再生するこ
とはできるものの、各々の音声の頭が揃わなかったり、
発音速度が一致しないことから比較しずらいという問題
が生じている。
【0011】
【課題を解決するための手段】本発明はこのような課題
を解決するために成された音声録音再生装置である。す
なわち、本発明の音声録音再生装置は、1つ以上の語句
から成る文に対応した音声を記憶する第1記憶手段と、
第1記憶手段に記憶された音声と対応する外部音声を入
力して記憶する第2記憶手段と、第2記憶手段に記憶さ
れた外部音声の有音部分を検出する検出手段と、検出手
段で検出した外部音声の有音部分の再生タイミングと、
第1記憶手段に記憶されたその外部音声と対応する音声
の有音部分の再生タイミングとを制御する制御手段とを
備えている。
【0012】このような本発明では、入力した外部音声
の有音部分を検出手段で検出し、その有音部分の再生タ
イミングと、第1記憶手段に記憶されたその外部音声と
対応する音声の有音部分の再生タイミングとを制御手段
で制御していることから、予め第1記憶手段に記憶され
ている音声に同期して、入力した外部音声を再生するこ
とができ、各音声の比較を行いやすいような再生を行う
ことができるようになる。
【0013】
【発明の実施の形態】以下に、本発明の音声録音再生装
置における実施の形態を図に基づいて説明する。図1は
本実施形態における音声録音再生装置のハードウェア構
成図である。すなわち、本実施形態における音声録音再
生装置1は、CPU10、ROM11、RAM12、操
作SW(スイッチ)13、ADC(アナログ/デジタル
変換器)14、ビットマップLCD(液晶表示装置)1
5、Speech.IC−L16、Speech.IC
−R17がBus(バス)によって接続された構成とな
っている。
【0014】また、ADC14にはマイク(MIC)1
9から入力された外部音声を増幅するマイクアンプ(A
MP−MIC)18が接続されている。さらに、Spe
ech.IC−L16にはAMP−L(左出力アンプ)
20が接続され、ヘッドホンスピーカー(L)31から
音声を出力するようになっている。また、Speec
h.IC−R17にはAMP−R(右出力アンプ)21
が接続され、ヘッドホンスピーカー(R)32から音声
を出力するようになっている。
【0015】CPU10は、Busを介してROM11
から所定のプログラムをフェッチし、そのプログラムに
従って音声の録音、再生等の処理を行う。
【0016】また、ROM11には、システム全体を制
御するためのプログラムの他、少なくとも1つ以上の語
句から成る文例(サンプル文章)をビットマップLCD
15に表示するための文字フォントデータ、および発音
の手本となる模範音声の音声データが記憶されている。
【0017】RAM12は、例えばマイク19から入力
された学習者の音声に基づくデータを記憶する部分であ
る。また、操作S/W13は、学習者の所望する動作
(例えば、録音や再生の選択、サンプル文章の表示、選
択)を行う。ADC14は、マイク19から入力され、
マイクアンプ18で増幅されたアナログの音声データを
デジタル音声に変換する部分である。
【0018】この変換されたデジタル音声データはBu
sを介して一旦RAM12に蓄積され、CPU10によ
ってLPCデータに変換され、再びRAM12に記憶さ
れる。このLPCデータとは、音声の強弱を表すEne
rgy、音声の高低を表すPitch、反射係数である
Kパラメータの3つで構成されている音声圧縮データで
ある。なお、ROM11に記憶される模範音声もこのL
PC形式となっている。
【0019】ビットマップLCD15は、操作S/W1
3によって選択した所望の操作内容や、サンプル文章を
ビットマップ形式で表示する部分である。
【0020】Speech.IC−L16およびSpe
ech.IC−R17は、LPCデータをアナログ音声
信号に変換する集積回路である。
【0021】ROM11に記録されている模範音声を出
力する場合は、ROM11から模範音声のLPCデータ
をBusを介して例えばSpeech.IC−L16に
転送し、ここでアナログ音声データに変換した後、AM
P−L20で増幅してヘッドホンスピーカー(L)31
から出力する。
【0022】また、記録した音声を出力する場合は、R
AM12に録音蓄積されたLPCデータをBusを介し
て例えばSpeech.IC−R17に転送し、ここで
アナログ音声データに変換した後、AMP−R21で増
幅してヘッドホンスピーカー(R)32から出力する。
【0023】なお、本実施形態では模範音声を出力する
場合にはSpeech.IC−L16、AMP−L2
0、ヘッドホンスピーカー(L)31から成る左側回路
を用い、記録した音声を出力する場合にはSpeec
h.IC−R17、AMP−R21、ヘッドホンスピー
カー(R)32から成る右側回路を用る場合を例とする
が、各々左右反対の回路を用いるようにしてもよい。
【0024】また、記録媒体として、ROM11やRA
M12を用いているが、ほかの記録媒体(ICメモリや
磁気記録媒体、光磁気記録媒体等)を用いてもよい。
【0025】図2は本実施形態における音声録音再生装
置の外観図である。音声録音再生装置1の外観として
は、サンプル文章(例えば、「Is this mot
herthere?」)を表示するビットマップLCD
15、各種操作スイッチ、マイク19、再生モード表示
ランプ15aが設けられている。
【0026】操作スイッチの中の電源スイッチ13a
は、装置全体の電源を入切するためのスイッチである。
すなわち、電源OFFの状態で電源スイッチ13aを押
すと電源ONとなり、電源ONの状態で電源スイッチ1
3aを押すと電源OFFとなる。
【0027】画面操作スイッチ13bは上下左右4個の
スイッチから構成され、これを用いてビットマップLC
D15に表示させるサンプル文章をスクロールさせ、目
的の文例を選択する。
【0028】モード選択スイッチ13cは、後述する各
種の再生モードを選択するスイッチであり、1回押す毎
に再生モードを順次切り換えられるようになっている。
また、このモード選択スイッチ13cを押す動作に連動
して、再生モード表示ランプ15aが順次切り換わり、
選択された再生モードを確認できるようになっている。
【0029】録音スイッチ13dは、マイク19から外
部の音声を録音する際に押すものであり、この録音スイ
ッチ13dが押下されている期間にマイク19から学習
者の発音した音声を録音することができる。
【0030】音声再生スイッチ13eは、画面操作スイ
ッチ13bで選択され、ビットマップLCD15に表示
されている文例をヘッドホン30のヘッドホンスピーカ
ー(L)31から出力して、模範となる音声だけを聞く
ためのスイッチである。
【0031】音声同時再生スイッチ13fは、モード選
択スイッチ13cで選択された再生モードに従って、ヘ
ッドホン30のヘッドホンスピーカー(L)31からは
模範音声を出力させ、ヘッドホンスピーカー(R)32
からは録音した学習者の音声を出力させるためのスイッ
チである。
【0032】このような音声録音再生装置1では、ヘッ
ドホンスピーカー(L)31から模範音声を出力し、ヘ
ッドホンスピーカー(R)32から学習者が録音した音
声を出力して発音の練習(聞き比べ)を行うにあたり、
CPU10で実行されるプログラムによって各々の語句
における出力タイミングを制御し、比較しやすいように
する点に特徴がある。
【0033】次に、本実施形態の音声録音再生装置1で
聞き比べを行う場合の各種再生モードの動作例を説明す
る。本実施形態の音声録音再生装置1では、主として
頭合わせ再生モード、データ長合わせ再生モード、
有音時間合わせ再生モード、有音交互再生モードを選
択できるようになっている。
【0034】ここで、各再生モードに入る前の共通の動
作を説明する。先ず、学習者は音声再生スイッチ13e
を押すことで、ビットマップLCD15に表示されてい
る文例の模範音声を聞く。続いて、録音スイッチ13d
を押し、先程聞いた模範音声を参考にして自ら発声し、
その音声をマイク19から取り込み録音する。
【0035】図3はこの録音動作を説明するフローチャ
ートである。なお、以下の説明で図3に示されない符号
は図1、2を参照するものとする。先ず、録音スイッチ
13dが押されると、CPU10は外部からの音声デー
タを記憶するRAM12の記憶開始アドレス(Save_ad
ress)をセットする(ステップS101)。
【0036】次に、所定のサンプリング時間を制御する
ためサンプリングタイマー(Sample_Timer )をセット
する(ステップS102)。そして、学習者の発音はマ
イク19を通してADC14に送られ、ここでアナログ
の音声データをデジタルに変換し(ステップS10
3)、RAM12のSave_adressにセーブされる(ステ
ップS104)。
【0037】音声データをセーブした後は、RAM12
のSave_adressをインクリメント(加算)する(ステッ
プS105)。次に、サンプリングタイマー(Sample_
Timer )が所定の時間になったか否かを調べ、所定の時
間が来るまで待機する(ステップS106)。
【0038】所定の時間になると処理が進み、録音スイ
ッチ13dがまだ押されているか否かを判定し(ステッ
プS107)、押されている場合にはステップS102
へ戻って録音を継続する。一方、録音スイッチ13dが
押されていない場合には録音が終了し、今まで録音され
た音声データ(PCM形式)がLPC形式へ変換される
(ステップS108)。LPC形式に変換された音声デ
ータはRAM12に記憶されることになる。
【0039】録音が終了すると、次に学習者はモード選
択スイッチ13cで所望の再生モードを選択し、音声同
時再生スイッチ13fを押して今録音した音声と模範音
声との聞き比べを行うことになる。
【0040】図4は再生モード選択処理を説明するフロ
ーチャートである。先ず、モード選択(ステップS20
1)で頭合わせ再生(モード)が選択された場合には
ステップS202へ進み、頭合わせデータ変換処理を実
行する。また、モード選択(ステップS201)でデー
タ長合わせ再生(モード)が選択された場合にはステ
ップS203へ進み、データ長合わせデータ変換処理を
実行する。また、モード選択(ステップS201)で有
音声時間合わせ再生(モード)が選択された場合には
ステップS204へ進み、有音声時間合わせデータ変換
処理を実行する。また、モード選択(ステップS20
1)で有音交互再生(モード)が選択された場合には
ステップS205へ進み、有音交互再生データ変換処理
を実行する。
【0041】各再生モードに対応したデータ処理を行っ
た後はステップS206へ進み、模範音声と学習者の録
音音声とを同時に再生する処理を行う。
【0042】以下、〜の各再生モードの動作を順に
説明する。
【0043】先ず、モードの動作を図5のフローチャ
ートおよび図6の音声データ例を示す図に基づいて説明
する。なお、以下の説明で図5、6に示されない符号は
図1、2を参照するものとする。
【0044】ここでは、図6(a)に示す模範音声と、
図6(b)に示す学習者の録音した音声との頭(最初の
有音部分の開始時点)を合わせをして再生できるよう処
理を行っている。
【0045】先ず、ステップS301に示す処理とし
て、ROM11に記憶されている模範音声の音声データ
における各フレームのenergy(音の大きさ)を最
初から順に参照していき、energyが0より大きく
なるまでのフレーム数(データ数)すなわち無効データ
領域のデータ数をカウントする。図6(a)の例ではデ
ータ数nとなっている。
【0046】次に、ステップS302に示す処理とし
て、先と同様なカウントで、RAM12に記憶されてい
る学習者の録音音声における各フレームのenergy
(音の大きさ)を最初から順に参照していき、ener
gyが0より大きくなるまでのフレーム数(データ数)
をカウントする。図6(b)に示す例ではデータ数mと
なっている。
【0047】次いで、ステップS303に示す処理で、
先にカウントした模範音声のデータ数nと録音音声のデ
ータ数mとを比較し、n>mならステップS304へ進
み、録音音声の頭のenergy=0の部分をn−m個
増やすようにする。
【0048】つまり、この場合は、録音音声の方が模範
音声よりn−m個分だけ早く始まるよう録音されている
ことから、その分だけ録音音声の始まりを遅くすること
で模範音声の頭と揃えることができるようになる。
【0049】一方、n>mにならない場合はステップS
305へ進み、録音音声の頭のenergy=0の部分
をm−n個減らすようにする。すなわち、この場合は、
録音音声の方が模範音声よりm−n個分遅く嵌まるよう
録音されていることから、その分だけ録音音声の始まり
を早くすることで模範音声の頭と揃えることができるよ
うになる。
【0050】図6(c)は上記の処理を行って、録音音
声の頭が模範音声の頭と揃った状態を示している。これ
により、模範音声と録音音声とを同時に再生すると、各
々の頭が揃って出力され、模範音声と録音音声との比較
を行いやすくなる。
【0051】次に、モードの動作を図7のフローチャ
ートおよび図8、9の音声データ例を示す図に基づいて
説明する。なお、以下の説明で図7、図8および図9に
示されない符号は図1、2を参照するものとする。
【0052】ここでは、図8(a)および図9(a)に
示す模範音声と、図8(b)および図9(b)に示す学
習者の録音した音声との有効データ長を合わせる処理す
なわち各々の音声の先頭位置と終了位置とを合わせるて
再生できる処理を行っている。
【0053】先ず、ステップS401に示す処理とし
て、先に説明したモードと同様に模範音声の頭と録音
音声の頭とを合わせる処理を行う。これにより、図8
(c)および図9(c)に示すように録音音声の頭が模
範音声の頭に揃えられるようになる。
【0054】次に、ステップS402に示す処理とし
て、模範音声の音声データ終了位置Nから、先頭方向へ
順にenergyを参照していき、energyが0よ
り大きくなるまでのデータ数を確認する。図8(a)お
よび図9(a)の例ではデータ数k(先頭からのフレー
ム数)となっている。この位置が模範音声の有音部分の
最後となる。
【0055】これと同様に、ステップS403に示す処
理では、録音音声の音声データ終了位置Mから、先頭方
向へ順にenergyを参照していき、energyが
0より大きくなるまでのデータ数を確認する。図8
(b)および図9(b)の例ではデータ数i(先頭から
のフレーム数)となっている。この位置が録音音声の有
音部分の最後となる。
【0056】次に、ステップS404において各々の有
音部分の最後であるデータ数iとkとを比較する。ここ
で、録音音声におけるデータ数iと模範音声におけるデ
ータ数kとが一致している場合(i=k)には、そのま
ま終了する。
【0057】また、録音音声におけるデータ数iが模範
音声におけるデータ数kより大きい場合(i>k)、ス
テップS405へ進む。ステップS405では、録音音
声の有効音声データ部を(i−k)等分し、区切られた
場所の音声データフレームを消去する。
【0058】図8(c)は頭が揃った状態で録音音声に
おけるデータ数iの方が模範音声におけるデータ数kよ
り6個分多い場合を示している。この場合は、図8
(d)に示すように録音音声の有効音声データを6等分
し、各区切り(図中×印参照)の音声データフレームを
消去して図8(e)に示すようにする。これによって、
模範音声に対して長い分だけデータが均等に間引かれ、
録音音声の有音部分の最後と模範音声の有音部分の最後
とが揃うようになる。
【0059】一方、録音音声におけるデータ数iが模範
音声におけるデータ数kより小さい場合(i<k)、ス
テップS406へ進む。ステップS406では、録音音
声の有効音声データ部を(k−i)等分し、区切られた
場所の音声データフレームを増やすようにする。
【0060】図9(c)は頭が揃った状態で録音音声に
おけるデータ数iの方が模範音声におけるデータ数kよ
り6個分短い場合を示している。この場合は、図9
(d)に示すように録音音声の有効音声データを6等分
し、各区切り(図中×印参照)の音声データフレームを
2度書きして図9(e)に示すようにする。これによっ
て、模範音声に対して短い分だけデータが均等に増やさ
れ、録音音声の有音部分の最後と模範音声の有音部分の
最後とが揃うようになる。
【0061】このように、録音音声の有音部分における
先頭位置と終了位置とを模範音声に合わせる処理を行
い、この状態で模範音声と録音音声とを同時に再生する
と、各々の頭と終わりとが揃って出力され、模範音声と
録音音声との比較を行いやすくなる。
【0062】次に、モードの動作を図10のフローチ
ャートおよび図11の音声データ例を示す図に基づいて
説明する。なお、以下の説明で図10、11に示されな
い符号は図1、2を参照するものとする。
【0063】ここでは、図11(a)に示す模範音声
と、図11(b)に示す学習者の録音した音声との各有
音データの長さを合わせる処理すなわち各々の音声の対
応する語句の出力時間を合わせて再生できる処理を行っ
ている。
【0064】先ず、ステップS501に示す処理とし
て、先に説明したモードと同様に模範音声の頭と録音
音声の頭とを合わせる処理を行う。これにより、図11
(b)に示すように録音音声の頭が模範音声の頭に揃え
られるようになる。
【0065】次に、ステップS502の処理へ進み、模
範音声の有音データのフレーム数gを無音フレームが出
るまでカウントする。同様に、次のステップS503で
は、学習者の録音音声データに対して有音データのフレ
ーム数hを無音フレームが出るまでカウントする。
【0066】次いで、ステップS504において、先に
カウントしたフレーム数gとフレーム数hとの比較を行
う。この比較でフレーム数g<フレーム数hならステッ
プS505へ進み、フレーム数g>フレーム数hならス
テップS506へ進み、フレーム数g=フレーム数hな
らステップS507へ進む。
【0067】ステップS505では、録音音声の最初の
有音データの方が模範音声の最初の有音データより長い
ことから、この長い部分を削除する処理を行う。すなわ
ち、学習者の録音音声の有音データを(g−h)等分
し、区切られた場所の音声データフレームを削除する。
【0068】図11(b)では、h−g=2であり、図
11(c)の×印で示すように2等分した位置の有音デ
ータフレームを削除して、図11(d)に示すように録
音音声の最初の有音データの長さを図11(a)に示す
模範音声の最初の有音データの長さと一致させる。
【0069】一方、ステップS506では、録音音声の
最初の有音データの方が模範音声の最初の有音データよ
り短いことから、この短い部分を追加する処理を行う。
すなわち、学習者の録音音声の有音データを(g−h)
等分し、区切られた場所の音声データフレームを2度書
きして追加する。
【0070】次に、ステップS507では、学習者の録
音音声データが終了したか否かを判断し、終了している
場合にはステップS508へ進み、ここで模範音声デー
タが終了したか否かを判断する。模範音声データが終了
している場合には処理を終了する。模範音声データが終
了していない場合にはステップS509へ進み、有音時
間合わせが出来ない旨(例えば、「有音時間合わせが不
可能です!」)をビットマップLCD15に表示する。
【0071】ステップS507で、学習者の録音音声デ
ータが終了していない場合にはステップS510へ進
む。ステップS510では、模範音声データが終了して
いるか否かの判断を行い、終了している場合にはステッ
プS509へ進んで有音時間合わせが出来ない旨の表示
を行う。
【0072】模範音声データが終了していない場合はス
テップS511へ進む。ステップS511では、模範音
声データの、先程カウントした有音部分の次の無音部分
フレームから次の有音フレームが出てくるまでの無音領
域のフレーム数iをカウントする。
【0073】次に、ステップS512では、同様に学習
者の録音音声データの、先程カウントした有音部分の次
の無音部分フレームから次の有音フレームが出てくるま
での無音領域のフレーム数jをカウントする。
【0074】そして、次のステップS513では、学習
者の録音音声データにおける無音領域のフレーム数と模
範音声データにおける無音領域のフレーム数とを合わせ
る処理を行う。この処理は、先に説明したステップS5
04、S505、S506と同様な手順でデータ長合わ
せを行う。
【0075】すなわち、先ずフレーム数iとフレーム数
jとを比較し、学習者の録音音声データのフレーム数j
の方が模範音声データのフレーム数iより長い場合に
は、その長いフレーム数だけ無音データを削除し、反対
に学習者の録音音声データのフレーム数jの方が模範音
声データのフレーム数iより短い場合には、その短いフ
レーム数だけ無音データを追加する。これにより、図1
1(e)に示すように学習者の無音領域の長さが図11
(a)に示す模範音声の無音領域の長さと一致するよう
になる。
【0076】次に、ステップS514へ進み、学習者の
録音音声データが終了したか否かの判断を行う。終了し
ていない場合はステップS515へ進み、模範音声デー
タが終了しているか否かの判断を行い、終了していない
場合はステップS502へ戻って、先に説明したステッ
プS502〜ステップS512を繰り返して行う。
【0077】これにより、図11(c)〜図11(e)
が繰り返され(図中参照)、全ての有音データについ
て模範音声の有音データとの長さが揃えられ、図11
(f)に示すようになる。
【0078】また、ステップS515で模範音声データ
が終了している場合はステップS517へ進み、有音時
間合わせが出来ない旨(例えば、「有音時間合わせが不
可能です!」)をビットマップLCD15に表示する。
【0079】また、ステップS514で学習者の録音音
声データが終了している場合にはステップS516へ進
む。ステップS516では、模範音声データが終了して
いるか否かの判断を行い、終了している場合には処理を
終了し、終了していない場合にはステップS517へ進
んで有音時間合わせが出来ない旨の表示を行う。
【0080】このような処理によって、学習者の録音音
声の各有音部分と模範音声の各有音部分との長さが一致
するようになり、この状態で模範音声と録音音声とを同
時に再生すると、各々の有音部分が揃って出力され、模
範音声と録音音声との比較を行いやすくなる。
【0081】なお、この例では学習者の録音音声の各有
音部分を模範音声の方に合わせるよう処理を行ったが、
反対に模範音声の各有音部分を学習者の録音音声の方に
合わせるよう処理を行っても同様の効果が得られる。
【0082】次に、モードの動作を図12のフローチ
ャートおよび図13の音声データ例を示す図に基づいて
説明する。なお、以下の説明で図10、11に示されな
い符号は図1、2を参照するものとする。
【0083】ここでは、図13(a)に示す模範音声の
各有音部分と、図13(b)に示す学習者の録音音声の
各有音部分とを交互に出力する処理を行っている。
【0084】先ず、ステップS601に示す処理とし
て、模範音声の有音データのフレーム数をカウントす
る。すなわち、図13(a)に示す例では、この処理に
よって最初の有音データD1のフレーム数をカウントす
ることになる。
【0085】次に、ステップS602では、次の有音デ
ータが有るか否かを判断する。有る場合にはステップS
601へ戻り、次の有音データのフレーム数をカウント
する。つまり、図13(a)に示す例では、2番目の有
音データD2のフレーム数をカウントする。
【0086】同様に、ステップS601〜S602を繰
り返すことで、模範音声の有音データD1〜D3の全て
において各々のフレーム数をカウントすることになる。
【0087】次に、ステップS603では、学習者の録
音音声における有音データのフレーム数をカウントす
る。すなわち、図13(b)に示す例では、この処理に
よって最初の有音データd1のフレーム数をカウントす
ることになる。
【0088】次に、ステップS604では、次の有音デ
ータが有るか否かを判断する。有る場合にはステップS
603へ戻り、次の有音データのフレーム数をカウント
する。つまり、図13(b)に示す例では、2番目の有
音データd2のフレーム数をカウントする。
【0089】同様に、ステップS603〜S604を繰
り返すことで、学習者の録音音声における有音データd
1〜d3の全てにおいて各々のフレーム数をカウントす
ることになる。
【0090】次に、ステップS605では、模範音声の
最初の有音データの再生を行う。すなわち、この処理に
より、図13(c)に示す模範音声の最初の有音データ
D1が再生されることになる。
【0091】次いで、ステップS606では、学習者の
録音音声における最初の有音データの再生を行う。この
処理により、図13(d)に示す学習者の録音音声にお
ける最初の有音データd1が再生される。この際、先の
ステップS605で再生した模範音声の最初の有音デー
タD1の再生終了から所定の時間S1だけ開けて学習者
の有音データd1の再生を開始するようにする。
【0092】次に、ステップS607において次の有音
データが有るか否かの判断を行う。次の有音データが無
い場合には処理終了となる。一方、次の有音データが有
る場合にはステップS608へ進む。
【0093】ステップS608では、模範音声の次の有
音データの再生を行う。すなわち、この処理により、図
13(c)に示す模範音声の次の有音データD2が再生
されることになる。この際、先のステップS606で再
生した学習者の録音音声における最初の有音データd1
の再生終了から所定の時間S2だけ開けて模範音声の有
音データd2の再生を開始するようにする。
【0094】次いで、ステップS609では、学習者の
録音音声における次の有音データの再生を行う。この処
理により、図13(d)に示す学習者の録音音声におけ
る次の有音データd2が再生される。この際、先のステ
ップS608で再生した模範音声の最初の有音データD
2の再生終了から所定の時間S1だけ開けて学習者の有
音データd2の再生を開始するようにする。
【0095】次に、ステップS610において次の有音
データが有るか否かの判断を行う。次の有音データが無
い場合には処理終了となる。一方、次の有音データが有
る場合にはステップS608〜ステップS609を繰り
返して行う。
【0096】図13に示す例では、(c)に示す模範音
声の次の有音データD3が再生され、時間S1だけ開け
て(d)に示す学習者の録音音声における次の有音デー
タd3が再生される。
【0097】このような処理によって、図13(c)
(d)に示すように、模範音声の各有音データD1〜D
3と、学習者の録音音声における各有音データd1〜d
3とが、各々交互に再生されることになる。
【0098】例えば、「Is this mother
there?」の模範音声に対し、このモードを選
択すると、模範音声「Is」、学習者の録音音声「I
s」、模範音声「this」、学習者の録音音声「th
is」、模範音声「mother」、学習者の録音音声
「mother」、模範音声「there?」、学習者
の録音音声「there?」という順でヘッドホンスピ
ーカー(L)31とヘッドホンスピーカー(R)32に
交互に出力される。
【0099】また、この交互再生において、同じ語句か
ら成る有音データの間は時間S1だけ開いて再生され、
異なる語句から成る有音データの間は時間S2だけ開い
て再生される。つまり、時間S1より時間S2をわずか
に長くすることで、同じ語句の間と異なる語句の間との
区別を付けることが可能となる。
【0100】このような再生により、語句の単位で模範
音声と学習者の発音との違いを明確に聞き比べることが
でき、模範音声との差を細かくチェックしながら練習を
行うことが可能となる。
【0101】
【発明の効果】以上説明したように、本発明の音声録音
再生装置によれば次のような効果がある。すなわち、予
め記憶された文に対応する音声と、入力した外部音声と
を再生するにあたり、各々の有音部分の再生タイミング
を制御することで、2つの音声を語句単位で聞き比べる
ことができ、より正確な発音練習を行うことが可能とな
る。
【図面の簡単な説明】
【図1】 本実施形態における音声録音再生装置のハー
ドウェア構成図である。
【図2】 本実施形態における音声録音再生装置の外観
図である。
【図3】 録音動作を説明するフローチャートである。
【図4】 再生モード選択処理を説明するフローチャー
トである。
【図5】 モードの動作を説明するフローチャートで
ある。
【図6】 モードの音声データ例を示す図である。
【図7】 モードの動作を説明するフローチャートで
ある。
【図8】 モードの音声データ例を示す図(その1)
である。
【図9】 モードの音声データ例を示す図(その2)
である。
【図10】 モードの動作を説明するフローチャート
である。
【図11】 モードの音声データ例を示す図である。
【図12】 モードの動作を説明するフローチャート
である。
【図13】 モードの音声データ例を示す図である。
【図14】 従来における音声の聞き比べ操作の手順を
説明するフローチャートである。
【符号の説明】
1…音声録音再生装置、10…CPU、11…ROM、
12…RAM、13…操作S/W、14…ADC、15
…ビットマップLCD、16…Speech.IC−
L、17…Speech.IC−R

Claims (7)

    【特許請求の範囲】
  1. 【請求項1】 1つ以上の語句から成る文に対応した音
    声を記憶する第1記憶手段と、 前記第1記憶手段に記憶された音声と対応する外部音声
    を入力して記憶する第2記憶手段と、 前記第2記憶手段に記憶された外部音声の有音部分を検
    出する検出手段と、 前記検出手段で検出した前記外部音声の有音部分の再生
    タイミングと、前記第1記憶手段に記憶された前記外部
    音声と対応する音声の有音部分の再生タイミングとを制
    御する制御手段とを備えていることを特徴とする音声録
    音再生装置。
  2. 【請求項2】 前記制御手段は、前記外部音声の有音部
    分の先頭と、前記第1記憶手段に記憶された前記外部音
    声と対応する音声の有音部分の先頭とを合わせて再生す
    ることを特徴とする請求項1記載の音声録音再生装置。
  3. 【請求項3】 前記制御手段は、前記外部音声の有音部
    分の先頭と、前記第1記憶手段に記憶された前記外部音
    声と対応する音声の有音部分の先頭とを合わせるととも
    に、前記外部音声の有音部分の終了と、前記第1記憶手
    段に記憶された前記外部音声と対応する音声の有音部分
    の終了とを合わせて再生することを特徴とする請求項1
    記載の音声録音再生装置。
  4. 【請求項4】 前記制御手段は、前記外部音声の有音部
    分が複数ある場合、各有音部分の再生時間と、前記第2
    記憶手段に記憶された前記外部音声と対応する各有音部
    分の再生時間とを各々合わせることを特徴とする請求項
    1記載の音声録音再生装置。
  5. 【請求項5】 前記制御手段は、前記外部音声の有音部
    分が複数ある場合、その各有音部分と、前記第1記憶手
    段に記憶された前記外部音声と対応する各有音部分とを
    交互に再生することを特徴とする請求項1記載の音声録
    音再生装置。
  6. 【請求項6】 請求項1記載の構成に加え、 前記外部音声を入力する際の入力時間を計測する計測手
    段と、 前記計測手段によって計測した入力時間が所定の範囲外
    となった場合に異常処理を行う異常処理手段とを備えて
    いることを特徴とする音声録音再生装置。
  7. 【請求項7】 請求項1記載の構成に加え、 前記外部音声の有音部分の塊の個数を計数する計数手段
    と、 前記計数手段によって計数した前記有音部分の塊の個数
    が所定の範囲外となった場合に異常処理を行う異常処理
    手段とを備えていることを特徴とする音声録音再生装
    置。
JP9309128A 1997-11-12 1997-11-12 音声録音再生装置 Pending JPH11143496A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP9309128A JPH11143496A (ja) 1997-11-12 1997-11-12 音声録音再生装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP9309128A JPH11143496A (ja) 1997-11-12 1997-11-12 音声録音再生装置

Publications (1)

Publication Number Publication Date
JPH11143496A true JPH11143496A (ja) 1999-05-28

Family

ID=17989242

Family Applications (1)

Application Number Title Priority Date Filing Date
JP9309128A Pending JPH11143496A (ja) 1997-11-12 1997-11-12 音声録音再生装置

Country Status (1)

Country Link
JP (1) JPH11143496A (ja)

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2001029798A1 (fr) * 1999-10-21 2001-04-26 Yoichi Tanaka Systeme de traitement audio/video et support enregistre exploitable par ordinateur sur lequel est enregistre le programme de mise en oeuvre dudit systeme
JP2002239220A (ja) * 2001-02-16 2002-08-27 Namco Ltd 遊戯情報、遊戯システム及び情報記憶媒体
JP2006178214A (ja) * 2004-12-22 2006-07-06 Yamaha Corp 語学学習装置

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2001029798A1 (fr) * 1999-10-21 2001-04-26 Yoichi Tanaka Systeme de traitement audio/video et support enregistre exploitable par ordinateur sur lequel est enregistre le programme de mise en oeuvre dudit systeme
JP2002239220A (ja) * 2001-02-16 2002-08-27 Namco Ltd 遊戯情報、遊戯システム及び情報記憶媒体
JP2006178214A (ja) * 2004-12-22 2006-07-06 Yamaha Corp 語学学習装置
JP4543919B2 (ja) * 2004-12-22 2010-09-15 ヤマハ株式会社 語学学習装置

Similar Documents

Publication Publication Date Title
JPS59220775A (ja) 母国語もしくは外国語の訓練援助装置
JP2001184100A (ja) 話速変換装置
JPH11143496A (ja) 音声録音再生装置
JP3617603B2 (ja) 音声情報の符号化方法及びその生成方法
JP2000206987A (ja) 音声認識装置
JPH0549998B2 (ja)
JP2001154684A (ja) 話速変換装置
JP3201327B2 (ja) 録音再生装置
JP2001331092A (ja) 語学学習システム
JPH0527787A (ja) 音楽再生装置
JPH0728384A (ja) 語学練習機
JP2000099308A (ja) 電子ブックプレーヤ
JP2005165120A (ja) 録音再生装置
JP2007248750A (ja) 音声再生装置
JP3267193B2 (ja) 音声読み上げ装置
JPH01265286A (ja) 語学練習器
JP2814385B2 (ja) 書写用減速再生テープレコーダー
JP3321578B2 (ja) 音声合成案内装置
JP2000162954A (ja) 言語学習装置及びこれを具備した電子機器
JPH08328575A (ja) 音声合成装置
JP2000163072A (ja) 波形再生装置のピッチ制御装置
JPS5811986A (ja) 電子音声楽器
JPH07295465A (ja) 語学学習装置
JPS63148288A (ja) 発音訓練装置
JP2001331086A (ja) 語学学習装置