JP2005092021A - 話速変換方法及び話速変換装置 - Google Patents

話速変換方法及び話速変換装置 Download PDF

Info

Publication number
JP2005092021A
JP2005092021A JP2003327784A JP2003327784A JP2005092021A JP 2005092021 A JP2005092021 A JP 2005092021A JP 2003327784 A JP2003327784 A JP 2003327784A JP 2003327784 A JP2003327784 A JP 2003327784A JP 2005092021 A JP2005092021 A JP 2005092021A
Authority
JP
Japan
Prior art keywords
signal
channel
speech
speed conversion
audio
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2003327784A
Other languages
English (en)
Inventor
Mikio Oda
幹夫 小田
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Panasonic Holdings Corp
Original Assignee
Matsushita Electric Industrial Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Matsushita Electric Industrial Co Ltd filed Critical Matsushita Electric Industrial Co Ltd
Priority to JP2003327784A priority Critical patent/JP2005092021A/ja
Publication of JP2005092021A publication Critical patent/JP2005092021A/ja
Pending legal-status Critical Current

Links

Images

Landscapes

  • Stereophonic System (AREA)

Abstract

【課題】音声ステレオ信号入力時の時間ズレのない話速変換処理を行う。
【解決手段】入力されたLチャンネル、Rチャンネルの音声ステレオ信号を加算する加算器と、前記加算器でモノラル信号になった音声信号を入力とし、所定の話速変換を行う話速変換処理部と、前記話速変換処理部で話速変換処理され、出力された信号を、音声LRチャンネルにそれぞれ分配する分配器を具備し、話速変換、分配された音声LR信号をスピーカで再生する構成とし、モノラル信号で話速変換処理することで、入力された音声ステレオ信号の相互時間管理処理のアルゴリズムの追加と、余分なメモリの追加なしで、音声ステレオ信号入力時の時間ズレのない話速変換の実現を図る。
【選択図】図1

Description

本発明は、話す速度を制御する話速変換に関するものである。
昨今のテレビ放送は放送局の増加、また衛星デジタル放送の開局などで、さまざまなジャンルのプログラムを放送できるようになり、視聴者を楽しませている。しかしながらこれらのプログラムの中には、早口でしゃべるアナウンサーやタレントがおり、高齢者には聞き取れない場合がある。この課題を解決する技術として、デジタル技術の進歩により、音程を変えずに、速度のみをゆっくりとするデジタル方式の話速変換装置が提案されている(例えば特許文献1参照)。
以下図4を参照しながら、デジタル方式の話速変換装置における第1の従来技術の一例について説明する。図4において、符号10は入力された音声信号をアナログ音声信号からデジタル音声信号に変換するA/Dコンバータ、11はデジタル音声信号を話速変換する話速変換部、12は話速変換されたデジタル音声信号をアナログ音声信号に戻すD/Aコンバータ、13は入力され、デジタル変換された音声デジタル信号を一時格納するリングメモリに構成されたメモリである。
以上のように構成された話速変換装置について、その動作を説明する。入力された音声信号はA/Dコンバータ10でアナログ信号からデジタル信号に変換され、話速変換する話速変換部11に入力され、また同時にリングメモリ構成されたメモリ13に格納される。話速変換部11は入力された音声デジタル信号の無音区間の切り出し、話速変換する発音の母音切り出しなどの処理を行い、図5(a)に示す会話例「それは わたしのです」を図5(b)に示すごとく、単純に2倍の時間に話速を伸ばすとすると「そーれーはーわーたーしーのーでーすー」という具合に母音を追加して時間を延ばす処理を行う。時間を伸ばされた音声デジタル信号はD/Aコンバータ12でデジタル音声信号からアナログ音声信号に戻され、一連の話速変換処理を終了する。一方、話速変換され時間が伸ばされていくと、有限なメモリ容量であるメモリ13は、書き込みアドレスを読み出しアドレスが追い越す、いわゆるオーバーフローする可能性が出てくる。メモリ13の残量を照会しながら話速変換処理の話速変換率を決定しようとするのが従来の方式であり、逆に無音区間では保存の必要がなく、つぎの音声信号の立ち上がりで、話速変換の頭合わせを行い、オーバーフローの削減を図る。
しかしながら前記従来の構成では、音声がモノラル信号なら、話速変換することで、聞き易くなるが、昨今のテレビ放送の音声はステレオ信号が通常であり、音声ステレオ信号を話速変換する場合は従来構成のステレオ化として図6に示す2チャンネル並列を想定した場合、同期ずれの問題が考えられる。すなわち、図6の話速変換装置に、図5(c)に示す音声ステレオ信号が入力された場合の話速変換を考えると、Lチャンネル音声が時間t1で言い終わってからRチャンネル音声が時間t2で言い始める場合、話速変換すると、図5(d)に示すごとくLチャンネル音声が時間t3まで遅れたにもかかわらず、無音区間で待機していたRチャンネル音声が時間t2で話速変換を開始し、時間t2と時間t3の区間に時間オーバーラップが発生するなど同期ずれの問題があった。
この課題を解決する技術として音声ステレオ信号を加算し、加算された音声信号で無音区間を検出して、それぞれLチャンネル音声と、Rチャンネル音声の無音区間削除を行い、LチャンネルとRチャンネルの同期をとった話速変換装置が提案されている(例えば特許文献2参照)。
以下図7を参照しながら、話速変換装置における第2の従来技術の一例について説明する。図7において、符号20は映像、音声信号の記録媒体としてのハードディスクドライブ、21はハードディスクドライブ20から読み出された映像、音声データをフレーム毎に記憶するフレームメモリ、22は映像、音声信号を分離する信号分離部、23は分離された音声ステレオ信号を加算する信号加算部、24は話速変換するために、ピッチ周期を検出するピッチ周期算出部、25は1フレーム分の加算音声信号が有音区間か無音区間かを判定する区間判定部、26は区間判定部25で無音区間と判定された区間のLチャンネル音声と、Rチャンネル音声を共に削除する無音区間削除部、27はピッチ周期単位で時間軸圧縮伸張処理する時間軸圧縮伸張部、28は時間軸圧縮伸張された音声データを記憶する音声メモリ、29は音声メモリ28のデータ蓄積率を算出し、話速変換制御を行う蓄積率算出、話速制御部、30は音声メモリ28から順次読み出される音声LRデータを分離するL/R分離部、31はLR分離された音声信号のうち、Lチャンネルの音声信号をデジタルからアナログに変換するD/Aコンバータ、32はLR分離された音声信号のうち、Rチャンネルの音声信号をデジタルからアナログに変換するD/Aコンバータである。
以上のように構成された第2の従来の話速変換装置について、その動作を説明する。デジタルテレビ放送などで送られた映像信号、音声信号は復調され、ハードディスクドライブ20に記録される。記録された映像信号、音声信号はフレームメモリ21にフレーム単位で読み出され、信号分配部22で映像信号、音声信号に分離する。分離された音声LR信号は信号加算部23で順次加算され、両チャンネルの1フレーム分の音声信号が加算された時点で加算信号を出力する。区間判定部25は、加算出力された1フレーム分の信号の信号レベルを検出し、有音区間か、無音区間かを判定し、無音区間削除部26を制御し、無音区間であれば、その1フレーム分のLチャンネル音声と、Rチャンネル音声を共に削除する。このようにして、フレーム単位の同期を維持する。但し、Lチャンネル音声と、Rチャンネル音声はそれぞれ独立である。次にピッチ周期算出部24でピッチ周期を算出し、同一のピッチ周期を用いて時間軸圧縮伸張することにより、時間軸圧縮伸張後の、音声Lチャンネル、Rチャンネルの同期が維持されつつ、品質の良い時間圧縮伸張処理が可能となる。時間軸圧縮伸張された音声データは音声メモリ28に記録され、順次読み出され、音声LRデータを分離するL/R分離部30、Lチャンネルの音声信号をデジタルからアナログに変換するD/Aコンバータ31、Rチャンネルの音声信号をデジタルからアナログに変換するD/Aコンバータ32を通してアナログ2チャンネルで再生される。また音声メモリ28のデータ蓄積率を算出し、話速変換制御を行う蓄積率算出、話速制御部29は、蓄積率が少ないと無音区間を削除しないとか、逆に蓄積率が多いと、圧縮率を高くするとかの制御を行う、つまり、速聞き時の話速変換方法である。
特開平7−192392号公報 特開2002−297200号公報
しかしながら音声ステレオ信号を話速変換する場合は、前記第1の従来技術の構成のように単純に2チャンネル並列処理すると、Lチャンネル音声とRチャンネル音声に時間同期がとれず、オーバーラップ区間が発生するなど問題があり、このオーバーラップを防ぐには前記第2の従来技術の構成のように、Lチャンネル、Rチャンネルの相互時間管理処理のアルゴリズムの追加と、LR独立の音声メモリの追加が必要になる。
前記課題を解決するために、本発明の話速変換方法は、入力された複数チャンネル、例えばLチャンネル及びRチャンネルの音声ステレオ信号を加算して、モノラル信号で話速変換することを特徴としたものである。
また話速変換装置として、入力されたLチャンネル及びRチャンネルの音声ステレオ信号を加算する加算器と、前記加算器でモノラル信号になった音声信号を入力とし所定の話速変換を行う話速変換処理部と、前記話速変換処理部の出力信号をLチャンネルとRチャンネルにそれぞれ分配し音声LR信号として出力する分配器を具備し、話速変換及び分配された音声LR信号をスピーカあるいはイヤホンで再生するように構成したものである。
上記構成を備えることにより、本発明は、音声ステレオ信号の話速変換処理の場合において、時間同期がとれないことで発生するLチャンネル音声とRチャンネル音声のオーバーラップを防止できるとともに、Lチャンネル、Rチャンネルの相互時間管理処理アルゴリズムの追加及び、それに伴うメモリの追加をすることなく簡単な回路構成で話速変換が行えるものである。
(実施の形態1)
以下に、本発明の第1の実施の形態について、図1、図2を用いて説明する。
図1は、本発明の第1の実施の形態における話速変換装置の構成を示すブロック図である。図1において、符号1は、入力されたLチャンネル、Rチャンネルの音声ステレオ信号を加算する加算器、2は加算器1でモノラル信号になった音声信号を入力とし、所定の話速変換を行う話速変換処理部、3は話速変換処理部2で話速変換処理され、出力された信号を、LチャンネルとRチャンネルにそれぞれ分配し音声LR信号として出力する分配器であり、分配器3で分配された音声LR信号をLチャンネルとRチャンネルのスピーカで再生するように構成している。なお音声LR信号は、話速変換されたモノラル信号をLチャンネルとRチャンネルに同一情報を有する信号として分配したものである。
以上のように構成された話速変換装置について、その動作と各部の詳細を説明する。例えばテレビ受信機の音声再生において、Lチャンネル、Rチャンネルの音声ステレオ信号に検波された音声信号は加算器1で加算され、モノラル信号に変換される。加算器1は、例えばデジタル信号を扱うのであれば、アダーと両チャンネルのタイミングを取るラッチとで容易に構成できるし、アナログ信号を扱うのであれば、抵抗ネットワーク等を用いて容易に構成でき、複数チャンネルの音声情報を加算してモノラル信号に変換するものであればその構成は限定されない。
次に加算器1から出力されたモノラル信号を入力とし、話速変換処理部2は所定の話速変換処理をする。以下、図2を用いて話速変換処理の詳細を説明する。
今、図2(a)に示すごとく、Lチャンネル、Rチャンネルにそれぞれ、「それは わたしのです」、「いいえ かれのです」という会話があったとすると、加算器1の出力はモノラル信号に変換されることにより、図2(b)に示すごとく、「それは わたしのです いいえ かれのです」という具合に、LチャンネルとRチャンネル間での会話における時間的対応を保持したモノラル信号に変換される。
話速変換処理部2における話速変換処理は、例えばその一例を示すと、まず入力されたモノラル信号の無音区間の切り出し、話速変換する発音の母音切り出しなどの処理を行う。例えば変換比率を2倍の時間に話速変換すると仮定すると、無音区間を除いた会話の区間に母音を追加して2倍の時間に延ばす処理を行う。その処理結果を図2(c)に示す。
図2(c)の処理結果に示されるごとく、Lチャンネルの会話部分の終了時刻はt1からt3になり時間が延びている。そしてRチャンネルの会話部分の開始時刻もt2からt3にシフトされている。その結果Lチャンネルの会話部分に対してRチャンネルの会話部分がオーバーラップすることがなく、かつ会話における時間的対応も保持しつつ加速変換されたことが分かる。
次に、話速変換部1より出力された信号は、分配器3でLチャンネルとRチャンネルに音声LR信号としてそれぞれ分配される。分配器3は、デジタル信号を扱うのであれば、両チャンネルに同一音声情報を流せばよく、アナログ信号を扱うのであれば、抵抗分割等で両チャンネルに同一信号を流すように構成すればよく、当該機能を満たすものであればその構成は限定されない。
さらに、話速変換され分配された音声LR信号はスピーカ再生のための回路、例えばアンプ回路などに供給され、テレビ受信機内蔵のスピーカで再生されてテレビ視聴が可能となる。
以上のように、本発明の話速変換装置によれば、Lチャンネル、Rチャンネルの音声ステレオ信号を、単純に加算するだけの簡単な回路構成で、音声ステレオ信号入力時の時間ズレのない話速変換が実現でき聞き易いテレビ視聴が可能となる。
また、従来技術の構成のようにステレオ信号のまま話速変換を行った場合、Lチャンネル、Rチャンネルの相互時間管理処理を行う必要があるのと、余分なメモリが必要となることが予想され、話速変換処理システムが大きくなる欠点があるのに対し、本願発明のように分配されたモノラル信号である音声LR信号を再生することで、音の定位情報は損なわれるが、上記の従来技術の構成で予想されるような欠点もなく、簡単な構成で両チャンネル間での会話における時間的対応を保持した聞き易い話速変換が実現でき、例えば高齢者など早い会話を聞き取ることが困難な視聴者に対しそのメリットは大きい。
特にLR独立の話速変換処理だと、Lチャンネルの話速変換が終わった事を検出してからRチャンネルの話速変換する。そのため余分な同期取りのアルゴリズム処理時間の追加があり、それまでRチャンネルの話速変換を待たせておくというように、Lチャンネルの会話終了時とRチャンネルの会話開始時とのタイムラグが生じ、話速変換による画像とのズレが拡大してしまう。
しかし本発明の話速変換装置によれば、話速変換による両チャンネル間の無音処理は同時に行われ、例えば図2(c)に示すように、Lチャンネルの会話終了時t3に対し、Rチャンネルの会話開始時もt3となり、タイムラグがなく、よって話速変換による画像とのズレは最小に抑えることができる。すなわち、本発明の話速変換装置は、テレビジョン受像機、VTR、DVDなどの画像を伴うAV機器の話速変換において格別の効果を奏する。
なお、本実施の形態では話速変換の変換比率が2倍の場合を説明したが、変換比率はこの値に限定されることはなく、必要に応じてその値を設定すればよい。その場合、図2で示した時刻t3に相当するタイミングが変わるだけで、本願発明の作用効果は同様に奏し得るものである。
また音声ステレオ信号の2チャンネルの場合を例に説明したが、MPEG−2AAC、ドルビーデジタルなどの5.1チャンネルや、マルチチャンネルの音声信号に対しても、全音声チャンネルを加算してモノラル信号で話速変換すれば、簡単な回路構成で、時間ズレのない話速変換が実現できることは言うまでもない。
(実施の形態2)
つぎに、本発明の第2の実施の形態について、図3を用いて説明する。図3は、本発明の第2の実施の形態における話速変換装置の構成を示すブロック図である。なお、第1の実施形態と同一の構成要素に対しては同一の符合を付すこととし、説明が重複する部分は適宜省略するものとする。
図3において、符号1は、入力されたLチャンネル、Rチャンネルの音声ステレオ信号を加算する加算器、2は加算器1でモノラル信号になった音声信号を入力とし、所定の話速変換を行う話速変換処理部、3は話速変換処理部2で話速変換処理され、出力された信号を、LチャンネルとRチャンネルにそれぞれ分配し音声LR信号として出力する分配器であり、分配器3で分配された音声LR信号をLチャンネルとRチャンネルのイヤホン出力とし、スピーカでは、入力された通常のLチャンネルとRチャンネルの音声ステレオ信号を再生する構成である。
以上のように構成された話速変換装置について、その動作を説明する。テレビ受信機の音声再生において、Lチャンネル、Rチャンネルの音声ステレオ信号に検波された音声信号はそのままテレビ受像機内臓のスピーカで再生される。他方、この音声ステレオ信号は加算器1で加算され、モノラル信号に変換され、さらに話速変換処理部2で所定の話速変換がなされ、分配器3で音声LRチャンネルにそれぞれ分配され、話速変換及び分配された音声LR信号としてテレビ受信機に追加されたイヤホン端子で再生される。なお、話速変換の動作や各構成要素の詳細な説明は前述の実施の形態1で説明したのと同じなので、ここでは割愛する。
以上のような構成により、通常のLチャンネル、Rチャンネルの音声ステレオ信号は、テレビ受信機内蔵のスピーカで再生することで、通常の話速で理解できる視聴者はスピーカ再生で聞き、通常の話速についていけない高齢者などはイヤホン端子から、イヤホンで話速変換された音声信号を聞くことにより、同じテレビ受信機でのテレビ視聴が可能となり、家族団欒が楽しめる。高齢者にとっては、モノラル信号になり音の定位情報は損なわれるが、話速変換による聞き易さのメリットの方が大きい。
またイヤホン端子から話速変換信号を出力することにより、この信号を入力に利用し、赤外線などの音飛ばし機能などと併用することにより、高齢者にとって、更に快適な聞き取り易いテレビ視聴環境が整う。
またイヤホン端子出力は、スピーカ再生側とは独立の音量調整を可能とするように音量調整部を設ける構成とすることが望ましい。さらに所定の話速を保ち音程を可変する音程調整部を設けることもできる。一般に高齢者は早い話速に追従困難なだけではなく、聴取感度も低下し、かつ聴取可能な音域も狭くなっているので、イヤホン端子出力に上記のような構成を追加すれば、他の視聴者に影響を与えることなく、自ら最も聞き取りやすい設定でテレビ視聴が可能になる。
本発明に係る話速変換方法及び話速変換装置によれば、簡単な回路構成で時間ズレのない話速変換が実現でき、とりわけ、画像が映し出される場合には、画像と音声のズレを極力小さくできるので、画像を伴う話速変換に効果があり、テレビのみならずVTR、DVDなどのAV機器の話速変換においてとりわけ有用である。
本発明の第1の実施の形態における話速変換装置のブロック構成図 本発明の話速変換のタイミング説明図 本発明の第2の実施の形態における話速変換装置のブロック構成図 従来の実施例の話速変換装置のブロック構成図 従来の話速変換のタイミング説明図 本発明を使用しない従来の第1の話速変換装置のブロック構成図 本発明を使用しない従来の第2の話速変換装置のブロック構成図
符号の説明
1 加算器
2 話速変換処理部
3 分配器

Claims (3)

  1. 入力された複数チャンネルの音声信号を加算してモノラル信号に変換し、前記モノラル信号を話速変換することを特徴とする話速変換方法。
  2. 入力されたLチャンネル及びRチャンネルの音声ステレオ信号を加算する加算器と、前記加算器でモノラル信号になった音声信号を入力とし所定の話速変換を行う話速変換処理部と、前記話速変換処理部の出力信号をLチャンネルとRチャンネルにそれぞれ分配し音声LR信号として出力する分配器を具備し、前記音声LR信号をスピーカで再生する構成としたことを特徴とする話速変換装置。
  3. 入力されたLチャンネル及びRチャンネルの音声ステレオ信号を加算する加算器と、前記加算器でモノラル信号になった音声信号を入力とし所定の話速変換を行う話速変換処理部と、前記話速変換処理部の出力信号をLチャンネルとRチャンネルにそれぞれ分配し音声LR信号として出力する分配器を具備し、スピーカでは前記音声ステレオ信号を再生し、イヤホン端子では前記音声LR信号を再生する構成としたことを特徴とする話速変換装置。
JP2003327784A 2003-09-19 2003-09-19 話速変換方法及び話速変換装置 Pending JP2005092021A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2003327784A JP2005092021A (ja) 2003-09-19 2003-09-19 話速変換方法及び話速変換装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2003327784A JP2005092021A (ja) 2003-09-19 2003-09-19 話速変換方法及び話速変換装置

Publications (1)

Publication Number Publication Date
JP2005092021A true JP2005092021A (ja) 2005-04-07

Family

ID=34457554

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2003327784A Pending JP2005092021A (ja) 2003-09-19 2003-09-19 話速変換方法及び話速変換装置

Country Status (1)

Country Link
JP (1) JP2005092021A (ja)

Similar Documents

Publication Publication Date Title
JP4170808B2 (ja) 情報表示装置、情報表示方法及びプログラム
CN100505064C (zh) 声音再生装置
JP3629253B2 (ja) 音声再生装置および同装置で用いられる音声再生制御方法
KR100739355B1 (ko) 음성 재생 방법 및 음성 재생 장치
US20090150151A1 (en) Audio processing apparatus, audio processing system, and audio processing program
JP2005519537A (ja) トリック・モードで再生中の音声データの削除および消音
JP2007318604A (ja) ディジタル音声信号処理装置
WO2018173413A1 (ja) 音声信号処理装置及び音声信号処理システム
JP2013179570A (ja) 再生装置
CN100581234C (zh) 记录再现装置
US20070192089A1 (en) Apparatus and method for reproducing audio data
JP2006317768A (ja) 話速変換装置、及びこの話速変換装置を制御する話速変換プログラム
JP2005092021A (ja) 話速変換方法及び話速変換装置
JP2001290500A (ja) 話速変換装置、スピーカ装置、テレビジョン受像機
JP3550110B2 (ja) 信号処理回路および信号処理方法
JP4212253B2 (ja) 話速変換装置
JP2005352330A (ja) 音声分割記録装置
JP2006243128A (ja) 再生装置及び再生方法
JP2010093614A (ja) 映像信号再生装置
JP4551734B2 (ja) 変速再生装置及び変速再生方法
US20060008093A1 (en) Media recorder system and method
JP2005128132A (ja) 話速変換方法及び話速変換装置
JP2006041660A (ja) 話速変換方法及び話速変換装置
KR100808201B1 (ko) 음성/영상 데이터의 동기화 방법
JP2003195893A (ja) 音声再生装置及び音声再生方法

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20060810

RD01 Notification of change of attorney

Free format text: JAPANESE INTERMEDIATE CODE: A7421

Effective date: 20060913

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20090518

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20090526

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20090626

RD01 Notification of change of attorney

Free format text: JAPANESE INTERMEDIATE CODE: A7421

Effective date: 20091119

A02 Decision of refusal

Free format text: JAPANESE INTERMEDIATE CODE: A02

Effective date: 20091208