JP2003218806A - 標本化信号生成装置及び標本化信号再生装置並びにその方法 - Google Patents

標本化信号生成装置及び標本化信号再生装置並びにその方法

Info

Publication number
JP2003218806A
JP2003218806A JP2002011901A JP2002011901A JP2003218806A JP 2003218806 A JP2003218806 A JP 2003218806A JP 2002011901 A JP2002011901 A JP 2002011901A JP 2002011901 A JP2002011901 A JP 2002011901A JP 2003218806 A JP2003218806 A JP 2003218806A
Authority
JP
Japan
Prior art keywords
signal
sampling
resolution
data
original
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP2002011901A
Other languages
English (en)
Other versions
JP3974408B2 (ja
Inventor
Shuji Hashimoto
周司 橋本
Akito Sudo
明人 須藤
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Waseda University
Original Assignee
Waseda University
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Waseda University filed Critical Waseda University
Priority to JP2002011901A priority Critical patent/JP3974408B2/ja
Publication of JP2003218806A publication Critical patent/JP2003218806A/ja
Application granted granted Critical
Publication of JP3974408B2 publication Critical patent/JP3974408B2/ja
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Landscapes

  • Transmission Systems Not Characterized By The Medium Used For Transmission (AREA)
  • Signal Processing For Digital Recording And Reproducing (AREA)
  • Analogue/Digital Conversion (AREA)

Abstract

(57)【要約】 【課題】 標本化信号のデータ量を増すことなしに、そ
の標本化周波数以上の精度で原信号を忠実に復元できる
ようにする。 【解決手段】 原信号を所定の第1の分解能で標本化し
た標本化信号を提供する手段と、原信号を第1の分解能
よりも細かい第2の分解能で標本化した教師信号を提供
する手段と、標本化信号と演算する重み係数を教師信号
に基づく学習により生成するニューラルネットワークと
を具え、生成した重み係数を標本化信号に付属させて出
力する。再生装置は、標本化信号を再生する手段と、再
生された標本化信号とそれに付属する重み係数とを演算
するニューラルネットワークとを具え、第2の分解能に
対応する精度で原信号を復元する。

Description

【発明の詳細な説明】
【0001】
【発明の属する技術分野】この発明は、ニューラルネッ
トを利用してオーディオ若しくは画像等の標本化信号を
生成する装置及び前記装置にて生成した標本化信号を再
生するための装置に関し、更には、その方法に関する。
【0002】
【従来の技術】周知の通り、標本化信号fsから原信号
fを復元するに際して、標本化信号fsの標本化周期を
Tsとし、時間をtとすると、標本化定理は下記の式
(1)にて表される。
【数1】 上記式において、sin[π/Ts*(t−nTs)]
/[π/Ts*(t−nTs)は、sinc関数特性を
示しており、標本化周期Tsでサンプリングした各n番
目(−∞<n<∞)の標本値f(nTs)を、前記si
nc関数を係数として−∞から∞の間で畳み込みすれ
ば、原信号fのある時点tにおける信号f(t)を復元
することができることを示している。ところで、周知の
ように標本化定理によって標本化信号から原信号の復元
を行うと、復元された信号においては標本化周期Tsの
1/2(ナイキスト周波数)より上の波形成分はカット
されてしまう。例えば、音楽用コンパクトディスク(C
D)の場合、通常は標本化周波数約44kHzにて標本
化しているため、復元信号(つまり再生音)において略
々20kHz以上の高調波成分はカットされている。し
かしながら、例えば実際の楽器音等のオーディオ波形の
周波数スペクトラムは20kHz以上の高い成分を含ん
でおり、その高調波成分の含み具合の異なり様によって
種々の音色の違いが生じる以上、オーディオ再生音にお
いても高調波成分を含む高品質な音を再現できる方が望
ましく、未だにアナログ盤が根強い人気を保っているの
も、高調波成分を含む高品質な再生音のためといえよ
う。勿論、標本化周波数(標本化周期Ts)を高く設定
することで高周波成分を含む高品質な再生音を得ること
も可能だが、そのように細かい周期でサンプリングする
と標本化信号に必要なデータ量が膨大に増加してしま
い、莫大な記憶容量が必要となるため、例えば通常のC
D1枚に記録できる収録時間等の実質的な記憶内容量が
減少する等、種々の不都合が生じていた。従って、通常
のCDにあっては、現状のデータ量を維持したまま高周
波成分を含ませて音質の向上を図ることはできなかっ
た。
【0003】一方、元の標本化周波数を上げることなく
オーバーサンプリングして再生することにより、ナイキ
スト周波数を上げ、再生音中により高域の成分を含ませ
ることができるようにすることが知られている。すなわ
ち、前記式(1)を変形すると下記の式(2)が得ら
れ、これに基づきオーバーサンプリング再生を行う。
【数2】 式(2)において、fsは原信号fを標本化周期Tsで
サンプリングした標本化信号の標本値であり、τはTs
よりも細かい所定の周期(オーバーサンプリング周期)
であり、Tsはτの整数倍である。fs(t−nτ)
は、時刻t−nτにおける標本化信号fsの標本値を示
し、時刻t−nτがTsの整数倍のとき実質的な標本値
を持ち、それ以外のとき0である。式(2)は、標本化
周期Tsで標本化した信号fsに対して、Tsよりも細
かな周期τの分解能で畳み込み演算することを示してい
る。すなわち、標本化周期Tsの標本化信号fsに基づ
き、Tsよりも細かな周期τの分解能で、原信号fの復
元を行うことができることを示している。この畳み込み
演算は、周期τのタイミングで動作するディジタルフィ
ルタで、標本化周期Tsの標本化信号fsを処理するこ
とにより実現される。この場合、重み係数すなわちフィ
ルタ係数としては、式(2)に示すような{sin[π
*nτ/Ts]}/[π*nτ/Ts]というsinc
関数が、有限個のnに関して固定値として与えられる。
しかし、このような従来のオーバーサンプリングによる
再生にあっては、ナイキスト周波数を見かけ上高くする
ことで再生音中により高域の成分を含ませることができ
るにしても、予め固定されたsinc関数の重み付け特
性でしか畳み込み演算が行われないため、原信号fの波
形を精度よく忠実に再現するには限界があった。音楽用
CD等の物理的記憶媒体において標本化信号から原信号
を復元する場合に限らず、例えば、近年通信ネットワー
クを介して盛んに行われている音楽データや画像データ
の伝送及び再生・復元においても同様の問題がある。
【0004】
【発明が解決しようとする課題】この発明は上述の点に
鑑みてなされたもので、標本化信号のデータ量を増すこ
となしに、その標本化周波数以上の精度で原信号を忠実
に復元できるようにした標本化信号生成装置及び標本化
信号再生装置並びにその方法を提供しようとするもので
ある。
【0005】
【課題を解決するための手段】本発明の請求項1に係る
標本化信号生成装置は、原信号を所定の第1の分解能で
標本化した標本化信号を提供する手段と、前記原信号を
前記第1の分解能よりも細かい第2の分解能で標本化し
た教師信号を提供する手段と、前記標本化信号と前記教
師信号を入力し、前記標本化信号と演算する重み係数を
前記教師信号に基づく学習により生成するニューラルネ
ットワークとを具え、前記生成した重み係数を前記標本
化信号に付属させて出力することを特徴とする。教師信
号は第1の分解能よりも細かい第2の分解能で標本化し
たものなので、標本化信号よりも原信号の特性に近い高
品質なデータである。よって、教師信号に基づく学習に
より生成された重み係数は、教師信号の原信号再現精度
と同等の品質の波形を再現しうるものである。しかも重
み係数のデータ量は標本値それ自体よりもはるかに少な
い。また、標本化信号は教師信号よりも分解能が粗いの
で、教師信号に比べてはるかにデータ量が少ない。よっ
て、標本化信号とそれに付属する重み係数との組み合わ
せからなるデータセットは、教師信号の原信号再現精度
と同等の品質の波形を再現しうるものでありながら、そ
のデータ量が少なくて済む。
【0006】また、本発明の請求項2に係る標本化信号
再生装置は、請求項1の標本化信号生成装置で出力した
前記標本化信号及びそれに付属する前記重み係数に基づ
き前記原信号を復元する装置であって、前記標本化信号
を前記第1の分解能に対応する第1の周期で再生する手
段と、前記第2の分解能に対応する第2の周期に従っ
て、再生された前記標本化信号とそれに付属する前記重
み係数とを演算するニューラルネットワークとを具え、
前記第2の分解能に対応する精度で前記原信号を復元し
た出力信号が前記ニューラルネットから出力されること
を特徴とする。ここで使用する重み係数は、教師信号に
基づく学習により生成されたものであるから、教師信号
の原信号再現精度と同等の品質の波形を再現しうるもの
であり、教師信号の原信号再現性能に見合った可変の重
み付け特性で演算が行われることになり、原信号の波形
を精度よく忠実に再現することができる。
【0007】また本発明は、装置の発明として構成し実
施することができるのみならず、方法の発明として構成
し実施することもできる。
【0008】また本発明に係る記憶媒体は、原信号を所
定の第1の分解能で標本化した標本化信号と、前記原信
号を前記第1の分解能よりも細かい第2の分解能で標本
化した教師信号を用いた学習により求められた前記標本
化信号と演算すべき重み係数とを組み合わせて前記原信
号の標本化データとして記憶したことを特徴とする。更
に、本発明に係るデータ伝送方式は、信号を所定の第1
の分解能で標本化した標本化信号と、前記原信号を前記
第1の分解能よりも細かい第2の分解能で標本化した教
師信号を用いた学習により求められた前記標本化信号と
演算すべき重み係数とを組み合わせて前記原信号の標本
化データとして伝送することを特徴とする。
【0009】前記原信号を複数の区間に分割し、各区間
に対応して前記重み係数のセットをそれぞれ有するよう
にすれば好ましく、原信号の再現精度をより一層向上さ
せることができる。
【0010】
【発明の実施形態】以下、添付図面を参照して本発明の
一実施例として、楽曲のオーディオ波形を標本化した標
本化信号からの原信号復元について説明する。まず、デ
ータ供給側における必要なデータ生成処理の概略につい
て、図1の本発明の一実施例の基本的ブロック図を参照
して説明すると、図1において、10は教師付きニュー
ラルネットワーク、20は標本化信号供給源、21は教
師信号供給源、である。ニューラルネットワーク10
は、概ね、遅延ライン11と、畳み込み演算部12と、
教師付き学習部13とから構成される。詳しくは後述す
るが、このニューラルネットワーク10は、畳み込み演
算部12にてニューラルネットワーク10に対して入力
された標本化信号fsを所定の重み係数Wnで演算し、
その演算結果である出力信号yが教師信号fzと同じ信
号になるように、教師付き学習部13にて該重み係数W
nを該教師信号Fzに基づく学習により適切に変更(学
習)して、この学習により生成した重み係数Wnを前記
標本化信号fsに付属させて出力するものである。この
出力した前記重み係数Wnのデータと前記標本化信号f
sのデータを例えばCD等の記憶媒体に記憶して、デー
タ受け手に対して提供することができる。
【0011】標本化信号供給源20は、標本化周期Ts
(第1の分解能)でサンプリングした標本化信号fsを
ニューラルネットワーク10に対して供給するものであ
り、標本化信号fsの波形図の一例を示すと図1中の
(A)のようである。(A)において原信号fを点線で
示している。標本化信号fs(t)は、この原信号fを
分解能Tsで標本化した信号の、ある時点tにおけるデ
ータである。標本化信号供給源20から実践的に供給さ
れるデータとしては、例えば、復元したい楽曲のマスタ
ー音源を所定の標本化周期Ts(例えば通常のCD規格
の標本化周波数(約44kHz)等)でサンプリングし
たデータ等の任意のものを用いてよく、また、CD等に
収録された既存のデータを使用することも可能である。
教師信号供給源21は、原信号fをより精密な標本化周
期τ(第2の分解能)でサンプリングした教師信号fz
をニューラルネットワーク10に対して供給するもので
ある。教師信号fzの波形図の一例を示すと図1中の
(B)のようである。(B)においても原信号fを点線
で示している。教師信号fz(t)は、この原信号fを
分解能τで標本化した信号の、ある時点tにおけるデー
タである。教師信号fzの標本化周期τは、標本化信号
fsの標本化周期Tsの1/a倍(つまりaτ=Ts、
但しaは整数)になっており、標本化信号fsの1標本
化周期Ts中に、教師信号fzの1標本化周期τがa個
入ることとなる。つまり、教師信号fzは前記標本化信
号fsよりも精密な分解能のサンプリングデータであ
る。よって、教師信号供給源21から供給されるデータ
としては、復元したい楽曲オーディオ波形(原信号)を
標本化周期τでサンプリングした高品質なデータを用い
ることになる。というのも、この教師信号fzを範とし
て適切な重み係数Wnを生成し、この生成した重み係数
Wnと標本化信号fsを演算することで、所望の高品質
の出力信号を得ることが可能となるからである。なお、
図1中の波形図(A)及び(B)においては、一例とし
て、標本化信号fsの1標本化周期Ts中に教師信号f
zの標本化周期τが4個入っている。
【0012】遅延ライン11は複数の遅延段から構成さ
れており、図1において該複数の遅延段を遅延ライン1
1内の点線で示す。標本化信号供給源20から供給され
る標本化信号fs(t)は、この遅延ライン11に対し
て入力される。遅延ライン11はシフトコマンドCKに
よって動作制御される。このシフトコマンドCKは標本
化周期τに相当する分解能のシフトコマンドとして機能
するものであるが、実際の周期τでリアルタイムで発生
されるものではなく、ニューラルネットワーク10にお
ける学習処理プログラムの進行に応じて非リアルタイム
に発生されるものである。遅延ライン11に対して入力
された標本化信号fs(t)は、一回のシフトコマンド
CK毎に順次1段づつシフトされる。
【0013】標本化信号供給源20は、シフトコマンド
CKがa回発生する毎に、1サンプルの標本化信号fs
(t)を順次出力し、遅延ライン11に入力する。図
中、符号aCKはシフトコマンドCKがa回発生する毎
に生じる出力コマンドを示す。この出力コマンドaCK
に応じて、シフトコマンドCKのa回の発生機会のう
ち、1回で1サンプルの標本化信号fs(t)が遅延ラ
イン11に入力され、残りのa−1回では0が遅延ライ
ン11に入力される。この遅延ライン11に対する標本
化信号fs(t)の入力動作の一例について図2を参照
して説明する。ここでは仮に、シフトコマンドCKに対
応する分解能τを標本化信号fs(t)の標本化周期T
sに対して1/4(つまりTs=4τ)とする。また、
遅延ライン11に入力される最新の入力データは図にお
いて左側の遅延段11aに入力されるものとする。
【0014】シフトコマンドCKに対応する分解能τは
Ts/4であるから、標本化信号fs(t)の標本化周
期Tsの1間隔につき、シフトコマンドCKは4回発生
することになる。そのため、シフトコマンドCKの4回
の発生機会のうち、1回で1サンプルの標本化信号fs
(t)が遅延ライン11に入力され、残りの3回では0
が遅延ライン11に入力される。例えば、fs(t)に
おけるtが周期Ts毎に0,1,2,…と変化するとす
ると、実質的な値を持つ標本値は図2においてfs
(0),fs(1),fs(2),…で示され、これらは
シフトコマンドCKが4回発生する毎に1回の割で遅延
ライン11に入力される。図2において、fs(t)に
おけるtとして、1/4、2/4、3/4、のように分数で示さ
れたものは、標本化周期Tsに同期していないものを示
し、これらの値fs(1/4)、fs(2/4)、fs(3/
4)としては前述の通り「0」が入力される。具体例と
して、実質的な標本値を有する標本化信号fs(0)が
最初の遅延段11aに入力されたとき、次に1シフトコ
マンドCKが発生すると、この標本化信号fs(0)は
次の遅延段11bにシフトされ、遅延段11aには信号
fs(1/4)の入力データとして値0が入力される。次
のシフトコマンドCKが発生すると、これに応じて標本
化信号fs(0)は次の遅延段11cにシフトし、ま
た、遅延段11aの値0は次の遅延段11bにシフト
し、遅延段11aには信号fs(2/4)の入力データと
して値0が入力される。このように、1シフトコマンド
に応じて、各遅延段のデータが図において右側の次段に
順次シフトして、遅延段11aに新たなデータが入力さ
れる。次の3回目のシフトでは遅延段11aには信号f
s(3/4)の入力データとして値0が入力され、4回目
のシフトで、遅延段11aに対して実質的な標本値を有
する標本化信号fs(1)が入力される。この時、各遅
延段11a〜11eに対して、図2に示すように、11
aにfs(1)、11bに0、11cに0、11dに
0、11eにfs(0)、という具合にデータが入力さ
れていることになる。
【0015】畳み込み演算部12には、遅延ライン11
の複数の遅延段に対応する複数の係数値を1セットとす
る重み係数Wnが入力されている。畳み込み演算部12
では、前記複数の各遅延段に入力されているデータとそ
れに対応する各係数値とを乗算して、畳み込み演算す
る。この畳み込み演算については公知のため説明を省略
する。上記の通り、遅延ライン11に対して分解能τで
データが入力されるので、畳み込み演算部12から、演
算した結果として出力される出力信号y(t)も分解能
τの信号である。ここで、既述の式(1)に示したsi
nc関数を1セットの重み係数Wnの初期値Wn’とし
て設定すると、重み係数Wnは下記の式(3)のように
表現される。
【数3】 このように重み係数Wnをsinc関数で初期設定した
とき、当該ニューラルネットワーク10は既述の式
(2)と等価なシステムである。この場合、図1に例示
した各係数値W-2,W-1,W0,W1,W2は、それぞれ
下記の式(4)、式(5)、式(6)、式(7)、式
(8)のように記述される。
【数4】 式(3)にて表現されるsinc関数を図示すると図3
のようである。1セットの重み係数Wnにおける各係数
…W-2,W-1,W0,W1,W2,…は、図3に示すよう
なsinc関数においてW0を中心にしてτの分解能で
左右にプロットされる有限個の係数群からなる。ここ
で、W0=1の重み係数が付与される標本値(これをf
s(i)とする)のタイミングが現在サンプルタイミン
グであり、教師信号fz(t)としては該現在サンプル
タイミングに対応する教師信号標本値(これをfz
(i)とする) が使用される。現在サンプルタイミン
グとはシフトコマンドCK毎に進行する分解能τに対応
する精度のサンプルタイミングのことである。尚、有限
個の係数群からなる重み係数Wnの数は設計上任意に設
定してよく、例えば1000個程度でも十分によい再生
精度が得られる。
【0016】教師信号供給源21は、分解能τに対応す
る精度からなる教師信号fz(t)の標本値を、シフト
コマンドCKの発生毎に(すなわち現在サンプルタイミ
ングの進行に伴って)順次出力し、これを教師付き学習
部13に入力する。なお、例えば、標本化信号fs
(t)のi番目の時刻tの標本値fs(i)が遅延ライ
ン11で重み係数W0に対応する位置までシフトされて
きたときに、同じi番目の時刻tの教師信号標本値fz
(i)を出力するように、標本化信号供給源20と教師
信号供給源21とが同期動作する。教師信号fz(t)
は、ニューラルネットワーク10の畳み込み演算部12
から出力される出力信号y(t)が該教師信号fz
(t)と同じ信号になるような適切な重み係数Wnを設
定するための模範信号である。教師付き学習部13は、
教師信号fz(t)を模範信号とする学習により、畳み
込み演算部12から出力される出力信号y(t)が教師
信号fz(t)と同じ値になるように、重み係数Wnの
値を適切に変更する。なお、教師付き学習部13におけ
る具体的な学習アルゴリズムとしては公知又は未公開の
適宜の手法を用いてよい。
【0017】ニューラルネットワーク10に対して、原
信号fの復元したい或る範囲に対応する標本化信号fs
と教師信号fzとを順次最後まで入力して行き、入力し
た範囲について一通り学習することを、以下「1波形回
学習する」と呼ぶ。例えば、或る楽曲全体を1波形回学
習で学習させる場合は、その曲頭から曲終了までの標本
化信号をニューラルネットワーク10に対して順次入力
して行き、教師信号もそれに対応すして曲頭から曲終了
まで順次切り換えて入力して行く。畳み込み演算部12
からの出力信号y(t)と教師信号fz(t)とが各々
分解能τで教師付き学習部13に入力されることからも
明らかな通り、1波形回学習するに際して、或る1時点
tに関する学習はτ相当の分解能でなされるもので、こ
の1τ相当の学習処理を1ステップ学習と名付ける。
【0018】例えば、i番目の1ステップ学習がなされ
る場合について考えると、このとき、標本化信号fs
(t)のi番目の時刻tの標本値fs(i)が遅延ライ
ン11で重み係数W0に対応する位置までシフトされて
おり、同じi番目の時刻tの教師信号標本値fz(i)
が教師付き学習部13に入力される。遅延ライン11に
入力されている標本化信号に関して、畳み込み演算部1
2にて重み係数Wn1で畳み込み演算を行い、その演算
結果として出力信号y(i)が教師付き学習部13に対
して入力され、教師付き学習部13では、入力された教
師信号fz(i)の値に基づき、入力された畳み込み演
算部12からの出力信号y(i)が該教師信号fz
(i)の値と同じになるような適切な1セット全部の重
み係数Wn2に変更する。このように、1つの教師信号
fzの値に対応して(及びこれに対応する標本化信号の
入力設定に対応して)、1ステップ学習の学習結果とし
て重み係数Wnの1セットの値が算出される。次の1ス
テップ学習では前記重み係数Wn 2が更新されることに
なる。このように1シフトコマンドCK毎に上記の1ス
テップ学習を順次行い、各1ステップ学習毎に1セット
の重み係数Wnの値が逐次更新されて行く。このように
して順次重み係数Wnを更新して行き、復元したい所定
範囲における一番最後のステップ学習がなされた時の1
セットの重み係数Wnのデータが、当該1波形回学習に
おける学習結果として1セットの重み係数Wnとして出
力(図1に示すWn学習結果出力)されることになる。
この1波形回学習の結果として出力される重み係数Wn
は、原信号fの特性に近い高品質なデータである教師信
号fzに基づく学習により生成されたものなので、教師
信号の原信号再現精度と同等の品質の波形を再現しうる
ものである。学習処理による重み係数Wnの変化の1例
を示すと図4のようである。学習の結果、学習処理後の
重み係数Wnが初期値Wn’(sinc関数)と比較し
て変化していることが見て取れる。
【0019】実際に或る1楽曲について学習処理を行う
際は、処理対象となるオーディオ波形(原信号f)を複
数の区間に分割し、分割した複数の区間夫々について1
波形回学習を行い、その各区間に対応して前記重み係数
のセットをそれぞれ有するようにすれば好ましく、これ
により原信号fの再現精度をより一層向上させることが
できる。例えば、曲時間3分の楽曲を1波形回学習を1
分間とする3波形回の区間に区切って学習することを考
えると、この場合、曲の頭(0分)〜1分までを第1の
区間として第1の1波形回学習を行い、1分〜2分まで
を第2の区間として第2の1波形回学習を行い、2分〜
3分までを第3の区間として第3の1波形回学習を行
う。この結果、当該楽曲の再生時に使用する重み係数W
nとしては各区間毎に夫々1セットづつ、第1の区間用
として第1の重み係数Wn(1)、第2の区間用として
第2の重み係数Wn(2)、第3の区間用として第3の
重み係数Wn(3)の計3セットの重み係数Wnが得ら
れることになる。尚、1区間あたりの時間長は均一であ
る必要はなく、例えば第1の区間を40秒、第2の区間
を1分30秒、第3の区間を50秒とする等、適宜に設
定することができる。
【0020】なお、上述した1波形回学習は同じ波形
(区間)について複数回なされるようにしてもよい。す
なわち、ある波形を1波形回学習して出力された重み係
数Wnを初期値として、前記波形に関して再度1波形回
学習して、2波形回学習するようにしてもよく、同様に
して、3波形回学習、4波形回学習…というように1波
形回学習を重ねて行ってもよい。このように1波形回学
習を同じ波形について複数回行うことで、重み係数Wn
の原信号復元能力を向上させることができる。
【0021】上述の学習処理により生成した重み係数の
データは標本化信号fsに付属して出力される。この出
力の形態としては例えばCDのような物理的記憶媒体に
記録する形態がある。そのような出力形態をとる場合、
本発明に従って生成された標本化信号と重み係数との組
み合わせからなるデータを記録したCD等の物理的記憶
媒体が、一般ユーザ等のデータ受け手に供給される。こ
のようにして出力される、本発明に従って生成された標
本化信号と重み係数との組み合わせからなるデータの構
成例について図5により説明する。図5は、本発明に従
って生成された標本化信号fsと重み係数Wnとの組み
合わせからなる標本化データの構成例を示すもので、楽
曲データからなる原信号を複数区間(上記の例では3区
間)に分割して各区間毎に重み係数を学習・生成し、こ
れを標本化信号に組み合わせてCDのような記録媒体に
記録した例を示す。このデータフォーマットは、当該楽
曲データの再生に必要な制御情報等を記録するヘッダ部
と、再生する楽曲(原信号f)を標本化周期Tsで標本
化した標本化信号fsを時系列的に記録したオーディオ
データ記録部とを含む。ヘッダ部には、標本化信号fs
の標本化周期Tsを指示するデータ及びそれより細かな
標本化周期τを指示するデータと、各区間(第1〜第3
の区間)にそれぞれ対応する重み系数Wn(1)〜
(3)及び各区間の継続時間を示す時間間隔データT
(1)〜(3)とが記録されている。時間間隔データT
(1)が第1の区間に対応し、時間間隔データT(2)
が第2の区間に対応し、時間間隔データT(3)が第3
の区間に対応する。この時間間隔データT(1)〜
(3)により指示される時間に応じて、それぞれ該当す
る重み系数Wn(1)〜(3)を使用し、また、その切
り換え時期を制御することとなる。なお、図5に示すよ
うな全部の重み系数Wn(1)〜(3)と時間間隔デー
タT(1)〜(3)とをヘッダに一括して纏めて記録す
るのに限らず、第1の区間に当たる重み系数Wn(1)
と時間間隔データT(1)のみヘッダ部に記憶して、重
み系数Wn(2)、Wn(3)と時間間隔データT
(2)、T(3)については、それぞれの先行区間にお
けるオーディオデータ中(例えばCDフォーマットのサ
ブコード領域等)に適宜分散して織り込み、該先行区間
の再生中に後続区間の重み系数Wnと時間間隔データT
を読み出して行くようにしてもよい。
【0022】例えば、標本化信号fsの標本化周波数を
従来のCD規格と同様に44.1kHzとすると、標本
化信号fsのデータ量は、たった1秒間に必要なデータ
量(サンプル数)だけでも44100個に及ぶが、1波
形回学習分の1セットの重み係数Wnのデータ量は1セ
ットに付き例えば1000個程度でよい。このことから
1波形回学習分の重み係数Wnとして必要なデータ量が
極めて微量なものであることが判る。従って、重み係数
Wnのデータを標本化信号fsに付属させても、復元に
要するデータ量の総量は殆ど増加しない。このように、
標本化信号fsとそれに付属する重み係数Wnとの組み
合わせからなるデータセットは、教師信号fzの原信号
再現精度と同等の品質の波形を再現しうるものでありな
がら、そのデータ量が少なくて済む。
【0023】なお、本発明に従って生成された標本化信
号と重み係数との組み合わせからなるデータの出力形
態、すなわちデータ供給の方式は、上記のように物理的
記憶媒体による限りではなく、例えば、インターネット
等の通信回線を経由してデータを伝送するようにしても
よい。その場合、データ受け手では、インターネット等
の通信回線を経由して受信したデータを自己のメモリ内
に保存すればよい。
【0024】次に、CD等に収録された或いは通信回線
を経由して伝送された前記標本化データの再生処理につ
いて図6を参照して説明する。図6に示すように、再生
処理側(データ受け手側)は、ニューラルネットワーク
30と、標本化信号再生装置40とを有する。ニューラ
ルネットワーク30は、図1のニューラルネットワーク
10内の遅延ライン11及び畳み込み演算部12と同様
の遅延ライン31及び畳み込み演算部32を有するが、
学習手段は不要である。
【0025】図6において、標本化信号再生装置40に
は、上述したような標本化周期Tsの標本化信号fsと
重み係数Wnとの組み合わせからなる標本化データが、
CD等の記録媒体で或いは通信回線を経由して供給され
る。標本化信号再生装置40は、まず供給された標本化
データのヘッダ部のデータを読み取り、該ヘッダ部にあ
る各標本化周期Ts、τを指示するデータに基づき、各
標本化周期Ts及びτに対応するクロックを生成する。
また、該ヘッダ部にある最初の区間の重み係数Wnを読
み取ってニューラルネットワーク30の畳み込み演算部
32に入力し、該畳み込み演算部32における重み係数
Wnを設定する。このように初期設定を行った上で、オ
ーディオデータ部にある標本化信号fsの再生読み出し
を開始する。
【0026】前述の通り、標本化信号再生装置40で再
生される標本化信号fsは、比較的粗い標本化周期Ts
で標本化されたデータである。再生装置40からの標本
化信号fs(t)の再生読み出しは、標本化周期Tsに
対応するタイミングで1サンプルづつ順次なされる。再
生装置40から読み出された標本化信号fs(t)は、
ニューラルネットワーク30の遅延ライン31に入力さ
れる。遅延ライン31には、再生装置40から細かい周
期τのクロックがシフトクロックとしてリアルタイムに
供給される。遅延ライン31では、再生装置40から入
力される標本化信号fs(t)を周期τのタイミングで
取り込み、周期τ毎に順次シフト(遅延)する。図1の
遅延ライン11と同様に、遅延ライン31では、標本化
周期Tsに同期する周期τのタイミングで標本化信号f
s(t)の実質的な標本値を取り込み、それ以外の周期
τのタイミングでは0を取り込む。図中、符号Ts・τ
は、標本化周期Tsに同期する周期τのタイミングを示
す。図6中の(A)は、再生装置40から読み出される
標本化信号fs(t)の一例を示し、標本化周期Tsに
同期する周期τのタイミングで実質的な標本値が再生出
力され、それ以外の周期τのタイミングでは0値が出力
される。例えば、標本化信号fsの標本化周波数(周期
Ts)を1とし、これに対してクロックτの周波数(周
期τ)が4として、ある1つの標本値をSとする。クロ
ックτの1クロックに応じて、遅延ライン31のある1
つの遅延段がSを取り込んだとすると、この遅延段は、
その後のτの3クロックでは、入力データとして0を取
り込む、という具合になる。
【0027】畳み込み演算部32は、再生装置40から
供給された前記重み係数Wnで遅延ライン31に順次入
力されるデータを、クロックτに対応する周期τに従っ
て、畳み込み演算し、その演算結果y(i)を周期τ毎
に出力する。畳み込み演算部32から演算結果として出
力される信号y(i)は、図6中の(B)に示すよう
な、周期τの細密な信号となる。こうして、この周期τ
に対応する精度で出力信号y(i)がニューラルネット
ワーク30から出力されることとなる。ここで、畳み込
み演算部32に供給された重み係数Wnは、上述の通り
教師信号fzの原信号再現精度と同等の品質の波形を再
現しうるものであり、このような重み係数Wnによる重
み付け特性で演算を行うことで、原信号fの波形を前記
教師信号に匹敵する高精度で忠実に再現した出力信号y
(i)が得られる。
【0028】図7に、本発明により復元した信号と従来
の方法により復元した信号とを比較したスペクトル分布
例を示す。図において横軸に周波数をとり、縦軸を振幅
とし、また波形信号成分はスペクトルエンベロープで表
しており、1/Tsは標本化周期Tsに対応する標本化
周波数である。従来の方式では、図において点線で示す
標本化周波数1/Tsの半分の周波数(ナイキスト周波
数)1/2Tsを上限としてそれ以上の波形成分はカッ
トされてしまい再現されなかったが、本発明によれば、
標本化信号fsの標本化周波数1/Tsを上げることな
くデータ量を殆ど増すことなしに、そのような従来再現
されていなかった高周波成分を含む原信号fの波形を精
度よく忠実に再現できる。例えば、本発明によれば、通
常のCD規格による標本化周波数約44kHzで標本化
した標本化信号でも、再生時に使用する重み係数を教師
信号に基づく学習により生成することで、従来カットさ
れていた約20kHz以上の高周波成分を含む高品質な
再生信号の出力が可能となり、更に原信号fの波形を精
度よく忠実に再現した高品質な音楽再生ができる。
【0029】上述した実施例においては、ニューラルネ
ットワーク10,30として1段のみから構成される単
層型ニューラルネットワークを用いた例を示したが、こ
れに限らず、ニューラルネットワークを多段にして非線
形処理を行える多層型ニューラルネットワークを用いれ
ば、更なる原信号復元能力の向上が可能となる。なお、
入力する標本化信号のサンプリング間隔は、等間隔にな
されて良いが、本発明においては、サンプリング間隔を
不等間隔にしてもよい。また、本実施例の別の一実施形
態としては、本発明をMPGやMP3等の適宜のデータ
圧縮方式と組み合わせて実施してもよい。すなわち、重
み係数Wnと標本化信号fsとを組み合わせて標本化デ
ータとして伝送する際、或いは記憶媒体に記録する際、
前記標本化信号fsをMPGやMP3或いはDPCMや
ADPCM等の適宜のデータ圧縮方式で圧縮し、この圧
縮された標本化信号データを重み係数Wnと共に標本化
データとして伝送する、或いは記憶媒体に記録する。そ
して、この標本化データの再生時に、圧縮された標本化
信号データの圧縮を解除してから、重み係数Wnと演算
すればよい。本実施例の更に別の例としては、1波形回
学習の時間間隔を極短くとることで学習に要する時間を
短くし、送信側でリアルタイムにピックアップしたオー
ディオ信号に基づき本実施例に従って標本化信号fsと
重み係数Wnをリアルタイムに生成し、これを通信回線
等を介して伝送し、受信側で本実施例に従って再生する
ことで、学習から再生までをリアルタイムに近い形で行
うことも可能となる。
【0030】上述の実施例においては、主にCD等のオ
ーディオ波形データの復元について説明したが、本発明
はそれに限らず、例えば画像データ等にも応用可能であ
る。画像データの場合、画素数の粗い画像データから画
素数の細かい高精度な画像データを復元できる。また、
画像拡大時の補間処理に本発明を適用すれば、拡大した
画像が元の画像よりも細かな精度で生成される。また、
動画データのコマ数補間処理に本発明を適用すれば、元
の動画データのコマ数(フレーム数)よりも多くのコマ
数を補間生成することができ、元の動画よりも滑らかな
動きの動画を再生することができる。
【0031】
【発明の効果】以上の通り本発明によれば、標本化信号
のデータ量を増すことなしに、その標本化周波数以上の
精度で原信号を忠実に復元できるようにした標本化信号
生成装置及び標本化信号再生装置並びにその方法を提供
することができるという優れた効果を奏する。
【図面の簡単な説明】
【図1】 本発明に係る一実施例を示すデータ供給側の
基本的なブロック図。
【図2】 同実施例において、遅延ラインに対して入力
される標本化信号の入力動作を示す概念図。
【図3】 同実施例において、重み係数の初期値として
設定したsinc関数の特性と各係数値を示す図。
【図4】 図3に示すsinc関数(初期値)からの学
習後の重み係数値の変化を示す図。
【図5】 同実施例に係る学習処理の別の例として、原
信号を複数区間に分割した場合のデータ構成例を示す
図。
【図6】 同実施例に係るデータ受け手側の基本的なブ
ロック図。
【図7】 本発明により復元した信号と従来の方法によ
り復元した信号とを比較したスペクトル分布図。
【符号の説明】
10,30 ニューラルネット 11,31 遅延ライン 12,32 畳み込み演算部 13 教師付き学習部 20 標本化信号供給源 21 教師信号供給源 40 標本化信号再生装置
───────────────────────────────────────────────────── フロントページの続き Fターム(参考) 5D044 AB05 AB07 GK08 GK11 GK14 5D045 DA20 5J022 BA01 CA10 CE04 5K041 CC01 CC02 CC07 DD00 EE01 EE17 EE21 FF11 HH11

Claims (7)

    【特許請求の範囲】
  1. 【請求項1】 原信号を所定の第1の分解能で標本化し
    た標本化信号を提供する手段と、 前記原信号を前記第1の分解能よりも細かい第2の分解
    能で標本化した教師信号を提供する手段と、 前記標本化信号と前記教師信号を入力し、前記標本化信
    号と演算する重み係数を前記教師信号に基づく学習によ
    り生成するニューラルネットワークとを具え、前記生成
    した重み係数を前記標本化信号に付属させて出力するこ
    とを特徴とする標本化信号生成装置。
  2. 【請求項2】 請求項1の標本化信号生成装置で出力し
    た前記標本化信号及びそれに付属する前記重み係数に基
    づき前記原信号を復元する装置であって、 前記標本化信号を前記第1の分解能に対応する第1の周
    期で再生する手段と、 前記第2の分解能に対応する第2の周期に従って、再生
    された前記標本化信号とそれに付属する前記重み係数と
    を演算するニューラルネットワークとを具え、前記第2
    の分解能に対応する精度で前記原信号を復元した出力信
    号が前記ニューラルネットから出力されることを特徴と
    する標本化信号再生装置。
  3. 【請求項3】 原信号を所定の第1の分解能で標本化し
    た標本化信号と前記原信号を前記第1の分解能よりも細
    かい第2の分解能で標本化した教師信号とをニューラル
    ネットワークに入力するステップと、 前記ニューラルネットワークにおいて、前記標本化信号
    と演算する重み係数を前記教師信号に基づく学習により
    生成するステップと、 前記生成した重み係数を前記標本化信号に付属させて出
    力するステップとを備えることを特徴とする標本化信号
    生成方法。
  4. 【請求項4】 請求項3の標本化信号生成方法で出力し
    た前記標本化信号及びそれに付属する前記重み係数に基
    づき前記原信号を復元する方法であって、 前記標本化信号を前記第1の分解能に対応する第1の周
    期で再生するステップと、 ニューラルネットワークにおいて、前記第2の分解能に
    対応する第2の周期に従って、再生された前記標本化信
    号とそれに付属する前記重み係数とを演算し、前記第2
    の分解能に対応する精度で前記原信号を復元した信号を
    出力するステップとを備えることを特徴とする標本化信
    号再生方法。
  5. 【請求項5】 原信号を所定の第1の分解能で標本化し
    た標本化信号と、 前記原信号を前記第1の分解能よりも細かい第2の分解
    能で標本化した教師信号を用いた学習により求められた
    前記標本化信号と演算すべき重み係数とを組み合わせて
    前記原信号の標本化データとして記憶した記憶媒体。
  6. 【請求項6】 原信号を所定の第1の分解能で標本化し
    た標本化信号と、 前記原信号を前記第1の分解能よりも細かい第2の分解
    能で標本化した教師信号を用いた学習により求められた
    前記標本化信号と演算すべき重み係数とを組み合わせて
    前記原信号の標本化データとして伝送することを特徴と
    するデータ伝送方式。
  7. 【請求項7】 前記原信号を複数の区間に分割し、各区
    間に対応して前記重み係数のセットをそれぞれ有するこ
    とを特徴とする請求項1乃至6のいずれかに記載の装置
    又は方法又は記憶媒体又はデータ伝送方式。
JP2002011901A 2002-01-21 2002-01-21 標本化信号生成装置及び標本化信号再生装置並びにその方法 Expired - Fee Related JP3974408B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2002011901A JP3974408B2 (ja) 2002-01-21 2002-01-21 標本化信号生成装置及び標本化信号再生装置並びにその方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2002011901A JP3974408B2 (ja) 2002-01-21 2002-01-21 標本化信号生成装置及び標本化信号再生装置並びにその方法

Publications (2)

Publication Number Publication Date
JP2003218806A true JP2003218806A (ja) 2003-07-31
JP3974408B2 JP3974408B2 (ja) 2007-09-12

Family

ID=27649268

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2002011901A Expired - Fee Related JP3974408B2 (ja) 2002-01-21 2002-01-21 標本化信号生成装置及び標本化信号再生装置並びにその方法

Country Status (1)

Country Link
JP (1) JP3974408B2 (ja)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2020046774A (ja) * 2018-09-14 2020-03-26 株式会社東芝 信号処理装置、距離計測装置、および距離計測方法
CN114002733A (zh) * 2021-10-27 2022-02-01 武汉科技大学 微震波信号初至到时自动拾取方法及微震监测装置

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2020046774A (ja) * 2018-09-14 2020-03-26 株式会社東芝 信号処理装置、距離計測装置、および距離計測方法
US12025748B2 (en) 2018-09-14 2024-07-02 Kabushiki Kaisha Toshiba Signal processing apparatus, distance measuring apparatus, and distance measuring method
CN114002733A (zh) * 2021-10-27 2022-02-01 武汉科技大学 微震波信号初至到时自动拾取方法及微震监测装置
CN114002733B (zh) * 2021-10-27 2024-01-23 武汉科技大学 微震波信号初至到时自动拾取方法及微震监测装置

Also Published As

Publication number Publication date
JP3974408B2 (ja) 2007-09-12

Similar Documents

Publication Publication Date Title
JPH0562495A (ja) サンプリング周波数変換器
CN110459196A (zh) 一种调整歌曲演唱难度的方法、装置及***
JP4076887B2 (ja) ボコーダ装置
US20030169887A1 (en) Reverberation generating apparatus with bi-stage convolution of impulse response waveform
JPH0435930B2 (ja)
JP3979133B2 (ja) 音場再生装置、プログラム及び記録媒体
US20020075777A1 (en) Method and apparatus for processing digital audio signal
JP3974408B2 (ja) 標本化信号生成装置及び標本化信号再生装置並びにその方法
JP2001255876A (ja) 時間軸方向における楽音波形信号の伸縮方法
JP3925349B2 (ja) 音声データと演奏データの同期再生を行うための装置および方法
JPS642960B2 (ja)
JP2914265B2 (ja) 音源装置
JP2687698B2 (ja) 電子楽器の楽音制御装置
JP2556560B2 (ja) 楽音生成方式
JP5359203B2 (ja) 楽曲処理装置およびプログラム
JP3920879B2 (ja) 標本化関数発生装置およびデジタル−アナログ変換器
JP2000206972A (ja) 波形デ―タの演奏制御装置
JP2594782B2 (ja) 電子楽器
JP2002023750A (ja) オーディオ波形データ再生装置、オーディオ波形データの時間軸圧縮伸長処理装置およびオーディオ波形データのピッチ変換処理装置
JPH07199998A (ja) 音声信号圧縮伸張装置
JP6149514B2 (ja) サーチ機能を備えるデジタル信号処理装置
JP2003202882A (ja) サウンド合成方法およびサウンド合成装置
JP2535808B2 (ja) 音源波形生成装置
JP3254829B2 (ja) デジタル音響信号の時間軸伸長読出し方法及び装置
JP3256316B2 (ja) デジタル電子楽器システム

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20050120

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20070515

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20070614

R150 Certificate of patent or registration of utility model

Free format text: JAPANESE INTERMEDIATE CODE: R150

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20100622

Year of fee payment: 3

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20110622

Year of fee payment: 4

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20110622

Year of fee payment: 4

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20120622

Year of fee payment: 5

LAPS Cancellation because of no payment of annual fees