JP2004271812A - Time-series signal encoding device and its method, and time-series signal decoding device and and its method - Google Patents

Time-series signal encoding device and its method, and time-series signal decoding device and and its method Download PDF

Info

Publication number
JP2004271812A
JP2004271812A JP2003061244A JP2003061244A JP2004271812A JP 2004271812 A JP2004271812 A JP 2004271812A JP 2003061244 A JP2003061244 A JP 2003061244A JP 2003061244 A JP2003061244 A JP 2003061244A JP 2004271812 A JP2004271812 A JP 2004271812A
Authority
JP
Japan
Prior art keywords
time
frame
signal
series signal
prediction
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2003061244A
Other languages
Japanese (ja)
Inventor
Takayuki Hiekata
孝之 稗方
Shigeki Murakami
茂樹 村上
Tetsuya Takahashi
哲也 高橋
Toshiro Yamashita
俊郎 山下
Toshiaki Shimoda
敏章 下田
Yohei Ikeda
陽平 池田
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Kobe Steel Ltd
Original Assignee
Kobe Steel Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Kobe Steel Ltd filed Critical Kobe Steel Ltd
Priority to JP2003061244A priority Critical patent/JP2004271812A/en
Publication of JP2004271812A publication Critical patent/JP2004271812A/en
Pending legal-status Critical Current

Links

Images

Abstract

<P>PROBLEM TO BE SOLVED: To provide a time-series signal encoding device that can start halfway reproduction at an arbitrary start position and realize compression with high efficiency as a time-series signal encoding device which performs reversible encoding (lossless encoding) of a time-series signal represented by an inputted speech/audio signal. <P>SOLUTION: The time-series signal encoding device is provided with a counter 107 which selects a special frame to include complementary information enabling prediction (reproduction) of a prediction signal without using data of past frames when an LPC prediction unit 102 performs prediction from a frame cut by a buffer 101 according to a specified selection rule, and a controller 106 which controls a bit stream generator 104, and the LPC prediction unit 102 and/or an encoder 103 so that a bit stream including the complementary information is generated as to the special frame selected by the counter 107. <P>COPYRIGHT: (C)2004,JPO&NCIPI

Description

【0001】
【発明の属する技術分野】
本発明は,音声/オーディオ信号等に代表される時系列信号を可逆符号化する時系列信号符号化装置に係り,詳しくは,任意の位置から途中再生可能であって,且つ高効率な圧縮を実現可能にする時系列信号符号化装置に関する。
【0002】
【従来の技術】
近年,音声/オーディオ信号等に代表される時系列信号の冗長性を利用して符号化することでデータ量を圧縮し,時系列信号の記録/再生,或いは送受信に関する効率を向上させる技術が数多く開発されている。
これらの技術は,大別すると非可逆符号化と可逆符号化に分けることが可能である。
前者は,MP3やAAC方式に代表されるようにデータの圧縮による聴覚的劣化を伴うものの,比較的高い圧縮率(1/10以下程度でも聴覚上大きな問題がない)の符号化が可能なものである。
一方,後者は,ロスレス符号化とも呼ばれ,圧縮(符号化)前の信号が完全に復元可能であるため聴覚的劣化はないが,比較的低い圧縮率(符号化される音声データによるが,概ね1/2程度)の符号化しかできないものである。
このように,高能率な圧縮符号化を実現するためには非可逆符号化が有利であるが,圧縮前の時系列信号と全く同一の時系列信号を復号することができるロスレス符号化に対するニーズも強い。
【0003】
ところで,ロスレス符号化の基本は,過去の時系列信号から現在の時系列信号を予測することである。
つまり,時系列信号をロスレス符号化する際には,過去の時系列信号を辿る必要がある。具体的には,過去の時系列信号から見た現在の時系列信号の予測値を所定の予測方式(例えば,線形予測,ピッチ予測)に基づいて予測し,予測された予測値と元の時系列信号の差分値(予測残差)を符号化することにより高能率な符号化を行うものである。
そのため,ロスレス符号化された符号を復号化する際にも,過去の時系列信号を参照しつつ,時系列信号を順次復号化する構成となる。
しかし,そのような構成であるため,符号化された符号の復号化に当たり,過去の時系列信号が欠落した場合には,該過去の時系列信号に基づく予測値が本来の予測値と異なる(誤った)値が予測される問題を生じ得る。
また,それ以降の時系列信号の予測は,この誤って予測された予測値(過去の時系列信号)に基づいた誤った予測が繰り返されることとなり,その結果として,時系列信号の欠落が生じた時点以降に復号化された時系列信号は,全て誤った時系列信号として復号化されるという不都合な状況(以下,「誤り伝播」という)を生じ得る。
この「誤り伝播」が問題となる典型例としては,ロスレス符号化された符号の途中再生を行う場合が挙げられる。つまり,該符号の途中再生を所望するユーザが,該符号の任意の位置(途中)を指定して当該符号の再生(復号化)を行うことを所望しても,その任意の位置から過去の時系列信号に関する情報がない(つまりは,過去の時系列信号が欠落した状況である)ため,前述した「誤り伝播」が発生し,正常な復号化処理ができない。
従って,前記符号の途中再生を所望するユーザは,該符号の途中再生を望む場合であっても,その都度,先頭から順に復号して途中再生を所望する位置まで辿りつく必要があった。
このように,ロスレス符号化された符号を途中再生する場合には,常に符号の先頭から復号化処理を行うことを強いられるため,多くの演算量(演算時間)を要することとなり,ユーザの作業効率及び使用性を低下させていた。
そこで,このような「誤り伝播」の防止を実施する技術が開発され,特許文献1により開示されている。
特許文献1において開示された技術により,最終的に生成されるビットストリームZを模式的に示す図が図22である。同図に示す如く,当該技術に基づき生成されたビットストリームZは,所定長さ(所定サンプル長単位)毎に切り出されたフレーム(図中にはブロックで示す)の先頭には,元の時系列信号(図中には「ブロック先頭m個の元の音声信号サンプル」で示す)が配置されることを特徴とする。
このような構成により,当該ビットストリームZを途中再生する場合,過去の時系列信号からの予測値と先頭に配置した元の時系列信号を比較し,「誤り伝播」が発生したかどうかを判定可能である。つまり,「誤り伝播」が発生したと判定された(即ち,予測値と元の時系列信号とが異なる)場合には,次の時系列信号を予測するに当たり,予測された予測値(つまりは,誤った過去の時系列信号)ではなく,元の時系列信号(つまりは,正しい過去の時系列信号)を用いることで,「誤り伝播」を防止しつつ,正しい時系列信号を途中再生することを可能としている。
このように,特許文献1により開示された技術によれば,元の時系列信号をビットストリームのフレーム毎に付加する構成によって,「誤り伝播」を防止することが可能となるため,所望の位置からの途中再生にも対応することができ,利便性の向上に寄与し得る。
【0004】
【特許文献1】
特開2000−22551号公報
【非特許文献1】
「音のコミュニケーション工学」(社団法人日本音響学会編,コロナ社,1996/8/30初版)
【非特許文献2】
ハーフレート音声コーデック(PSI−CELP)規格書RCR STD−27C
【0005】
【発明が解決しようとする課題】
しかしながら,前述した従来公知の技術では以下のような問題点がある。
その一つは,符号化効率の劣化である。つまり,全フレームそれぞれの先頭にエラー検出を目的とした元の時系列信号(つまりは,「ブロック先頭m個の元の音声信号サンプル」)を配置する構成上,その分だけデータサイズが増大することは避けられず,しかもその増加分が大きいことが問題であった。
例えば,10サンプル分の元の時系列信号を付加する場合,その時系列信号が16bit/sampleの精度であれば1chあたり160bitが冗長な情報となる。更に,元の時系列信号が,ビットレート256kbps,ステレオ2ch,フレーム長10msのオーディオデータであれば,1フレームあたりの符号の平均ビット数は256000bps/(1000ms/10ms)=2560bitであるので,この時系列信号の配置分だけで(160bit×2ch)/2560bit=12.5%もの情報量の増加になり,符号化効率が著しく低下する。
ましてや,ロスレス符号化する際の予測手段として,元の時系列信号の周期性を利用して符号化するピッチ予測(ピッチフィルタ)が適用される場合には,その時系列信号の周期に応じて過去に保存しておくべき(先頭に配置されるべき)サンプルのビット長は長いものになる。例えば,元の時系列信号が音声信号である場合には,80Hz程度までの周期信号に対応することが望ましいが(ハーフレート音声コーデックPSI−CELPはその程度の周期信号まで対応する),サンプリング周波数が8KHzであるとしても最低100サンプル分の時系列信号の保存が必要になるため,符号化効率が更に低下する。
もう一つの問題点は,スタート個所の特定(同期を取ること)が必要な点である。つまり,ロスレス符号化/復号化とは,符号化を行う前の時系列信号と,復号化された後の時系列信号と,が完全一致することを特徴とするものであるため,各フレーム毎の符号のデータサイズは可変長とならざるを得ない。従って,符号化された符号の途中再生を行うためには,複数のフレームの中からその開始位置(フレーム)を特定することが必要となるが,図22に示す如く構成されるビットストリームZでは,複数のフレームから,特定のフレームを識別することは不可能であり,所望の開始位置(フレーム)から該符号を途中再生することは容易ではない。
そこで,本発明は,前記事情に鑑みてなされたものであり,その目的とするところは,音声/オーディオ信号等に代表される時系列信号を可逆符号化する時系列信号符号化装置において,任意の開始位置から途中再生可能であって,且つ高効率な圧縮を実現可能とする時系列信号符号化装置を提供することにある。
【0006】
【課題を解決するための手段】
前記目的を達成するために,本発明は,入力される時系列信号を所定長さのフレームごとに区分するフレーム区分手段と,所定の予測方式に基づいて過去の前記時系列信号から現在の前記時系列信号を予測する予測手段と,前記フレームごとに前記予測手段による予測信号と前記時系列信号との間の残差信号を算出する残差信号算出手段と,前記残差信号を可逆符号化して残差信号情報を生成する符号化手段と,前記残差信号情報に基づいて所定のビットストリームを生成するビットストリーム生成手段と,を具備してなる時系列信号符号化装置において,所定の選択ルールに基づいて前記フレームの一部を特殊フレームとして選択する特殊フレーム選択手段と,前記ビットストリームにおける前記特殊フレームについての情報ごとに,前記特殊フレームに関する旨の識別情報と当該特殊フレーム以外の前記フレームについての前記残差信号を使用せずに前記時系列信号の再生を可能とするための所定の補充情報とが含まれるよう前記ビットストリーム生成手段と前記予測手段及び/又は前記符号化手段とを制御するビットストリーム生成制御手段と,を具備してなることを特徴とする時系列信号符号化装置として構成される。
ここで,前記予測手段における前記所定の予測方式の一例としては,線形予測,或いはピッチ予測のいずれかを適用することが考え得る。
このような構成により,当該時系列信号符号化装置により生成されたビットストリームには,所定の選択ルールに基づく間隔毎に特殊フレームに関する情報が配置され,且つ,該特殊フレームに関する情報には前記補充情報が含まれるため,そのフレームより過去のフレームについての前記残差信号を参照(使用)することなく復号(再生)可能となる。また,特殊フレームであるか否かは,前記識別情報の有無によって判別できる。
従って,当該時系列信号符号化装置によれば,特殊フレームに関する前記識別情報を時間的な指標(インデックス)として,任意の位置から途中再生することも可能であり,その途中再生において,「誤り伝播」を生ずることもない。
更には,その「誤り伝播」を防止するための構成は,従来構成の如く,各フレームごとの情報の先頭にエラー検出を目的とした元の時系列信号をダブらせて配置する構成に較べ,選択された一部の特殊フレームごとに前記識別情報及び前記補充情報が含められるだけなので,ビットストリーム全体のデータサイズを格段に小さくできる。
【0007】
ここで,前記補充情報としては,前記特殊フレームにおける前記時系列信号の先頭の一部について前記予測信号を所定の設定信号に置き換えて得られた前記残差信号が前記符号化手段により符号化された前記残差信号情報であるものが考えられる。
通常は,信号の再生(復号)側においては,各フレームの先頭の一部について再生する際には,その1つ前のフレームの後尾の一部の時系列信号(図22における「ブロック先頭m個の元の音響信号サンプル」に相当)が必要となる。これに対し,上記構成では,前記特殊フレームにおける先頭の一部についての前記残差信号は,前記時系列信号と前記設定信号(例えば,固定値0(ゼロ))との残差を表すことになる。従って,前記特殊フレームの先頭部分,即ち,通常であれば前記特殊フレームの1つ前のフレームの後尾の一部の時系列信号が再生のために必要となる部分については,再生(復号)側において前記設定値が既知であれば,当該特殊フレーム以外の1つ前のフレームについての前記残差信号を使用せずに前記時系列信号の再生が可能となる。
しかも,前記補充情報は,別途新たに設けられるものでなく,先頭の一部についての通常の前記残差信号に置き換わるものであるので,前記ビットストリームのサイズの増加が最小限に抑えられる。
【0008】
また,前記補充情報が,前記特殊フレームにおける前記時系列信号の先頭の一部であり,前記ビットストリーム生成制御手段により,前記補充情報に対応する前記残差信号情報を前記ビットストリームに含めない制御を行うものも考えられる。
これによっても,上記と同様に,当該特殊フレーム以外の1つ前のフレームについての前記残差信号を使用せずに前記時系列信号の再生が可能となる。また,この場合の前記補充情報は,符号化されない分だけ上記よりも前記ビットストリームのデータサイズが多少大きくなるが,前記補充情報に対応する前記残差信号情報が含められないので,前記補充情報を追加して含めるよりはデータサイズの増加を小さく抑えることができる。
【0009】
また,前記補充情報が,前記特殊フレームの1つ前の前記フレームにおける前記時系列信号の一部又は該一部が前記符号化手段により符号化された前記残差信号情報であるものであってもかまわない。
この場合,前記特殊フレームについては,特許文献1に示される場合と同様に,前記補充情報が追加される分だけ前記ビットストリームのサイズが増えることにはなるが,フレームごと(ブロックごと)に前記補充情報(図22における「ブロック先頭m個の元の音響信号サンプル」に相当)を含める場合に比べれば,格段に前記ビットストリームのデータサイズの増加量を抑えることができる。
【0010】
ここで,前記特殊フレーム選択手段における前記所定の選択ルールが,前記時系列信号における一定時間間隔の前記フレームを前記特殊フレームとするものであるものが望ましい。
これにより,前記特殊データの位置(数)に基づいて,時系列信号における特定の位置(再生時間)を正確に把握することが可能となり,特殊データの指標としての利用性を高めることができる。つまり,当該時系列信号符号化装置により符号化されたビットストリームの途中再生をする場合,前記特殊データの位置(数)に基づいて,所望する位置(再生時間)からの途中再生を正確に実現し得る。
【0011】
更に,前記特殊フレームとしては,他の特殊フレームの位置を特定する位置情報を含んでなる形態であることが望ましい。ここで,前記位置情報の一例としては,その特殊フレームの直前の前記特殊フレーム及び/又は直後の前記特殊フレームの位置を特定するものが考えられよう。
このような形態によれば,ユーザは,ビットストリームを再生するに当たり,特殊フレーム毎に含まれる前記位置情報に基づいて,所定の時間(フレーム)間隔で時系列信号を聞き飛ばす,或いは直前から聞き直すといった再生方法が可能となり,より利便性の高い再生方法を実現し得る。
【0012】
また,本発明は,前記構成の時系列信号符号化装置により符号化された前記ビットストリームデータを復号化(再生)する時系列信号復号化装置として捕らえたものも考えられる。
即ち,所定のフレーム単位の残差信号が符号化された残差信号情報を複数含むビットストリームを入力するビットストリーム入力手段と,前記ビットストリームに含まれる前記残差信号情報を復号化する復号化手段と,当該時系列信号復号化装置により過去に出力された時系列信号に基づいて次に出力する時系列信号を予測する予測手段と,該予測手段による予測信号と前記復号化手段により復号化された前記残差信号とに基づいて前記時系列信号を出力する時系列信号出力手段とを具備してなる時系列信号復号化装置において,前記ビットストリームから,前記残差信号情報それぞれについて該残差信号情報が所定の特殊フレームに関するものである旨を表す識別情報を検出する識別情報検出手段と,前記識別情報検出手段により前記識別情報が検出された場合には,該識別情報に対応して前記ビットストリームに含まれる所定の補充情報と前記残差信号情報が前記復号化手段により復号化された前記残差信号とに基づいて前記時系列信号が出力されるよう前記予測手段及び/又は前記時系列信号出力手段を制御する時系列信号出力制御手段と,を具備してなることを特徴とする時系列信号復号化装置として構成されるものである。
【0013】
また,本発明は,前述構成の時系列信号符号化装置により実行される処理(工程)を行う時系列信号符号化方法として捉えたものであってもよい。
即ち,入力される時系列信号を所定長さのフレームごとに区分するフレーム区分工程と,所定の予測方式に基づいて過去の前記時系列信号から現在の前記時系列信号を予測する予測工程と,前記フレームごとに前記予測工程による予測信号と前記時系列信号との間の残差信号を算出する残差信号算出工程と,前記残差信号を可逆符号化して残差信号情報を生成する符号化工程と,前記残差信号情報に基づいて所定のビットストリームを生成するビットストリーム生成工程と,を有してなる時系列信号符号化方法において,所定の選択ルールに基づいて前記フレームの一部を特殊フレームとして選択する特殊フレーム選択工程と,前記ビットストリームにおける前記特殊フレームについての情報ごとに,前記特殊フレームに関する旨の識別情報と当該特殊フレーム以外の前記フレームについての前記残差信号を使用せずに前記時系列信号の再生を可能とするための所定の補充情報とが含まれるよう前記ビットストリーム生成工程と前記予測工程及び/又は前記符号化工程とを制御するビットストリーム生成制御工程と,を有してなることを特徴とする時系列信号符号化方法である。
【0014】
同様に,本発明は,前述構成の時系列信号復号化装置により実行される処理(工程)を行う時系列信号復号化方法として捉えたものであってもよい。
所定のフレーム単位の残差信号が符号化された残差信号情報を複数含むビットストリームを入力するビットストリーム入力工程と,前記ビットストリームに含まれる前記残差信号情報を復号化する復号化工程と,当該時系列信号復号化方法により過去に出力された時系列信号に基づいて次に出力する時系列信号を予測する予測工程と,該予測工程による予測信号と前記復号化工程により復号化された前記残差信号とに基づいて前記時系列信号を出力する時系列信号出力工程とを有してなる時系列信号復号化方法において,前記ビットストリームから,前記残差信号情報それぞれについて該残差信号情報が所定の特殊フレームに関するものである旨を表す識別情報を検出する識別情報検出工程と,前記識別情報検出工程により前記識別情報が検出された場合には,該識別情報に対応して前記ビットストリームに含まれる所定の補充情報と前記残差信号情報が前記復号化工程により復号化された前記残差信号とに基づいて前記時系列信号が出力されるよう前記予測工程及び/又は前記時系列信号出力工程を制御する時系列信号出力制御工程と,を有してなることを特徴とする時系列信号復号化方法である。
【0015】
【発明の実施の形態】
以下添付図面を参照しながら,本発明の実施の形態及び実施例について説明し,本発明の理解に供する。尚,以下の実施の形態及び実施例は,本発明を具体化した一例であって,本発明の技術的範囲を限定する性格のものではない。
ここに,図1は本発明の第1の実施形態に係る時系列信号符号化装置の概略構成を示すブロック図,図2は第1の実施形態に係る時系列信号符号化装置により生成されたビットストリームを復号化する時系列信号復号化装置の概略構成を示すブロック図,図3は第1の実施形態に係る時系列信号符号化装置における信号及び符号に関する処理の流れを模式的に示す図,図4は第1の実施形態に係る時系列信号符号化装置により生成されたビットストリームの構造を模式的に示す図,図5は本発明の第2の実施形態に係る時系列信号符号化装置の概略構成を示すブロック図,図6は第2の実施形態に係る時系列信号符号化装置により生成されたビットストリームを復号化する時系列信号復号化装置の概略構成を示すブロック図,図7は第1の実施形態に係る時系列信号符号化装置における信号及び符号に関する処理の流れを模式的に示す図,図8は本発明の第3の実施形態に係る時系列信号符号化装置の概略構成を示すブロック図,図9は第3の実施形態に係る時系列信号符号化装置により生成されたビットストリームを復号化する時系列信号復号化装置の概略構成を示すブロック図,図10は第3の実施形態に係る時系列信号符号化装置における信号及び符号に関する処理の流れを模式的に示す図,図11は本発明の第4の実施形態に係る時系列信号符号化装置の概略構成を示すブロック図,図12は第4の実施形態に係る時系列信号符号化装置により生成されたビットストリームを復号化する時系列信号復号化装置の概略構成を示すブロック図,図13は第4の実施形態に係る時系列信号符号化装置における信号及び符号に関する処理の流れを模式的に示す図,図14は本発明の第5の実施形態に係る時系列信号符号化装置の概略構成を示すブロック図,図15は第5の実施形態に係る時系列信号符号化装置により生成されたビットストリームを復号化する時系列信号復号化装置の概略構成を示すブロック図,図16は第5の実施形態に係る時系列信号符号化装置における信号及び符号に関する処理の流れを模式的に示す図,図17は本発明の第6の実施形態に係る時系列信号符号化装置の概略構成を示すブロック図,図18は第6の実施形態に係る時系列信号符号化装置により生成されたビットストリームを復号化する時系列信号復号化装置の概略構成を示すブロック図,図19は第6の実施形態に係る時系列信号符号化装置における信号及び符号に関する処理の流れを模式的に示す図,図20は特殊フレームにおけるヘッダの構造例を示す図,図21は特殊フレームにおけるヘッダを利用したポインタ状態を示す図,図22は従来公知の時系列信号符号化装置により生成されたビットストリームの構造を模式的に示す図である。
【0016】
(第1の実施形態)
先ず,本発明の第1の実施形態に係る時系列信号符号化装置について図1を参照しつつ,説明する。
ここに,第1の実施形態に係る時系列信号符号化装置Aは,図1に示すブロック図の如く具現化される。同図に示す如く,該時系列信号符号化装置Aは,バッファ101(前記フレーム区分手段の一例に該当),LPC(Liner Predictive Coding)予測器102(前記予測手段の一例に該当),減算器108(前記残差信号算出手段の一例に該当),符号器103(前記符号化手段の一例に該当),ビットストリーム生成器104(前記ビットストリーム生成手段の一例に該当),制御器106(ビットストリーム生成制御手段の一例に該当),カウンタ107(特殊フレーム選択手段の一例に該当)を具備して概略構成される。
以下に,当該時系列信号符号化装置Aに入力されたPCMデータ(時系列信号の一例)が符号化され,符号データとして出力されるまでの各部の処理について,処理の流れに沿って説明する。
【0017】
(バッファ101)
先ず,当該時系列信号符号化装置Aに入力されたPCMデータ(サンプル,時系列信号の一例)は,入力端子100から前記バッファ101に入力される。
該バッファ101では,PCMデータがあるサンプル数(例えば800サンプル)毎にフレームと呼ばれる単位に区分されてバッファリングされる。尚,入力されるPCMデータのチャンネル数が複数の場合には,該バッファ101において,各チャンネル相互の相関性を除去する処理を行ってもよい。例えば,PCMデータが2チャンネルである場合には,Lch+Rch,或いはLch−Rchのような演算処理が行われる。
【0018】
(LPC予測器102)
次に,前記バッファ101にバッファリングされた,フレーム単位のPCMデータ(以下,略して単にフレームデータという)が前記LPC予測器102に入力される。
該LPC予測器102では,下式1の如く,割り当てられた所定の予測係数αn(n=1,2,…,N)に基づいて線形予測処理が行われ,過去のPCMデータx(i−n)(iは,各フレームにおける現在のPCMデータの番号(i=1,2,…,K)(Kは,1フレーム中のサンプル数))から現在のPCMデータ(サンプル)の予測値(予測信号)
【数1】

Figure 2004271812
が予測され,予測された該予測値が前記減算器108に出力される。
【数2】
Figure 2004271812
この式1からわかるように,各フレームデータx(i)の先頭のN個(i=1〜N)のPCMデータ(サンプル)を予測するには,iが0以下となるため,当該フレームの1つ前のフレームの後尾のPCMデータN個分が必要となる。
尚,前記予測係数αnは,予め設定された係数であっても,入力されるフレームデータに応じてその都度算出される係数であってもよい。予測係数αnの算出方法は周知であり,その詳細は,例えば非特許文献1に詳しいため,ここでは説明を省略する。
【0019】
(減算器108)
前記減算器108では,前記LPC予測器102により予測された前記予測値
【数3】
Figure 2004271812
と,前記バッファ101から直接入力された各フレームデータx(i)とを用い,下式2の如く,LPC残差信号d(i)が算出される。
【数4】
Figure 2004271812
そして,算出された該LPC残差信号d(i)の1フレーム分(i=1〜K)が,前記符号器103に出力される。
【0020】
(符号器103)
前記符号器103では,前記減算器108から入力された1フレーム分のLPC残差信号d(i)(i=1〜K)が符号化され,しかる後に,前記ビットストリーム生成器104に出力される。尚,該LPC残差信号d(i)の符号化方法としては,その出現頻度の偏りを利用した符号化方法(いわゆるエントロピー符号化)を用いることが望ましい。具体的には,公知な符号化技術であるHuffman符号方式,算術符号化方式,或いはレンジコーダ等の手法を用いることが考えられる。無論,その符号化方法はこれらの手法に限定されるものでない。
【0021】
(ビットストリーム生成器104)
最後に,前記ビットストリーム生成器205において,前記符号器103から入力される符号(残差信号情報),前記制御器106から入力されるヘッダ(詳細は後述する),及び前記LPC符号器102から入力される予測係数を特定する情報(図中には,予測係数情報で示す)がパッキングされ,しかる後に,ビットストリーム(図中では,符号データで示す)として出力端子105から出力され,PCMデータの符号化が完了する。
【0022】
以上説明した各部の基本的構成並びに動作については,従来公知の時系列信号符号化装置と同様である。
しかしながら,本実施形態では,前記バッファ101により切り出された(区分された)前記フレームデータから,一定時間間隔(前記所定の選択ルールの一例)で,所定の特殊フレーム(後述)を選択する特殊フレーム選択機能(前記特殊フレーム選択手段の一例に該当)と,更には,選択された該特殊フレームについて,当該特殊フレーム以外の前記フレーム(1つ前のフレーム)についての前記LPC残差信号d(i)を使用せずにPCMデータの再生を可能とするための所定の補充情報が含まれた符号化データが作成されるべく,前記LPC予測器102による予測を行うに当たり,該特殊フレームより過去の(他の)フレームのデータを使用しないで該特殊フレームの先頭の一部の予測値を所定の設定値(設定信号,=0)に置き換えるビットストリーム生成制御機能(前記ビットストリーム生成制御手段の一例に該当)と,を具備する点で,従来構成と異なる。
この差異(特徴点)により,本実施形態によれば,生成されるビットストリーム中には一定時間毎に特殊フレームが配置され,更には,該特殊フレームは,そのフレームより過去のフレーム内(そのフレーム以外のフレーム内)のデータを使用することなく符号化される。このようにして符号化された特殊フレームについてのデータは,他の(過去の)フレームのデータを用いることなく再生(復号)が可能となる。
その結果,本実施形態に係る時系列信号符号化装置により生成されたビットストリームであれば,該ビットストリームを復号するに当たり,特殊フレームを時間的な指標(インデックス)として利用できるとともに,ビットストリームを所望の時間(位置)から途中再生することが可能である。
更には,その途中再生機能を実現することによる情報量の増加,つまりは,符号化効率の低下は最小限に抑えることができる。
以下に,本実施形態における特徴点である前記特殊フレーム選択機能並びに前記ビットストリーム生成制御機能について詳説する。
【0023】
(特殊フレーム選択機能)
この特殊フレーム選択機能は,前記カウンタ107により実現される。具体的には,前記制御器106に接続される該カウンタ107は,一定時間が経過する(即ち,リアルタイム処理であるので一定量のフレームが処理される)度に所定の動作指令を該制御器106に発信する機能を有しており,この機能により,前記バッファ101によって切り出された前記フレームデータから,一定時間間隔で特殊フレームが選択される。
尚,前記特殊フレームの選択処理の他の例としては,処理されたフレームデータ数を計数し,その処理フレーム数が所定数に達するまでカウントする処理等も考えられる。
【0024】
(ビットストリーム生成制御機能)
前記カウンタ107からの動作指令を受信した前記制御器106では,前記LPC予測器102等を以下のように制御することで,前記カウンタ107により選択された特殊フレームについては,該特殊フレーム以外の(過去の)フレームデータを使用することなく前記予測信号が予測され,しかる後に,予測された該予測信号をが含む符号化データを作成する機能を実現する。
先ず,前記カウンタ107からの動作指令を受信すると,前記制御器106において,前記LPC予測器102の動作を制御する制御信号が発信される。また,それに合わせて,該制御器106において,今回処理されるフレームが特殊フレームであることを示すヘッダ(識別情報の一例)が生成され,前記ビットストリーム生成器106に送出される。該ヘッダは,前記ビットストリーム生成器106において,前記符号器103により符号化された符号,或いは予測係数情報とパッキングされることで特殊フレームを形成するものであり,ビットストリームを復号する際には該ヘッダの有無により,そのフレームが特殊フレームであるかどうかが判定される。
そのため該ヘッダ中には,少なくとも,フレームの同期が可能な同期符号(例えばAAAAhなどの極力ビットストリーム中にはあまり登場しないパターン)が含まれ,その他にも,必要に応じて制御に関する情報(後述する予測未実施のLPC予測の次数Nその他),或いはカウンタ情報(現在の特殊フレームが何番目なのか,あるいはPCMデータ先頭からの時間その他)等が含まれる。
一方,前記制御器106から制御指令を受信した前記LPC予測器102では,前述した通常の予測処理とは異なる以下のような予測処理が行われる。
制御指令を受信すると前記LPC予測器102では,そのフレーム(特殊フレーム)における先頭サンプルからLPC予測の次数(上式(1)におけるNに相当)に対応するサンプルまでは,LPC予測が実施されない。具体的には,LPC残差信号d(i)=フレームデータx(i)(i=1〜N)とする処理が行われる。
この処理により,当該LPC予測器102において,特殊フレームについては,過去のフレームの信号を用いることなく,現在のフレーム内(特殊フレーム内)の信号(データ)のみから予測値が特定される。その結果,特殊フレームについては,符号化された時系列信号を途中再生することが可能となる。
尚,特殊フレームにおいても,該特殊フレームの先頭サンプルからLPC予測の次数(上式(1)におけるNに相当)に対応するサンプル以降のサンプルについては,LPC予測をするために必要な過去のサンプルがフレーム内に存在するため,従来同様,LPC予測により予測値が算出される。
【0025】
ここで,前記符号器103において,前記制御器106からの制御信号に応じて通常フレームと特殊フレームとが作成される際の処理の流れについて,その流れを模式的示す図3を用いて説明する。尚,同図では,前記制御器106からの制御信号(図中では,LPC予測制御信号で示す)が「1」であれば,そのフレームを特殊フレームとして処理し,前記制御器106からの制御信号が「0」であれば,そのフレームを通常フレームとして処理する場合について示している。無論,この制御信号の「0」「1」は逆に構成することも可能である。
同図に示す如く,前記制御器106からの制御信号が「0」である(同図左側に示す,処理するフレームが通常フレームである)場合には,従来構成と同様,前記LPC予測器102において所定の予測係数に基づいて予測値が算出され,算出された該予測値に応じたLPC予測残差信号d(i)が算出され,しかる後に,前記符号器103において,算出された該LPC予測残差信号d(i)が,残差信号情報として符号化される。
そして,前記符号器103により符号化された残差信号情報が,前記ビットストリーム生成器104において,該通常フレームを予測する際に適用された予測係数を特定する情報(図中では,予測係数情報で示す)とパッキングされ,所定の書式に基づく符号データを形成する。(図中には,通常フレーム符号で示す)。
一方,前記制御器106からの入力が「1」である(同図右側に示す,処理するフレームが特殊フレームである)場合には,所定のサンプル長(LPC予測の次数N分のサンプルであって,図中にはLPCサンプル長で示す)だけは前記LPC予測器102における予測処理が実行されず,予測値=0として出力され(設定値0に置き換え),入力されたフレームデータx(i)がそのまま前記符号器103に入力される。そして,この入力されたフレームデータx(i)(予測値=0としたときのLPC予測残渣信号d(i))と,残り(LPCサンプル長以降)のフレームデータx(i)に基づいて算出されたLPC予測残差信号d(i)とが,残差信号情報として符号化される。そして,前記符号器103により符号化された残差信号情報が,前記ビットストリーム生成器104において,該特殊フレームを予測する際に適用された予測係数を特定する情報(図中には,予測係数情報で示す),及び前記制御器106において生成されたヘッダと共にパッキングされ,所定の書式に基づく符号データを形成する。(図中には,特殊フレーム符号で示す)。
このような手順に基づいて生成されたビットストリーム構造の模式図を図4に示す。
同図に示すビットストリームXは,前記カウンタ107により処理フレーム数を計数し,10フレーム間隔で動作信号を前記制御部106に発信した場合,つまりは,特殊フレームが10フレームに一度挿入されるように構成したものである。
このようなビットストリームXにおいて,フレームの時間長が20msであるとすれば,特殊フレームが200msという所定間隔毎に存在することとなる。従って,このビットストリームXの再生するユーザは,200ms毎の任意の位置から「誤り伝播」を招くことなく途中再生することが可能であることが理解される。無論,途中再生に対するユーザからの要求に応じて,特殊フレームの挿入割合を変更(増減)させることも可能であることは言うまでもない。
一方,フレームごとに冗長な情報を不可する(全フレームを特殊フレームとする)場合に比べ,情報量の増加(符号化率の悪化)が約1/10程度に抑えられる。
このように,本実施形態によれば,▲1▼特殊フレームが所定の時間間隔毎にビットストリーム中に配置され,▲2▼該特殊フレームが過去のフレームに依存せずに再生可能に符号化され,▲3▼該特殊フレームのヘッダには同期符号が含まれるという特徴点を有している。
このような特徴点を有することで,本実施形態により符号化された符号化データにおいては,特殊フレームを時間的な指標(インデックス)として利用可能である。即ち,ビットストリームを任意の位置から途中再生することを所望するユーザは,その途中位置(時間)に対応する特殊フレームを検索することにより,任意の位置を特定し,その位置からの途中再生することができる。
更には,特殊フレームから途中再生するに当たり,「誤り伝播」を起こすことなく,正常に時系列信号を復号化(再生)することができる。
【0026】
次に,前述した時系列信号符号化装置Aにより生成されたビットストリームを復号化する時系列信号復号化装置の一例について,図2を参照しつつ,説明する。
以下に,図2に示す時系列信号復号化装置Bに入力されたビットストリームが復号化され,PCMデータとして出力(再生)されるまでの各部の処理について,処理の流れに沿って説明する。
【0027】
先ず,前記時系列信号復号化装置Bに入力されたビットストリームは,入力端子205を介してビットストリーム解読器204に入力される。
該ビットストリーム解読器204(前記ビットストリーム入力手段及び前記識別情報検出手段の一例)では,ビットストリームのセグメントが解読され,フレーム単位への分解と,そのフレームの種別(特殊フレームかその他(通常フレーム)か)の判別とが行われる。そして,各フレームについて,その種別に応じた以下の処理が行われる。
【0028】
(処理されるフレームが通常フレームである場合)
先ず,分解されたフレーム(のデータ)が,前記ヘッダが無い通常フレームである場合について説明する。
前記ビットストリーム解読器204で解読されたビットストリームのうち,残差信号情報(図3参照)の符号は復号器203(前記復号化手段の一例)に入力され,LPC予測残差信号d(i)に復元される。尚,該復号器203では,図1に示す前記符号器103に対応した復号処理が施される。
また,前記ビットストリーム解読器204で解読されたビットストリームのうち,予測係数情報(図3参照)の符号はLPC予測器202(前記予測手段の一例)に入力され,該LPC予測器202におけるLPC予測係数の特定に利用される。これにより,該LPC予測器202におけるLPC予測係数は,前述した時系列信号符号化装置Aにおける前記LPC予測器102(図1参照)に適用されたLPC予測係数と同一の係数となる。
そして,前記LPC予測器202の出力信号と,復号されたLPC予測残差信号d(i)とが加算器202aにより加算されてフレームデータx(i)が復号され,復号されたフレームデータx(i)がバッファ201に入力される。そして,このバッファ201からPCMデータ(時系列信号)が出力される。ここで,前記加算器202a及び前記バッファ201が,前記時系列信号出力手段の一例である。
【0029】
(処理されるフレームが特殊フレームである場合)
次に,分解されたフレームが,ヘッダを有する特殊フレームである場合について説明する。
前記ビットストリーム解読器204において,解読されたフレームにヘッダの存在が認識された(つまりは,そのフレームが特殊フレームであると判別された)場合,該ヘッダは前記制御器206に送信される。ここに,該ヘッダには,制御に関する情報が含まれるため,この情報に基づいて前記制御器206(前記時系列信号出力制御手段の一例)では,後述するような所定の制御(つまりは,符号化の手順と逆の処理)が行われる。
ここで,前記ビットストリーム解読器204で解読されたビットストリームのうち,残差信号情報(図3参照)の符号が前記復号器203により復号される点,予測係数情報(図3参照)の符号が前記LPC予測器202におけるLPC予測係数の特定に利用される点は,前述した通常フレームにおける処理と同様である。
しかしながら,特殊フレームの復号を行う場合においては,前記復号器203により復号される残差信号情報には,LPC予測残差信号だけでなく,フレームデータx(i)そのもの(予測値=0(所定の設定値)としたときのLPC予測残差信号)が含まれている。
そこで,前記ヘッダを受信した前記制御器206は,前記LPC予測器202に対して所定の制御信号を送信し,前記復号器203により復号された残差信号情報がフレームデータx(i)(つまり,前述した説明の場合であれば,i=1〜Nのサンプル)である場合には,前記LPC予測器202からの出力信号が加算されないように制御を行い(つまり,前記LPC予測器202の出力信号を0とし),フレームデータx(i)が,そのまま,前記バッファ201に出力されるようにする。一方,前記復号器203により復号された残差信号情報がLPC予測残差信号(つまり,前述した説明の場合であれば,N以降のサンプル)である場合には,通常フレームと同様,前記LPC予測器202の出力信号と,LPC予測残差信号d(i)とを加算することで,フレームデータx(i)が復号され,復号された該フレームデータx(i)が前記バッファ201に入力されるようにする。
このようにして夫々のフレームに対して所定の処理が施されることで生成されたフレームデータx(i)が前記バッファ201へ順次転送され,該バッファ201の出力信号が出力端子200を介して出力されることで,元のPCMデータの復号化が完了する。
尚,前述説明並びに図2においては,図1で説明した前記時系列信号符号化装置Aにおける前記バッファ101と対応させるべく前記バッファ201を具備する形態としたが,該バッファ201は不可欠な構成要素ではなく,該バッファ201でバッファリングすることなく,復号されたPCMデータを順次出力する形態であってもよい。但し,前述した符号化の手順において説明したように,前記時系列信号符号化装置Aにおける前記バッファ101において,各チャンネル間の相関を利用した処理(例えば,2chの音声信号に対するLch+Rch,Lch−Rchの如き処理)が実施されている場合には,該バッファ201において逆処理を実施する必要がある。
以上説明したように,当該時系列信号復号化装置Bによれば,前記時系列信号符号化装置Aにより生成されたビットストリームから時系列信号を復号するに当たり,該ビットストリームに所定間隔毎に配置される特殊フレームを時間的な指標(インデックス)として,任意の場所から途中再生することも可能であることが理解される。
また,その途中再生に係る処理においては,過去の時系列信号を使用しないで元の時系列信号を復号する構成であるため,「誤り伝播」を生ずることもない。
【0030】
(第2の実施形態)
次に,本発明の第2の実施形態に係る時系列信号符号化装置について図5を参照しつつ説明する。
ここに,第2の実施形態に係る時系列信号符号化装置Cは,図5に示すブロック図の如く具現化される。同図によりも明らかな如く,該時系列信号符号化装置Cは,バッファ101(前記フレーム区分手段の一例に該当),LPC予測器102(前記予測手段の一例に該当),減算器108(前記残差信号算出手段の一例に該当),符号器103(前記符号化手段の一例に該当),ビットストリーム生成器104(前記ビットストリーム生成手段の一例に該当),制御器106(ビットストリーム生成制御手段の一例に該当),カウンタ107(特殊フレーム選択手段の一例に該当)を具備して概略構成される。つまり,前述した第1の実施形態と略同一の構成により実現されるものである。(共通する部分の付番は同一とした)
しかしながら,前記第1の実施形態は,前記制御器106からの所定の制御信号が前記LPC予測器102に入力され,その制御指令に応じて該LPC予測器102が,所定の処理を行うことで,LPC予測係数の次数(N)に応じた所定サンプル長(図3ではLPCサンプル長で示す)のフレームデータx(i)を特殊フレームの一部として送出する構成であった。
これに対して,本実施形態は,前記バッファ部101からLPC予測係数の次数(N)に応じた所定サンプル長のフレームデータx(i)(図5では先頭PCMデータで示す)が前記制御器106に予め入力されると共に,前記制御器106からの所定の制御信号が前記符号器103に入力され,その制御指令に応じて前記符号器103に所定の処理を実行させることで,LPC予測係数の次数(N)に応じた所定サンプル長(図7ではLPCサンプル長で示す)のフレームデータx(i)を,特殊フレームのデータの一部として送出する構成である点で異なる。
以下に,当該時系列信号符号化装置Cに入力されたPCMデータ(時系列信号の一例)が符号化され,符号データとして出力されるまでの各部の処理について,処理の流れに沿って説明する。
【0031】
ここで,当該時系列信号符号化装置Cにおける前記バッファ101,前記LPC予測器102,減算器108,符号器103,前記ビットストリーム生成器104による基本的な処理,及びカウンタ107による特殊フレーム選択機能については前述説明した前記第1の実施形態と同一であるためここでは,説明を省略し,異なる処理が行われるビットストリーム生成制御機能についてのみ説明する。
【0032】
(ビットストリーム生成制御機能)
ここで,本実施形態において,前記バッファ101は,図5に示す如く,入力されるPCMデータをフレーム単位でバッファリングする機能に加え,各フレームにおける所定サンプル長のフレームデータx(i)(図5及び7では,先頭PCMデータ)を抽出して前記制御器106に入力する機能を有している。
前記バッファ101によるフレームデータx(i)の入力を前提として,前記カウンタ107からの動作指令を受信した前記制御器106では,前述した各部を以下に説明するように制御することで,前記カウンタ107により選択された特殊フレームについては,該特殊フレームより過去のフレームデータを使用することなく予測値を予測する機能を実現する。
先ず,前記カウンタ107からの動作指令を受信すると,前記制御器106において,前記符号器103の動作を制御する制御信号が発信される。また,それに合わせて,該制御器106において,今回処理されるフレームが特殊フレームであることを示すヘッダが生成され,前記ビットストリーム生成器104に送出されるのは前記第1の実施形態と同様である。しかしながら,本実施形態では,前記ヘッダに加え,前記バッファ101から入力された所定サンプル長のフレームデータx(i)(先頭PCMデータ,前記補充情報の一例)が,該ヘッダと共に前記ビットストリーム生成器104に送出される点で異なる。所定サンプル長のフレームデータx(i)及びヘッダは,前記ビットストリーム生成器106において,前記符号器103により符号化された符号,或いは予測係数情報とパッキングされることで特殊フレームを形成する。
【0033】
一方,前記制御器106から制御指令を受信した前記符号器103では,通常の符号化処理とは異なり,以下のような符号化処理が行われる。
制御指令を受信すると前記符号器103では,そのフレーム(特殊フレーム)における先頭サンプルからLPC予測の次数(上式(1)におけるNに相当)に対応するサンプルまでは,符号化が実施されない。つまり,前記減算器108から前記符号器103に入力されるLPC予測残差信号d(i)のうち,d(i)(i=1〜N)については符号化が実施されない。
この処理により,当該符号器103において,特殊フレームについては,過去のフレームの時系列信号を用いることなく算出されるLPC予測残差信号d(i)(i=N+1〜K)のみが符号化される。このように,前記ビットストリーム生成器104で生成されるビットストリームに,フレームデータx(i)(i=1〜N(先頭PCMデータ))に対応するLPC予測残差信号d(i)(i=1〜N)についての符号(残差信号情報)が含められないので,ビットストリームサイズの増加が最小限に抑えられる。
尚,特殊フレームにおいても,該特殊フレームの先頭サンプルからLPC予測の次数(上式(1)におけるNに相当)に対応するサンプル以降のサンプルについては,通常フレームと同様,所定の符号化方式に基づく符号化が実施され,しかる後に,その符号が前記ビットストリーム生成器104に出力される。
【0034】
ここで,前記符号器103において,前記制御器106からの制御信号に応じて通常フレームと特殊フレームとが作成される際の処理の流れについて,その流れを模式的示す図7を用いて説明する。
同図に示す如く,前記制御器106からの制御信号が「0」である(同図左側に示す,処理するフレームが通常フレームである)場合には,従来構成と同様,前記LPC予測器102により予測値が算出され,算出された該予測値に応じたLPC予測残差信号d(i)が算出され,しかる後に,前記符号器103において,算出された該LPC予測残差信号d(i)が,残差信号情報として符号化される。
そして,前記符号器103により符号化された残差信号情報が,前記ビットストリーム生成器104において,該通常フレームを予測する際に適用された予測係数を特定する情報(図中には,予測係数情報で示す)とパッキングされ,所定の書式に基づく符号データを形成する(図中には,通常フレーム符号で示す)。一方,前記制御器106からの入力が「1」である(同図右側に示す,処理するフレームが特殊フレームである)場合には,所定のサンプル長(LPC予測の次数N分のサンプルであって,図中にはLPCサンプル長で示す)のLPC予測残差信号d(i)は前記符号器102における符号化処理が実行されず(図中では,その状態を「符号器での処理信号」を「なし」とすることで示す),所定のサンプル長以降のLPC予測残差信号d(i)だけが前記符号器102において,残差信号情報として符号化される。
そして,前記符号器103により符号化された残差信号情報が,前記ビットストリーム生成器104において,該特殊フレームを予測する際に適用された予測係数を特定する情報(図中では,予測係数情報で示す),前記制御器106から入力される所定サンプル長のフレームデータx(i)(図中では,先頭PCMデータで示す),及び該特殊フレームのヘッダと共にパッキングされ,所定の書式に基づく符号データを形成する。(図中には,特殊フレーム符号で示す)。
このように,本実施形態では,前述した実施形態同様に,▲1▼特殊フレームが所定の時間間隔毎にビットストリーム中に配置され,▲2▼該特殊フレームが過去のフレームのデータに依存した信号を使用せずに符号化され,▲3▼該特殊フレームのヘッダには同期符号が含まれるという特徴点を有する。
その結果,本実施形態により符号化された符号化データにおいても,特殊フレームを時間的な指標(インデックス)として利用可能であり,ビットストリームの途中再生を希望するユーザは,その途中位置(時間)に対応する特殊フレームを検索することで,任意の位置からの途中再生することができる。
更には,特殊フレームから途中再生するに当たり,該特殊フレームには過去のフレームに依存した時系列信号が使用されていないため,「誤り伝播」を起こすことなく,正常に時系列信号を復号化(再生)することができる。
【0035】
次に,前述した前記時系列信号符号化装置Cにより生成されたビットストリームを復号化する時系列信号復号化装置の一例について,図6を参照しつつ,説明する。
以下に,図6に示す時系列信号復号化装置Dに入力されたビットストリームが復号化され,PCMデータとして出力(再生)されるまでの各部の処理について,処理の流れに沿って説明する。
【0036】
先ず,前記時系列信号復号化装置Dに入力されたビットストリームは,入力端子205を介してビットストリーム解読器204に入力される。
該ビットストリーム解読器204では,ビットストリームのセグメントが解読され,フレーム単位への分解と,そのフレームの種別(特殊フレームかその他(通常フレーム)か)の判別とが行われる。そして,各フレームについて,その種別に応じた以下の処理が行われる。
【0037】
(処理されるフレームが通常フレームである場合)
先ず,分解されたフレームが,ヘッダが無い通常フレームである場合について説明する。
前記ビットストリーム解読器204で解読されたビットストリームのうち,残差信号情報(図7参照)の符号は復号器203に入力され,LPC予測残差信号d(i)に復元される。尚,該復号器203では,図5に示す前記符号器103に対応した復号処理が施される。
また,前記ビットストリーム解読器204で解読されたビットストリームのうち,予測係数情報(図7参照)の符号はLPC予測器202入力され,該LPC予測器202におけるLPC予測係数の特定に利用される。これにより,該LPC予測器202におけるLPC予測係数は,前述した時系列信号符号化装置Cにおける前記LPC予測器102(図5参照)に適用されたLPC予測係数と同一の係数となる。
そして,前記LPC予測器202の出力信号と,復号されたLPC予測残差信号d(i)とが加算されることで,フレームデータx(i)が復号され,復号された該フレームデータx(i)がバッファ201に入力される。
【0038】
(処理されるフレームが特殊フレームである場合)
次に,分解されたフレームが,ヘッダを有する特殊フレームである場合について説明する。
前記ビットストリーム解読器204において,解読されたフレームにヘッダの存在が認識された(つまりは,そのフレームが特殊フレームであると判別された)場合,該ヘッダ及び所定サンプル長のフレームデータx(i)(図中には先頭PCMデータで示す)が前記制御器206に送信される。ここに,該ヘッダには,制御に関する情報が含まれるため,この情報に基づいて前記制御器206では,後述するような所定の制御(つまりは,符号化の手順と逆の処理)が行われる。
ここで,前記ビットストリーム解読器204で解読されたビットストリームのうち,残差信号情報(図7参照)の符号が前記復号器203により復号される点,予測係数情報(図7参照)の符号が前記LPC予測器202におけるLPC予測係数の特定に使用される点は,前述した通常フレームにおける処理と同様である。
しかしながら,特殊フレームの復号を行う場合においては,前記復号器203により復号される残差信号情報には,所定サンプル長のフレームデータx(i)(つまりは,先頭PCMデータであって,i=Nから過去のサンプル)に対応する情報が含まれていない。
そこで,本実施形態において特殊フレームを復号化する場合には,先ず,前記所定サンプル長のフレームデータx(i)を受信した前記制御器206から,該フレームデータx(i)がバッファ201に送出され,送出された該フレームデータx(i)が,復号化されたフレームデータx(i)の先頭サンプル(i=1〜N)として使用される。
尚,前記復号器203により復号されたLPC予測残差信号d(i)は,所定サンプル長のフレームデータx(i)(つまりは,先頭PCMデータであって,i=Nから過去のサンプル)に対応する信号が含まれていない点以外は,通常フレームと同一であり,その復号化に係る処理は通常フレームにおける処理と同様であるため,ここでは説明を省略する。
このようにして夫々のフレームに対して所定の処理を施すことにより生成されたフレームデータx(i)がバッファ201へ順次転送され,該バッファ201の出力信号が出力端子200を介して出力されることで,元のPCMデータの復号化が完了する。
尚,前述説明並びに図6においては,図5で説明した前記時系列信号符号化装置Cにおける前記バッファ101と対応させるべく前記バッファ201を具備する形態としたが,該バッファ201は不可欠な構成要素ではなく,該バッファ201でバッファリングすることなく,復号されたPCMデータを(及び前記制御器206から受信する先頭データ)順次出力する形態であってもよい。但し,前述の実施形態同様に,前記時系列信号符号化装置Cにおける前記バッファ101において,各チャンネル間の相関を利用した処理(例えば,2chの音声信号に対するLch+Rch,Lch−Rchの如き処理)が実施されている場合には,該バッファ201において逆処理を実施する必要がある。
以上説明したように,当該時系列信号復号化装置Dによれば,前記時系列信号符号化装置Cにより生成されたビットストリームから時系列信号を復号するに当たり,該ビットストリームに所定間隔毎に配置される特殊フレームを時間的な指標(インデックス)として,任意の場所から途中再生することも可能であることが理解される。
また,その途中再生に係る処理においては,他の(過去の)フレームのデータを使用しないで元の時系列信号を復号する構成であるため,「誤り伝播」を生ずることもない。
【0039】
(第3の実施形態)
次に,本発明の第3の実施形態に係る時系列信号符号化装置について図8を参照しつつ,説明する。
ここに,第3の実施形態に係る時系列信号符号化装置Eは,図8に示すブロック図の如く具現化される。同図に示す如く,該時系列信号符号化装置Eは,バッファ101(前記フレーム区分手段の一例に該当),LPC予測器102(前記予測手段の一例に該当),減算器108(前記残差信号算出手段の一例に該当),符号器103(前記符号化手段の一例に該当),ビットストリーム生成器104(前記ビットストリーム生成手段の一例に該当),制御器106(ビットストリーム生成制御手段の一例に該当),カウンタ107(特殊フレーム選択手段の一例に該当)を具備する点では,前述説明した前記時系列信号符号化装置A(第1の実施形態)と同一である(共通する部分の付番は同一とした)。
しかしながら,当該時系列信号符号化装置Eは,過去の時系列信号から現在の時系列信号を予測する予測手段として,前記LPC予測器108に加え,ピッチ予測器110を更に具備してなる点で前述した実施形態と異なる。
以下に,当該時系列信号符号化装置Eに入力されたPCMデータ(時系列信号の一例)が符号化され,符号データとして出力されるまでの各部の処理について,処理の流れに沿って説明する。
【0040】
ここで,当該時系列信号符号化装置Cにおける前記バッファ101,前記LPC予測器102,減算器108,符号器103,前記ビットストリーム生成器104による基本的な処理,及びカウンタ107による特殊フレーム選択機能については前述説明した前記第1の実施形態と同一であるためここでは,説明を省略し,新たに加えられた前記ピッチ予測器110によるピッチ予測処理,並びにそれに伴い異なる処理が行われる部分について説明する。
【0041】
(ピッチ予測器110)
当該時系列信号符号化装置Eでは,前記減算器108下流に前記ピッチ予測器110が配置される点で,前述した前記時系列信号符号化装置Aと異なる。
該ピッチ予測器110には,前記減算器108により算出されたLPC残差信号d(i)が入力され,該LPC残差信号d(i)のピッチ(周期性)を利用した予測処理(つまりは,ピッチ予測)が行われる。
このピッチ予測に関する詳細は,例えば非特許文献1や,非特許文献2等に詳しい。
尚,ピッチ予測を用いる利点は,音声・オーディオ信号等に代表される時系列信号は駆動音源情報とそれ以外の情報(音声の場合は声道情報に相当)が混在しており,LPC予測(前記LPC予測器による予測処理)が後者に対応しているのに対し,ピッチ予測は前者の予測に対応している点にあると言える。
従って,前記LPC予測器102による予測値に応じて算出されるLPC予測残差信号に対し,更にピッチ予測を施すことで,更なる高能率な予測(圧縮符号化)を期待することができる。
ピッチ予測が実施される前記ピッチ予測器110では,LPC予測残差信号d(i)のピッチLを用いて予測値
【数5】
Figure 2004271812
が下式(3)によって予測され,予測された該予測値が,前記減算器109に出力される。
【数6】
Figure 2004271812
但し,βn(n=1,2,・・,2M)はピッチ予測係数である。
尚,このピッチ予測係数βnも,前記LPC予測器102におけるLPC予測係数αn同様,予め設定された計数であっても,入力されるLPC予測残差信号d(i)に応じてその都度算出される係数を用いてもよい。また,LPC予測残差信号d(i)のピッチLは,自己相関信号を用いてその自己相関値が最も大きくなるサンプル間隔を求めることで,特定することが可能である(もちろん方法は制限しない)。
【0042】
(減算器109)
該減算器109では,前記ピッチ予測器110により予測された前記予測信号
【数7】
Figure 2004271812
と,前記LPC予測器102から直接入力されたLPC予測残差信号d(i)とを用い,下式4の如く,ピッチ予測残差信号e(i)が算出される。
【数8】
Figure 2004271812
そして,上式4により算出されたピッチ予測残差信号e(i)が,前記符号器103に出力される。
【0043】
以上説明した,ピッチ予測を用いた符号化に係る基本的構成並びに動作については,従来公知の時系列信号符号化装置と同様である。
しかしながら,本実施形態では,前述したように,前記特殊フレーム機能(前記カウンタ107)により選択された該特殊フレームについては,予測値を予測するに当たり,該特殊フレームより過去の(他の)フレームデータを使用しないで予測値を所定の設定値(設定信号,=0)に置き換えるビットストリーム生成制御機能(前記ビットストリーム生成制御手段の一例に該当)を具備する点を特徴とする。
そこで,以下に,前記ピッチ予測器110により予測された前記予測信号を符号化する場合における前記ビットストリーム生成制御機能について詳説する。
【0044】
(ビットストリーム生成制御機能)
前記カウンタ107からの動作指令を受信した前記制御器106では,前述した各部を以下のように制御することで,前記カウンタ107により選択された特殊フレームについては,該特殊フレームより過去のフレームデータを使用することなく予測値を予測する機能を実現する。
先ず,前記カウンタ107からの動作指令を受信すると,前記制御器106において,前記LPC予測器102及び前記ピッチ予測器110の動作を制御する制御信号が発信される。また,それに合わせて,該制御器106において,今回処理されるフレームが特殊フレームであることを示すヘッダが生成され,前記ビットストリーム生成器106に送出されるのは前記第1の実施形態と同様である。
一方,前記制御器106から制御指令を受信すると前記LPC予測器102では,通常の予測処理とは異なる以下のような予測処理が行われる。
制御指令を受信すると前記LPC予測器102では,そのフレーム(特殊フレーム)における先頭サンプルからLPC予測の次数(上式(1)におけるNに相当)に対応するサンプルまでは,LPC予測が実施されない。具体的には,予測値が所定の設定値(=0)に置き換えられれ,LPC残差信号d(i)=フレームデータx(i)(i=1〜N)とする処理が行われる。
この処理により,当該LPC予測器102において,特殊フレームについては,過去のフレームの信号を用いることなく,現在のフレーム内の信号のみから予測値が特定され,符号化された時系列信号の途中再生に対応可能なフレームのデータが生成される。
尚,特殊フレームにおいても,該特殊フレームの先頭サンプルからLPC予測の次数(上式(1)におけるNに相当)に対応するサンプル以降のサンプルについては,LPC予測をするために必要な過去のサンプルがフレーム内に存在するため,従来同様,LPC予測により予測値が算出される。
他方,前記制御器106から制御指令を受信した前記ピッチ予測器110でも,前記LPC予測器102と同様の思想に基づき,通常の予測処理とは異なる以下のような予測処理が行われる。
制御指令を受信した前記ピッチ予測器110では,そのフレーム(特殊フレーム)の先頭のサンプルからピッチ予測の次数(上式(3)における2Mに相当)に対応するサンプルまでは,ピッチ予測が実施されない。具体的には,ピッチ予測残差信号e(i)=LPC予測残差信号d(i)(i=1〜L+M)とする処理が行われる。
この処理も,前述した前記LPC予測器102同様,前記ピッチ予測器110において,特殊フレームについては,過去のフレームの信号を用いることなく,現在のフレーム内の時系列信号のみから予測値が算出されることを示しており,途中再生に対応したフレームのデータが生成される。
尚,特殊フレームにおいても,フレームの先頭サンプルからピッチ予測の次数(上式(3)における2Mに相当)に対応するサンプル以降のサンプルについては,LPC予測をするために必要な過去のサンプルがフレーム内に存在するため,従来同様,ピッチ予測により予測値が算出される。
ここで,前記符号器103において,前記制御器106からの制御信号に応じて通常フレームと特殊フレームとが作成される際の処理の流れについて,その流れを模式的示す図10を用いて説明する。
同図に示す如く,前記制御器106から両方の予測器に対して入力された制御信号が,共に「0」である場合には,(同図左側に示す,処理するフレームが通常フレームである)場合には,従来構成と同様,前記LPC予測器102により予測値が算出され,算出された該予測値に応じたLPC予測残差信号d(i)が,更には,前記ピッチ側器110により予測値が算出され,算出された該予測値に応じたピッチ予測残差信号e(i)が算出され,しかる後に,前記符号器103において,算出された該ピッチ予測残差信号e(i)が,残差信号情報として符号化される。
そして,前記符号器103により符号化された残差信号情報が,前記ビットストリーム生成器104において,該通常フレームを予測する際に適用された予測係数を特定する情報(図中には,予測係数情報で示す)とパッキングされ,所定の書式に基づく符号データを形成する。(図中には,通常フレーム符号で示す)。
一方,同図右側に示す,処理するフレームが特殊フレームである場合には,制御信号の状況に応じて以下の3つの条件が考え得る。
先ず,前記制御器106から両方の予測器に対して入力された制御信号が,共に「1」である場合には,LPC予測及びピッチ予測が実施されずに,予測値が設定値=0に置き換えられるため,先頭の所定のサンプル長(LPC予測の次数N分のサンプルであって,図中にはLPCサンプル長で示す)分だけ,入力されたフレームデータx(i)(予測値=0としたときのLPC予測残差信号d(i))が前記符号器103の入力信号となる。このときの前記符号器103によって符号化された残差信号情報が,前記補充情報の一例である。
次に,前記ピッチ予測器110に対する制御信号のみが「1」である場合には,ピッチ予測だけが実施されないため,その間は,LPC予測残差信号d(i)が前記符号器103の入力信号となる。
最後に,両方の予測器に対して入力された制御信号が,共に「0」である場合には,LPC予測及びピッチ予測共が実施されるため,前述した通常フレームの場合と同様に,ピッチ予測残差信号e(i)が前記符号器103の入力信号となる。
このように制御信号の状況に応じて切り替えられた入力信号が,前記符号器103により,残差信号情報として符号化され,しかる後に,前記符号器103により符号化された残差信号情報が,前記ビットストリーム生成器104において,該特殊フレームを予測する際に適用された予測係数を特定する情報(図中には,予測係数情報で示す),及び該特殊フレームのヘッダと共にパッキングされ,所定の書式に基づく符号データを形成する。(図中には,特殊フレーム符号で示す)。
このように,本実施形態では,前述した実施形態同様に,特殊フレームにおいては,▲1▼特殊フレームが所定の時間間隔毎にビットストリーム中に配置され,▲2▼該特殊フレームが過去のフレームに依存した信号を使用せずに符号化され,▲3▼該特殊フレームのヘッダには同期符号が含まれるという特徴点を有する。
その結果,本実施形態により符号化された符号化データにおいても,特殊フレームを時間的な指標(インデックス)として利用可能であり,ビットストリームの途中再生を行う場合,その途中位置(時間)に対応する特殊フレームを検索することで,任意の位置からの途中再生することができる。
また,特殊フレームから途中再生するに当たり,該特殊フレームには過去のフレームに依存した時系列信号が使用されていないため,「誤り伝播」を起こすことなく,正常に時系列信号を復号化(再生)することができる。更に,「誤り伝播」防止のために補充する情報を,全く別個に設けるのではなく,特殊フレームの先頭の一部についての通常の前記LPC予測残差信号d(i)の符号(残差信号情報)に置き換わるものであるので,ビットストリームのサイズの増加が最小限に抑えられる。
また,本実施形態は,前述した実施形態に対してピッチ予測器を新たに付加することで,更なる高能率な圧縮符号化が期待できる。
尚,通常はLPC予測の次数(N)と,ピッチ予測におけるピッチ(L)との比較では,通常後者(ピッチ)の方が大きいため,図10並びに前述した説明においてはその大小関係を前提として記述しているが,無論,LPC予測の次数(N)が,ピッチ予測におけるピッチ(L)よりも大きい場合も考え得る。
【0045】
次に,前述した時系列信号符号化装置Eにより生成されたビットストリームを復号化する時系列信号復号化装置の一例について,図9を参照しつつ,説明する。
以下に,図9に示す時系列信号復号化装置Fに入力されたビットストリームが復号化され,PCMデータとして出力(再生)されるまでの各部の処理について,処理の流れに沿って説明する。
【0046】
先ず,前記時系列信号復号化装置Fに入力されたビットストリームは,入力端子205を介してビットストリーム解読器204に入力される。
該ビットストリーム解読器204(前記ビットストリーム入力手段及び前記識別情報検出手段の一例)では,ビットストリームのセグメントが解読され,フレーム単位への分解と,そのフレームの種別(特殊フレームかその他(通常フレーム)か)の判別とが行われる。そして,各フレームについて,その種別に応じた以下の処理が行われる。
【0047】
(処理されるフレームが通常フレームである場合)
先ず,分解されたフレームが,ヘッダが無い通常フレームである場合について説明する。
第一に,分解された通常フレームに基づいてピッチ予測残差信号e(i)の復号処理が行われる。具体的には,前記ビットストリーム解読器204で解読されたビットストリームのうち,残差信号情報(図10参照)の符号が復号器203に入力され,ピッチ予測残差信号e(i)に復元される。尚,該復号器203(前記復号化手段の一例)では,図1に示す前記符号器103に対応した復号処理が施される。
また,前記ビットストリーム解読器204で解読されたビットストリームのうち,予測係数情報(図10参照)はピッチ予測器207入力され,該ピッチ予測器207におけるピッチ予測係数の特定に利用される。これにより,該ピッチ予測器207におけるピッチ予測係数は,前述した時系列信号符号化装置Eにおける前記ピッチ予測器110(図8参照,前記予測手段の一例)に適用されたピッチ予測係数と同一の係数となる。
そして,前記ピッチ予測器207の出力信号と,復号されたピッチ予測残差信号e(i)とを加算器207aにより加算することでLPC予測残差信号d(i)が復号される。
続いて,復号された該LPC予測残差信号d(i)に基づいてフレームデータx(i)の復号処理が行われる。そのため,前記ビットストリーム解読器204で解読されたビットストリームのうち,予測係数情報(図10参照)がLPC予測器202(前記予測手段の一例)に入力され,該LPC予測器202におけるLPC予測係数の特定に利用される。これにより,該LPC予測器202におけるLPC予測係数は,前述した時系列信号符号化装置Eにおける前記LPC予測器102(図8参照)に適用されたLPC予測係数と同一の係数となる。
そして,前記LPC予測器202の出力信号と,復号されたLPC予測残差信号d(i)とを加算器202aにより加算することで,フレームデータx(i)が復号され,復号された該フレームデータx(i)がバッファ201に入力され,該バッファ201からPCMデータ(時系列信号)として出力される。ここで,前記加算器207a,202a及び前記バッファ201が時系列信号出力手段の一例である。
【0048】
(処理されるフレームが特殊フレームである場合)
次に,分解されたフレームが,ヘッダを有する特殊フレームである場合について説明する。
前記ビットストリーム解読器204において,解読されたフレームにヘッダの存在が認識された(つまりは,そのフレームが特殊フレームであると判別された)場合,該ヘッダは前記制御器206に送信される。ここに,該ヘッダには,制御に関する情報が含まれるため,この情報に基づいて前記制御器206では,後述するような所定の制御(つまりは,符号化の手順と逆の処理)が行われる。
ここで,前記ビットストリーム解読器204で解読されたビットストリームのうち,残差信号情報(図10参照)の符号が前記復号器203により復号される点,予測係数情報(図10参照)の符号が,前記LPC予測器202におけるLPC予測係数,並びに前記ピッチ予測器207におけるピッチ予測係数の特定に利用される点は,前述した通常フレームにおける処理と同様である。
しかしながら,本実施形態における特殊フレームの場合,前記復号器203により復号される残差信号情報には,ピッチ予測残差信号e(i)だけでなく,先頭の一部にLPC予測残差信号d(i)及びフレームデータx(i)そのもの(前記補充情報の一例)が含まれている。
そこで,前記ヘッダを受信した前記制御器206は,前記LPC予測器202及び前記ピッチ予測器207に対して所定の制御信号を送信し,以下のように夫々の出力信号(予測値)を制御する。
【0049】
(ピッチ予測器207)
前記制御器206からの制御信号を受信した前記ピッチ予測器207において,前記復号器203により復号された残差信号情報のうち,ピッチ予測残差信号e(i)以外の信号(つまり,前述した説明の場合であれば,i=L+Mから過去のサンプルであるフレームデータx(i)及びLPC予測残差信号d(t))には,前記ピッチ予測器207からの出力信号が加算されないように制御を行い(つまり,前記ピッチ予測器207の出力信号を設定値=0に置き換え),フレームデータx(i)並びにLPC予測残差信号d(i)が,そのまま,前記LPC予測器202に出力されるようにする。一方,前記復号器203により復号された残差信号情報がピッチ予測残差信号e(i)である場合(つまり,前述した説明の場合であれば,i=L+M以降のサンプル)には,通常フレームと同様,前記ピッチ予測器207の出力信号と,ピッチ予測残差信号e(i)とを加算することでLPC予測残差信号d(i)が復号されるよう制御を行う。
【0050】
(LPC予測器202)
他方,前記制御器206からの制御信号を受信した前記LPC予測器202においては,前記ピッチ予測器207により復号された残差信号情報がLPC予測残差信号d(i)以外の信号(つまり,前述した説明の場合であれば,i=Nから過去のサンプルであるフレームデータx(i))である場合には,前記LPC予測器202からの出力信号が加算されないように制御を行い(つまり,前記LPC予測器202の出力信号を設定値=0に置き換え),フレームデータx(i)が,そのまま,前記バッファ201に出力されるようにする。一方,前記ピッチ予測器207により復号された残差信号情報がLPC予測残差信号d(i)である場合(つまり,前述した説明の場合であれば,N以降のサンプル)には,通常フレームと同様,前記LPC予測器202の出力信号と,LPC予測残差信号d(i)とを加算することで元のフレームデータx(i)が復号され,復号されたフレームデータx(i)が前記バッファ201に入力されるようにする。
このようにして夫々のフレームに対して所定の処理が施されることで生成されたフレームデータx(i)がバッファ201へ順次転送され,該バッファ201の出力信号が出力端子200を介して出力されることで,PCMデータの復号化が完了する。
尚,前述説明並びに図9においては,図8で説明した前記時系列信号符号化装置Eにおける前記バッファ101と対応させるべく前記バッファ201を具備する形態としたが,該バッファ201は不可欠な構成要素ではなく,該バッファ201でバッファリングすることなく,復号されたPCMデータを順次出力する形態であってもよい。但し,前述した符号化の手順において説明したように,前記時系列信号符号化装置Aにおける前記バッファ101において,各チャンネル間の相関を利用した処理(例えば,2chの音声信号に対するLch+Rch,Lch−Rchの如き処理)が実施されている場合には,該バッファ201において逆処理を実施する必要がある。
以上説明したように,当該時系列信号復号化装置Fによれば,前記時系列信号符号化装置Eにより生成されたビットストリームから時系列信号を復号するに当たり,該ビットストリームに所定間隔毎に配置される特殊フレームを時間的な指標(インデックス)として,任意の場所から途中再生することも可能であることが理解される。
また,その途中再生に係る処理においては,過去の(他の)フレームのデータを使用しないで元の時系列信号を復号する構成であるため,「誤り伝播」を生ずることもない。
【0051】
(第4の実施形態)
次に,本発明の第4の実施形態に係る時系列信号符号化装置について図11を参照しつつ,説明する。
ここに,第4の実施形態に係る時系列信号符号化装置Gは,図11に示すブロック図の如く具現化される。同図によりも明らかな如く,該時系列信号符号化装置Gは,バッファ101(前記フレーム区分手段の一例に該当),LPC予測器102(前記予測手段の一例に該当),減算器108(前記残差信号算出手段の一例に該当),ピッチ予測器110(前記予測手段の一例に該当),減算器109(前記残差信号算出手段の一例に該当),符号器103(前記符号化手段の一例に該当),ビットストリーム生成器104(前記ビットストリーム生成手段の一例に該当),制御器106(ビットストリーム生成制御手段の一例に該当),カウンタ107(特殊フレーム選択手段の一例に該当)を具備して概略構成される。つまり,前述した第3の実施形態と略同一の構成により実現されるものである。(共通する部分の付番は同一とした)
しかしながら,前記第3の実施形態は,前記制御器106からの所定の制御信号が前記LPC予測器102及び前記ピッチ予測器110に入力され,その制御指令に応じて該LPC予測器102及びピッチ予測器110が,所定の処理を行うことで,LPC予測係数の次数(N)及びピッチ予測係数の次数(2M)に応じた所定サンプル長のフレームデータx(i)及びLPC予測残債信号d(i)を特殊フレームの一部として送出する構成であった。
これに対して,本実施形態は,前記バッファ部101から所定サンプル長のフレームデータx(i)(図11では先頭PCMデータで示す)が前記制御器106に予め入力されると共に,前記制御器106からの所定の制御信号が前記LPC予測器102及び前記ピッチ予測器110に入力され,その制御指令に応じて該LPC予測器102及びピッチ予測器110が,所定の処理を行うことで,LPC予測係数の次数(N)及びピッチ予測係数の次数(2M)に応じた所定サンプル長のフレームデータx(i)及びLPC予測残債信号d(i)を,特殊フレームの一部として送出する構成である点で異なる。
以下に,当該時系列信号符号化装置Gに入力されたPCMデータ(時系列信号の一例)が符号化され,符号データとして出力されるまでの各部の処理について,処理の流れに沿って説明する。
【0052】
ここで,当該時系列信号符号化装置Gにおける前記バッファ101,前記LPC予測器102,前記減算器108,前記ピッチ予測器110,前記減算器109,符号器103,前記ビットストリーム生成器104による基本的な処理,及びカウンタ107による特殊フレーム選択機能は前述説明した前記第3の実施形態と同一であるためここでは,説明を省略し,異なる処理が行われるビットストリーム生成制御機能についてのみ説明する。
【0053】
(ビットストリーム生成制御機能)
ここで,本実施形態において,前記バッファ101は,図11に示す如く,入力されるPCMデータをフレーム単位でバッファリングする機能に加え,各フレームにおける所定サンプル長のフレームデータx(i)(図11及び13では,先頭PCMデータ)を抽出して前記制御器106に入力する機能を有している。前記バッファ101によるフレームデータx(i)の入力を前提として,前記カウンタ107からの動作指令を受信した前記制御器106では,前述した各部を以下のように制御することで,前記カウンタ107により選択された特殊フレームについては,該特殊フレームより過去のフレームデータを使用することなく予測値を予測する機能を実現する。
先ず,前記カウンタ107からの動作指令を受信すると,前記制御器106において,前記ピッチ予測器110及び前記符号器103の動作を制御する制御信号が発信される。また,それに合わせて,該制御器106において,今回処理されるフレームが特殊フレームであることを示すヘッダが生成され,前記ビットストリーム生成器106に送出されるのは前記第3の実施形態と同様である。しかしながら,本実施形態では,前記ヘッダに加え,前記バッファ101から入力された所定サンプル長のフレームデータx(i)(先頭PCMデータ,前記補充情報の一例)が,該ヘッダと共に前記ビットストリーム生成器104に送出される点で異なる。所定サンプル長のフレームデータx(i)及びヘッダは,前記ビットストリーム生成器106において,前記符号器103により符号化された符号,或いは予測係数情報とパッキングされることで特殊フレームを形成する。
一方,前記制御器106から制御指令を受信すると前記ピッチ予測器110では,通常の予測処理とは異なる以下のような予測処理が行われる。
制御指令を受信すると前記ピッチ予測器107では,そのフレーム(特殊フレーム)の先頭サンプルからピッチ予測の次数(上式(3)における2Mに相当)に対応するサンプルまでは,ピッチ予測が実施されず,それに対応する残差信号情報(符号)はビットストリームに含められない。具体的には,ピッチ予測残差信号e(i)=LPC予測残差信号d(i)(i=1〜L+M)とする処理が行われる。
尚,フレームの先頭サンプルからピッチ予測の次数(上式(3)における2Mに相当)に対応するサンプル以降のサンプルについては,ピッチ予測をするために必要な過去のサンプルがフレーム内に存在するため,従来同様,ピッチ予測により予測値が算出される。
他方,前記制御器106から制御指令を受信した前記符号器103でも,前記ピッチ予測器110と同様の思想に基づき,通常の符号化処理とは異なる以下のような符号化処理が行われる。
具体的には,制御指令を受信すると前記符号器103では,そのフレーム(特殊フレーム)における先頭サンプルからLPC予測の次数(上式(1)におけるNに相当)に対応するサンプルまでは,符号化が実施されない。つまり,前記減算器108から前記符号器103に入力されるピッチ予測残差信号e(i)のうち,e(i)(i=1〜N)については符号化が実施されない。
この処理により,当該符号器103において符号化されるピッチ予測残差信号e(i)から,過去のフレームの信号を取り除くことが可能となる。つまり,当該符号器103による符号の演算において,特殊フレームについては,過去のフレームに依存する信号を不使用とすることで,符号化された時系列信号を途中再生する状況に対応したフレームになり得る。
尚,特殊フレームにおいても,該特殊フレームの先頭サンプルからLPC予測の次数(上式(1)におけるNに相当)に対応するサンプル以降のサンプルについては,従来同様,所定の符号化方式に基づく符号化が実施され,しかる後に,その符号が前記ビットストリーム生成器104に出力される。
【0054】
ここで,前記符号器103において,前記制御器106からの制御信号に応じて通常フレームと特殊フレームとが作成される際の処理の流れについて,その流れを模式的示す図13を用いて説明する。
同図に示す如く,前記制御器106から前記ピッチ予測器110及び前記符号器103に対して入力された制御信号が,共に「0」である(同図左側に示す,処理するフレームが通常フレームである)場合には,従来構成と同様,前記LPC予測器102により予測値が算出され,算出された該予測値に応じたLPC予測残差信号d(i)が,更には,前記ピッチ側器110により予測値が算出され,算出された該予測値に応じたピッチ予測残差信号e(i)が算出され,しかる後に,前記符号器103において,算出された該ピッチ予測残差信号e(i)が,残差信号情報として符号化される。
そして,前記符号器103により符号化された残差信号情報が,前記ビットストリーム生成器104において,該通常フレームを予測する際に適用された予測係数を特定する情報(図中には,予測係数情報で示す)とパッキングされ,所定の書式に基づく符号データを形成する。(図中には,通常フレーム符号で示す)。
一方,同図右側に示す,処理するフレームが特殊フレームである場合には,制御信号の状況に応じて以下の3つの条件が考え得る。
先ず,前記制御器106から前記ピッチ予測器110及び前記符号器103に対して入力された制御信号が,共に「1」である場合には,ピッチ予測及び符号化処理が実施されないため,所定のサンプル長(LPC予測の次数N分のサンプルであって,図中にはLPCサンプル長で示す)だけ,前記符号器103に対する入力信号がない状態となる(図中では,その状態を「なし」により示す)。
次に,前記ピッチ予測器110に対する制御信号のみが「1」である場合には,ピッチ予測だけが実施されないため,その間は,LPC予測残差信号d(i)が前記符号器103の入力信号となる。
最後に,前記制御器106から前記ピッチ予測器110及び前記符号器103に対して入力された制御信号が,共に「0」である場合には,ピッチ予測及び符号化処理が共に実施されるため,前述した通常フレームの場合と同様に,ピッチ予測残差信号e(i)が前記符号器103の入力信号となる。
このように制御信号の状況に応じて切り替えられた入力信号が,前記符号器103により,残差信号情報として符号化される。そして,前記符号器103により符号化された残差信号情報が,前記ビットストリーム生成器104において,該特殊フレームを予測する際に適用された予測係数を特定する情報(図中には,予測係数情報で示す),前記制御器106から入力される所定サンプル長のフレームデータx(i)(図中では,先頭PCMサンプルデータで示す)及び該特殊フレームのヘッダと共にパッキングされ,所定の書式に基づく符号データを形成する。(図中には,特殊フレーム符号で示す)。
このように,本実施形態では,前述した実施形態同様に,特殊フレームにおいては,▲1▼特殊フレームが所定の時間間隔毎にビットストリーム中に配置され,▲2▼該特殊フレームが過去のフレームに依存した信号を使用せずに符号化され,▲3▼該特殊フレームのヘッダには同期符号が含まれるという特徴点を有することとなる。
その結果,本実施形態により符号化された符号化データにおいても,特殊フレームを時間的な指標(インデックス)として利用可能であり,ビットストリームの途中再生を希望するユーザは,その途中位置(時間)に対応する特殊フレームを検索することで,任意の位置からの途中再生することができる。
また,特殊フレームから途中再生するに当たり,該特殊フレームには過去のフレームに依存した時系列信号が使用されていないため,従来構成では問題となっていた「誤り伝播」を起こすことなく,正常に時系列信号を復号化(再生)することができる。
更には,前述した実施形態に対して更にピッチ予測器を新たに付加することで,更なる高能率な圧縮符号化が期待できる。
尚,通常はLPC予測の次数(N)と,ピッチ予測におけるピッチ(L)との比較では,通常後者(ピッチ)の方が大きいため,図10並びに前述した説明においてはその大小関係を前提として記述しているが,無論,LPC予測の次数(N)が,ピッチ予測におけるピッチ(L)よりも大きい場合も考え得る。
【0055】
次に,前述した前記時系列信号符号化装置Gにより生成されたビットストリームを復号化する時系列信号復号化装置の一例について,図12を参照しつつ,説明する。
以下に,図12に示す時系列信号復号化装置Fに入力されたビットストリームが復号化され,PCMデータとして出力(再生)されるまでの各部の処理について,処理の流れに沿って説明する。
【0056】
先ず,前記時系列信号復号化装置Hに入力されたビットストリームは,入力端子205を介してビットストリーム解読器204に入力される。
該ビットストリーム解読器204では,ビットストリームのセグメントが解読され,フレーム単位への分解と,そのフレームの種別(特殊フレームかその他(通常フレーム)か)の判別とが行われる。そして,各フレームについて,その種別に応じた以下の処理が行われる。。
【0057】
(処理されるフレームが通常フレームである場合)
先ず,分解されたフレームが,ヘッダが無い通常フレームである場合について説明する。
第一に,分解された通常フレームに基づいてピッチ予測残差信号e(i)の復号処理が行われる。具体的には,前記ビットストリーム解読器204で解読されたビットストリームのうち,残差信号情報(図13参照)の符号が復号器203に入力され,ピッチ予測残差信号e(i)に復元される。尚,該復号器203では,図11に示す前記符号器103に対応した復号処理が施される。
また,前記ビットストリーム解読器204で解読されたビットストリームのうち,予測係数情報(図13参照)はピッチ予測器207入力され,該ピッチ予測器207におけるピッチ予測係数の特定に利用される。これにより,該ピッチ予測器207におけるピッチ予測係数は,前述した時系列信号符号化装置Gにおける前記ピッチ予測器110(図11参照)に適用されたピッチ予測係数と同一の係数となる。
そして,前記ピッチ予測器207の出力信号と,復号されたピッチ予測残差信号e(i)とを加算することでLPC予測残差信号d(i)が復号される。
続いて,復号された該LPC予測残差信号d(i)に基づいてフレームデータx(i)の復号処理が行われる。そのため,前記ビットストリーム解読器204で解読されたビットストリームのうち,予測係数情報(図13参照)がLPC予測器202に入力され,該LPC予測器202におけるLPC予測係数の特定に利用される。これにより,該LPC予測器202におけるLPC予測係数は,前述した時系列信号符号化装置Gにおける前記LPC予測器102(図11参照)に適用されたLPC予測係数と同一の係数となる。
そして,前記LPC予測器202の出力信号と,復号されたLPC予測残差信号d(i)とを加算することで,フレームデータx(i)が復号され,復号されたフレームデータx(i)がバッファ201に入力される。
【0058】
(処理されるフレームが特殊フレームである場合)
次に,分解されたフレームが,ヘッダを有する特殊フレームである場合について説明する。
前記ビットストリーム解読器204において,解読されたフレームにヘッダの存在が認識された(つまりは,そのフレームが特殊フレームであると判別された)場合,該ヘッダは前記制御器206に送信される。ここに,該ヘッダには,制御に関する情報が含まれるため,この情報に基づいて前記制御器206では,後述するように所定の制御(つまりは,復号化の手順と逆の処理)が行われる。
ここで,前記ビットストリーム解読器204で解読されたビットストリームのうち,残差信号情報(図13参照)の符号が前記復号器203により復号される点,予測係数情報(図13参照)の符号が,前記LPC予測器202におけるLPC予測係数,並びに前記ピッチ予測器207におけるピッチ予測係数の特定に利用される点は,前述した通常フレームにおける処理と同様である。
しかしながら,本実施形態における特殊フレームの場合,前記復号器203により復号される残差信号情報には,ピッチ予測残差信号e(i)だけでなく,LPC予測残差信号d(i)が含まれ,更には,所定サンプル長のフレームデータx(i)(つまりは,先頭PCMデータであって,i=Nから過去のサンプル)が含まれていない。
そこで,前記ヘッダを受信した前記制御器206は,先ず,前記ピッチ予測器207に対して所定の制御信号を送信し,以下のように出力信号(予測値)を制御する。
前記制御器206からの制御信号を受信した前記ピッチ予測器207において,前記復号器203により復号された残差信号情報がピッチ予測残差信号e(i)以外の信号(つまり,前述した説明の場合であれば,i=N〜L+Mのサンプルであって,LPC予測残差信号d(i))である場合には,前記ピッチ予測器207からの出力信号が加算されないように制御を行い(つまり,前記ピッチ予測器207の出力信号を0に置き換え),LPC予測残差信号d(i)が,そのまま,前記LPC予測器102に出力されるようにする。一方,前記復号器203により復号された残差信号情報がピッチ予測残差信号e(i)である場合(つまり,前述した説明の場合であれば,i=L+M以降のサンプル)には,通常フレームと同様,前記ピッチ予測器207の出力信号と,ピッチ予測残差信号e(i)とを加算することでLPC予測残差信号d(i)が復号されるよう制御を行う。
ここで,前述したように,本実施形態においては,前記復号器203により復号される残差信号情報に,所定サンプル長のフレームデータx(i)(つまりは,先頭PCMデータであって,i=Nから過去のサンプル)に対応する情報が含まれていない。
そこで,本実施形態において特殊フレームを復号化する場合には,先ず,前記所定サンプル長のフレームデータx(i)を受信した前記制御器206から,該フレームデータx(i)がバッファ201に送出され,送出された該フレームデータx(i)が,復号化されたフレームデータx(i)の先頭サンプルとして使用される。
尚,前記ピッチ予測器207により復号されたLPC予測残差信号d(i)は,所定サンプル長のフレームデータx(i)(つまりは,先頭PCMデータであって,i=Nから過去のサンプル)に対応する信号が含まれていない点以外は,通常フレームと同一であり,その復号化に係る処理は通常フレームにおける処理と同様であるため,ここでは説明を省略する。
このようにして夫々のフレームに対して所定の処理を施すことにより生成されたフレームデータx(i)が,バッファ201へ順次転送され,該バッファ201の出力信号が出力端子200を介して出力されることで,PCMデータの復号化が完了する。
尚,前述説明並びに図12においては,図11で説明した前記時系列信号符号化装置Gにおける前記バッファ101と対応させるべく前記バッファ201を具備する形態としたが,該バッファ201は不可欠な構成要素ではなく,該バッファ201でバッファリングすることなく,復号されたPCMデータを順次出力する形態であってもよい。但し,前述した符号化の手順において説明したように,前記時系列信号符号化装置Gにおける前記バッファ101において,各チャンネル間の相関を利用した処理(例えば,2chの音声信号に対するLch+Rch,Lch−Rchの如き処理)が実施されている場合には,該バッファ201において逆処理を実施する必要がある。
以上説明したように,当該時系列信号復号化装置Hによれば,前記時系列信号符号化装置Gにより生成されたビットストリームから時系列信号を復号するに当たり,該ビットストリームに所定間隔毎に配置される特殊フレームを時間的な指標(インデックス)として,任意の場所から途中再生することも可能であることが理解される。
また,その途中再生に係る処理においては,過去の時系列信号を使用しないで元の時系列信号を復号する構成であるため,「誤り伝播」を生ずることもない。
【0059】
(第5の実施形態)
次に,本発明の第5の実施形態に係る時系列信号符号化装置について図14を参照しつつ,説明する。
ここに,第5の実施形態に係る時系列信号符号化装置Iは,図14に示すブロック図の如く具現化される。同図によりも明らかな如く,該時系列信号符号化装置Iは,バッファ101(前記フレーム区分手段の一例に該当),LPC予測器102(前記予測手段の一例に該当),減算器108(前記残差信号算出手段の一例に該当),ピッチ予測器110(前記予測手段の一例に該当),減算器109(前記残差信号算出手段の一例に該当),符号器103(前記符号化手段の一例に該当),ビットストリーム生成器104(前記ビットストリーム生成手段の一例に該当),制御器106(ビットストリーム生成制御手段の一例に該当),カウンタ107(特殊フレーム選択手段の一例に該当)を具備して概略構成される。つまり,前述した第3の実施形態と略同一の構成により実現されるものである。(共通する部分の付番は同一とした)
しかしながら,前記第3の実施形態は,前記制御器106からの所定の制御信号が前記LPC予測器102及び前記ピッチ予測器110に入力され,その制御指令に応じて該LPC予測器102及びピッチ予測器110が,所定の処理を行うことで,LPC予測係数の次数(N)及びピッチ予測係数の次数(2M)に応じた所定サンプル長のフレームデータx(i)及びLPC予測残債信号d(i)を特殊フレームの一部として送出する構成であった。
これに対して,本実施形態は,前記バッファ部101から所定サンプル長のフレームデータx(i)(図11では先頭PCMデータで示す)が前記制御器106に予め入力され,該制御器106において,前記カウンタ107からの動作指令に応じて該フレームデータx(i)を前記ヘッダと共に前記ビットストリーム生成器104に出力し,更には前記符号器103に所定の処理を実行させることで,LPC予測係数の次数(N)及びピッチ予測係数の次数(2M)に応じた所定サンプル長のフレームデータx(i)及びLPC予測残債信号d(i)を,特殊フレームの一部として送出する構成である点で異なる。
以下に,当該時系列信号符号化装置Gに入力されたPCMデータ(時系列信号の一例)が符号化され,符号データとして出力されるまでの各部の処理について,処理の流れに沿って説明する。
【0060】
ここで,当該時系列信号符号化装置Gにおける前記バッファ101,前記LPC予測器102,前記減算器108,前記ピッチ予測器110,前記減算器109,前記符号器103,前記ビットストリーム生成器104による基本的な処理,及びカウンタ107による特殊フレーム選択機能は前述説明した前記時系列信号符号化装置Eと同一であるためここでは,説明を省略し,異なる処理が行われるビットストリーム生成制御機能についてのみ説明する。
【0061】
(ビットストリーム生成制御機能)
前記カウンタ107からの動作指令を受信した前記制御器106では,各部を以下のように制御することで,前記カウンタ107により選択された特殊フレームについては,該特殊フレームより過去のフレームデータを使用することなく予測値を予測する機能を実現する。
先ず,前記カウンタ107からの動作指令を受信すると,前記制御器106において,前記符号器103の動作を制御する制御信号が発信される。また,それに合わせて,該制御器106において,今回処理されるフレームが特殊フレームであることを示すヘッダが生成され,前記ビットストリーム生成器106に送出されるのは前記第3の実施形態と同様である。
一方,前記制御器106から制御指令を受信した前記符号器103では,通常の符号化処理とは異なる以下のような符号化処理が行われる。
制御指令を受信すると前記符号器103では,そのフレーム(特殊フレーム)の先頭サンプルからピッチ予測の次数(上式(3)における2Mに相当)に対応するサンプルまでは,符号化が実施されない。つまり,前記減算器108から前記符号器103に入力されるLPC予測残差信号d(i)のうち,d(i)(i=1〜L+M)については符号化が実施されず,それに対応する残差信号情報(符号)はビットストリームに含められない。
この処理により,当該符号器103において,特殊フレームについては,過去のフレームの信号を用いることなく算出されるピッチ予測残差信号e(i)のみが符号化されるので,符号化された時系列信号は途中再生に対応したデータとなる。
尚,特殊フレームにおいても,該特殊フレームの先頭サンプルからピッチ予測の次数(上式(3)における2Mに相当)に対応するサンプル以降のサンプルについては,通常フレームと同様,所定の符号化方式に基づく符号化が実施され,しかる後に,その符号が前記ビットストリーム生成器104に出力される。
【0062】
ここで,前記符号器103において,前記制御器106からの制御信号に応じて通常フレームと特殊フレームとが作成される際の処理の流れを,その流れを模式的示す図16を用いて説明する。
同図に示す如く,前記制御器106から前記符号器103に対して入力された制御信号が「0」である(同図左側に示す,処理するフレームが通常フレームである)場合には,従来構成と同様,前記LPC予測器102により予測値が算出され,算出された該予測値に応じたLPC予測残差信号d(i)が,更には,前記ピッチ側器110により予測値が算出され,算出された該予測値に応じたピッチ予測残差信号e(i)が算出され,しかる後に,前記符号器103において,算出された該ピッチ予測残差信号e(i)が,残差信号情報として符号化される。
そして,該符号器103により符号化された残差信号情報が,前記ビットストリーム生成器104において,該通常フレームを予測する際に適用された予測係数を特定する情報(図中には,予測係数情報で示す)とパッキングされ,所定の書式に基づく符号データを形成する(図中には,通常フレーム符号で示す)。
【0063】
一方,前記制御器106から前記符号器103に対して入力された制御信号が「1」である(同図右側に示す,処理するフレームが特殊通常フレームである)場合には,所定のサンプル長(ピッチ予測の次数2Mに対応するサンプルであって,図中にはピッチ予測サンプル長で示す)のピッチ予測残差信号e(i)は前記符号器103における符号化処理が実施されず(図中では,その状態を「符号器での処理信号」を「なし」とすることで示す),所定のサンプル長以降のピッチ予測残差信号e(i)だけが前記符号器203において,残差信号情報として符号化される。
そして,前記符号器103により符号化された残差信号情報が,前記ビットストリーム生成器104において,該特殊フレームを予測する際に適用された予測係数を特定する情報(図中には,予測係数情報で示す),前記制御器106から入力される所定サンプル長のフレームデータx(i)(図中では,先頭PCMサンプルデータで示す)及び該特殊フレームのヘッダと共にパッキングされ,所定の書式に基づく符号データを形成する。(図中には,特殊フレーム符号で示す)。
このように,本実施形態では,前述した実施形態同様に,特殊フレームにおいては,▲1▼特殊フレームが所定の時間間隔毎にビットストリーム中に配置され,▲2▼該特殊フレームが過去のフレームに依存した信号を使用せずに符号化され,▲3▼該特殊フレームのヘッダには同期符号が含まれるという特徴点を有することとなる。
その結果,本実施形態により符号化された符号化データにおいても,特殊フレームを時間的な指標(インデックス)として利用可能であり,ビットストリームの途中再生を希望するユーザは,その途中位置(時間)に対応する特殊フレームを検索することで,任意の位置からの途中再生することができる。
また,特殊フレームから途中再生するに当たり,該特殊フレームには過去のフレームに依存した時系列信号が使用されていないため,「誤り伝播」を起こすことなく,正常に時系列信号を復号化(再生)することができる。
更には,前述した実施形態に対して更にピッチ予測器を新たに付加することで,更なる高能率な圧縮符号化が期待できる。
尚,通常はLPC予測の次数(N)と,ピッチ予測におけるピッチ(L)との比較では,通常後者(ピッチ)の方が大きいため,図10並びに前述した説明においてはその大小関係を前提として記述しているが,無論,LPC予測の次数(N)が,ピッチ予測におけるピッチ(L)よりも大きい場合も考え得る。
【0064】
次に,前述した前記時系列信号符号化装置Gにより生成されたビットストリームを復号化する時系列信号復号化装置の一例について,図15を参照しつつ,説明する。
以下に,図15に示す時系列信号復号化装置Jに入力されたビットストリームが復号化され,PCMデータとして出力(再生)されるまでの各部の処理について,処理の流れに沿って説明する。
【0065】
先ず,前記時系列信号復号化装置Jに入力されたビットストリームは,入力端子205を介してビットストリーム解読器204に入力される。
該ビットストリーム解読器204では,ビットストリームのセグメントが解読され,フレーム単位への分解と,そのフレームの種別(特殊フレームかその他(通常フレーム)か)の判別とが行われる。そして,各フレームについて,その種別に応じた以下の処理が行われる。。
【0066】
(処理されるフレームが通常フレームである場合)
先ず,分解されたフレームが,ヘッダが無い通常フレームである場合について説明する。
第一に,分解された通常フレームに基づいてピッチ予測残差信号e(i)の復号処理が行われる。具体的には,前記ビットストリーム解読器204で解読されたビットストリームのうち,残差信号情報(図16参照)の符号が復号器203に入力され,ピッチ予測残差信号e(i)に復元される。尚,該復号器203では,図14に示す前記符号器103に対応した復号処理が施される。
また,前記ビットストリーム解読器204で解読されたビットストリームのうち,予測係数情報(図16参照)はピッチ予測器207入力され,該ピッチ予測器207におけるピッチ予測係数の特定に利用される。これにより,該ピッチ予測器207におけるピッチ予測係数は,前述した時系列信号符号化装置Iにおける前記ピッチ予測器110(図14参照)に適用されたピッチ予測係数と同一の係数となる。
そして,前記ピッチ予測器207の出力信号と,復号されたピッチ予測残差信号e(i)とを加算器207aにより加算することでLPC予測残差信号d(i)が復号される。
次に,復号された該LPC予測残差信号d(i)に基づいてフレームデータx(i)の復号処理が行われる。具体的には,前記ビットストリーム解読器204で解読されたビットストリームのうち,予測係数情報(図16参照)がLPC予測器202に入力され,該LPC予測器202におけるLPC予測係数の特定に利用される。これにより,該LPC予測器202におけるLPC予測係数は,前述した時系列信号符号化装置Iにおける前記LPC予測器102(図14参照)に適用されたLPC予測係数と同一の係数となる。
そして,前記LPC予測器202の出力信号と,復号されたLPC予測残差信号d(i)とを加算することで,フレームデータx(i)が復号され,復号されたフレームデータx(i)がバッファ201に入力される。
【0067】
(処理されるフレームが特殊フレームである場合)
次に,分解されたフレームが,ヘッダを有する特殊フレームである場合について説明する。
前記ビットストリーム解読器204において,解読されたフレームにヘッダの存在が認識された(つまりは,そのフレームが特殊フレームであると判別された)場合,該ヘッダは前記制御器206に送信される。ここに,該ヘッダには,制御に関する情報が含まれるため,この情報に基づいて前記制御器206では,後述するように所定の制御(つまりは,符号化の手順と逆の処理)が行われる。
一方,前記ビットストリーム解読器204で解読されたビットストリームのうち,残差信号情報(図16参照)の符号が前記復号器203により復号される点,予測係数情報(図16参照)の符号が,前記LPC予測器202におけるLPC予測係数,並びに前記ピッチ予測器207におけるピッチ予測係数の特定に利用される点は,前述した通常フレームにおける処理と同様である。
しかしながら,特殊フレームの復号を行う場合においては,前記復号器203により復号される残差信号情報には,所定サンプル長のフレームデータx(i)(つまりは,先頭PCMデータであって,i=L+Mから過去のサンプル)に対応する情報が含まれていない。
そこで,本実施形態において特殊フレームを復号化する場合には,先ず,前記所定サンプル長のフレームデータx(i)を受信した前記制御器206から,該フレームデータx(i)がバッファ201に送出され,送出された該フレームデータx(i)が,復号化されたフレームデータx(i)の先頭サンプルとして使用される。
尚,前記復号器203により復号されたピッチ予測残差信号e(i)は,所定サンプル長のフレームデータx(i)(つまりは,先頭PCMデータであって,i=L+Mから過去のサンプル)に対応する信号が含まれていない点以外は,通常フレームと同一であり,その復号化に係る処理は通常フレームにおける処理と同様であるため,ここでは説明を省略する。
このようにして夫々のフレームに対して所定の処理を施すことにより生成されたフレームデータx(i)が,バッファ201へ順次転送され,該バッファ201の出力信号が出力端子200を介して出力されることで,PCMデータの復号化が完了する。
尚,前述説明並びに図15においては,図14で説明した前記時系列信号符号化装置Iにおける前記バッファ101と対応させるべく前記バッファ201を具備する形態としたが,該バッファ201は不可欠な構成要素ではなく,該バッファ201でバッファリングすることなく,復号されたPCMデータを順次出力する形態であってもよい。但し,前述した符号化の手順において説明したように,前記時系列信号符号化装置Gにおける前記バッファ101において,各チャンネル間の相関を利用した処理(例えば,2chの音声信号に対するLch+Rch,Lch−Rchの如き処理)が実施されている場合には,該バッファ201において逆処理を実施する必要がある。
以上説明したように,当該時系列信号復号化装置Jによれば,前記時系列信号符号化装置Iにより生成されたビットストリームから時系列信号を復号するに当たり,該ビットストリームに所定間隔毎に配置される特殊フレームを時間的な指標(インデックス)として,任意の場所から途中再生することも可能であることが理解される。
また,その途中再生に係る処理においては,過去の(他の)フレームのデータを使用しないで元の時系列信号を復号する構成であるため,「誤り伝播」を生ずることもない。更に,「誤り伝播」防止のために補充する情報を,全く別個に設けるのではなく,特殊フレームの先頭の一部についての通常の前記ピッチ予測残差信号e(i)の符号(残差信号情報)に置き換わるものであるので,ビットストリームのサイズの増加が最小限に抑えられる。
【0068】
(第6の実施形態)
次に,本発明の第6の実施形態に係る時系列信号符号化装置について図17を参照しつつ説明する。
ここに,第6の実施形態に係る時系列信号符号化装置C1の構成機器は,図5に示した前記時系列信号符号化装置Cと同じであるので,ここでは説明を省略する。また,前記通常フレームについての処理も前述した各実施形態と同様である。
ここで,前記時系列信号符号化装置Cは,前記特殊フレームについて,前記バッファ101からその先頭の一部のフレームデータを前記制御器106に入力させるものであった。これに対し,時系列信号符号化装置C1は,前記特殊フレームの1つ前のフレームにおけるフレームデータ(PCMデータ)の後尾の一部である予測用初期設定データが,前記LPC予測器102から前記制御器106を介して前記ビットストリーム生成器104に出力されるよう構成されている点で異なる。
前述した式1に示されるように,前記LPC予測器102は,現在のPCMデータの値を予測するために,予測に必要な過去の所定サンプル数分(式1の場合,Nサンプル分)の過去のPCMデータを,処理開始時後の一定時間を除いて常に保持している。当該時系列信号符号化装置C1では,前記カウンタ107によって前記特殊フレームとするフレームが選択されるごとに,その特殊フレームデータの処理が開始される前に,前記LPC予測器102が保持する過去のPCMデータ,即ち,当該特殊フレームの1つ前のフレーム(通常フレーム)におけるフレームデータの後尾の所定サンプル数分(前記LPC予測器102による予測の次数分)のPCMデータが,前記予測用初期設定データ(前記補充情報の一例)として前記制御器106により前記LCP予測器102から取得され,それが前記ビットストリーム生成器104へ出力される。この予測用初期設定データを入力した前記ビットストリーム生成器104は,それをビットストリームに含める(含めるように前記制御器106によって制御される)。ここで,前記特殊フレームについて,前記ヘッダが前記制御器106から前記ビットストリーム生成器104に出力されてビットストリームに含められることは前述の各実施形態と同様である。それ以外は,前記特殊フレームにおいても前記通常フレームと同様に処理される。
【0069】
図19は,第6の実施形態に係る時系列信号符号化装置C1における信号及び符号に関する処理の流れを模式的に示したものである。
同図に示す如く,前記制御器106からの制御信号が「0」である(通常フレームである)場合は前述した各実施形態と同様である。
一方,前記制御器106からの入力が「1」である(特殊フレームである)場合には,当該特殊フレームについての前記LPC予測器102による予測処理開示前(開示時点)での前記予測用初期設定データが前記ヘッダとともにビットストリームに含められる。これ以外は,前記通常フレームの場合と同様に予測処理及び符号化処理が行われ,前記LPC予測残差信号d(i)が符号化された残差信号情報がビットストリームに含められる。
このようなビットストリームを生成することにより,前記特殊フレームについては,他の(過去の)フレームのデータを使用する(参照する)ことなく再生が可能となる。ここで生成されるビットストリームは,前記予測用初期設定データが追加情報となる一方,前記符号器103は何ら制御されずに前記特殊フレームにおける全てのフレームデータ(PDMデータ)についての前記LPC予測残差信号の符号(残差信号情報)が省略なく含められる。従って,前述した第1〜第6の実施形態に比べれば,ビットストリームのサイズの増加量は大きくなる。しかし,前記特殊フレームの選択(サンプリング)を行っているため,特許文献1に示されるようにフレーム(ブロック)ごとに追加情報(補充情報)を含める場合に比べれば,データサイズの増加量が格段に抑えられる。
【0070】
次に,図18を用いて,時系列信号符号化装置C1により生成されたビットストリームを復号化して再生する時系列復号化装置D1について説明する。
ここに,時系列信号復号化装置D1の構成機器は,図6に示した前記時系列信号復号化装置Dと同じであるので,ここでは説明を省略する。また,前記通常フレームについての処理も前述した各実施形態と同様である。
一方,前記ビットストリーム解読器204により,分解されたフレームの種別が前記特殊フレームであると判別された場合は,その特殊フレームに含まれる前記予測用初期設定データが前記制御器206を介して前記LPC予測器202に転送される。これを入力した前記LPC予測器202は,当該特殊フレームについての予測処理を開始する前に,前記予測用初期設定データ(1つ前のフレームの後尾の一部のPCMデータ)を,予測に用いる過去のPDMデータの初期値として設定した後,処理を開始する。
これにより,当該時系列信号復号化装置D1によれば,前記時系列信号符号化装置C1により生成されたビットストリームから時系列信号を復号するに当たり,該ビットストリームに所定間隔毎に配置される特殊フレームを時間的な指標(インデックス)として,任意の場所から途中再生することが可能である。
また,その途中再生の処理においては,他の(過去の)フレームのデータを使用せずに元のPCMデータ(時系列信号)を再生できるため,「誤り伝播」を生ずることもない。
この実施形態では,前記予測用初期設定データは符号化せずにビットストリームに含められたが,時系列信号符号化装置C1側において符号化し,時系列信号復号化装置D1において復号化するよう構成することも考えられる。
【0071】
【実施例】
前述説明した実施形態においては,ビットストリームに,所定時間間隔毎に配置される同期符号を含むヘッダを有する特殊フレームを配置することで,該特殊フレームを時間的な指標(インデックス)として利用することを可能とし,符号化された時系列信号(つまりは,ビットストリーム)の途中再生に対応する時系列信号符号化装置について説明している。
ここでは,更に,特殊フレームのヘッダに,同期符号だけでなく,他の特殊フレームの位置を特定する位置情報(ポインタ)を含んでなる形態について考える。
具体的には,特殊フレームのヘッダに含まれる前記位置情報が,該特殊フレームの直前の特殊フレーム及び/又は直後の特殊フレームの位置を特定する情報である場合について考える。
【0072】
ここに,そのような構成に基づいて生成された特殊フレームにおけるヘッダを模式的に示す図が図20である。
同図に示す如く,特殊フレームのヘッダYは,そのヘッダ(特殊フレーム)を他のヘッダ(特殊フレーム)と識別する同期符号(図中では,同期符号:IDにより示す)に加え,他の特殊フレームへのポインタを含むことを特徴とする。
尚,本実施例においては,該ポインタが,直前の特殊フレームへのポインタである前ポインタ(PTR−B)と直後の特殊フレームへのポインタである後ポインタ(PTR−N)により構成されるものとする。
ここで,これらポインタの値としては,符号を含む値(例えば,前方向ならマイナス,後ろ方向ならプラス)とすることも可能であるし,PTR−BとPTR−Nの並びを規定した上で,絶対値を用いることも可能である。
【0073】
次に,図21を参照しつつ,ポインタの状態について説明する。
同図より明らかな如く,例えば,特殊フレームX2のヘッダY2に含まれる前ポインタ(PTR−B)を利用すれば,直前のヘッダY1(つまりは,特殊フレームX1)の位置を正確且つ即時的に特定可能であり,逆に,特殊フレームX2のヘッダY2に含まれる後ポインタ(PTR−N)を利用すれば直後のヘッダY3(つまりは,特殊フレームX3)の位置を正確且つ即時的に特定可能である。
このように,特殊フレームのヘッダに対し,他の特殊フレームの位置を特定する位置情報を含ませることで,当該時系列信号により生成されたビットストリームを再生(途中再生)するに当たり,特殊フレームのヘッダ毎に含まれる前記位置情報に基づいて,所定の時間(フレーム)間隔で時系列信号を聞き飛ばす,或いは直前から繰り返し再生するといった再生方法が可能となり,より利便性の高い再生方法を実現し得る。
尚,上述した説明では,直前及び直後の特殊フレームに関する位置情報のみを含む形態についてのみ説明しているため,例えば,複数個の特殊フレームを聞き直すことを所望する場合には,特殊フレームを順次遡る必要がある。
そこで,前記位置情報として,更に,複数個前の特殊フレーム及び/又は複数個後の特殊フレームに関する位置情報を含む形態も考え得る。
このような形態によれば,一度に多くの特殊フレームを聞き飛ばす,或いは聞き直すといった再生方法も可能となり,より多機能な再生方法を実現し得る。
【0074】
【発明の効果】
以上説明したように,本発明によれば,当該時系列信号符号化装置により生成されたビットストリームには,所定間隔毎に配置される特殊フレームが配置され,且つ,該特殊フレームについては,そのフレームより過去の(他の)フレームのデータを用いることなく復号化できるよう補充情報が含められる。
従って,当該時系列信号符号化装置により生成されたビットストリームを復号(再生)する場合,特殊フレームを時間的な指標(インデックス)として,任意の場所から途中再生することが可能であり,その途中再生において,「誤り伝播」を生ずることもない。
また,その「誤り伝播」を防止するためのビットストリームの構成は,一部の選択(サンプリング)された特殊フレームにのみ補充情報が含められるものであるため,従来構成の如く,全フレームそれぞれの先頭にエラー検出を目的とした元の時系列信号をダブらせて配置する構成に較べ,格段に小さいデータサイズで実現可能である。しかも,その補充情報として,特殊フレームの先頭の一部の時系列データ或いはそれを符号化したデータを用いれば,それに対応する残差信号情報を省略できるので,ビットストリームのデータサイズ増加量をさらに抑えることが可能である。
【図面の簡単な説明】
【図1】第1の実施形態に係る時系列信号符号化装置の概略構成を示すブロック図。
【図2】第1の実施形態に係る時系列信号符号化装置により生成されたビットストリームを復号化する時系列信号復号化装置の概略構成を示すブロック図。
【図3】第1の実施形態に係る時系列信号符号化装置における信号及び符号に関する処理の流れを模式的に示す図。
【図4】第1の実施形態に係る時系列信号符号化装置により生成されたビットストリームの構造を模式的に示す図。
【図5】本発明の第2の実施形態に係る時系列信号符号化装置の概略構成を示すブロック図。
【図6】第2の実施形態に係る時系列信号符号化装置により生成されたビットストリームを復号化する時系列信号復号化装置の概略構成を示すブロック図。
【図7】第1の実施形態に係る時系列信号符号化装置における信号及び符号に関する処理の流れを模式的に示す図。
【図8】本発明の第3の実施形態に係る時系列信号符号化装置の概略構成を示すブロック図。
【図9】第3の実施形態に係る時系列信号符号化装置により生成されたビットストリームを復号化する時系列信号復号化装置の概略構成を示すブロック図。
【図10】第3の実施形態に係る時系列信号符号化装置における信号及び符号に関する処理の流れを模式的に示す図。
【図11】本発明の第4の実施形態に係る時系列信号符号化装置の概略構成を示すブロック図。
【図12】第4の実施形態に係る時系列信号符号化装置により生成されたビットストリームを復号化する時系列信号復号化装置の概略構成を示すブロック図。
【図13】第4の実施形態に係る時系列信号符号化装置における信号及び符号に関する処理の流れを模式的に示す図。
【図14】本発明の第5の実施形態に係る時系列信号符号化装置の概略構成を示すブロック図。
【図15】第5の実施形態に係る時系列信号符号化装置により生成されたビットストリームを復号化する時系列信号復号化装置の概略構成を示すブロック図。
【図16】第5の実施形態に係る時系列信号符号化装置における信号及び符号に関する処理の流れを模式的に示す図。
【図17】本発明の第6の実施形態に係る時系列信号符号化装置の概略構成を示すブロック図。
【図18】第6の実施形態に係る時系列信号符号化装置により生成されたビットストリームを復号化する時系列信号復号化装置の概略構成を示すブロック図。
【図19】第6の実施形態に係る時系列信号符号化装置における信号及び符号に関する処理の流れを模式的に示す図。
【図20】特殊フレームにおけるヘッダの構造例を示す図。
【図21】特殊フレームにおけるヘッダを利用したポインタ状態を示す図。
【図22】従来公知の時系列信号符号化装置により生成されたビットストリームの構造を模式的に示す図。
【符号の説明】
X…ビットストリーム(本実施形態)
Y…特殊フレームにおけるヘッダ
Z…ビットストリーム(従来構成)
A…時系列信号符号化装置
B…時系列信号復号化装置
C…時系列信号符号化装置
D…時系列信号復号化装置
E…時系列信号符号化装置
F…時系列信号復号化装置
G…時系列信号符号化装置
H…時系列信号復号化装置
I…時系列信号符号化装置
J…時系列信号復号化装置
101…バッファ
102…LPC予測器
103…符号器
104…ビットストリーム生成器
106…カウンタ
107…制御器
108…減算器
109…減算器
110…ピッチ予測器
201…バッファ
202…LPC予測器
203…復号器
204…ビットストリーム生成器
206…制御器
207…ピッチ予測器[0001]
TECHNICAL FIELD OF THE INVENTION
The present invention relates to a time-series signal encoding apparatus that losslessly encodes a time-series signal represented by a voice / audio signal and the like. The present invention relates to a time-series signal encoding device that can be realized.
[0002]
[Prior art]
2. Description of the Related Art In recent years, there are many techniques for compressing a data amount by utilizing the redundancy of a time-series signal represented by a voice / audio signal or the like, thereby compressing the data amount, and improving the efficiency of recording / reproduction of the time-series signal or transmission and reception. Is being developed.
These techniques can be roughly classified into lossy coding and lossless coding.
The former, which is accompanied by auditory deterioration due to data compression as represented by the MP3 or AAC method, is capable of encoding at a relatively high compression ratio (even if it is about 1/10 or less, there is no major problem in hearing). It is.
On the other hand, the latter is also referred to as lossless coding, and since the signal before compression (encoding) can be completely restored, there is no auditory deterioration, but the compression rate is relatively low (depending on the audio data to be encoded, (Approximately 1 /).
As described above, irreversible coding is advantageous in order to realize highly efficient compression coding, but there is a need for lossless coding that can decode a time series signal that is exactly the same as the time series signal before compression. Is also strong.
[0003]
By the way, the basis of lossless coding is to predict a current time-series signal from a past time-series signal.
That is, when lossless encoding is performed on a time-series signal, it is necessary to trace past time-series signals. Specifically, the prediction value of the current time-series signal viewed from the past time-series signal is predicted based on a predetermined prediction method (for example, linear prediction, pitch prediction), and the predicted value is compared with the original prediction value. High-efficiency encoding is performed by encoding a difference value (prediction residual) of a sequence signal.
Therefore, even when decoding the lossless encoded code, the time series signal is sequentially decoded while referring to the past time series signal.
However, because of such a configuration, when decoding a coded code, if a past time-series signal is missing, a prediction value based on the past time-series signal is different from an original prediction value ( (Wrong) values can be predicted.
In the subsequent prediction of the time-series signal, the erroneous prediction based on the erroneously predicted value (past time-series signal) is repeated, and as a result, the time-series signal is lost. An unfavorable situation (hereinafter referred to as “error propagation”) may occur in that time-series signals decoded after the time point are all decoded as erroneous time-series signals.
A typical example in which this “error propagation” poses a problem is a case in which lossless-coded codes are reproduced halfway. In other words, even if a user who wants to reproduce the code halfway desires to reproduce (decode) the code by designating an arbitrary position (midway) of the code, the user can start the past reproduction from the arbitrary position. Since there is no information on the time-series signal (that is, a situation where the past time-series signal is missing), the above-described “error propagation” occurs and normal decoding cannot be performed.
Therefore, even when the user who wants to play the code in the middle is required to decode the code in order from the beginning, it is necessary to reach the position where the middle playback is desired.
As described above, when the lossless-encoded code is reproduced in the middle, the decoding process is always forced to be performed from the beginning of the code, so that a large amount of operation (operation time) is required. Efficiency and usability were reduced.
Therefore, a technique for preventing such “error propagation” has been developed and disclosed in Japanese Patent Application Laid-Open No. H11-163,837.
FIG. 22 is a diagram schematically showing a bit stream Z finally generated by the technique disclosed in Patent Document 1. As shown in the figure, a bit stream Z generated based on this technology is provided at the beginning of a frame (indicated by a block in the figure) cut out for each predetermined length (in units of a predetermined sample length). A sequence signal (indicated by “m original audio signal samples at the beginning of the block” in the figure) is arranged.
With such a configuration, when the bit stream Z is played back halfway, a prediction value from a past time-series signal is compared with the original time-series signal arranged at the head to determine whether or not “error propagation” has occurred. It is possible. That is, when it is determined that “error propagation” has occurred (ie, the predicted value differs from the original time-series signal), the predicted value (ie, By using the original time-series signal (that is, the correct past time-series signal) instead of the erroneous past time-series signal, the correct time-series signal is reproduced halfway while preventing "error propagation". It is possible.
As described above, according to the technology disclosed in Patent Literature 1, it is possible to prevent “error propagation” by a configuration in which the original time-series signal is added for each frame of the bit stream, so that a desired position can be prevented. It is also possible to cope with playback from the middle, which can contribute to improvement of convenience.
[0004]
[Patent Document 1]
JP-A-2000-22551
[Non-patent document 1]
"Sound Communication Engineering" (edited by The Acoustical Society of Japan, Corona, August 30, 1996, first edition)
[Non-patent document 2]
Half Rate Audio Codec (PSI-CELP) Standard RCR STD-27C
[0005]
[Problems to be solved by the invention]
However, the above-mentioned conventionally known techniques have the following problems.
One of them is degradation of coding efficiency. In other words, since the original time-series signal for error detection (that is, "the original m audio signal samples at the beginning of the block") is arranged at the beginning of each frame, the data size increases by that amount. This is inevitable, and the increase is large.
For example, when an original time-series signal for 10 samples is added, if the time-series signal has an accuracy of 16 bits / sample, 160 bits per channel become redundant information. Further, if the original time-series signal is audio data having a bit rate of 256 kbps, stereo 2 ch, and frame length of 10 ms, the average number of bits of a code per frame is 256000 bps / (1000 ms / 10 ms) = 2560 bits. The amount of information increases by as much as (160 bits × 2 ch) / 2560 bits = 12.5% due to the arrangement of the time-series signal alone, and the coding efficiency is significantly reduced.
Further, when pitch prediction (pitch filter) for encoding using the periodicity of the original time-series signal is applied as a prediction means at the time of lossless encoding, past prediction is performed according to the cycle of the time-series signal. The bit length of the sample to be stored in (i.e., placed at the beginning) becomes long. For example, if the original time-series signal is an audio signal, it is desirable to correspond to a periodic signal up to about 80 Hz (half-rate audio codec PSI-CELP corresponds to a periodic signal of that level), but the sampling frequency Even if the frequency is 8 KHz, it is necessary to store a time-series signal for at least 100 samples, so that the coding efficiency is further reduced.
Another problem is that it is necessary to specify the starting point (synchronize). In other words, lossless encoding / decoding is characterized in that the time-series signal before encoding and the time-series signal after decoding completely match, so that each frame has Has to be of variable length. Therefore, in order to reproduce the encoded code in the middle, it is necessary to specify the start position (frame) from a plurality of frames. However, in the bit stream Z configured as shown in FIG. , It is impossible to identify a specific frame from a plurality of frames, and it is not easy to reproduce the code halfway from a desired start position (frame).
The present invention has been made in view of the above circumstances, and an object of the present invention is to provide a time-series signal encoding apparatus for lossless-encoding a time-series signal represented by a voice / audio signal or the like. The present invention is to provide a time-series signal encoding device that can be played back halfway from the start position of the above and realizes highly efficient compression.
[0006]
[Means for Solving the Problems]
In order to achieve the above object, the present invention provides a frame dividing means for dividing an input time-series signal into frames of a predetermined length, and a current time-series signal from a past time-series signal based on a predetermined prediction method. Prediction means for predicting a time-series signal, residual signal calculation means for calculating a residual signal between the prediction signal by the prediction means and the time-series signal for each frame, and lossless encoding of the residual signal A time-series signal encoding apparatus comprising: coding means for generating residual signal information by using a predetermined bit stream based on the residual signal information; A special frame selecting means for selecting a part of the frame as a special frame based on a rule, and for each piece of information about the special frame in the bit stream, The bit stream so as to include identification information indicating a special frame and predetermined supplementary information for enabling reproduction of the time-series signal without using the residual signal for the frame other than the special frame. It is configured as a time-series signal encoding device, comprising: a bit stream generation control unit that controls a generation unit and the prediction unit and / or the encoding unit.
Here, as an example of the predetermined prediction method in the prediction means, it is possible to apply either linear prediction or pitch prediction.
With such a configuration, in the bit stream generated by the time-series signal encoding device, information on a special frame is arranged at intervals based on a predetermined selection rule. Since the information is included, decoding (reproduction) can be performed without referring to (using) the residual signal of a frame earlier than that frame. Whether or not the frame is a special frame can be determined by the presence or absence of the identification information.
Therefore, according to the time-series signal encoding apparatus, it is possible to play back the intermediate information from an arbitrary position using the identification information on the special frame as a temporal index. Does not occur.
Furthermore, the configuration for preventing the “error propagation” is different from the conventional configuration in which the original time-series signal for error detection is dubbed and arranged at the head of the information for each frame. Since only the identification information and the supplementary information are included for each of the selected special frames, the data size of the entire bit stream can be significantly reduced.
[0007]
Here, as the supplementary information, the residual signal obtained by replacing the prediction signal with a predetermined setting signal for a part of the head of the time-series signal in the special frame is encoded by the encoding means. It is also conceivable that the information is the residual signal information.
Normally, on the signal reproducing (decoding) side, when reproducing a part of the head of each frame, a time-series signal of a part of the tail of the immediately preceding frame (“block head m in FIG. 22”) Original sound signal samples). On the other hand, in the above configuration, the residual signal for the first part of the special frame represents a residual between the time-series signal and the setting signal (for example, a fixed value 0 (zero)). Become. Therefore, the reproduction (decoding) side of the head of the special frame, that is, the part where the time-series signal of a part of the tail of the frame immediately before the special frame is necessary for reproduction is normally used. If the set value is known, the time-series signal can be reproduced without using the residual signal for the immediately preceding frame other than the special frame.
Moreover, the supplementary information is not newly provided, but replaces the normal residual signal for a part of the head, so that the increase in the size of the bit stream is minimized.
[0008]
Further, the supplementary information is a part of the head of the time-series signal in the special frame, and the bit stream generation control unit controls the residual signal information corresponding to the supplementary information not to be included in the bit stream. It is also conceivable to do the following.
As a result, similarly to the above, the time-series signal can be reproduced without using the residual signal for the immediately preceding frame other than the special frame. Further, in this case, the supplementary information has a data size of the bit stream slightly larger than that described above because of no encoding, but the residual signal information corresponding to the supplementary information is not included. , The increase in the data size can be suppressed to be smaller than when the data is added.
[0009]
Further, the supplementary information is a part of the time-series signal in the frame immediately before the special frame or the residual signal information in which the part is encoded by the encoding unit. It doesn't matter.
In this case, for the special frame, the size of the bit stream is increased by the addition of the supplementary information, as in the case shown in Patent Document 1. Compared with the case where supplementary information (corresponding to “m original sound signal samples at the beginning of the block” in FIG. 22) is included, the increase in the data size of the bit stream can be suppressed remarkably.
[0010]
Here, it is preferable that the predetermined selection rule in the special frame selecting means is such that the frame at a fixed time interval in the time-series signal is the special frame.
Accordingly, it is possible to accurately grasp a specific position (reproduction time) in the time-series signal based on the position (number) of the special data, and it is possible to enhance the utility of the special data as an index. That is, when the bit stream encoded by the time-series signal encoding device is played back halfway, the halfway playback from a desired position (playback time) is accurately realized based on the position (number) of the special data. I can do it.
[0011]
Further, it is preferable that the special frame has a form including position information for specifying the position of another special frame. Here, as an example of the position information, information specifying the position of the special frame immediately before the special frame and / or the special frame immediately after the special frame may be considered.
According to such an embodiment, when reproducing the bit stream, the user can skip the time-series signal at predetermined time (frame) intervals or can listen to the time-series signal immediately before, based on the position information included in each special frame. This makes it possible to realize a more convenient reproduction method.
[0012]
Further, the present invention may be embodied as a time-series signal decoding device that decodes (reproduces) the bit stream data encoded by the time-series signal encoding device configured as described above.
That is, bit stream input means for inputting a bit stream including a plurality of residual signal information obtained by encoding a residual signal of a predetermined frame unit, and decoding for decoding the residual signal information included in the bit stream Means, prediction means for predicting the next time-series signal to be output based on the time-series signal output in the past by the time-series signal decoding apparatus, and a prediction signal by the prediction means and decoding by the decoding means. And a time-series signal output means for outputting the time-series signal based on the obtained residual signal. Identification information detecting means for detecting identification information indicating that the difference signal information relates to a predetermined special frame; When the information is detected, based on predetermined supplementary information included in the bit stream corresponding to the identification information and the residual signal obtained by decoding the residual signal information by the decoding means, A time-series signal output control means for controlling the prediction means and / or the time-series signal output means so as to output the time-series signal. Is what is done.
[0013]
Further, the present invention may be regarded as a time-series signal encoding method for performing a process (step) executed by the time-series signal encoding device having the above-described configuration.
That is, a frame dividing step of dividing an input time-series signal into frames of a predetermined length, a prediction step of predicting the current time-series signal from the past time-series signal based on a predetermined prediction method, A residual signal calculating step of calculating a residual signal between the prediction signal obtained by the prediction step and the time-series signal for each frame; and an encoding step of reversibly encoding the residual signal to generate residual signal information. And a bit stream generating step of generating a predetermined bit stream based on the residual signal information. A time-series signal encoding method comprising the steps of: A special frame selecting step of selecting a special frame, and identification information indicating the special frame for each piece of information about the special frame in the bit stream. The bit stream generation step, the prediction step, and / or the predetermined supplementary information for enabling the reproduction of the time-series signal without using the residual signal for the frame other than the special frame. Or a bit stream generation control step of controlling the encoding step.
[0014]
Similarly, the present invention may be regarded as a time-series signal decoding method for performing a process (step) performed by the time-series signal decoding device having the above-described configuration.
A bit stream inputting step of inputting a bit stream including a plurality of residual signal information obtained by encoding a residual signal of a predetermined frame unit; and a decoding step of decoding the residual signal information included in the bit stream. A prediction step of predicting a next time-series signal to be output next based on a time-series signal output in the past by the time-series signal decoding method, a prediction signal of the prediction step, and a signal decoded by the decoding step. A time-series signal output step of outputting the time-series signal based on the residual signal, wherein the residual signal information is obtained from the bit stream for each of the residual signal information. An identification information detecting step of detecting identification information indicating that the information relates to a predetermined special frame; and the identification information detecting step detects the identification information. In this case, the time series is determined based on predetermined supplementary information included in the bit stream corresponding to the identification information and the residual signal obtained by decoding the residual signal information in the decoding step. A time-series signal output control step of controlling the prediction step and / or the time-series signal output step so as to output a signal.
[0015]
BEST MODE FOR CARRYING OUT THE INVENTION
Hereinafter, embodiments and examples of the present invention will be described with reference to the accompanying drawings to provide an understanding of the present invention. The following embodiments and examples are mere examples embodying the present invention, and do not limit the technical scope of the present invention.
Here, FIG. 1 is a block diagram showing a schematic configuration of a time-series signal encoding device according to the first embodiment of the present invention, and FIG. 2 is generated by the time-series signal encoding device according to the first embodiment. FIG. 3 is a block diagram illustrating a schematic configuration of a time-series signal decoding device that decodes a bit stream. FIG. 3 is a diagram schematically illustrating a flow of processing related to signals and codes in the time-series signal encoding device according to the first embodiment. FIG. 4 is a diagram schematically showing the structure of a bit stream generated by the time-series signal encoding device according to the first embodiment. FIG. 5 is a diagram showing the time-series signal encoding according to the second embodiment of the present invention. FIG. 6 is a block diagram illustrating a schematic configuration of a device, and FIG. 6 is a block diagram illustrating a schematic configuration of a time-series signal decoding device that decodes a bit stream generated by the time-series signal encoding device according to the second embodiment. 7 is the first fruit The figure which shows typically the flow of the process regarding the signal and the code | symbol in the time series signal encoding apparatus which concerns on form, FIG. 8: is a block diagram which shows the schematic structure of the time series signal encoding apparatus concerning the 3rd Embodiment of this invention. FIG. 9 is a block diagram showing a schematic configuration of a time-series signal decoding device for decoding a bit stream generated by the time-series signal encoding device according to the third embodiment, and FIG. The figure which shows typically the flow of the process regarding the signal and code in such a time series signal encoding apparatus, FIG. 11 is a block diagram which shows the schematic structure of the time series signal encoding apparatus concerning 4th Embodiment of this invention, figure 12 is a block diagram illustrating a schematic configuration of a time-series signal decoding device that decodes a bit stream generated by the time-series signal encoding device according to the fourth embodiment. FIG. 13 illustrates a time-series signal decoding device according to the fourth embodiment. FIG. 14 is a diagram schematically showing a flow of processing related to signals and codes in a column signal encoding device, FIG. 14 is a block diagram showing a schematic configuration of a time-series signal encoding device according to a fifth embodiment of the present invention, and FIG. FIG. 16 is a block diagram illustrating a schematic configuration of a time-series signal decoding device that decodes a bit stream generated by the time-series signal encoding device according to the fifth embodiment. FIG. 16 illustrates a time-series signal according to the fifth embodiment. FIG. 17 is a diagram schematically showing a flow of processing related to signals and codes in the encoding device, FIG. 17 is a block diagram showing a schematic configuration of a time-series signal encoding device according to a sixth embodiment of the present invention, and FIG. And FIG. 19 is a block diagram illustrating a schematic configuration of a time-series signal decoding device that decodes a bit stream generated by the time-series signal encoding device according to the sixth embodiment. FIG. 20 is a diagram schematically showing a flow of processing relating to signals and codes in the coding apparatus, FIG. 20 is a diagram showing an example of the structure of a header in a special frame, FIG. It is a figure which shows typically the structure of the bit stream produced | generated by the conventionally well-known time series signal encoding apparatus.
[0016]
(1st Embodiment)
First, a time-series signal encoding device according to a first embodiment of the present invention will be described with reference to FIG.
Here, the time-series signal encoding device A according to the first embodiment is embodied as shown in the block diagram of FIG. As shown in the figure, the time-series signal encoding apparatus A includes a buffer 101 (corresponding to an example of the frame dividing means), an LPC (Linear Predictive Coding) predictor 102 (corresponding to an example of the predicting means), and a subtractor. 108 (corresponding to an example of the residual signal calculating means), an encoder 103 (corresponding to an example of the encoding means), a bit stream generator 104 (corresponding to an example of the bit stream generating means), and a controller 106 (corresponding to the bit stream generating means). It is schematically configured to include a stream generation control unit) and a counter 107 (corresponding to an example of a special frame selection unit).
In the following, the processing of each unit until PCM data (an example of a time-series signal) input to the time-series signal encoding device A is encoded and output as encoded data will be described along the processing flow. .
[0017]
(Buffer 101)
First, PCM data (an example of a sample or a time-series signal) input to the time-series signal encoding device A is input to the buffer 101 from an input terminal 100.
In the buffer 101, PCM data is buffered by being divided into units called frames for every certain number of samples (for example, 800 samples). When the number of channels of the input PCM data is plural, the buffer 101 may perform a process for removing the correlation between the channels. For example, when the PCM data has two channels, an arithmetic process such as Lch + Rch or Lch-Rch is performed.
[0018]
(LPC predictor 102)
Next, PCM data in frame units (hereinafter simply referred to as frame data) buffered in the buffer 101 is input to the LPC predictor 102.
The LPC predictor 102 performs a linear prediction process based on the assigned predetermined prediction coefficient αn (n = 1, 2,..., N) as shown in the following equation 1, and obtains the past PCM data x (i− n) (i is the number of the current PCM data in each frame (i = 1, 2,..., K) (K is the number of samples in one frame)) and the predicted value of the current PCM data (sample) ( Prediction signal)
(Equation 1)
Figure 2004271812
Is predicted, and the predicted value is output to the subtractor 108.
(Equation 2)
Figure 2004271812
As can be seen from Equation 1, in order to predict the first N (i = 1 to N) PCM data (samples) of each frame data x (i), i becomes 0 or less. N pieces of PCM data at the end of the previous frame are required.
The prediction coefficient αn may be a coefficient set in advance or a coefficient calculated each time according to input frame data. The calculation method of the prediction coefficient αn is well known, and the details thereof are described in, for example, Non-Patent Document 1, and thus the description is omitted here.
[0019]
(Subtractor 108)
The subtractor 108 calculates the predicted value predicted by the LPC predictor 102.
[Equation 3]
Figure 2004271812
And the frame data x (i) directly input from the buffer 101, the LPC residual signal d (i) is calculated as in the following equation 2.
(Equation 4)
Figure 2004271812
Then, one frame (i = 1 to K) of the calculated LPC residual signal d (i) is output to the encoder 103.
[0020]
(Encoder 103)
In the encoder 103, the LPC residual signal d (i) (i = 1 to K) for one frame input from the subtracter 108 is encoded, and thereafter, is output to the bit stream generator 104. You. It is desirable to use an encoding method (so-called entropy encoding) using the bias of the appearance frequency as an encoding method of the LPC residual signal d (i). Specifically, it is conceivable to use a known coding technique such as a Huffman coding method, an arithmetic coding method, or a range coder. Of course, the encoding method is not limited to these methods.
[0021]
(Bit stream generator 104)
Finally, in the bit stream generator 205, the code (residual signal information) input from the encoder 103, the header (details will be described later) input from the controller 106, and the LPC encoder 102 Information (indicated by prediction coefficient information in the figure) for specifying the input prediction coefficient is packed, and thereafter, output from the output terminal 105 as a bit stream (indicated by code data in the figure), and PCM data Is completed.
[0022]
The basic configuration and operation of each unit described above are the same as those of a conventionally known time-series signal encoding device.
However, in the present embodiment, a special frame (to be described later) is selected from the frame data cut out (divided) by the buffer 101 at predetermined time intervals (an example of the predetermined selection rule). A selection function (corresponding to an example of the special frame selecting means), and further, for the selected special frame, the LPC residual signal d (i) for the frame other than the special frame (the previous frame). ), The LPC predictor 102 performs prediction in order to generate encoded data including predetermined supplementary information for enabling reproduction of PCM data without using the special frame. Without using the data of the (other) frame, a partial predicted value at the head of the special frame is set to a predetermined set value (set signal, = 0). Obtain the bit stream generation control function and (corresponds to an example of the bit stream generation control means), a point having a different from the conventional configuration.
Due to this difference (feature point), according to the present embodiment, a special frame is arranged at regular time intervals in the generated bit stream. (Within a frame other than the frame). The data on the special frame encoded in this way can be reproduced (decoded) without using data of another (past) frame.
As a result, in the case of a bit stream generated by the time-series signal encoding device according to the present embodiment, a special frame can be used as a temporal index (index) when decoding the bit stream, and the bit stream can be used. It is possible to play back halfway from a desired time (position).
Furthermore, an increase in the amount of information due to realizing the midway reproduction function, that is, a decrease in encoding efficiency can be minimized.
Hereinafter, the special frame selection function and the bit stream generation control function, which are characteristic points of the present embodiment, will be described in detail.
[0023]
(Special frame selection function)
This special frame selection function is realized by the counter 107. Specifically, the counter 107 connected to the controller 106 sends a predetermined operation command to the controller 107 every time a predetermined time elapses (that is, a fixed amount of frames are processed because the processing is a real-time process). A special frame is selected from the frame data cut out by the buffer 101 at regular time intervals.
As another example of the special frame selection process, a process of counting the number of processed frame data and counting until the number of processed frames reaches a predetermined number can be considered.
[0024]
(Bit stream generation control function)
The controller 106, which has received the operation command from the counter 107, controls the LPC predictor 102 and the like as described below, so that the special frame selected by the counter 107 is ( The prediction signal is predicted without using (past) frame data, and thereafter, a function of generating encoded data included in the predicted signal is realized.
First, upon receiving an operation command from the counter 107, the controller 106 sends a control signal for controlling the operation of the LPC predictor 102. At the same time, the controller 106 generates a header (an example of identification information) indicating that the frame processed this time is a special frame, and sends it to the bit stream generator 106. The header forms a special frame by being packed with the code or prediction coefficient information encoded by the encoder 103 in the bit stream generator 106. When decoding the bit stream, Whether or not the frame is a special frame is determined based on the presence or absence of the header.
For this reason, the header includes at least a synchronization code capable of synchronizing frames (for example, a pattern such as AAAAh, which rarely appears in a bit stream as much as possible). Or the order N of the LPC prediction for which the prediction has not been performed, or counter information (the number of the current special frame, or the time from the beginning of the PCM data, etc.).
On the other hand, the LPC predictor 102 that has received the control command from the controller 106 performs the following prediction processing different from the above-described normal prediction processing.
Upon receiving the control command, the LPC predictor 102 does not perform LPC prediction from the first sample in the frame (special frame) to the sample corresponding to the order of LPC prediction (corresponding to N in the above equation (1)). Specifically, a process is performed in which the LPC residual signal d (i) = frame data x (i) (i = 1 to N).
With this processing, the LPC predictor 102 specifies a prediction value for a special frame only from a signal (data) in the current frame (in a special frame) without using a signal of a past frame. As a result, for a special frame, the encoded time-series signal can be reproduced halfway.
In the special frame, samples after the sample corresponding to the order of the LPC prediction (corresponding to N in the above equation (1)) from the head sample of the special frame are past samples necessary for performing the LPC prediction. Exists in the frame, so that a prediction value is calculated by LPC prediction as in the related art.
[0025]
Here, the flow of processing when the encoder 103 creates a normal frame and a special frame in accordance with a control signal from the controller 106 will be described with reference to FIG. 3 schematically showing the flow. . In the figure, if the control signal from the controller 106 (indicated by the LPC prediction control signal in the figure) is "1", the frame is processed as a special frame, and the control from the controller 106 is performed. If the signal is "0", the case where the frame is processed as a normal frame is shown. Of course, the control signals "0" and "1" can be configured in reverse order.
As shown in the figure, when the control signal from the controller 106 is "0" (the frame to be processed is a normal frame shown on the left side of the figure), the LPC predictor 102 , A prediction value is calculated based on a predetermined prediction coefficient, an LPC prediction residual signal d (i) corresponding to the calculated prediction value is calculated, and thereafter, the LPC calculated by the encoder 103 is calculated. The prediction residual signal d (i) is encoded as residual signal information.
Then, the residual signal information encoded by the encoder 103 is used by the bit stream generator 104 to identify information (refer to the prediction coefficient information in FIG. ) To form code data based on a predetermined format. (In the figure, it is usually indicated by a frame code.)
On the other hand, when the input from the controller 106 is “1” (the frame to be processed is a special frame shown on the right side of the figure), a predetermined sample length (sample of the order N of the LPC prediction) is used. Only the LPC sample length in the figure) is not subjected to the prediction processing in the LPC predictor 102, and is output as the predicted value = 0 (replaced by the set value 0), and the input frame data x (i ) Is directly input to the encoder 103. Then, calculation is performed based on the input frame data x (i) (the LPC predicted residue signal d (i) when the predicted value = 0) and the remaining frame data x (i) after the LPC sample length. The obtained LPC prediction residual signal d (i) is encoded as residual signal information. Then, the residual signal information encoded by the encoder 103 is used by the bit stream generator 104 to identify information (hereinafter, referred to as prediction coefficient) that specifies a prediction coefficient applied when predicting the special frame. And the header generated by the controller 106 to form coded data based on a predetermined format. (In the figure, it is indicated by a special frame code).
FIG. 4 shows a schematic diagram of a bit stream structure generated based on such a procedure.
In the bit stream X shown in the figure, when the number of processing frames is counted by the counter 107 and an operation signal is transmitted to the control unit 106 at intervals of 10 frames, that is, a special frame is inserted once in 10 frames. It is what was constituted.
In such a bit stream X, if the time length of a frame is 20 ms, special frames exist at predetermined intervals of 200 ms. Therefore, it is understood that the user who reproduces the bit stream X can reproduce the bit stream X halfway from any position every 200 ms without causing “error propagation”. Of course, it is needless to say that the insertion ratio of the special frame can be changed (increased / decreased) in accordance with a request from the user for midway reproduction.
On the other hand, an increase in the amount of information (deterioration of the coding rate) can be suppressed to about 1/10 as compared with the case where redundant information is disabled for each frame (all frames are special frames).
As described above, according to the present embodiment, (1) the special frame is arranged in the bit stream at predetermined time intervals, and (2) the special frame is encoded so as to be reproducible without depending on the past frame. (3) The special frame has a feature that the header of the special frame includes a synchronization code.
With such feature points, in the encoded data encoded according to the present embodiment, the special frame can be used as a temporal index. That is, a user who wishes to play back a bit stream halfway from an arbitrary position specifies an arbitrary position by searching for a special frame corresponding to the halfway position (time), and plays back the halfway from that position. be able to.
Furthermore, in reproducing the special frame halfway, the time-series signal can be normally decoded (reproduced) without causing “error propagation”.
[0026]
Next, an example of a time-series signal decoding device that decodes the bit stream generated by the above-described time-series signal encoding device A will be described with reference to FIG.
Hereinafter, the processing of each unit from decoding of the bit stream input to the time-series signal decoding device B illustrated in FIG. 2 to output (reproduction) as PCM data will be described along the processing flow.
[0027]
First, the bit stream input to the time-series signal decoding device B is input to a bit stream decoder 204 via an input terminal 205.
The bit stream decoder 204 (an example of the bit stream input means and the identification information detecting means) decodes a bit stream segment, decomposes the frame into frame units, and classifies the frame (special frame or other (normal frame)). Is determined. Then, the following processing according to the type is performed for each frame.
[0028]
(When the frame to be processed is a normal frame)
First, a case in which (the data of) the decomposed frame is a normal frame without the header will be described.
The code of the residual signal information (see FIG. 3) in the bit stream decoded by the bit stream decoder 204 is input to a decoder 203 (an example of the decoding unit), and the LPC prediction residual signal d (i ) Will be restored. The decoder 203 performs a decoding process corresponding to the encoder 103 shown in FIG.
The code of the prediction coefficient information (see FIG. 3) in the bit stream decoded by the bit stream decoder 204 is input to an LPC predictor 202 (an example of the predicting unit). Used to specify prediction coefficients. As a result, the LPC prediction coefficient in the LPC predictor 202 becomes the same coefficient as the LPC prediction coefficient applied to the LPC predictor 102 (see FIG. 1) in the time-series signal encoding device A described above.
The output signal of the LPC predictor 202 and the decoded LPC prediction residual signal d (i) are added by the adder 202a to decode the frame data x (i), and the decoded frame data x ( i) is input to the buffer 201. Then, PCM data (time-series signal) is output from the buffer 201. Here, the adder 202a and the buffer 201 are an example of the time-series signal output unit.
[0029]
(If the frame to be processed is a special frame)
Next, a case where the decomposed frame is a special frame having a header will be described.
When the bit stream decoder 204 recognizes the presence of a header in the decoded frame (that is, when the frame is determined to be a special frame), the header is transmitted to the controller 206. Here, since the header includes information related to control, the controller 206 (an example of the time-series signal output control means) performs predetermined control (to be described later, Process that is the reverse of the conversion procedure).
Here, of the bit stream decoded by the bit stream decoder 204, the code of the residual signal information (see FIG. 3) is decoded by the decoder 203, and the code of the prediction coefficient information (see FIG. 3). Is used to specify the LPC prediction coefficient in the LPC predictor 202 as in the above-described processing in the normal frame.
However, when decoding a special frame, the residual signal information decoded by the decoder 203 includes not only the LPC prediction residual signal but also the frame data x (i) itself (prediction value = 0 (predetermined value = 0). LPC prediction residual signal).
Therefore, the controller 206 receiving the header transmits a predetermined control signal to the LPC predictor 202, and the residual signal information decoded by the decoder 203 is converted into frame data x (i) (that is, In the case of the above description, if i = 1 to N samples), control is performed so that the output signal from the LPC predictor 202 is not added (that is, the LPC predictor 202 The output signal is set to 0), and the frame data x (i) is output to the buffer 201 as it is. On the other hand, when the residual signal information decoded by the decoder 203 is an LPC prediction residual signal (that is, in the case of the above-described description, samples after N), the LPC prediction residual signal is used as in the case of a normal frame. By adding the output signal of the predictor 202 and the LPC prediction residual signal d (i), the frame data x (i) is decoded, and the decoded frame data x (i) is input to the buffer 201. To be done.
Frame data x (i) generated by performing predetermined processing on each frame in this manner is sequentially transferred to the buffer 201, and an output signal of the buffer 201 is output via the output terminal 200. By outputting, the decoding of the original PCM data is completed.
In the above description and FIG. 2, the buffer 201 is provided so as to correspond to the buffer 101 in the time-series signal encoding apparatus A described in FIG. 1, but the buffer 201 is an essential component. Instead, the decoded PCM data may be sequentially output without buffering in the buffer 201. However, as described in the above-described encoding procedure, in the buffer 101 of the time-series signal encoding device A, processing using correlation between channels (for example, Lch + Rch, Lch-Rch for a 2ch audio signal) Is performed, it is necessary to perform reverse processing in the buffer 201.
As described above, according to the time-series signal decoding apparatus B, when decoding the time-series signal from the bit stream generated by the time-series signal encoding apparatus A, the time-series signal is arranged at predetermined intervals in the bit stream. It can be understood that the special frame to be played back can be played back from an arbitrary place as a temporal index.
Further, in the processing related to the halfway reproduction, since the original time-series signal is decoded without using the past time-series signal, "error propagation" does not occur.
[0030]
(Second embodiment)
Next, a time-series signal encoding device according to a second embodiment of the present invention will be described with reference to FIG.
Here, the time-series signal encoding device C according to the second embodiment is embodied as shown in the block diagram of FIG. As is clear from the figure, the time-series signal encoding apparatus C includes a buffer 101 (corresponding to an example of the frame dividing means), an LPC predictor 102 (corresponding to an example of the predicting means), and a subtractor 108 (corresponding to the example of the predicting means). An encoder 103 (corresponding to an example of the encoding means), a bit stream generator 104 (corresponding to an example of the bit stream generating means), a controller 106 (corresponding to an example of the bit stream generation control). And a counter 107 (corresponding to an example of the special frame selecting means). That is, it is realized by the substantially same configuration as that of the first embodiment. (Numbering of common parts is the same)
However, in the first embodiment, a predetermined control signal from the controller 106 is input to the LPC predictor 102, and the LPC predictor 102 performs a predetermined process according to the control command. , The frame data x (i) having a predetermined sample length (in FIG. 3, indicated by the LPC sample length) according to the order (N) of the LPC prediction coefficients is transmitted as a part of the special frame.
On the other hand, in the present embodiment, frame data x (i) having a predetermined sample length corresponding to the order (N) of the LPC prediction coefficient from the buffer unit 101 (shown by the leading PCM data in FIG. In addition, a predetermined control signal from the controller 106 is input to the encoder 103, and the encoder 103 performs predetermined processing in accordance with the control command. In that the frame data x (i) having a predetermined sample length (indicated by the LPC sample length in FIG. 7) according to the order (N) is transmitted as a part of the data of the special frame.
Hereinafter, the processing of each unit from the time when the PCM data (an example of a time-series signal) input to the time-series signal encoding device C is encoded to the time when the PCM data is output as the code data will be described along the processing flow. .
[0031]
Here, basic processing by the buffer 101, the LPC predictor 102, the subtracter 108, the encoder 103, and the bit stream generator 104 in the time-series signal encoding device C, and a special frame selecting function by the counter 107 Is the same as that of the first embodiment described above, and the description is omitted here, and only the bit stream generation control function that performs different processing will be described.
[0032]
(Bit stream generation control function)
Here, in the present embodiment, as shown in FIG. 5, the buffer 101 has a function of buffering input PCM data in units of frames, and also includes a frame data x (i) (see FIG. 5 and 7 have a function of extracting the leading PCM data and inputting it to the controller 106.
Assuming that the buffer 101 inputs the frame data x (i), the controller 106, which has received the operation command from the counter 107, controls each of the above-described units as described below, so that the counter 107 For the special frame selected by (1), a function of predicting a prediction value without using past frame data from the special frame is realized.
First, when an operation command is received from the counter 107, a control signal for controlling the operation of the encoder 103 is transmitted from the controller 106. In addition, the controller 106 generates a header indicating that the frame to be processed this time is a special frame, and sends the header to the bit stream generator 104 in the same manner as in the first embodiment. It is. However, in the present embodiment, in addition to the header, frame data x (i) (head PCM data, an example of the supplementary information) of a predetermined sample length input from the buffer 101 is transmitted together with the header to the bit stream generator. The difference is that the information is sent to the E.104. The frame data x (i) and the header having a predetermined sample length are packed in the bit stream generator 106 with the code encoded by the encoder 103 or the prediction coefficient information to form a special frame.
[0033]
On the other hand, the encoder 103, which has received the control command from the controller 106, performs the following encoding process, unlike the normal encoding process.
Upon receiving the control command, the encoder 103 does not perform encoding from the first sample in the frame (special frame) to the sample corresponding to the order of LPC prediction (corresponding to N in the above equation (1)). That is, among the LPC prediction residual signals d (i) input from the subtracter 108 to the encoder 103, encoding is not performed on d (i) (i = 1 to N).
By this process, the encoder 103 encodes only the LPC prediction residual signal d (i) (i = N + 1 to K) calculated for the special frame without using the time-series signal of the past frame. You. Thus, the LPC prediction residual signal d (i) (i) corresponding to the frame data x (i) (i = 1 to N (head PCM data)) is added to the bit stream generated by the bit stream generator 104. = 1 to N) (residual signal information) is not included, so that an increase in the bit stream size can be minimized.
In the special frame, samples subsequent to the sample corresponding to the order of the LPC prediction (corresponding to N in the above equation (1)) from the first sample of the special frame are subjected to a predetermined encoding method, similarly to the normal frame. Encoding is performed, and then the code is output to the bit stream generator 104.
[0034]
Here, the flow of processing when a normal frame and a special frame are created in the encoder 103 in accordance with a control signal from the controller 106 will be described with reference to FIG. 7 schematically showing the flow. .
As shown in the figure, when the control signal from the controller 106 is "0" (the frame to be processed is a normal frame shown on the left side of the figure), the LPC predictor 102 , A LPC prediction residual signal d (i) corresponding to the calculated prediction value is calculated, and then, the encoder 103 calculates the calculated LPC prediction residual signal d (i). ) Is encoded as residual signal information.
Then, the residual signal information encoded by the encoder 103 is used by the bit stream generator 104 to generate information (prediction coefficient in the figure) for specifying a prediction coefficient applied when predicting the normal frame. (Indicated by information) to form code data based on a predetermined format (in the figure, a normal frame code is used). On the other hand, when the input from the controller 106 is “1” (the frame to be processed is a special frame shown on the right side of the figure), a predetermined sample length (sample of the order N of the LPC prediction) is used. Therefore, the LPC prediction residual signal d (i) of the LPC sample length is not subjected to the encoding process in the encoder 102 (in FIG. Is set to "none"), and only the LPC prediction residual signal d (i) after a predetermined sample length is encoded by the encoder 102 as residual signal information.
Then, the residual signal information encoded by the encoder 103 is used by the bit stream generator 104 to specify information (hereinafter, referred to as prediction coefficient information) for specifying a prediction coefficient applied when predicting the special frame. ), Frame data x (i) of a predetermined sample length input from the controller 106 (indicated by head PCM data in the figure), and a code based on a predetermined format, packed together with the header of the special frame. Form the data. (In the figure, it is indicated by a special frame code).
As described above, in the present embodiment, as in the above-described embodiment, (1) special frames are arranged in the bit stream at predetermined time intervals, and (2) the special frames depend on data of past frames. It is encoded without using a signal, and {circle around (3)} has a feature that the header of the special frame includes a synchronization code.
As a result, even in the encoded data encoded according to the present embodiment, the special frame can be used as a temporal index (index), and a user who wants to play the bit stream halfway can use the midway position (time). By searching for a special frame corresponding to, it is possible to play back halfway from an arbitrary position.
In addition, when the special frame is reproduced halfway, the special frame does not use a time-series signal depending on a past frame. Playback).
[0035]
Next, an example of a time-series signal decoding device for decoding the bit stream generated by the above-described time-series signal encoding device C will be described with reference to FIG.
Hereinafter, processing of each unit from decoding of the bit stream input to the time-series signal decoding device D illustrated in FIG. 6 to output (reproduction) as PCM data will be described along the processing flow.
[0036]
First, the bit stream input to the time-series signal decoding device D is input to a bit stream decoder 204 via an input terminal 205.
The bit stream decoder 204 decodes the segment of the bit stream, performs decomposition into frame units, and determines the type of the frame (special frame or other (normal frame)). Then, the following processing according to the type is performed for each frame.
[0037]
(When the frame to be processed is a normal frame)
First, the case where the decomposed frame is a normal frame without a header will be described.
The code of the residual signal information (see FIG. 7) in the bit stream decoded by the bit stream decoder 204 is input to the decoder 203 and restored to the LPC prediction residual signal d (i). Note that the decoder 203 performs a decoding process corresponding to the encoder 103 shown in FIG.
Also, of the bit stream decoded by the bit stream decoder 204, the code of the prediction coefficient information (see FIG. 7) is input to the LPC predictor 202 and used for specifying the LPC prediction coefficient in the LPC predictor 202. . As a result, the LPC prediction coefficient in the LPC predictor 202 is the same as the LPC prediction coefficient applied to the LPC predictor 102 (see FIG. 5) in the time-series signal encoding device C described above.
Then, by adding the output signal of the LPC predictor 202 and the decoded LPC prediction residual signal d (i), the frame data x (i) is decoded, and the decoded frame data x (i) is decoded. i) is input to the buffer 201.
[0038]
(If the frame to be processed is a special frame)
Next, a case where the decomposed frame is a special frame having a header will be described.
If the bit stream decoder 204 recognizes the presence of a header in the decoded frame (that is, if the frame is determined to be a special frame), the header and frame data x (i ) (Indicated by the head PCM data in the figure) is transmitted to the controller 206. Here, since the header includes information relating to control, the controller 206 performs predetermined control (that is, processing reverse to the encoding procedure) described later based on this information. .
Here, of the bit stream decoded by the bit stream decoder 204, the code of the residual signal information (see FIG. 7) is decoded by the decoder 203, and the code of the prediction coefficient information (see FIG. 7). Is used to specify the LPC prediction coefficient in the LPC predictor 202, which is the same as the processing in the normal frame described above.
However, when decoding a special frame, the residual signal information decoded by the decoder 203 includes frame data x (i) having a predetermined sample length (that is, head PCM data and i = No information corresponding to (N to past samples) is included.
Therefore, when decoding a special frame in the present embodiment, first, the controller 206 that has received the frame data x (i) having the predetermined sample length transmits the frame data x (i) to the buffer 201. The transmitted and transmitted frame data x (i) is used as the first sample (i = 1 to N) of the decoded frame data x (i).
Note that the LPC prediction residual signal d (i) decoded by the decoder 203 is frame data x (i) having a predetermined sample length (that is, the first PCM data, i = N and past samples). Is the same as that of the normal frame except that the signal corresponding to the normal frame is not included, and the processing related to the decoding is the same as the processing in the normal frame, and thus the description is omitted here.
The frame data x (i) generated by performing predetermined processing on each frame in this manner is sequentially transferred to the buffer 201, and the output signal of the buffer 201 is output via the output terminal 200. Thus, the decoding of the original PCM data is completed.
In the above description and FIG. 6, the buffer 201 is provided so as to correspond to the buffer 101 in the time-series signal encoding apparatus C described in FIG. 5, but the buffer 201 is an essential component. Instead, the decoded PCM data (and the leading data received from the controller 206) may be sequentially output without buffering in the buffer 201. However, as in the above-described embodiment, in the buffer 101 of the time-series signal encoding device C, processing using correlation between channels (for example, processing such as Lch + Rch and Lch-Rch for a 2ch audio signal) is performed. If so, the buffer 201 needs to perform the reverse process.
As described above, according to the time-series signal decoding apparatus D, when decoding the time-series signal from the bit stream generated by the time-series signal encoding apparatus C, the time-series signals are arranged at predetermined intervals in the bit stream. It can be understood that the special frame to be played back can be played back from an arbitrary place as a temporal index.
Further, in the processing relating to the intermediate reproduction, since the original time-series signal is decoded without using data of another (past) frame, "error propagation" does not occur.
[0039]
(Third embodiment)
Next, a time-series signal encoding device according to a third embodiment of the present invention will be described with reference to FIG.
Here, the time-series signal encoding apparatus E according to the third embodiment is embodied as a block diagram shown in FIG. As shown in the figure, the time-series signal encoding device E includes a buffer 101 (corresponding to an example of the frame dividing unit), an LPC predictor 102 (corresponding to an example of the predicting unit), and a subtracter 108 (corresponding to the residual). An encoder 103 (corresponding to an example of the encoding means); a bit stream generator 104 (corresponding to an example of the bit stream generating means); and a controller 106 (corresponding to an example of the bit stream generation control means). (Corresponding to an example) and a counter 107 (corresponding to an example of a special frame selecting means) which is the same as the above-described time-series signal encoding apparatus A (the first embodiment) (a common part Numbering is the same).
However, the time-series signal encoding device E further includes a pitch predictor 110 in addition to the LPC predictor 108 as prediction means for predicting a current time-series signal from a past time-series signal. This is different from the embodiment described above.
Hereinafter, the processing of each unit from the time when PCM data (an example of a time-series signal) input to the time-series signal encoding device E is encoded and output as code data will be described along the processing flow. .
[0040]
Here, basic processing by the buffer 101, the LPC predictor 102, the subtracter 108, the encoder 103, and the bit stream generator 104 in the time-series signal encoding device C, and a special frame selecting function by the counter 107 Is the same as that of the first embodiment described above, so that the description is omitted here, and the pitch prediction processing by the newly added pitch predictor 110 and the part where the different processing is performed accordingly will be described. I do.
[0041]
(Pitch predictor 110)
The time-series signal encoder E differs from the time-series signal encoder A described above in that the pitch predictor 110 is arranged downstream of the subtractor 108.
The pitch predictor 110 receives the LPC residual signal d (i) calculated by the subtractor 108, and performs a prediction process using the pitch (periodicity) of the LPC residual signal d (i) (ie, Is pitch prediction).
Details regarding the pitch prediction are described in, for example, Non-Patent Document 1, Non-Patent Document 2, and the like.
The advantage of using pitch prediction is that a time-series signal represented by a voice / audio signal or the like contains a mixture of driving sound source information and other information (corresponding to vocal tract information in the case of voice). It can be said that the pitch prediction corresponds to the former prediction, whereas the LPC predictor corresponds to the latter.
Therefore, by further performing pitch prediction on the LPC prediction residual signal calculated according to the prediction value by the LPC predictor 102, it is possible to expect further efficient prediction (compression encoding).
In the pitch predictor 110 in which pitch prediction is performed, a prediction value is calculated using the pitch L of the LPC prediction residual signal d (i).
(Equation 5)
Figure 2004271812
Is predicted by the following equation (3), and the predicted value is output to the subtractor 109.
(Equation 6)
Figure 2004271812
Here, βn (n = 1, 2,..., 2M) is a pitch prediction coefficient.
Note that, like the LPC prediction coefficient αn in the LPC predictor 102, the pitch prediction coefficient βn is calculated each time according to the input LPC prediction residual signal d (i), even if it is a preset count. Coefficient may be used. Further, the pitch L of the LPC prediction residual signal d (i) can be specified by using an autocorrelation signal to determine a sample interval at which the autocorrelation value is maximized (of course, the method is not limited). ).
[0042]
(Subtractor 109)
In the subtractor 109, the prediction signal predicted by the pitch predictor 110 is output.
(Equation 7)
Figure 2004271812
And the LPC prediction residual signal d (i) directly input from the LPC predictor 102, a pitch prediction residual signal e (i) is calculated as in the following Expression 4.
(Equation 8)
Figure 2004271812
Then, the pitch prediction residual signal e (i) calculated by the above equation 4 is output to the encoder 103.
[0043]
The basic configuration and operation of the encoding using the pitch prediction described above are the same as those of a conventionally known time-series signal encoding device.
However, in the present embodiment, as described above, when the predicted value is predicted for the special frame selected by the special frame function (the counter 107), the past (other) frame data of the special frame is used. And a bit stream generation control function (corresponding to an example of the bit stream generation control means) for replacing a predicted value with a predetermined set value (setting signal, = 0) without using the bit stream generation control function.
Therefore, the bit stream generation control function in encoding the prediction signal predicted by the pitch predictor 110 will be described below in detail.
[0044]
(Bit stream generation control function)
The controller 106, which has received the operation command from the counter 107, controls each of the above-described units as follows, so that, for the special frame selected by the counter 107, the past frame data from the special frame is deleted. A function of predicting a predicted value without using it is realized.
First, upon receiving an operation command from the counter 107, the controller 106 transmits a control signal for controlling the operations of the LPC predictor 102 and the pitch predictor 110. In addition, the controller 106 generates a header indicating that the frame to be processed this time is a special frame, and sends the header to the bit stream generator 106 in the same manner as in the first embodiment. It is.
On the other hand, when the control command is received from the controller 106, the LPC predictor 102 performs the following prediction processing different from the normal prediction processing.
Upon receiving the control command, the LPC predictor 102 does not perform LPC prediction from the first sample in the frame (special frame) to the sample corresponding to the order of LPC prediction (corresponding to N in the above equation (1)). Specifically, the predicted value is replaced with a predetermined set value (= 0), and a process of setting the LPC residual signal d (i) = frame data x (i) (i = 1 to N) is performed.
By this processing, in the LPC predictor 102, for a special frame, the prediction value is specified only from the signal in the current frame without using the signal of the past frame, and the encoded time-series signal is reproduced halfway. Is generated.
In the special frame, samples after the sample corresponding to the order of the LPC prediction (corresponding to N in the above equation (1)) from the head sample of the special frame are past samples necessary for performing the LPC prediction. Exists in the frame, so that a prediction value is calculated by LPC prediction as in the related art.
On the other hand, the pitch predictor 110 that has received the control command from the controller 106 also performs the following prediction processing different from the normal prediction processing based on the same concept as the LPC predictor 102.
In the pitch predictor 110 having received the control command, pitch prediction is not performed from the first sample of the frame (special frame) to the sample corresponding to the order of pitch prediction (corresponding to 2M in the above equation (3)). . Specifically, a process is performed in which the pitch prediction residual signal e (i) = the LPC prediction residual signal d (i) (i = 1 to L + M).
In this process, similarly to the LPC predictor 102, the pitch predictor 110 calculates a prediction value for a special frame from only the time-series signal in the current frame without using a signal of a past frame. And the data of the frame corresponding to the halfway reproduction is generated.
Note that, even in a special frame, for samples subsequent to the sample corresponding to the order of pitch prediction (corresponding to 2M in the above equation (3)) from the first sample of the frame, past samples necessary for performing LPC prediction are not included in the frame. , The predicted value is calculated by pitch prediction as in the related art.
Here, the flow of processing when the encoder 103 creates a normal frame and a special frame in accordance with a control signal from the controller 106 will be described with reference to FIG. 10 schematically showing the flow. .
As shown in the figure, when the control signals input from the controller 106 to both predictors are both "0", the frame to be processed is a normal frame shown on the left side of the figure. ), A prediction value is calculated by the LPC predictor 102 as in the conventional configuration, and the LPC prediction residual signal d (i) corresponding to the calculated prediction value is further transmitted to the pitch side unit 110. , A pitch prediction residual signal e (i) corresponding to the calculated prediction value is calculated, and then the encoder 103 calculates the pitch prediction residual signal e (i). ) Is encoded as residual signal information.
Then, the residual signal information encoded by the encoder 103 is used by the bit stream generator 104 to generate information (prediction coefficient in the figure) for specifying a prediction coefficient applied when predicting the normal frame. (Shown by information) to form code data based on a predetermined format. (In the figure, it is usually indicated by a frame code.)
On the other hand, when the frame to be processed is a special frame as shown on the right side of the figure, the following three conditions can be considered according to the state of the control signal.
First, when the control signals input to both predictors from the controller 106 are both “1”, the LPC prediction and the pitch prediction are not performed, and the prediction value becomes the set value = 0. Therefore, the input frame data x (i) (predicted value = 0) is replaced by a predetermined number of sample lengths at the beginning (samples of the order N of LPC prediction, which are indicated by LPC sample lengths in the figure). The LPC prediction residual signal d (i)) becomes the input signal of the encoder 103. The residual signal information encoded by the encoder 103 at this time is an example of the supplementary information.
Next, if only the control signal for the pitch predictor 110 is “1”, only the pitch prediction is not performed, and during that time, the LPC prediction residual signal d (i) is input to the encoder 103. It becomes.
Finally, when the control signals input to both predictors are both “0”, both LPC prediction and pitch prediction are performed. The prediction residual signal e (i) is an input signal of the encoder 103.
The input signal switched according to the state of the control signal in this manner is encoded by the encoder 103 as residual signal information, and thereafter, the residual signal information encoded by the encoder 103 is The bit stream generator 104 packs together with information for specifying a prediction coefficient applied when predicting the special frame (indicated by prediction coefficient information in the figure) and a header of the special frame, and Form code data based on the format. (In the figure, it is indicated by a special frame code).
Thus, in the present embodiment, as in the above-described embodiment, in the special frame, (1) the special frame is arranged in the bit stream at predetermined time intervals, and (2) the special frame is the past frame. And (3) the header of the special frame includes a synchronization code.
As a result, even in the encoded data encoded according to the present embodiment, the special frame can be used as a temporal index (index), and when the bit stream is reproduced halfway, it corresponds to the intermediate position (time). By searching for a special frame to be played back, it is possible to play back halfway from an arbitrary position.
In addition, when the special frame is played back halfway, the time series signal dependent on the past frame is not used for the special frame, so that the time series signal is normally decoded (reproduced) without causing “error propagation”. )can do. Furthermore, information supplemented to prevent "error propagation" is not provided completely separately, but instead of the sign (residual signal) of the normal LPC prediction residual signal d (i) for a part of the head of a special frame. Information), the increase in the size of the bit stream is minimized.
Further, in the present embodiment, by adding a pitch predictor to the above-described embodiment, further highly efficient compression encoding can be expected.
It should be noted that, usually, in the comparison between the order (N) of LPC prediction and the pitch (L) in pitch prediction, the latter (pitch) is usually larger. Therefore, FIG. Although described, it is needless to say that the order (N) of the LPC prediction may be larger than the pitch (L) in the pitch prediction.
[0045]
Next, an example of a time-series signal decoding device that decodes the bit stream generated by the above-described time-series signal encoding device E will be described with reference to FIG.
Hereinafter, the processing of each unit from decoding of the bit stream input to the time-series signal decoding device F illustrated in FIG. 9 to output (reproduction) as PCM data will be described along the processing flow.
[0046]
First, the bit stream input to the time-series signal decoding device F is input to a bit stream decoder 204 via an input terminal 205.
The bit stream decoder 204 (an example of the bit stream input means and the identification information detecting means) decodes a bit stream segment, decomposes the frame into frame units, and classifies the frame (special frame or other (normal frame)). Is determined. Then, the following processing according to the type is performed for each frame.
[0047]
(When the frame to be processed is a normal frame)
First, the case where the decomposed frame is a normal frame without a header will be described.
First, decoding processing of the pitch prediction residual signal e (i) is performed based on the decomposed normal frame. Specifically, of the bit stream decoded by the bit stream decoder 204, the code of the residual signal information (see FIG. 10) is input to the decoder 203 and restored to the pitch prediction residual signal e (i). Is done. Note that the decoder 203 (an example of the decoding unit) performs a decoding process corresponding to the encoder 103 shown in FIG.
In the bit stream decoded by the bit stream decoder 204, prediction coefficient information (see FIG. 10) is input to the pitch predictor 207, and is used for specifying the pitch prediction coefficient in the pitch predictor 207. Accordingly, the pitch prediction coefficient in the pitch predictor 207 is the same as the pitch prediction coefficient applied to the pitch predictor 110 (see FIG. 8, an example of the prediction unit) in the time-series signal encoding device E described above. It becomes a coefficient.
Then, the output signal of the pitch predictor 207 and the decoded pitch prediction residual signal e (i) are added by the adder 207a to decode the LPC prediction residual signal d (i).
Subsequently, decoding processing of the frame data x (i) is performed based on the decoded LPC prediction residual signal d (i). Therefore, of the bit stream decoded by the bit stream decoder 204, prediction coefficient information (see FIG. 10) is input to the LPC predictor 202 (an example of the prediction unit), and the LPC prediction coefficient in the LPC predictor 202 is Used to identify Thereby, the LPC prediction coefficient in the LPC predictor 202 becomes the same coefficient as the LPC prediction coefficient applied to the LPC predictor 102 (see FIG. 8) in the time-series signal encoding device E described above.
Then, the output signal of the LPC predictor 202 and the decoded LPC prediction residual signal d (i) are added by an adder 202a, so that the frame data x (i) is decoded. The data x (i) is input to the buffer 201, and is output from the buffer 201 as PCM data (time-series signal). Here, the adders 207a and 202a and the buffer 201 are examples of a time-series signal output unit.
[0048]
(If the frame to be processed is a special frame)
Next, a case where the decomposed frame is a special frame having a header will be described.
When the bit stream decoder 204 recognizes the presence of a header in the decoded frame (that is, when the frame is determined to be a special frame), the header is transmitted to the controller 206. Here, since the header includes information relating to control, the controller 206 performs predetermined control (that is, processing reverse to the encoding procedure) described later based on this information. .
Here, of the bit stream decoded by the bit stream decoder 204, the code of the residual signal information (see FIG. 10) is decoded by the decoder 203, and the code of the prediction coefficient information (see FIG. 10). However, the point used for specifying the LPC prediction coefficient in the LPC predictor 202 and the pitch prediction coefficient in the pitch predictor 207 is the same as the processing in the normal frame described above.
However, in the case of the special frame in the present embodiment, the residual signal information decoded by the decoder 203 includes not only the pitch prediction residual signal e (i) but also the LPC prediction residual signal d (I) and the frame data x (i) itself (an example of the supplementary information).
Therefore, the controller 206 having received the header transmits a predetermined control signal to the LPC predictor 202 and the pitch predictor 207 and controls each output signal (prediction value) as follows. .
[0049]
(Pitch predictor 207)
In the pitch predictor 207 receiving the control signal from the controller 206, among the residual signal information decoded by the decoder 203, signals other than the pitch prediction residual signal e (i) (that is, the signals described above) In the case of the description, the output signal from the pitch predictor 207 is not added to the frame data x (i) and the LPC prediction residual signal d (t) which are past samples from i = L + M. The control is performed (that is, the output signal of the pitch predictor 207 is replaced with the set value = 0), and the frame data x (i) and the LPC prediction residual signal d (i) are output to the LPC predictor 202 as they are. To be done. On the other hand, when the residual signal information decoded by the decoder 203 is the pitch prediction residual signal e (i) (that is, in the case of the above-described description, the sample after i = L + M) As in the case of the frame, the control is performed so that the LPC prediction residual signal d (i) is decoded by adding the output signal of the pitch predictor 207 and the pitch prediction residual signal e (i).
[0050]
(LPC predictor 202)
On the other hand, in the LPC predictor 202 that has received the control signal from the controller 206, the residual signal information decoded by the pitch predictor 207 is a signal other than the LPC prediction residual signal d (i) (ie, In the case of the above description, when i = N and frame data x (i), which is a past sample, control is performed so that the output signal from the LPC predictor 202 is not added (that is, , The output signal of the LPC predictor 202 is replaced with a set value = 0), and the frame data x (i) is output to the buffer 201 as it is. On the other hand, when the residual signal information decoded by the pitch predictor 207 is the LPC prediction residual signal d (i) (that is, in the case of the above description, the samples after N) Similarly to the above, the original frame data x (i) is decoded by adding the output signal of the LPC predictor 202 and the LPC prediction residual signal d (i), and the decoded frame data x (i) is obtained. The data is input to the buffer 201.
The frame data x (i) generated by performing predetermined processing on each frame in this manner is sequentially transferred to the buffer 201, and the output signal of the buffer 201 is output via the output terminal 200. Thus, decoding of the PCM data is completed.
In the above description and FIG. 9, the buffer 201 is provided to correspond to the buffer 101 in the time-series signal encoding apparatus E described in FIG. 8, but the buffer 201 is an essential component. Instead, the decoded PCM data may be sequentially output without buffering in the buffer 201. However, as described in the above-described encoding procedure, in the buffer 101 of the time-series signal encoding device A, processing using correlation between channels (for example, Lch + Rch, Lch-Rch for a 2ch audio signal) Is performed, it is necessary to perform reverse processing in the buffer 201.
As described above, according to the time-series signal decoding apparatus F, when decoding the time-series signal from the bit stream generated by the time-series signal encoding apparatus E, the time-series signal is allocated to the bit stream at predetermined intervals. It can be understood that the special frame to be played back can be played back from an arbitrary place as a temporal index.
Further, in the processing relating to the intermediate reproduction, since the original time-series signal is decoded without using the data of the past (other) frame, "error propagation" does not occur.
[0051]
(Fourth embodiment)
Next, a time-series signal encoding device according to a fourth embodiment of the present invention will be described with reference to FIG.
Here, the time-series signal encoding device G according to the fourth embodiment is embodied as a block diagram shown in FIG. As is clear from the figure, the time-series signal encoding apparatus G includes a buffer 101 (corresponding to an example of the frame dividing unit), an LPC predictor 102 (corresponding to an example of the predicting unit), and a subtractor 108 (corresponding to the example of the predicting unit). Pitch predictor 110 (corresponds to an example of the prediction means), subtractor 109 (corresponds to an example of the residual signal calculation means), encoder 103 (corresponding to an example of the residual signal calculation means). A bit stream generator 104 (corresponding to an example of the bit stream generating means), a controller 106 (corresponding to an example of the bit stream generation controlling means), and a counter 107 (corresponding to an example of the special frame selecting means). It is provided with a schematic configuration. That is, it is realized by the substantially same configuration as that of the third embodiment. (Numbering of common parts is the same)
However, in the third embodiment, a predetermined control signal from the controller 106 is input to the LPC predictor 102 and the pitch predictor 110, and the LPC predictor 102 and the pitch predictor 102 The unit 110 performs a predetermined process, so that frame data x (i) of a predetermined sample length corresponding to the order (N) of the LPC prediction coefficient and the order (2M) of the pitch prediction coefficient and the LPC prediction residual bond signal d ( i) is transmitted as a part of the special frame.
On the other hand, in the present embodiment, the frame data x (i) having a predetermined sample length (indicated by the head PCM data in FIG. 11) from the buffer unit 101 is input to the controller 106 in advance, and the controller 106 The LPC predictor 102 and the pitch predictor 110 receive predetermined control signals from the LPC predictor 102 and the pitch predictor 110, and perform predetermined processing in accordance with the control command. A configuration in which frame data x (i) having a predetermined sample length and an LPC prediction residual signal d (i) corresponding to the order (N) of prediction coefficients and the order (2M) of pitch prediction coefficients are transmitted as a part of a special frame. Is different.
In the following, the processing of each unit until PCM data (an example of a time-series signal) input to the time-series signal encoding device G is encoded and output as encoded data will be described along the processing flow. .
[0052]
Here, the basics of the buffer 101, the LPC predictor 102, the subtractor 108, the pitch predictor 110, the subtractor 109, the encoder 103, and the bit stream generator 104 in the time-series signal encoding device G are described. Since the basic processing and the special frame selection function by the counter 107 are the same as those in the above-described third embodiment, the description is omitted here, and only the bit stream generation control function in which different processing is performed will be described.
[0053]
(Bit stream generation control function)
Here, in the present embodiment, as shown in FIG. 11, the buffer 101 has a function of buffering input PCM data in frame units, and also includes a frame data x (i) (see FIG. 11 and 13 have a function of extracting head PCM data and inputting the extracted data to the controller 106. Assuming that the buffer 101 inputs the frame data x (i), the controller 106, which has received the operation command from the counter 107, controls each of the above-described units as described below, so that it can be selected by the counter 107. With respect to the special frame, a function of predicting a predicted value without using past frame data from the special frame is realized.
First, upon receiving an operation command from the counter 107, the controller 106 transmits a control signal for controlling the operations of the pitch predictor 110 and the encoder 103. In addition, the controller 106 generates a header indicating that the frame to be processed this time is a special frame, and sends the header to the bit stream generator 106 in the same manner as in the third embodiment. It is. However, in the present embodiment, in addition to the header, frame data x (i) (head PCM data, an example of the supplementary information) of a predetermined sample length input from the buffer 101 is transmitted together with the header to the bit stream generator. The difference is that the information is sent to the E.104. The frame data x (i) and the header having a predetermined sample length are packed in the bit stream generator 106 with the code encoded by the encoder 103 or the prediction coefficient information to form a special frame.
On the other hand, when a control command is received from the controller 106, the pitch predictor 110 performs the following prediction processing different from the normal prediction processing.
Upon receiving the control command, the pitch predictor 107 does not perform pitch prediction from the first sample of the frame (special frame) to the sample corresponding to the order of pitch prediction (corresponding to 2M in the above equation (3)). , And the corresponding residual signal information (code) are not included in the bit stream. Specifically, a process is performed in which the pitch prediction residual signal e (i) = the LPC prediction residual signal d (i) (i = 1 to L + M).
Note that past samples necessary for pitch prediction exist in the frame from the first sample of the frame to samples subsequent to the sample corresponding to the order of pitch prediction (corresponding to 2M in the above equation (3)). As in the prior art, a predicted value is calculated by pitch prediction.
On the other hand, the encoder 103, which has received the control command from the controller 106, performs the following encoding process different from the normal encoding process based on the same concept as the pitch predictor 110.
Specifically, when the control command is received, the encoder 103 performs coding from the first sample in the frame (special frame) to the sample corresponding to the order of LPC prediction (corresponding to N in the above equation (1)). Is not implemented. That is, among the pitch prediction residual signals e (i) input from the subtractor 108 to the encoder 103, encoding is not performed on e (i) (i = 1 to N).
This processing makes it possible to remove the signal of the past frame from the pitch prediction residual signal e (i) encoded in the encoder 103. That is, in the calculation of the code by the encoder 103, the special frame becomes a frame corresponding to the situation in which the encoded time-series signal is reproduced halfway by not using the signal depending on the past frame. obtain.
In the special frame as well, the samples subsequent to the sample corresponding to the order of the LPC prediction (corresponding to N in the above equation (1)) from the first sample of the special frame are code based on a predetermined encoding method as in the related art. After that, the code is output to the bit stream generator 104.
[0054]
Here, the flow of processing in the encoder 103 when a normal frame and a special frame are created according to a control signal from the controller 106 will be described with reference to FIG. 13 schematically showing the flow. .
As shown in the figure, control signals input from the controller 106 to the pitch predictor 110 and the encoder 103 are both "0" (the frame to be processed is a normal frame shown on the left side of the figure). ), A prediction value is calculated by the LPC predictor 102 as in the conventional configuration, and the LPC prediction residual signal d (i) corresponding to the calculated prediction value is further transmitted to the pitch side. The prediction value is calculated by the encoder 110, the pitch prediction residual signal e (i) corresponding to the calculated prediction value is calculated, and thereafter, the calculated pitch prediction residual signal e (I) is encoded as residual signal information.
Then, the residual signal information encoded by the encoder 103 is used by the bit stream generator 104 to generate information (prediction coefficient in the figure) for specifying a prediction coefficient applied when predicting the normal frame. (Shown by information) to form code data based on a predetermined format. (In the figure, it is usually indicated by a frame code.)
On the other hand, when the frame to be processed is a special frame as shown on the right side of the figure, the following three conditions can be considered according to the state of the control signal.
First, when the control signals input from the controller 106 to the pitch estimator 110 and the encoder 103 are both “1”, the pitch prediction and the encoding process are not performed. There is no input signal to the encoder 103 for a sample length (sample of the order N of the LPC prediction, which is indicated by the LPC sample length in the figure) (the state is shown as "none" in the figure). ).
Next, if only the control signal for the pitch predictor 110 is “1”, only the pitch prediction is not performed, and during that time, the LPC prediction residual signal d (i) is input to the encoder 103. It becomes.
Finally, if the control signals input from the controller 106 to the pitch predictor 110 and the encoder 103 are both "0", both pitch prediction and encoding are performed. As in the case of the normal frame described above, the pitch prediction residual signal e (i) becomes the input signal of the encoder 103.
The input signal switched in accordance with the state of the control signal as described above is encoded by the encoder 103 as residual signal information. Then, the residual signal information encoded by the encoder 103 is used by the bit stream generator 104 to identify information (hereinafter, referred to as prediction coefficient) that specifies a prediction coefficient applied when predicting the special frame. Information), frame data x (i) of a predetermined sample length input from the controller 106 (indicated by the leading PCM sample data in the figure) and the header of the special frame, and packed based on a predetermined format. Form code data. (In the figure, it is indicated by a special frame code).
Thus, in the present embodiment, as in the above-described embodiment, in the special frame, (1) the special frame is arranged in the bit stream at predetermined time intervals, and (2) the special frame is the past frame. And (3) the header of the special frame includes a synchronization code.
As a result, even in the encoded data encoded according to the present embodiment, the special frame can be used as a temporal index (index), and a user who wants to play the bit stream halfway can use the midway position (time). By searching for a special frame corresponding to, it is possible to play back halfway from an arbitrary position.
In addition, when the special frame is played back halfway, the time sequence signal depending on the past frame is not used for the special frame. A time-series signal can be decoded (reproduced).
Further, by further adding a pitch predictor to the above-described embodiment, further efficient compression encoding can be expected.
It should be noted that, usually, in the comparison between the order (N) of LPC prediction and the pitch (L) in pitch prediction, the latter (pitch) is usually larger. Therefore, FIG. Although described, it is needless to say that the order (N) of the LPC prediction may be larger than the pitch (L) in the pitch prediction.
[0055]
Next, an example of a time-series signal decoding device that decodes the bit stream generated by the above-described time-series signal encoding device G will be described with reference to FIG.
Hereinafter, processing of each unit from decoding of the bit stream input to the time-series signal decoding device F illustrated in FIG. 12 to output (reproduction) as PCM data will be described along the processing flow.
[0056]
First, the bit stream input to the time-series signal decoding device H is input to a bit stream decoder 204 via an input terminal 205.
The bit stream decoder 204 decodes the segment of the bit stream, performs decomposition into frame units, and determines the type of the frame (special frame or other (normal frame)). Then, the following processing according to the type is performed for each frame. .
[0057]
(When the frame to be processed is a normal frame)
First, the case where the decomposed frame is a normal frame without a header will be described.
First, decoding processing of the pitch prediction residual signal e (i) is performed based on the decomposed normal frame. Specifically, of the bit stream decoded by the bit stream decoder 204, the code of the residual signal information (see FIG. 13) is input to the decoder 203 and restored to the pitch prediction residual signal e (i). Is done. The decoder 203 performs a decoding process corresponding to the encoder 103 shown in FIG.
Also, of the bit stream decoded by the bit stream decoder 204, prediction coefficient information (see FIG. 13) is input to the pitch predictor 207, and is used for specifying the pitch prediction coefficient in the pitch predictor 207. Thereby, the pitch prediction coefficient in the pitch predictor 207 is the same as the pitch prediction coefficient applied to the pitch predictor 110 (see FIG. 11) in the time-series signal encoding device G described above.
Then, the LPC prediction residual signal d (i) is decoded by adding the output signal of the pitch predictor 207 and the decoded pitch prediction residual signal e (i).
Subsequently, decoding processing of the frame data x (i) is performed based on the decoded LPC prediction residual signal d (i). Therefore, among the bit streams decoded by the bit stream decoder 204, prediction coefficient information (see FIG. 13) is input to the LPC predictor 202, and is used for specifying LPC prediction coefficients in the LPC predictor 202. Thereby, the LPC prediction coefficient in the LPC predictor 202 becomes the same coefficient as the LPC prediction coefficient applied to the LPC predictor 102 (see FIG. 11) in the time-series signal encoding device G described above.
Then, by adding the output signal of the LPC predictor 202 and the decoded LPC prediction residual signal d (i), the frame data x (i) is decoded, and the decoded frame data x (i) Is input to the buffer 201.
[0058]
(If the frame to be processed is a special frame)
Next, a case where the decomposed frame is a special frame having a header will be described.
When the bit stream decoder 204 recognizes the presence of a header in the decoded frame (that is, when the frame is determined to be a special frame), the header is transmitted to the controller 206. Here, since the header includes information related to control, the controller 206 performs predetermined control (that is, processing reverse to the decoding procedure) based on this information, as described later. .
Here, in the bit stream decoded by the bit stream decoder 204, the code of the residual signal information (see FIG. 13) is decoded by the decoder 203, and the code of the prediction coefficient information (see FIG. 13). However, the point used for specifying the LPC prediction coefficient in the LPC predictor 202 and the pitch prediction coefficient in the pitch predictor 207 is the same as the processing in the normal frame described above.
However, in the case of the special frame in the present embodiment, the residual signal information decoded by the decoder 203 includes not only the pitch prediction residual signal e (i) but also the LPC prediction residual signal d (i). Further, the frame data x (i) having a predetermined sample length (that is, the first PCM data, i.e., a past sample from i = N) is not included.
Therefore, the controller 206 having received the header first transmits a predetermined control signal to the pitch predictor 207 and controls an output signal (predicted value) as follows.
In the pitch predictor 207 receiving the control signal from the controller 206, the residual signal information decoded by the decoder 203 is a signal other than the pitch prediction residual signal e (i) (that is, In this case, if i = N to L + M and the LPC prediction residual signal d (i)), control is performed so that the output signal from the pitch predictor 207 is not added ( That is, the output signal of the pitch predictor 207 is replaced with 0), and the LPC prediction residual signal d (i) is output to the LPC predictor 102 as it is. On the other hand, when the residual signal information decoded by the decoder 203 is the pitch prediction residual signal e (i) (that is, in the case of the above-described description, the sample after i = L + M) As in the case of the frame, the control is performed so that the LPC prediction residual signal d (i) is decoded by adding the output signal of the pitch predictor 207 and the pitch prediction residual signal e (i).
Here, as described above, in the present embodiment, the residual signal information decoded by the decoder 203 includes frame data x (i) having a predetermined sample length (that is, the first PCM data, i. = N to the past sample).
Therefore, when decoding a special frame in the present embodiment, first, the controller 206 that has received the frame data x (i) having the predetermined sample length transmits the frame data x (i) to the buffer 201. The transmitted frame data x (i) is used as the first sample of the decoded frame data x (i).
Note that the LPC prediction residual signal d (i) decoded by the pitch predictor 207 is frame data x (i) having a predetermined sample length (that is, head PCM data, i. ) Except that a signal corresponding to the normal frame is not included, and the processing related to the decoding is the same as the processing in the normal frame.
The frame data x (i) generated by performing a predetermined process on each frame in this way is sequentially transferred to the buffer 201, and the output signal of the buffer 201 is output via the output terminal 200. Thus, the decoding of the PCM data is completed.
In the above description and in FIG. 12, the buffer 201 is provided so as to correspond to the buffer 101 in the time-series signal encoding apparatus G described in FIG. 11, but the buffer 201 is an essential component. Instead, the decoded PCM data may be sequentially output without buffering in the buffer 201. However, as described in the above-described encoding procedure, in the buffer 101 of the time-series signal encoding device G, processing using correlation between channels (for example, Lch + Rch, Lch-Rch for a 2ch audio signal) Is performed, it is necessary to perform reverse processing in the buffer 201.
As described above, according to the time-series signal decoding apparatus H, when decoding the time-series signal from the bit stream generated by the time-series signal encoding apparatus G, the time-series signal is arranged at predetermined intervals in the bit stream. It can be understood that the special frame to be played back can be played back from an arbitrary place as a temporal index.
Further, in the processing related to the halfway reproduction, since the original time-series signal is decoded without using the past time-series signal, "error propagation" does not occur.
[0059]
(Fifth embodiment)
Next, a time-series signal encoding device according to a fifth embodiment of the present invention will be described with reference to FIG.
Here, the time-series signal encoding device I according to the fifth embodiment is embodied as a block diagram shown in FIG. As is clear from the figure, the time-series signal coding apparatus I includes a buffer 101 (corresponding to an example of the frame dividing means), an LPC predictor 102 (corresponding to an example of the predicting means), and a subtractor 108 (corresponding to the example of the predicting means). Pitch predictor 110 (corresponds to an example of the prediction means), subtractor 109 (corresponds to an example of the residual signal calculation means), encoder 103 (corresponding to an example of the residual signal calculation means). A bit stream generator 104 (corresponding to an example of the bit stream generating means), a controller 106 (corresponding to an example of the bit stream generation controlling means), and a counter 107 (corresponding to an example of the special frame selecting means). It is provided with a schematic configuration. That is, it is realized by the substantially same configuration as that of the third embodiment. (Numbering of common parts is the same)
However, in the third embodiment, a predetermined control signal from the controller 106 is input to the LPC predictor 102 and the pitch predictor 110, and the LPC predictor 102 and the pitch predictor 102 The unit 110 performs a predetermined process, so that frame data x (i) of a predetermined sample length corresponding to the order (N) of the LPC prediction coefficient and the order (2M) of the pitch prediction coefficient and the LPC prediction residual bond signal d ( i) is transmitted as a part of the special frame.
On the other hand, in the present embodiment, the frame data x (i) having a predetermined sample length (indicated by the head PCM data in FIG. 11) from the buffer unit 101 is input to the controller 106 in advance. , Outputs the frame data x (i) together with the header to the bit stream generator 104 in response to an operation command from the counter 107, and further causes the encoder 103 to execute predetermined processing, thereby achieving LPC prediction. The frame data x (i) and the LPC prediction residual signal d (i) having a predetermined sample length according to the coefficient order (N) and the pitch prediction coefficient order (2M) are transmitted as a part of the special frame. Some differences.
In the following, the processing of each unit until PCM data (an example of a time-series signal) input to the time-series signal encoding device G is encoded and output as encoded data will be described along the processing flow. .
[0060]
Here, the buffer 101, the LPC predictor 102, the subtractor 108, the pitch predictor 110, the subtractor 109, the encoder 103, and the bit stream generator 104 in the time-series signal encoding device G are used. The basic processing and the special frame selection function by the counter 107 are the same as those of the above-described time-series signal encoding apparatus E, so that the description is omitted here, and only the bit stream generation control function in which different processing is performed is described. explain.
[0061]
(Bit stream generation control function)
The controller 106, which has received the operation command from the counter 107, controls each unit as described below, so that for the special frame selected by the counter 107, frame data older than the special frame is used. A function of predicting a predicted value without realizing it.
First, when an operation command is received from the counter 107, a control signal for controlling the operation of the encoder 103 is transmitted from the controller 106. In addition, the controller 106 generates a header indicating that the frame to be processed this time is a special frame, and sends the header to the bit stream generator 106 in the same manner as in the third embodiment. It is.
On the other hand, the encoder 103 that has received the control command from the controller 106 performs the following encoding process different from the normal encoding process.
Upon receiving the control command, the encoder 103 does not perform encoding from the first sample of the frame (special frame) to the sample corresponding to the order of pitch prediction (corresponding to 2M in the above equation (3)). That is, among the LPC prediction residual signals d (i) input from the subtractor 108 to the encoder 103, encoding is not performed on d (i) (i = 1 to L + M), and The residual signal information (code) is not included in the bit stream.
By this processing, in the encoder 103, for the special frame, only the pitch prediction residual signal e (i) calculated without using the signal of the past frame is encoded. The signal becomes data corresponding to halfway reproduction.
In the special frame, samples subsequent to the sample corresponding to the order of pitch prediction (corresponding to 2M in the above equation (3)) from the first sample of the special frame are subjected to a predetermined encoding method, similarly to the normal frame. Encoding is performed, and then the code is output to the bit stream generator 104.
[0062]
Here, the flow of processing in the encoder 103 when a normal frame and a special frame are created according to a control signal from the controller 106 will be described with reference to FIG. 16 schematically showing the flow. .
As shown in the figure, when the control signal input from the controller 106 to the encoder 103 is "0" (the frame to be processed is a normal frame shown on the left side of the figure), Similarly to the configuration, a prediction value is calculated by the LPC predictor 102, and an LPC prediction residual signal d (i) corresponding to the calculated prediction value is further calculated by the pitch side unit 110. , A pitch prediction residual signal e (i) corresponding to the calculated prediction value is calculated, and thereafter, the encoder 103 converts the calculated pitch prediction residual signal e (i) into a residual signal. Encoded as information.
Then, the residual signal information encoded by the encoder 103 is used by the bit stream generator 104 to identify information (prediction coefficient in the figure) specifying the prediction coefficient applied when predicting the normal frame. (Indicated by information) to form code data based on a predetermined format (in the figure, a normal frame code is used).
[0063]
On the other hand, if the control signal input from the controller 106 to the encoder 103 is “1” (the frame to be processed is a special normal frame shown on the right side of FIG. The pitch prediction residual signal e (i) of the sample corresponding to the order 2M of pitch prediction (indicated by the pitch prediction sample length in the figure) is not subjected to the encoding process in the encoder 103 (see FIG. In the figure, the state is indicated by “none” for “the signal processed by the encoder”), and only the pitch prediction residual signal e (i) after a predetermined sample length It is encoded as signal information.
Then, the residual signal information encoded by the encoder 103 is used by the bit stream generator 104 to identify information (hereinafter, referred to as prediction coefficient) that specifies a prediction coefficient applied when predicting the special frame. Information), frame data x (i) of a predetermined sample length input from the controller 106 (indicated by the leading PCM sample data in the figure) and the header of the special frame, and packed based on a predetermined format. Form code data. (In the figure, it is indicated by a special frame code).
Thus, in the present embodiment, as in the above-described embodiment, in the special frame, (1) the special frame is arranged in the bit stream at predetermined time intervals, and (2) the special frame is the past frame. And (3) the header of the special frame includes a synchronization code.
As a result, even in the encoded data encoded according to the present embodiment, the special frame can be used as a temporal index (index), and a user who wants to play the bit stream halfway can use the midway position (time). By searching for a special frame corresponding to, it is possible to play back halfway from an arbitrary position.
In addition, when the special frame is played back halfway, the time series signal dependent on the past frame is not used for the special frame, so that the time series signal is normally decoded (reproduced) without causing “error propagation”. )can do.
Further, by further adding a pitch predictor to the above-described embodiment, further efficient compression encoding can be expected.
It should be noted that, usually, in the comparison between the order (N) of LPC prediction and the pitch (L) in pitch prediction, the latter (pitch) is usually larger. Therefore, FIG. Although described, it is needless to say that the order (N) of the LPC prediction may be larger than the pitch (L) in the pitch prediction.
[0064]
Next, an example of a time-series signal decoding device that decodes the bit stream generated by the above-described time-series signal encoding device G will be described with reference to FIG.
Hereinafter, processing of each unit from decoding of the bit stream input to the time-series signal decoding apparatus J illustrated in FIG. 15 to output (reproduction) as PCM data will be described along the processing flow.
[0065]
First, the bit stream input to the time-series signal decoding device J is input to a bit stream decoder 204 via an input terminal 205.
The bit stream decoder 204 decodes the segment of the bit stream, performs decomposition into frame units, and determines the type of the frame (special frame or other (normal frame)). Then, the following processing according to the type is performed for each frame. .
[0066]
(When the frame to be processed is a normal frame)
First, the case where the decomposed frame is a normal frame without a header will be described.
First, decoding processing of the pitch prediction residual signal e (i) is performed based on the decomposed normal frame. Specifically, of the bit stream decoded by the bit stream decoder 204, the code of the residual signal information (see FIG. 16) is input to the decoder 203 and restored to the pitch prediction residual signal e (i). Is done. Note that the decoder 203 performs a decoding process corresponding to the encoder 103 shown in FIG.
Also, of the bit stream decoded by the bit stream decoder 204, prediction coefficient information (see FIG. 16) is input to the pitch predictor 207 and is used for specifying the pitch prediction coefficient in the pitch predictor 207. Accordingly, the pitch prediction coefficient in the pitch predictor 207 is the same as the pitch prediction coefficient applied to the pitch predictor 110 (see FIG. 14) in the time-series signal encoding device I described above.
Then, the output signal of the pitch predictor 207 and the decoded pitch prediction residual signal e (i) are added by the adder 207a to decode the LPC prediction residual signal d (i).
Next, decoding processing of the frame data x (i) is performed based on the decoded LPC prediction residual signal d (i). Specifically, of the bit stream decoded by the bit stream decoder 204, prediction coefficient information (see FIG. 16) is input to the LPC predictor 202 and used to specify LPC prediction coefficients in the LPC predictor 202. Is done. As a result, the LPC prediction coefficient in the LPC predictor 202 is the same as the LPC prediction coefficient applied to the LPC predictor 102 (see FIG. 14) in the time-series signal encoding device I described above.
Then, by adding the output signal of the LPC predictor 202 and the decoded LPC prediction residual signal d (i), the frame data x (i) is decoded, and the decoded frame data x (i) Is input to the buffer 201.
[0067]
(If the frame to be processed is a special frame)
Next, a case where the decomposed frame is a special frame having a header will be described.
When the bit stream decoder 204 recognizes the presence of a header in the decoded frame (that is, when the frame is determined to be a special frame), the header is transmitted to the controller 206. Here, since the header includes information related to control, the controller 206 performs predetermined control (that is, processing reverse to the coding procedure) based on this information, as described later. .
On the other hand, in the bit stream decoded by the bit stream decoder 204, the code of the residual signal information (see FIG. 16) is decoded by the decoder 203, and the code of the prediction coefficient information (see FIG. 16) is changed. , The LPC prediction coefficient in the LPC prediction unit 202 and the pitch prediction coefficient in the pitch prediction unit 207 are used in the same manner as the processing in the normal frame described above.
However, when decoding a special frame, the residual signal information decoded by the decoder 203 includes frame data x (i) having a predetermined sample length (that is, head PCM data and i = No information corresponding to (L + M to past sample) is included.
Therefore, when decoding a special frame in the present embodiment, first, the controller 206 that has received the frame data x (i) having the predetermined sample length transmits the frame data x (i) to the buffer 201. The transmitted frame data x (i) is used as the first sample of the decoded frame data x (i).
Note that the pitch prediction residual signal e (i) decoded by the decoder 203 is frame data x (i) having a predetermined sample length (that is, the first PCM data, i.e., the past sample from i = L + M). Is the same as that of the normal frame except that the signal corresponding to the normal frame is not included, and the processing related to the decoding is the same as the processing in the normal frame, and thus the description is omitted here.
The frame data x (i) generated by performing a predetermined process on each frame in this way is sequentially transferred to the buffer 201, and the output signal of the buffer 201 is output via the output terminal 200. Thus, the decoding of the PCM data is completed.
In the above description and FIG. 15, the buffer 201 is provided so as to correspond to the buffer 101 in the time-series signal encoding apparatus I described in FIG. 14, but the buffer 201 is an essential component. Instead, the decoded PCM data may be sequentially output without buffering in the buffer 201. However, as described in the above-described encoding procedure, in the buffer 101 of the time-series signal encoding device G, processing using correlation between channels (for example, Lch + Rch, Lch-Rch for a 2ch audio signal) Is performed, it is necessary to perform reverse processing in the buffer 201.
As described above, according to the time-series signal decoding apparatus J, when decoding the time-series signal from the bit stream generated by the time-series signal encoding apparatus I, the time-series signal is arranged in the bit stream at predetermined intervals. It can be understood that the special frame to be played back can be played back from an arbitrary place as a temporal index.
Further, in the processing relating to the intermediate reproduction, since the original time-series signal is decoded without using the data of the past (other) frame, "error propagation" does not occur. Further, information supplemented to prevent "error propagation" is not provided completely separately, but instead of the code (residual signal) of the normal pitch prediction residual signal e (i) for the first part of the special frame. Information), the increase in the size of the bit stream is minimized.
[0068]
(Sixth embodiment)
Next, a time-series signal encoding device according to a sixth embodiment of the present invention will be described with reference to FIG.
Here, the components of the time-series signal encoding device C1 according to the sixth embodiment are the same as those of the time-series signal encoding device C shown in FIG. The processing for the normal frame is the same as that in each of the above-described embodiments.
Here, the time-series signal encoding device C inputs a part of the leading frame data from the buffer 101 to the controller 106 for the special frame. On the other hand, the time-series signal encoding device C1 transmits, from the LPC predictor 102, the prediction initial setting data that is a part of the tail of the frame data (PCM data) in the frame immediately before the special frame. The difference is that the bit stream generator 104 is configured to be output to the bit stream generator 104 via a controller 106.
As shown in the above equation 1, the LPC predictor 102 estimates the number of past samples required for the prediction (N samples in the case of equation 1) in order to predict the current PCM data value. Past PCM data is always retained except for a certain time after the start of processing. In the time-series signal encoding device C1, every time a frame to be the special frame is selected by the counter 107, before the processing of the special frame data is started, the past data held by the LPC predictor 102 is stored. The PCM data, that is, the PCM data of the predetermined number of samples (the order of the prediction by the LPC predictor 102) at the end of the frame data in the frame (normal frame) immediately before the special frame is the initial setting for the prediction. The data is obtained from the LCP predictor 102 by the controller 106 as data (an example of the supplementary information), and is output to the bit stream generator 104. The bit stream generator 104 that has received the prediction initial setting data includes it in the bit stream (controlled by the controller 106 to include it). Here, for the special frame, the header is output from the controller 106 to the bit stream generator 104 and is included in the bit stream as in the above-described embodiments. Otherwise, the special frame is processed in the same manner as the normal frame.
[0069]
FIG. 19 schematically illustrates a flow of processing related to signals and codes in the time-series signal encoding device C1 according to the sixth embodiment.
As shown in the figure, when the control signal from the controller 106 is "0" (normal frame), it is the same as the above-described embodiments.
On the other hand, when the input from the controller 106 is “1” (special frame), the initial value for the prediction before the disclosure of the prediction process by the LPC predictor 102 for the special frame (at the time of disclosure) is described. Configuration data is included in the bitstream along with the header. Otherwise, prediction processing and encoding processing are performed as in the case of the normal frame, and residual signal information in which the LPC prediction residual signal d (i) is encoded is included in the bit stream.
By generating such a bit stream, the special frame can be reproduced without using (referencing) data of another (past) frame. In the bit stream generated here, the initial setting data for prediction becomes additional information, while the encoder 103 is not controlled at all and the LPC prediction residual for all frame data (PDM data) in the special frame is not changed. The sign of the difference signal (residual signal information) is included without omission. Therefore, the amount of increase in the size of the bit stream is greater than in the first to sixth embodiments. However, since the selection (sampling) of the special frame is performed, the amount of increase in the data size is remarkably increased as compared with the case where additional information (supplementary information) is included for each frame (block) as shown in Patent Document 1. Can be suppressed.
[0070]
Next, a time-series decoding device D1 that decodes and reproduces the bit stream generated by the time-series signal encoding device C1 will be described with reference to FIG.
Here, the components of the time-series signal decoding device D1 are the same as those of the time-series signal decoding device D shown in FIG. The processing for the normal frame is the same as that in each of the above-described embodiments.
On the other hand, when the bit stream decoder 204 determines that the type of the decomposed frame is the special frame, the prediction initial setting data included in the special frame is transmitted to the controller 206 via the controller 206. The data is transferred to the LPC predictor 202. The LPC predictor 202 that has input this uses the prediction initial setting data (a part of the tail PCM data of the immediately preceding frame) for prediction before starting the prediction process for the special frame. After setting as the initial value of the past PDM data, the process is started.
Thereby, according to the time-series signal decoding apparatus D1, when decoding the time-series signal from the bit stream generated by the time-series signal encoding apparatus C1, a special signal arranged at a predetermined interval in the bit stream is used. Using a frame as a temporal index (index), it is possible to play back halfway from an arbitrary location.
Also, in the process of the midway reproduction, the original PCM data (time-series signal) can be reproduced without using data of another (past) frame, so that "error propagation" does not occur.
In this embodiment, the initial setting data for prediction is included in the bit stream without being encoded. However, the data is encoded by the time-series signal encoding device C1 and decoded by the time-series signal decoding device D1. It is also possible to do.
[0071]
【Example】
In the embodiment described above, by arranging a special frame having a header including a synchronization code arranged at predetermined time intervals in a bit stream, the special frame is used as a temporal index. And a time-sequential signal encoding apparatus corresponding to halfway reproduction of an encoded time-series signal (that is, a bit stream) is described.
Here, a mode is considered in which the header of the special frame further includes not only the synchronization code but also position information (pointer) for specifying the position of another special frame.
Specifically, a case is considered where the position information included in the header of the special frame is information for specifying the position of the special frame immediately before and / or immediately after the special frame.
[0072]
FIG. 20 schematically shows a header in a special frame generated based on such a configuration.
As shown in the figure, the header Y of the special frame includes, in addition to a synchronization code (synchronization code: indicated by ID in the figure) for identifying the header (special frame) from other headers (special frames), another special It is characterized by including a pointer to a frame.
In this embodiment, the pointer is constituted by a front pointer (PTR-B) which is a pointer to the immediately preceding special frame and a rear pointer (PTR-N) which is a pointer to the immediately following special frame. And
Here, the value of these pointers can be a value including a sign (for example, a minus value in the forward direction, a plus value in the backward direction), and a sequence of PTR-B and PTR-N is defined. , Absolute values can also be used.
[0073]
Next, the state of the pointer will be described with reference to FIG.
As is clear from the figure, for example, if the previous pointer (PTR-B) included in the header Y2 of the special frame X2 is used, the position of the immediately preceding header Y1 (that is, the special frame X1) can be accurately and immediately determined. On the contrary, if the rear pointer (PTR-N) included in the header Y2 of the special frame X2 is used, the position of the immediately following header Y3 (that is, the special frame X3) can be specified accurately and immediately. It is.
As described above, by including the position information for specifying the position of another special frame in the header of the special frame, when the bit stream generated by the time-series signal is reproduced (reproduced halfway), the special frame is reproduced. Based on the position information included in each header, a reproduction method of skipping the time-series signal at predetermined time (frame) intervals, or repeatedly reproducing immediately before, becomes possible, and realizes a more convenient reproduction method. obtain.
In the above description, only the form including only the position information regarding the immediately preceding and succeeding special frames is described. For example, if it is desired to listen to a plurality of special frames again, the special frames are sequentially arranged. I need to go back.
Therefore, a form may be considered in which the position information further includes position information relating to a special frame before a plurality of frames and / or a special frame after a plurality of special frames.
According to such an embodiment, a reproduction method of skipping or re-listening a large number of special frames at a time becomes possible, and a more multifunctional reproduction method can be realized.
[0074]
【The invention's effect】
As described above, according to the present invention, special frames arranged at predetermined intervals are arranged in a bit stream generated by the time-series signal encoding device, and the special frames are Supplementary information is included so that decoding can be performed without using data of a frame (another frame) earlier than the frame.
Therefore, when decoding (reproducing) the bit stream generated by the time-series signal encoding device, the special frame can be reproduced halfway from an arbitrary position as a temporal index (index). In reproduction, "error propagation" does not occur.
In addition, the configuration of the bit stream for preventing the “error propagation” is such that the supplementary information is included only in a part of the selected (sampled) special frames. Compared to a configuration in which the original time-series signal for error detection is placed at the beginning, it can be realized with a much smaller data size. Moreover, if the time-series data at the beginning of the special frame or the data obtained by encoding the time-series data is used as the supplementary information, the residual signal information corresponding to the data can be omitted. It is possible to suppress.
[Brief description of the drawings]
FIG. 1 is a block diagram showing a schematic configuration of a time-series signal encoding device according to a first embodiment.
FIG. 2 is a block diagram showing a schematic configuration of a time-series signal decoding device that decodes a bit stream generated by the time-series signal encoding device according to the first embodiment.
FIG. 3 is a diagram schematically showing a flow of processing related to signals and codes in the time-series signal encoding device according to the first embodiment.
FIG. 4 is a diagram schematically showing a structure of a bit stream generated by the time-series signal encoding device according to the first embodiment.
FIG. 5 is a block diagram illustrating a schematic configuration of a time-series signal encoding device according to a second embodiment of the present invention.
FIG. 6 is a block diagram illustrating a schematic configuration of a time-series signal decoding device that decodes a bit stream generated by the time-series signal encoding device according to the second embodiment.
FIG. 7 is a diagram schematically showing a flow of processing related to signals and codes in the time-series signal encoding device according to the first embodiment.
FIG. 8 is a block diagram illustrating a schematic configuration of a time-series signal encoding device according to a third embodiment of the present invention.
FIG. 9 is a block diagram illustrating a schematic configuration of a time-series signal decoding device that decodes a bit stream generated by the time-series signal encoding device according to the third embodiment.
FIG. 10 is a diagram schematically showing a flow of processing related to signals and codes in the time-series signal encoding device according to the third embodiment.
FIG. 11 is a block diagram showing a schematic configuration of a time-series signal encoding device according to a fourth embodiment of the present invention.
FIG. 12 is a block diagram showing a schematic configuration of a time-series signal decoding device that decodes a bit stream generated by the time-series signal encoding device according to the fourth embodiment.
FIG. 13 is a diagram schematically showing a flow of processing related to signals and codes in the time-series signal encoding device according to the fourth embodiment.
FIG. 14 is a block diagram showing a schematic configuration of a time-series signal encoding device according to a fifth embodiment of the present invention.
FIG. 15 is a block diagram showing a schematic configuration of a time-series signal decoding device that decodes a bit stream generated by the time-series signal encoding device according to the fifth embodiment.
FIG. 16 is a diagram schematically showing a flow of processing related to signals and codes in the time-series signal encoding device according to the fifth embodiment.
FIG. 17 is a block diagram illustrating a schematic configuration of a time-series signal encoding device according to a sixth embodiment of the present invention.
FIG. 18 is a block diagram illustrating a schematic configuration of a time-series signal decoding device that decodes a bit stream generated by the time-series signal encoding device according to the sixth embodiment.
FIG. 19 is a diagram schematically showing the flow of processing related to signals and codes in the time-series signal encoding device according to the sixth embodiment.
FIG. 20 is a diagram showing a structural example of a header in a special frame.
FIG. 21 is a diagram showing a pointer state using a header in a special frame.
FIG. 22 is a diagram schematically showing a structure of a bit stream generated by a conventionally known time-series signal encoding device.
[Explanation of symbols]
X: bit stream (this embodiment)
Y: Header in special frame
Z: bit stream (conventional configuration)
A: Time-series signal encoding device
B: time-series signal decoding device
C: time-series signal encoding device
D: time-series signal decoding device
E: time-series signal encoding device
F: time-series signal decoding device
G: time-series signal encoding device
H: time-series signal decoding device
I: time-series signal encoding device
J: time-series signal decoding device
101 ... buffer
102 LPC predictor
103 ... Encoder
104: Bit stream generator
106 ... Counter
107 ... Controller
108 ... Subtractor
109 ... Subtractor
110 ... Pitch predictor
201 ... buffer
202 LPC predictor
203 ... Decoder
204: bit stream generator
206 ... Controller
207 ... Pitch predictor

Claims (12)

入力される時系列信号を所定長さのフレームごとに区分するフレーム区分手段と,所定の予測方式に基づいて過去の前記時系列信号から現在の前記時系列信号を予測する予測手段と,前記フレームごとに前記予測手段による予測信号と前記時系列信号との間の残差信号を算出する残差信号算出手段と,前記残差信号を可逆符号化して残差信号情報を生成する符号化手段と,前記残差信号情報に基づいて所定のビットストリームを生成するビットストリーム生成手段と,を具備してなる時系列信号符号化装置において,
所定の選択ルールに基づいて前記フレームの一部を特殊フレームとして選択する特殊フレーム選択手段と,
前記ビットストリームにおける前記特殊フレームについての情報ごとに,前記特殊フレームに関する旨の識別情報と当該特殊フレーム以外の前記フレームについての前記残差信号を使用せずに前記時系列信号の再生を可能とするための所定の補充情報とが含まれるよう前記ビットストリーム生成手段と前記予測手段及び/又は前記符号化手段とを制御するビットストリーム生成制御手段と,
を具備してなることを特徴とする時系列信号符号化装置。
Frame division means for dividing the input time-series signal into frames of a predetermined length, prediction means for predicting the current time-series signal from the past time-series signal based on a predetermined prediction method, A residual signal calculating means for calculating a residual signal between a prediction signal from the prediction means and the time-series signal, and an encoding means for generating the residual signal information by lossless encoding the residual signal. , A bit stream generating means for generating a predetermined bit stream based on the residual signal information,
A special frame selecting means for selecting a part of the frame as a special frame based on a predetermined selection rule;
For each piece of information about the special frame in the bit stream, it is possible to reproduce the time-series signal without using identification information indicating the special frame and the residual signal of the frame other than the special frame. Bit stream generation control means for controlling the bit stream generation means and the prediction means and / or the encoding means so as to include predetermined supplementary information for
A time-series signal encoding device, comprising:
前記補充情報が,前記特殊フレームにおける前記時系列信号の先頭の一部について前記予測信号を所定の設定信号に置き換えて得られた前記残差信号が前記符号化手段により符号化された前記残差信号情報である請求項1に記載の時系列信号符号化装置。The supplementary information is obtained by replacing the residual signal obtained by replacing the prediction signal with a predetermined setting signal for a part of the head of the time-series signal in the special frame. The time-series signal encoding device according to claim 1, which is signal information. 前記補充情報が,前記特殊フレームにおける前記時系列信号の先頭の一部であり,
前記ビットストリーム生成制御手段により,前記補充情報に対応する前記残差信号情報を前記ビットストリームに含めない制御を行うものである請求項1に記載の時系列信号符号化装置。
The supplementary information is a part of the head of the time-series signal in the special frame,
2. The time-series signal encoding device according to claim 1, wherein the bit stream generation control unit performs control not to include the residual signal information corresponding to the supplementary information in the bit stream. 3.
前記補充情報が,前記特殊フレームの1つ前の前記フレームにおける前記時系列信号の後尾の一部又は該一部が前記符号化手段により符号化された前記残差信号情報である請求項1に記載の時系列信号符号化装置。2. The supplementary information according to claim 1, wherein a part of or a part of a tail of the time-series signal in the frame immediately before the special frame is the residual signal information encoded by the encoding unit. 3. 2. The time-series signal encoding device according to claim 1. 前記特殊フレーム選択手段における前記所定の選択ルールが,前記時系列信号における一定時間間隔の前記フレームを前記特殊フレームとするものである請求項1〜4のいずれかに記載の時系列信号符号化装置。5. The time-series signal encoding device according to claim 1, wherein the predetermined selection rule in the special frame selection unit is such that the frame at a fixed time interval in the time-series signal is set as the special frame. 6. . 前記予測手段における前記所定の予測方式が,線形予測である請求項1〜5のいずれかに記載の時系列信号符号化装置。The time-series signal encoding device according to any one of claims 1 to 5, wherein the predetermined prediction method in the prediction means is linear prediction. 前記予測手段における前記所定の予測方式が,ピッチ予測である請求項1〜5のいずれかに記載の時系列信号符号化装置。The time-series signal encoding device according to any one of claims 1 to 5, wherein the predetermined prediction method in the prediction means is pitch prediction. 前記ビットストリームにおける前記特殊フレームについての情報ごとに,他の前記特殊フレームについての情報の位置を特定する位置情報を含めてなる請求項1〜7のいずれかに記載の時系列信号符号化装置。The time-series signal encoding apparatus according to any one of claims 1 to 7, wherein each piece of information about the special frame in the bit stream includes position information for specifying a position of information about another special frame. 前記位置情報が,直前の前記特殊フレームについての情報及び/又は直後の前記特殊フレームについての情報の位置を特定するものである請求項8に記載の時系列信号符号化装置。9. The time-series signal encoding device according to claim 8, wherein the position information specifies a position of information about the immediately preceding special frame and / or information about the immediately following special frame. 所定のフレーム単位の残差信号が符号化された残差信号情報を複数含むビットストリームを入力するビットストリーム入力手段と,前記ビットストリームに含まれる前記残差信号情報を復号化する復号化手段と,当該時系列信号復号化装置により過去に出力された時系列信号に基づいて次に出力する時系列信号を予測する予測手段と,該予測手段による予測信号と前記復号化手段により復号化された前記残差信号とに基づいて前記時系列信号を出力する時系列信号出力手段とを具備してなる時系列信号復号化装置において,
前記ビットストリームから,前記残差信号情報それぞれについて該残差信号情報が所定の特殊フレームに関するものである旨を表す識別情報を検出する識別情報検出手段と,
前記識別情報検出手段により前記識別情報が検出された場合には,該識別情報に対応して前記ビットストリームに含まれる所定の補充情報と前記残差信号情報が前記復号化手段により復号化された前記残差信号とに基づいて前記時系列信号が出力されるよう前記予測手段及び/又は前記時系列信号出力手段を制御する時系列信号出力制御手段と,
を具備してなることを特徴とする時系列信号復号化装置。
Bit stream input means for inputting a bit stream including a plurality of residual signal information obtained by encoding a residual signal of a predetermined frame unit; and decoding means for decoding the residual signal information included in the bit stream. Prediction means for predicting the next time-series signal to be output based on the time-series signal output in the past by the time-series signal decoding apparatus; A time-series signal decoding device comprising: a time-series signal output unit that outputs the time-series signal based on the residual signal.
Identification information detecting means for detecting, from the bit stream, identification information indicating that the residual signal information is related to a predetermined special frame for each of the residual signal information;
When the identification information is detected by the identification information detecting means, the predetermined supplementary information and the residual signal information included in the bit stream corresponding to the identification information are decoded by the decoding means. A time-series signal output control unit that controls the prediction unit and / or the time-series signal output unit so that the time-series signal is output based on the residual signal;
A time-series signal decoding device, comprising:
入力される時系列信号を所定長さのフレームごとに区分するフレーム区分工程と,所定の予測方式に基づいて過去の前記時系列信号から現在の前記時系列信号を予測する予測工程と,前記フレームごとに前記予測工程による予測信号と前記時系列信号との間の残差信号を算出する残差信号算出工程と,前記残差信号を可逆符号化して残差信号情報を生成する符号化工程と,前記残差信号情報に基づいて所定のビットストリームを生成するビットストリーム生成工程と,を有してなる時系列信号符号化方法において,
所定の選択ルールに基づいて前記フレームの一部を特殊フレームとして選択する特殊フレーム選択工程と,
前記ビットストリームにおける前記特殊フレームについての情報ごとに,前記特殊フレームに関する旨の識別情報と当該特殊フレーム以外の前記フレームについての前記残差信号を使用せずに前記時系列信号の再生を可能とするための所定の補充情報とが含まれるよう前記ビットストリーム生成工程と前記予測工程及び/又は前記符号化工程とを制御するビットストリーム生成制御工程と,
を有してなることを特徴とする時系列信号符号化方法。
A frame dividing step of dividing an input time-series signal into frames of a predetermined length, a prediction step of predicting the current time-series signal from the past time-series signal based on a predetermined prediction method, A residual signal calculating step of calculating a residual signal between a prediction signal obtained by the prediction step and the time-series signal, and an encoding step of losslessly encoding the residual signal to generate residual signal information. A bit stream generating step of generating a predetermined bit stream based on the residual signal information.
A special frame selecting step of selecting a part of the frame as a special frame based on a predetermined selection rule;
For each piece of information about the special frame in the bit stream, it is possible to reproduce the time-series signal without using identification information indicating the special frame and the residual signal of the frame other than the special frame. A bitstream generation control step of controlling the bitstream generation step and the prediction step and / or the encoding step so that predetermined supplementary information for the bitstream is included;
A time-series signal encoding method comprising:
所定のフレーム単位の残差信号が符号化された残差信号情報を複数含むビットストリームを入力するビットストリーム入力工程と,前記ビットストリームに含まれる前記残差信号情報を復号化する復号化工程と,当該時系列信号復号化方法により過去に出力された時系列信号に基づいて次に出力する時系列信号を予測する予測工程と,該予測工程による予測信号と前記復号化工程により復号化された前記残差信号とに基づいて前記時系列信号を出力する時系列信号出力工程とを有してなる時系列信号復号化方法において,
前記ビットストリームから,前記残差信号情報それぞれについて該残差信号情報が所定の特殊フレームに関するものである旨を表す識別情報を検出する識別情報検出工程と,
前記識別情報検出工程により前記識別情報が検出された場合には,該識別情報に対応して前記ビットストリームに含まれる所定の補充情報と前記残差信号情報が前記復号化工程により復号化された前記残差信号とに基づいて前記時系列信号が出力されるよう前記予測工程及び/又は前記時系列信号出力工程を制御する時系列信号出力制御工程と,
を有してなることを特徴とする時系列信号復号化方法。
A bit stream inputting step of inputting a bit stream including a plurality of residual signal information obtained by encoding a residual signal of a predetermined frame unit; and a decoding step of decoding the residual signal information included in the bit stream. A prediction step of predicting a next time-series signal to be output next based on a time-series signal output in the past by the time-series signal decoding method, a prediction signal of the prediction step, and a prediction signal decoded by the decoding step. A time-series signal output step of outputting the time-series signal based on the residual signal and a time-series signal decoding method,
An identification information detecting step for detecting, from the bit stream, identification information indicating that the residual signal information relates to a predetermined special frame for each of the residual signal information;
When the identification information is detected by the identification information detecting step, the predetermined supplementary information and the residual signal information included in the bit stream corresponding to the identification information are decoded by the decoding step. A time-series signal output control step of controlling the prediction step and / or the time-series signal output step so that the time-series signal is output based on the residual signal;
A time-series signal decoding method comprising:
JP2003061244A 2003-03-07 2003-03-07 Time-series signal encoding device and its method, and time-series signal decoding device and and its method Pending JP2004271812A (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2003061244A JP2004271812A (en) 2003-03-07 2003-03-07 Time-series signal encoding device and its method, and time-series signal decoding device and and its method

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2003061244A JP2004271812A (en) 2003-03-07 2003-03-07 Time-series signal encoding device and its method, and time-series signal decoding device and and its method

Publications (1)

Publication Number Publication Date
JP2004271812A true JP2004271812A (en) 2004-09-30

Family

ID=33123516

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2003061244A Pending JP2004271812A (en) 2003-03-07 2003-03-07 Time-series signal encoding device and its method, and time-series signal decoding device and and its method

Country Status (1)

Country Link
JP (1) JP2004271812A (en)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2009500659A (en) * 2005-06-30 2009-01-08 エルジー エレクトロニクス インコーポレイティド Audio signal encoding and decoding method and apparatus

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2009500659A (en) * 2005-06-30 2009-01-08 エルジー エレクトロニクス インコーポレイティド Audio signal encoding and decoding method and apparatus
US8214221B2 (en) 2005-06-30 2012-07-03 Lg Electronics Inc. Method and apparatus for decoding an audio signal and identifying information included in the audio signal

Similar Documents

Publication Publication Date Title
KR101826375B1 (en) Method and apparatus for searching in a layered hierarchical bit stream followed by replay, said bit stream including a base layer and at least one enhancement layer
JP4831117B2 (en) Speech encoding method and speech decoding method
JP2004271812A (en) Time-series signal encoding device and its method, and time-series signal decoding device and and its method
JP4244222B2 (en) Speech encoding method and speech decoding method
JP4151033B2 (en) Speech encoding method and speech decoding method
JP4151031B2 (en) Speech encoding method and speech decoding method
JP4148259B2 (en) Speech encoding method and speech decoding method
JP4151032B2 (en) Speech encoding method and speech decoding method
JP4196356B2 (en) Speech encoding method and speech decoding method
JP4151028B2 (en) Speech encoding method and speech decoding method
JP4151034B2 (en) Speech encoding method and speech decoding method
JP4151036B2 (en) Speech encoding method and speech decoding method
JP2006171776A (en) Voice coding method and decoding method
JPH02246625A (en) Predictive coding method for voice signal
JP2005208669A (en) Voice encoding method and voice decoding method
JP2005208668A (en) Voice encoding method and voice decoding method
JP2005208670A (en) Voice encoding method and voice decoding method
JP2005208673A (en) Voice encoding method and voice decoding method
JP2005208667A (en) Voice encoding method and voice decoding method
JP2005208672A (en) Voice encoding method and voice decoding method
JP2005208671A (en) Voice encoding method and voice decoding method
JP2005141275A (en) Speech coding method and speech decoding method
JP2005141274A (en) Speech coding method and speech decoding method
JP2006053553A (en) Voice coding method and voice decoding method
JP2006011471A (en) Voice encoding method and voice decoding method