JP3618217B2 - 音声のピッチ符号化方法及び音声のピッチ符号化装置並びに音声のピッチ符号化プログラムが記録された記録媒体 - Google Patents

音声のピッチ符号化方法及び音声のピッチ符号化装置並びに音声のピッチ符号化プログラムが記録された記録媒体 Download PDF

Info

Publication number
JP3618217B2
JP3618217B2 JP04593398A JP4593398A JP3618217B2 JP 3618217 B2 JP3618217 B2 JP 3618217B2 JP 04593398 A JP04593398 A JP 04593398A JP 4593398 A JP4593398 A JP 4593398A JP 3618217 B2 JP3618217 B2 JP 3618217B2
Authority
JP
Japan
Prior art keywords
subframe
pitch
encoding
determined
subframes
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
JP04593398A
Other languages
English (en)
Other versions
JPH11242498A (ja
Inventor
健喜 井原
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Pioneer Corp
Original Assignee
Pioneer Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Pioneer Corp filed Critical Pioneer Corp
Priority to JP04593398A priority Critical patent/JP3618217B2/ja
Priority to US09/257,382 priority patent/US6219636B1/en
Publication of JPH11242498A publication Critical patent/JPH11242498A/ja
Application granted granted Critical
Publication of JP3618217B2 publication Critical patent/JP3618217B2/ja
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L25/00Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
    • G10L25/90Pitch determination of speech signals
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L25/00Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
    • G10L25/93Discriminating between voiced and unvoiced parts of speech signals
    • G10L2025/932Decision in previous or following frames

Landscapes

  • Engineering & Computer Science (AREA)
  • Computational Linguistics (AREA)
  • Signal Processing (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Physics & Mathematics (AREA)
  • Acoustics & Sound (AREA)
  • Multimedia (AREA)
  • Compression, Expansion, Code Conversion, And Decoders (AREA)

Description

【0001】
【発明の属する技術分野】
本発明は、音声符号化の技術分野に属し、より詳しくは、音声のピッチ情報の符号化方法、ピッチ符号化装置、及びピッチ符号化プログラムが記録された記録媒体の技術分野に属する。
【0002】
【従来の技術】
従来、音声信号を高能率に符号化するため、人間の声帯振動の周期性に起因する音声信号の長期相関に基づくピッチを抽出し符号化することが一般的に行われている。即ち、音声信号においては、このピッチで定まる周期ごとに同様の波形が繰り返されるため、ピッチを符号化する際、近接相関に基づく短期予測と組み合わせれば、高能率に音声信号を符号化することが可能となる。また、代表的な音声符号化方式であるCELP(Code Excited Linear Prediction)においては、適応コードブックの内容を過去の合成フィルタの駆動源とし、いったん再生して入力信号との聴感重み付け誤差電力を最小化するように、ピッチを決定する構成をとるので、ピッチ抽出が不可欠な要素となっている。
【0003】
ところで、一般にCELPなどの音声符号化方式においては、入力音声をフレームを単位に区切りフレームごとに符号化を行うとともに、フレームをさらに複数のサブフレーム単位に分割し、ベクトル量子化等の処理の基本単位としている。そして、上述したピッチ抽出は、各サブフレームに対してそれぞれ1つのピッチを算出した上で、この算出ピッチを1又は複数のフレームの範囲内で符号化処理することにより行われる。ここで、算出ピッチの符号化に際しては、1フレーム内の各サブフレームに対し、算出ピッチの値そのものを符号化することによっても可能であるが、符号化データ量削減のために1フレーム内の先頭のサブフレームに対しては、算出ピッチの値そのものを符号化し、後続の各サブフレームに対しては、算出ピッチと前のサブフレームとの差分を符号化することが有効である。
【0004】
【発明が解決しようとする課題】
しかしながら、音声信号は時間軸において、声帯の振動を伴う入力音声が存在する有声音、声帯の振動を伴わない入力音声のみ存在する無声音、入力音声が存在しない無音とに区別できる。音声のピッチは、有声音の部分に対して意味を持つので、これらのいずれかの状態にあるかを判断した上で、処理の最小単位であるサブフレームが、有声音ではない無声音又は無音と判定された場合には、ピッチ符号化を行わないようにすることが一般的である。そのため、1フレーム内の先頭部分のサブフレームが有声音と判定されない場合は、その後のサブフレームで求めるべき差分の基準とすべき値が定まらないので、1フレーム全体についてピッチ符号化を行わないこととせざるを得ない。この場合、CELP等における適応コードブックからは再生信号が出力されないこととなる。
【0005】
従って、従来の音声符号化方式において、符号化データ量を削減しつつ、きめが細かく入力音声に忠実なピッチ符号化を実現することは困難である。特に、1フレームが長くなる場合や、1フレーム中のサブフレーム数が多い場合などは、1フレーム内に有声音と判定されないサブフレームが含まれる可能性が増大するので、音声符号化の品質劣化を招くおそれがある。
【0006】
そこで、本発明は、上記の問題点に鑑みなされたものであり、その課題は、符号化データ量を増大させることなく、1フレーム内に有声音と判定されないサブフレームが含まれている場合でも、入力音声のピッチを忠実に符号化することができる符号化方法、符号化装置、及び符号化プログラムが記録された記録媒体を提供することにある。
【0007】
【課題を解決するための手段】
前記課題を達成するため、請求項1に記載のピッチ符号化方法は、フレーム単位に区切られた入力音声に対し、フレームをさらに複数に分割したサブフレーム単位のピッチを算出し符号化するピッチ符号化方法であって、一又は複数のフレームに含まれる複数のサブフレームのピッチを各サブフレームごとに算出する算出工程と、前記複数のサブフレームに含まれる入力音声が声帯の振動を伴う有声音であるか否かを各サブフレームごとに判定する判定工程と、前記複数のサブフレーム中、当該先頭サブフレームが有声音でないと判定され、かつ前記複数のサブフレーム中、当該先頭サブフレームに後続する他のサブフレームである後続サブフレームに有声音と判定されたサブフレームが存在する場合は、前記先頭サブフレームに、予め定められた複数のピッチの基準値の中から一の基準値を選択して符号化する第1符号化工程と、前記選択した基準値と有声音と判定された前記後続サブフレームの前記算出したピッチとの差分を算出して符号化する第2符号化工程と、を備え、前記第1符号化工程において選択される基準値は、前記有声音と判定された後続サブフレームのピッチとの差分が最も小さい基準値であることを特徴とする。
【0008】
請求項1に記載のピッチ符号化方法によれば、算出工程において、一又は複数のフレームに含まれるサブフレームを単位に入力音声のピッチが各サブフレームごとに算出されるとともに、判定工程において、この入力音声が有声音であるか否かがサブフレームごとに判定される。
【0009】
そして、第1符号化工程においては先頭サブフレームに対する符号化が行われる。即ち、有声音と判定された先頭サブフレームの算出ピッチを符号化する一方、有声音でないと判定された先頭サブフレームであって、有声音と判定される後続サブフレームが存在する場合には、複数のピッチの基準値から1つを選択することにより符号化が行われる。
【0010】
また、第2符号化工程においては、後続サブフレームに対する符号化が行われる。即ち、有声音と判定された後続サブフレームについて、先行するサブフレームに有声音と判定されるものが存在する場合には、後続サブフレームと当該先行するサブフレームとの算出ピッチどうしの差分を算出して符号化する一方、先行するサブフレームに有声音と判定されるものが存在しない場合には、後続サブフレームの算出ピッチと選択した基準値との差分を算出して符号化を行う。
【0011】
よって、ピッチ符号化の処理を行うべき複数のサブフレーム内で、有声音であるか否かの判定結果が1フレーム内で変動するような場合であっても、差分を利用してピッチを忠実に符号化することができ、品質を確保しつつ、データ量が増大しないピッチ情報の符号化が可能となる。
【0012】
請求項2に記載のピッチ符号化方法は、請求項1に記載のピッチ符号化方法において、前記有声音でないと判定された先頭フレームに後続するサブフレームが、有声音でないと判定された場合には、当該後続するサブフレームの差分を0として符号化する第3符号化工程と、を有することを特徴とする。
【0015】
請求項3に記載のピッチ符号化装置は、フレーム単位に区切られた入力音声に対し、フレームをさらに複数に分割したサブフレーム単位のピッチを算出し符号化するピッチ符号化装置であって、一又は複数のフレームに含まれる複数のサブフレームのピッチを各サブフレームごとに算出する算出手段と、前記複数のサブフレームに含まれる入力音声が声帯の振動を伴う有声音であるか否かを各サブフレームごとに判定する判定手段と、前記複数のサブフレーム中、当該先頭サブフレームが有声音でないと判定され、かつ前記複数のサブフレーム中、当該先頭サブフレームに後続する他のサブフレームである後続サブフレームに有声音と判定されたサブフレームが存在する場合は、前記先頭サブフレームに、予め定められた複数のピッチの基準値の中から一の基準値を選択して符号化する第1符号化手段と、前記選択した基準値と有声音と判定された前記後続サブフレームの前記算出したピッチとの差分を算出して符号化する第2符号化手段と、を備え、前記第1符号化工程において選択される基準値は、前記有声音と判定された後続サブフレームのピッチとの差分が最も小さい基準値であることを特徴とする
【0016】
請求項3に記載のピッチ符号化装置によれば、算出手段により、一又は複数のフレームに含まれるサブフレームを単位に入力音声のピッチが各サブフレームごとに算出されるとともに、判定手段により、この入力音声が有声音であるか否かがサブフレームごとに判定される。
【0017】
そして、第1符号化手段により、先頭サブフレームに対する符号化が行われる。即ち、有声音と判定された先頭サブフレームの算出ピッチを符号化する一方、有声音でないと判定された先頭サブフレームであって、有声音と判定される後続サブフレームが存在する場合には、複数のピッチの基準値から1つを選択することにより符号化が行われる。
【0018】
また、第2符号化手段により、後続サブフレームに対する符号化が行われる。即ち、有声音と判定された後続サブフレームについて、先行するサブフレームに有声音と判定されるものが存在する場合には、後続サブフレームと当該先行するサブフレームとの算出ピッチどうしの差分を算出して符号化する一方、先行するサブフレームに有声音と判定されるものが存在しない場合には、後続サブフレームの算出ピッチと選択した基準値との差分を算出して符号化を行う。
【0019】
よって、ピッチ符号化の処理を行うべき複数のサブフレーム内で、有声音であるか否かの判定結果が1フレーム内で変動するような場合であっても、差分を利用してピッチを忠実に符号化することができ、品質を確保しつつ、データ量が増大しないピッチ情報の符号化が可能となる。
【0020】
請求項4に記載のピッチ符号化装置は、請求項3に記載のピッチ符号化装置において、前記有声音でないと判定された先頭フレームに後続するサブフレームが、有声音でないと判定された場合には、当該後続するサブフレームの差分を0として符号化する第3符号化手段と、を有することを特徴とする。
【0023】
請求項5に記載のピッチ符号化方法を実行させるためのプログラムを記録した記録媒体は、コンピュータに、フレーム単位に区切られた入力音声に対し、フレームをさらに複数に分割したサブフレーム単位のピッチを算出し符号化するピッチ符号化方法を実行させるためのプログラムを記録した記録媒体であって、
一又は複数のフレームに含まれる複数のサブフレームのピッチを各サブフレームごとに算出する算出工程と、前記複数のサブフレームに含まれる入力音声が声帯の振動を伴う有声音であるか否かを各サブフレームごとに判定する判定工程と、前記複数のサブフレーム中、当該先頭サブフレームが有声音でないと判定され、かつ前記複数のサブフレーム中、当該先頭サブフレームに後続する他のサブフレームである後続サブフレームに有声音と判定されたサブフレームが存在する場合は、前記先頭サブフレームに、予め定められた複数のピッチの基準値の中から一の基準値を選択して符号化する第1符号化工程と、前記選択した基準値と有声音と判定された前記後続サブフレームの前記算出したピッチとの差分を算出して符号化する第2符号化工程と、を備え、前記第1符号化工程において選択される基準値は、前記有声音と判定された後続サブフレームのピッチとの差分が最も小さい基準値であることを特徴とする
【0024】
請求項5に記載のピッチ符号化方法を実行させるためのプログラムを記録した読み取り実行するコンピュータによれば、算出工程において、一又は複数のフレームに含まれるサブフレームを単位に入力音声のピッチが各サブフレームごとに算出されるとともに、判定工程において、この入力音声が有声音であるか否かがサブフレームごとに判定される。
【0025】
そして、第1符号化工程においては先頭サブフレームに対する符号化が行われる。即ち、有声音と判定された先頭サブフレームの算出ピッチを符号化する一方、有声音でないと判定された先頭サブフレームであって、有声音と判定される後続サブフレームが存在する場合には、複数のピッチの基準値から1つを選択することにより符号化が行われる。
【0026】
また、第2符号化工程においては、後続サブフレームに対する符号化が行われる。即ち、有声音と判定された後続サブフレームについて、先行するサブフレームに有声音と判定されるものが存在する場合には、後続サブフレームと当該先行するサブフレームとの算出ピッチどうしの差分を算出して符号化する一方、先行するサブフレームに有声音と判定されるものが存在しない場合には、後続サブフレームの算出ピッチと選択した基準値との差分を算出して符号化を行う。
【0027】
よって、ピッチ符号化の処理を行うべき複数のサブフレーム内で、有声音であるか否かの判定結果が1フレーム内で変動するような場合であっても、差分を利用してピッチを忠実に符号化することができ、品質を確保しつつ、データ量が増大しないピッチ情報の符号化が可能となる。
【0028】
請求項6に記載のピッチ符号化方法を実行させるためのプログラムを記録した記録媒体は、請求項5に記載のピッチ符号化方法を実行させるためのプログラムを記録した記録媒体において、前記有声音でないと判定された先頭フレームに後続するサブフレームが、有声音でないと判定された場合には、当該後続するサブフレームの差分を0として符号化する第3符号化工程とを更に備えることを特徴とする。
【0031】
【発明の実施の形態】
以下、本発明の好適な実施形態について、図面に基づいて説明する。
【0032】
図1は、本発明に係るピッチ符号化方法をCELP符号化方式に適用する場合の全体構成を示すブロック図である。
【0033】
図1に示すCELP符号化方式は、ピッチ分析部1と、ピッチパス決定部2と、符号化部3と、線形予測分析部4と、適応コードブック5と、雑音コードブック6と、利得コードブック7と、聴覚重み付けフィルタ8と、合成フィルタ9とから構成されている。
【0034】
図1の構成において、入力音声はフレーム単位に区切られ、さらにフレームを複数のサブフレームに分割し、サブフレームごと、又は、フレームごとに各種パラメータを抽出し符号化がなされる。まず、入力音声は、サブフレームごとに線形予測分析部4に入力され、サンプル値間の近接相関を利用して予測値を求める処理が行われる。
【0035】
CELP符号化方式における線形予測残差の符号化は、3種のコードブックを使ったベクトル量子化を用いて行われ、最適な量子化ベクトル(各コードブックのインデクス)をサブフレームごとに決定し、その際の各コードブックのインデクスを伝送すべき符号化データとする。適応コードブック5は、合成フィルタ9へ入力する過去の駆動源を用いていったん信号を再生し、入力信号との聴感重み付け誤差電力を最小化するようにピッチ予測を行う。雑音コードブック6は、ガウス性の確率密度をもつ雑音信号を音源として、ピッチ予測残差信号を近似するものである。利得コードブック7は、適応コードブック5及び雑音コードブック6において最適なインデクスを決定した上で、その条件において最適な利得を与えるように別途決定するものである。
【0036】
また、入力音声は、サブフレームごとにピッチ分析部1にも入力され、ピッチパス決定部2を経て、オープンループ探索法によりピッチパス情報を得た後、符号化部3において前述の適応コードブックのインデクスを決定し、クローズドループ探索法により音声信号の長期相関に基づくピッチの符号化処理が行われる。これらピッチ符号化処理の詳細については後述する。
【0037】
合成フィルタ9は、線形予測分析部7における予測結果に基づき、フィルタの係数を決定した上で、各コードブックの求めたインデクスによる信号を入力し、再生音声として出力を行う。そして、合成フィルタ9から出力される再生信号は、入力音声との誤差電力を求めた上で、聴覚のマスキング現象を利用して量子化雑音を低減するための聴覚重み付けフィルタ8を通した後、符号化部3において当該誤差電力を最小化するように符号化が行われる。
【0038】
次に、図2に、クローズドループ探索法によるピッチ符号化処理のフローチャートを示す。図2に示すピッチ符号化処理においては、ピッチ分析部1とピッチパス決定部2で行われるオープンループ探索法により得られたピッチパス情報を入力した後、クローズドループ探索法に基づき各サブフレームのピッチが決定される。
【0039】
ここで、オープンループ探索法によるピッチパス情報の生成の概略を説明する。なお、本実施形態では、1フレームが4サブフレームから構成され、各処理は1フレームの範囲内で行われる場合を考える。
【0040】
まず、1フレーム内の各サブフレームに対するピッチ候補をM個求める。より具体的には、各サブフレームに線形予測分析( Linear Predictive Coding:LPC)を行い、その予測残差にハミング窓を乗じた後、対応するサンプリング数あるいはその補間を考慮した上でピッチとしてとり得る所定の範囲内において、自己相関関数が大きくなる順にM個のピッチ候補を決定する。
【0041】
そして、各サブフレーム中、自己相関関数が最大となるサブフレームをピッチパスの起点とし、M個のピッチ候補について、それぞれ符号化する際の差分で表せる範囲内の遅延を入力音声に与えた場合に、自己相関を最大化するピッチを決定する。このピッチの決定を順方向及び逆方向の各サブフレームについて繰り返す。
【0042】
その結果、先頭のサブフレームから最後のサブフレームに至るまでの上述の方法で決定された4つのピッチの列、即ちピッチパスがM通り生成される。このM個のピッチパスから、例えば4つのサブフレームに対する歪みの和を最小化するものなど、1フレーム全体として最適なピッチパスを1つ選び、符号化部3に入力すべきピッチ情報とする。
【0043】
上述のように得られたピッチパス情報は、クローズドループ探索法に基づくピッチ符号化を行うために、1フレーム分が取り込まれる(ステップS1)。そして、各サブフレームごとに順次ピッチが決定される(ステップS2)。具体的には、前記ピッチパス情報の各サブフレームについてのピッチの値を中心に、複数のピッチ候補を選定した上で、その中から、自己相関が最大となるものを選択する。この際、いったん前記複数のピッチ候補から簡易な計算により数個のピッチ候補を予備選択し、その後、その中から1個のピッチを本選択する構成としてもよい。
【0044】
次いで、後述する処理に従い、ピッチ情報の符号化が行われる(ステップS3)。
【0045】
なお、ピッチ符号化処理は、入力音声が有声音か否かを各サブフレームごとに判定する判定結果に基づいて行なわれる。具体的には、入力音声のピッチは、声帯振動の基本周期であるから、音声が声帯振動を伴わない無声音であるような場合には、本来ピッチは抽出できない。そのため、有声音でないと判定されたサブフレームについては、ピッチの符号化は行わないこととする。
【0046】
最後に、処理すべき入力信号の有無を判断し(ステップS4)、新たな入力信号がなく、全ての入力信号に対する処理を終了した場合(ステップS4;YES)、符号化処理を終了し、まだ処理すべき入力信号がある場合(ステップS4;NO)、再びステップS1に戻る。
【0047】
次に、図3に、図2のステップS3に対応する前述したピッチ情報の符号化処理の詳細についてのフローチャートを示す。
【0048】
まず、ピッチ分析に際し、前記有声音か否かの判定処理を行った上で、1フレーム内で、全てのサブフレームの判定結果に応じて処理を分岐する(ステップS10)。1フレーム内で全てのサブフレームが有声音ではなく無声音と判定された場合(ステップS10;YES)、全てのサブフレームについて、無声音として定めたパターンにより符号化を行い(ステップS11)、処理を終える。
【0049】
一方、有声音と判定されるサブフレームが存在する場合(ステップS10;NO)、サブフレームの処理用カウンタcntをゼロクリアする(ステップS12)。このカウンタcntは、1フレーム内で最初に有声音と判定されるサブフレームに達したか否かを判別するためのものであり、この値をsとして予め設定した上で、cntとsの比較を行う(ステップS13)。
【0050】
そして、cntがsに達していない場合は(ステップS13;NO)、そのサブフレームに対するピッチを符号化せず、ピッチ情報の符号化をいったん保留する(ステップS14)。その後、カウンタcntをインクリメントした後(ステップS15)、次のサブフレームに対する処理に移る(ステップS13)。
【0051】
一方、cntがsに達すると(ステップS13;YES)、先頭のサブフレームに対しては、予め定められた複数のピッチの基準値の中から、s番目のサブフレームのピッチに最も近い基準値(適応コードブック5の出力はなしであるが、ピッチ情報を有する基準値)を1つを選び、ピッチ情報として符号化する(ステップS16)。
【0052】
ここで、このピッチの基準値について説明する。通常、1フレーム内の複数のサブフレームのピッチ情報を符号化するに際しては、図2のステップS2で決定済みのピッチの値そのものに基づき符号化する方法も考えられるが、1フレーム内のサブフレーム数が多い場合などは、ピッチ情報として割り当てるデータ量が大幅に増大するため、高能率の音声符号化を行うには適さない。よって、先頭のサブフレームをピッチの値に基づき符号化する一方、後続のサブフレームは1つ先行するサブフレームのピッチとの差分を求め、符号化することがデータ量削減に有効である。
【0053】
しかし、処理すべきサブフレームが常にピッチ抽出可能な有声音であれば問題ないが、無声音となるサブフレームについては、ピッチを符号化せず、無声音であることを示すパターンをピッチ情報とする。よって、最初の有声音となるs番目のサブフレームについては、s−1番目のサブフレームのピッチを抽出できないので、前述の差分を求めることはできない。
【0054】
従って、先頭のサブフレームが無声音なら“基準値”を持たせ、2番目〜s−1番目のサブフレームを“差分0で出力なし”として符号化を行う(ステップS17)。
【0055】
その後、次のサブフレームに処理を進めるため、カウンタcntをインクリメントし(ステップS18)、cntが4に達したか否かを判断する(ステップS19)。cnt=4であれば(ステップS19;YES)、1フレーム内の4つの各サブフレームについてのピッチ符号化が終了したので、処理を終える。
【0056】
一方、cnt=4でなければ(ステップS19;NO)、対象となるサブフレームが有声音である場合は、前述の差分を求め符号化し、無声音である場合は、“差分0で出力なし”として符号化する(ステップS20)。そして、cntが示す次のサブフレームに対する処理に移る(ステップS18)。
【0057】
以上の処理を行うことにより、有声音のサブフレームと無声音のサブフレームをともに含んでいる一又は複数のフレームに対しても、入力音声のピッチ情報を適切に符号化することができる。特に、先頭部分において無声音となるサブフレームが連続した後、s番目のサブフレームで初めて有声音と判定されるようなケースであっても、それ以降のサブフレームにおけるピッチの所定の基準値との差分を用いることで符号化が可能となる。
【0058】
なお、上述した本発明に係る音声のピッチ符号化方法は、コンピュータに読み取り可能なCD−ROM、フロッピーディスク等の記録媒体に記録させることが可能である。そして、当該CD−ROM等を用いてコンピュータにおいて音声のピッチ符号化プログラムをインストールし、実行することにより、本発明に係るピッチ符号化が実現される。
【0059】
【発明の効果】
以上説明したように、請求項1および請求項2に記載の発明によれば、複数のサブフレームに対するピッチを符号化するに際し、有声音であるか否かの判定結果に応じて、算出ピッチそのものに加え、所定の基準値を利用してピッチ又はピッチの差分値を符号化するようにしたので、有声音であるか否かの判定結果が1フレーム内で変動するような場合でも、適切な符号化を行うことができ、データ量を増大させることなく高品質なピッチ符号化の方法を実現することができる。
【0061】
請求項3および請求項4に記載の発明によれば、複数のサブフレームに対するピッチを符号化するに際し、有声音であるか否かの判定結果に応じて、算出ピッチそのものに加え、所定の基準値を利用してピッチ又はピッチの差分値を符号化するようにしたので、有声音であるか否かの判定結果が1フレーム内で変動するような場合でも、適切な符号化を行うことができ、データ量を増大させることなく高品質なピッチ符号化を行うピッチ符号化装置を提供することができる。
【0063】
請求項5および請求項6に記載の発明によれば、複数のサブフレームに対するピッチを符号化するに際し、有声音であるか否かの判定結果に応じて、算出ピッチそのものに加え、所定の基準値を利用してピッチ又はピッチの差分値を符号化するようにしたので、有声音であるか否かの判定結果が1フレーム内で変動するような場合でも、適切な符号化を行うことができ、データ量を増大させることなく高品質なピッチ符号化のためのソフトウェアを提供することができる。
【図面の簡単な説明】
【図1】本発明の実施形態におけるCELP符号化方式の全体構成を示すブロック図である。
【図2】本発明の実施形態におけるクローズドループ探索法によるピッチ符号化処理を示すフローチャートである。
【図3】本発明の実施形態におけるピッチ情報の符号化処理の詳細を示すフローチャートである。
【符号の説明】
1…ピッチ分析部
2…ピッチパス決定部
3…符号化部
4…線形予測分析部
5…適応コードブック
6…雑音コードブック
7…利得コードブック
8…重み付けフィルタ
9…合成フィルタ

Claims (6)

  1. フレーム単位に区切られた入力音声に対し、フレームをさらに複数に分割したサブフレーム単位のピッチを算出し符号化するピッチ符号化方法であって、
    一又は複数のフレームに含まれる複数のサブフレームのピッチを各サブフレームごとに算出する算出工程と、
    前記複数のサブフレームに含まれる入力音声が声帯の振動を伴う有声音であるか否かを各サブフレームごとに判定する判定工程と、
    前記複数のサブフレーム中、当該先頭サブフレームが有声音でないと判定され、かつ前記複数のサブフレーム中、当該先頭サブフレームに後続する他のサブフレームである後続サブフレームに有声音と判定されたサブフレームが存在する場合は、前記先頭サブフレームに、予め定められた複数のピッチの基準値の中から一の基準値を選択して符号化する第1符号化工程と、
    前記選択した基準値と有声音と判定された前記後続サブフレームの前記算出したピッチとの差分を算出して符号化する第2符号化工程と、
    を備え、
    前記第1符号化工程において選択される基準値は、前記有声音と判定された後続サブフレームのピッチとの差分が最も小さい基準値であることを特徴とするピッチ符号化方法。
  2. 請求項1に記載のピッチ符号化方法において、
    前記有声音でないと判定された先頭フレームに後続するサブフレームが、有声音でないと判定された場合には、当該後続するサブフレームの差分を0として符号化する第3符号化工程と、
    を有することを特徴とするピッチ符号化方法。
  3. フレーム単位に区切られた入力音声に対し、フレームをさらに複数に分割したサブフレーム単位のピッチを算出し符号化するピッチ符号化装置であって、
    一又は複数のフレームに含まれる複数のサブフレームのピッチを各サブフレームごとに算出する算出手段と、
    前記複数のサブフレームに含まれる入力音声が声帯の振動を伴う有声音であるか否かを各サブフレームごとに判定する判定手段と、
    前記複数のサブフレーム中、当該先頭サブフレームが有声音でないと判定され、かつ前記複数のサブフレーム中、当該先頭サブフレームに後続する他のサブフレームである後続サブフレームに有声音と判定されたサブフレームが存在する場合は、前記先頭サブフレームに、予め定められた複数のピッチの基準値の中から一の基準値を選択して符号化する第1符号化手段と、
    前記選択した基準値と有声音と判定された前記後続サブフレームの前記算出したピッチとの差分を算出して符号化する第2符号化手段と、
    を備え、
    前記第1符号化工程において選択される基準値は、前記有声音と判定された後続サブフレームのピッチとの差分が最も小さい基準値であることを特徴とするピッチ符号化手段。
  4. 請求項3に記載のピッチ符号化装置において、
    前記有声音でないと判定された先頭フレームに後続するサブフレームが、有声音でないと判定された場合には、当該後続するサブフレームの差分を0として符号化する第3符号化手段と、
    を有することを特徴とするピッチ符号化装置。
  5. コンピュータに、フレーム単位に区切られた入力音声に対し、フレームをさらに複数に分割したサブフレーム単位のピッチを算出し符号化するピッチ符号化方法を実行させるためのプログラムを記録した記録媒体であって、
    一又は複数のフレームに含まれる複数のサブフレームのピッチを各サブフレームごとに算出する算出工程と、
    前記複数のサブフレームに含まれる入力音声が声帯の振動を伴う有声音であるか否かを各サブフレームごとに判定する判定工程と、
    前記複数のサブフレーム中、当該先頭サブフレームが有声音でないと判定され、かつ前記複数のサブフレーム中、当該先頭サブフレームに後続する他のサブフレームである後続サブフレームに有声音と判定されたサブフレームが存在する場合は、前記先頭サブフレームに、予め定められた複数のピッチの基準値の中から一の基準値を選択して符号化する第1符号化工程と、
    前記選択した基準値と有声音と判定された前記後続サブフレームの前記算出したピッチとの差分を算出して符号化する第2符号化工程と、
    を備え、
    前記第1符号化工程において選択される基準値は、前記有声音と判定された後続サブフレームのピッチとの差分が最も小さい基準値であることを特徴とするピッチ符号化方法を実現させるためのプログラムを記録した記録媒体。
  6. 請求項5に記載のピッチ符号化方法において、
    前記有声音でないと判定された先頭フレームに後続するサブフレームが、有声音でないと判定された場合には、当該後続するサブフレームの差分を0として符号化する第3符号化工程とを更に備えるピッチ符号化方法を実行させるためのプログラムを記録した記録媒体。
JP04593398A 1998-02-26 1998-02-26 音声のピッチ符号化方法及び音声のピッチ符号化装置並びに音声のピッチ符号化プログラムが記録された記録媒体 Expired - Fee Related JP3618217B2 (ja)

Priority Applications (2)

Application Number Priority Date Filing Date Title
JP04593398A JP3618217B2 (ja) 1998-02-26 1998-02-26 音声のピッチ符号化方法及び音声のピッチ符号化装置並びに音声のピッチ符号化プログラムが記録された記録媒体
US09/257,382 US6219636B1 (en) 1998-02-26 1999-02-25 Audio pitch coding method, apparatus, and program storage device calculating voicing and pitch of subframes of a frame

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP04593398A JP3618217B2 (ja) 1998-02-26 1998-02-26 音声のピッチ符号化方法及び音声のピッチ符号化装置並びに音声のピッチ符号化プログラムが記録された記録媒体

Publications (2)

Publication Number Publication Date
JPH11242498A JPH11242498A (ja) 1999-09-07
JP3618217B2 true JP3618217B2 (ja) 2005-02-09

Family

ID=12733076

Family Applications (1)

Application Number Title Priority Date Filing Date
JP04593398A Expired - Fee Related JP3618217B2 (ja) 1998-02-26 1998-02-26 音声のピッチ符号化方法及び音声のピッチ符号化装置並びに音声のピッチ符号化プログラムが記録された記録媒体

Country Status (2)

Country Link
US (1) US6219636B1 (ja)
JP (1) JP3618217B2 (ja)

Families Citing this family (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6418407B1 (en) * 1999-09-30 2002-07-09 Motorola, Inc. Method and apparatus for pitch determination of a low bit rate digital voice message
GB2357683A (en) * 1999-12-24 2001-06-27 Nokia Mobile Phones Ltd Voiced/unvoiced determination for speech coding
US7630883B2 (en) * 2001-08-31 2009-12-08 Kabushiki Kaisha Kenwood Apparatus and method for creating pitch wave signals and apparatus and method compressing, expanding and synthesizing speech signals using these pitch wave signals
JP4547965B2 (ja) * 2004-04-02 2010-09-22 カシオ計算機株式会社 音声符号化装置、方法及びプログラム
KR20060067016A (ko) 2004-12-14 2006-06-19 엘지전자 주식회사 음성 부호화 장치 및 방법
JPWO2008155919A1 (ja) * 2007-06-21 2010-08-26 パナソニック株式会社 適応音源ベクトル量子化装置および適応音源ベクトル量子化方法
RU2523796C2 (ru) 2009-05-15 2014-07-27 Ниппон Сокубаи Ко., Лтд. Способ получения (мет)акриловой кислоты
US8670990B2 (en) * 2009-08-03 2014-03-11 Broadcom Corporation Dynamic time scale modification for reduced bit rate audio coding

Family Cites Families (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US4989250A (en) * 1988-02-19 1991-01-29 Sanyo Electric Co., Ltd. Speech synthesizing apparatus and method
US5091946A (en) * 1988-12-23 1992-02-25 Nec Corporation Communication system capable of improving a speech quality by effectively calculating excitation multipulses
US5657418A (en) * 1991-09-05 1997-08-12 Motorola, Inc. Provision of speech coder gain information using multiple coding modes
US5495555A (en) * 1992-06-01 1996-02-27 Hughes Aircraft Company High quality low bit rate celp-based speech codec
US5732389A (en) * 1995-06-07 1998-03-24 Lucent Technologies Inc. Voiced/unvoiced classification of speech for excitation codebook selection in celp speech decoding during frame erasures

Also Published As

Publication number Publication date
US6219636B1 (en) 2001-04-17
JPH11242498A (ja) 1999-09-07

Similar Documents

Publication Publication Date Title
JP4132109B2 (ja) 音声信号の再生方法及び装置、並びに音声復号化方法及び装置、並びに音声合成方法及び装置
KR100566713B1 (ko) 음향 파라미터 부호화, 복호화 방법, 장치 및 프로그램, 음성 부호화, 복호화 방법, 장치 및 프로그램
JP2003044098A (ja) 音声帯域拡張装置及び音声帯域拡張方法
JP3357795B2 (ja) 音声符号化方法および装置
JP3618217B2 (ja) 音声のピッチ符号化方法及び音声のピッチ符号化装置並びに音声のピッチ符号化プログラムが記録された記録媒体
JP3531780B2 (ja) 音声符号化方法および復号化方法
JPH07199997A (ja) 音声信号の処理システムにおける音声信号の処理方法およびその処理における処理時間の短縮方法
JP2931059B2 (ja) 音声合成方式およびこれに用いる装置
JP3050978B2 (ja) 音声符号化方法
JP3559485B2 (ja) 音声信号の後処理方法および装置並びにプログラムを記録した記録媒体
JP3916934B2 (ja) 音響パラメータ符号化、復号化方法、装置及びプログラム、音響信号符号化、復号化方法、装置及びプログラム、音響信号送信装置、音響信号受信装置
JP3583945B2 (ja) 音声符号化方法
JP2002169579A (ja) オーディオ信号への付加データ埋め込み装置及びオーディオ信号からの付加データ再生装置
JP4438280B2 (ja) トランスコーダ及び符号変換方法
JPH1138997A (ja) 雑音抑圧装置および音声の雑音除去の処理をするための処理プログラムを記録した記録媒体
JP2000235400A (ja) 音響信号符号化装置、復号化装置、これらの方法、及びプログラム記録媒体
JP4489371B2 (ja) 合成音声を最適化する方法、音声合成フィルタを生成する方法、音声最適化方法及び音声最適化装置
JP3552201B2 (ja) 音声符号化方法および装置
JP3798433B2 (ja) ピッチサイクル波形を平滑化する方法及び装置
JPH05232996A (ja) 音声符号化装置
JP4826580B2 (ja) 音声信号の再生方法及び装置
JP3515216B2 (ja) 音声符号化装置
JPH08211895A (ja) ピッチラグを評価するためのシステムおよび方法、ならびに音声符号化装置および方法
JP3192999B2 (ja) 音声符号化方法および音声符号化方法
JP2853170B2 (ja) 音声符号化復号化方式

Legal Events

Date Code Title Description
A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20040702

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20040713

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20040913

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20041109

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20041109

R150 Certificate of patent or registration of utility model

Free format text: JAPANESE INTERMEDIATE CODE: R150

LAPS Cancellation because of no payment of annual fees