JP2003005795A - 送信装置および送信方法、受信装置および受信方法、プログラムおよび記録媒体、並びに送受信装置 - Google Patents

送信装置および送信方法、受信装置および受信方法、プログラムおよび記録媒体、並びに送受信装置

Info

Publication number
JP2003005795A
JP2003005795A JP2001192379A JP2001192379A JP2003005795A JP 2003005795 A JP2003005795 A JP 2003005795A JP 2001192379 A JP2001192379 A JP 2001192379A JP 2001192379 A JP2001192379 A JP 2001192379A JP 2003005795 A JP2003005795 A JP 2003005795A
Authority
JP
Japan
Prior art keywords
data
quality
voice data
unit
receiving
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP2001192379A
Other languages
English (en)
Other versions
JP4711099B2 (ja
Inventor
Tetsujiro Kondo
哲二郎 近藤
Masaaki Hattori
正明 服部
Tsutomu Watanabe
勉 渡辺
Hiroto Kimura
裕人 木村
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Sony Corp
Original Assignee
Sony Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Sony Corp filed Critical Sony Corp
Priority to JP2001192379A priority Critical patent/JP4711099B2/ja
Priority to US10/362,582 priority patent/US7366660B2/en
Priority to PCT/JP2002/006179 priority patent/WO2003001709A1/ja
Priority to KR1020037002805A priority patent/KR100895745B1/ko
Priority to EP02743668A priority patent/EP1401130A4/en
Priority to CN028026632A priority patent/CN1465149B/zh
Publication of JP2003005795A publication Critical patent/JP2003005795A/ja
Application granted granted Critical
Publication of JP4711099B2 publication Critical patent/JP4711099B2/ja
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/04Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/04Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
    • G10L19/16Vocoder architecture
    • G10L19/18Vocoders using multiple modes
    • G10L19/22Mode decision, i.e. based on audio signal content versus external parameters
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/04Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
    • G10L19/16Vocoder architecture
    • G10L19/18Vocoders using multiple modes
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L21/00Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
    • G10L21/02Speech enhancement, e.g. noise reduction or echo cancellation
    • G10L21/0316Speech enhancement, e.g. noise reduction or echo cancellation by changing the amplitude
    • G10L21/0364Speech enhancement, e.g. noise reduction or echo cancellation by changing the amplitude for improving intelligibility
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04WWIRELESS COMMUNICATION NETWORKS
    • H04W4/00Services specially adapted for wireless communication networks; Facilities therefor
    • H04W4/18Information format or content conversion, e.g. adaptation by the network of the transmitted or received information for the purpose of wireless delivery to users or terminals

Landscapes

  • Engineering & Computer Science (AREA)
  • Signal Processing (AREA)
  • Human Computer Interaction (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Computational Linguistics (AREA)
  • Physics & Mathematics (AREA)
  • Acoustics & Sound (AREA)
  • Multimedia (AREA)
  • Quality & Reliability (AREA)
  • Computer Networks & Wireless Communication (AREA)
  • Mobile Radio Communication Systems (AREA)
  • Telephone Function (AREA)
  • Transmission Systems Not Characterized By The Medium Used For Transmission (AREA)

Abstract

(57)【要約】 【課題】 高音質の音声を復号する。 【解決手段】 携帯電話機1011では、ユーザの音声
データが符号化され、符号化音声データが出力される。
さらに、携帯電話機1011では、符号化音声データを
受信する携帯電話機1012において出力される音声の
品質を向上させる高品質化データの学習が、過去の学習
に用いられた音声データと、新たに入力された音声デー
タに基づいて行われ、符号化音声データと高品質化デー
タが送信される。携帯電話機1012では、携帯電話機
1011から送信されてきた符号化音声データが受信さ
れ、携帯電話機1011の電話番号と対応付けられてい
る高品質化データが選択される。そして、携帯電話機1
012では、その選択された高品質化データに基づい
て、受信された符号化音声データが復号される。

Description

【発明の詳細な説明】
【0001】
【発明の属する技術分野】本発明は、送信装置および送
信方法、受信装置および受信方法、プログラムおよび記
録媒体、並びに送受信装置に関し、特に、例えば、携帯
電話機等において、高音質の音声による通話を行うこと
ができるようにする送信装置および送信方法、受信装置
および受信方法、プログラムおよび記録媒体、並びに送
受信装置に関する。
【0002】
【従来の技術】例えば、携帯電話機での音声通話におい
ては、伝送帯域が制限されていること等に起因して、受
信された音声の音質は、ユーザが発した実際の音声の音
質よりも比較的大きく劣化したものとなる。
【0003】そこで、従来の携帯電話機では、受信した
音声の音質を改善するために、受信した音声に対して、
例えば、その音声の周波数スペクトルを調整するフィル
タリング等の信号処理が施される。
【0004】
【発明が解決しようとする課題】しかしながら、ユーザ
の音声は、ユーザごとに特徴があるため、同一のタップ
係数のフィルタによって、受信した音声のフィルタリン
グを行うのでは、ユーザごとに異なる音声の周波数特性
によっては、その音声の音質を十分に改善することがで
きない場合がある。
【0005】本発明は、このような状況に鑑みてなされ
たものであり、ユーザごとに、音質を十分に改善した音
声を得ることができるようにするものである。
【0006】
【課題を解決するための手段】本発明の送信装置は、音
声データを符号化し、符号化音声データを出力する符号
化手段と、符号化音声データを受信する受信側において
出力される音声の品質を向上させる高品質化データの学
習を、過去の学習に用いられた音声データと、新たに入
力された音声データに基づいて行う学習手段と、符号化
音声データと高品質化データを送信する送信手段とを備
えることを特徴とする。
【0007】本発明の送信方法は、音声データを符号化
し、符号化音声データを出力する符号化ステップと、符
号化音声データを受信する受信側において出力される音
声の品質を向上させる高品質化データの学習を、過去の
学習に用いられた音声データと、新たに入力された音声
データに基づいて行う学習ステップと、符号化音声デー
タと高品質化データを送信する送信ステップとを備える
ことを特徴とする。
【0008】本発明の第1のプログラムは、音声データ
を符号化し、符号化音声データを出力する符号化ステッ
プと、符号化音声データを受信する受信側において出力
される音声の品質を向上させる高品質化データの学習
を、過去の学習に用いられた音声データと、新たに入力
された音声データに基づいて行う学習ステップと、符号
化音声データと高品質化データを送信する送信ステップ
とを備えることを特徴とする。
【0009】本発明の第1の記録媒体は、音声データを
符号化し、符号化音声データを出力する符号化ステップ
と、符号化音声データを受信する受信側において出力さ
れる音声の品質を向上させる高品質化データの学習を、
過去の学習に用いられた音声データと、新たに入力され
た音声データに基づいて行う学習ステップと、符号化音
声データと高品質化データを送信する送信ステップとを
備えるプログラムが記録されていることを特徴とする。
【0010】本発明の受信装置は、符号化音声データを
受信する受信手段と、符号化音声データを復号した復号
音声データの品質を向上させる高品質化データを、符号
化音声データを送信してくる送信側を特定する特定情報
とともに記憶する記憶手段と、符号化音声データを送信
してきた送信側の特定情報と対応付けられている高品質
化データを選択する選択手段と、選択手段において選択
された高品質化データに基づいて、受信手段において受
信された符号化音声データを復号する復号手段とを備え
ることを特徴とする。
【0011】本発明の受信方法は、符号化音声データを
受信する受信ステップと、符号化音声データを復号した
復号音声データの品質を向上させる高品質化データを、
符号化音声データを送信してくる送信側を特定する特定
情報とともに記憶する記憶ステップと、符号化音声デー
タを送信してきた送信側の特定情報と対応付けられてい
る高品質化データを選択する選択ステップと、選択ステ
ップにおいて選択された高品質化データに基づいて、受
信ステップにおいて受信された符号化音声データを復号
する復号ステップとを備えることを特徴とする。
【0012】本発明の第2のプログラムは、符号化音声
データを受信する受信ステップと、符号化音声データを
復号した復号音声データの品質を向上させる高品質化デ
ータを、符号化音声データを送信してくる送信側を特定
する特定情報とともに記憶する記憶ステップと、符号化
音声データを送信してきた送信側の特定情報と対応付け
られている高品質化データを選択する選択ステップと、
選択ステップにおいて選択された高品質化データに基づ
いて、受信ステップにおいて受信された符号化音声デー
タを復号する復号ステップとを備えることを特徴とす
る。
【0013】本発明の第2の記録媒体は、符号化音声デ
ータを受信する受信ステップと、符号化音声データを復
号した復号音声データの品質を向上させる高品質化デー
タを、符号化音声データを送信してくる送信側を特定す
る特定情報とともに記憶する記憶ステップと、符号化音
声データを送信してきた送信側の特定情報と対応付けら
れている高品質化データを選択する選択ステップと、選
択ステップにおいて選択された高品質化データに基づい
て、受信ステップにおいて受信された符号化音声データ
を復号する復号ステップとを備えるプログラムが記録さ
れていることを特徴とする。
【0014】本発明の送受信装置は、入力された音声デ
ータを符号化し、符号化音声データを出力する符号化手
段と、符号化音声データを受信する他の送受信装置にお
いて出力される音声の品質を向上させる高品質化データ
の学習を、過去の学習に用いられた音声データと、新た
に入力された音声データに基づいて行う学習手段と、符
号化音声データと高品質化データを送信する送信手段
と、他の送受信装置から送信されてくる符号化音声デー
タを受信する受信手段と、高品質化データを、符号化音
声データを送信してくる他の送受信装置を特定する特定
情報とともに記憶する記憶手段と、符号化音声データを
送信してきた他の送受信装置の特定情報と対応付けられ
ている高品質化データを選択する選択手段と、選択手段
において選択された高品質化データに基づいて、受信手
段において受信された符号化音声データを復号する復号
手段とを備えることを特徴とする。
【0015】本発明の送信装置および送信方法、並びに
第1のプログラムにおいては、音声データが符号化さ
れ、符号化音声データが出力される。一方、符号化音声
データを受信する受信側において出力される音声の品質
を向上させる高品質化データの学習が、過去の学習に用
いられた音声データと、新たに入力された音声データに
基づいて行われ、符号化音声データと高品質化データが
送信される。
【0016】本発明の受信装置及び受信方法、並びに第
1のプログラムにおいては、符号化音声データが受信さ
れ、その符号化音声データを送信してきた送信側の特定
情報と対応付けられている高品質化データが選択され
る。そして、その選択された高品質化データに基づい
て、受信された符号化音声データが復号される。
【0017】本発明の送受信装置においては、入力され
た音声データが符号化され、符号化音声データが出力さ
れる。そして、符号化音声データを受信する他の送受信
装置において出力される音声の品質を向上させる高品質
化データの学習が、過去の学習に用いられた音声データ
と、新たに入力された音声データに基づいて行われ、符
号化音声データと高品質化データが送信される。一方、
他の送受信装置から送信されてくる符号化音声データが
受信され、その符号化音声データを送信してきた他の送
受信装置の特定情報と対応付けられている高品質化デー
タが選択される。そして、その選択された高品質化デー
タに基づいて、受信された符号化音声データが復号され
る。
【0018】
【発明の実施の形態】図1は、本発明を適用した伝送シ
ステム(システムとは、複数の装置が論理的に集合した
物をいい、各構成の装置が同一筐体中にあるか否かは問
わない)の一実施の形態の構成を示している。
【0019】この伝送システムでは、携帯電話機101
1と1012が、基地局1021と1022それぞれとの間
で、無線による送受信を行うとともに、基地局1021
と1022それぞれが、交換局103との間で送受信を
行うことにより、最終的には、携帯電話機1011と1
012との間において、基地局1021および1022
並びに交換局103を介して、音声の送受信を行うこと
ができるようになっている。なお、基地局1021と1
022は、同一の基地局であっても良いし、異なる基地
局であっても良い。
【0020】ここで、以下、特に区別する必要がない限
り、携帯電話機1011と1012を、携帯電話機101
と記述する。
【0021】次に、図2は、図1の携帯電話機1011
の構成例を示している。なお、携帯電話機1012も、
以下説明する携帯電話機1011と同様に構成されるた
め、その説明は省略する。
【0022】アンテナ111は、基地局1021または
1022からの電波を受信し、その受信信号を、変復調
部112に供給するとともに、変復調部112からの信
号を、電波で、基地局1021または1022に送信す
る。変復調部112は、アンテナ111からの信号を、
例えば、CDMA(Code Division Multiple Access)方
式等によって復調し、その結果得られる復調信号を、受
信部114に供給する。また、変復調部112は、送信
部113から供給される送信データを、例えば、CDM
A方式等で変調し、その結果得られる変調信号を、アン
テナ111に供給する。送信部113は、そこに入力さ
れるユーザの音声を符号化する等の所定の処理を行い、
送信データを得て、変復調部112に供給する。受信部
114は、変復調部112からの復調信号である受信デ
ータを受信し、高音質の音声を復号して出力する。
【0023】操作部115は、発呼先の電話番号や、所
定のコマンド等を入力するときに、ユーザによって操作
され、その操作に対応する操作信号は、送信部113や
受信部114に供給される。
【0024】なお、送信部113と受信部114との間
では、必要に応じて情報をやりとりすることができるよ
うになっている。
【0025】次に、図3は、図2の送信部113の構成
例を示している。
【0026】マイク121には、ユーザの音声が入力さ
れ、マイク121は、そのユーザの音声を、電気信号と
しての音声信号として、A/D(Analog/Digital)変換部
122に出力する。A/D変換部122は、マイク12
1からのアナログの音声信号をA/D変換することによ
り、ディジタルの音声データとし、符号化部123およ
び学習部125に出力する。
【0027】符号化部123は、A/D変換部122か
らの音声データを所定の符号化方式によって符号化し、
その結果得られる符号化音声データを、送信制御部12
4に出力する。
【0028】送信制御部124は、符号化部123が出
力する符号化音声データと、後述する管理部127が出
力するデータの送信制御を行う。即ち、送信制御部12
4は、符号化部123が出力する符号化音声データ、ま
たは後述する管理部127が出力するデータを選択し、
所定の送信タイミングにおいて、送信データとして、変
復調部112(図2)に出力する。なお、送信制御部1
24は、符号化音声データおよび高品質化データの他、
操作部115が操作されることによって入力される、発
信先の電話番号や、発信元である自身の電話番号、その
他の必要な情報を、必要に応じて、送信データとして出
力する。
【0029】学習部125は、符号化部123が出力す
る符号化音声データを受信する受信側において出力され
る音声の品質を向上させる高品質化データの学習を、過
去の学習に用いられた音声データと、新たにA/D変換
部122から入力される音声データに基づいて行う。学
習部125は、学習を行うことにより、新たな高品質化
データを得ると、その高品質化データを、記憶部126
に供給する。
【0030】記憶部126は、学習部125から供給さ
れる高品質化データを記憶する。
【0031】管理部127は、受信部114から供給さ
れる情報を必要に応じて参照しながら、記憶部126に
記憶された高品質化データの送信を管理する。
【0032】以上のように構成される送信部113で
は、マイク121に入力されたユーザの音声が、A/D
変換部122を介して、符号化部123および学習部1
25に供給される。
【0033】符号化部123は、A/D変換部122か
ら供給される音声データを符号化し、その結果得られる
符号化音声データを、送信制御部124に出力する。送
信制御部124は、符号化部123から供給される符号
化音声データを送信データとして、変復調部112(図
2)に出力する。
【0034】一方、学習部125は、過去の学習に用い
られた音声データと、新たにA/D変換部122から入
力される音声データに基づいて、高品質化データを学習
し、その結果得られる高品質化データを、記憶部126
に供給して記憶させる。
【0035】ここで、このように、学習部125では、
新たに入力されたユーザの音声データだけではなく、過
去の学習に用いられた音声データにも基づいて、高品質
化データの学習が行われるので、ユーザが通話を行うほ
ど、より、そのユーザの音声データを符号化した符号化
音声データを、高品質の音声データに復号することので
きる高品質化データが得られることになる。
【0036】そして、管理部127は、所定のタイミン
グにおいて、記憶部126に記憶された高品質化データ
を、記憶部126から読み出し、送信制御部124に供
給する。送信制御部124は、管理部127が出力する
高品質化データを、所定の送信タイミングにおいて、送
信データとして、変復調部112(図2)に出力する。
【0037】以上のように、送信部113では、通常の
通話のための音声としての符号化音声データの他に、高
品質化データも送信される。
【0038】次に、図4は、図2の受信部114の構成
例を示している。
【0039】図2の変復調部112が出力する復調信号
としての受信データは、受信制御部131に供給され、
受信制御部131は、その受信データを受信する。そし
て、受信制御部131は、受信データが符号化音声デー
タである場合には、その符号化音声データを、復号部1
32に供給し、受信データが高品質化データである場合
には、その高品質化データを、管理部135に供給す
る。
【0040】なお、受信データには、符号化音声データ
および高品質化データの他、必要に応じて、発信元の電
話番号その他の情報が含まれており、受信制御部131
は、そのような情報を、必要に応じて、管理部135
や、送信部113(の管理部127)に供給する。
【0041】復号部132は、受信制御部132から供
給される符号化音声データを、管理部135から供給さ
れる高品質化データを用いて復号し、これにより、高品
質の復号音声データを得て、D/A(Digital/Analog)変
換部133に供給する。
【0042】D/A変換部133は、復号部132が出
力するディジタルの復号音声データをD/A変換し、そ
の結果得られるアナログの音声信号を、スピーカ134
に供給する。スピーカ134は、D/A変換部133か
らの音声信号に対応する音声を出力する。
【0043】管理部135は、高品質化データの管理を
行う。即ち、管理部135は、着呼時に、受信制御部1
31から、発信元の電話番号を受信し、その電話番号に
基づいて、記憶部136またはデフォルトデータメモリ
137に記憶された高品質化データを選択し、復号部1
32に供給する。また、管理部135は、受信制御部1
31から、最新の高品質化データを受信し、その最新の
高品質化データによって、記憶部136の記憶内容を更
新する。
【0044】記憶部136は、例えば、書き換え可能な
EEPROM(Electrically Erasable Programmable Re
ad-only Memory)で構成され、管理部135から供給さ
れる高品質化データを、その高品質化データを送信して
きた発信元を特定する特定情報としての、例えば、その
発信元の電話番号と対応付けて記憶する。
【0045】デフォルトデータメモリ137は、例え
ば、ROMで構成され、デフォルトの高品質化データ
を、あらかじめ記憶している。
【0046】以上のように構成される受信部114で
は、着呼があると、受信制御部131は、そこに供給さ
れる受信データを受信し、その受信データに含まれる発
信元の電話番号を、管理部135に供給する。管理部1
35は、例えば、受信制御部131から発信元の電話番
号を受信し、音声通話が可能な状態となると、その音声
通話で用いる高品質化データを設定する高品質化データ
設定処理を、図5のフローチャートにしたがって行う。
【0047】即ち、高品質化データ設定処理では、まず
最初に、ステップS141において、管理部135は、
発信元の電話番号を、記憶部136から検索し、ステッ
プS142に進む。ステップS142では、管理部13
5は、ステップS141の検索によって、発信元の電話
番号が見つかったかどうか(記憶部136に記憶されて
いるかどうか)を判定する。
【0048】ステップS142において、発信元の電話
番号が見つかったと判定された場合、ステップS143
に進み、管理部135は、記憶部136に記憶されてい
る高品質化データの中から、発信元の電話番号に対応付
けられている高品質化データを選択し、復号部132に
供給、設定して、高品質化データ設定処理を終了する。
【0049】また、ステップS142において、発信元
の電話番号が見つからなかったと判定された場合、ステ
ップS144に進み、管理部135は、デフォルトデー
タメモリ137から、デフォルトの高品質化データ(以
下、適宜、デフォルトデータという)を読み出し、復号
部132に供給、設定して、高品質化データ設定処理を
終了する。
【0050】なお、図5の実施の形態では、発信元の電
話番号が見つかった場合、即ち、発信元の電話番号が、
記憶部136に記憶されている場合に、その発信元の電
話番号に対応付けられている高品質化データを、復号部
132に設定するようにしたが、操作部115(図2)
を操作することにより、発信元の電話番号が見つかった
場合であっても、デフォルトデータを、復号部132に
設定するように、管理部135を制御することが可能で
ある。
【0051】以上のようにして、高品質化データが、復
号部132に設定された後、受信制御部131に対し、
受信データとして、発信元から送信されてきた符号化音
声データの供給が開始されると、その符号化音声データ
は、受信制御部131から復号部132に供給される。
復号部132は、受信制御部131から供給される、発
信元から送信されてきた符号化音声データを、着呼直後
に行われた図5の高品質化データ設定処理で設定された
高品質化データ、即ち、発信元の電話番号と対応付けら
れている高品質化データに基づいて復号し、復号音声デ
ータを出力する。この復号音声データは、復号部132
から、D/A変換部133を介してスピーカ134に供
給されて出力される。
【0052】一方、受信制御部131は、受信データと
して、発信元から送信されてきた高品質化データを受信
すると、その高品質化データを、管理部135に供給す
る。管理部135は、受信制御部131から供給される
高品質化データを、その高品質化データを送信してきた
発信元の電話番号と対応付け、記憶部136に供給して
記憶させる。
【0053】ここで、上述のように、記憶部135にお
いて、発信元の電話番号と対応付けられて記憶される高
品質化データは、発信元の送信部113(図3)の学習
部125において、その発信元のユーザの音声に基づい
て学習を行うことにより得られたものであり、発信元の
ユーザの音声を符号化した符号化音声データを、高品質
の復号音声データに復号するものである。
【0054】そして、受信部114の復号部132で
は、発信元から送信されてきた符号化音声データが、発
信元の電話番号と対応付けられている高品質化データに
基づいて復号されるので、発信元から送信されてきた符
号化音声データに適した復号処理(その符号化音声デー
タに対応する音声を発話したユーザの音声の特性ごとに
異なる復号処理)が施されることになり、高品質の復号
音声データを得ることができる。
【0055】ところで、上述のように、発信元から送信
されてきた符号化音声データに適した復号処理を施すこ
とにより、高品質の復号音声データを得るには、復号部
132において、その発信元の送信部113(図3)の
学習部125で学習された高品質化データを用いて処理
を行う必要があり、さらに、そのためには、記憶部13
6に、その高品質符号化データが、発信元の電話番号と
対応付けて記憶されている必要がある。
【0056】そこで、発信元(送信側)の送信部113
(図3)は、学習により得られた最新の高品質化データ
を、着信側(受信側)に送信する高品質化データ送信処
理を行い、着信側の受信部114は、発信元において、
その高品質化データ送信処理が行われることにより送信
されてくる高品質化データによって、記憶部136の記
憶内容を更新する高品質化データ更新処理を行うように
なっている。
【0057】そこで、いま、例えば、携帯電話機101
1を発信元とするとともに、携帯電話機1012を着信側
として、高品質化データ送信処理と、高品質化データ更
新処理について説明する。
【0058】図6は、高品質化データ送信処理の第1実
施の形態を示すフローチャートである。
【0059】発信元である携帯電話機1011では、ユ
ーザが、操作部115(図2)を操作して、着信側とし
ての携帯電話機1012の電話番号を入力すると、送信
部113において、高品質化データ送信処理が開始され
る。
【0060】即ち、高品質化データ送信処理では、まず
最初に、ステップS1において、送信部113(図3)
の送信制御部124が、操作部115が操作されること
により入力された携帯電話機1012の電話番号を、送
信データとして出力することにより、携帯電話機101
2の呼び出しが行われる。
【0061】そして、携帯電話機1012のユーザが、
携帯電話機1011からの呼び出しに応じて、操作部1
15を操作することにより、携帯電話機1012をオフ
フック状態にすると、ステップS2に進み、送信制御部
124は、着信側の携帯電話機1012との間の通信リ
ンクを確立し、ステップS3に進む。
【0062】ステップS3では、管理部127が、記憶
部126に記憶された高品質化データの更新の状況を表
す更新情報を、送信制御部124に送信し、送信制御部
124は、その更新情報を、送信データとして選択、出
力して、ステップS4に進む。
【0063】ここで、学習部125は、学習を行って、
新たな高品質化データを得ると、例えば、その高品質化
データを得た日時(年月を含む)を、その高品質化デー
タと対応付けて、記憶部126に記憶させるようになっ
ており、更新情報としては、この高品質化データと対応
付けられている日時を用いることができる。
【0064】着信側の携帯電話機1012は、発信元の
携帯電話機1011から更新情報を受信すると、後述す
るように、最新の高品質化データが必要な場合は、その
送信を要求する転送要求を送信してくるので、ステップ
S4において、管理部127は、着信側の携帯電話機1
012から転送要求が送信されてきたかどうかを判定す
る。
【0065】ステップS4において、転送要求が送信さ
れてきていないと判定された場合、即ち、携帯電話機1
011の受信部114の受信制御部131において、受
信データとして、着信側の携帯電話機1012からの転
送要求が受信されなかった場合、ステップS5をスキッ
プして、ステップS6に進む。
【0066】また、ステップS4において、転送要求が
送信されてきたと判定された場合、即ち、携帯電話機1
011の受信部114の受信制御部131において、受
信データとして、着信側の携帯電話機1012からの転
送要求が受信され、その転送要求が、送信部113の管
理部127に供給された場合、ステップS5に進み、管
理部127は、記憶部126から最新の高品質化データ
を読み出し、送信制御部124に供給する。さらに、ス
テップS5では、送信制御部124が、管理部127か
らの最新の高品質化データを選択し、送信データとして
送信する。なお、高品質化データは、その高品質化デー
タが学習によって得られた日時、即ち、更新情報ととも
に送信されるようになっている。
【0067】その後、ステップS5からS6に進み、管
理部127は、準備完了通知が、着信側の携帯電話機1
012から送信されてきたかどうかを判定する。
【0068】即ち、着信側の携帯電話機1012は、通
常の音声通話が可能な状態となると、音声通話の準備が
完了したことを表す準備完了通知を送信するようになっ
ており、ステップS6では、そのような準備完了通知
が、携帯電話機1012から送信されてきたかどうかが
判定される。
【0069】ステップS6において、準備完了通知が送
信されてきていないと判定された場合、即ち、携帯電話
機1011の受信部114の受信制御部131におい
て、受信データとして、着信側の携帯電話機1012
らの準備完了通知が受信されていない場合、ステップS
6に戻り、準備完了通知が送信されてくるまで待つ。
【0070】そして、ステップS6において、準備完了
通知が送信されてきたと判定された場合、即ち、携帯電
話機1011の受信部114の受信制御部131におい
て、受信データとして、着信側の携帯電話機1012
らの準備完了通知が受信され、その準備完了通知が、送
信部113の管理部127に供給された場合、ステップ
S7に進み、送信制御部124は、符号化部123の出
力を選択することにより、音声通話が可能な状態、即
ち、符号化部123が出力する符号化音声データを、送
信データとして選択する状態となって、高品質化データ
送信処理を終了する。
【0071】次に、図7のフローチャートを参照して、
発信側の携帯電話機1011で図6の高品質化データ送
信処理が行われる場合の、着信側の携帯電話機1012
による高品質化データ更新処理について説明する。
【0072】着信側の携帯電話機1012では、例え
ば、着呼があると、受信部114(図4)において、高
品質化データ更新処理が開始される。
【0073】即ち、高品質化データ更新処理では、まず
最初に、ステップS11において、受信制御部131
が、ユーザが操作部115を操作することによりオフフ
ック状態とされたかどうかを判定し、オフフック状態と
されていないと判定した場合、ステップS11に戻る。
【0074】また、ステップS11において、オフフッ
ク状態とされたと判定された場合、ステップS12に進
み、受信制御部131は、発信側の携帯電話機1011
との通信リンクを確立し、ステップS13に進む。
【0075】ステップS13では、図6のステップS3
で説明したように、発信側の携帯電話機1011から更
新情報が送信されてくるので、受信制御部131は、こ
の更新情報を含む受信データを受信し、管理部135に
供給する。
【0076】管理部135は、ステップS14におい
て、発信側の携帯電話機1011から受信した更新情報
を参照し、記憶部136に、発信側の携帯電話機101
1のユーザについての最新の高品質化データが記憶され
ているかどうかを判定する。
【0077】即ち、図1の伝送システムにおける通信で
は、発信側の携帯電話機1011(または1012)か
ら、着信側の携帯電話機1012(または1011)の着
呼時に、発信側の携帯電話機1011の電話番号が送信
されるようになっており、この電話番号は、受信データ
として、受信制御部131で受信され、管理部135に
供給されるようになっている。管理部135は、その発
信側である携帯電話機1011の電話番号と対応付けら
れている高品質化データが、記憶部136に既に記憶さ
れているかどうか、さらに、記憶されている場合には、
その記憶されている高品質化データが最新のものかどう
かを調査することにより、ステップS14の判定処理を
行う。
【0078】ステップS14において、記憶部136
に、発信側の携帯電話機1011のユーザについての最
新の高品質化データが記憶されていると判定された場
合、即ち、記憶部136に、発信元の携帯電話機101
1の電話番号と対応付けられている高品質化データが記
憶されており、その高品質化データに対応付けられてい
る更新情報が表す日時が、ステップS13で受信された
更新情報が表す日時と一致する場合、記憶部136にお
ける、発信元の携帯電話機1011の電話番号と対応付
けられている高品質化データを更新する必要はないの
で、ステップS15乃至S18をスキップして、ステッ
プS19に進む。
【0079】ここで、図6のステップS5で説明したよ
うに、発信側の携帯電話機1011は、高品質化データ
を、その更新情報とともに送信してくるようになってお
り、着信側の携帯電話機1012の管理部135は、発
信側の携帯電話機1011からの高品質化データを記憶
部136に記憶させる場合、その高品質化データに、そ
の高品質化データとともに送信されてくる更新情報を対
応付けて記憶させるようになっている。ステップS14
では、このようにして、記憶部136に記憶されている
高品質化データに対応付けられている更新情報と、ステ
ップS13で受信された更新情報とを比較することによ
り、記憶部136に記憶されている高品質化データが最
新のものであるかどうかが判定される。
【0080】一方、ステップS14において、記憶部1
36に、発信側の携帯電話機101 1のユーザについて
の最新の高品質化データが記憶されていないと判定され
た場合、即ち、記憶部136に、発信元の携帯電話機1
011の電話番号と対応付けられている高品質化データ
が記憶されていないか、または記憶されていても、その
高品質化データに対応付けられている更新情報が表す日
時が、ステップS13で受信された更新情報が表す日時
よりも過去を表す(古い)ものである場合、ステップS
15に進み、管理部135は、最新の高品質化データへ
の更新が禁止されているかどうかを判定する。
【0081】即ち、例えば、ユーザは、操作部115を
操作することにより、高品質化データの更新を行わない
ように、管理部135を設定することが可能であり、管
理部135は、高品質化データの更新を行うかどうかの
設定に基づいて、ステップS15の判定処理を行う。
【0082】ステップS15において、最新の高品質化
データへの更新が禁止されていると判定された場合、即
ち、管理部135が、高品質化データの更新を行わない
ように設定されている場合、ステップS16乃至S18
をスキップして、ステップS19に進む。
【0083】また、ステップS15において、最新の高
品質化データへの更新が禁止されていないと判定された
場合、即ち、管理部135が、高品質化データの更新を
行わないように設定されていない場合、ステップS16
に進み、管理部135は、発信元の携帯電話機1011
に対して、最新の高品質化データの送信を要求する転送
要求を、送信部113(図3)の送信制御部124に供
給する。これにより、送信部113の送信制御部124
は、転送要求を、送信データとして送信する。
【0084】図6のステップS4およびS5で説明した
ように、転送要求を受信した発信元の携帯電話機101
1は、最新の高品質化データを、その更新情報とともに
送信してくるので、受信制御部131は、ステップS1
7において、その最新の高品質化データおよび更新情報
を含む受信データを受信し、管理部135に供給する。
【0085】管理部135は、ステップS18におい
て、ステップS17で得た最新の高品質化データを、着
呼時に受信した発信側の携帯電話機1011の電話番
号、さらには、その高品質化データとともに送信されて
きた更新情報と対応付けて、記憶部136に記憶させる
ことにより、記憶部136の記憶内容を更新する。
【0086】即ち、管理部135は、発信側の携帯電話
機1011の電話番号と対応付けられた高品質化データ
が、記憶部136に記憶されていない場合には、ステッ
プS17で得た最新の高品質化データ、着呼時に受信し
た発信側の携帯電話機101 1の電話番号、および更新
情報(最新の高品質化データの更新情報)を、記憶部1
36に、新たに記憶させる。
【0087】また、管理部135は、発信側の携帯電話
機1011の電話番号と対応付けられた高品質化データ
(最新でない高品質化データ)が、記憶部136に記憶
されている場合には、その高品質化データと、その高品
質化データに対応付けられている電話番号および更新情
報に代えて、ステップS17で得た最新の高品質化デー
タ、着呼時に受信した発信側の携帯電話機1011の電
話番号、および更新情報を、記憶部136に記憶させる
(上書きする)。
【0088】そして、ステップS19に進み、管理部1
35は、送信部113の送信制御部124を制御するこ
とにより、音声通話の準備が完了したことを表す準備完
了通知を、送信データとして送信させ、ステップS20
に進む。
【0089】ステップS20では、受信制御部131
は、そこに供給される受信データに含まれる符号化音声
データを復号部132に出力する、音声通話が可能な状
態となって、高品質化データ更新処理を終了する。
【0090】次に、図8は、高品質化データ送信処理の
第2実施の形態を示すフローチャートである。
【0091】図6における場合と同様に、発信元である
携帯電話機1011では、ユーザが、操作部115(図
2)を操作して、着信側としての携帯電話機1012
電話番号を入力すると、送信部113において、高品質
化データ送信処理が開始される。
【0092】即ち、高品質化データ送信処理では、まず
最初に、ステップS31において、送信部113(図
3)の送信制御部124が、操作部115が操作される
ことにより入力された携帯電話機1012の電話番号
を、送信データとして出力することにより、携帯電話機
1012の呼び出しが行われる。
【0093】そして、携帯電話機1012のユーザが、
携帯電話機1011からの呼び出しに応じて、操作部1
15を操作することにより、携帯電話機1012をオフ
フック状態にすると、ステップS32に進み、送信制御
部124は、着信側の携帯電話機1012との間の通信
リンクを確立し、ステップS13に進む。
【0094】ステップS33では、管理部127は、記
憶部126から最新の高品質化データを読み出し、送信
制御部124に供給する。さらに、ステップS33で
は、送信制御部124が、管理部127からの最新の高
品質化データを選択し、送信データとして送信する。な
お、高品質化データは、上述したように、その高品質化
データが学習によって得られた日時を表す更新情報とと
もに送信される。
【0095】その後、ステップS33からS34に進
み、管理部127は、図6のステップS6における場合
と同様に、準備完了通知が、着信側の携帯電話機101
2から送信されてきたかどうかを判定し、準備完了通知
が送信されてきていないと判定した場合、ステップS3
4に戻り、準備完了通知が送信されてくるまで待つ。
【0096】そして、ステップS34において、準備完
了通知が送信されてきたと判定された場合、ステップS
35に進み、送信制御部124は、図6のステップS7
における場合と同様に、音声通話が可能な状態となっ
て、高品質化データ送信処理を終了する。
【0097】次に、図9のフローチャートを参照して、
発信側の携帯電話機1011で図8の高品質化データ送
信処理が行われる場合の、着信側の携帯電話機1012
による高品質化データ更新処理について説明する。
【0098】着信側の携帯電話機1012では、図7に
おける場合と同様に、着呼があると、受信部114(図
4)において、高品質化データ更新処理が開始され、ま
ず最初に、ステップS41において、受信制御部131
が、ユーザが操作部115を操作することによりオフフ
ック状態としたかどうかを判定し、オフフック状態とさ
れていないと判定した場合、ステップS41に戻る。
【0099】また、ステップS41において、オフフッ
ク状態とされたと判定された場合、ステップS42に進
み、図7のステップS12における場合と同様に、通信
リンクが確立され、ステップS43に進む。ステップS
43では、受信制御部131は、発信側の携帯電話機1
011から送信されてくる最新の高品質化データを含む
受信データを受信し、管理部135に供給する。
【0100】即ち、図8の高品質化データ送信処理で
は、上述したように、ステップS33において、携帯電
話機1011が、最新の高品質化データを、更新情報と
ともに送信してくるので、ステップS43では、その高
品質化データと更新情報が受信される。
【0101】その後、ステップS44に進み、管理部1
35は、図7のステップS14における場合と同様にし
て、発信側の携帯電話機1011から受信した更新情報
を参照し、記憶部136に、発信側の携帯電話機101
1のユーザについての最新の高品質化データが記憶され
ているかどうかを判定する。
【0102】ステップS44において、記憶部136
に、発信側の携帯電話機1011のユーザについての最
新の高品質化データが記憶されていると判定された場
合、ステップS45に進み、管理部135は、ステップ
S43で受信した高品質化データと更新情報を破棄し、
ステップS47に進む。
【0103】また、ステップS44において、記憶部1
36に、発信側の携帯電話機101 1のユーザについて
の最新の高品質化データが記憶されていないと判定され
た場合、ステップS46に進み、管理部135は、図7
のステップS18における場合と同様に、ステップS4
3で得た最新の高品質化データを、着呼時に受信した発
信側の携帯電話機1011の電話番号、さらには、その
高品質化データとともに送信されてきた更新情報と対応
付けて、記憶部136に記憶させることにより、記憶部
136の記憶内容を更新する。
【0104】そして、ステップS47に進み、管理部1
35は、送信部113の送信制御部124を制御するこ
とにより、音声通話の準備が完了したことを表す準備完
了通知を、送信データとして送信させ、ステップS48
に進む。
【0105】ステップS48では、受信制御部131
は、そこに供給される受信データに含まれる符号化音声
データを復号部132に出力する、音声通話が可能な状
態となって、高品質化データ更新処理を終了する。
【0106】図9の高品質化データ更新処理によれば、
着信側の携帯電話機1012において、発信側の携帯電
話機1011のユーザについての最新の高品質化データ
が記憶されていない限り、必ず、記憶部136の記憶内
容が更新されることになる。
【0107】次に、図10は、高品質化データ送信処理
の第3実施の形態を示すフローチャートである。
【0108】発信元である携帯電話機1011では、ユ
ーザが、操作部115(図2)を操作して、着信側とし
ての携帯電話機1012の電話番号を入力すると、送信
部113(図3)において、高品質化データ送信処理が
開始され、まず最初に、ステップS51において、管理
部127は、操作部115が操作されることにより入力
された電話番号に対応する携帯電話機1012への高品
質化データの送信履歴を検索する。
【0109】即ち、図10の実施の形態では、管理部1
27は、後述するステップS58において、高品質化デ
ータを、着信側へ送信した場合、その高品質化データの
送信履歴として、着信側の電話番号と、送信した高品質
化データの更新情報を、その内蔵するメモリ(図示せ
ず)に記憶しておくようになっており、ステップS52
では、そのような送信履歴の中から、操作部115が操
作されることにより入力された着信側の電話番号が記述
されているものが検索される。
【0110】そして、ステップS52に進み、管理部1
27は、ステップS51での検索結果に基づき、着信側
に対して、最新の高品質化データが、既に送信されてい
るかどうかを判定する。
【0111】ステップS52において、最新の高品質化
データが、着信側に対して送信されていないと判定され
た場合、即ち、送信履歴の中に、着信側の電話番号が記
述されたものがなかったか、または、そのような送信履
歴があっても、その送信履歴に記述されている更新情報
が、最新の高品質化データの更新情報と一致しない場
合、ステップS53に進み、管理部127は、最新の高
品質化データを送信すべきであるかどうかを表す転送フ
ラグをオン状態にして、ステップS55に進む。
【0112】また、ステップS52において、最新の高
品質化データが、着信側に対して、既に送信されている
と判定された場合、即ち、送信履歴の中に、着信側の電
話番号が記述されたものがあり、その送信履歴に記述さ
れている更新情報が、最新の更新情報と一致する場合、
ステップS54に進み、管理部127は、転送フラグを
オフ状態にして、ステップS55に進む。
【0113】ステップS55では、送信制御部124
が、操作部115が操作されることにより入力された着
信側である携帯電話機1012の電話番号を、送信デー
タとして出力することにより、携帯電話機1012の呼
び出しが行われる。
【0114】そして、携帯電話機1012のユーザが、
携帯電話機1011からの呼び出しに応じて、操作部1
15を操作することにより、携帯電話機1012をオフ
フック状態にすると、ステップS56に進み、送信制御
部124は、着信側の携帯電話機1012との間の通信
リンクを確立し、ステップS57に進む。
【0115】ステップS57では、管理部127は、転
送フラグがオン状態になっているかどうかを判定し、オ
ン状態になっていないと判定した場合、即ち、転送フラ
グがオフ状態になっている場合、ステップS58をスキ
ップして、ステップS59に進む。
【0116】また、ステップS57において、転送フラ
グがオン状態になっていると判定された場合、ステップ
S58に進み、管理部127は、記憶部126から最新
の高品質化データと更新情報を読み出し、送信制御部1
24に供給する。さらに、ステップS58では、送信制
御部124が、管理部127からの最新の高品質化デー
タと更新情報を選択し、送信データとして送信する。さ
らに、ステップS58では、管理部127は、最新の高
品質化データを送信した携帯電話機1012の電話番号
(着信側の電話番号)と、その更新情報を、送信履歴と
して記憶し、ステップS59に進む。
【0117】ステップS59では、管理部127は、図
6のステップS6における場合と同様に、準備完了通知
が、着信側の携帯電話機1012から送信されてきたか
どうかを判定し、送信されてきていないと判定した場
合、ステップS59に戻り、準備完了通知が送信されて
くるまで待つ。
【0118】そして、ステップS59において、準備完
了通知が送信されてきたと判定された場合、ステップS
60に進み、送信制御部124は、音声通話が可能な状
態となって、高品質化データ送信処理を終了する。
【0119】次に、図11のフローチャートを参照し
て、発信側の携帯電話機1011で図10の高品質化デ
ータ送信処理が行われる場合の、着信側の携帯電話機1
012による高品質化データ更新処理について説明す
る。
【0120】着信側の携帯電話機1012では、例え
ば、着呼があると、受信部114(図4)において、高
品質化データ更新処理が開始される。
【0121】即ち、高品質化データ更新処理では、まず
最初に、ステップS71において、受信制御部131
が、ユーザが操作部115を操作することによりオフフ
ック状態とされたかどうかを判定し、オフフック状態と
されていないと判定した場合、ステップS71に戻る。
【0122】また、ステップS71において、オフフッ
ク状態とされたと判定された場合、ステップS72に進
み、受信制御部131は、発信側の携帯電話機1011
との通信リンクを確立し、ステップS73に進む。
【0123】ステップS73では、受信制御部131
が、高品質化データが送信されてきたかどうかを判定
し、送信されてこなかったと判定した場合、ステップS
74およびS75をスキップして、ステップS76に進
む。
【0124】また、ステップS73において、高品質化
データが送信されてきたと判定された場合、即ち、図1
0のステップS58において、発信側の携帯電話機10
1から、最新の高品質化データおよび更新情報が送信
された場合、ステップS74に進み、受信制御部131
は、その最新の高品質化データおよび更新情報を含む受
信データを受信し、管理部135に供給する。
【0125】管理部135は、ステップS75におい
て、図7のステップS18における場合と同様に、ステ
ップS74で得た最新の高品質化データを、着呼時に受
信した発信側の携帯電話機1011の電話番号、さらに
は、その高品質化データとともに送信されてきた更新情
報と対応付けて、記憶部136に記憶させることによ
り、記憶部136の記憶内容を更新する。
【0126】そして、ステップS76に進み、管理部1
35は、送信部113の送信制御部124を制御するこ
とにより、音声通話の準備が完了したことを表す準備完
了通知を、送信データとして送信させ、ステップS77
に進む。
【0127】ステップS77では、受信制御部131
は、音声通話が可能な状態となって、高品質化データ更
新処理を終了する。
【0128】次に、図6乃至図11で説明した高品質化
データ送信処理または高品質化データ更新処理は、発呼
時または着呼時に行われるが、高品質化データ送信処理
または高品質化データ更新処理は、その他、任意のタイ
ミングで行うことも可能である。
【0129】そこで、図12は、発信側としての携帯電
話機1011において、例えば、最新の高品質化データ
が学習により得られた後に、送信部113(図3)で行
われる高品質化データ送信処理を示すフローチャートで
ある。
【0130】まず最初に、ステップS81において、管
理部127は、電子メールのメッセージとして、記憶部
126に記憶された最新の高品質化データとその更新情
報、および自身の電話番号を配置し、ステップS82に
進む。
【0131】ステップS82では、管理部127は、最
新の高品質化データ、その更新情報、自身の電話番号を
メッセージとして配置した電子メール(以下、適宜、高
品質化データ送信用電子メールという)のサブジェクト
(件名)として、その電子メールが、最新の高品質化デ
ータを含むものであることを表すものを配置する。即
ち、管理部127は、例えば、「更新通知」等を、高品
質化データ送信用電子メールのサブジェクトに配置す
る。
【0132】そして、ステップS83に進み、管理部1
27は、高品質化データ送信用電子メールに、その宛先
となるメールアドレスを設定する。ここで、高品質化デ
ータ送信用電子メールの宛先となるメールアドレスとし
ては、例えば、過去に電子メールのやりとりをしたこと
がある相手のメールアドレスを記憶しておき、そのメー
ルアドレスすべて、あるいは、そのメールアドレスのう
ちのユーザが指定したもの等を配置することが可能であ
る。
【0133】その後、ステップS84に進み、管理部1
27は、高品質化データ送信用電子メールを、送信制御
部124に供給し、送信データとして送信させ、高品質
化データ送信処理を終了する。
【0134】以上のようにして送信された高品質化デー
タ送信用電子メールは、所定のサーバを経由して、高品
質化データ送信用電子メールの宛先に配置されたメール
アドレスの端末で受信されることになる。
【0135】次に、図13のフローチャートを参照し
て、発信側の携帯電話機1011で図12の高品質化デ
ータ送信処理が行われる場合の、着信側の携帯電話機1
012による高品質化データ更新処理について説明す
る。
【0136】着信側の携帯電話機1012では、例え
ば、任意のタイミングや、ユーザからの指示に応じて、
所定のメールサーバに対して、電子メールの受信が要求
され、この要求が行われると、受信部114(図4)に
おいて、高品質化データ更新処理が開始される。
【0137】即ち、まず最初に、ステップS91におい
て、上述の電子メールの受信の要求に応じてメールサー
バから送信されてくる電子メールが、受信データとし
て、受信制御部131で受信され、管理部135に供給
される。
【0138】管理部135は、ステップS92におい
て、受信制御部131から供給された電子メールのサブ
ジェクトが、最新の高品質化データを含むものであるこ
とを表す「更新通知」であるかどうかを判定し、「更新
通知」でないと判定した場合、即ち、電子メールが、高
品質化データ送信用電子メールではない場合、高品質化
データ更新処理を終了する。
【0139】また、ステップS92において、電子メー
ルのサブジェクトが、「更新通知」であると判定された
場合、即ち、電子メールが、高品質化データ送信用電子
メールである場合、ステップS93に進み、管理部13
5は、その高品質化データ送信用電子メールのメッセー
ジとして配置されている最新の高品質化データ、更新情
報、および発信側の電話番号を取得し、ステップS94
に進む。
【0140】ステップS94では、管理部135は、図
7のステップS14における場合と同様にして、高品質
化データ送信用電子メールから取得した更新情報および
発信側の電話番号を参照し、記憶部136に、発信側の
携帯電話機1011のユーザについての最新の高品質化
データが記憶されているかどうかを判定する。
【0141】ステップS94において、記憶部136
に、発信側の携帯電話機1011のユーザについての最
新の高品質化データが記憶されていると判定された場
合、ステップS95に進み、管理部135は、ステップ
S93で取得した高品質化データ、更新情報、および電
話番号を破棄し、高品質化データ更新処理を終了する。
【0142】また、ステップS94において、記憶部1
36に、発信側の携帯電話機101 1のユーザについて
の最新の高品質化データが記憶されていないと判定され
た場合、ステップS96に進み、管理部135は、図7
のステップS18における場合と同様に、ステップS9
3で取得した高品質化データ、更新情報、および発信側
の携帯電話機1011の電話番号を、記憶部136に記
憶させることにより、記憶部136の記憶内容を更新
し、高品質化データ更新処理を終了する。
【0143】次に、図14は、図3の送信部113にお
ける学習部125の構成例を示している。
【0144】図14の実施の形態においては、学習部1
25は、本件出願人が先に提案したクラス分類適応処理
に用いられるタップ係数を、高品質化データとして学習
するようになっている。
【0145】クラス分類適応処理は、クラス分類処理と
適応処理とからなり、クラス分類処理によって、データ
が、その性質に基づいてクラス分けされ、各クラスごと
に適応処理が施される。
【0146】ここで、適応処理について、低音質の音声
(以下、適宜、低音質音声という)を、高音質の音声
(以下、適宜、高音質音声という)に変換する場合を例
に説明する。
【0147】この場合、適応処理では、低音質音声を構
成する音声サンプル(以下、適宜、低音質音声サンプル
という)と、所定のタップ係数との線形結合により、そ
の低音質音声の音質を向上させた高音質音声の音声サン
プルの予測値を求めることで、その低音質音声の音質を
高くした音声が得られる。
【0148】具体的には、例えば、いま、ある高音質音
声データを教師データとするとともに、その高音質音声
の音質を劣化させた低音質音声データを生徒データとし
て、高音質音声を構成する音声サンプル(以下、適宜、
高音質音声サンプルという)yの予測値E[y]を、幾
つかの低音質音声サンプル(低音質音声を構成する音声
サンプル)x1,x2,・・・の集合と、所定のタップ係
数w1,w2,・・・の線形結合により規定される線形1
次結合モデルにより求めることを考える。この場合、予
測値E[y]は、次式で表すことができる。
【0149】 E[y]=w11+w22+・・・ ・・・(1)
【0150】式(1)を一般化するために、タップ係数
jの集合でなる行列W、生徒データxijの集合でなる
行列X、および予測値E[yj]の集合でなる行列Y’
を、
【数1】 で定義すると、次のような観測方程式が成立する。
【0151】 XW=Y’ ・・・(2) ここで、行列Xの成分xijは、i件目の生徒データの集
合(i件目の教師データyiの予測に用いる生徒データ
の集合)の中のj番目の生徒データを意味し、行列Wの
成分wjは、生徒データの集合の中のj番目の生徒デー
タとの積が演算されるタップ係数を表す。また、y
iは、i件目の教師データを表し、従って、E[yi
は、i件目の教師データの予測値を表す。なお、式
(1)の左辺におけるyは、行列Yの成分yiのサフィ
ックスiを省略したものであり、また、式(1)の右辺
におけるx1,x2,・・・も、行列Xの成分xijのサフ
ィックスiを省略したものである。
【0152】式(2)の観測方程式に最小自乗法を適用
して、高音質音声サンプルyに近い予測値E[y]を求
めることを考える。この場合、教師データとなる高音質
音声サンプルの真値yの集合でなる行列Y、および高音
質音声サンプルyの予測値E[y]の残差(真値yに対
する誤差)eの集合でなる行列Eを、
【数2】 で定義すると、式(2)から、次のような残差方程式が
成立する。
【0153】 XW=Y+E ・・・(3)
【0154】この場合、高音質音声サンプルyに近い予
測値E[y]を求めるためのタップ係数wjは、自乗誤
【数3】 を最小にすることで求めることができる。
【0155】従って、上述の自乗誤差をタップ係数wj
で微分したものが0になる場合、即ち、次式を満たすタ
ップ係数wjが、高音質音声サンプルyに近い予測値E
[y]を求めるため最適値ということになる。
【0156】
【数4】 ・・・(4)
【0157】そこで、まず、式(3)を、タップ係数w
jで微分することにより、次式が成立する。
【0158】
【数5】 ・・・(5)
【0159】式(4)および(5)より、式(6)が得
られる。
【0160】
【数6】 ・・・(6)
【0161】さらに、式(3)の残差方程式における生
徒データxij、タップ係数wj、教師データyi、および
残差eiの関係を考慮すると、式(6)から、次のよう
な正規方程式を得ることができる。
【0162】
【数7】 ・・・(7)
【0163】なお、式(7)に示した正規方程式は、行
列(共分散行列)Aおよびベクトルvを、
【数8】 で定義するとともに、ベクトルWを、数1で示したよう
に定義すると、式 AW=v ・・・(8) で表すことができる。
【0164】式(7)における各正規方程式は、生徒デ
ータxijおよび教師データyiのセットを、ある程度の
数だけ用意することで、求めるべきタップ係数wjの数
Jと同じ数だけたてることができ、従って、式(8)
を、ベクトルWについて解くことで(但し、式(8)を
解くには、式(8)における行列Aが正則である必要が
ある)、最適なタップ係数wjを求めることができる。
なお、式(8)を解くにあたっては、例えば、掃き出し
法(Gauss-Jordanの消去法)などを用いることが可能で
ある。
【0165】以上のように、生徒データと教師データを
用いて、最適なタップ係数wjを求める学習をしてお
き、さらに、そのタップ係数wjを用い、式(1)によ
り、教師データyに近い予測値E[y]を求めるのが適
応処理である。
【0166】なお、適応処理は、低音質音声には含まれ
ていないが、高音質音声に含まれる成分が再現される点
で、単なる補間とは異なる。即ち、適応処理では、式
(1)だけを見る限りは、いわゆる補間フィルタを用い
ての単なる補間と同一に見えるが、その補間フィルタの
タップ係数に相当するタップ係数wが、教師データyを
用いての、いわば学習により求められるため、高音質音
声に含まれる成分を再現することができる。このことか
ら、適応処理は、いわば音声の創造作用がある処理とい
うことができる。
【0167】また、上述の場合には、高音質音声の予測
値を、線形一次予測するようにしたが、その他、予測値
は、2以上の式によって予測することも可能である。
【0168】図14の学習部125は、以上のようなク
ラス分類適応処理で用いられるタップ係数を、高品質化
データとして学習する。
【0169】即ち、バッファ141には、A/D変換部
122(図3)が出力する音声データが、学習用のデー
タとして供給されるようになっており、バッファ141
は、その音声データを、学習の教師となる教師データと
して一時記憶する。
【0170】生徒データ生成部142は、バッファ14
1に記憶された教師データとしての音声データから、学
習の生徒となる生徒データを生成する。
【0171】即ち、生徒データ生成部142は、エンコ
ーダ142Eとデコーダ142Dとから構成されてい
る。エンコーダ142Eは、送信部113(図3)の符
号化部123と同様に構成されており、バッファ141
に記憶された教師データを、符号化部123と同様にし
て符号化して、符号化音声データを出力する。デコーダ
142Dは、後述する図16のデコーダ161と同様に
構成されており、符号化音声データを、符号化部123
における符号化方式に対応する復号方式で復号し、その
結果得られる復号音声データを、生徒データとして出力
する。
【0172】なお、ここでは、教師データを、符号化部
123における場合と同様に、符号化音声データに符号
化し、さらに、その符号化音声データを復号することに
よって、生徒データを生成するようにしたが、その他、
生徒データは、例えば、教師データとしての音声データ
を、ローパスフィルタ等によってフィルタリングするこ
とで、その音質を劣化させることにより生成すること等
が可能である。
【0173】また、生徒データ生成部142を構成する
エンコーダ142Eとしては、符号化部123を用いる
ことが可能であり、さらに、デコーダ142Dとして
は、後述する図16のデコーダ161を用いることが可
能である。
【0174】生徒データメモリ143は、生徒データ生
成部142のデコーダ142Dが出力する生徒データを
一時記憶する。
【0175】予測タップ生成部144は、バッファ14
1に記憶された教師データの音声サンプルを、順次、注
目データとし、さらに、その注目データを予測するのに
用いる生徒データとしての幾つかの音声サンプルを、生
徒データメモリ143から読み出すことにより、予測タ
ップ(注目データの予測値を求めるためのタップ)を生
成する。この予測タップは、予測タップ生成部144か
ら足し込み部147に供給される。
【0176】クラスタップ生成部145は、注目データ
をクラス分けするクラス分類に用いる生徒データとして
の幾つかの音声サンプルを、生徒データメモリ143か
ら読み出すことにより、クラスタップ(クラス分類に用
いるタップ)を生成する。このクラスタップは、クラス
タップ生成部145からクラス分類部146に供給され
る。
【0177】ここで、予測タップやクラスタップを構成
する音声サンプルとしては、例えば、注目データとなっ
ている教師データの音声サンプルに対応する生徒データ
の音声サンプルに対して時間的に近い位置にある音声サ
ンプルを用いることができる。
【0178】また、予測タップとクラスタップを構成す
る音声サンプルとしては、同一の音声サンプルを用いる
こともできるし、異なる音声サンプルを用いることも可
能である。
【0179】クラス分類部146は、クラスタップ生成
部145からのクラスタップに基づき、注目データをク
ラス分類し、その結果得られるクラスに対応するクラス
コードを、足し込み部147に出力する。
【0180】ここで、クラス分類を行う方法としては、
例えば、ADRC(Adaptive Dynamic Range Coding)等を採
用することができる。
【0181】ADRCを用いる方法では、クラスタップを構
成する音声サンプルが、ADRC処理され、その結果得られ
るADRCコードにしたがって、注目データのクラスが決定
される。
【0182】なお、KビットADRCにおいては、例えば、
クラスタップを構成する音声サンプルの最大値MAXと最
小値MINが検出され、DR=MAX-MINを、集合の局所的なダ
イナミックレンジとし、このダイナミックレンジDRに基
づいて、クラスタップを構成する音声サンプルがKビッ
トに再量子化される。即ち、クラスタップを構成する各
音声サンプルから、最小値MINが減算され、その減算値
がDR/2Kで除算(量子化)される。そして、以上のよう
にして得られる、クラスタップを構成するKビットの各
音声サンプルを、所定の順番で並べたビット列が、ADRC
コードとして出力される。従って、クラスタップが、例
えば、1ビットADRC処理された場合には、そのクラスタ
ップを構成する各音声サンプルは、最小値MINが減算さ
れた後に、最大値MAXと最小値MINとの平均値で除算さ
れ、これにより、各音声サンプルが1ビットとされる
(2値化される)。そして、その1ビットの音声サンプ
ルを所定の順番で並べたビット列が、ADRCコードとして
出力される。
【0183】なお、クラス分類部146には、例えば、
クラスタップを構成する音声サンプルのレベル分布のパ
ターンを、そのままクラスコードとして出力させること
も可能であるが、この場合、クラスタップが、N個の音
声サンプルで構成され、各音声サンプルに、Kビットが
割り当てられているとすると、クラス分類部146が出
力するクラスコードの場合の数は、(2NK通りとな
り、音声サンプルのビット数Kに指数的に比例した膨大
な数となる。
【0184】従って、クラス分類部146においては、
クラスタップの情報量を、上述のADRC処理や、あるいは
ベクトル量子化等によって圧縮してから、クラス分類を
行うのが好ましい。
【0185】足し込み部147は、バッファ141か
ら、注目データとなっている教師データの音声サンプル
を読み出し、予測タップ生成部144からの予測タップ
を構成する生徒データ、および注目データとしての教師
データを対象とした足し込みを、初期コンポーネント記
憶部148およびユーザ用コンポーネント記憶部149
の記憶内容を必要に応じて用いながら、クラス分類部1
46から供給されるクラスごとに行う。
【0186】即ち、足し込み部147は、基本的には、
クラス分類部146から供給されるクラスコードに対応
するクラスごとに、予測タップ(生徒データ)を用い、
式(8)の行列Aにおける各コンポーネントとなってい
る、生徒データどうしの乗算(xinim)と、サメーシ
ョン(Σ)に相当する演算を行う。
【0187】さらに、足し込み部147は、やはり、ク
ラス分類部146から供給されるクラスコードに対応す
るクラスごとに、予測タップ(生徒データ)および注目
データ(教師データ)を用い、式(8)のベクトルvに
おける各コンポーネントとなっている、生徒データと教
師データの乗算(xini)と、サメーション(Σ)に
相当する演算を行う。
【0188】一方、初期コンポーネント記憶部148
は、例えば、ROMで構成され、あらかじめ用意された
不特定多数の話者の音声データを学習用のデータとして
学習を行うことにより得られた、式(8)における行列
Aのコンポーネントと、ベクトルvのコンポーネント
を、クラスごとに記憶している。
【0189】また、ユーザ用コンポーネント記憶部14
9は、例えば、EEPROMで構成され、足し込み部1
47において前回の学習で求められた式(8)における
行列Aのコンポーネントと、ベクトルvのコンポーネン
トを、クラスごとに記憶する。
【0190】足し込み部147は、新たに入力された音
声データを用いて学習を行う場合、ユーザ用コンポーネ
ント記憶部149に記憶された、前回の学習で求められ
た式(8)における行列Aのコンポーネントと、ベクト
ルvのコンポーネントを読み出し、その行列Aまたはベ
クトルvのコンポーネントに対して、新たに入力された
音声データから得られる教師データyiおよび生徒デー
タxin(xim)を用いて計算される、対応するコンポーネン
トxinimまたはxiniを足し込むことにより(行列
A、ベクトルvにおけるサメーションで表される加算を
行うことにより)、各クラスについて、式(8)に示し
た正規方程式をたてる。
【0191】従って、足し込み部147では、新たに入
力された音声データだけではなく、過去の学習に用いら
れた音声データにも基づいて、式(8)の正規方程式が
たてられる。
【0192】なお、学習部125で、初めて学習が行わ
れる場合や、ユーザ用コンポーネント記憶部149がク
リアされた直後等に学習が行われる場合おいては、ユー
ザ用コンポーネント記憶部149には、前回の学習で求
められた行列Aとベクトルvのコンポーネントは記憶さ
れていないため、式(8)の正規方程式は、ユーザから
入力された音声データだけを用いてたてられることにな
る。
【0193】この場合、入力される音声データのサンプ
ル数が十分でないこと等に起因して、タップ係数を求め
るのに必要な数の正規方程式が得られないクラスが生じ
ることがあり得る。
【0194】そこで、初期コンポーネント記憶部148
は、あらかじめ用意された不特定十分な数の話者の音声
データを学習用のデータとして学習を行うことにより得
られた、式(8)における行列Aのコンポーネントと、
ベクトルvのコンポーネントを、クラスごとに記憶して
おり、学習部125は、この初期コンポーネント記憶部
148に記憶された行列Aおよびベクトルvのコンポー
ネントと、入力された音声データから得られる行列Aお
よびベクトルvのコンポーネントとを必要に応じて用い
て、式(8)の正規方程式をたてることで、タップ係数
を求めるのに必要な数の正規方程式が得られないクラス
が生じることを防止するようになっている。
【0195】足し込み部147は、新たに入力された音
声データから得られた行列Aおよびベクトルvのコンポ
ーネントと、ユーザ用コンポーネント記憶部149(ま
たは初期コンポーネント記憶部148)に記憶された行
列Aおよびベクトルvのコンポーネントと用いて、新た
に、クラスごとの行列Aおよびベクトルvのコンポーネ
ントを求めると、それらのコンポーネントを、ユーザ用
コンポーネント記憶部149に供給し、上書きする形で
記憶させる。
【0196】さらに、足し込み部147は、新たに求め
たクラスごとの行列Aおよびベクトルvのコンポーネン
トで構成される式(8)の正規方程式を、タップ係数決
定部150に供給する。
【0197】その後、タップ係数決定部150は、足し
込み部147から供給されるクラスごとの正規方程式を
解くことにより、クラスごとに、タップ係数を求め、こ
のクラスごとのタップ係数を、高品質化データとして、
その更新情報とともに、記憶部126に供給し、上書き
する形で記憶させる。
【0198】次に、図15のフローチャートを参照し
て、図14の学習部125で行われる、高品質化データ
としてのタップ係数の学習処理について説明する。
【0199】例えば、ユーザが通話時に行った発話、あ
るいは任意のタイミングで行った発話による音声データ
が、A/D変換部122(図3)からバッファ141に
供給され、バッファ141は、そこに供給される音声デ
ータを記憶する。
【0200】そして、例えば、ユーザが通話を終了する
と、あるいは、発話を開始してから所定時間が経過する
と、学習部125は、通話中に、バッファ141に記憶
された音声データ、あるいは、一連の発話を開始してか
ら終了するまでに、バッファ141に記憶された音声デ
ータを、新たに入力された音声データとして、学習処理
を開始する。
【0201】即ち、まず最初に、生徒データ生成部14
2は、ステップS101において、バッファ141に記
憶された音声データを教師データとして、その教師デー
タから生徒データを生成し、生徒データメモリ143に
供給して記憶させ、ステップS102に進む。
【0202】ステップS102では、予測タップ生成部
144は、バッファ141に記憶された教師データとし
ての音声サンプルのうち、まだ注目データとしていない
ものの1つを注目データとして、その注目データについ
て、生徒データメモリ143に記憶された生徒データと
しての音声サンプルの幾つかを読み出すことにより、予
測タップを生成して、足し込み部147に供給する。
【0203】さらに、ステップS102では、クラスタ
ップ生成部145が、予測タップ生成部144における
場合と同様にして、注目データについて、クラスタップ
を生成し、クラス分類部146に供給する。
【0204】ステップS102の処理後は、ステップS
103に進み、クラス分類部146が、クラスタップ生
成部145からのクラスタップに基づいて、クラス分類
を行い、その結果得られるクラスコードを、足し込み部
147に供給する。
【0205】そして、ステップS104に進み、足し込
み部147は、バッファ141から注目データを読み出
し、その注目データと、予測タップ生成部144からの
予測タップを用いて、行列Aとベクトルvのコンポーネ
ントを計算する。さらに、足し込み部147は、ユーザ
用コンポーネント記憶部149に記憶された行列Aとベ
クトルvのコンポーネントのうち、クラス分類部146
からのクラスコードに対応するものに対して、注目デー
タと予測タップから求められた行列Aとベクトルvのコ
ンポーネントを足し込み、ステップS105に進む。
【0206】ステップS105では、予測タップ生成部
144が、バッファ141に、まだ、注目データとして
いない教師データが存在するかどうかを判定し、存在す
ると判定した場合、ステップS102に戻り、まだ、注
目データとされていない教師データを、新たに注目デー
タとして、以下、同様の処理が繰り返される。
【0207】また、ステップS105において、バッフ
ァ141に、注目データとしていない教師データが存在
しないと判定された場合、足し込み部147は、ユーザ
用コンポーネント記憶部149に記憶されたクラスごと
の行列Aおよびベクトルvのコンポーネントで構成され
る式(8)の正規方程式を、タップ係数決定部150に
供給し、ステップS106に進む。
【0208】ステップS106では、タップ係数決定部
150は、足し込み部147から供給される各クラスご
との正規方程式を解くことにより、各クラスごとに、タ
ップ係数を求める。さらに、ステップS106では、タ
ップ係数決定部150は、各クラスごとのタップ係数
を、更新情報とともに、記憶部126に供給し、上書き
する形で記憶させ、学習処理を終了する。
【0209】なお、ここでは、学習処理をリアルタイム
で行わないようにしたが、ハードウェアが十分な性能を
有する場合には、リアルタイムで行っても良い。
【0210】以上のように、学習部125では、新たに
入力された音声データと、過去の学習に用いられた音声
データに基づく学習処理が、通話時その他の任意のタイ
ミングで行われ、これにより、ユーザが発話を行うほ
ど、符号化音声データを、そのユーザの音声に近い音声
に復号することのできるタップ係数が求められる。従っ
て、通話相手側において、そのようなタップ係数を用い
て、符号化音声データの復号を行うことにより、ユーザ
の音声の特性に適した処理が施され、十分に音質を改善
した復号音声データを得ることができ、ユーザが携帯電
話機101を使い込むことにより、通話相手側におい
て、より品質の良い音声が出力されることになる。
【0211】ここで、送信部113(図3)の学習部1
25が図14に示したように構成される場合には、高品
質化データはタップ係数であるから、受信部114(図
4)の記憶部136には、タップ係数が記憶される。な
お、この場合、受信部114のデフォルトデータメモリ
137には、例えば、図14の初期コンポーネント記憶
部148に記憶されたコンポーネントによる正規方程式
を解くことによって得られるクラスごとのタップ係数
が、デフォルトデータとして記憶される。
【0212】次に、図16は、送信部113(図3)の
学習部125が図14に示したように構成される場合
の、受信部114(図4)の復号部132の構成例を示
している。
【0213】デコーダ161には、受信制御部131
(図4)が出力する符号化音声データが供給されるよう
になっており、デコーダ161は、その符号化音声デー
タを、送信部113(図3)の符号化部123における
符号化方式に対応する復号方式で復号し、その結果得ら
れる復号音声データを、バッファ162に出力する。
【0214】バッファ162は、デコーダ161が出力
する復号音声データを一時記憶する。
【0215】予測タップ生成部163は、復号音声デー
タの音質を向上させた音質向上データを、順次、注目デ
ータとして、その注目データの予測値を、式(1)の線
形一次予測演算により求めるのに用いる予測タップを、
バッファ162に記憶された復号音声データのうちの幾
つかの音声サンプルによって構成(生成)し、予測部1
67に供給する。なお、予測タップ生成部163は、図
14の学習部125における予測タップ生成部144が
生成するのと同一の予測タップを生成する。
【0216】クラスタップ生成部164は、バッファ1
62に記憶された復号音声データのうちの幾つかの音声
サンプルによって、注目データについて、クラスタップ
を構成(生成)し、クラス分類部165に供給する。な
お、クラスタップ生成部164は、図14の学習部12
5におけるクラスタップ生成部145が生成するのと同
一のクラスタップを生成する。
【0217】クラス分類部165は、クラスタップ生成
部164からのクラスタップを用い、図14の学習部1
25におけるクラス分類部146と同様のクラス分類を
行い、その結果得られるクラスコードを、係数メモリ1
66に供給する。
【0218】係数メモリ166は、管理部135から供
給される高品質化データとしてのクラスごとのタップ係
数を、そのクラスに対応するアドレスに記憶する。さら
に、係数メモリ166は、クラス分類部165から供給
されるクラスコードに対応するアドレスに記憶されてい
るタップ係数を、予測部167に供給する。
【0219】予測部167は、予測タップ生成部163
が出力する予測タップと、係数メモリ166が出力する
タップ係数とを取得し、その予測タップとタップ係数と
を用いて、式(1)に示した線形予測演算を行う。これ
により、予測部167は、注目データとしての音質向上
データ(の予測値)を求め、D/A変換部133(図
4)に供給する。
【0220】次に、図17のフローチャートを参照し
て、図16の復号部132の処理について説明する。
【0221】デコーダ161は、受信制御部131(図
4)が出力する符号化音声データを復号し、その結果得
られる復号音声データを、バッファ162に出力して記
憶させている。
【0222】そして、まず最初に、ステップS111に
おいて、予測タップ生成部163が、復号音声データの
音質を向上させた音質向上データのうち、例えば、時系
列順で、まだ注目データとしていない音声サンプルを、
注目データとし、その注目データについて、バッファ1
62から復号音声データのうちの幾つかの音声サンプル
を読み出すことにより、予測タップを構成して、予測部
167に供給する。
【0223】さらに、ステップS111では、クラスタ
ップ生成部164が、バッファ162に記憶された復号
音声データのうちの幾つかの音声サンプルを読み出すこ
とにより、注目データについて、クラスタップを構成
し、クラス分類部165に供給する。
【0224】クラス分類部165は、クラスタップ生成
部164からクラスタップを受信すると、ステップS1
12に進み、そのクラスタップを用いてクラス分類を行
い、その結果得られるクラスコードを、係数メモリ16
6に供給して、ステップS113に進む。
【0225】ステップS113では、係数メモリ166
は、クラス分類部165からのクラスコードに対応する
アドレスに記憶されているタップ係数を読み出し、予測
部167に供給して、ステップS114に進む。
【0226】ステップS114では、予測部167は、
係数メモリ166が出力するタップ係数を取得し、その
タップ係数と、予測タップ生成部163からの予測タッ
プとを用いて、式(1)に示した積和演算を行い、音質
向上データ(の予測値)を得る。
【0227】以上のようにして得られた音質向上データ
は、予測部167から、D/A変換部133(図4)を
介して、スピーカ134に供給され、これにより、スピ
ーカ134からは、高音質の音声が出力される。
【0228】即ち、タップ係数は、ユーザの音声を教師
とするとともに、その音声を符号化し、さらに復号した
ものを生徒として、学習を行うことにより得られたもの
であるので、デコーダ161が出力する復号音声データ
から、元のユーザの音声を、精度良く予測することを可
能とするものであり、従って、スピーカ134からは、
通信相手のユーザの音声の肉声により近い音声、即ち、
デコーダ161(図16)が出力する復号音声データの
音質を向上させたものが出力されることになる。
【0229】ステップS114の処理後は、ステップS
115に進み、まだ、注目データとして処理すべき音質
向上データがあるかどうかが判定され、あると判定され
た場合、ステップS111に戻り、以下、同様の処理が
繰り返される。また、ステップS115において、注目
データとして処理すべき音質向上データがないと判定さ
れた場合、処理を終了する。
【0230】なお、携帯電話機1011と1012との間
で通話が行われる場合、携帯電話機1012では、図5
で説明したことから、高品質化データとしてのタップ係
数として、通話相手である携帯電話機1011の電話番
号と対応付けられたもの、即ち、携帯電話機1011
所有するユーザの音声データを学習用のデータとして学
習したものが用いられる。従って、携帯電話機1011
から携帯電話機1012に対して送信されてくる音声
が、携帯電話機1011のユーザの音声であれば、携帯
電話機1012において、携帯電話機1011のユーザ用
のタップ係数を用いて復号が行われることにより、高音
質の音声が出力されることとなる。
【0231】しかしながら、携帯電話機1011から携
帯電話機1012に対して送信されてくる音声が、携帯
電話機1011のユーザの音声でない場合、即ち、携帯
電話機1011の所有者でないユーザが、携帯電話機1
011を使用している場合、携帯電話機1012では、や
はり、携帯電話機1011のユーザ用のタップ係数を用
いて復号が行われることから、その復号によって得られ
る音声は、携帯電話機1011の真のユーザ(所有者)
の音声における場合よりも、音質が向上したものにはな
らない。即ち、単純には、携帯電話機1012では、携
帯電話機1011を、そのの所有者が使用していれば、
高音質の音声が出力され、携帯電話機1011を、その
所有者以外のユーザが使用している場合には、あまり音
質の良い音声は出力されない。この点に注目すれば、携
帯電話機101によって、簡易な個人認証が可能である
ということができる。
【0232】次に、図18は、携帯電話機101が、例
えば、CELP(Code Excited Liner Prediction codin
g)方式のものである場合の、送信部113(図3)を構
成する符号化部123の構成例を示している。
【0233】A/D変換部122(図3)が出力する音
声データは、演算器3とLPC(Liner Prediction Coef
ficient)分析部4に供給される。
【0234】LPC分析部4は、A/D変換部122
(図3)からの音声データを、所定の音声サンプルを1
フレームとして、フレームごとにLPC分析し、P次の
線形予測係数α1,α2,・・・,αPを求める。そし
て、LPC分析部4は、このP次の線形予測係数α
p(p=1,2,・・・,P)を要素とするベクトル
を、音声の特徴ベクトルとして、ベクトル量子化部5に
供給する。
【0235】ベクトル量子化部5は、線形予測係数を要
素とするコードベクトルとコードとを対応付けたコード
ブックを記憶しており、そのコードブックに基づいて、
LPC分析部4からの特徴ベクトルαをベクトル量子化
し、そのベクトル量子化の結果得られるコード(以下、
適宜、Aコード(A_code)という)を、コード決定部15
に供給する。
【0236】さらに、ベクトル量子化部5は、Aコード
に対応するコードベクトルα’を構成する要素となって
いる線形予測係数α1’,α2’,・・・,αP’を、音
声合成フィルタ6に供給する。
【0237】音声合成フィルタ6は、例えば、IIR(I
nfinite Impulse Response)型のディジタルフィルタ
で、ベクトル量子化部5からの線形予測係数αp’(p
=1,2,・・・,P)をIIRフィルタのタップ係数
とするとともに、演算器14から供給される残差信号e
を入力信号として、音声合成を行う。
【0238】即ち、LPC分析部4で行われるLPC分
析は、現在時刻nの音声データ(のサンプル値)sn
およびこれに隣接する過去のP個のサンプル値sn-1
n-2,・・・,sn-Pに、式 sn+α1n-1+α2n-2+・・・+αPn-P=en ・・・(9) で示す線形1次結合が成立すると仮定し、現在時刻nの
サンプル値snの予測値(線形予測値)sn’を、過去の
P個の標本値sn-1,sn-2,・・・,sn-Pを用いて、
式 sn’=−(α1n-1+α2n-2+・・・+αPn-P) ・・・(10) によって線形予測したときに、実際のサンプル値sn
線形予測値sn’との間の自乗誤差を最小にする線形予
測係数αpを求めるものである。
【0239】ここで、式(9)において、{en}(・・
・,en-1,en,en+1,・・・)は、平均値が0で、分散
が所定値σ2の互いに無相関な確率変数である。
【0240】式(9)から、サンプル値snは、式 sn=en−(α1n-1+α2n-2+・・・+αPn-P) ・・・(11) で表すことができ、これを、Z変換すると、次式が成立
する。
【0241】 S=E/(1+α1-1+α2-2+・・・+αP-P) ・・・(12) 但し、式(12)において、SとEは、式(11)にお
けるsnとenのZ変換を、それぞれ表す。
【0242】ここで、式(9)および(10)から、e
nは、式 en=sn−sn’ ・・・(13) で表すことができ、実際のサンプル値snと線形予測値
n’との間の残差信号と呼ばれる。
【0243】従って、式(12)から、線形予測係数α
pをIIRフィルタのタップ係数とするとともに、残差
信号enをIIRフィルタの入力信号とすることによ
り、音声データsnを求めることができる。
【0244】そこで、音声合成フィルタ6は、上述した
ように、ベクトル量子化部5からの線形予測係数αp
をタップ係数とするとともに、演算器14から供給され
る残差信号eを入力信号として、式(12)を演算し、
音声データ(合成音データ)ssを求める。
【0245】なお、音声合成フィルタ6では、LPC分
析部4によるLPC分析の結果得られる線形予測係数α
pではなく、そのベクトル量子化の結果得られるコード
に対応するコードベクトルとしての線形予測係数αp
が用いられるため、音声合成フィルタ6が出力する合成
音信号は、A/D変換部122(図3)が出力する音声
データとは、基本的に同一にはならない。
【0246】音声合成フィルタ6が出力する合成音デー
タssは、演算器3に供給される。演算器3は、音声合
成フィルタ6からの合成音データssから、A/D変換
部122(図3)が出力する音声データsを減算し、そ
の減算値を、自乗誤差演算部7に供給する。自乗誤差演
算部7は、演算器3からの減算値の自乗和(第kフレー
ムのサンプル値についての自乗和)を演算し、その結果
得られる自乗誤差を、自乗誤差最小判定部8に供給す
る。
【0247】自乗誤差最小判定部8は、自乗誤差演算部
7が出力する自乗誤差に対応付けて、長期予測ラグを表
すコードとしてのLコード(L_code)、ゲインを表すコー
ドとしてのGコード(G_code)、および符号語(励起コー
ドブック)を表すコードとしてのIコード(I_code)を記
憶しており、自乗誤差演算部7が出力する自乗誤差に対
応するLコード、Gコード、およびLコードを出力す
る。Lコードは、適応コードブック記憶部9に、Gコー
ドは、ゲイン復号器10に、Iコードは、励起コードブ
ック記憶部11に、それぞれ供給される。さらに、Lコ
ード、Gコード、およびIコードは、コード決定部15
にも供給される。
【0248】適応コードブック記憶部9は、例えば7ビ
ットのLコードと、所定の遅延時間(ラグ)とを対応付
けた適応コードブックを記憶しており、演算器14から
供給される残差信号eを、自乗誤差最小判定部8から供
給されるLコードに対応付けられた遅延時間(長期予測
ラグ)だけ遅延して、演算器12に出力する。
【0249】ここで、適応コードブック記憶部9は、残
差信号eを、Lコードに対応する時間だけ遅延して出力
することから、その出力信号は、その遅延時間を周期と
する周期信号に近い信号となる。この信号は、線形予測
係数を用いた音声合成において、主として、有声音の合
成音を生成するための駆動信号となる。従って、Lコー
ドは、概念的には、音声のピッチ周期を表す。なお、CE
LPの規格によれば、レコードは、20乃至146の範囲
の整数値をとる。
【0250】ゲイン復号器10は、Gコードと、所定の
ゲインβおよびγとを対応付けたテーブルを記憶してお
り、自乗誤差最小判定部8から供給されるGコードに対
応付けられたゲインβおよびγを出力する。ゲインβと
γは、演算器12と13に、それぞれ供給される。ここ
で、ゲインβは、長期フィルタ状態出力ゲインと呼ばれ
るものであり、また、ゲインγは、励起コードブックゲ
インと呼ばれるものである。
【0251】励起コードブック記憶部11は、例えば9
ビットのIコードと、所定の励起信号とを対応付けた励
起コードブックを記憶しており、自乗誤差最小判定部8
から供給されるIコードに対応付けられた励起信号を、
演算器13に出力する。
【0252】ここで、励起コードブックに記憶されてい
る励起信号は、例えば、ホワイトノイズ等に近い信号で
あり、線形予測係数を用いた音声合成において、主とし
て、無声音の合成音を生成するための駆動信号となる。
【0253】演算器12は、適応コードブック記憶部9
の出力信号と、ゲイン復号器10が出力するゲインβと
を乗算し、その乗算値lを、演算器14に供給する。演
算器13は、励起コードブック記憶部11の出力信号
と、ゲイン復号器10が出力するゲインγとを乗算し、
その乗算値nを、演算器14に供給する。演算器14
は、演算器12からの乗算値lと、演算器13からの乗
算値nとを加算し、その加算値を、残差信号eとして、
音声合成フィルタ6と適応コードブック記憶部9に供給
する。
【0254】音声合成フィルタ6では、以上のようにし
て、演算器14から供給される残差信号eを入力信号
が、ベクトル量子化部5から供給される線形予測係数α
p’をタップ係数とするIIRフィルタでフィルタリン
グされ、その結果得られる合成音データが、演算器3に
供給される。そして、演算器3および自乗誤差演算部7
において、上述の場合と同様の処理が行われ、その結果
得られる自乗誤差が、自乗誤差最小判定部8に供給され
る。
【0255】自乗誤差最小判定部8は、自乗誤差演算部
7からの自乗誤差が最小(極小)になったかどうかを判
定する。そして、自乗誤差最小判定部8は、自乗誤差が
最小になっていないと判定した場合、上述のように、そ
の自乗誤差に対応するLコード、Gコード、およびLコ
ードを出力し、以下、同様の処理が繰り返される。
【0256】一方、自乗誤差最小判定部8は、自乗誤差
が最小になったと判定した場合、確定信号を、コード決
定部15に出力する。コード決定部15は、ベクトル量
子化部5から供給されるAコードをラッチするととも
に、自乗誤差最小判定部8から供給されるLコード、G
コード、およびIコードを順次ラッチするようになって
おり、自乗誤差最小判定部8から確定信号を受信する
と、そのときラッチしているAコード、Lコード、Gコ
ード、およびIコードを多重化し、符号化音声データと
して出力する。
【0257】以上から、符号化音声データは、復号に用
いられる情報であるAコード、Lコード、Gコード、お
よびIコードを、フレーム単位ごとに有するものとなっ
ている。
【0258】ここで、図18(後述する図19および図
20においても同様)では、各変数に、[k]が付され、
配列変数とされている。このkは、フレーム数を表す
が、明細書中では、その記述は、適宜省略する。
【0259】次に、図19は、携帯電話機101が、C
ELP方式のものである場合の、受信部114(図4)
を構成する復号部132の構成例を示している。なお、
図中、図16における場合と対応する部分については、
同一の符号を付してある。
【0260】受信制御部131(図4)が出力する符号
化音声データは、DEMUX(デマルチプレクサ)21
に供給され、DEMUX21は、符号化音声データか
ら、Lコード、Gコード、Iコード、Aコードを分離
し、それぞれを、適応コードブック記憶部22、ゲイン
復号器23、励起コードブック記憶部24、フィルタ係
数復号器25に供給する。
【0261】適応コードブック記憶部22、ゲイン復号
器23、励起コードブック記憶部24、演算器26乃至
28は、図18の適応コードブック記憶部9、ゲイン復
号器10、励起コードブック記憶部11、演算器12乃
至14とそれぞれ同様に構成されるもので、図1で説明
した場合と同様の処理が行われることにより、Lコー
ド、Gコード、およびIコードが、残差信号eに復号さ
れる。この残差信号eは、音声合成フィルタ29に対し
て、入力信号として与えられる。
【0262】フィルタ係数復号器25は、図18のベク
トル量子化部5が記憶しているのと同一のコードブック
を記憶しており、Aコードを、線形予測係数αp’に復
号し、音声合成フィルタ29に供給する。
【0263】音声合成フィルタ29は、図18の音声合
成フィルタ6と同様に構成されており、フィルタ係数復
号器25からの線形予測係数αp’をタップ係数とする
とともに、演算器28から供給される残差信号eを入力
信号として、式(12)を演算し、これにより、図18
の自乗誤差最小判定部8において自乗誤差が最小と判定
されたときの合成音データを生成し、復号音声データと
して出力する。
【0264】ここで、発信側の符号化部123から、着
信側の復号部132に対しては、図18で説明したこと
から、復号部132の音声合成フィルタ29に与えられ
る入力信号としての残差信号と線形予測係数がコード化
されて送信されてくるため、復号部132では、そのコ
ードが、残差信号と線形予測係数に復号される。しかし
ながら、この復号された残差信号や線形予測係数(以
下、適宜、それぞれを、復号残差信号または復号線形予
測係数という)には、量子化誤差等の誤差が含まれるた
め、発信側におけるユーザの音声をLPC分析して得ら
れる残差信号と線形予測係数には一致しない。
【0265】このため、復号部132の音声合成フィル
タ29が出力する合成音データである復号音声データ
は、発信側のユーザの音声データに対して、歪み等を有
する、音質の劣化したものとなる。
【0266】そこで、復号部132は、上述のクラス分
類適応処理を行うことによって、復号音声データを、歪
みのない(歪みを低減した)、発信側のユーザの音声デ
ータに近い音質向上データに変換するようになってい
る。
【0267】即ち、音声合成フィルタ29が出力する合
成音データである復号音声データは、バッファ162に
供給され、バッファ162は、その復号音声データを一
時記憶する。
【0268】そして、予測タップ生成部163は、復号
音声データの音質を向上させた音質向上データを、順
次、注目データとし、その注目データについて、バッフ
ァ162から復号音声データのうちの幾つかの音声サン
プルを読み出すことにより、予測タップを構成して、予
測部167に供給する。また、クラスタップ生成部16
4は、バッファ162に記憶された復号音声データのう
ちの幾つかの音声サンプルを読み出すことにより、注目
データについて、クラスタップを構成し、クラス分類部
165に供給する。
【0269】クラス分類部165は、クラスタップ生成
部164からクラスタップを用いてクラス分類を行い、
その結果得られるクラスコードを、係数メモリ166に
供給する。係数メモリ166は、クラス分類部165か
らのクラスコードに対応するアドレスに記憶されている
タップ係数を読み出し、予測部167に供給する。
【0270】そして、予測部167は、係数メモリ16
6が出力するタップ係数と、予測タップ生成部163か
らの予測タップとを用いて、式(1)に示した積和演算
を行い、音質向上データ(の予測値)を得る。
【0271】以上のようにして得られた音質向上データ
は、予測部167から、D/A変換部133(図4)を
介して、スピーカ134に供給され、これにより、スピ
ーカ134からは、高音質の音声が出力される。
【0272】次に、図20は、携帯電話機101が、C
ELP方式のものである場合の、送信部113(図3)
を構成する学習部125の構成例を示している。なお、
図中、図14における場合と対応する部分については、
同一の符号を付してあり、以下では、その説明は、適宜
省略する。
【0273】演算器183乃至コード決定部195は、
図18の演算器3乃至コード決定部15とそれぞれ同様
に構成される。演算器183には、A/D変換部122
(図3)が出力する音声データが、学習用のデータとし
て入力されるようになっており、従って、演算器183
乃至コード決定部195では、その学習用の音声データ
に対して、図18の符号化部123における場合と同様
の処理が施される。
【0274】そして、自乗誤差最小判定部188におい
て自乗誤差が最小になったと判定されたときの音声合成
フィルタ186が出力する合成音データが、生徒データ
として、生徒データメモリ143に供給される。
【0275】その後は、生徒データメモリ143乃至タ
ップ係数決定部150において、図14および15にお
ける場合と同様の処理が行われ、これにより、クラスご
とのタップ係数が、高品質化データとして生成される。
【0276】なお、図19または図20の実施の形態で
は、予測タップやクラスタップを、音声合成フィルタ2
9または186が出力する合成音データから構成するよ
うにしたが、予測タップやクラスタップは、図19また
は図20において点線で示すように、Iコードや、Lコ
ード、Gコード、Aコード、Aコードから得られる線形
予測係数αp、Gコードから得られるゲインβ,γ、そ
の他の、Lコード、Gコード、Iコード、またはAコー
ドから得られる情報(例えば、残差信号eや、残差信号
eを得るためのl,n、さらには、l/β,n/γな
ど)のうちの1以上を含めて構成することが可能であ
る。
【0277】次に、図21は、送信部113(図3)を
構成する符号化部123の他の構成例を示している。
【0278】図21の実施の形態においては、符号化部
123は、A/D変換部122(図3)が出力する音声
データをベクトル量子化することにより符号化するよう
になっている。
【0279】即ち、A/D変換部122(図3)が出力
する音声データは、バッファ201に供給され、バッフ
ァ201は、そこに供給される音声データを一時記憶す
る。
【0280】ベクトル化部202は、バッファ201に
記憶された音声データを時系列に読み出して、所定数の
音声サンプルを1フレームとし、各フレームの音声デー
タをベクトル化する。
【0281】ここで、ベクトル化部202では、例え
ば、1フレームの各音声サンプルを、そのまま、ベクト
ルの各コンポーネントとすることにより、音声データを
ベクトル化することも可能であるし、また、例えば、1
フレームを構成する音声サンプルについて、LPC分析
等の音響分析を施し、その結果得られる音声の特徴量
を、ベクトルのコンポーネントとすることにより、音声
データをベクトル化することも可能である。なお、ここ
では、説明を簡単にするために、例えば、1フレームの
各音声サンプルを、そのまま、ベクトルの各コンポーネ
ントとすることにより、音声データをベクトル化するも
のとする。
【0282】ベクトル化部202は、1フレームの各音
声サンプルを、そのままコンポーネントとして構成した
ベクトル(以下、適宜、音声ベクトルとする)を、距離
計算部203に出力する。
【0283】距離計算部203は、コードブック記憶部
204に記憶されたコードブックに登録されている各コ
ードベクトルと、ベクトル化部202からの音声ベクト
ルとの距離(例えば、ユークリッド距離など)を計算
し、各コードベクトルについて求められた距離を、その
コードベクトルに対応するコードとともに、コード決定
部205に供給する。
【0284】即ち、コードブック記憶部204は、後述
する図22の学習部125における学習によって得られ
る高品質化データとしてのコードブックを記憶し、距離
計算部203は、そのコードブックに登録されている各
コードベクトルについて、ベクトル化部202からの音
声ベクトルとの距離を計算して、各コードベクトルに対
応するコードとともに、コード決定部205に供給す
る。
【0285】コード決定部205は、距離計算部203
から供給される、各コードベクトルについての距離のう
ち、最も短いものを検出し、その最も短い距離を与える
コードベクトル、即ち、音声ベクトルについての量子化
誤差(ベクトル量子化誤差)を最も小さくするコードベ
クトルに対応するコードを、ベクトル化部202が出力
した音声ベクトルについてのベクトル量子化結果として
決定する。そして、コード決定部205は、そのベクト
ル量子化結果としてのコードを、符号化音声データとし
て、送信制御部124(図3)に出力する。
【0286】次に、図22は、符号化部123が図21
に示したように構成される場合の、図3の送信部113
を構成する学習部125の構成例を示している。
【0287】バッファ211には、A/D変換部122
が出力する音声データが供給されるようになっており、
バッファ211は、そこに供給される音声データを記憶
する。
【0288】ベクトル化部212は、バッファ211に
記憶された音声データを用いて、図21のベクトル化部
202における場合と同様にして、音声ベクトルを構成
し、ユーザ用ベクトル記憶部213に供給する。
【0289】ユーザ用ベクトル記憶部213は、例え
ば、EEPROMなどで構成され、ベクトル化部212
から供給される音声ベクトルを順次記憶する。初期ベク
トル記憶部214は、例えば、ROMなどで構成され、
不特定多数のユーザの音声データを用いて構成された多
数の音声ベクトルをあらかじめ記憶している。
【0290】コードブック生成部215は、初期ベクト
ル記憶部214およびユーザベクトル記憶部213に記
憶された音声ベクトルをすべて用い、例えば、LBG
(Linde, Buzo, Gray)アルゴリズムによって、コード
ブックを生成する学習を行い、その学習の結果得られる
コードブックを、高品質化データとして出力する。
【0291】なお、コードブック生成部215が出力す
る高品質化データとしてのコードブックは、記憶部12
6(図3)に供給され、更新情報(コードブックが得ら
れた日時)とともに記憶されるとともに、符号化部12
3(図21)にも供給され、コードブック記憶部204
に書き込まれる(上書きされる)。
【0292】ここで、図22の学習部125で、初めて
学習が行われる場合や、ユーザ用ベクトル記憶部213
がクリアされた直後等に学習が行われる場合おいては、
ユーザ用ベクトル記憶部213には、音声ベクトルが記
憶されていないため、コードブック生成部215におい
て、ユーザ用ベクトル記憶部213だけを参照するので
は、コードブックを生成することができない。また、携
帯電話機101の使用が開始されてから間もない場合に
おいては、ユーザ用ベクトル記憶部213には、それほ
ど多くの音声ベクトルが記憶されていない。この場合、
コードブック生成部215において、ユーザ用ベクトル
記憶部213を参照するだけでも、コードブックを生成
することは可能ではあるが、そのようなコードブックを
用いたベクトル量子化は、かなり精度の悪いもの(量子
化誤差が大きいもの)となる。
【0293】そこで、初期ベクトル記憶部214には、
上述のように、多数の音声ベクトルが記憶されており、
コードブック生成部215は、ユーザ用ベクトル記憶部
213だけでなく、初期ベクトル記憶部214も参照す
ることで、上述のような精度の悪いベクトル量子化が行
われるようなコードブックが生成されることを防止する
ようになっている。
【0294】なお、ユーザ用ベクトル記憶部213に、
ある程度の数の音声ベクトルが記憶された後は、コード
ブック生成部215において、初期ベクトル記憶部21
4を参照せずに、ユーザ用ベクトル記憶部213だけを
参照して、コードブックを生成するようにすることが可
能である。
【0295】次に、図23のフローチャートを参照し
て、図22の学習部125で行われる、高品質化データ
としてのコードブックの学習処理について説明する。
【0296】例えば、ユーザが通話時に行った発話、あ
るいは任意のタイミングで行った発話による音声データ
が、A/D変換部122(図3)からバッファ211に
供給され、バッファ211は、そこに供給される音声デ
ータを記憶する。
【0297】そして、例えば、ユーザが通話を終了する
と、あるいは、発話を開始してから所定時間が経過する
と、学習部125は、通話中に、バッファ211に記憶
された音声データ、あるいは、一連の発話を開始してか
ら終了するまでに、バッファ211に記憶された音声デ
ータを、新たに入力された音声データとして、学習処理
を開始する。
【0298】即ち、ベクトル化部212は、バッファ2
11に記憶された音声データを時系列に読み出し、所定
数の音声サンプルを1フレームとして、各フレームの音
声データをベクトル化する。そして、ベクトル化部21
2は、そのベクトル化の結果得られる音声ベクトルを、
ユーザ用ベクトル記憶部213に供給して追加記憶させ
る。
【0299】バッファ211に記憶された音声データす
べてのベクトル化が終了すると、コードブック生成部2
15は、ステップS121において、ユーザ用ベクトル
記憶部213と初期ベクトル記憶部214に記憶された
各音声ベクトルとの距離の総和を最小にするベクトルy
1を求める。そしてコードブック生成部215は、その
ベクトルy1を、コートベクトルy1として、ステップS
122に進む。
【0300】ステップS122では、コードブック生成
部215は、現在得られているコードベクトルの総数を
変数nに設定し、コードベクトルy1,y2,・・・,y
nそれぞれを2分割する。即ち、コードブック生成部2
15は、例えば、△を微小なベクトルとするとき、コー
ドベクトルyi(i=1,2,・・・,n)から、ベク
トルyi+△およびyi−△を生成し、ベクトルyi+△
を、新たなコードベクトルyiとするとともに、ベクト
ルyi−△を、新たなコードベクトルyn+iとする。
【0301】そして、ステップS123に進み、コード
ブック生成部215は、ユーザ用ベクトル記憶部213
と初期ベクトル記憶部214に記憶された各音声ベクト
ルx j(j=1,2,・・・,J(ユーザ用ベクトル記
憶部213と初期ベクトル記憶部214に記憶された音
声ベクトルの総数))を、その音声ベクトルxjと最も
距離が近いコードベクトルyi(i=1,2,・・・,
2n)に分類し、ステップS124に進む。
【0302】ステップS124では、コードブック生成
部215は、各コードベクトルyiを、そのコードベク
トルyiに分類された各音声ベクトルとの距離の総和が
最小になるように更新する。なお、この更新は、例え
ば、コードベクトルyiに分類された0個以上の音声ベ
クトルが指す点の重心を求めることによって行うことが
できる。即ち、その重心を指すベクトルが、コードベク
トルyiに分類された各音声ベクトルとの距離の総和を
最小にするものとなる。但し、コードベクトルy iに分
類された音声ベクトルが0個の場合は、コードベクトル
iは、そのままとされる。
【0303】その後、ステップS125に進み、コード
ブック生成部215は、更新後の各コードベクトルyi
について、そのコードベクトルyiに分類された各音声
ベクトルとの距離の総和(以下、適宜、コードベクトル
iについての距離の総和という)を求め、さらに、す
べてのコードベクトルyiについての距離の総和の総和
(以下、適宜、全総和という)を求める。そして、コー
ドブック生成部215は、その全総和の変化、即ち、今
回のステップS125で求めた全総和(以下、適宜、今
回の全総和という)と、前回のステップS125で求め
た全総和(以下、適宜、前回の全総和という)との差の
絶対値が、所定の閾値以下であるかどうかを判定する。
【0304】ステップS125において、今回の全総和
と前回の全総和との差の絶対値が、所定の閾値以下でな
いと判定された場合、即ち、コードベクトルyiを更新
することにより、全総和が大きく変化した場合、ステッ
プS123に戻り、以下、同様の処理を繰り返す。
【0305】また、ステップS125において、今回の
全総和と前回の全総和との差の絶対値が、所定の閾値以
下であると判定された場合、即ち、コードベクトルyi
を更新しても、全総和がほとんど変化しない場合、ステ
ップS126に進み、コードブック生成部215は、現
在得られているコードベクトルの総数を表す変数nが、
コードブックにあらかじめ設定されているコードベクト
ルの数(以下、適宜、設定コードベクトル数という)N
に等しいかどうかを判定する。
【0306】ステップS126において、変数nが、設
定コードベクトル数Nに等しくないと判定された場合、
即ち、まだ、設定コードベクトル数Nに等しい数のコー
ドベクトルyiが得られていない場合、ステップS12
2に戻り、以下、同様の処理を繰り返す。
【0307】また、ステップS126において、変数n
が、設定コードベクトル数Nに等しいと判定された場
合、即ち、設定コードベクトル数Nに等しい数のコード
ベクトルyiが得られた場合、コードブック生成部21
5は、そのN個のコードベクトルyiで構成されるコー
ドブックを、高品質化データとして出力し、学習処理を
終了する。
【0308】なお、図23の学習処理では、ユーザ用ベ
クトル記憶部213に、いままでに入力された音声ベク
トルを記憶しておき、その音声ベクトルを用いて、コー
ドブックを更新(生成)するようにしたが、コードブッ
クの更新は、過去に入力された音声ベクトルを記憶して
おかずに、今回入力された音声ベクトルと、既に得られ
ているコードブックを用い、ステップS123およびS
124の処理により、いわば簡略化した形で行うことも
可能である。
【0309】即ち、この場合、コードブック生成部21
5は、ステップS123において、今回入力された各音
声ベクトルxj(j=1,2,・・・,J(今回入力さ
れた音声ベクトルの総数))を、その音声ベクトルxj
と最も距離が近いコードベクトルyi(i=1,2,・
・・,N(コードブックにおけるコードベクトルの総
数))に分類し、ステップS124に進む。
【0310】ステップS124では、コードブック生成
部215は、各コードベクトルyiを、そのコードベク
トルyiに分類された各音声ベクトルとの距離の総和が
最小になるように更新する。なお、この更新は、上述し
たように、コードベクトルy iに分類された0個以上の
音声ベクトルが指す点の重心を求めることによって行う
ことができるから、例えば、いま、更新後のコードベク
トルをyi’と、更新前のコードベクトルyiに分類され
ている過去に入力された音声ベクトルをx1,x2,・・
・,xM-Lと、コードベクトルyiに分類された今回の音
声ベクトルをxM-L+1,xM-L+2,・・・,xMと、それ
ぞれ表すと、更新前のコードベクトルyiと、更新後の
コードベクトルyi’は、それぞれ式(14)と式(1
5)を計算することによって求めることができる。
【0311】 yi=(x1+x2+・・・+xM-L)/(M−L) ・・・(14)
【0312】 yi’=(x1+x2+・・・+xM-L+xM-L+1+xM-L+2+・・・+xM)/M ・・・(15)
【0313】ところで、いまの場合、過去に入力された
音声ベクトルx1,x2,・・・,x M-Lは記憶されてい
ない。そこで、式(15)を次式にように変形する。
【0314】 yi’=(x1+x2+・・・+xM-L+xM-L+1)/M +(xM-L+2+・・・+xM)/M =(x1+x2+・・・+xM-L+xM-L+1)/(M-L)×(M-L)/M +(xM-L+2+・・・+xM)/M ・・・(16)
【0315】式(16)に、式(14)を代入すると次
式が得られる。
【0316】 yi’=yi×(M-L)/M+(xM-L+2+・・・+xM)/M ・・・(17)
【0317】式(17)によれば、今回入力された音声
ベクトルxM-L+1,xM-L+2,・・・,xMと、既に得ら
れているコードブックにおけるコードベクトルyiを用
いることによって、そのコードベクトルyiを更新し、
更新後のコードベクトルyiを求めることができる。
【0318】この場合、過去に入力された音声ベクトル
を記憶しておく必要がないので、ユーザ用ベクトル記憶
部213の記憶容量が少なくて済む。但し、この場合、
ユーザ用ベクトル記憶部213には、今回入力された音
声ベクトルの他、いままでに各コードベクトルyiに分
類された音声ベクトルの総数を記憶させておくととも
に、コードベクトルyiの更新に伴って、その更新後の
コードベクトルyi’についても、そのコードベクトル
i’に分類された音声ベクトルの総数を更新する必要
がある。さらに、初期ベクトル記憶部214には、不特
定多数のユーザの音声データを用いて構成された多数の
音声ベクトルではなく、そのような多数の音声ベクトル
を用いて生成されたコードブックと各コードベクトルに
分類された音声ベクトルの総数を記憶させておく必要が
ある。図22の学習部125で、初めて学習が行われる
場合や、ユーザ用ベクトル記憶部213がクリアされた
直後等に学習が行われる場合おいては、初期ベクトル記
憶部214に記憶されたコードブックを用いて、そのコ
ードブックの更新が行われることになる。
【0319】以上のように、図22の実施の形態におけ
る学習部125でも、新たに入力された音声データと、
過去の学習に用いられた音声データに基づく図23の学
習処理が、通話時その他の任意のタイミングで行われ、
これにより、ユーザが発話を行うほど、そのユーザに適
したコードブック、即ち、そのユーザの音声に対して量
子化誤差を小さくするコードブックが求められる。従っ
て、通話相手側において、そのようなコードブックを用
いて、符号化音声データの復号(ここでは、ベクトル逆
量子化)を行うことにより、やはり、ユーザの音声の特
性に適した処理(ベクトル逆量子化処理)が施され、従
来の場合(不特定多数の話者の発話から求められたコー
ドブックを用いる場合)に比較して、十分に音質を改善
した復号音声データを得ることができることになる。
【0320】次に、図24は、送信部113(図3)の
学習部125が図22に示したように構成される場合
の、受信部114(図4)の復号部132の構成例を示
している。
【0321】バッファ221は、受信制御部131(図
4)が出力する符号化音声データ(ここでは、ベクトル
量子化結果としてのコード)を一時記憶する。ベクトル
逆量子化部222は、バッファ221に記憶されたコー
ドを読み出し、コードブック記憶部223に記憶された
コードブックを参照することでベクトル逆量子化を行う
ことにより、そのコードを、音声ベクトルに復号し、逆
ベクトル化部224に供給する。
【0322】コードブック記憶部223は、管理部13
5が高品質化データとして供給するコードブックを記憶
する。
【0323】ここで、送信部113(図3)の学習部1
25が図22に示したように構成される場合には、高品
質化データはコードブックであるから、受信部114
(図4)の記憶部136には、コードブックが記憶され
る。なお、この場合、受信部114のデフォルトデータ
メモリ137には、例えば、図22の初期ベクトル記憶
部214に記憶された音声ベクトルを用いて生成された
コードブックが、デフォルトデータとして記憶される。
【0324】逆ベクトル化部224は、ベクトル逆量子
化部222が出力する音声ベクトルを、時系列の音声デ
ータに逆ベクトル化して出力する。
【0325】次に、図25のフローチャートを参照し
て、図24の復号部132の処理(復号処理)について
説明する。
【0326】バッファ221は、そこに供給される符号
化音声データとしてのコードを順次記憶する。
【0327】そして、ベクトル逆量子化部222は、ス
テップS131において、バッファ221に記憶された
コードのうち、まだ読み出していない時間的に最も古い
ものを、注目コードとして読み出し、ベクトル逆量子化
する。即ち、ベクトル逆量子化部222は、コードブッ
ク記憶部223に記憶されたコードブックのコードベク
トルのうち、注目コードが対応付けられているものを検
出し、そのコードベクトルを、音声ベクトルとして、逆
ベクトル化部224に出力する。
【0328】逆ベクトル化部224は、ステップS13
2において、ベクトル逆量子化部22からの音声ベクト
ルを逆ベクトル化することにより、音声データに復号し
て出力し、ステップS133に進む。
【0329】ステップS133では、ベクトル逆量子化
部222が、バッファ221に、注目コードとされてい
ないコードが、まだ記憶されているかどうかを判定す
る。ステップS133において、バッファ221に、注
目コードとされていないコードが、まだ記憶されている
と判定された場合、ステップS131に戻り、バッファ
221に記憶されたコードのうち、まだ読み出していな
い時間的に最も古いものを、新たな注目コードとして、
以下、同様の処理が繰り返される。
【0330】また、ステップS133において、バッフ
ァ221に、注目コードとされていないコードが記憶さ
れていないと判定された場合、処理を終了する。
【0331】次に、上述した一連の処理は、ハードウェ
アにより行うこともできるし、ソフトウェアにより行う
こともできる。一連の処理をソフトウェアによって行う
場合には、そのソフトウェアを構成するプログラムが、
汎用のコンピュータ等にインストールされる。
【0332】そこで、図26は、上述した一連の処理を
実行するプログラムがインストールされるコンピュータ
の一実施の形態の構成例を示している。
【0333】プログラムは、コンピュータに内蔵されて
いる記録媒体としてのハードディスク405やROM4
03に予め記録しておくことができる。
【0334】あるいはまた、プログラムは、フレキシブ
ルディスク、CD-ROM(Compact DiscRead Only Memory),
MO(Magneto optical)ディスク,DVD(Digital Versatile
Disc)、磁気ディスク、半導体メモリなどのリムーバブ
ル記録媒体411に、一時的あるいは永続的に格納(記
録)しておくことができる。このようなリムーバブル記
録媒体411は、いわゆるパッケージソフトウエアとし
て提供することができる。
【0335】なお、プログラムは、上述したようなリム
ーバブル記録媒体411からコンピュータにインストー
ルする他、ダウンロードサイトから、ディジタル衛星放
送用の人工衛星を介して、コンピュータに無線で転送し
たり、LAN(Local Area Network)、インターネットとい
ったネットワークを介して、コンピュータに有線で転送
し、コンピュータでは、そのようにして転送されてくる
プログラムを、通信部408で受信し、内蔵するハード
ディスク405にインストールすることができる。
【0336】コンピュータは、CPU(Central Processing
Unit)402を内蔵している。CPU402には、バス4
01を介して、入出力インタフェース410が接続され
ており、CPU402は、入出力インタフェース410を
介して、ユーザによって、キーボードや、マウス、マイ
ク等で構成される入力部407が操作等されることによ
り指令が入力されると、それにしたがって、ROM(Read O
nly Memory)403に格納されているプログラムを実行
する。あるいは、また、CPU402は、ハードディスク
405に格納されているプログラム、衛星若しくはネッ
トワークから転送され、通信部408で受信されてハー
ドディスク405にインストールされたプログラム、ま
たはドライブ409に装着されたリムーバブル記録媒体
411から読み出されてハードディスク405にインス
トールされたプログラムを、RAM(Random Access Memor
y)404にロードして実行する。これにより、CPU40
2は、上述したフローチャートにしたがった処理、ある
いは上述したブロック図の構成により行われる処理を行
う。そして、CPU402は、その処理結果を、必要に応
じて、例えば、入出力インタフェース410を介して、
LCD(Liquid CryStal Display)やスピーカ等で構成され
る出力部406から出力、あるいは、通信部408から
送信、さらには、ハードディスク405に記録等させ
る。
【0337】ここで、本明細書において、コンピュータ
に各種の処理を行わせるためのプログラムを記述する処
理ステップは、必ずしもフローチャートとして記載され
た順序に沿って時系列に処理する必要はなく、並列的あ
るいは個別に実行される処理(例えば、並列処理あるい
はオブジェクトによる処理)も含むものである。
【0338】また、プログラムは、1のコンピュータに
より処理されるものであっても良いし、複数のコンピュ
ータによって分散処理されるものであっても良い。さら
に、プログラムは、遠方のコンピュータに転送されて実
行されるものであっても良い。
【0339】なお、本実施の形態では、着信側におい
て、着呼時に、発信側から送信されてくる電話番号を、
発信側を特定する特定情報とするようにしたが、その
他、例えば、ユーザ等に、ユニークなID(Identificatio
n)を割り当てておき、そのIDを、特定情報として用いる
ことも可能である。
【0340】また、本実施の形態では、本発明を、携帯
電話機どうしで音声通話を行う伝送システムに適用した
場合について説明したが、本発明は、その他、音声通信
を行うシステムに広く適用可能である。
【0341】
【発明の効果】本発明の送信装置および送信方法、並び
に第1のプログラムによれば、音声データが符号化さ
れ、符号化音声データが出力される。一方、符号化音声
データを受信する受信側において出力される音声の品質
を向上させる高品質化データの学習が、過去の学習に用
いられた音声データと、新たに入力された音声データに
基づいて行われ、符号化音声データと高品質化データが
送信される。従って、受信側において、高品質の音声を
復号することが可能となる。
【0342】本発明の受信装置及び受信方法、並びに第
1のプログラムによれば、符号化音声データが受信さ
れ、その符号化音声データを送信してきた送信側の特定
情報と対応付けられている高品質化データが選択され
る。そして、その選択された高品質化データに基づい
て、受信された符号化音声データが復号される。従っ
て、高品質の音声を復号することが可能となる。
【0343】本発明の送受信装置によれば、入力された
音声データが符号化され、符号化音声データが出力され
る。そして、符号化音声データを受信する他の送受信装
置において出力される音声の品質を向上させる高品質化
データの学習が、過去の学習に用いられた音声データ
と、新たに入力された音声データに基づいて行われ、符
号化音声データと高品質化データが送信される。一方、
他の送受信装置から送信されてくる符号化音声データが
受信され、その符号化音声データを送信してきた他の送
受信装置の特定情報と対応付けられている高品質化デー
タが選択される。そして、その選択された高品質化デー
タに基づいて、受信された符号化音声データが復号され
る。従って、高品質の音声を復号することが可能とな
る。
【図面の簡単な説明】
【図1】本発明を適用した伝送システムの一実施の形態
の構成例を示すブロック図である。
【図2】携帯電話機101の構成例を示すブロック図で
ある。
【図3】送信部113の構成例を示すブロック図であ
る。
【図4】受信部114の構成例を示すブロック図であ
る。
【図5】受信部114による高品質化データ設定処理を
説明するフローチャートである。
【図6】発信側の高品質化データ送信処理の第1実施の
形態を示すフローチャートである。
【図7】着信側の高品質化データ更新処理の第1実施の
形態を示すフローチャートである。
【図8】発信側の高品質化データ送信処理の第2実施の
形態を示すフローチャートである。
【図9】着信側の高品質化データ更新処理の第2実施の
形態を示すフローチャートである。
【図10】発信側の高品質化データ送信処理の第3実施
の形態を示すフローチャートである。
【図11】着信側の高品質化データ更新処理の第3実施
の形態を示すフローチャートである。
【図12】発信側の高品質化データ送信処理の第4実施
の形態を示すフローチャートである。
【図13】着信側の高品質化データ更新処理の第4実施
の形態を示すフローチャートである。
【図14】学習部125の構成例を示すブロック図であ
る。
【図15】学習部125の学習処理を説明するフローチ
ャートである。
【図16】復号部132の構成例を示すブロック図であ
る。
【図17】復号部132の処理を説明するフローチャー
トである。
【図18】CELP方式の符号化部123の構成例を示
すブロック図である。
【図19】CELP方式の符号化部123を採用した場
合の復号部132の構成例を示すブロック図である。
【図20】CELP方式の符号化部123を採用した場
合の学習部125の構成例を示すブロック図である。
【図21】ベクトル量子化を行う符号化部123の構成
例を示すブロック図である。
【図22】符号化部123がベクトル量子化を行う場合
の学習部125の構成例を示すブロック図である。
【図23】符号化部123がベクトル量子化を行う場合
の学習部125の学習処理を説明するフローチャートで
ある。
【図24】符号化部123がベクトル量子化を行う場合
の復号部132の構成例を示すブロック図である。
【図25】符号化部123がベクトル量子化を行う場合
の復号部132の処理を説明するフローチャートであ
る。
【図26】本発明を適用したコンピュータの一実施の形
態の構成例を示すブロック図である。
【符号の説明】
3 演算器, 4 LPC分析部, 5 ベクトル量子
化部, 6 音声合成フィルタ, 7 自乗誤差演算
部, 8 自乗誤差最小判定部, 9 適応コードブッ
ク記憶部, 10 ゲイン復号器, 11 励起コード
ブック記憶部,12乃至14 演算器, 15 コード
決定部, 21 DEMUX, 22適応コードブック
記憶部, 23 ゲイン復号器, 24 励起コードブ
ック記憶部, 25 フィルタ係数復号器, 26乃至
28 演算器, 29 音声合成フィルタ, 10
1,1012 携帯電話機, 1021,1022 基地
局,102 交換局, 111 アンテナ, 112
変復調部, 113 送信部, 114 受信部, 1
15 操作部, 121 マイク(マイクロフォン),
122 A/D変換部, 123 符号化部, 12
4 送信制御部,125 学習部, 126 記憶部,
127 管理部, 128 送信制御部, 131
受信制御部, 132 復号部, 133 D/A変換
部, 134 スピーカ, 135 管理部, 136
記憶部, 137 デフォルトデータメモリ, 14
1 バッファ, 142 生徒データ生成部, 142
Eエンコーダ, 142D デコーダ, 143 生徒
データメモリ, 144予測タップ生成部, 145
クラスタップ生成部, 146 クラス分類部,147
足し込み部, 148 初期コンポーネント記憶部,
149 ユーザ用コンポーネント記憶部, 150
タップ係数決定部, 161 デコーダ, 162 バ
ッファ, 163 予測タップ生成部, 164 クラ
スタップ生成部, 165 クラス分類部, 166
係数メモリ, 167 予測部,183 演算器, 1
84 LPC分析部, 185 ベクトル量子化部,1
86 音声合成フィルタ, 187 自乗誤差演算部,
188 自乗誤差最小判定部, 189 適応コード
ブック記憶部, 190 ゲイン復号器, 191 励
起コードブック記憶部, 192乃至194 演算器,
195 コード決定部, 201 バッファ, 20
2 ベクトル化部, 203 距離計算部, 204
コードブック記憶部, 205 コード決定部, 21
1 バッファ, 212 ベクトル化部, 213 ユ
ーザ用ベクトル記憶部, 214初期ベクトル記憶部,
215 コードブック生成部, 221 バッファ,
222 ベクトル逆量子化部, 223 コードブック
記憶部, 224 逆ベクトル化部, 401 バス,
402 CPU, 403 ROM, 404 RAM, 4
05 ハードディスク, 406 出力部, 407
入力部, 408 通信部, 409 ドライブ, 4
10 入出力インタフェース, 411リムーバブル記
録媒体
───────────────────────────────────────────────────── フロントページの続き (72)発明者 渡辺 勉 東京都品川区北品川6丁目7番35号 ソニ ー株式会社内 (72)発明者 木村 裕人 東京都品川区北品川6丁目7番35号 ソニ ー株式会社内 Fターム(参考) 5D045 AB04 DA02 DA11 5K027 AA11 BB03 CC01 CC08 DD11 DD14 DD16 HH19 5K067 AA23 BB04 DD04 FF07 GG01 GG11 HH21 HH23 KK13 KK15

Claims (29)

    【特許請求の範囲】
  1. 【請求項1】 入力された音声データを送信する送信装
    置であって、 前記音声データを符号化し、符号化音声データを出力す
    る符号化手段と、 前記符号化音声データを受信する受信側において出力さ
    れる音声の品質を向上させる高品質化データの学習を、
    過去の学習に用いられた音声データと、新たに入力され
    た音声データに基づいて行う学習手段と、 前記符号化音声データと高品質化データを送信する送信
    手段とを備えることを特徴とする送信装置。
  2. 【請求項2】 前記高品質化データの送信を管理する管
    理手段をさらに備えることを特徴とする請求項1に記載
    の送信装置。
  3. 【請求項3】 前記管理手段は、前記受信側との通信リ
    ンクを確立した後に、最新の前記高品質化データが送信
    されるように、前記高品質化データの送信を管理するこ
    とを特徴とする請求項1に記載の送信装置。
  4. 【請求項4】 前記管理手段は、前記受信側との通信リ
    ンクを確立した後、前記受信側から、高品質化データの
    要求があった場合に、最新の前記高品質化データが送信
    されるように、前記高品質化データの送信を管理するこ
    とを特徴とする請求項2に記載の送信装置。
  5. 【請求項5】 前記管理手段は、前記受信側への高品質
    化データの送信履歴を記憶しており、 前記送信履歴に基づいて、前記送信側への最新の前記高
    品質化データの送信が済んでいるかどうかを判定し、 前記送信側への最新の前記高品質化データの送信が済ん
    でいない場合に、その最新の前記高品質化データが送信
    されるように、前記高品質化データの送信を管理するこ
    とを特徴とする請求項1に記載の送信装置。
  6. 【請求項6】 前記学習手段は、前記符号化音声データ
    を復号した復号音声データを高品質化した高品質音声デ
    ータの予測値を求める予測演算を行うのに、前記復号音
    声データとともに用いるタップ係数を、前記高品質化デ
    ータとして求める学習を行うことを特徴とする請求項1
    に記載の送信装置。
  7. 【請求項7】 前記学習手段は、 前記音声データを、学習の教師となる教師データとし
    て、その教師データから、学習の生徒となる生徒データ
    を生成する生徒データ生成手段と、 前記タップ係数および生徒データを用いて予測演算を行
    うことにより得られる前記教師データの予測値の予測誤
    差を、統計的に最小にする前記タップ係数を演算する演
    算手段とを有することを特徴とする請求項6に記載の送
    信装置。
  8. 【請求項8】 前記生徒データ生成手段は、前記教師デ
    ータを前記符号化音声データに符号化し、さらに、その
    符号化音声データを復号して得られる復号音声データ
    を、前記生徒データとして生成することを特徴とする請
    求項7に記載の送信装置。
  9. 【請求項9】 前記学習手段は、 注目している前記教師データである注目教師データをク
    ラス分けするクラス分類を行うのに用いるクラスタップ
    を生成するクラスタップ生成手段と、 前記クラスタップに基づいて、前記注目教師データをク
    ラス分類し、そのクラスを表すクラスを求めるクラス分
    類手段とをさらに有し、 前記演算手段は、前記クラスごとに、前記タップ係数を
    求めることを特徴とする請求項7に記載の送信装置。
  10. 【請求項10】 前記符号化手段は、前記音声データ
    を、所定のコードブックに基づいてベクトル量子化し、
    その結果得られるコードを、前記符号化音声データとし
    て出力することを特徴とする請求項1に記載の送信装
    置。
  11. 【請求項11】 前記学習手段は、新たな前記コードブ
    ックを、前記高品質化データとして求める学習を行うこ
    とを特徴とする請求項10に記載の送信装置。
  12. 【請求項12】 入力された音声データを送信する送信
    方法であって、 前記音声データを符号化し、符号化音声データを出力す
    る符号化ステップと、 前記符号化音声データを受信する受信側において出力さ
    れる音声の品質を向上させる高品質化データの学習を、
    過去の学習に用いられた音声データと、新たに入力され
    た音声データに基づいて行う学習ステップと、 前記符号化音声データと高品質化データを送信する送信
    ステップとを備えることを特徴とする送信方法。
  13. 【請求項13】 入力された音声データを送信する送信
    処理を、コンピュータに行わせるプログラムであって、 前記音声データを符号化し、符号化音声データを出力す
    る符号化ステップと、 前記符号化音声データを受信する受信側において出力さ
    れる音声の品質を向上させる高品質化データの学習を、
    過去の学習に用いられた音声データと、新たに入力され
    た音声データに基づいて行う学習ステップと、 前記符号化音声データと高品質化データを送信する送信
    ステップとを備えることを特徴とするプログラム。
  14. 【請求項14】 入力された音声データを送信する送信
    処理を、コンピュータに行わせるプログラムが記録され
    ている記録媒体であって、 前記音声データを符号化し、符号化音声データを出力す
    る符号化ステップと、 前記符号化音声データを受信する受信側において出力さ
    れる音声の品質を向上させる高品質化データの学習を、
    過去の学習に用いられた音声データと、新たに入力され
    た音声データに基づいて行う学習ステップと、 前記符号化音声データと高品質化データを送信する送信
    ステップとを備えるプログラムが記録されていることを
    特徴とする記録媒体。
  15. 【請求項15】 音声データを符号化した符号化音声デ
    ータを受信する受信装置であって、 前記符号化音声データを受信する受信手段と、 前記符号化音声データを復号した復号音声データの品質
    を向上させる高品質化データを、前記符号化音声データ
    を送信してくる送信側を特定する特定情報とともに記憶
    する記憶手段と、 前記符号化音声データを送信してきた送信側の特定情報
    と対応付けられている前記高品質化データを選択する選
    択手段と、 前記選択手段において選択された前記高品質化データに
    基づいて、前記受信手段において受信された符号化音声
    データを復号する復号手段とを備えることを特徴とする
    受信装置。
  16. 【請求項16】 前記受信手段は、前記送信側から送信
    されてくる前記高品質化データも受信し、 前記受信手段において受信された前記高品質化データに
    よる、前記記憶手段の記憶内容の更新を管理する管理手
    段をさらに備えることを特徴とする請求項15に記載の
    受信装置。
  17. 【請求項17】 前記管理手段は、前記送信側との通信
    リンクを確立した後に、前記送信側から送信されてくる
    最新の前記高品質化データによって、前記記憶手段の記
    憶内容を更新することを特徴とする請求項16に記載の
    受信装置。
  18. 【請求項18】 前記管理手段は、前記送信側との通信
    リンクを確立した後、前記送信側に対して、高品質化デ
    ータを要求し、その要求に応じて、前記送信側から送信
    されてくる最新の前記高品質化データによって、前記記
    憶手段の記憶内容を更新することを特徴とする請求項1
    7に記載の受信装置。
  19. 【請求項19】 前記管理手段は、 前記記憶手段において、最新の前記高品質化データが記
    憶されているかどうかを判定し、 前記記憶手段に最新の前記高品質化データが記憶されて
    いない場合に、前記送信側から送信されてくる最新の前
    記高品質化データによって、前記記憶手段の記憶内容を
    更新することを特徴とする請求項16に記載の受信装
    置。
  20. 【請求項20】 前記送信側は、電話機であり、 前記送信側の特定情報は、その送信側の電話機の電話番
    号であることを特徴とする請求項15に記載の受信装
    置。
  21. 【請求項21】 前記高品質化データは、前記符号化音
    声データを復号した復号音声データを高品質化した高品
    質音声データの予測値を求める予測演算を行うのに、前
    記復号音声データとともに用いるタップ係数であり、 前記復号手段は、 前記符号化音声データを復号し、復号音声データを出力
    する処理を行う第1の処理手段と、 前記復号音声データおよびタップ係数を用いて予測演算
    を行うことにより、前記高品質音声データの予測値を求
    める処理を行う第2の処理手段とを有することを特徴と
    する請求項15に記載の受信装置。
  22. 【請求項22】 前記タップ係数は、 前記高品質音声データを、学習の教師となる教師データ
    として、その教師データから、学習の生徒となる生徒デ
    ータを生成し、 前記タップ係数および生徒データを用いて予測演算を行
    うことにより得られる前記教師データの予測値の予測誤
    差を、統計的に最小にする前記タップ係数を演算するこ
    とにより求められたものであることを特徴とする請求項
    21に記載の受信装置。
  23. 【請求項23】 前記生徒データは、前記教師データを
    前記符号化音声データに符号化し、さらに、その符号化
    音声データを復号して得られる復号音声データであるこ
    とを特徴とする請求項22に記載の受信装置。
  24. 【請求項24】 前記タップ係数は、所定のクラスごと
    にクラス分けされており、 前記第2の処理手段は、 前記予測値を求めようとする前記高品質音声データを注
    目データとして、その注目データをクラス分けするクラ
    ス分類を行うのに用いるクラスタップを生成するクラス
    タップ生成手段と、 前記クラスタップに基づいて、前記注目データをクラス
    分類し、そのクラスを表すクラスを求めるクラス分類手
    段と、 前記注目データのクラスに対応する前記タップ係数と、
    前記復号音声データとを用いて予測演算を行うことによ
    り、前記注目データの予測値を求める予測手段とを有す
    ることを特徴とする請求項21に記載の受信装置。
  25. 【請求項25】 前記符号化音声データは、前記音声デ
    ータをベクトル量子化して得られるコードであり、 前記高品質化データは、前記コードをベクトル逆量子化
    するのに用いられるコードブックであり、 前記復号手段は、前記コードブックに基づいて、前記コ
    ードをベクトル逆量子化することにより、前記符号化音
    声データを復号することを特徴とする請求項14に記載
    の受信装置。
  26. 【請求項26】 音声データを符号化した符号化音声デ
    ータを受信する受信方法であって、 前記符号化音声データを受信する受信ステップと、 前記符号化音声データを復号した復号音声データの品質
    を向上させる高品質化データを、前記符号化音声データ
    を送信してくる送信側を特定する特定情報とともに記憶
    する記憶ステップと、 前記符号化音声データを送信してきた送信側の特定情報
    と対応付けられている前記高品質化データを選択する選
    択ステップと、 前記選択ステップにおいて選択された前記高品質化デー
    タに基づいて、前記受信ステップにおいて受信された符
    号化音声データを復号する復号ステップとを備えること
    を特徴とする受信方法。
  27. 【請求項27】 音声データを符号化した符号化音声デ
    ータを受信する受信処理を、コンピュータに行わせるプ
    ログラムであって、 前記符号化音声データを受信する受信ステップと、 前記符号化音声データを復号した復号音声データの品質
    を向上させる高品質化データを、前記符号化音声データ
    を送信してくる送信側を特定する特定情報とともに記憶
    する記憶ステップと、 前記符号化音声データを送信してきた送信側の特定情報
    と対応付けられている前記高品質化データを選択する選
    択ステップと、 前記選択ステップにおいて選択された前記高品質化デー
    タに基づいて、前記受信ステップにおいて受信された符
    号化音声データを復号する復号ステップとを備えること
    を特徴とするプログラム。
  28. 【請求項28】 音声データを符号化した符号化音声デ
    ータを受信する受信処理を、コンピュータに行わせるプ
    ログラムが記録されている記録媒体であって、 前記符号化音声データを受信する受信ステップと、 前記符号化音声データを復号した復号音声データの品質
    を向上させる高品質化データを、前記符号化音声データ
    を送信してくる送信側を特定する特定情報とともに記憶
    する記憶ステップと、 前記符号化音声データを送信してきた送信側の特定情報
    と対応付けられている前記高品質化データを選択する選
    択ステップと、 前記選択ステップにおいて選択された前記高品質化デー
    タに基づいて、前記受信ステップにおいて受信された符
    号化音声データを復号する復号ステップとを備えるプロ
    グラムが記録されていることを特徴とする記録媒体。
  29. 【請求項29】 送信装置と受信装置とから構成される
    送受信装置であって、 前記送信装置は、 入力された音声データを符号化し、符号化音声データを
    出力する符号化手段と、 前記符号化音声データを受信する他の送受信装置におい
    て出力される音声の品質を向上させる高品質化データの
    学習を、過去の学習に用いられた音声データと、新たに
    入力された音声データに基づいて行う学習手段と、 前記符号化音声データと高品質化データを送信する送信
    手段とを備え、 前記受信装置は、 前記他の送受信装置から送信されてくる符号化音声デー
    タを受信する受信手段と、 前記高品質化データを、前記符号化音声データを送信し
    てくる前記他の送受信装置を特定する特定情報とともに
    記憶する記憶手段と、 前記符号化音声データを送信してきた前記他の送受信装
    置の特定情報と対応付けられている前記高品質化データ
    を選択する選択手段と、 前記選択手段において選択された前記高品質化データに
    基づいて、前記受信手段において受信された前記符号化
    音声データを復号する復号手段とを備えることを特徴と
    する送受信装置。
JP2001192379A 2001-06-26 2001-06-26 送信装置および送信方法、送受信装置および送受信方法、並びにプログラムおよび記録媒体 Expired - Fee Related JP4711099B2 (ja)

Priority Applications (6)

Application Number Priority Date Filing Date Title
JP2001192379A JP4711099B2 (ja) 2001-06-26 2001-06-26 送信装置および送信方法、送受信装置および送受信方法、並びにプログラムおよび記録媒体
US10/362,582 US7366660B2 (en) 2001-06-26 2002-06-20 Transmission apparatus, transmission method, reception apparatus, reception method, and transmission/reception apparatus
PCT/JP2002/006179 WO2003001709A1 (en) 2001-06-26 2002-06-20 Transmission apparatus, transmission method, reception apparatus, reception method, and transmission/reception apparatus
KR1020037002805A KR100895745B1 (ko) 2001-06-26 2002-06-20 송신 장치 및 송신 방법, 수신 장치 및 수신 방법, 및송수신 장치
EP02743668A EP1401130A4 (en) 2001-06-26 2002-06-20 TRANSMISSION DEVICE, TRANSMISSION METHOD, RECEIVING DEVICE, RECEPTION METHOD AND TRANSMISSION OR TRANSMISSION. RECEPTION DEVICE
CN028026632A CN1465149B (zh) 2001-06-26 2002-06-20 发送设备及方法、接收设备及方法和发送/接收设备

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2001192379A JP4711099B2 (ja) 2001-06-26 2001-06-26 送信装置および送信方法、送受信装置および送受信方法、並びにプログラムおよび記録媒体

Publications (2)

Publication Number Publication Date
JP2003005795A true JP2003005795A (ja) 2003-01-08
JP4711099B2 JP4711099B2 (ja) 2011-06-29

Family

ID=19030838

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2001192379A Expired - Fee Related JP4711099B2 (ja) 2001-06-26 2001-06-26 送信装置および送信方法、送受信装置および送受信方法、並びにプログラムおよび記録媒体

Country Status (6)

Country Link
US (1) US7366660B2 (ja)
EP (1) EP1401130A4 (ja)
JP (1) JP4711099B2 (ja)
KR (1) KR100895745B1 (ja)
CN (1) CN1465149B (ja)
WO (1) WO2003001709A1 (ja)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2007295618A (ja) * 2007-06-26 2007-11-08 Sony Corp 受信装置及び方法、プログラム、並びに記録媒体
JP2013505606A (ja) * 2009-09-18 2013-02-14 富士通株式会社 前置符号化マトリクス・コードブックを生成するための方法および装置

Families Citing this family (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
DE10240899A1 (de) * 2002-09-04 2004-03-18 Siemens Ag Teilnehmerseitige Geräteanordnung für Datenübermittlungsdienste und zugehörige Komponenten
US20050053127A1 (en) * 2003-07-09 2005-03-10 Muh-Tian Shiue Equalizing device and method
US8140849B2 (en) * 2004-07-02 2012-03-20 Microsoft Corporation Security for network coding file distribution
US7756051B2 (en) * 2004-07-02 2010-07-13 Microsoft Corporation Content distribution using network coding
US20070033009A1 (en) * 2005-08-05 2007-02-08 Samsung Electronics Co., Ltd. Apparatus and method for modulating voice in portable terminal
EP1952548B1 (en) * 2005-11-21 2011-06-22 Telefonaktiebolaget LM Ericsson (publ) Method and apparatus for improving call quality
JP4437486B2 (ja) * 2006-10-10 2010-03-24 ソニー・エリクソン・モバイルコミュニケーションズ株式会社 音声通信装置、音声通信システム、音声通信制御方法、及び音声通信制御プログラム
KR101394152B1 (ko) * 2007-04-10 2014-05-14 삼성전자주식회사 모바일 단말의 콘텐츠 다운로드 방법, 장치 및 시스템
CN110503965B (zh) * 2019-08-29 2021-09-14 珠海格力电器股份有限公司 一种调制解调器语音编解码器的选择方法和存储介质

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH05303398A (ja) * 1992-04-24 1993-11-16 Olympus Optical Co Ltd 音声符号化装置
WO2000067091A2 (en) * 1999-04-29 2000-11-09 Spintronics Ltd. Speech recognition interface with natural language engine for audio information retrieval over cellular network
US20030076245A1 (en) * 2001-05-31 2003-04-24 Southern Methodist University Types-based, lossy data embedding

Family Cites Families (16)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN1009428B (zh) * 1988-05-10 1990-09-05 中国人民解放军空军总医院 微型电脑中频治疗仪
US5432883A (en) * 1992-04-24 1995-07-11 Olympus Optical Co., Ltd. Voice coding apparatus with synthesized speech LPC code book
WO1994025959A1 (en) 1993-04-29 1994-11-10 Unisearch Limited Use of an auditory model to improve quality or lower the bit rate of speech synthesis systems
EP0788091A3 (en) * 1996-01-31 1999-02-24 Kabushiki Kaisha Toshiba Speech encoding and decoding method and apparatus therefor
US5883891A (en) 1996-04-30 1999-03-16 Williams; Wyatt Method and apparatus for increased quality of voice transmission over the internet
JP3874851B2 (ja) * 1996-09-30 2007-01-31 松下電器産業株式会社 音声符号化装置
US6160845A (en) * 1996-12-26 2000-12-12 Sony Corporation Picture encoding device, picture encoding method, picture decoding device, picture decoding method, and recording medium
JP3844031B2 (ja) * 1996-12-26 2006-11-08 ソニー株式会社 画像符号化装置および画像符号化方法、並びに、画像復号装置および画像復号方法
KR100504415B1 (ko) 1996-12-26 2005-11-22 소니 가부시끼 가이샤 화상부호화장치,화상부호화방법,화상복호장치,화상복호방법및기록매체
US6202046B1 (en) * 1997-01-23 2001-03-13 Kabushiki Kaisha Toshiba Background noise/speech classification method
JP3557426B2 (ja) 1997-11-19 2004-08-25 株式会社三技協 移動体通信ネットワークの通話品質監視装置
JP2000132196A (ja) * 1998-10-23 2000-05-12 Toshiba Corp ディジタル携帯電話及びデータ通信方法
JP4218134B2 (ja) * 1999-06-17 2009-02-04 ソニー株式会社 復号装置及び方法、並びにプログラム提供媒体
US6704711B2 (en) * 2000-01-28 2004-03-09 Telefonaktiebolaget Lm Ericsson (Publ) System and method for modifying speech signals
EP1944760B1 (en) 2000-08-09 2009-09-23 Sony Corporation Voice data processing device and processing method
JP4736266B2 (ja) * 2000-08-09 2011-07-27 ソニー株式会社 音声処理装置および音声処理方法、学習装置および学習方法、並びにプログラムおよび記録媒体

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH05303398A (ja) * 1992-04-24 1993-11-16 Olympus Optical Co Ltd 音声符号化装置
WO2000067091A2 (en) * 1999-04-29 2000-11-09 Spintronics Ltd. Speech recognition interface with natural language engine for audio information retrieval over cellular network
US20030076245A1 (en) * 2001-05-31 2003-04-24 Southern Methodist University Types-based, lossy data embedding

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2007295618A (ja) * 2007-06-26 2007-11-08 Sony Corp 受信装置及び方法、プログラム、並びに記録媒体
JP2013505606A (ja) * 2009-09-18 2013-02-14 富士通株式会社 前置符号化マトリクス・コードブックを生成するための方法および装置

Also Published As

Publication number Publication date
US20040024589A1 (en) 2004-02-05
KR100895745B1 (ko) 2009-04-30
WO2003001709A1 (en) 2003-01-03
CN1465149A (zh) 2003-12-31
EP1401130A4 (en) 2007-04-25
CN1465149B (zh) 2010-05-26
US7366660B2 (en) 2008-04-29
JP4711099B2 (ja) 2011-06-29
EP1401130A1 (en) 2004-03-24
KR20030046419A (ko) 2003-06-12

Similar Documents

Publication Publication Date Title
US7688922B2 (en) Transmitting apparatus and transmitting method, receiving apparatus and receiving method, transceiver apparatus, communication apparatus and method, recording medium, and program
US7587314B2 (en) Single-codebook vector quantization for multiple-rate applications
JP4711099B2 (ja) 送信装置および送信方法、送受信装置および送受信方法、並びにプログラムおよび記録媒体
JP4857468B2 (ja) データ処理装置およびデータ処理方法、並びにプログラムおよび記録媒体
JP4937746B2 (ja) 音声符号化装置および音声符号化方法
EP1308927A1 (en) Voice data processing device and processing method
KR100875783B1 (ko) 데이터 처리 장치
JPH08179800A (ja) 音声符号化装置
JP4736266B2 (ja) 音声処理装置および音声処理方法、学習装置および学習方法、並びにプログラムおよび記録媒体
JPWO2009037852A1 (ja) 通信端末装置、通信システムおよび通信方法
JP4517262B2 (ja) 音声処理装置および音声処理方法、学習装置および学習方法、並びに記録媒体
JPH0786952A (ja) 音声の予測符号化方法
JP2002062899A (ja) データ処理装置およびデータ処理方法、学習装置および学習方法、並びに記録媒体
JPH11352999A (ja) 音声圧縮符号化装置
JP2012163825A (ja) 音声符号化装置及び音声符号化方法

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20080305

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20101104

A521 Written amendment

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20101214

A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20110224

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20110309

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20140401

Year of fee payment: 3

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

LAPS Cancellation because of no payment of annual fees