JP4464707B2 - 通信装置 - Google Patents

通信装置 Download PDF

Info

Publication number
JP4464707B2
JP4464707B2 JP2004048569A JP2004048569A JP4464707B2 JP 4464707 B2 JP4464707 B2 JP 4464707B2 JP 2004048569 A JP2004048569 A JP 2004048569A JP 2004048569 A JP2004048569 A JP 2004048569A JP 4464707 B2 JP4464707 B2 JP 4464707B2
Authority
JP
Japan
Prior art keywords
transmission mode
bit rate
mode information
transmission
information
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
JP2004048569A
Other languages
English (en)
Other versions
JP2005241761A (ja
Inventor
智史 山梨
薫 佐藤
利幸 森井
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Panasonic Corp
Panasonic Holdings Corp
Original Assignee
Panasonic Corp
Matsushita Electric Industrial Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Priority to JP2004048569A priority Critical patent/JP4464707B2/ja
Application filed by Panasonic Corp, Matsushita Electric Industrial Co Ltd filed Critical Panasonic Corp
Priority to PCT/JP2005/002764 priority patent/WO2005081232A1/ja
Priority to CN2005800057013A priority patent/CN1922660B/zh
Priority to CA002557000A priority patent/CA2557000A1/en
Priority to US10/590,417 priority patent/US7653539B2/en
Priority to EP08011802A priority patent/EP1968047B1/en
Priority to CN2010101561255A priority patent/CN101819781B/zh
Priority to EP05710495A priority patent/EP1720154B1/en
Priority to DE602005009501T priority patent/DE602005009501D1/de
Priority to DE602005017952T priority patent/DE602005017952D1/de
Priority to KR1020067017018A priority patent/KR20060131851A/ko
Publication of JP2005241761A publication Critical patent/JP2005241761A/ja
Application granted granted Critical
Publication of JP4464707B2 publication Critical patent/JP4464707B2/ja
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/04Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
    • G10L19/16Vocoder architecture
    • G10L19/18Vocoders using multiple modes
    • G10L19/24Variable rate codecs, e.g. for generating different qualities using a scalable representation such as hierarchical encoding or layered encoding
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/005Correction of errors induced by the transmission channel, if related to the coding algorithm
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/04Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques

Landscapes

  • Engineering & Computer Science (AREA)
  • Human Computer Interaction (AREA)
  • Computational Linguistics (AREA)
  • Signal Processing (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Physics & Mathematics (AREA)
  • Acoustics & Sound (AREA)
  • Multimedia (AREA)
  • Quality & Reliability (AREA)
  • Compression, Expansion, Code Conversion, And Decoders (AREA)
  • Detection And Prevention Of Errors In Transmission (AREA)
  • Transmission Systems Not Characterized By The Medium Used For Transmission (AREA)
  • Communication Control (AREA)

Description

本発明は、インターネット通信に代表されるパケット通信システムや、移動通信システムなどで音声・楽音信号を伝送する場合における通信装置に関するものである。
インターネット通信に代表されるパケット通信システムや、移動通信システムなどで音声・楽音信号を伝送する場合、音声・楽音信号の伝送効率を高めるため、圧縮・符号化技術がよく使われる。また、信号の多重化に関しても、各通信端末の伝送ビットレートが小さい程、多くの通信の多重化が可能になるため、多くの加入者が同時に通信するためには、各通信端末の伝送ビットレートを下げ、回線の効率化を図る手法が望まれている。
これに対して、従来から、通信端末及び基地局において、同時接続者数、呼損率、接続待ち時間、BER(Bit Error Rate)、SIR(Signal Interference Ratio)等の情報を取得し、得られた情報に応じて、予め定められた複数の通信モードの中から適切なモードを選択して通信を行うことにより、伝送ビットレートを下げる技術が開示されている(例えば、特許文献1)。
また、話者の音声の有無を検出し、その検出結果に応じて伝送ビットレートを制御するという手法も開発されている。例えば、非特許文献1には、話者の音声の有無を検出し、話者が音声を発している区間(有声区間)は高ビットレートで符号化し、話者が音声を発していない区間(無声区間)は低ビットレートで符号化し伝送することにより、全体として伝送ビットレートを下げる技術が開示されている(例えば、非特許文献1)。
特開平11−331936号公報 ANSI/TIA/EIA-96-C, Speech Service Option Standard for Wideband Spread Spectrum Digital Cellular System
しかしながら、上記従来の音声・楽音符号化/復号化方法では、送信側の通信環境の一つとして通話中一定時間無音であれば伝送ビットレートを低くする制御を行っているのみで、受信側の使用環境については全く考慮されていないため、効率的な伝送を行うことができないという課題を有している。
本発明はかかる点に鑑みてなされたものであり、受信側の使用環境を考慮して送信側の伝送ビットレートを制御することにより、所定の品質を維持しつつ効率的な音声・楽音信号の符号化を行うことができる通信装置を提供することを目的とする。
本発明の通信装置は、入力信号からマスキングレベルを算出するマスキングレベル算出手段と、前記マスキングレベルに基づいて第1伝送モード情報を決定し、前記第1伝送モード情報と、通信相手の装置における環境雑音のレベルに基づく第2伝送モード情報とにより第3伝送モード情報を決定する伝送モード判定手段と、前記第3伝送モード情報に対応した伝送ビットレートで入力信号を符号化し、符号化によって得られた情報源符号と前記第1伝送モードとを前記通信相手の装置に伝送する符号化手段と、を具備し、前記第1伝送モード情報は、前記マスキングレベルの所定期間における最大値を最小値で除した値と、所定の閾値との比較結果に基づいて高ビットレート又は低ビットレートのいずれかで表され、前記第2伝送モード情報は、通信相手の装置における環境雑音のレベルに応じて高ビットレート又は低ビットレートのいずれかで表され、前記伝送モード判定手段は、前記第1伝送モード情報が低ビットレートかつ前記第2伝送モード情報が高ビットレートで有る場合に第1ビットレートを示し、前記第1伝送モード情報が高ビットレートかつ前記第2伝送モード情報が高ビットレート、あるいは、前記第1伝送モード情報が低ビットレートかつ前記第2伝送モード情報が低ビットレートで有る場合に前記第1ビットレートよりも低い第2ビットレートを示し、前記第1伝送モード情報が高ビットレートかつ前記第2伝送モード情報が低ビットレートで有る場合に前記第2ビットレートよりも低い第3ビットレートを示す、第3伝送モード情報を決定する、構成を採る。
この構成により、受信側において自動車や電車の走行音等が存在した場合、受信側においてそのような環境雑音を認識し、環境雑音によるマスキング効果を利用することにより、送信側は、音声・楽音信号を、人間の聴感に影響のない範囲で最小限の伝送ビットレートを用いて通信することが可能となり、それによって回線効率を大幅に向上させることができる。また、受信側の環境雑音に加え、送信側における環境雑音の情報を検知し、これを音声・楽音信号の符号化に利用することにより、さらに効率的な通信が可能となる。
本発明の通信装置は、通信相手の装置にて符号化して得られた情報源符号を復号化する復号化手段と、入力信号から第1マスキングレベルを算出し、前記復号化手段が復号化した信号から第2マスキングレベルを算出するマスキングレベル算出手段と、前記第1マスキングレベルに基づいて第1伝送モード情報を決定し、前記第2マスキングレベルに基づいて第2伝送モード情報を決定し、前記第1伝送モード情報と前記第2伝送モード情報とにより第3伝送モード情報を決定する伝送モード判定手段と、前記第3伝送モード情報に対応した伝送ビットレートで前記入力信号を符号化し、符号化によって得られた情報源符号を前記通信相手の装置に伝送する符号化手段と、を具備し、前記第1伝送モード情報は、前記第1マスキングレベルの所定期間における最大値を最小値で除した値と、所定の閾値との比較結果に基づいて高ビットレート又は低ビットレートのいずれかで表され、前記第2伝送モード情報は、前記第2マスキングレベルの所定期間における最大値を最小値で除した値と、所定の閾値との比較結果に基づいて高ビットレート又は低ビットレートのいずれかで表され、前記伝送モード判定手段は、前記第1伝送モード情報が低ビットレートかつ前記第2伝送モード情報が高ビットレートで有る場合に第1ビットレートを示し、前記第1伝送モード情報が高ビットレートかつ前記第2伝送モード情報が高ビットレート、あるいは、前記第1伝送モード情報が低ビットレートかつ前記第2伝送モード情報が低ビットレートで有る場合に前記第1ビットレートよりも低い第2ビットレートを示し、前記第1伝送モード情報が高ビットレートかつ前記第2伝送モード情報が低ビットレートで有る場合に前記第2ビットレートよりも低い第3ビットレートを示す、第3伝送モード情報を決定する、構成を採る。
この構成により、受信側において自動車や電車の走行音等が存在した場合、送信側において、受信側から伝送されてきた音声・楽音信号に含まれる環境雑音を認識し、環境雑音によるマスキング効果を利用することができるので、送信側は、人間の聴感に影響のない範囲で最小限の伝送ビットレートを用いて通信することが可能となり、それにより回線効率が大幅に向上する。また、受信側の環境雑音に加え、送信側における環境雑音の情報を検知し、それを音声・楽音信号符号化に利用することにより、より効率的な通信が可能となる。
本発明の通信装置は、前記伝送モード判定手段は、ユーザの指示に基づくタイミングで前記第3伝送モード情報を決定する処理を行う構成を採る。
本発明の通信装置は、前記伝送モード判定手段は、前記第3伝送モード情報を決定する処理を定期的に行う構成を採る。
本発明の通信装置は、前記伝送モード判定手段は、検知した環境雑音のレベルと前回検知したものとの差が所定の閾値より大きい場合に前記第3伝送モード情報を決定する処理を行う構成を採る。
これらの構成により、受信側において自動車や電車の走行音等が存在した場合、受信側においてそのような環境雑音を認識し、環境雑音によるマスキング効果を利用することにより、送信側は、音声・楽音信号を、人間の聴感に影響のない範囲で最小限の伝送ビットレートを用いて通信することが可能となり、それによって回線効率を大幅に向上させることができる。
本発明の基地局装置は、上記いずれかの通信装置を具備する構成を採る。また、本発明の通信端末装置は、上記いずれかの通信装置を具備する構成を採る。
これらの構成により、受信側において自動車や電車の走行音等が存在した場合、受信側においてそのような環境雑音を認識し、環境雑音によるマスキング効果を利用することにより、送信側は、音声・楽音信号を、人間の聴感に影響のない範囲で最小限の伝送ビットレートを用いて通信することが可能となり、それによって回線効率を大幅に向上させることができる。
本発明の中継局は、第1通信装置と第2通信装置とが中継局を経由して無線通信を行う通信システムの前記中継局であって、予め設定されたビットレートで前記第1通信装置にて入力信号を符号化して得られた情報源符号、前記予め設定されたビットレートを示す初期伝送モード情報、及び前記第1通信装置の入力信号に含まれる環境雑音のレベルに基づいて設定される第1伝送モード情報を前記第1通信装置から入力する第1インターフェース手段と、前記第2通信装置の入力信号に含まれる環境雑音のレベルに応じて前記第1通信装置から伝送される信号の伝送ビットレートを制御する第2伝送モード情報を前記第2通信装置から入力する第2インターフェース手段と、前記初期伝送モード情報、前記第1伝送モード情報及び前記第2伝送モード情報が所定の関係に有る場合に前記初期伝送モード情報を変更して第3伝送モード情報とし、他の場合に前記初期伝送モード情報をそのまま第3伝送モード情報とし、前記情報源符号を前記第3伝送モード情報に応じた伝送ビットレートに変換する伝送モード変換手段と、変換後の情報源符号と前記第3伝送モードとを統合し、統合後の情報を前記第2インターフェース手段を介して第2通信装置に伝送する符号化情報統合手段と、を具備し、前記初期伝送モード情報は、第1ビットレート、前記第1ビットレートよりも低い第2ビットレート又は前記第2ビットレートよりも低い第3ビットレートのいずれかで表され、前記第1伝送モード情報は、高ビットレート又は低ビットレートのいずれかで表され、前記第2伝送モード情報は、高ビットレート又は低ビットレートのいずれかで表され、前記伝送モード変換手段は、前記初期伝送モード情報が第1ビットレートであって、前記第1伝送モード情報が高ビットレートかつ前記第2伝送モード情報が高ビットレート、あるいは、前記第1伝送モード情報が低ビットレートかつ前記第2伝送モード情報が低ビットレートで有る場合に、前記初期伝送モード情報を第2ビットレートに変更して前記第3伝送モード情報とし、前記初期伝送モード情報が第1ビットレートあるいは第2ビットレートであって、前記第1伝送モード情報が低ビットレートかつ前記第2伝送モード情報が高ビットレートで有る場合に前記初期伝送モード情報を第3ビットレートに変更して前記第3伝送モード情報とする、構成を採る。
この構成により、受信側及び送信側において自動車や電車の走行音等の環境雑音が存在した場合に、送信側ではなく、中継局においても伝送ビットレートを制御することができるので、より柔軟な伝送ビットレート制御が可能となり、更なる回線効率の向上を図ることができる。
本発明によれば、受信側において自動車や電車の走行音等が存在した場合、受信側における環境雑音によるマスキング効果を利用して送信側のビットレートを決定することにより、送信側は、人間の聴感に影響のない範囲で最小限の伝送ビットレートで通信することができるので、回線効率を大幅に向上させることができる。
MP3(Mpeg-1 Audio Layer-3)やAAC(Advanced Audio Coding)に代表されるようなオーディオ符号化方式では、聴感マスキング効果を利用し、帯域毎に符号化時の量子化誤差が、符号化対象となるオーディオ信号から算出されるマスキングレベル以下になるように量子化することで、効率的な符号化を実現している。聴感マスキング効果とは、「ある周波数にエネルギーの大きな成分が存在することにより、その近隣の周波数のエネルギーの小さな成分がマスクされ、聴覚的に聴こえなくなる」という現象である。
図1は、聴感マスキング効果を説明する図である。図1中の成分B、成分Cは、成分A及び成分Dにマスクされ聴感的には感知されない。従って、成分B及び成分Cのようなマスクされる成分は大きく削減しても知覚されない。また、エネルギーの大きな成分(図1では三角形の領域の大きな成分)に対しては、符号化時に粗く量子化を行っても、その誤差(量子化誤差)が人間の聴感的に知覚されにくいという性質がある。
本発明の骨子は、オーディオ符号化方式によく用いられている聴感マスキング効果と符号化時の量子化誤差の関係を環境雑音に応用し、環境雑音によるマスキングレベルに基づいて伝送ビットレートを制御することである。
以下、本発明の実施の形態について、添付図面を参照して詳細に説明する。
(実施の形態1)
実施の形態1では、通信端末同士の双方向通信において、環境雑音による聴感マスキング効果を考慮して伝送モードを決定し、伝送ビットレートを制御する音声・楽音符号化/復号化方法について説明する。
図2は、実施の形態1に係る通信端末装置の構成を示すブロック図である。図2では、2つの通信端末装置100、150の間で双方向通信を行うものとする。
まず、通信端末装置100の構成について説明する。通信端末装置100は、伝送モード決定部101と、信号符号化部102と、信号復号化部103とから主に構成される。
伝送モード決定部101は、入力信号中の音声・楽音信号の背景に含まれる環境雑音を検知し、その環境雑音のレベルに応じて相手側通信端末である通信端末装置150から伝送される信号の伝送ビットレートを制御する伝送モードを決定し、決定した伝送モードを示す情報(以下、「伝送モード情報」という)を伝送路110及び信号復号化部103に出力する。なお、本実施の形態の一例では、予め定められた2つ以上の伝送ビットレートの中から一つの伝送ビットレートを選択するものとし、伝送モード情報は、予め定められた3種類の伝送ビットレートbitrate1、bitrate2、bitrate3(bitrate3<bitrate2<bitrate1)の値を取り得るものとする。
信号符号化部102は、伝送路110を介して通信端末装置150から伝送される伝送モード情報に応じて、音声・楽音信号である入力信号を符号化し、得られた符号化情報を伝送路110に出力する。
信号復号化部103は、伝送路110を介して通信端末装置150から伝送される符号化情報を復号化し、得られた信号を出力信号として出力する。なお、信号復号化部103は、伝送路110から出力される符号化情報に含まれる伝送モード情報と伝送モード決定部101から得られる伝送モード情報とを、伝送遅延を考慮した上で比較することにより、伝送誤りを検出することができる。具体的には、伝送遅延を考慮した伝送モード決定部101から得られる伝送モード情報と伝送路110から出力される符号化情報に含まれる伝送モード情報とが異なる場合には、信号復号化部103は、伝送路110において伝送誤りが発生したと判断する。また、通信端末装置150の信号符号化部152では、符号化情報に伝送モード情報を統合せず、信号復号化部103では、伝送モード決定部101から得られる伝送モード情報を用いて、伝送路110から出力される符号化情報を復号化するという手法を採ることも可能である。
次に、通信端末装置150の構成について説明する。通信端末装置150は、伝送モード決定部151と、信号符号化部152と、信号復号化部153とから主に構成される。
伝送モード決定部151は、入力信号を入力とし、音声・楽音信号の背景に含まれる環境雑音を検知し、その環境雑音のレベルに応じて通信端末装置100から伝送される信号の伝送ビットレートを制御する伝送モードを決定し、決定した伝送モードを示す伝送モード情報を伝送路110及び信号復号化部153に出力する。
信号符号化部152は、伝送路110を介して通信端末装置100から伝送される伝送モード情報を入力とし、伝送モード情報に応じて、音声・楽音信号である入力信号を符号化し、得られた符号化情報を伝送路110に出力する。
信号復号化部153は、伝送路110を介して通信端末装置100から伝送される符号化情報及び伝送モード決定部151から得られる伝送モード情報を入力とし、符号化情報を復号化した後、得られた信号を出力信号として出力する。なお、信号復号化部153は、伝送路110から出力される符号化情報に含まれる伝送モード情報と伝送モード決定部151から得られる伝送モード情報とを、伝送遅延を考慮した上で比較することにより、伝送誤りを検出することができる。具体的には、伝送遅延を考慮した伝送モード決定部151から得られる伝送モード情報と伝送路110から出力される符号化情報に含まれる伝送モード情報とが異なる場合には、信号復号化部153は、伝送路110において伝送誤りが発生したと判断する。また、通信端末装置100の信号符号化部102では、符号化情報に伝送モード情報を統合せず、信号復号化部153では、伝送モード決定部151から得られる伝送モード情報を用いて、伝送路110から出力される符号化情報を復号化するという手法を採ることも可能である。
次に、図2の伝送モード決定部101の内部構成について、図3を用いて説明する。なお、図2の伝送モード決定部151の構成は伝送モード決定部101の構成と同じである。
伝送モード決定部101は、マスキングレベル算出部301と、伝送モード判定部302とから主に構成される。
マスキングレベル算出部301は、入力信号からマスキングレベルを算出し、算出されたマスキングレベルを伝送モード判定部302に出力する。
伝送モード判定部302は、マスキングレベル算出部301から出力されたマスキングレベルと所定の閾値とを比較し、比較結果に基づいて伝送ビットレートを決定する。具体的には、通信端末装置100において検知された通信端末装置100側に存在する環境雑音のレベルが大きくマスキングレベルが大きい場合には伝送ビットレートを低くする。これは、その環境雑音による聴感マスキング効果により通信端末装置150から伝送する符号化情報の量子化誤差がある程度マスキングされるため、通信端末装置150において伝送ビットレートを低くしても、低くしなかった場合と聴感的に同等の品質の復号化信号が得られるという原理に基づくものである。一方、通信端末装置100において検知された通信端末装置100側に存在する環境雑音のレベルが小さい場合には、その環境雑音の聴感マスキング効果によって、通信端末装置150から伝送する符号化情報の量子化誤差がマスキングされないため、伝送ビットレートを高くする。
そして、伝送モード判定部302は、決定した伝送モードを示す伝送モード情報を伝送路110及び信号復号化部103に出力する。
ここで、伝送モード決定部101が、所定期間(例えば、5秒〜10秒程度の一定区間内)の入力信号のパワー値の最大値と最小値を算出し、最大値と最小値とから、入力信号に含まれる環境雑音のレベルを判定し、そのレベルに応じてビットレートを制御する方法を採る場合におけるマスキングレベル算出部301及び伝送モード判定部302の処理について説明する。なお、ここでは各フレームを処理する毎に、環境雑音のレベルを判定し、出力する処理を行う場合について説明するが、この他に、通信端末のユーザからのボタン押下などをトリガとして以下の処理を行う、あるいは、ある一定時間間隔ごとに以下の処理を行うといったことも可能である。さらに、一定時間間隔ごとに環境雑音のレベルを検出し、検知した環境雑音のレベルと前回検知したものとの差が所定の閾値より大きい場合に以下の処理を行うといったことも可能である。
まず、マスキングレベル算出部301の処理について説明する。マスキングレベル算出部301は、入力信号をNサンプルずつ区切り(Nは自然数)、同区間を1フレームとしてフレーム毎に処理を行う。以下、符号化の対象となる入力信号をx(n=0,・・・,N-1)と表す。
また、マスキングレベル算出部301は、内部にバッファbuf(i=0,・・・,N-1)を有する。ここで、Nは予め定められる非負の整数であり、1フレームのサンプル数Nに依存し、1フレームの区間がおよそ20ミリ秒程度の場合には、100〜500程度の値で性能が得られることが確認されている。
次に、マスキングレベル算出部301は、処理対象であるフレームのフレームパワーPframeを以下の式1により求める。
Figure 0004464707
次に、マスキングレベル算出部301は、式1により求めたフレームパワーPframeをバッファbufNi-1に代入する。
次に、マスキングレベル算出部301は、i区間(区間長N)におけるフレームパワーPframeの最小値PframeMINと最大値PframeMAXを求め、PframeMIN、PframeMAXを伝送モード判定部302に出力する。
次に、マスキングレベル算出部301は、以下の式2によりバッファbufを更新する。
Figure 0004464707
以上が、図3のマスキングレベル算出部301における処理の説明である。
次に、伝送モード判定部302における処理について説明する。伝送モード判定部302は、マスキングレベル算出部301から出力されたPframeMIN、PframeMAXから、伝送モード情報Modeを以下の式3により決定する。
Figure 0004464707
ここで、Th0及びTh1(Th0<Th1)は、環境雑音の聴感マスキング効果に基づいた予備実験により予め定められた定数である。
以下、Th0及びTh1を算出するための予備実験について簡単に説明する。ここで、Modeがbitrate1のときに使用される符号化方法を符号化方法A、符号化方法Aにより符号化した情報を復号して得られる信号を復号化信号Aという。同様に、Modeがbitrate2のときに使用される符号化方法を符号化方法B、符号化方法Bにより符号化した情報を復号して得られる信号を復号化信号Bという。また、Modeがbitrate3のときに使用される符号化方法を符号化方法C、符号化方法Cにより符号化した情報を復号して得られる信号を復号化信号Cという。
復号化信号Aと復号化信号Bに対して、平均的な雑音(例えばホワイトノイズ等)を、そのレベルが徐々に増加するように付加していき、雑音が付加された復号化信号Aと雑音が付加された復号化信号Bが聴感的に等しくなった時点の雑音レベルをTh0とする。同様に、雑音が付加された復号化信号Aと雑音が付加された復号化信号Cが聴感的に等しくなった時点の雑音レベルをTh1とする。このようにして、雑音によるマスキング効果を利用し、Th0及びTh1を実験的に定める。
次に、伝送モード判定部302は、伝送モード情報を伝送路110及び信号復号化部103に出力する。
以上が、図2の伝送モード決定部101の内部構成の説明である。
次に、図2の信号符号化部102の構成について、図4を用いて説明する。なお、図2の信号符号化部152の構成は信号符号化部102の構成と同じである。
ここで、本実施の形態では、基本レイヤと2つの拡張レイヤとで構成される3階層の音声符号化/復号化方法において音声・楽音信号を符号化/復号化する場合について説明する。ただし、本発明は階層について制限はなく、4階層以上の階層的な音声符号化/復号化方法において音声・楽音信号を符号化/復号化する場合についても適用することができる。
階層的な音声符号化方法とは、残差信号(下位レイヤの入力信号と下位レイヤの復号化信号との差)を符号化し、符号化情報を出力する音声符号化方法が上位レイヤに複数存在して階層構造を成している方法である。また、階層的な音声復号化方法とは、残差信号を復号化する音声復号化方法が上位レイヤに複数存在して階層構造を成している方法である。ここで、最下のレイヤに存在する音声符号化/復号化方法を基本レイヤとする。また、基本レイヤより上位レイヤに存在する音声符号化/復号化方法を拡張レイヤとする。なお、以下、基本レイヤにおける符号化部、復号化部をそれぞれ基本レイヤ符号化部、基本レイヤ復号化部といい、拡張レイヤにおける符号化部、復号化部をそれぞれ拡張レイヤ符号化部、及び拡張レイヤ復号化部という。
信号符号化部102は、伝送ビットレート制御部401と、制御スイッチ402〜405と、基本レイヤ符号化部406と、基本レイヤ復号化部407と、加算部408、411と、第1拡張レイヤ符号化部409と、第1拡張レイヤ復号化部410と、第2拡張レイヤ符号化部412と、符号化情報統合部413とから主に構成される。
入力信号は、基本レイヤ符号化部406及び制御スイッチ402に入力される。また、伝送モード情報は、伝送ビットレート制御部401に入力される。
伝送ビットレート制御部401は、入力した伝送モード情報に応じて、制御スイッチ402〜405のオン/オフ制御を行う。具体的には、伝送ビットレート制御部401は、伝送モード情報がbitrate1である場合、制御スイッチ402〜405を全てオン状態にする。また、伝送ビットレート制御部401は、伝送モード情報がbitrate2である場合、制御スイッチ402及び403をオン状態にし、制御スイッチ404及び405をオフ状態にする。また、伝送ビットレート制御部401は、伝送モード情報がbitrate3である場合、制御スイッチ402〜405を全てオフ状態にする。このように、伝送ビットレート制御部401が伝送モード情報に応じて制御スイッチをオン/オフ制御することにより、入力信号の符号化に用いる符号化部の組み合わせが決定される。なお、伝送モード情報は、伝送ビットレート制御部401から符号化情報統合部413に出力される。
基本レイヤ符号化部406は、入力信号に対して符号化を行い、符号化により得られた情報源符号(以下、「基本レイヤ情報源符号」という)を制御スイッチ403及び符号化情報統合部413に出力する。なお、基本レイヤ符号化部406の内部構成については後述する。
基本レイヤ復号化部407は、制御スイッチ403がオン状態である場合、基本レイヤ符号化部406から出力された基本レイヤ情報源符号に対して復号化を行い、得られた復号化信号(以下、「基本レイヤ復号化信号」という)を加算部408に出力する。なお、基本レイヤ復号化部407は、制御スイッチ403がオフ状態の場合には何も動作しない。なお、基本レイヤ復号化部407の内部構成については後述する。
加算部408は、制御スイッチ402、403がオン状態の場合、入力信号に、基本レイヤ復号化部407から出力された基本レイヤ復号化信号の極性を反転させた信号を加算し、加算結果である第1残差信号を第1拡張レイヤ符号化部409及び制御スイッチ404に出力する。なお、加算部408は、制御スイッチ402、403がオフ状態の場合には何も動作しない。
第1拡張レイヤ符号化部409は、制御スイッチ402、403がオン状態の場合、加算部408から出力された第1残差信号に対して符号化を行い、符号化により得られた情報源符号(以下、「第1拡張レイヤ情報源符号」という)を制御スイッチ405及び符号化情報統合部413に出力する。なお、第1拡張レイヤ符号化部409は、制御スイッチ402、403がオフ状態の場合には何も動作しない。
第1拡張レイヤ復号化部410は、制御スイッチ405がオン状態の場合、第1拡張レイヤ符号化部409から出力された第1拡張レイヤ情報源符号に対して復号化を行い、復号化により得られた復号化信号(以下、「第1拡張レイヤ復号化信号」という)を加算部411に出力する。なお、第1拡張レイヤ復号化部410は、制御スイッチ405がオフ状態の場合には何も動作しない。
加算部411は、制御スイッチ404、405がオン状態の場合、第1残差信号に、第1拡張レイヤ復号化部410の出力信号の極性を反転させた信号を加算し、加算結果である第2残差信号を第2拡張レイヤ符号化部412に出力する。なお、加算部411は、制御スイッチ404、405がオフ状態の場合には何も動作しない。
第2拡張レイヤ符号化部412は、制御スイッチ404、405がオン状態の場合、加算部411から出力される第2残差信号に対して符号化を行い、符号化により得られた情報源符号(以下、「第2拡張レイヤ情報源符号」という)を符号化情報統合部413に出力する。なお、第2拡張レイヤ符号化部412は、制御スイッチ404、405がオフ状態の場合には何も動作しない。
符号化情報統合部413は、伝送ビットレート制御部401から出力された伝送モード情報、基本レイヤ符号化部406から出力された基本レイヤ情報源符号、第1拡張レイヤ符号化部409から出力された第1拡張レイヤ情報源符号及び第2拡張レイヤ符号化部412から出力された第2拡張レイヤ情報源符号を統合し、統合後の符号化情報を伝送路110に出力する。
以上が、図4を用いた信号符号化部102の構成の説明である。なお、以上では、各フレーム処理時に常に伝送モード情報が伝送ビットレート制御部401に入力されるという条件で説明したが、伝送モード情報が伝送ビットレート制御部401に入力されない場合には、前回入力された伝送モード情報を伝送ビットレート制御部401内のバッファに格納する等して、前回入力時の伝送モード情報を使うことも可能である。
次に、図5を用いて、図4における基本レイヤ符号化部406の構成について説明する。なお、本実施の形態では、基本レイヤ符号化部406において、CELPタイプの音声符号化を行う場合について説明する。
前処理部501は、入力サンプリング周波数の信号に対し、DC成分を取り除くハイパスフィルタ処理や後続する符号化処理の性能改善につながるような波形整形処理やプリエンファシス処理を行い、これらの処理後の信号(Xin)をLPC分析部502および加算部505に出力する。
LPC分析部502は、Xinを用いて線形予測分析を行い、分析結果(線形予測係数)をLPC量子化部503に出力する。LPC量子化部503は、LPC分析部502から出力された線形予測係数(LPC)の量子化処理を行い、量子化LPCを合成フィルタ504に出力するとともに量子化LPCを表す符号(L)を多重化部514に出力する。
合成フィルタ504は、量子化LPCに基づくフィルタ係数により、後述する加算部511から出力される駆動音源に対してフィルタ合成を行うことにより合成信号を生成し、合成信号を加算部505に出力する。
加算部505は、合成信号の極性を反転させてXinに加算することにより誤差信号を算出し、誤差信号を聴覚重み付け部512に出力する。
適応音源符号帳506は、過去に加算部511によって出力された駆動音源をバッファに記憶しており、パラメータ決定部513から出力された信号により特定される過去の駆動音源から1フレーム分のサンプルを適応音源ベクトルとして切り出して乗算部509に出力する。
量子化利得生成部507は、パラメータ決定部513から出力された信号によって特定される量子化適応音源利得と量子化固定音源利得とをそれぞれ乗算部509と乗算部510とに出力する。
固定音源符号帳508は、パラメータ決定部513から出力された信号によって特定される形状を有するパルス音源ベクトルに拡散ベクトルを乗算して得られた固定音源ベクトルを乗算部510に出力する。
乗算部509は、量子化利得生成部507から出力された量子化適応音源利得を、適応音源符号帳506から出力された適応音源ベクトルに乗じて、加算部511に出力する。乗算部510は、量子化利得生成部507から出力された量子化固定音源利得を、固定音源符号帳508から出力された固定音源ベクトルに乗じて、加算部511に出力する。
加算部511は、利得乗算後の適応音源ベクトルと固定音源ベクトルとをそれぞれ乗算部509と乗算部510とから入力し、これらをベクトル加算し、加算結果である駆動音源を合成フィルタ504および適応音源符号帳506に出力する。なお、適応音源符号帳506に入力された駆動音源は、バッファに記憶される。
聴覚重み付け部512は、加算部505から出力された誤差信号に対して聴覚的な重み付けをおこない符号化歪みとしてパラメータ決定部513に出力する。
パラメータ決定部513は、聴覚重み付け部512から出力された符号化歪みを最小とする適応音源ベクトル、固定音源ベクトル及び量子化利得を、各々適応音源符号帳506、固定音源符号帳508及び量子化利得生成部507から選択し、選択結果を示す適応音源ベクトル符号(A)、固定音源ベクトル符号(F)及び音源利得符号(G)を多重化部514に出力する。
多重化部514は、LPC量子化部503から量子化LPCを表す符号(L)を入力し、パラメータ決定部513から適応音源ベクトルを表す符号(A)、固定音源ベクトルを表す符号(F)および音源利得を表す符号(G)を入力し、これらの情報を多重化して基本レイヤ情報源符号として出力する。
以上が、図4の基本レイヤ符号化部406の内部構成の説明である。
なお、図4の第1拡張レイヤ符号化部409及び第2拡張レイヤ符号化部412の内部構成は、基本レイヤ符号化部406と同一であり、入力される信号の種類及び出力される情報源符号の種類のみが異なるので、その説明は省略する。
次に、図4の基本レイヤ復号化部407の内部構成について図6を用いて説明する。ここでは、基本レイヤ復号化部407において、CELPタイプの音声復号化を行う場合について説明する。
図6において、基本レイヤ復号化部407に入力された基本レイヤ情報源符号は、多重化分離部601によって個々の符号(L、A、G、F)に分離される。分離されたLPC符号(L)はLPC復号化部602に出力され、分離された適応音源ベクトル符号(A)は適応音源符号帳605に出力され、分離された音源利得符号(G)は量子化利得生成部606に出力され、分離された固定音源ベクトル符号(F)は固定音源符号帳607に出力される。
LPC復号化部602は、多重化分離部601から出力された符号(L)から量子化LPCを復号化し、合成フィルタ603に出力する。
適応音源符号帳605は、多重化分離部601から出力された符号(A)で指定される過去の駆動音源から1フレーム分のサンプルを適応音源ベクトルとして取り出して乗算部608に出力する。
量子化利得生成部606は、多重化分離部601から出力された音源利得符号(G)で指定される量子化適応音源利得と量子化固定音源利得を復号化し乗算部608及び乗算部609に出力する。
固定音源符号帳607は、多重化分離部601から出力された符号(F)で指定される固定音源ベクトルを生成し、乗算部609に出力する。
乗算部608は、適応音源ベクトルに量子化適応音源利得を乗算して、加算部610に出力する。乗算部609は、固定音源ベクトルに量子化固定音源利得を乗算して、加算部610に出力する。
加算部610は、乗算部608、609から出力された利得乗算後の適応音源ベクトルと固定音源ベクトルとの加算を行い駆動音源を生成し、これを合成フィルタ603及び適応音源符号帳605に出力する。
合成フィルタ603は、LPC復号化部602によって復号化されたフィルタ係数を用いて、加算部610から出力された駆動音源のフィルタ合成を行い、合成した信号を後処理部604に出力する。
後処理部604は、合成フィルタ603から出力された信号に対して、ホルマント強調やピッチ強調といったような音声の主観的な品質を改善する処理や、定常雑音の主観的品質を改善する処理などを施し、基本レイヤ復号化情報として出力する。
以上が、図4の基本レイヤ復号化部407の内部構成の説明である。
なお、図4の第1拡張レイヤ復号化部410の内部構成は、基本レイヤ復号化部407の内部構成と同一であり、入力される情報源符号の種類及び出力される信号の種類のみが異なるので、その説明は省略する。
次に、図2の信号復号化部103の構成について図7を用いて説明する。なお、図2の信号復号化部153の構成は信号復号化部103の構成と同じである。
信号復号化部103は、伝送ビットレート制御部701と、基本レイヤ復号化部702と、第1拡張レイヤ復号化部703と、第2拡張レイヤ復号化部704と、制御スイッチ705、706と、加算部707、708とから主に構成される。
伝送ビットレート制御部701は、受信した符号化情報に含まれる伝送モード情報に応じて、制御スイッチ705、706のオン/オフ制御を行う。具体的には、伝送ビットレート制御部701は、伝送モード情報がbitrate1である場合、制御スイッチ705、706の両方ともオン状態にする。また、伝送ビットレート制御部701は、伝送モード情報がbitrate2である場合、制御スイッチ705をオン状態にし、制御スイッチ706をオフ状態にする。また、伝送ビットレート制御部701は、伝送モード情報がbitrate3である場合、制御スイッチ705、706の両方ともオフ状態にする。また、伝送ビットレート制御部701は、受信した符号化情報に含まれる基本レイヤ情報源符号、第1拡張レイヤ情報源符号及び第2拡張レイヤ情報源符号を分離し、それぞれ基本レイヤ情報源符号を基本レイヤ復号化部702に出力し、第1拡張レイヤ情報源符号を制御スイッチ705に出力し、第2拡張レイヤ情報源符号を制御スイッチ706に出力する。
基本レイヤ復号化部702は、伝送ビットレート制御部701から出力された基本レイヤ情報源符号を復号化し、基本レイヤ復号化信号を生成して加算部708に出力する。
第1拡張レイヤ復号化部703は、制御スイッチ705がオン状態の場合、伝送ビットレート制御部701から出力された第1拡張レイヤ情報源符号を復号化し、第1拡張レイヤ復号化信号を生成して加算部707に出力する。なお、第1拡張レイヤ復号化部703は、制御スイッチ705がオフ状態の場合には何も動作しない。
第2拡張レイヤ復号化部704は、制御スイッチ706がオン状態の場合、伝送ビットレート制御部701から出力された第2拡張レイヤ情報源符号を復号化し、第2拡張レイヤ復号化信号を生成して加算部707に出力する。なお、第2拡張レイヤ復号化部704は、制御スイッチ706がオフ状態の場合には何も動作しない。
加算部707は、制御スイッチ705、706がオン状態である場合、第2拡張レイヤ復号化部704から出力された第2拡張レイヤ復号化信号と第1拡張レイヤ復号化部703から出力された第1拡張レイヤ復号化信号とを加算し、加算後の信号を加算部708に出力する。また、加算部707は、制御スイッチ706がオフ状態であり、かつ、制御スイッチ705がオン状態である場合、第1拡張レイヤ復号化部703から出力された第1拡張レイヤ復号化信号を加算部708に出力する。なお、加算部707は、制御スイッチ705、706がオフ状態である場合には何も動作しない。
加算部708は、基本レイヤ復号化部702から出力された基本レイヤ復号化信号と加算部707の出力信号とを加算し、加算後の信号を出力信号として出力する。また、加算部708は、制御スイッチ705、706がオフ状態である場合、基本レイヤ復号化部702から出力された基本レイヤ復号化信号を出力信号として出力する。
以上が、図2の信号復号化部103の構成の説明である。
なお、図7の基本レイヤ復号化部702、第1拡張レイヤ復号化部703及び第2拡張レイヤ復号化部704の内部構成は、図4の基本レイヤ復号化部407の内部構成と同一であり、入力される信号の種類及び出力される情報源符号の種類のみが異なるので、その説明は省略する。
ここで、信号符号化部102及び信号復号化部103における符号化/復号化方法として、ビットレートの異なる複数の符号化/復号化方法を切り替えて符号化/復号化する構成を適用することも可能である。以下、この場合の信号符号化部102及び信号復号化部103の構成について図8、図9を用いて説明する。
なお、本実施の形態では、3種類の音声符号化/復号化方法を利用して音声・楽音信号を符号化/復号化する場合について説明する。ただし、本発明は符号化/復号化方法の数について制限はなく、4種類以上の異なるビットレートの音声符号化/復号化方法を利用して音声・楽音信号を符号化/復号化する場合についても適用することができる。
図8は、信号符号化部102の内部構成を示すブロック図である。信号符号化部102は、伝送ビットレート制御部801と、制御スイッチ802、803と、信号符号化部804〜806と、符号化情報統合部807とから主に構成される。
入力信号は、制御スイッチ802に入力される。また、伝送モード情報は、伝送ビットレート制御部801に入力される。
伝送ビットレート制御部801は、入力した伝送モード情報に応じて、制御スイッチ802、803の切替え制御を行う。具体的には、伝送ビットレート制御部801は、伝送モード情報がbitrate1である場合、制御スイッチ802、803を両方とも信号符号化部804に接続する。また、伝送ビットレート制御部801は、伝送モード情報がbitrate2である場合、制御スイッチ802、803を両方とも信号符号化部805に接続する。また、伝送ビットレート制御部801は、伝送モード情報がbitrate3である場合、制御スイッチ802、803を両方とも信号符号化部806に接続する。このように、伝送ビットレート制御部801が伝送モード情報に応じて制御スイッチを切替え制御することにより、入力信号の符号化に用いる符号化部が決定される。なお、伝送モード情報は、伝送ビットレート制御部801から符号化情報統合部807に出力される。
信号符号化部804は、bitrate1に対応する符号化方法で入力信号を符号化し、符号化により得られた情報源符号を制御スイッチ803経由で符号化情報統合部807に出力する。
信号符号化部805は、bitrate2に対応する符号化方法で入力信号を符号化し、符号化により得られた情報源符号を制御スイッチ803経由で符号化情報統合部807に出力する。
信号符号化部806は、bitrate3に対応する符号化方法で入力信号を符号化し、符号化により得られた情報源符号を制御スイッチ803経由で符号化情報統合部807に出力する。
符号化情報統合部807は、伝送ビットレート情報制御部801から出力された伝送モード情報及びスイッチ803から出力された情報源符号を統合し、統合後の符号化情報を伝送路110に出力する。
以上が、図8を用いた信号符号化部102の構成の説明である。なお、以上では、各フレーム処理時に常に伝送モード情報が伝送ビットレート制御部801に入力されるという条件で説明したが、伝送モード情報が伝送ビットレート制御部801に入力されない場合には、前回入力された伝送モード情報を伝送ビットレート制御部801内のバッファに格納する等して、前回入力時の伝送モード情報を使うことも可能である。
なお、図8の信号符号化部804〜806の内部構成は、図4の基本レイヤ符号化部406と同一であり、入力される信号の種類及び出力される情報源符号の種類のみが異なるので、その説明は省略する。
図9は、信号復号化部103の内部構成を示すブロック図である。信号復号化部103は、伝送ビットレート制御部901と、制御スイッチ902、903と、信号復号化部904〜906とから主に構成される。
符号化情報は、伝送ビットレート制御部901に入力される。
伝送ビットレート制御部901は、受信した符号化情報に含まれる伝送モード情報に応じて、制御スイッチ902、903の切替え制御を行う。具体的には、伝送ビットレート制御部901は、伝送モード情報がbitrate1である場合、制御スイッチ902、903を両方とも信号復号化部904に接続する。また、伝送ビットレート制御部901は、伝送モード情報がbitrate2である場合、制御スイッチ902、903を両方とも信号復号化部905に接続する。また、伝送ビットレート制御部901は、伝送モード情報がbitrate3である場合、制御スイッチ902、903を両方とも信号復号化部906に接続する。また、受信した情報源符号を制御スイッチ902に出力する。
信号復号化部904は、制御スイッチ902経由で入力した情報源符号をbitrate1に対応する復号化方法で復号化し、復号化により得られた出力信号を制御スイッチ903経由で出力する。
信号復号化部905は、制御スイッチ902経由で入力した情報源符号をbitrate2に対応する復号化方法で復号化し、復号化により得られた出力信号を制御スイッチ903経由で出力する。
信号復号化部906は、制御スイッチ902経由で入力した情報源符号をbitrate3に対応する復号化方法で復号化し、復号化により得られた出力信号を制御スイッチ903経由で出力する。
以上が、図9を用いた信号復号化部103の構成の説明である。
なお、図9の信号復号化部904〜906の内部構成は、図4の基本レイヤ復号化部407の内部構成と同一であり、入力される情報源符号の種類及び出力される信号の種類のみが異なるので、その説明は省略する。
このように、受信側の環境雑音によるマスキング効果を考慮して、環境雑音によるマスキングレベルに応じて送信側の伝送ビットレートを制御することにより、効率的な音声・楽音信号の符号化を行うことができる。
(実施の形態2)
ここで、上述したCELP等の音声符号化方法は、音声の音源・声道モデルを用いるため、人間の音声については効率的に符号化することができるが、例えば背景に存在する環境雑音等のような人間の音声以外の成分に関しては効率的に符号化することはできない。従って、送信側に環境雑音が存在した場合に、その環境雑音を含む送信側の音声・楽音信号を、環境雑音が存在しない場合と同等の品質で符号化するためには、送信側に環境雑音が存在しない場合よりも多くのビットが必要となる。
実施の形態2では、受信側における環境雑音に加え、送信側における環境雑音も考慮して伝送ビットレートを制御する場合について説明する。
図10は、本発明の実施の形態2に係る通信端末装置の構成を示すブロック図である。なお、図10に示す通信端末装置1000、1050において、図2に示した通信端末装置100、150と共通する構成部分には図2と同一の符号を付して説明を省略する。
図10の通信端末装置1000は、図2の通信端末装置100と比較して伝送モード決定部1001の作用が伝送モード決定部101と異なる。また、図10の通信端末装置1050は、図2の通信端末装置150と比較して伝送モード決定部1051の作用が伝送モード決定部151と異なる。
伝送モード決定部1001は、入力信号中の音声・楽音信号の背景に含まれる環境雑音を検知し、その環境雑音のレベルに応じて相手側通信端末である通信端末装置1050から伝送される信号の伝送ビットレートを制御する伝送モードを決定し、決定した伝送モードを示す伝送モード情報を伝送路110に出力する。また、伝送モード決定部1001は、入力信号中の環境雑音のレベル及び通信端末装置1050から伝送路110を介して伝送される伝送モード情報に基づいて符号化/復号化する際の伝送ビットレートを制御する伝送モードを決定し、決定した伝送モードを示す伝送モード情報を信号符号化部102及び信号復号化部103に出力する。
次に、図10の伝送モード決定部1001の内部構成について、図11を用いて説明する。伝送モード決定部1001は、マスキングレベル算出部1101と、伝送モード判定部1102とから主に構成される。なお、ここでは各フレームを処理する毎に、環境雑音のレベルを判定し、出力する処理を行う場合について説明するが、この他に、通信端末のユーザからのボタン押下などをトリガとして以下の処理を行う、あるいは、ある一定時間間隔ごとに以下の処理を行うことも可能である。
マスキングレベル算出部1101は、図3のマスキングレベル算出部301と同様に、入力信号からマスキングレベルを算出し、算出されたマスキングレベルを伝送モード判定部1102に出力する。
伝送モード判定部1102は、マスキングレベル算出部1101から出力されたマスキングレベルと所定の閾値との比較結果に基づいて、送信側における環境雑音を考慮して伝送ビットレートを制御する伝送モードを決定し、決定した伝送モードを示す情報(以下、「第1伝送モード情報」という)を伝送路110に出力する。また、伝送モード判定部1102は、第1伝送モード情報、及び、通信端末装置1050から伝送路110を介して伝送される伝送モード情報(以下、「第2伝送モード情報」という)に基づいて、送信側及び受信側における環境雑音を考慮して伝送ビットレートを制御する伝送モードを決定し、決定した伝送モードを示す情報(以下、「第3伝送モード情報」という)を信号符号化部102及び信号復号化部103に出力する。
ここで、伝送モード決定部1001が、所定期間の入力信号のパワー値の最大値と最小値を算出し、最大値と最小値とから、入力信号に含まれる環境雑音のレベルを判定し、そのレベルに応じてビットレートを制御する方法を採る場合における伝送モード判定部1102の処理について説明する。
まず、伝送モード判定部1102は、マスキングレベル算出部1101から出力されたPframeMIN、PframeMAXから、第1伝送モード情報Mode'1を以下の式4により決定する。
Figure 0004464707
なお、Th'0は、実施の形態1で説明した予備実験と同様の実験により、環境雑音の聴感マスキング効果に基づいて予め定められた定数である。
次に、伝送モード判定部1102は、第1伝送モード情報Mode'1を伝送路110に出力する。
また、伝送モード判定部1102は、通信端末装置1050から伝送路110を介して伝送される第2伝送モード情報Mode'2を用いて、以下の式5により、第3伝送モード情報Mode'3を求め、信号符号化部102及び信号復号化部103に出力する。
Figure 0004464707
以上が、図10の伝送モード決定部1001の内部構成の説明である。
なお、図10における伝送モード決定部1051の構成は、図10の伝送モード決定部1001の構成と同一である。
このように、受信側において自動車や電車の走行音等が存在した場合、受信側においてそのような環境雑音を認識し、環境雑音によるマスキング効果を利用することにより、送信側は、音声・楽音信号を、人間の聴感に影響のない範囲で最小限の伝送ビットレートを用いて通信することが可能となり、それによって回線効率を大幅に向上させることができる。また、受信側の環境雑音に加え、送信側における環境雑音の情報を検知し、これを音声・楽音信号の符号化に利用することにより、さらに効率的な通信が可能となる。
(実施の形態3)
実施の形態3では、携帯電話等の携帯端末を利用した音楽配信サービスに代表される単方向通信に関して、本発明の伝送モード情報決定方法を適用した例を説明する。
図12は、実施の形態3に係る通信装置の構成を示すブロック図である。図12において、通信装置1200は音楽配信サービスを受けるユーザ側の通信端末装置であり、通信装置1250は音楽配信のサーバ側の基地局装置である。
通信装置1200は、伝送モード決定部1201と、信号復号化部1202とから主に構成される。通信装置1250は信号符号化部1251を有する。
伝送モード決定部1201は、音声・楽音信号である入力信号の背景に含まれる環境雑音を検知し、その環境雑音のレベルに応じて通信装置1250における伝送ビットレートを制御する伝送モードを決定し、これを伝送モード情報として伝送路110及び信号復号化部1202に出力する。
信号符号化部1251は、伝送路110を介して伝送された伝送モード情報に基づいて入力信号を符号化した後、伝送モード情報と統合し、これを符号化情報として伝送路110に出力する。
信号復号化部1202は、伝送路110を介して伝送される符号化情報を復号化し、得られる復号化信号を出力信号として出力する。なお、信号復号化部1202は、伝送路110から出力される符号化情報に含まれる伝送モード情報と伝送モード決定部1201から得られる伝送モード情報とを、伝送遅延を考慮した上で比較することにより、伝送誤りを検出することができる。具体的には、伝送遅延を考慮した伝送モード決定部1201から得られる伝送モード情報と伝送路110から出力される符号化情報に含まれる伝送モード情報とが異なる場合には、信号復号化部1202は、伝送路110において伝送誤りが発生したと判断する。また、通信装置1250の信号符号化部1251では、符号化情報に伝送モード情報を統合せずに、信号復号化部1202では、伝送モード決定部1201から得られる伝送モード情報を用いて、伝送路110から出力される符号化情報を復号化するという手法を採ることも可能である。
なお、図12の伝送モード決定部1201、信号符号化部1202、信号復号化部1251の内部構成は、それぞれ図2に示した伝送モード決定部101、信号符号化部102、信号復号化部103と同一であるので、それらの構成についての詳しい説明は省略する。
このように、本実施の形態によれば、音楽配信サービス等の単方向通信システムにおいても、通信装置における環境雑音を検知し、環境雑音による聴感マスキング効果を利用して伝送モード情報を決定することにより、基地局装置は、音声・楽音信号を、人間の聴感に影響のない範囲で最小限の伝送ビットレートを用いて通信することが可能となり、それによって回線効率を大幅に向上させることができる。
(実施の形態4)
実施の形態4では、相手側から送信されてきた符号化情報を復号化し、得られる復号化信号に含まれる環境雑音を検知することにより伝送モードを決定する場合について説明する。
図13は、実施の形態4に係る通信端末装置の構成を示すブロック図である。なお、図13に示す通信端末装置1300、1350において、図2に示した通信端末装置100、150と共通する構成部分には図2と同一の符号を付して説明を省略する。
図13の通信端末装置1300は、図2の通信端末装置100と比較して伝送モード決定部1301の作用が伝送モード決定部101と異なる。また、図13の通信端末装置1350は、図2の通信端末装置150と比較して伝送モード決定部1351の作用が伝送モード決定部151と異なる。
伝送モード決定部1301は、復号化信号に含まれる環境雑音を検知し、その環境雑音のレベルに応じて符号化する際の伝送ビットレートを制御する伝送モードを決定し、決定した伝送モードを示す伝送モード情報を信号符号化部102に出力する。
次に、図13の伝送モード決定部1301の内部構成について、図14を用いて説明する。伝送モード決定部1301は、マスキングレベル算出部1401と、伝送モード判定部1402とから主に構成される。なお、図13の伝送モード決定部1301は、図2の伝送モード決定部101と同様、各フレームを処理する毎に環境雑音のレベルを判定し、出力する処理を行うと手法の他に、通信端末のユーザからのボタン押下などをトリガとして以下の処理を行う、あるいは、ある一定時間間隔ごとに以下の処理を行うといったことも可能である。
マスキングレベル算出部1401は、図3のマスキングレベル算出部301と同様に、信号復号化部103から出力された復号化信号からマスキングレベルを算出し、算出されたマスキングレベルを伝送モード判定部1402に出力する。
伝送モード判定部1402は、図3の伝送モード判定部302と同様に、マスキングレベル算出部1401から出力されたマスキングレベルと所定の閾値とを比較し、比較結果に基づいて伝送ビットレートを制御する伝送モードを決定し、決定した伝送モードを示す伝送モード情報を信号符号化部102に出力する。
なお、図13における伝送モード決定部1351の内部構成は、伝送モード決定部1301の構成と同じであるので、その詳しい説明は省略する。
このように、本実施の形態によれば、相手側から送信されてきた符号化情報を復号化し、得られる復号化信号に含まれる環境雑音を検知することにより、その環境雑音のマスキング効果を利用することができ、非常に効率的な信号の符号化ができる。
(実施の形態5)
実施の形態5では、復号化信号に含まれる受信側における環境雑音に加え、送信側における環境雑音も利用して伝送モードを決定する場合について説明する。
図15は、実施の形態5に係る通信端末装置の構成を示すブロック図である。なお、図15に示す通信端末装置1500、1550において、図2に示した通信端末装置100、150と共通する構成部分には図2と同一の符号を付して説明を省略する。
図15の通信端末装置1500は、図2の通信端末装置100と比較して伝送モード決定部1501の作用が伝送モード決定部101と異なる。また、図15の通信端末装置1550は、図2の通信端末装置150と比較して伝送モード決定部1551の作用が伝送モード決定部151と異なる。
伝送モード決定部1501は、入力信号中の音声・楽音信号の背景に含まれる環境雑音を検知し、さらに復号化信号に含まれる環境雑音を検知し、その環境雑音のレベルに応じて符号化する際の伝送ビットレートを制御する伝送モードを決定し、決定した伝送モードを示す伝送モード情報を信号符号化部102に出力する。
次に、図15の伝送モード決定部1501の内部構成について、図16を用いて説明する。伝送モード決定部1501は、マスキングレベル算出部1601と、伝送モード判定部1602とから主に構成される。なお、図15の伝送モード決定部1501は、図2の伝送モード決定部101と同様、各フレームを処理する毎に環境雑音のレベルを判定し、出力する処理を行うと手法の他に、通信端末のユーザからのボタン押下などをトリガとして以下の処理を行う、あるいは、ある一定時間間隔ごとに以下の処理を行うといったことも可能である。
マスキングレベル算出部1601は、入力信号と、信号復号化部103から出力された復号化信号とからマスキングレベルを算出し、算出されたマスキングレベルを伝送モード判定部1602に出力する。
伝送モード判定部1602は、図3の伝送モード判定部302と同様に、マスキングレベル算出部1601から出力されたマスキングレベルと所定の閾値とを比較し、比較結果に基づいて伝送ビットレートを制御する伝送モードを決定し、決定した伝送モードを示す伝送モード情報を信号符号化部102に出力する。
ここで、伝送モード決定部1501が、所定期間の入力信号のパワー値の最大値と最小値を算出し、最大値と最小値とから、入力信号に含まれる環境雑音のレベルを判定し、そのレベルに応じてビットレートを制御する方法を採る場合におけるマスキングレベル算出部1601及び伝送モード判定部1602の処理について説明する。
マスキングレベル算出部1601は、入力信号をNサンプルずつ区切り(Nは自然数)、同区間を1フレームとしてフレーム毎に処理を行う。以下、符号化の対象となる入力信号をu'(n=0,・・・,N-1)と表す。
また、マスキングレベル算出部1601は、内部にバッファbufu'(i=0,・・・,N-1)を有する。
次に、マスキングレベル算出部1601は、処理対象であるフレームのフレームパワーPframeu'を以下の式6により求める。
Figure 0004464707
次に、マスキングレベル算出部1601は、式6により求めたフレームパワーPframeu'をバッファbufu'Ni-1に代入する。
次に、マスキングレベル算出部1601は、i区間(区間長N)におけるフレームパワーPframeu'の最小値Pframeu'MINと最大値Pframeu'MAXを求め、Pframeu'MIN、Pframeu'MAXを伝送モード判定部1602に出力する。
次に、マスキングレベル算出部1601は、以下の式7によりバッファbufu'を更新する。
Figure 0004464707
次に、マスキングレベル算出部1601は、信号復号化部103から出力される復号化信号をNサンプルずつ区切り(Nは自然数)、Nサンプルを1フレームとしてフレーム毎に処理を行う。以下、符号化の対象となる復号化信号u"n(n=0,・・・,N-1)と表す。
また、マスキングレベル算出部1601は、内部にバッファbufu"(i=0,・・・,N-1)を有する。
次に、マスキングレベル算出部1601は、処理対象であるフレームのフレームパワーPframeu"を以下の式8により求める。
Figure 0004464707
次に、マスキングレベル算出部1601は、式8により求めたフレームパワーPframeu"をバッファbufu"Ni-1に代入する。
次に、マスキングレベル算出部1601は、i区間(区間長N)におけるフレームパワーPframeu"の最小値Pframeu"MINと最大値Pframeu"MAXを求め、Pframeu"MIN、Pframeu"MAXを伝送モード判定部1602に出力する。
次に、マスキングレベル算出部1601は、以下の式9によりバッファbufu"を更新する。
Figure 0004464707
以上が、図16のマスキングレベル算出部1601における処理の説明である。
次に、伝送モード判定部1602における処理について説明する。伝送モード判定部1602は、マスキングレベル算出部1601から出力されたPframeu'MIN、Pframeu'MAXから、伝送モード情報Modeu'1を以下の式10により決定する。
Figure 0004464707
ここで、Thu'0は、上述した予備実験と同様の実験により、環境雑音の聴感マスキング効果に基づいて予め定められた定数である。
次に、伝送モード判定部1602は、マスキングレベル算出部1601から出力されたPframeu"MIN、Pframeu"MAXから、伝送モード情報Modeu'2を以下の式11により決定する。
Figure 0004464707
ここで、Thu"0は、上述した予備実験と同様の実験により、環境雑音の聴感マスキング効果に基づいて予め定められた定数である。
次に、伝送モード判定部1602は、伝送モード情報Modeu'1と伝送モード情報Modeu'2を用いて、以下の式12により、伝送モード情報Modeu'3を求め、信号符号化部102に出力する。
Figure 0004464707
以上が、図15の伝送モード決定部1501の内部構成の説明である。
なお、図15の伝送モード決定部1551の内部構成は、伝送モード決定部1501と同一であり、説明を省略する。
このように、本実施の形態によれば、受信側において自動車や電車の走行音等が存在した場合、送信側において、受信側から伝送されてきた音声・楽音信号に含まれる環境雑音を認識し、環境雑音によるマスキング効果を利用することにより、送信側は、人間の聴感に影響のない範囲で最小限の伝送ビットレートを用いて通信することが可能となり、それにより回線効率が大幅に向上する。また、受信側の環境雑音に加え、送信側における環境雑音の情報を検知し、それを音声・楽音信号符号化に利用することにより、より効率的な通信が可能となる。
(実施の形態6)
実施の形態6では、スケーラブル符号化方式により通信が行われている環境において、伝送路110にある中継局が各通信端末装置から伝送される伝送ビットレートを調整する場合について説明する。
図17は、本発明の実施の形態6に係る通信端末装置及び中継局の構成を示すブロック図である。また、図17の通信端末装置1700、1750の通信途中に中継局1730が存在する。なお、図17に示す通信端末装置1700、1750において、図2に示した通信端末装置100、150と共通する構成部分には図2と同一の符号を付して説明を省略する。
図17の通信端末装置1700は、図2の通信端末装置100と比較して伝送モード決定部1701、信号符号化部1702の作用がそれぞれ伝送モード決定部101、信号符号化部102と異なる。また、図17の通信端末装置1750は、図2の通信端末装置150と比較して伝送モード決定部1751、信号符号化部1752の作用がそれぞれ伝送モード決定部151、信号符号化部152と異なる。
伝送モード決定部1701は、入力信号中の音声・楽音信号の背景に含まれる環境雑音を検知し、その環境雑音のレベルに応じて符号化する際の伝送ビットレートを制御する伝送モードを決定し、決定した伝送モードを示す伝送モード情報を伝送路110及び信号復号化部103に出力する。なお、図17の伝送モード決定部1701は、図2の伝送モード決定部101と同様、各フレームを処理する毎に環境雑音のレベルを判定し、出力する処理を行うと手法の他に、通信端末のユーザからのボタン押下などをトリガとして以下の処理を行う、あるいは、ある一定時間間隔ごとに以下の処理を行うといったことも可能である。
信号符号化部1702は、入力信号と初期伝送モード情報を入力し、初期伝送モード情報に応じて、入力信号を符号化し、得られた符号化情報を伝送路110に出力する。なお、信号符号化部1702の内部構成は、図4に示した信号符号化部102と比較して伝送モード情報を初期伝送モード情報に置き換えたものとなる。
伝送モード決定部1751は、入力信号中の音声・楽音信号の背景に含まれる環境雑音を検知し、その環境雑音のレベルに応じて符号化する際の伝送ビットレートを制御する伝送モードを決定し、決定した伝送モードを示す伝送モード情報を伝送路110及び信号復号化部153に出力する。
信号符号化部1752は、入力信号と初期伝送モード情報を入力し、初期伝送モード情報に応じて入力信号を符号化し、得られた情報源符号及び初期伝送モード情報を統合し、これを符号化情報として伝送路110に出力する。
なお、通信端末装置1700、1750における初期伝送モード情報ModeAは、以下の式13に表されるものとする。
Figure 0004464707
なお、図17の伝送モード決定部1751の内部構成は、伝送モード決定部1701と同一であるため説明を省略する。
次に、中継局1730の内部構成について図18を用いて説明する。なお、図18では、通信端末装置1750からの伝送モード情報に応じて、通信端末装置1700からの符号化情報の伝送ビットレートを制御する場合について説明するが、通信端末装置1700からの伝送モード情報に応じて、通信端末装置1750からの符号化情報の伝送ビットレートを制御する場合についても同様である。
中継局1730は、インターフェース部1801と、符号化情報解析部1802と、伝送モード変換部1803と、符号化情報統合部1804と、インターフェース部1805とから主に構成される。
インターフェース部1801は、通信端末装置1700から伝送される情報を伝送路110経由で入力し、通信端末装置1750への情報を伝送路110経由で伝送する。
符号化情報解析部1802は、通信端末装置1700から伝送された情報を解析し、信号符号化部1702内の各レイヤで符号化された情報源符号と初期伝送モード情報ModeAとに分離し、それらの情報を伝送モード変換部1803に出力する。
伝送モード変換部1803は、通信端末装置1750から伝送された伝送モード情報ModeBに応じて、情報源符号及び初期伝送モード情報ModeAに対して、伝送ビットレート変換処理を行う。具体的には、伝送モード変換部1803は、初期伝送モード情報ModeAがbitrate1であり、伝送モード情報ModeBがbitrate2である場合には、初期伝送モード情報ModeAをbitrate2と変更し、基本レイヤ情報源符号と、第1拡張レイヤ情報源符号と、初期伝送モード情報ModeAとを符号化情報統合部1804に出力する。また、伝送モード変換部1803は、初期伝送モード情報ModeAがbitrate1であり、伝送モード情報ModeBがbitrate3である場合には、初期伝送モード情報ModeAをbitrate3と変更し、基本レイヤ情報源符号と、初期伝送モード情報ModeAとを符号化情報統合部1804に出力する。また、伝送モード変換部1803は、伝送モード情報ModeAがbitrate2であり、伝送モード情報ModeBがbitrate3である場合には、初期伝送モード情報ModeAをbitrate3と変更し、基本レイヤ情報源符号と、初期伝送モード情報ModeAとを符号化情報統合部1804に出力する。また、伝送モード変換部1803は、初期伝送モード情報ModeA、伝送モード情報ModeBが上記以外の組み合わせの場合は、情報源符号及び初期伝送モード情報ModeAをそのまま符号化情報統合部1804に出力する。
符号化情報統合部1804は、伝送モード変換部1803から得られる情報源符号、及び初期伝送モード情報ModeAを入力し、これらを統合し、変換後符号化情報としてインターフェース部1805に出力する。
インターフェース部1805は、通信端末装置1750から伝送される情報を伝送路110経由で入力し、通信端末装置1700への情報を伝送路110経由で伝送する。
以上が、図17の中継局1730の構成についての説明である。
このように、本実施の形態によれば、受信側において自動車や電車の走行音等の環境雑音が存在した場合に、送信側ではなく、中継局においても伝送ビットレートを制御することができる。これにより、より柔軟な伝送ビットレート制御が可能となり、更なる回線効率の向上を図ることができる。
なお、本実施の形態では、中継局が、受信側における環境雑音に加え、送信側における環境雑音も利用して伝送ビットレートを制御する伝送モードを決定することもできる。
図19は、この場合の中継局1730の構成を示すブロック図であり、伝送モード変換部1901の作用が図18の伝送モード変換部1803と異なる。伝送モード変換部1901は、通信端末装置1700からの伝送モード情報ModeA'と伝送モード情報ModeBとに応じて、情報源符号及び初期伝送モード情報ModeAに対して、伝送ビットレート変換処理を行う。具体的には、伝送モード変換部1901は、初期伝送モード情報ModeAがbitrate1であり、伝送モード情報ModeBがbitratehighであり、かつ伝送モード情報ModeA'がbitratehighである場合には、初期伝送モード情報ModeAをbitrate2と変更し、基本レイヤ情報源符号と、第1拡張レイヤ情報源符号と、初期伝送モード情報ModeAとを符号化情報統合部1804に出力する。また、伝送モード変換部1901は、初期伝送モード情報ModeAがbitrate1であり、伝送モード情報ModeBがbitratelowであり、かつ伝送モード情報ModeA'がbitratelowである場合には、初期伝送モード情報ModeAをbitrate2と変更し、基本レイヤ情報源符号と、第1拡張レイヤ情報源符号と、初期伝送モード情報ModeAとを符号化情報統合部1804に出力する。また、伝送モード変換部1901は、初期伝送モード情報ModeAがbitrate1であり、伝送モード情報ModeBがbitratelowであり、かつ伝送モード情報ModeA'がbitratehighである場合には、初期伝送モード情報ModeAをbitrate3と変更し、基本レイヤ情報源符号と、初期伝送モード情報ModeAとを符号化情報統合部1804に出力する。また、伝送モード変換部1901は、初期伝送モード情報ModeAがbitrate2であり、伝送モード情報ModeBがbitratelowであり、かつ伝送モード情報ModeA'がbitratehighである場合には、初期伝送モード情報ModeAをbitrate3と変更し、基本レイヤ情報源符号と、伝送モード情報ModeAとを符号化情報統合部1804に出力する。また、伝送モード変換部1901は、初期伝送モード情報ModeA、伝送モード情報ModeB及び伝送モード情報ModeA'が上記以外の組み合わせの場合には、情報源符号及び伝送モード情報ModeAをそのまま符号化情報統合部1804に出力する。
このように、本実施の形態によれば、受信側及び送信側において自動車や電車の走行音等の環境雑音が存在した場合に、送信側ではなく、中継局においても伝送ビットレートを制御することができる。これにより、より柔軟な伝送ビットレート制御が可能となり、更なる回線効率の向上を図ることができる。
なお、本実施の形態と上記実施の形態3とを組み合わせることにより、音声・楽音信号の単方向通信方式通信がスケーラブル符号化方式により行われている環境において、伝送路110にある中継局が存在した場合に、その中継局が、通信端末から伝送される伝送モード情報を利用し、基地局から伝送される符号化情報の情報量を削減し、再び伝送路110に送出することもできる。
本発明は、パケット通信システムや移動通信システムの通信端末装置に用いるに好適である。
聴感マスキング効果を説明する図 本発明の実施の形態1に係る通信端末装置の構成を示すブロック図 上記実施の形態に係る通信端末装置の伝送モード決定部の内部構成を示すブロック図 上記実施の形態に係る通信端末装置の信号符号化部の内部構成を示すブロック図 上記実施の形態に係る通信端末装置の基本レイヤ符号化部の内部構成を示すブロック図 上記実施の形態に係る通信端末装置の基本レイヤ復号化部の内部構成を示すブロック図 上記実施の形態に係る通信端末装置の信号復号化部の内部構成を示すブロック図 上記実施の形態に係る通信端末装置の信号符号化部の内部構成を示すブロック図 上記実施の形態に係る通信端末装置の信号復号化部の内部構成を示すブロック図 本発明の実施の形態2に係る通信端末装置の構成を示すブロック図 上記実施の形態に係る通信端末装置の伝送モード決定部の内部構成を示すブロック図 本発明の実施の形態3に係る通信装置の構成を示すブロック図 本発明の実施の形態4に係る通信端末装置の構成を示すブロック図 上記実施の形態に係る通信端末装置の伝送モード決定部の内部構成を示すブロック図 本発明の実施の形態5に係る通信端末装置の構成を示すブロック図 上記実施の形態に係る通信端末装置の伝送モード決定部の内部構成を示すブロック図 本発明の実施の形態6に係る通信端末装置及び中継局の構成を示すブロック図 上記実施の形態に係る中継局の構成を示すブロック図 上記実施の形態に係る中継局の構成を示すブロック図
符号の説明
101、151、1001、1051、1201、1301、1351、1501、1551、1701、1751 伝送モード決定部
102、152、1251、1702、1752 信号符号化部
103、153、1202 信号復号化部
301、1101、1401、1601 マスキングレベル算出部
302、1102、1402、1602 伝送モード判定部
1801、1805 インターフェース部
1802 符号化情報解析部
1803、1901 伝送モード変換部
1804 符号化情報統合部

Claims (8)

  1. 入力信号からマスキングレベルを算出するマスキングレベル算出手段と、
    前記マスキングレベルに基づいて第1伝送モード情報を決定し、前記第1伝送モード情報と、通信相手の装置における環境雑音のレベルに基づく第2伝送モード情報とにより第3伝送モード情報を決定する伝送モード判定手段と、
    前記第3伝送モード情報に対応した伝送ビットレートで入力信号を符号化し、符号化によって得られた情報源符号と前記第1伝送モードとを前記通信相手の装置に伝送する符号化手段と、を具備し、
    前記第1伝送モード情報は、前記マスキングレベルの所定期間における最大値を最小値で除した値と、所定の閾値との比較結果に基づいて高ビットレート又は低ビットレートのいずれかで表され、
    前記第2伝送モード情報は、通信相手の装置における環境雑音のレベルに応じて高ビットレート又は低ビットレートのいずれかで表され、
    前記伝送モード判定手段は、
    前記第1伝送モード情報が低ビットレートかつ前記第2伝送モード情報が高ビットレートで有る場合に第1ビットレートを示し、
    前記第1伝送モード情報が高ビットレートかつ前記第2伝送モード情報が高ビットレート、あるいは、前記第1伝送モード情報が低ビットレートかつ前記第2伝送モード情報が低ビットレートで有る場合に前記第1ビットレートよりも低い第2ビットレートを示し、
    前記第1伝送モード情報が高ビットレートかつ前記第2伝送モード情報が低ビットレートで有る場合に前記第2ビットレートよりも低い第3ビットレートを示す、第3伝送モード情報を決定する、
    通信装置。
  2. 通信相手の装置にて符号化して得られた情報源符号を復号化する復号化手段と、
    入力信号から第1マスキングレベルを算出し、前記復号化手段が復号化した信号から第2マスキングレベルを算出するマスキングレベル算出手段と、
    前記第1マスキングレベルに基づいて第1伝送モード情報を決定し、前記第2マスキングレベルに基づいて第2伝送モード情報を決定し、前記第1伝送モード情報と前記第2伝送モード情報とにより第3伝送モード情報を決定する伝送モード判定手段と、
    前記第3伝送モード情報に対応した伝送ビットレートで前記入力信号を符号化し、符号化によって得られた情報源符号を前記通信相手の装置に伝送する符号化手段と、を具備し、
    前記第1伝送モード情報は、前記第1マスキングレベルの所定期間における最大値を最小値で除した値と、所定の閾値との比較結果に基づいて高ビットレート又は低ビットレートのいずれかで表され、
    前記第2伝送モード情報は、前記第2マスキングレベルの所定期間における最大値を最小値で除した値と、所定の閾値との比較結果に基づいて高ビットレート又は低ビットレートのいずれかで表され、
    前記伝送モード判定手段は、
    前記第1伝送モード情報が低ビットレートかつ前記第2伝送モード情報が高ビットレートで有る場合に第1ビットレートを示し、
    前記第1伝送モード情報が高ビットレートかつ前記第2伝送モード情報が高ビットレート、あるいは、前記第1伝送モード情報が低ビットレートかつ前記第2伝送モード情報が低ビットレートで有る場合に前記第1ビットレートよりも低い第2ビットレートを示し、
    前記第1伝送モード情報が高ビットレートかつ前記第2伝送モード情報が低ビットレートで有る場合に前記第2ビットレートよりも低い第3ビットレートを示す、第3伝送モード情報を決定する、
    通信装置。
  3. 前記伝送モード判定手段は、ユーザの指示に基づくタイミングで前記第3伝送モード情報を決定する処理を行う請求項1又は請求項2記載の通信装置。
  4. 前記伝送モード判定手段は、前記第3伝送モード情報を決定する処理を定期的に行う請求項1又は請求項2記載の通信装置。
  5. 前記伝送モード判定手段は、検知した環境雑音のレベルと前回検知したものとの差が所定の閾値より大きい場合に前記第3伝送モード情報を決定する処理を行う請求項1又は請求項2記載の通信装置。
  6. 請求項1から請求項5のいずれかに記載の通信装置を具備する基地局装置。
  7. 請求項1から請求項5のいずれかに記載の通信装置を具備する通信端末装置。
  8. 第1通信装置と第2通信装置とが中継局を経由して無線通信を行う通信システムの前記中継局であって、
    予め設定されたビットレートで前記第1通信装置にて入力信号を符号化して得られた情報源符号、前記予め設定されたビットレートを示す初期伝送モード情報、及び前記第1通信装置の入力信号に含まれる環境雑音のレベルに基づいて設定される第1伝送モード情報を前記第1通信装置から入力する第1インターフェース手段と、
    前記第2通信装置の入力信号に含まれる環境雑音のレベルに応じて前記第1通信装置から伝送される信号の伝送ビットレートを制御する第2伝送モード情報を前記第2通信装置から入力する第2インターフェース手段と、
    前記初期伝送モード情報、前記第1伝送モード情報及び前記第2伝送モード情報が所定の関係に有る場合に前記初期伝送モード情報を変更して第3伝送モード情報とし、他の場合に前記初期伝送モード情報をそのまま第3伝送モード情報とし、前記情報源符号を前記第3伝送モード情報に応じた伝送ビットレートに変換する伝送モード変換手段と、
    変換後の情報源符号と前記第3伝送モードとを統合し、統合後の情報を前記第2インターフェース手段を介して第2通信装置に伝送する符号化情報統合手段と、を具備し、
    前記初期伝送モード情報は、第1ビットレート、前記第1ビットレートよりも低い第2ビットレート又は前記第2ビットレートよりも低い第3ビットレートのいずれかで表され、
    前記第1伝送モード情報は、高ビットレート又は低ビットレートのいずれかで表され、
    前記第2伝送モード情報は、高ビットレート又は低ビットレートのいずれかで表され、
    前記伝送モード変換手段は、
    前記初期伝送モード情報が第1ビットレートであって、前記第1伝送モード情報が高ビットレートかつ前記第2伝送モード情報が高ビットレート、あるいは、前記第1伝送モード情報が低ビットレートかつ前記第2伝送モード情報が低ビットレートで有る場合に、前記初期伝送モード情報を第2ビットレートに変更して前記第3伝送モード情報とし、
    前記初期伝送モード情報が第1ビットレートあるいは第2ビットレートであって、前記第1伝送モード情報が低ビットレートかつ前記第2伝送モード情報が高ビットレートで有る場合に前記初期伝送モード情報を第3ビットレートに変更して前記第3伝送モード情報とする、
    中継局。
JP2004048569A 2004-02-24 2004-02-24 通信装置 Expired - Fee Related JP4464707B2 (ja)

Priority Applications (11)

Application Number Priority Date Filing Date Title
JP2004048569A JP4464707B2 (ja) 2004-02-24 2004-02-24 通信装置
DE602005009501T DE602005009501D1 (de) 2004-02-24 2005-02-22 Kommunikationseinrichtung, signalcodierungs-/ -decodierungsverfahren
CA002557000A CA2557000A1 (en) 2004-02-24 2005-02-22 Communication device, signal encoding/decoding method
US10/590,417 US7653539B2 (en) 2004-02-24 2005-02-22 Communication device, signal encoding/decoding method
EP08011802A EP1968047B1 (en) 2004-02-24 2005-02-22 Communication apparatus and communication method
CN2010101561255A CN101819781B (zh) 2004-02-24 2005-02-22 通信装置和通信方法
PCT/JP2005/002764 WO2005081232A1 (ja) 2004-02-24 2005-02-22 通信装置及び信号符号化/復号化方法
CN2005800057013A CN1922660B (zh) 2004-02-24 2005-02-22 通信装置和通信方法
DE602005017952T DE602005017952D1 (de) 2004-02-24 2005-02-22 Kommunikationsvorrichtung und Kommunikationsverfahren
KR1020067017018A KR20060131851A (ko) 2004-02-24 2005-02-22 통신 장치 및 신호 부호화/복호화 방법
EP05710495A EP1720154B1 (en) 2004-02-24 2005-02-22 Communication device, signal encoding/decoding method

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2004048569A JP4464707B2 (ja) 2004-02-24 2004-02-24 通信装置

Publications (2)

Publication Number Publication Date
JP2005241761A JP2005241761A (ja) 2005-09-08
JP4464707B2 true JP4464707B2 (ja) 2010-05-19

Family

ID=34879519

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2004048569A Expired - Fee Related JP4464707B2 (ja) 2004-02-24 2004-02-24 通信装置

Country Status (8)

Country Link
US (1) US7653539B2 (ja)
EP (2) EP1968047B1 (ja)
JP (1) JP4464707B2 (ja)
KR (1) KR20060131851A (ja)
CN (2) CN101819781B (ja)
CA (1) CA2557000A1 (ja)
DE (2) DE602005017952D1 (ja)
WO (1) WO2005081232A1 (ja)

Families Citing this family (21)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2007114291A1 (ja) * 2006-03-31 2007-10-11 Matsushita Electric Industrial Co., Ltd. 音声符号化装置、音声復号化装置、およびこれらの方法
US8619623B2 (en) 2006-08-08 2013-12-31 Marvell World Trade Ltd. Ad-hoc simple configuration
US8233456B1 (en) 2006-10-16 2012-07-31 Marvell International Ltd. Power save mechanisms for dynamic ad-hoc networks
US8732315B2 (en) 2006-10-16 2014-05-20 Marvell International Ltd. Automatic ad-hoc network creation and coalescing using WiFi protected setup
US9308455B1 (en) 2006-10-25 2016-04-12 Marvell International Ltd. System and method for gaming in an ad-hoc network
JP4871894B2 (ja) 2007-03-02 2012-02-08 パナソニック株式会社 符号化装置、復号装置、符号化方法および復号方法
US8628420B2 (en) 2007-07-03 2014-01-14 Marvell World Trade Ltd. Location aware ad-hoc gaming
US7987285B2 (en) 2007-07-10 2011-07-26 Bytemobile, Inc. Adaptive bitrate management for streaming media over packet networks
US7991904B2 (en) 2007-07-10 2011-08-02 Bytemobile, Inc. Adaptive bitrate management for streaming media over packet networks
CN101430880A (zh) * 2007-11-07 2009-05-13 华为技术有限公司 一种背景噪声的编解码方法和装置
US8775665B2 (en) * 2009-02-09 2014-07-08 Citrix Systems, Inc. Method for controlling download rate of real-time streaming as needed by media player
CN102376306B (zh) * 2010-08-04 2013-01-23 华为技术有限公司 语音帧等级的获取方法及装置
WO2012170904A2 (en) 2011-06-10 2012-12-13 Bytemobile, Inc. Adaptive bitrate management on progressive download with indexed media files
CN103828324B (zh) 2011-06-10 2017-11-28 茨特里克斯***公司 用于自适应比特率管理的方法、设备和***
US9560392B2 (en) * 2012-09-07 2017-01-31 Google Inc. Dynamic bit rate encoding
CN103516483B (zh) * 2013-08-29 2016-08-10 天津大学 传输速率可按需调节的远距离有线数据传输装置
CN103780345A (zh) * 2014-01-21 2014-05-07 清华大学 密集通信中实时业务的多缓冲非恒速码传输***和方法
CN105280188B (zh) * 2014-06-30 2019-06-28 美的集团股份有限公司 基于终端运行环境的音频信号编码方法和***
JP6317235B2 (ja) * 2014-11-07 2018-04-25 日本電信電話株式会社 コンテンツサーバ装置、コンテンツサーバ装置の動作方法およびコンピュータプログラム
CN104485112B (zh) * 2014-12-08 2017-12-08 福建联迪商用设备有限公司 一种基于音频通讯中的音频解码方法及其装置
JP7262593B2 (ja) 2019-01-13 2023-04-21 華為技術有限公司 ハイレゾリューションオーディオ符号化

Family Cites Families (12)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6125179A (en) * 1995-12-13 2000-09-26 3Com Corporation Echo control device with quick response to sudden echo-path change
JP3750705B2 (ja) 1997-06-09 2006-03-01 松下電器産業株式会社 音声符号化伝送方法及び音声符号化伝送装置
US6185244B1 (en) * 1997-08-29 2001-02-06 Telefonaktiebolaget Lm Ericsson Cell searching in a CDMA communications system
US6201796B1 (en) * 1998-05-14 2001-03-13 Broadcom Corporation Startup protocol for high throughput communications systems
JPH11331936A (ja) 1998-05-20 1999-11-30 Oki Electric Ind Co Ltd 移動体通信システム
US6275798B1 (en) * 1998-09-16 2001-08-14 Telefonaktiebolaget L M Ericsson Speech coding with improved background noise reproduction
JP3061039B2 (ja) 1998-10-20 2000-07-10 日本電気株式会社 無音圧縮符号復号化方法及びその装置
JP2000244384A (ja) * 1999-02-18 2000-09-08 Mitsubishi Electric Corp 移動通信端末装置及び移動通信端末装置における音声符号化レート決定方法
US6760435B1 (en) * 2000-02-08 2004-07-06 Lucent Technologies Inc. Method and apparatus for network speech enhancement
US6898566B1 (en) * 2000-08-16 2005-05-24 Mindspeed Technologies, Inc. Using signal to noise ratio of a speech signal to adjust thresholds for extracting speech parameters for coding the speech signal
JP2003218781A (ja) * 2002-01-24 2003-07-31 Toshiba Corp 通信端末およびネットワーク制御装置
JP2004048569A (ja) 2002-07-15 2004-02-12 Matsushita Electric Ind Co Ltd アンテナ用カバー

Also Published As

Publication number Publication date
CN101819781B (zh) 2012-03-14
WO2005081232A1 (ja) 2005-09-01
EP1720154B1 (en) 2008-09-03
US20080167865A1 (en) 2008-07-10
US7653539B2 (en) 2010-01-26
KR20060131851A (ko) 2006-12-20
DE602005017952D1 (de) 2010-01-07
EP1968047A2 (en) 2008-09-10
DE602005009501D1 (de) 2008-10-16
EP1968047A3 (en) 2008-09-24
EP1720154A1 (en) 2006-11-08
CN101819781A (zh) 2010-09-01
CN1922660B (zh) 2010-06-09
CA2557000A1 (en) 2005-09-01
CN1922660A (zh) 2007-02-28
JP2005241761A (ja) 2005-09-08
EP1720154A4 (en) 2007-02-28
EP1968047B1 (en) 2009-11-25

Similar Documents

Publication Publication Date Title
JP4464707B2 (ja) 通信装置
JP4518714B2 (ja) 音声符号変換方法
US8600740B2 (en) Systems, methods and apparatus for context descriptor transmission
JP5413839B2 (ja) 符号化装置および復号装置
JP5753540B2 (ja) ステレオ信号符号化装置、ステレオ信号復号装置、ステレオ信号符号化方法及びステレオ信号復号方法
JP4263412B2 (ja) 音声符号変換方法
KR100351484B1 (ko) 음성 부호화 장치, 음성 복호화 장치, 음성 부호화 방법 및 기록 매체
WO2004097796A1 (ja) 音声符号化装置、音声復号化装置及びこれらの方法
CN102150202A (zh) 对音频/语音信号进行编码和解码的方法和设备
JP2009539132A (ja) オーディオ信号の線形予測符号化
KR20030041169A (ko) 무성 음성의 코딩 방법 및 장치
JP4445328B2 (ja) 音声・楽音復号化装置および音声・楽音復号化方法
JPH11126098A (ja) 音声合成方法及び装置、並びに帯域幅拡張方法及び装置
KR101610765B1 (ko) 음성 신호의 부호화/복호화 방법 및 장치
US20090271184A1 (en) Scalable encoding device, and scalable encoding method
WO2001065542A1 (fr) Dispositif de codage/decodage de la voix et procede associe
JP4236675B2 (ja) 音声符号変換方法および装置
JP4578145B2 (ja) 音声符号化装置、音声復号化装置及びこれらの方法
JP4373693B2 (ja) 音響信号の階層符号化方法および階層復号化方法
JP2004053763A (ja) 多地点制御装置の音声符号化伝送システム
JP2006072269A (ja) 音声符号化装置、通信端末装置、基地局装置および音声符号化方法
JP2004078235A (ja) 複数レートで動作する無音声符号化を含む音声符号化・復号装置

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20070223

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20090901

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20091102

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20091124

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20100107

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20100126

A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20100219

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20130226

Year of fee payment: 3

R150 Certificate of patent or registration of utility model

Ref document number: 4464707

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

Free format text: JAPANESE INTERMEDIATE CODE: R150

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20130226

Year of fee payment: 3

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20140226

Year of fee payment: 4

S111 Request for change of ownership or part of ownership

Free format text: JAPANESE INTERMEDIATE CODE: R313113

R350 Written notification of registration of transfer

Free format text: JAPANESE INTERMEDIATE CODE: R350

S111 Request for change of ownership or part of ownership

Free format text: JAPANESE INTERMEDIATE CODE: R313113

R350 Written notification of registration of transfer

Free format text: JAPANESE INTERMEDIATE CODE: R350

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

LAPS Cancellation because of no payment of annual fees