JP2011065093A - オーディオ信号補正装置及びオーディオ信号補正方法 - Google Patents

オーディオ信号補正装置及びオーディオ信号補正方法 Download PDF

Info

Publication number
JP2011065093A
JP2011065093A JP2009217941A JP2009217941A JP2011065093A JP 2011065093 A JP2011065093 A JP 2011065093A JP 2009217941 A JP2009217941 A JP 2009217941A JP 2009217941 A JP2009217941 A JP 2009217941A JP 2011065093 A JP2011065093 A JP 2011065093A
Authority
JP
Japan
Prior art keywords
signal
audio signal
music
input audio
sound quality
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Abandoned
Application number
JP2009217941A
Other languages
English (en)
Inventor
Yutaka Yonekubo
裕 米久保
Hirokazu Takeuchi
広和 竹内
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Toshiba Corp
Original Assignee
Toshiba Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Toshiba Corp filed Critical Toshiba Corp
Priority to JP2009217941A priority Critical patent/JP2011065093A/ja
Priority to US12/772,790 priority patent/US20110071837A1/en
Publication of JP2011065093A publication Critical patent/JP2011065093A/ja
Abandoned legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L21/00Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L25/00Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
    • G10L25/78Detection of presence or absence of voice signals
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10HELECTROPHONIC MUSICAL INSTRUMENTS; INSTRUMENTS IN WHICH THE TONES ARE GENERATED BY ELECTROMECHANICAL MEANS OR ELECTRONIC GENERATORS, OR IN WHICH THE TONES ARE SYNTHESISED FROM A DATA STORE
    • G10H2210/00Aspects or methods of musical processing having intrinsic musical character, i.e. involving musical theory or musical parameters or relying on musical knowledge, as applied in electrophonic musical tools or instruments
    • G10H2210/031Musical analysis, i.e. isolation, extraction or identification of musical elements or musical parameters from a raw acoustic signal or from an encoded audio signal
    • G10H2210/046Musical analysis, i.e. isolation, extraction or identification of musical elements or musical parameters from a raw acoustic signal or from an encoded audio signal for differentiation between music and non-music signals, based on the identification of musical parameters, e.g. based on tempo detection

Landscapes

  • Engineering & Computer Science (AREA)
  • Computational Linguistics (AREA)
  • Signal Processing (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Physics & Mathematics (AREA)
  • Acoustics & Sound (AREA)
  • Multimedia (AREA)
  • Quality & Reliability (AREA)
  • Stereophonic System (AREA)

Abstract

【課題】入力オーディオ信号の内容を評価し、適応的な音質補正処理を施すオーディオ信号補正装置を提供する。
【解決手段】入力オーディオ信号をチャネル情報に基づいてモノラル信号またはステレオ信号のいずれか判別し、前記入力オーディオ信号を音声信号または音楽信号のいずれかに判別するための複数の特徴量パラメータを抽出する特徴抽出手段と、前記特徴抽出手段で抽出された前記複数の特徴量パラメータに基づいて、前記入力オーディオ信号が音声信号及び音楽信号のいずれに近いかを示す音声音楽識別スコアを算出する信号種別判定手段と、前記音声音楽識別スコアを用いて前記入力オーディオ信号の音声度合いおよび音楽度合いの出力レベルを算出するレベル算出手段と、前記レベル算出手段で算出された前記出力レベルに基づいて、音質補正処理を前記入力オーディオ信号に施す音質補正手段とを有する。
【選択図】図2

Description

本発明は、オーディオ信号に含まれる音声信号と音楽信号とに対して、それぞれ適応的に音質補正処理を施すオーディオ信号補正技術に関する。
周知のように、例えばテレビジョン放送を受信する放送受信機器や、情報記録媒体からその記録情報を再生する情報再生機器等にあっては、受信した放送信号や情報記録媒体から読み取った信号等からオーディオ信号を再生する際に、オーディオ信号に音質補正処理を施すことによって、より一層の高音質化を図るようにしている。
この場合、オーディオ信号に施す音質補正処理の内容は、オーディオ信号が人の話し声のような音声信号であるか、楽曲のような音楽(非音声)信号であるかに応じて異なる。すなわち、音声信号に対しては、トークシーンやスポーツ実況等のようにセンター定位成分を強調して明瞭化するように音質補正処理を施すことで音質が向上し、音楽信号に対しては、ステレオ感を強調した拡がりのある音質補正処理を施すことで音質が向上する。
このため、取得したオーディオ信号が音声信号か音楽信号かを判別し、その判別結果に応じて対応する音質補正処理を施すことが考えられている。しかしながら、実際のオーディオ信号では、音声信号と音楽信号とが混在している場合が多いことから、それらの判別処理が困難になっているため、オーディオ信号に対して適切な音質補正処理が施されているとは言えないのが現状である。
特許文献1には、音声信号がスピーチか非スピーチかをスピーチ性の度合およびミュージック性の度合に応じて判定し、さらに、音声信号がモノラル信号かステレオ信号かに応じてスピーチか非スピーチかの判定を最適化する構成が開示されている。
特開2007−67858号公報
しかしながら、特許文献1の構成では、音声信号がデュアルモノラル信号の場合やステレオ信号であってもモノラル伝送する場合には、信号内容を適切に判別することは困難である。
本発明の目的は、入力オーディオ信号の内容を評価し、適応的な音質補正処理を施すオーディオ信号補正装置及を提供することにある。
本発明の実施形態に係るオーディオ信号補正装置は、入力オーディオ信号をチャンル情報に基づいてモノラル信号またはステレオ信号のいずれか判別し、前記入力オーディオ信号を音声信号または音楽信号のいずれかに判別するための複数の特徴量パラメータを抽出する特徴抽出手段と、前記特徴抽出手段で抽出された前記複数の特徴量パラメータに基づいて、前記入力オーディオ信号が音声信号及び音楽信号のいずれに近いかを示す音声音楽識別スコアを算出する信号種別判定手段と、前記音声音楽識別スコアを用いて前記入力オーディオ信号の音声度合いおよび音楽度合いの出力レベルを算出するレベル算出手段と、前記レベル算出手段で算出された前記出力レベルに基づいて、音質補正処理を前記入力オーディオ信号に施す音質補正手段とを有する。
本発明によれば、入力オーディオ信号の内容を評価し、適応的な音質補正処理を施すオーディオ信号補正装置を提供できる。
本発明の実施形態に係るデジタルテレビジョン放送受信装置の概略構成を示すブロック図である。 本発明の実施形態に係るオーディオ処理モジュールの概略構成を示すブロック図である。 本発明の実施形態に係る特徴量抽出処理を説明するフローチャートである。 本発明の実施形態に係る信号種別判定処理を説明するフローチャートである。 本発明の実施形態に係るレベル算出処理を説明するフローチャートである。
以下、この発明の実施形態について図面を参照して詳細に説明する。図1は、デジタルテレビジョン放送受信装置11の主要な信号処理系を示している。すなわち、BS/CS(broadcasting satellite/communication satellite)デジタル放送受信用のアンテナ43で受信した衛星デジタルテレビジョン放送信号は、入力端子44を介して衛星デジタル放送用のチューナ45に供給されることにより、所望のチャネルの放送信号が選局される。
そして、このチューナ45で選局された放送信号は、PSK(phase shift keying)復調モジュール46及びTS(transport stream)復号モジュール47に順次供給されることにより、デジタルの映像信号及びオーディオ信号に復調された後、信号処理モジュール48に出力される。
また、地上波放送受信用のアンテナ49で受信した地上デジタルテレビジョン放送信号は、入力端子50を介して地上デジタル放送用のチューナ51に供給されることにより、所望のチャネルの放送信号が選局される。
そして、このチューナ51で選局された放送信号は、例えば日本ではOFDM(orthogonal frequency division multiplexing)復調モジュール52及びTS復号モジュール53に順次供給されることにより、デジタルの映像信号及びオーディオ信号に復調された後、上記信号処理モジュール48に出力される。
また、上記地上波放送受信用のアンテナ49で受信した地上アナログテレビジョン放送信号は、入力端子50を介して地上アナログ放送用のチューナ54に供給されることにより、所望のチャネルの放送信号が選局される。そして、このチューナ54で選局された放送信号は、アナログ復調モジュール55に供給されてアナログの映像信号及びオーディオ信号に復調された後、上記信号処理モジュール48に出力される。
ここで、上記信号処理モジュール48は、TS復号モジュール47,53からそれぞれ供給されたデジタルの映像信号及びオーディオ信号に対して、選択的に所定のデジタル信号処理を施し、グラフィック処理モジュール56及びオーディオ処理モジュール57に出力している。
また、上記信号処理モジュール48には、複数(図示の場合は4つ)の入力端子58a,58b,58c,58dが接続されている。これら入力端子58a〜58dは、それぞれ、アナログの映像信号及びオーディオ信号を、デジタルテレビジョン放送受信装置11の外部から入力可能とするものである。
信号処理モジュール48は、上記アナログ復調モジュール55及び各入力端子58a〜58dからそれぞれ供給されたアナログの映像信号及びオーディオ信号を選択的にデジタル化し、このデジタル化された映像信号及びオーディオ信号に対して所定のデジタル信号処理を施した後、グラフィック処理モジュール56及びオーディオ処理モジュール57に出力する。
グラフィック処理モジュール56は、信号処理モジュール48から供給されるデジタルの映像信号に、OSD(on screen display)信号生成モジュール59で生成されるOSD信号を重畳して出力する機能を有する。このグラフィック処理モジュール56は、信号処理モジュール48の出力映像信号と、OSD信号生成モジュール59の出力OSD信号とを選択的に出力すること、また、両出力をそれぞれ画面の半分を構成するように組み合わせて出力することができる。
グラフィック処理モジュール56から出力されたデジタルの映像信号は、映像処理モジュール60に供給される。この映像処理モジュール60は、入力されたデジタルの映像信号を、前記映像表示器14で表示可能なフォーマットのアナログ映像信号に変換した後、映像表示器14に出力して映像表示させるとともに、出力端子61を介して外部に導出させる。
また、上記オーディオ処理モジュール57は、入力されたデジタルのオーディオ信号に対して、後述する音質補正処理を施した後、前記スピーカ15で再生可能なフォーマットのアナログオーディオ信号に変換している。そして、このアナログオーディオ信号は、スピーカ15に出力されてオーディオ再生に供されるとともに、出力端子62を介して外部に導出される。
ここで、このデジタルテレビジョン放送受信装置11は、上記した各種の受信動作を含むその全ての動作を制御モジュール63によって統括的に制御されている。この制御モジュール63は、CPU(central processing unit)64を内蔵しており、前記操作モジュール16からの操作情報、または、リモートコントローラ17から送出され前記受光モジュール18に受信された操作情報を受けて、その操作内容が反映されるように各部をそれぞれ制御している。
この場合、制御モジュール63は、主として、そのCPU64が実行する制御プログラムを格納したROM(read only memory)65と、該CPU64に作業エリアを提供するRAM(random access memory)66と、各種の設定情報及び制御情報等が格納される不揮発性メモリ67とを利用している。
図2は、上記オーディオ処理モジュール57内に信号特性解析モジュール70と音質補正モジュール80を備える構成を示している。信号特性解析モジュール70は、特徴抽出モジュール72、信号種別判定モジュール74、レベル算出モジュール76を備える。さらに、特徴抽出モジュール72は、第1の特徴抽出モジュール72a、第2の特徴抽出モジュール72bを備える。信号種別判定モジュール74は、第1の信号種別判定モジュール74a、第2の信号種別判定モジュール74bを備える。入力端子71には、入力オーディオ信号が供給される。制御モジュール63は、入力オーディオ信号を特徴抽出モジュール72に供給する。制御モジュール63は、入力オーディオ信号のチャネル情報(モノラル/ステレオ信号情報)を信号特性解析モジュール70を構成する各モジュールに供給する。
第1の特徴抽出モジュール72aは、入力オーディオ信号がステレオ信号の場合、入力オーディオ信号が音声信号と音楽信号のいずれであるかを判別するための各種の特徴量パラメータを算出する。第2の特徴抽出モジュール72bは、入力オーディオ信号がモノラル信号の場合、入力オーディオ信号が音声信号と音楽信号のいずれであるかを判別するための各種の特徴量パラメータを算出する。特徴抽出モジュール72は、入力オーディオ信号がステレオ信号かモノラル信号かに応じて第1の特徴抽出モジュール72aか第2の特徴抽出モジュール72bに切り替える。
第1の信号種別判定モジュール74aは、入力オーディオ信号(ステレオ信号)が音声信号または音楽信号のいずれであるかを判別する。同様に第2の特徴抽出モジュール74bは、入力オーディオ信号(モノラル信号)が音声信号または音楽信号のいずれであるかを判別する。信号種別判定モジュール74は、入力オーディオ信号がステレオ信号かモノラル信号かに応じて第1の信号種別判定モジュール74aか第2の信号種別判定モジュール74bに切り替える。
レベル算出モジュール76は、音声信号または音楽信号に対して、音質を細かく制御するための確度情報を含む音声・音楽レベルを算出する。レベル算出モジュール76は、音声・音楽レベル情報を音質補正モジュール80に出力する。
本実施形態では、第1の特徴抽出モジュール72aと第2の特徴抽出モジュール72bを異なるモジュール、第1の信号種別判定モジュール74aと第2の特徴抽出モジュール74bを異なるモジュールとした構成であるが、それぞれ一体となっていてもよい。
音質補正モジュール80は、信号特性解析モジュール70で算出された音楽・音声レベル情報に基づいて、音質補正処理を施す。音質補正モジュール80は、音質補正処理を施した出力オーディオ信号を出力端子77に供給する。
つまり、信号特性解析モジュール70および音質補正モジュール80は、放送受信や記録媒体からのコンテンツ再生において、音楽区間と音声区間を処理遅延することなく識別し、シーンの内容に応じて入力オーディオ信号に適切な音質補正処理を施すことで高音質化を図るシーン適応音質補正を実行する機能を有する。
次に、第1の特徴抽出モジュール72と第2の特徴抽出モジュール73の動作について説明する。図3は、特徴量抽出処理を説明するフローチャートである。はじめに、特徴抽出モジュール72は、入力オーディオ信号を数百msec程度ごとにフレームとして切り出す。さらに、特徴抽出モジュール72は、それらを数十msec程度ごとにサブフレームに分割する(ステップS101)。例えば、1つのサブフレームは、20msecである。
特徴抽出モジュール72は、入力オーディオ信号のチャネル情報に基づいて、入力オーディオ信号のチャネル数が2か否か(つまりモノラル信号かステレオ信号か)を判断する(ステップS102)。ここでは、信号処理モジュール48は、例えばチューナ51で選局された放送信号から復調された入力オーディオ信号がマルチチャネルのステレオ信号であった場合、マルチチャネルから2チャネルのステレオ信号にダウンミックス処理していることを前提とする。信号処理モジュール48は、2チャネルのステレオ信号を入力端子71に入力オーディオ信号として供給する。
チャネル数が2の場合(ステップS102、YES)、特徴抽出モジュール72は、入力オーディオ信号がデュアルモノラル信号ではない通常のステレオ信号か否かを判断する(ステップS103)。デュアルモノラル信号は、デュアルモノラル信号のチャネル数は2であっても、メイン/サブの各チャネルに重畳される音は本来別々のモノラル信号である。
入力オーディオ信号がデュアルモノラル信号でない通常のステレオ信号である場合(ステップS103、YES)、特徴抽出モジュール72は、サブフレーム単位で入力オーディオ信号における2チャネルステレオの左右(LR)信号のパワー比(LRパワー比)を算出する。ここで、入力オーディオ信号のフォーマットがステレオ信号であっても、実際はモノラル信号のように伝送されるケースがある。この場合、LRチャネル相互でほぼ同等の信号となり、特徴抽出モジュール72は、チャネル数だけでは判断できない。そこで、特徴抽出モジュール72は、LRチャネルの差成分値を和成分値で除したLRパワー比を算出し、予め設定された閾値thPwと比較する。次に、特徴抽出モジュール72は、LRパワー比が閾値thPwよりも大きいか否かを判断する(ステップS104)。
LRパワー比が閾値thPwよりも大きい場合(ステップS104、YES)、第1の特徴抽出モジュール72aは、LRパワー比が閾値thPwよりも大きいステレオ信号からステレオ向け判別情報を抽出する(ステップS105)。本実施形態では、ステレオ信号は、チャネル数が2の信号の中でも、デュアルモノラル信号ではなく、LRチャネルのパワー比が一定以上のステレオ性の強い信号を意味しているものとする。
第1の特徴抽出モジュール72aは、サブフレーム単位でLRパワー比(信号振幅の2乗和)、サブフレーム単位で入力オーディオ信号の時間波形が振幅方向に零を横切る回数である零交差周波数、サブフレーム単位で入力オーディオ信号の周波数領域でのスペクトル成分変動等の判別情報を算出する。判別情報の内容としてはこれらに限定せず追加することができる。
第1の特徴抽出モジュール72aは、入力オーディオ信号に対してステレオ向け判別情報を示す変数paramSet=stereoをセットする(ステップS106)。特徴抽出モジュール72は、サブフレームを統合して数百msec程度ごとにフレームを抽出する(ステップS107)。次に、特徴抽出モジュール72は、ステレオ向け判別情報またはモノラル向け判別情報からフレーム単位での統計特徴量(例えば平均,分散,最大,最小等)を求め特徴量パラメータセットを生成する(ステップS108)。特徴抽出モジュール72は、特徴量抽出処理を終了する。
入力オーディオ信号がデュアルモノラル信号であって通常のステレオ信号でない場合(ステップS103、NO)、第2の特徴抽出モジュール72bは、ユーザにより決定されるメイン/サブの選択情報を受け取り、検出対象となるチャネルのフォーカスを決定する(ステップS109)。第2の特徴抽出モジュール72bは、メイン/サブのうち該当するいずれかのチャネルについてモノラル向けの判別情報を抽出する(ステップS110)。同様に、チャネル数が2でない場合(つまり、チャネル数が1の場合)(ステップS102、NO)、第2の特徴抽出モジュール72bは、モノラル向けの判別情報を抽出する(ステップS110)。同様に、LRパワー比が閾値thPw以下の場合(ステップS104、NO)、第2の特徴抽出モジュール72bは、モノラル向けの判別情報を抽出する(ステップS110)。
第2の特徴抽出モジュール72aは、サブフレーム単位で、LRパワー比、零交差周波数、スペクトル成分変動等の判別情報を算出する。判別情報の内容としてはこれらに限定せず追加することができる。
第2の特徴抽出モジュール72bは、入力オーディオ信号に対してモノラル向け判別情報を示す変数paramSet=monoをセットする(ステップS111)。次に、第2の特徴抽出モジュール72bは、ステップS107以降の動作を続行する。
ステレオ向け判別情報とモノラル向けの判別情報は、互いに共通するものもあれば、それぞれに特有なものもある。ステレオ向け判別情報の特有の特徴量パラメータとしては、例えばLRパワー比がある。LRパワー比は、音楽区間では値が大きくなる傾向にあり、音声区間では値が小さくなる傾向にある。
上記説明したように、特徴抽出モジュール72は、入力オーディオ信号のチャネル情報とともに入力オーディオ信号の内容に応じてステレオ向け判別情報またはモノラル向けの判別情報を抽出し、抽出した判別情報に基づいて特徴量パラメータセットを生成する。したがって、特徴抽出モジュール72は、入力オーディオ信号が音声信号または音楽信号のいずれかを判別するために用いる最適な判別情報を選択することができる。特徴抽出モジュール72で生成された各種の特徴量パラメータセットは、信号種別判定モジュール74に供給される。
次に、信号種別判定モジュール74の動作について説明する。図4は、特徴量パラメータセットおよびチャネル情報を用いた信号種別判定処理を説明するフローチャートである。はじめに、信号種別判定モジュール74は、入力オーディオ信号に対してparamSet=stereoがセットされているか否かを判断する(ステップS201)。paramSet=stereoがセットされている場合(ステップS201、YES)、第1の信号種別判定モジュール74aは、以下のようにステレオ向け線形判別式を算出する(ステップS202)。
ステレオ向け線形判別式は、信号種別判定モジュール74が入力オーディオ信号を音声信号または音楽信号のいずれであるか判断するために用いる音声・音楽識別スコアS1の算出に用いられる。信号種別判定モジュール74は、特徴抽出モジュール72で生成した特徴量パラメータセットについて、各特徴量パラメータの重要度に応じた重み付け係数を付与し、係数を乗じた値の線形和をとることで音楽・音声に属する確からしさを表す音声・音楽識別スコアS1を算出する。信号種別判定モジュール74は、音楽・音声の音種別期待値があらかじめ判明しているデータを用いて学習することで重み付け係数を決定する。
この重み付け係数としては、信号種別の判別に効果の高い特徴量パラメータほど大きい値が与えられる。例として、信号種別判定モジュール74は、以下のようなステレオ向け線形判定式を利用する。また、重み付け係数は、音声・音楽識別スコアS1については、予め準備した多くの既知の音声信号及び音楽信号を基準となる参照データとして入力し、その参照データについて特徴量パラメータを学習することで算出される。
学習対象とする参照データのk番目のフレームの特徴量パラメータセットをベクトルxで表わし、入力オーディオ信号が属する信号区間{音声、音楽}としてyで以下のように表わすものとする。
Figure 2011065093
Figure 2011065093
ここで、上記(1)式の各要素は、抽出したn個の特徴量パラメータに対応する。また、上記(2)式の−1,+1は、それぞれ、音声区間及び音楽区間に対応し、使用する音声・音楽用学習データの正解信号種別となる区間について、予め人手で2値のラベル付けをしたものである。上記(2)式の−1,+1は、便宜的な定義であるので、逆にしてもよい。さらに、上記(2)式より、以下の線形識別関数を立てる。
Figure 2011065093
k=1〜N(Nは参照データの入力フレーム数)に対し、ベクトルxを抽出し、(3)式の評価値と正解信号種別(2)式の誤差二乗和(4)式が最小となる正規方程式を解くことにより、各特徴量パラメータに対する重み付け係数β(i=0〜n)が決定される。
Figure 2011065093
paramSet=stereoがセットされてない場合(つまり、paramSet=monoがセットされている場合)(ステップS201、NO)、第2の信号種別判定モジュール74bは、上記同様(1)式から(4)式を用いてモノラル向け線形判別式を算出する(ステプS202)。このとき、第2の信号種別判定モジュール74aは、ステレオ向け線形判別式とは異なり、m個の特徴量パラメータによってモノラル向け線形判別式を算出する。
信号種別判定モジュール74は、ステレオ向け線形判別式またはモノラル向け線形判別式について、学習によって決定した重み付け係数を用い、実際に識別する入力オーディオ信号の評価値を(3)式よりフレーム毎に算出する(ステップS204)。f(x)が上記音声・音楽識別スコアS1に相当する。
なお、音声・音楽識別スコアS1の算出については、上記した線形識別関数を用いたオフライン学習により求めた重み付け係数を特徴量パラメータに乗ずる手法に限定されるものではない。例えば各特徴量パラメータの算出値に対して経験的な閾値を設定し、この閾値との比較判定に応じて各特徴量パラメータに重み付けされた得点を付与し、スコアを算出する等の手法も用いることが可能である。
信号種別判定モジュール74は、S1<0か否かを判断する(ステップS205)。信号種別判定モジュール74は、S1<0であれば音楽区間、f(x)>0であれば音声区間と判定する。信号種別判定モジュール74は、各フレームを音声区間か音楽区間に排他的に判別する。
S1<0でない場合(つまり、音声区間である場合)(ステップS205、NO)、信号種別判定モジュール74は、変数cntSpをインクリメントする(ステップS206)。S1<0である場合(つまり、音楽区間である場合)(ステップS205、YES)、信号種別判定モジュール74は、変数cntMsをインクリメントする。
信号種別判定モジュール74で算出された音声・音楽識別スコアS1およびインクリメントされた変数は、レベル算出モジュール76に供給される。信号種別判定モジュール74は、信号種別判定を終了する。
ここで、信号種別判定モジュール74は、チャネル情報に基づいて判別した入力オーディオ信号がステレオ信号かモノラル信号かに応じて異なる特徴量パラメータセットを選定している。信号種別判定モジュール74が特徴量パラメータセットを選定する有効性について説明する。
例えば、ステレオ向け特徴量パラメータセットの特徴量パラメータの数nは、モノラル向け特徴量パラメータセットの特徴量パラメータの数mと異なる。上述したように、入力オーディオ信号がステレオ信号の場合、信号種別判定モジュール74は判別情報であるLRパワー比から算出した統計特徴量を含めた特徴量パラメータセットを使用するため、音声・音楽識別スコアS1の検出精度の向上が期待できる。一方、入力オーディオ信号がモノラル信号の場合、信号種別判定モジュール74がLRパワー比から算出した統計特徴量を含めた特徴量パラメータセットを使用しても音声・音楽識別スコアS1の検出精度の向上が期待できない。逆に、検出精度が低下することもありうる。
(5)式は、第1の信号種別判定モジュール74aが各特徴量パラメータの重要度に応じた重み付け係数βを決定し、(3)式に適用した一例である。χnはLRパワー比における特徴量パラメータとする。
Figure 2011065093
(2)式に示すように、線形識別関数の値が負であれば、入力オーディオ信号の音楽性が高くなる。ここで、通常のステレオ音楽信号ではLRチャネルで異なる楽音が配置されているため、LRパワー比は大きくなりやすい傾向にある。
この傾向は、どのようなステレオ楽曲でも一般的に当てはまる。学習の結果、LRパワー比における特徴量パラメータに対応する重み付け係数の値は、他の特徴量パラメータが音楽区間・音声区間の判別を指し示す重み付け係数値に比べると相対的に大きくなりやすい。言い換えると、LRパワー比における特徴量パラメータは、他の特徴量パラメータが音楽区間・音声区間の判別に寄与する度合いよりも強い。したがって線形識別関数の値も大きい負の値となる傾向をもつ。
一方、入力オーディオ信号が音楽であってもモノラル信号であれば、特徴量パラメータχnは省略される。第2の信号種別判定モジュール74bは、通常χnに0の値を入れて線形識別関数の値を算出する。つまり、線形識別関数の値は、LRパワー比における特徴量パラメータの項が音楽区間・音声区間の判定に寄与しなくなる。第2の信号種別判定モジュール74bは音楽区間・音声区間の検出精度が落ちる。第2の信号種別判定モジュール74bは、重み付け係数の重みを特徴量パラメータごとに音楽区間・音声区間の判定への寄与を考慮して決定している。LRパワー比における特徴量パラメータは、音楽区間・音声区間の判定への寄与が他の特徴量パラメータに比べて相対的に大きい。LRパワー比における特徴量パラメータの項が線形識別関数から省略されると、第2の信号種別判定モジュール74bは、音楽区間・音声区間の判定をしづらくなる。
そこで、第2の信号種別判定モジュール74bは、LRパワー比の特徴量パラメータの項を除いた他の特徴量パラメータセット(モノラル信号、ステレオ信号共通で効果が期待できる特徴量パラメータおよびモノラル信号に特有な特徴量パラメータから構成される)を用いて、(1)式から(4)式により重み付け係数値を求める。
第2の信号種別判定モジュール74bは、LRパワー比の特徴量パラメータがない分、他の特徴量パラメータのうち特定の特徴量パラメータに対して、(5)式に示す重み付け係数値よりも音楽性を強く示す係数値を与える。したがって、第2の信号種別判定モジュール74bは、音楽区間・音声区間の検出精度の低下を抑制できる。
以上説明したように、信号種別判定モジュール74は、ステレオ信号またはモノラル信号に応じて最適な重み付け係数を用意し、入力オーディオ信号のチャネル情報により、線形判定式を切り替えて用いることができる。
次に、レベル算出モジュール76の動作について説明する。図5は、レベル算出処理を説明するフローチャートである。レベル算出モジュール76は、(5)式で求めた線形識別関数の値が正であれば音声区間、負であれば音楽区間と判断することができる。しかしながら、制御モジュール63がスピーカ15から出力する音声の音質を細かく制御するために、レベル算出モジュール76は、線形識別関数の値を段階的に表現される確度情報の形で算出するのが望ましい。また、モノラル信号では、楽曲特性が特徴量パラメータとしてステレオ信号ほど顕著に現れない。したがって、線形識別関数の値S1の音楽性スコアが比較的小さい値をとる傾向にある。そのため、レベル算出モジュール76は、楽曲によって判定が不安定化する可能性がある。そこで、レベル算出モジュール76は、例えば以下のようにスコア安定化を兼ねた音声・音楽レベルを算出する。
レベル算出モジュール76は、線形判別式で求まった線形識別関数の値S1をベースに音楽区間・音声区間それぞれの確度情報を算出する。ここで、Sm1は音楽用スコア変数、Ss1は音声用スコア変数である。レベル算出モジュール76は、Sm1=−S1、Ss1=S1と設定する(ステップS301)。Sm1でS1の符号を反転するのは、音声・音楽のどちらも正値のレベルで表現するのが扱いやすいためである。
レベル算出モジュール76は、Sm1(>0)について、フレームごとに音声・音楽識別スコアS1を算出する一方で、継続して過去に音楽判定されたフレーム数cntMsをカウントする。レベル算出モジュール76は、cntMsが規定の回数thNms以上となったか否かを判断する(ステップS302)。
cntMsがthNmsに達した場合(ステップS301、YES)、レベル算出モジュール76は、Sm1に加算する補正スコアSm2(>0)をstep_m(>0)だけ加える。レベル算出モジュール76は、Ss1から減算する補正スコアSs2(>0)をstep_s(>0)だけ減ずる。レベル算出モジュール76は、Sm2とSs2の値を適切な値(min=0,max=1等)の範囲でクリッピングする(ステップS303)。
これにより、Sm1が示す音楽用スコア変数が比較的小さい値の場合でも、時間の経過とともに補正後の音楽用スコア変数の値は安定する。
レベル算出モジュール76は、(6)式のように補正スコアSm2を音楽用スコア変数Sm1に加算する(ステップS304)。
Figure 2011065093
レベル算出モジュール76は、(7)式のように補正スコアSs2を音声用スコア変数Ss1から減算する(ステップS305)。
Figure 2011065093
cntMsがthNmsに達していない場合(ステップS302、NO)、レベル算出モジュール76は、Ss1(>0)について、継続して過去に音声判定されたフレーム数cntSpをカウントする。レベル算出モジュール76は、cntSpが規定回数thNsp以上となったか否かを判断する(ステップS306)。
cntSpがthNspに達した場合(ステップS306、YES)、レベル算出モジュール76は、Sm1に加算する補正スコアSm2(>0)をstep_m(>0)だけ減ずる。レベル算出モジュール76は、Ss1から減算する補正スコアSs2(>0)をstep_s(>0)だけ加える。レベル算出モジュール76は、Sm2とSs2の値を適切な値(min=0,max=1等)の範囲でクリッピングする(ステップS307)。
レベル算出モジュール76は、補正スコアSm2を段階的に減ずるため、音楽から音声区間に変わる際の急激な補正音質変動を緩和する効果をもつ。
レベル算出モジュール76は、(8)式のように補正スコアSm2を音楽用スコア変数Sm1から減算する(ステップS308)。
Figure 2011065093
レベル算出モジュール76は、(9)式のように補正スコアSs2を音声用スコア変数Ss1に加算する(ステップS309)。レベル算出モジュール76は、判定の連続性に伴い補正スコアSs2を加算することで音声・音楽レベルの安定化を図ることができる
Figure 2011065093
次に、レベル算出モジュール76は、Ss1´、Sm1´を後段で扱いやすい形に適宜変換するために、0から1の範囲でクリッピングする(ステップS310)。レベル算出モジュール76は、Ss1´、Sm1´を所望の解像度のレベルに変換する(ステップS311)。レベル算出モジュール76は、例えば、0から255などのN段階の整数値として音楽レベルLmsおよび音声レベルLspに変換する。
レベル算出モジュール76は、レベル値変換の過程で平滑化を行う(ステップS312)。レベル算出モジュール76は、フレーム間における急激な音声・音楽レベルの変動を抑制するためである。すなわちレベル算出モジュール76は、過去num_fr数のフレームで平滑化を行う場合、num_fr数のフレームの音声・音楽レベルにそれぞれ重み係数を乗じ移動平均をとった値を最終的な出力レベル(音楽レベルLms,音声レベルLsp)とする。この際、レベル算出モジュール76は、例えば、直近の過去フレームほど音声・音楽レベルに乗じる重み係数の値を大きくする。
レベル算出モジュール76は、上記説明したスコア補正および平滑化により、低遅延・低負荷で、安定的な音声・音楽レベルを得ることができる。信号種別判定モジュール74は、(3)式で2値による判定結果によって音楽・音声の結果を排他的に算出する。しかしレベル算出モジュール76は、音声・音楽レベル情報に対して独立にスコア補正・平滑化を行うので、時間の経過とともに、音声・音楽レベルをお互いに排他的でない独立した値として算出することができる。レベル算出モジュール76は、例えばBGMのような区間では、音楽・音声レベルがそれぞれの音成分に応じた確度として出力する。
さらに、レベル算出モジュール76は、検出を適用する入力オーディオ信号の内容や、入力オーディオ信号が属するコンテンツ種類に応じて、音声・音楽レベルを制御してもよい。例えば、レベル算出モジュール76は、入力オーディオ信号がステレオ信号に比べて相対的に楽曲補正の効果が得られにくいモノラル信号であれば、音声・音楽レベルの最大値をステレオ信号の場合に比べて低く設定する。
あるいは、トークシーンと楽曲シーンが比較的明確に現れる音楽番組以外のドラマやバラエティなどでは、演出上、各種の効果音が入りやすく、音楽区間と音声区間の著しい変動が短い時間内で頻繁に発生する。レベル算出モジュール76は、こうした変動による急激な音質変化の影響を避けるべく、EPGなどのジャンル情報を参照し、特定のコンテンツでは出力する音楽・音声レベルの音声・音楽レベルを低く設定する。
音質補正モジュール80は、入力オーディオ信号が音楽信号であるか音声信号であるか、およびステレオ信号であるかモノラル信号であるかに応じて柔軟に音質補正を制御できる。つまり、音質補正モジュール80は、上記算出された音楽・音声レベル情報を用いて、信号の内容に即した音質補正処理を施す。
例えば、音質補正モジュール80は、入力オーディオ信号がステレオ信号かつ音楽レベルが高ければサラウンド効果など広がり感を重視する補正を入力オーディオ信号に施す。音質補正モジュール80は、入力オーディオ信号がモノラル信号かつ音楽レベルが高ければイコライジング中心の補正を入力オーディオ信号に施す。音質補正モジュール80は、入力オーディオ信号がモノラル信号かつ音声レベルが高ければセンター定位を強めた輪郭強調を入力オーディオ信号に施す。音質補正モジュール63は、入力オーディオ信号がステレオ信号かつ音声レベルが高ければよりソフトな音声強調を入力オーディオ信号に施す。したがって、音質補正モジュール80は、入力オーディオ信号のチャネル数や音声・音楽レベルの高さ、安定度に応じて制御しやすくなる。
本実施形態によれば、信号特性解析モジュール70は、入力オーディオ信号の特性に応じて音質補正を柔軟に切り替えることが可能となる。信号特性解析モジュール70は、ステレオ信号だけでなく、モノラル信号も精度良く検出できる。また、信号特性解析モジュール70は、ステレオ信号のフォーマットであってもモノラル的性質を持つ入力オーディオ信号や、デュアルモノラル信号の入力オーディオ信号も最適に検出できる。信号特性解析モジュール70は、瞬間的、局所的な判定ブレを安定化した上で音楽・音声の確度をレベル情報で表現できる。さらに、信号特性解析モジュール70は、音声・音楽レベルの算出を判別式1個を基にして低遅延・低負荷で行え、継続時間長に応じて安定化かつ音声と音楽で独立した情報として得ることができる。結果として、信号特性解析モジュール70は、モノラル/ステレオ、音声/音楽の区分に応じて入力オーディオ信号の音質補正を柔軟に切り替えられる。
なお、上記したモジュールとは、ハードウェアで実現するものであっても良いし、CPU64等を使ってソフトウェアで実現するものであってもよい。
なお、本願発明は、上記実施形態に限定されるものではなく、実施段階ではその要旨を逸脱しない範囲で種々に変形することが可能である。また、各実施形態は可能な限り適宜組み合わせて実施してもよく、その場合組み合わせた効果が得られる。更に、上記実施形態には種々の段階の発明が含まれており、開示される複数の構成要件における適当な組み合わせにより種々の発明が抽出され得る。例えば、実施形態に示される全構成要件からいくつかの構成要件が削除されても、発明が解決しようとする課題の欄で述べた課題が解決でき、発明の効果の欄で述べられている効果が得られる場合には、この構成要件が削除された構成が発明として抽出され得る。
11…デジタルテレビジョン放送受信装置、15…スピーカ、72…特徴量抽出モジュール、74…信号種別判定モジュール、76…レベル算出モジュール、80…音質補正モジュール。

Claims (9)

  1. 入力オーディオ信号をチャネル情報に基づいてモノラル信号またはステレオ信号のいずれか判別し、前記入力オーディオ信号を音声信号または音楽信号のいずれかに判別するための複数の特徴量パラメータを抽出する特徴抽出手段と、
    前記特徴抽出手段で抽出された前記複数の特徴量パラメータに基づいて、前記入力オーディオ信号が音声信号及び音楽信号のいずれに近いかを示す音声音楽識別スコアを算出する信号種別判定手段と、
    前記音声音楽識別スコアを用いて前記入力オーディオ信号の音声度合いおよび音楽度合いの出力レベルを算出するレベル算出手段と、
    前記レベル算出手段で算出された前記出力レベルに基づいて、音質補正処理を前記入力オーディオ信号に施す音質補正手段と、
    を具備することを特徴とするオーディオ信号補正装置。
  2. 前記特徴抽出手段は、前記入力オーディオ信号がデュアルモノラル信号の場合、選択に基づいて前記入力オーディオ信号を前記モノラル信号と判別し、前記入力オーディオ信号が前記ステレオ信号のフォーマットであって前記入力オーディオ信号のLRパワー比が所定値より小さい場合、前記入力オーディオ信号を前記モノラル信号と判別することを特徴とする請求項1記載の音質補正装置。
  3. 前記特徴抽出手段は、前記入力オーディオ信号が前記ステレオ信号の場合、LRパワー比を前記複数の特徴量パラメータの1つとして抽出することを特徴とする請求項1記載の音質補正装置。
  4. 前記信号種別判定手段は、前記複数の特徴量パラメータそれぞれに対して、予め用意された前記音声信号及び前記音楽信号を参照データとして前記複数の特徴量パラメータを学習することにより算出した複数の重み付け係数それぞれを乗算し、前記複数の特徴量パラメータと前記複数の重み付け係数を乗算した総和を前記音声音楽識別スコアとして算出することを特徴とする請求項1記載の音質補正装置。
  5. 前記特徴抽出手段は、前記入力オーディオ信号を所定の単位毎の複数のフレームに分割し、前記分割フレーム毎に前記複数の特徴量パラメータを抽出する請求項1記載の音質補正装置。
  6. 前記レベル算出手段は、前記信号種別判定手段で算出した前記分割フレーム毎の前記音声音楽識別スコアが所定回数以上連続して前記音楽信号であると判断した場合、前記音声音楽識別スコアに音楽向けの補正強度を高くするように補正スコアを加算し、前記信号種別判定手段で算出した前記分割フレーム毎の前記音声音楽識別スコアが所定回数以上連続して前記音声信号であると判断した場合、前記音声音楽識別スコアに音声向けの補正強度を高くするように補正スコアを加算して補正することを特徴とする請求項5記載の音質補正装置。
  7. 前記レベル算出手段は、複数の前記分割フレームについて前記補正した前記音声音楽識別スコアの移動平均をとって平滑化した前記出力レベルを算出することを特徴とする請求項4記載の音質補正装置。
  8. 前記レベル算出手段は、前記オーディオ信号が前記モノラル信号の場合、前記ステレオ信号の場合に比べて前記出力レベルの最大値を小さくし、前記オーディオ信号のジャンルに応じて前記出力レベルの最大値を変更することを特徴とする請求項7記載の音質補正装置。
  9. 入力オーディオ信号をチャネル情報に基づいてモノラル信号またはステレオ信号のいずれか判別し、前記入力オーディオ信号を音声信号または音楽信号のいずれかに判別するための複数の特徴量パラメータを抽出し、
    前記複数の特徴量パラメータに基づいて、前記入力オーディオ信号が音声信号及び音楽信号のいずれに近いかを示す音声音楽識別スコアを算出し、
    前記音声音楽識別スコアを用いて前記入力オーディオ信号の音声度合いおよび音楽度合いの出力レベルを算出し、
    前記出力レベルに基づいて、音質補正処理を前記入力オーディオ信号に施す、
    ことを特徴とするオーディオ信号補正方法。
JP2009217941A 2009-09-18 2009-09-18 オーディオ信号補正装置及びオーディオ信号補正方法 Abandoned JP2011065093A (ja)

Priority Applications (2)

Application Number Priority Date Filing Date Title
JP2009217941A JP2011065093A (ja) 2009-09-18 2009-09-18 オーディオ信号補正装置及びオーディオ信号補正方法
US12/772,790 US20110071837A1 (en) 2009-09-18 2010-05-03 Audio Signal Correction Apparatus and Audio Signal Correction Method

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2009217941A JP2011065093A (ja) 2009-09-18 2009-09-18 オーディオ信号補正装置及びオーディオ信号補正方法

Related Child Applications (1)

Application Number Title Priority Date Filing Date
JP2011132362A Division JP4886907B2 (ja) 2011-06-14 2011-06-14 オーディオ信号補正装置及びオーディオ信号補正方法

Publications (1)

Publication Number Publication Date
JP2011065093A true JP2011065093A (ja) 2011-03-31

Family

ID=43757405

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2009217941A Abandoned JP2011065093A (ja) 2009-09-18 2009-09-18 オーディオ信号補正装置及びオーディオ信号補正方法

Country Status (2)

Country Link
US (1) US20110071837A1 (ja)
JP (1) JP2011065093A (ja)

Cited By (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2012063726A (ja) * 2010-09-17 2012-03-29 Toshiba Corp 音質補正装置及び音声補正方法
JP2013009199A (ja) * 2011-06-24 2013-01-10 Toshiba Corp 音響制御装置、音響補正装置、及び音響補正方法
US8457954B2 (en) 2010-07-28 2013-06-04 Kabushiki Kaisha Toshiba Sound quality control apparatus and sound quality control method
JP2021157180A (ja) * 2016-05-20 2021-10-07 フラウンホッファー−ゲゼルシャフト ツァ フェルダールング デァ アンゲヴァンテン フォアシュンク エー.ファオ 類似性情報決定装置、類似性情報決定方法、自己相関情報決定装置、相互相関情報決定装置およびコンピュータプログラム
JP2022540511A (ja) * 2019-08-27 2022-09-15 ドルビー ラボラトリーズ ライセンシング コーポレイション 適応的スムージングを使用したダイアローグの拡張

Families Citing this family (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101359472B (zh) * 2008-09-26 2011-07-20 炬力集成电路设计有限公司 一种人声判别的方法和装置
DE102011087984A1 (de) * 2011-12-08 2013-06-13 Siemens Medical Instruments Pte. Ltd. Hörvorrichtung mit Sprecheraktivitätserkennung und Verfahren zum Betreiben einer Hörvorrichtung
JP2013171089A (ja) * 2012-02-17 2013-09-02 Toshiba Corp 音声補正装置、方法、及びプログラム
US20170142178A1 (en) * 2014-07-18 2017-05-18 Sony Semiconductor Solutions Corporation Server device, information processing method for server device, and program
US20160344902A1 (en) * 2015-05-20 2016-11-24 Gwangju Institute Of Science And Technology Streaming reproduction device, audio reproduction device, and audio reproduction method
KR102614577B1 (ko) 2016-09-23 2023-12-18 삼성전자주식회사 전자 장치 및 그 제어 방법
KR102650138B1 (ko) * 2018-12-14 2024-03-22 삼성전자주식회사 디스플레이장치, 그 제어방법 및 기록매체
CN111161728B (zh) * 2019-12-26 2022-08-30 珠海格力电器股份有限公司 一种智能设备的唤醒方法、装置、设备及介质
US20220365799A1 (en) * 2021-05-17 2022-11-17 Iyo Inc. Using machine learning models to simulate performance of vacuum tube audio hardware
US11848019B2 (en) * 2021-06-16 2023-12-19 Hewlett-Packard Development Company, L.P. Private speech filterings

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2001204100A (ja) * 2000-01-24 2001-07-27 Victor Co Of Japan Ltd サラウンド信号処理装置
JP2003131686A (ja) * 2001-10-29 2003-05-09 Nippon Hoso Kyokai <Nhk> 音声と音楽の混合比推定方法及び装置並びにそれを用いたオーディオ装置
JP2006301134A (ja) * 2005-04-19 2006-11-02 Hitachi Ltd 音楽検出装置、音楽検出方法及び録音再生装置
JP2007072273A (ja) * 2005-09-08 2007-03-22 Sharp Corp 音声信号判別装置、音質調整装置、コンテンツ表示装置、プログラム、及び記録媒体
JP4327888B1 (ja) * 2008-05-30 2009-09-09 株式会社東芝 音声音楽判定装置、音声音楽判定方法及び音声音楽判定用プログラム

Family Cites Families (21)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS57176856A (en) * 1981-04-23 1982-10-30 Matsushita Electric Ind Co Ltd Transmitting system of time division digital signal
JP3033061B2 (ja) * 1990-05-28 2000-04-17 松下電器産業株式会社 音声雑音分離装置
KR940001861B1 (ko) * 1991-04-12 1994-03-09 삼성전자 주식회사 오디오 대역신호의 음성/음악 판별장치
DE69214882T2 (de) * 1991-06-06 1997-03-20 Matsushita Electric Ind Co Ltd Gerät zur Unterscheidung von Musik und Sprache
US5210366A (en) * 1991-06-10 1993-05-11 Sykes Jr Richard O Method and device for detecting and separating voices in a complex musical composition
JP2699860B2 (ja) * 1994-03-24 1998-01-19 日本電気株式会社 パイロット信号検出回路およびパイロット信号検出方法
KR960016676B1 (ko) * 1994-10-27 1996-12-19 삼성전자 주식회사 모노/스테레오 커넥터 자동 인식 음성 입력 회로
US6570991B1 (en) * 1996-12-18 2003-05-27 Interval Research Corporation Multi-feature speech/music discrimination system
US7013013B2 (en) * 1998-03-20 2006-03-14 Pioneer Electronic Corporation Surround device
US7146313B2 (en) * 2001-12-14 2006-12-05 Microsoft Corporation Techniques for measurement of perceptual audio quality
US6934677B2 (en) * 2001-12-14 2005-08-23 Microsoft Corporation Quantization matrices based on critical band pattern information for digital audio wherein quantization bands differ from critical bands
US7428440B2 (en) * 2002-04-23 2008-09-23 Realnetworks, Inc. Method and apparatus for preserving matrix surround information in encoded audio/video
WO2005008659A1 (ja) * 2003-07-23 2005-01-27 Matsushita Electric Industrial Co., Ltd. データ処理装置
US20050091066A1 (en) * 2003-10-28 2005-04-28 Manoj Singhal Classification of speech and music using zero crossing
US20050096898A1 (en) * 2003-10-29 2005-05-05 Manoj Singhal Classification of speech and music using sub-band energy
JP4602204B2 (ja) * 2005-08-31 2010-12-22 ソニー株式会社 音声信号処理装置および音声信号処理方法
US7831434B2 (en) * 2006-01-20 2010-11-09 Microsoft Corporation Complex-transform channel coding with extended-band frequency coding
KR101358700B1 (ko) * 2006-02-21 2014-02-07 코닌클리케 필립스 엔.브이. 오디오 인코딩 및 디코딩
US7792220B2 (en) * 2006-12-19 2010-09-07 Sigmatel, Inc. Demodulator system and method
JP2008164823A (ja) * 2006-12-27 2008-07-17 Toshiba Corp オーディオデータ処理装置
US8565444B2 (en) * 2008-01-03 2013-10-22 Apple Inc. Detecting stereo and mono headset devices

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2001204100A (ja) * 2000-01-24 2001-07-27 Victor Co Of Japan Ltd サラウンド信号処理装置
JP2003131686A (ja) * 2001-10-29 2003-05-09 Nippon Hoso Kyokai <Nhk> 音声と音楽の混合比推定方法及び装置並びにそれを用いたオーディオ装置
JP2006301134A (ja) * 2005-04-19 2006-11-02 Hitachi Ltd 音楽検出装置、音楽検出方法及び録音再生装置
JP2007072273A (ja) * 2005-09-08 2007-03-22 Sharp Corp 音声信号判別装置、音質調整装置、コンテンツ表示装置、プログラム、及び記録媒体
JP4327888B1 (ja) * 2008-05-30 2009-09-09 株式会社東芝 音声音楽判定装置、音声音楽判定方法及び音声音楽判定用プログラム

Cited By (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US8457954B2 (en) 2010-07-28 2013-06-04 Kabushiki Kaisha Toshiba Sound quality control apparatus and sound quality control method
JP2012063726A (ja) * 2010-09-17 2012-03-29 Toshiba Corp 音質補正装置及び音声補正方法
JP2013009199A (ja) * 2011-06-24 2013-01-10 Toshiba Corp 音響制御装置、音響補正装置、及び音響補正方法
US9002021B2 (en) 2011-06-24 2015-04-07 Kabushiki Kaisha Toshiba Audio controlling apparatus, audio correction apparatus, and audio correction method
JP2021157180A (ja) * 2016-05-20 2021-10-07 フラウンホッファー−ゲゼルシャフト ツァ フェルダールング デァ アンゲヴァンテン フォアシュンク エー.ファオ 類似性情報決定装置、類似性情報決定方法、自己相関情報決定装置、相互相関情報決定装置およびコンピュータプログラム
JP7317888B2 (ja) 2016-05-20 2023-07-31 フラウンホッファー-ゲゼルシャフト ツァ フェルダールング デァ アンゲヴァンテン フォアシュンク エー.ファオ 類似性情報決定装置、類似性情報決定方法、自己相関情報決定装置、相互相関情報決定装置およびコンピュータプログラム
JP2022540511A (ja) * 2019-08-27 2022-09-15 ドルビー ラボラトリーズ ライセンシング コーポレイション 適応的スムージングを使用したダイアローグの拡張
JP7258228B2 (ja) 2019-08-27 2023-04-14 ドルビー ラボラトリーズ ライセンシング コーポレイション 適応的平滑化を使用したダイアローグの拡張

Also Published As

Publication number Publication date
US20110071837A1 (en) 2011-03-24

Similar Documents

Publication Publication Date Title
JP2011065093A (ja) オーディオ信号補正装置及びオーディオ信号補正方法
JP4439579B1 (ja) 音質補正装置、音質補正方法及び音質補正用プログラム
US9865279B2 (en) Method and electronic device
JP4621792B2 (ja) 音質補正装置、音質補正方法及び音質補正用プログラム
JP5267115B2 (ja) 信号処理装置、その処理方法およびプログラム
JP4336364B2 (ja) テレビジョン受像機
US9002021B2 (en) Audio controlling apparatus, audio correction apparatus, and audio correction method
JP4327886B1 (ja) 音質補正装置、音質補正方法及び音質補正用プログラム
US10176825B2 (en) Electronic apparatus, control method, and computer program
JP4837123B1 (ja) 音質制御装置及び音質制御方法
EP2194733B1 (en) Sound volume correcting device, sound volume correcting method, sound volume correcting program, and electronic apparatus.
US8099276B2 (en) Sound quality control device and sound quality control method
JP4937393B2 (ja) 音質補正装置及び音声補正方法
JP2010014960A (ja) 音声音楽判定装置、音声音楽判定方法及び音声音楽判定用プログラム
JP4869420B2 (ja) 音情報判定装置、及び音情報判定方法
US9042562B2 (en) Audio controlling apparatus, audio correction apparatus, and audio correction method
JP4886907B2 (ja) オーディオ信号補正装置及びオーディオ信号補正方法
JP2010258776A (ja) 音声信号処理装置
JP2013164518A (ja) 音声信号補正装置、音声信号補正方法、及び音声信号補正プログラム

Legal Events

Date Code Title Description
A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20110302

A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20110524

A762 Written abandonment of application

Free format text: JAPANESE INTERMEDIATE CODE: A762

Effective date: 20110617