JP7107727B2 - 音声処理装置、音声処理方法、プログラム、及び、プログラムの記録媒体 - Google Patents
音声処理装置、音声処理方法、プログラム、及び、プログラムの記録媒体 Download PDFInfo
- Publication number
- JP7107727B2 JP7107727B2 JP2018079248A JP2018079248A JP7107727B2 JP 7107727 B2 JP7107727 B2 JP 7107727B2 JP 2018079248 A JP2018079248 A JP 2018079248A JP 2018079248 A JP2018079248 A JP 2018079248A JP 7107727 B2 JP7107727 B2 JP 7107727B2
- Authority
- JP
- Japan
- Prior art keywords
- audio data
- layer channel
- channel
- channels
- output
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
Images
Landscapes
- Stereophonic System (AREA)
Description
上記音声データ生成ステップでは、22.2chを有する入力音声データに含まれる、各チャンネルの音声データをダウンミックスすることによって、上記出力音声データの中層チャンネルの音声データを生成し、上記音声データ生成ステップには、上記入力音声データに含まれる中層チャンネルの音声データのうち、フロントに位置する各チャンネルの重み係数を設定する重み係数設定ステップを含む。
以下、本発明の実施形態1について、図1~図6を用いて詳細に説明する。
図1は、本実施形態に係る音声処理装置1の構成を示すブロック図である。音声処理装置1は、複数のチャンネルを有する入力音声データをダウンミックスすることによって、複数のチャンネルを有する出力音声データを生成する。音声処理装置1は、音声データ取得部10と、音声データ生成部11と、音声データ出力部12とを備えている。
音声処理装置1は、例えば22.2chの音声データを取得し、ダウンミックスすることによって、例えば5.1.2ch(水平層5ch、低域1ch、上層2ch)の音声データを生成する。
・上層チャンネル(TpFL、TpFC、TpFR、TpSiL、TpC、TpSiR、TpBL、TpBC、およびTpBR)と、
・中層チャンネル(FL、FLC、FC、FRC、FR、SiL、SiR、BL、BC、およびBR)と、
・下層チャンネル(BtFL、BtFC、BtFR)、低域チャンネル(LFE1、LFE2)とのうち、
少なくとも中層チャンネル、および下層チャンネルの音声データをダウンミックスすることによって、上記出力音声データの中層チャンネル(L、C、R、LS、およびRS)の音声データを生成する。
以下、上記処理について、図5~図6を用いて詳細に説明する。図5の(a)はダイアログ音声データがセンターチャンネルに入力された場合、中層チャンネルにおける中央チャンネルおよび上層チャンネルの右側及び左側チャンネルから出力する一態様を示す図であり、(b)は他の態様を示す図である。また、上記処理の一例として、図5の(a)は、ベース1(図3の(a))に対応する。
本発明の実施形態2について、図7~図15に基づいて説明すれば、以下のとおりである。なお、説明の便宜上、前記実施形態にて説明した部材と同じ機能を有する部材については、同じ符号を付記し、その説明を省略する。
図7は、本実施形態に係る音声処理装置1aの構成を示すブロック図である。実施形態1における音声処理装置1と比較すると、音声処理装置1aは、音声データ生成部11aが重み係数設定部111を備えている点で相違する。以下、この相違点を中心に説明する。
音声処理装置1aは、例えば22.2chの音声データを取得し、ダウンミックスすることによって、例えば5.1.2chの音声データを生成する。
処理例1と比較すると。本変形例では、上層チャンネル(TpFL、TpFC、TpFR、TpSiL、TpC、TpSiR、TpBL、TpBC、およびTpBR)に異なる重み係数α1、α2、及びα3が乗算される点で相違する。以下、この相違点を中心に説明する。
図12は、本実施形態に係る音声処理装置1aが生成する5.1.2chの音声データを含むチャンネルを模式的に示す図であって、(a)は上層チャンネルの音声データを生成する処理例2の生成例1(ベース1に対応)を示す図であり、(b)は処理例2の生成例2(ベース2に対応)を示す図である。
処理例2と比較すると。本変形例では、中層チャンネル(FL、FLC、FC、FRC、FR、SiL、SiR、BL、BC、およびBR)に異なる重み係数β1、β2、及びβ3が乗算される点で相違する。以下、この相違点を中心に説明する。
本発明の実施形態3について、図16~図20に基づいて説明すれば、以下のとおりである。なお、説明の便宜上、前記実施形態1、及び2にて説明した部材と同じ機能を有する部材については、同じ符号を付記し、その説明を省略する。
図16は、本実施形態に係る音声処理装置1bの構成を示すブロック図である。実施形態2における音声処理装置1aと比較すると、音声処理装置1bは、重み係数設定部111aの重み係数の設定方法が異なる。以下、この相違点を中心に説明する。
音声処理装置1bは、例えば22.2chの音声データを取得し、ダウンミックスすることによって、例えば5.1chの音声データを生成する。
具体的には、重み係数設定部111aは、フロントに位置する各チャンネル(FL、FLC、FC、FRC、及びFR)に対応するスピーカの互いの間隔に応じて、上記重み係数を設定する。一例として、図19に示すように、例えばL、Rの距離が近い場合、FL、FRをCにダウンミックスし、L、Rの距離が遠い場合FLをL、FRをRにダウンミックスするように上記重み係数を設定する。
音声処理装置1bは、例えば22.2chの音声データを取得し、ダウンミックスすることによって、例えば5.1.2chの音声データを生成する。
図21は、比較例を示す図である。この比較例において、不図示の音声処理装置は、例えば22.2chの音声データを取得し、ダウンミックスすることによって、例えば5.1chの音声データを生成する。具体的には、不図示の音声処理装置は、複数のチャンネル、例えば22.2chを有する入力音声データをダウンミックスすることによって、複数のチャンネル例えば5.1chを有する出力音声データを生成するものであり、例えば上記22.2chを有する入力音声データに含まれる、各チャンネルの音声データをダウンミックスすることによって、上記出力音声データの中層チャンネル(L、C、R、LS、及びRS)の音声データを生成する。
音声処理装置1の制御ブロック(音声データ生成部11)は、集積回路(ICチップ)等に形成された論理回路(ハードウェア)によって実現してもよいし、CPU(Central Processing Unit)を用いてソフトウェアによって実現してもよい。
本発明の態様1に係る音声処理装置(1)は、複数のチャンネルを有する入力音声データをダウンミックスすることによって、複数のチャンネルを有する出力音声データを生成する音声データ生成部(11)を備えている音声処理装置(1)において、音声データ生成部(11)は、22.2chを有する入力音声データに含まれる上層チャンネル、中層チャンネル、及び下層チャンネルのうち、少なくとも中層チャンネルの音声データをダウンミックスすることによって、上記出力音声データの中層チャンネルの音声データを生成し、上記入力音声データに含まれる、上層チャンネルの音声データをダウンミックスすることによって、上記出力音声データの上層チャンネルの音声データを生成する。
10 音声データ取得部
11、11a、11b 音声データ生成部
12 音声データ出力部
111、111a 重み係数設定部
Claims (11)
- 複数のチャンネルを有する入力音声データをダウンミックスすることによって、複数のチャンネルを有する出力音声データを生成する音声データ生成部を備えている音声処理装置において、
上記音声データ生成部は、
22.2chを有する入力音声データに含まれる上層チャンネル、中層チャンネル、及び下層チャンネルのうち、少なくとも中層チャンネル、および下層チャンネルの音声データをダウンミックスすることによって、上記出力音声データの中層チャンネルの音声データを生成し、
上記入力音声データに含まれる、上層チャンネルの音声データをダウンミックスすることによって、上記出力音声データの上層チャンネルの音声データを生成し、
上記入力音声データに含まれる、上層チャンネルにおける中央チャンネルの音声データから、上記入力音声データに含まれる、中層チャンネルにおける中央チャンネルの音声データを引き算したうえで、上記出力音声データの上層チャンネルの音声データにミックスする
ことを特徴とする音声処理装置。 - 複数のチャンネルを有する入力音声データをダウンミックスすることによって、複数のチャンネルを有する出力音声データを生成する音声データ生成部を備えている音声処理装置において、
上記音声データ生成部は、
22.2chを有する入力音声データに含まれる上層チャンネル、中層チャンネル、及び下層チャンネルのうち、少なくとも中層チャンネル、および下層チャンネルの音声データをダウンミックスすることによって、上記出力音声データの中層チャンネルの音声データを生成し、
上記入力音声データに含まれる、上層チャンネルの音声データをダウンミックスすることによって、上記出力音声データの上層チャンネルの音声データを生成し、
上記入力音声データに含まれる、少なくとも、上層チャンネルの音声データを中層チャンネルの音声データにもダウンミックスすることによって、上記出力音声データの中層チャンネルの音声データを生成し、
上記入力音声データに含まれる、上層チャンネルの音声データを乗算させる重み係数を、前列から後列に行くに従って大きく設定する
ことを特徴とする音声処理装置。 - 複数のチャンネルを有する入力音声データをダウンミックスすることによって、複数のチャンネルを有する出力音声データを生成する音声データ生成部を備えている音声処理装置において、
上記音声データ生成部は、
22.2chを有する入力音声データに含まれる上層チャンネル、中層チャンネル、及び下層チャンネルのうち、少なくとも中層チャンネル、および下層チャンネルの音声データをダウンミックスすることによって、上記出力音声データの中層チャンネルの音声データを生成し、
上記入力音声データに含まれる、上層チャンネルの音声データをダウンミックスすることによって、上記出力音声データの上層チャンネルの音声データを生成し、
上記入力音声データに含まれる、少なくとも、上層チャンネルの音声データに中層チャンネルの音声データをダウンミックスすることによって、上記出力音声データの上層チャンネルの音声データを生成し、
上記入力音声データに含まれる、中層チャンネルの音声データを乗算させる重み係数を、前列から後列に行くに従って大きく設定する
ことを特徴とする音声処理装置。 - 上記音声データ生成部は、
上記入力音声データに含まれる、上層チャンネルにおける中央チャンネルの音声データを、上記出力音声データの上層チャンネルの音声データにミックスせず、上記出力音声データの中層チャンネルにおける中央チャンネルの音声データにミックスする
ことを特徴とする請求項2または3に記載の音声処理装置。 - 上記音声データ生成部は、
上記入力音声データに含まれる、少なくとも、上層チャンネルの音声データと中層チャンネルの音声データとをダウンミックスすることによって、上記出力音声データの上層チャンネルにおける右側チャンネルの音声データ及び左側チャンネルの音声データを生成する
ことを特徴とする請求項1~4の何れか1項に記載の音声処理装置。 - 上記音声データ生成部は、
上記入力音声データに含まれる、少なくとも、上層チャンネルの音声データと中層チャンネルの音声データとをダウンミックスすることによって、上記出力音声データの上層チャンネルにおける前側チャンネルの音声データ及び後側チャンネルの音声データを生成する
ことを特徴とする請求項1~4の何れか1項に記載の音声処理装置。 - 複数のチャンネルを有する入力音声データをダウンミックスすることによって、複数のチャンネルを有する出力音声データを生成する音声データ生成ステップを含む音声処理方法において、
上記音声データ生成ステップでは、
22.2chを有する入力音声データに含まれる上層チャンネル、中層チャンネル、及び下層チャンネルのうち、少なくとも中層チャンネル、および下層チャンネルの音声データをダウンミックスすることによって、上記出力音声データの中層チャンネルの音声データを生成し、
上記入力音声データに含まれる、上層チャンネルの音声データをダウンミックスすることによって、上記出力音声データの上層チャンネルの音声データを生成し、
上記入力音声データに含まれる、上層チャンネルにおける中央チャンネルの音声データから、上記入力音声データに含まれる、中層チャンネルにおける中央チャンネルの音声データを引き算したうえで、上記出力音声データの上層チャンネルの音声データにミックスする
ことを特徴とする音声処理方法。 - 複数のチャンネルを有する入力音声データをダウンミックスすることによって、複数のチャンネルを有する出力音声データを生成する音声データ生成ステップを含む音声処理方法において、
上記音声データ生成ステップでは、
22.2chを有する入力音声データに含まれる上層チャンネル、中層チャンネル、及び下層チャンネルのうち、少なくとも中層チャンネル、および下層チャンネルの音声データをダウンミックスすることによって、上記出力音声データの中層チャンネルの音声データを生成し、
上記入力音声データに含まれる、上層チャンネルの音声データをダウンミックスすることによって、上記出力音声データの上層チャンネルの音声データを生成し、
上記入力音声データに含まれる、少なくとも、上層チャンネルの音声データを中層チャンネルの音声データにもダウンミックスすることによって、上記出力音声データの中層チャンネルの音声データを生成し、
上記入力音声データに含まれる、上層チャンネルの音声データを乗算させる重み係数を、前列から後列に行くに従って大きく設定する
ことを特徴とする音声処理方法。 - 複数のチャンネルを有する入力音声データをダウンミックスすることによって、複数のチャンネルを有する出力音声データを生成する音声データ生成ステップを含む音声処理方法において、
上記音声データ生成ステップでは、
22.2chを有する入力音声データに含まれる上層チャンネル、中層チャンネル、及び下層チャンネルのうち、少なくとも中層チャンネル、および下層チャンネルの音声データをダウンミックスすることによって、上記出力音声データの中層チャンネルの音声データを生成し、
上記入力音声データに含まれる、上層チャンネルの音声データをダウンミックスすることによって、上記出力音声データの上層チャンネルの音声データを生成し、
上記入力音声データに含まれる、少なくとも、上層チャンネルの音声データに中層チャンネルの音声データをダウンミックスすることによって、上記出力音声データの上層チャンネルの音声データを生成し、
上記入力音声データに含まれる、中層チャンネルの音声データを乗算させる重み係数を、前列から後列に行くに従って大きく設定する
ことを特徴とする音声処理方法。 - 請求項1~6の何れか1項に記載の音声処理装置としてコンピュータを機能させるためのプログラムであって、上記音声データ生成部としてコンピュータを機能させるための
プログラム。 - 請求項10に記載のプログラムを記録したコンピュータ読み取り可能な記録媒体。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2018079248A JP7107727B2 (ja) | 2018-04-17 | 2018-04-17 | 音声処理装置、音声処理方法、プログラム、及び、プログラムの記録媒体 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2018079248A JP7107727B2 (ja) | 2018-04-17 | 2018-04-17 | 音声処理装置、音声処理方法、プログラム、及び、プログラムの記録媒体 |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2019186888A JP2019186888A (ja) | 2019-10-24 |
JP7107727B2 true JP7107727B2 (ja) | 2022-07-27 |
Family
ID=68337740
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2018079248A Active JP7107727B2 (ja) | 2018-04-17 | 2018-04-17 | 音声処理装置、音声処理方法、プログラム、及び、プログラムの記録媒体 |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP7107727B2 (ja) |
Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2016537669A (ja) | 2013-10-21 | 2016-12-01 | ドルビー・インターナショナル・アーベー | オーディオ信号のパラメトリック再構成 |
JP2017212547A (ja) | 2016-05-24 | 2017-11-30 | 日本放送協会 | チャンネル数変換装置およびそのプログラム |
-
2018
- 2018-04-17 JP JP2018079248A patent/JP7107727B2/ja active Active
Patent Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2016537669A (ja) | 2013-10-21 | 2016-12-01 | ドルビー・インターナショナル・アーベー | オーディオ信号のパラメトリック再構成 |
JP2017212547A (ja) | 2016-05-24 | 2017-11-30 | 日本放送協会 | チャンネル数変換装置およびそのプログラム |
Also Published As
Publication number | Publication date |
---|---|
JP2019186888A (ja) | 2019-10-24 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
KR102294767B1 (ko) | 고채널 카운트 멀티채널 오디오에 대한 멀티플렛 기반 매트릭스 믹싱 | |
KR101341523B1 (ko) | 스테레오 신호들로부터 멀티 채널 오디오 신호들을생성하는 방법 | |
KR100636252B1 (ko) | 공간 스테레오 사운드 생성 방법 및 장치 | |
KR102302672B1 (ko) | 음향 신호의 렌더링 방법, 장치 및 컴퓨터 판독 가능한 기록 매체 | |
US20080298597A1 (en) | Spatial Sound Zooming | |
JP2015509212A (ja) | 空間オーディオ・レンダリング及び符号化 | |
JP6284480B2 (ja) | 音声信号再生装置、方法、プログラム、及び記録媒体 | |
CN103081512A (zh) | 3d声音再现方法和设备 | |
JP6660982B2 (ja) | オーディオ信号レンダリング方法及び装置 | |
KR102160248B1 (ko) | 다채널 음향 신호의 정위 방법 및 장치 | |
JP5611970B2 (ja) | オーディオ信号を変換するためのコンバータ及び方法 | |
CN103650538A (zh) | 用于使用采用谱权重生成器的频域处理分解立体声录音的方法和装置 | |
JP2006033847A (ja) | 最適な仮想音源を提供する音響再生装置及び音響再生方法 | |
Lee | 2D to 3D ambience upmixing based on perceptual band allocation | |
JP5338053B2 (ja) | 波面合成信号変換装置および波面合成信号変換方法 | |
JP2012129840A (ja) | 音響システム、音響信号処理装置および方法、並びに、プログラム | |
WO2021124906A1 (ja) | 制御装置、信号処理方法およびスピーカ装置 | |
JP7107727B2 (ja) | 音声処理装置、音声処理方法、プログラム、及び、プログラムの記録媒体 | |
JP2018121309A (ja) | 音声処理装置、音声出力装置、テレビジョン受像機、音声処理方法、プログラム、及び、プログラムの記録媒体 | |
JP2011199707A (ja) | 音声データ再生装置及び音声データ再生方法 | |
JP5743003B2 (ja) | 波面合成信号変換装置および波面合成信号変換方法 | |
JP2015076857A (ja) | アップミックス装置、音響再生装置、音響増幅装置、及びプログラム | |
US20230269552A1 (en) | Electronic device, system, method and computer program | |
JP6905411B2 (ja) | チャンネル数変換装置及びプログラム | |
JP2018121310A (ja) | 音声処理装置、音声出力装置、テレビジョン受像機、音声処理方法、プログラム、及び、プログラムの記録媒体 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20210324 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20220215 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20220301 |
|
A601 | Written request for extension of time |
Free format text: JAPANESE INTERMEDIATE CODE: A601 Effective date: 20220427 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20220602 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20220621 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20220714 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 7107727 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |