RU2623886C2 - Способ и устройство для сжатия и восстановления представления системы амбисоник высшего порядка для звукового поля - Google Patents

Способ и устройство для сжатия и восстановления представления системы амбисоник высшего порядка для звукового поля Download PDF

Info

Publication number
RU2623886C2
RU2623886C2 RU2015128090A RU2015128090A RU2623886C2 RU 2623886 C2 RU2623886 C2 RU 2623886C2 RU 2015128090 A RU2015128090 A RU 2015128090A RU 2015128090 A RU2015128090 A RU 2015128090A RU 2623886 C2 RU2623886 C2 RU 2623886C2
Authority
RU
Russia
Prior art keywords
residual
signals
hoa
component
order
Prior art date
Application number
RU2015128090A
Other languages
English (en)
Other versions
RU2015128090A (ru
Inventor
Александр КРЮГЕР
Свен КОРДОН
Йоханнес БЕМ
Original Assignee
Долби Интернэшнл Аб
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Долби Интернэшнл Аб filed Critical Долби Интернэшнл Аб
Publication of RU2015128090A publication Critical patent/RU2015128090A/ru
Application granted granted Critical
Publication of RU2623886C2 publication Critical patent/RU2623886C2/ru

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04SSTEREOPHONIC SYSTEMS 
    • H04S7/00Indicating arrangements; Control arrangements, e.g. balance control
    • H04S7/30Control circuits for electronic adaptation of the sound field
    • H04S7/302Electronic adaptation of stereophonic sound system to listener position or orientation
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/008Multichannel audio signal coding or decoding using interchannel correlation to reduce redundancy, e.g. joint-stereo, intensity-coding or matrixing
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04SSTEREOPHONIC SYSTEMS 
    • H04S3/00Systems employing more than two channels, e.g. quadraphonic
    • H04S3/008Systems employing more than two channels, e.g. quadraphonic in which the audio signals are in digital form, i.e. employing more than two discrete digital channels
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04HBROADCAST COMMUNICATION
    • H04H20/00Arrangements for broadcast or for distribution combined with broadcast
    • H04H20/86Arrangements characterised by the broadcast information itself
    • H04H20/88Stereophonic broadcast systems
    • H04H20/89Stereophonic broadcast systems using three or more audio channels, e.g. triphonic or quadraphonic
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04SSTEREOPHONIC SYSTEMS 
    • H04S2400/00Details of stereophonic systems covered by H04S but not provided for in its groups
    • H04S2400/01Multi-channel, i.e. more than two input channels, sound reproduction with two speakers wherein the multi-channel information is substantially preserved
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04SSTEREOPHONIC SYSTEMS 
    • H04S2420/00Techniques used stereophonic systems covered by H04S but not provided for in its groups
    • H04S2420/11Application of ambisonics in stereophonic audio systems

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Acoustics & Sound (AREA)
  • Signal Processing (AREA)
  • Multimedia (AREA)
  • Computational Linguistics (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Mathematical Physics (AREA)
  • Stereophonic System (AREA)
  • Percussion Or Vibration Massage (AREA)
  • Compression, Expansion, Code Conversion, And Decoders (AREA)

Abstract

Изобретение относится к средствам для сжатия и восстановления представления системы Амбисоник высшего порядка для звукового поля. Технический результат заключается в улучшении качества сжатого представления звукового поля HOA. Представление HOA анализируется на присутствие доминирующих источников звука и их направления оцениваются. Затем представление HOA разлагается на некоторое количество доминирующих направленных сигналов и остаточную компоненту. Эта остаточная компонента преобразуется в дискретную пространственную область, чтобы получать функции общих плоских волн в равномерных направлениях дискретизации, которые предсказываются из доминирующих направленных сигналов. В заключение, ошибка предсказания преобразуется назад в область HOA и представляет остаточную окружающую компоненту HOA, для которой выполняется уменьшение порядка, затем следует перцепционное кодирование доминирующих направленных сигналов и остаточной компоненты. 4 н. и 10 з.п. ф-лы, 8 ил.

Description

Изобретение относится к способу и к устройству для сжатия и восстановления представления системы Амбисоник высшего порядка для звукового поля.
Уровень техники
Система Амбисоник высшего порядка, обозначаемая HOA, предлагает один способ представления трехмерного звука. Другими способами являются синтез волнового поля (WFS) или основанные на каналах способы, как, например, 22.2. В отличие от основанных на каналах способов, представление HOA предлагает преимущество, что оно является независимым от конкретной системы громкоговорителей. Эта гибкость, однако, обеспечивается за счет обработки декодирования, которая требуется для проигрывания представления HOA на конкретной системе громкоговорителей. По сравнению с подходом WFS, где количество требуемых громкоговорителей является обычно очень большим, HOA также может воспроизводиться на системах, состоящих только из нескольких громкоговорителей. Дополнительное преимущество HOA состоит в том, что одно и то же представление также может использоваться без какой-либо модификации для бинаурального воспроизведения в наушниках.
HOA основывается на представлении пространственной плотности комплексных амплитуд гармонических плоских волн посредством усеченного разложения по сферическим гармоникам (SH). Каждый коэффициент разложения является функцией угловой частоты, который может быть эквивалентным образом представлен посредством функции временной области. Следовательно, без потери общности, может предполагаться, что полное представление звукового поля HOA фактически состоит из
Figure 00000001
функций временной области, где
Figure 00000002
обозначает количество коэффициентов разложения. Эти функции временной области в последующем будут эквивалентным образом упоминаться как последовательности коэффициентов HOA.
Пространственное разрешение представления HOA улучшается с ростом максимального порядка
Figure 00000003
разложения. К сожалению, количество коэффициентов разложения
Figure 00000004
растет квадратично с порядком
Figure 00000005
, в частности,
Figure 00000006
. Например, обычные представления HOA, использующие порядок
Figure 00000007
, требуют
Figure 00000008
коэффициентов (разложения) HOA. Согласно вышеизложенным рассмотрениям, полный битрейт (частота следования битов) для передачи представления HOA, при заданных требуемой одноканальной частоте дискретизации
Figure 00000009
и количестве бит
Figure 00000010
в расчете на выборку, определяется посредством
Figure 00000011
. Передача представления HOA порядка
Figure 00000012
с частотой дискретизации
Figure 00000013
= 48 кГц с использованием
Figure 00000014
бит в расчете на выборку дает результатом битрейт, равный 19.2 Мбит/с, что является очень высоким для многих практических применений, например, потоковой передачи. Поэтому сжатие представлений HOA является в высшей степени предпочтительным.
Изобретение
Существующие способы, обращающиеся к сжатию представлений HOA (с
Figure 00000015
), являются достаточно редкими. Наиболее прямой подход, которому следуют в E. Hellerud, I. Burnett, A Solvang and U.P. Svensson, "Encoding Higher Order Ambisonics with AAC", 124th AES Convention, Amsterdam, 2008, состоит в том, чтобы выполнять прямое кодирование индивидуальных последовательностей коэффициентов HOA с использованием улучшенного кодирования аудио (AAC), которое является алгоритмом перцепционного кодирования. Однако присущей проблемой для этого подхода является перцепционное кодирование сигналов, которые никогда не прослушиваются. Реконструированные сигналы проигрывания обычно получаются посредством взвешенной суммы последовательностей коэффициентов HOA, и имеется высокая вероятность для размаскирования шума перцепционного кодирования, когда восстановленное представление HOA воспроизводится на конкретной системе громкоговорителей. Большой проблемой для размаскирования шума перцепционного кодирования являются высокие взаимные корреляции между индивидуальными последовательностями коэффициентов HOA. Так как сигналы шума кодирования в индивидуальных последовательностях коэффициентов HOA являются обычно некоррелированными друг с другом, может происходить конструктивная суперпозиция шума перцепционного кодирования при том, что в то же время свободные от шума последовательности коэффициентов HOA удаляются при суперпозиции. Дополнительная проблема состоит в том, что эти взаимные корреляции ведут к уменьшенной эффективности перцепционных кодеров.
Чтобы минимизировать степень обоих эффектов, в EP 2469742 A2 предложено преобразовывать представление HOA в эквивалентное представление в дискретной пространственной области до перцепционного кодирования. Формально, эта дискретная пространственная область является эквивалентом временной области пространственной плотности комплексных амплитуд гармонических плоских волн, дискретизированной в некоторых дискретных направлениях. Дискретная пространственная область, таким образом, представляется посредством
Figure 00000016
стандартных сигналов временной области, которые могут интерпретироваться как общие плоские волны, сталкивающиеся из направлений дискретизации, и соответствуют сигналам громкоговорителей, если громкоговорители расположены в точности в таких же направлениях, что и направления, предполагаемые для преобразования пространственной области.
Преобразование в дискретную пространственную область уменьшает взаимные корреляции между индивидуальными сигналами пространственной области, но эти взаимные корреляции полностью не устраняются. Примером для относительно высоких взаимных корреляций является направленный сигнал, чье направление попадает между смежными направлениями, охватываемыми сигналами пространственной области.
Основной недостаток обоих подходов состоит в том, что количество перцепционно кодированных сигналов равняется
Figure 00000017
, и скорость данных для сжатого представления HOA растет квадратично с порядком системы Амбисоник N.
Чтобы уменьшать количество перцепционно кодированных сигналов, патентная заявка EP 2665208 A1 предлагает разложение представления HOA на заданное максимальное количество доминирующих направленных сигналов и остаточную окружающую компоненту. Уменьшение количества сигналов, подлежащих перцепционному кодированию, достигается посредством уменьшения порядка остаточной окружающей компоненты. Логическое обоснование за этим подходом состоит в том, чтобы сохранять высокое пространственное разрешение по отношению к доминирующим направленным сигналам при представлении остатка с достаточной точностью посредством представления HOA более низкого порядка.
Этот подход работает достаточно хорошо до тех пор, пока предположения о звуковом поле удовлетворяются, т.е. что оно состоит из малого количества доминирующих направленных сигналов (представляющих функции общих плоских волн, кодированные с использованием полного порядка N) и остаточной окружающей компоненты без какой-либо направленности. Однако, если последующее разложение остаточной окружающей компоненты все еще содержит некоторые доминирующие направленные компоненты, уменьшение порядка вызывает ошибки, которые воспринимаются различным образом при воспроизведении после восстановления. Обычными примерами представлений HOA, где предположения нарушаются, являются общие плоские волны, кодированные в порядке, более низком, чем N. Такие общие плоские волны порядка, более низкого, чем N, могут проистекать из авторского создания, чтобы делать, чтобы источники звука проявлялись более широко, и также могут происходить при записи представлений звукового поля HOA посредством сферических микрофонов. В обоих примерах звуковое поле представляется посредством большого количества высоко коррелированных сигналов пространственной области (см. также раздел Пространственное разрешение системы Амбисоник высшего порядка для объяснения).
Проблема, подлежащая решению посредством изобретения, состоит в том, чтобы устранить недостатки, результирующие из обработки, описанной в патентной заявке EP 2665208 A1, чтобы, тем самым, также избежать вышеописанных недостатков другого процитированного предшествующего уровня техники.
Эта проблема решается посредством способов, раскрытых в пунктах 1 и 3. Соответствующие устройства, которые используют эти способы, раскрыты в пунктах 2 и 4.
Изобретение улучшает обработку сжатия представления звукового поля HOA, описанную в патентной заявке EP 2665208 A1. Сначала, как и в EP 2665208 A1, представление HOA анализируется на присутствие доминирующих источников звука, чьи направления оцениваются. Со знанием направлений доминирующих источников звука, представление HOA разлагается на некоторое количество доминирующих направленных сигналов, представляющих общие плоские волны, и остаточную компоненту. Однако вместо немедленного уменьшения порядка этой остаточной компоненты HOA, она преобразуется в дискретную пространственную область, чтобы получать функции общих плоских волн в равномерных направлениях дискретизации, представляющие остаточную компоненту HOA. После этого эти функции плоских волн предсказываются из доминирующих направленных сигналов. Причина для этой операции состоит в том, что части остаточной компоненты HOA могут быть высоко коррелированными с доминирующими направленными сигналами.
Это предсказание может быть простым предсказанием, чтобы вырабатывать только малую величину дополнительной (побочной) информации. В наиболее простом случае предсказание состоит из соответствующего масштабирования и задержки. В заключение, ошибка предсказания преобразуется назад в область HOA и рассматривается как остаточная окружающая компонента HOA, для которой выполняется уменьшение порядка. Предпочтительно, эффект вычитания предсказуемых сигналов из остаточной компоненты HOA состоит в том, чтобы уменьшать ее полную мощность также как оставшуюся величину доминирующих направленных сигналов и, этим способом, уменьшать ошибку разложения, результирующую из уменьшения порядка.
В принципе, новый способ сжатия подходит для сжатия представления системы Амбисоник высшего порядка, обозначаемой HOA, для звукового поля, при этом упомянутый способ включает в себя этапы:
- из текущего временного кадра коэффициентов HOA, оценку направлений доминирующих источников звука;
- в зависимости от упомянутых коэффициентов HOA и от упомянутых направлений доминирующих источников звука, разложение упомянутого представления HOA на доминирующие направленные сигналы во временной области и остаточную компоненту HOA, при этом упомянутая остаточная компонента HOA преобразуется в дискретную пространственную область, чтобы получать функции плоских волн в равномерных направлениях дискретизации, представляющие упомянутую остаточную компоненту HOA, и при этом упомянутые функции плоских волн предсказываются из упомянутых доминирующих направленных сигналов, тем самым, обеспечивая параметры, описывающие упомянутое предсказание, и соответствующая ошибка предсказания преобразуется назад в область HOA;
- уменьшение текущего порядка упомянутой остаточной компоненты HOA до более низкого порядка, что дает результатом остаточную компоненту HOA уменьшенного порядка;
- декоррелирование упомянутой остаточной компоненты HOA уменьшенного порядка, чтобы получать соответствующие сигналы временной области остаточной компоненты HOA;
- перцепционное кодирование упомянутых доминирующих направленных сигналов и упомянутых сигналов временной области остаточной компоненты HOA, чтобы обеспечивать сжатые доминирующие направленные сигналы и сжатые сигналы остаточной компоненты.
В принципе? новое устройство сжатия является подходящим для сжатия представления системы Амбисоник высшего порядка, обозначаемой HOA, для звукового поля, при этом упомянутое устройство включает в себя:
- средство, которое выполнено с возможностью оценки направлений доминирующих источников звука из текущего временного кадра коэффициентов HOA;
- средство, которое выполнено с возможностью разложения, в зависимости от упомянутых коэффициентов HOA и от упомянутых направлений доминирующих источников звука, упомянутого представления HOA на доминирующие направленные сигналы во временной области и остаточную компоненту HOA, при этом упомянутая остаточная компонента HOA преобразуется в дискретную пространственную область, чтобы получать функции плоских волн в равномерных направлениях дискретизации, представляющие упомянутую остаточную компоненту HOA, и при этом упомянутые функции плоских волн предсказываются из упомянутых доминирующих направленных сигналов, тем самым, обеспечивая параметры, описывающие упомянутое предсказание, и соответствующая ошибка предсказания преобразуется назад в область HOA;
- средство, которое выполнено с возможностью уменьшения текущего порядка упомянутой остаточной компоненты HOA до более низкого порядка, что дает результатом остаточную компоненту HOA уменьшенного порядка;
- средство, которое выполнено с возможностью декоррелирования упомянутой остаточной компоненты HOA уменьшенного порядка, чтобы получать соответствующие сигналы временной области остаточной компоненты HOA;
- средство, которое выполнено с возможностью перцепционного кодирования упомянутых доминирующих направленных сигналов и упомянутых сигналов временной области остаточной компоненты HOA, чтобы обеспечивать сжатые доминирующие направленные сигналы и сжатые сигналы остаточной компоненты.
В принципе, новый способ восстановления является подходящим для восстановления представления системы Амбисоник высшего порядка, сжатого согласно вышеописанному способу сжатия, при этом упомянутый способ восстановления включает в себя этапы:
- перцепционное декодирование упомянутых сжатых доминирующих направленных сигналов и упомянутых сжатых сигналов остаточной компоненты, чтобы обеспечивать восстановленные доминирующие направленные сигналы и восстановленные сигналы временной области, представляющие остаточную компоненту HOA в пространственной области;
- повторную корреляцию упомянутых восстановленных сигналов временной области, чтобы получать соответствующую остаточную компоненту HOA уменьшенного порядка;
- увеличение порядка упомянутой остаточной компоненты HOA уменьшенного порядка до исходного порядка, чтобы обеспечивать соответствующую восстановленную остаточную компоненту HOA;
- с использованием упомянутых восстановленных доминирующих направленных сигналов, упомянутой восстановленной остаточной компоненты HOA исходного порядка, упомянутых оцененных направлений доминирующих источников звука, и упомянутых параметров, описывающих упомянутое предсказание, конструирование соответствующего восстановленного и реконструированного кадра коэффициентов HOA.
В принципе новое устройство восстановления является подходящим для восстановления представления системы Амбисоник высшего порядка, сжатого согласно вышеописанному способу сжатия, при этом упомянутое устройство восстановления включает в себя:
- средство, которое выполнено с возможностью перцепционного декодирования упомянутых сжатых доминирующих направленных сигналов и упомянутых сжатых сигналов остаточной компоненты, чтобы обеспечивать восстановленные доминирующие направленные сигналы и восстановленные сигналы временной области, представляющие остаточную компоненту HOA в пространственной области;
- средство, которое выполнено с возможностью повторной корреляции упомянутых восстановленных сигналов временной области, чтобы получать соответствующую остаточную компоненту HOA уменьшенного порядка;
- средство, которое выполнено с возможностью увеличения порядка упомянутой остаточной компоненты HOA уменьшенного порядка до исходного порядка, чтобы обеспечивать соответствующую восстановленную остаточную компоненту HOA;
- средство, которое выполнено с возможностью конструирования соответствующего восстановленного и реконструированного кадра коэффициентов HOA посредством использования упомянутых восстановленных доминирующих направленных сигналов, упомянутой восстановленной остаточной компоненты HOA исходного порядка, упомянутых оцененных направлений доминирующих источников звука, и упомянутых параметров, описывающих упомянутое предсказание.
Предпочтительные дополнительные варианты осуществления изобретения раскрыты в соответствующих зависимых пунктах формулы изобретения.
Чертежи
Иллюстративные варианты осуществления изобретения описаны со ссылкой на сопровождающие чертежи, которые показывают:
Фиг. 1a - этап 1 сжатия: разложение сигнала HOA на некоторое количество доминирующих направленных сигналов, остаточную окружающую компоненту HOA и дополнительную информацию;
Фиг. 1b - этап 2 сжатия: уменьшение порядка и декоррелирование для окружающей компоненты HOA и перцепционное кодирование обоих компонент;
Фиг. 2a - этап 1 восстановления: перцепционное декодирование сигналов временной области, повторная корреляция сигналов, представляющих остаточную окружающую компоненту HOA, и увеличение порядка;
Фиг. 2b - этап 2 восстановления: конструирование полного представления HOA;
Фиг. 3 - разложение HOA;
Фиг. 4 - конструирование HOA;
Фиг. 5 - сферическая система координат.
Иллюстративные варианты осуществления
Обработка сжатия
Обработка сжатия согласно изобретению включает в себя два последовательных этапа, проиллюстрированных на фиг. 1a и фиг. 1b, соответственно. Точные определения индивидуальных сигналов описаны в разделе Подробное описание разложения и реконструкции HOA. Используется по-кадровая обработка для сжатия с неперекрывающимися входными кадрами
Figure 00000018
последовательностей коэффициентов HOA длины
Figure 00000019
, где k обозначает индекс кадра. Кадры определяются по отношению к последовательностям коэффициентов HOA, определенным в уравнении (42) как
Figure 00000020
(1)
где
Figure 00000021
обозначает период дискретизации.
На фиг. 1a, кадр
Figure 00000022
последовательностей коэффициентов HOA вводится в этап или стадию 11 оценки направлений доминирующих источников звука, который анализирует представление HOA на присутствие доминирующих направленных сигналов, чьи направления оцениваются. Оценка направления может выполняться, например, посредством обработки, описанной в патентной заявке EP 2665208 A1. Оцененные направления обозначаются посредством
Figure 00000023
, где
Figure 00000024
обозначает максимальное количество оценок направлений. Предполагается, что они располагаются в матрице
Figure 00000025
как
Figure 00000026
. (2)
Неявно предполагается, что оценки направлений подходящим образом упорядочены посредством назначения их оценкам направлений из предыдущих кадров. Следовательно, предполагается, что временная последовательность индивидуальной оценки направления описывает направленную траекторию доминирующего источника звука. В частности, если предполагается, что d-й доминирующий источник звука не является активным, является возможным указать это посредством назначения недействительного значения для
Figure 00000027
. Затем, используя оцененные направления в
Figure 00000028
, представление HOA разлагается на этапе или стадии 12 разложения на некоторое количество максимум
Figure 00000029
доминирующих направленных сигналов
Figure 00000030
, некоторые параметры
Figure 00000031
, описывающие предсказание сигналов пространственной области остаточной компоненты HOA из доминирующих направленных сигналов, и окружающую компоненту HOA
Figure 00000032
, представляющую ошибку предсказания. Подробное описание этого разложения обеспечивается в разделе Разложение HOA.
На фиг. 1b показано перцепционное кодирование направленных сигналов
Figure 00000033
и остаточной окружающей компоненты HOA
Figure 00000034
. Направленные сигналы
Figure 00000035
являются стандартными сигналами временной области, которые могут индивидуально сжиматься с использованием любого существующего способа перцепционного сжатия. Сжатие окружающей компоненты области HOA
Figure 00000036
выполняется в двух последовательных этапах или стадиях. На этапе или стадии 13 уменьшения порядка выполняется уменьшение до порядка системы Амбисоник
Figure 00000037
, где, например,
Figure 00000038
, давая результатом окружающую компоненту HOA
Figure 00000039
. Такое уменьшение порядка выполняется посредством удержания в
Figure 00000040
только
Figure 00000041
коэффициентов HOA и отбрасывания других. На стороне декодера, как описано ниже, для опущенных значений добавляются соответствующие нулевые значения.
Следует отметить, что, по сравнению с подходом в патентной заявке EP 2665208 A1, уменьшенный порядок
Figure 00000042
может, в общем, выбираться более малым, так как полная мощность также как оставшаяся величина направленности остаточной окружающей компоненты HOA является более малой. Поэтому уменьшение порядка вызывает более малые ошибки по сравнению с EP 2665208 A1.
На последующем этапе или стадии 14 декоррелирования, последовательности коэффициентов HOA, представляющие окружающую компоненту HOA
Figure 00000043
с уменьшенным порядком, декоррелируются, чтобы получать сигналы временной области
Figure 00000044
, которые вводятся в (набор из) параллельные перцепционные кодеры или модули 15 сжатия, работающие согласно любому известному способу перцепционного сжатия. Декоррелирование выполняется, чтобы избегать размаскирования шума перцепционного кодирования при воспроизведении представления HOA, следующем за его восстановлением (см. патентную заявку EP 2688065 A1 для объяснения). Приблизительное декоррелирование может достигаться посредством преобразования
Figure 00000045
в
Figure 00000046
эквивалентных сигналов в пространственной области посредством применения сферического гармонического преобразования, как описано в EP 2469742 A2.
Альтернативно, может использоваться адаптивное сферическое гармоническое преобразование, как предложено в патентной заявке EP 2688066 A1, где сетка направлений дискретизации вращается, чтобы достигать наилучшего возможного эффекта декоррелирования. Дополнительным альтернативным способом декоррелирования является преобразование Карунена-Лоэва (KLT), описанное в патентной заявке EP 12305860.4. Следует отметить, что для упомянутых последних двух типов декоррелирования должен обеспечиваться некоторый тип дополнительной информации, обозначенной посредством
Figure 00000047
, чтобы обеспечивать возможность обращения декоррелирования на стадии восстановления HOA.
В одном варианте осуществления перцепционное сжатие всех сигналов временной области
Figure 00000048
и
Figure 00000049
выполняется совместно, чтобы улучшать эффективность кодирования.
Вывод перцепционного кодирования является сжатыми направленными сигналами
Figure 00000050
и сжатыми окружающими сигналами временной области
Figure 00000051
.
Обработка восстановления
Обработка восстановления показана на фиг. 2a и фиг. 2b. Подобно сжатию, она состоит из двух последовательных этапов. На фиг. 2a перцепционное восстановление направленных сигналов
Figure 00000052
и сигналов временной области
Figure 00000053
, представляющих остаточную окружающую компоненту HOA, выполняется на этапе или стадии 21 перцепционного декодирования или восстановления. Результирующие перцепционно восстановленные сигналы временной области
Figure 00000054
повторно коррелируются на этапе или стадии 22 повторной корреляции, чтобы обеспечивать представление HOA остаточной компоненты
Figure 00000055
порядка
Figure 00000056
. Необязательно, повторная корреляция может выполняться обратным способом, как описано для упомянутых двух альтернативных обработок, описанных для этапа/стадии 14, с использованием переданных или сохраненных параметров
Figure 00000057
в зависимости от способа декоррелирования, который использовался. После этого, из
Figure 00000058
оценивается соответствующее представление HOA
Figure 00000059
порядка
Figure 00000060
на этапе или стадии 23 увеличения порядка посредством увеличения порядка. Увеличение порядка достигается посредством добавления соответствующих строк 'нулевых значений' к
Figure 00000061
, тем самым предполагается, что коэффициенты HOA по отношению к более высоким порядкам имеют нулевые значения.
На фиг. 2b полное представление HOA реконструируется на этапе или стадии 24 конструирования из восстановленных доминирующих направленных сигналов
Figure 00000062
вместе с соответствующими направлениями
Figure 00000063
и параметрами предсказания
Figure 00000064
, также как из остаточной окружающей компоненты HOA
Figure 00000065
, что дает результатом восстановленный и реконструированный кадр
Figure 00000066
коэффициентов HOA.
В случае, когда перцепционное сжатие всех сигналов временной области
Figure 00000067
и
Figure 00000068
выполняется совместно, чтобы улучшать эффективность кодирования, перцепционное восстановление сжатых направленных сигналов
Figure 00000069
и сжатых сигналов временной области
Figure 00000070
также выполняется совместно соответствующим способом.
Подробное описание реконструкции обеспечивается в разделе Реконструкция HOA.
Разложение HOA
Блок-схема, иллюстрирующая операции, выполняемые для разложения HOA, дана на фиг. 3. Краткое описание операции: Во-первых, сглаженные доминирующие направленные сигналы
Figure 00000071
вычисляются и выводятся для перцепционного сжатия. Далее, остаток между представлением HOA
Figure 00000072
доминирующих направленных сигналов и исходным представлением HOA
Figure 00000073
представляется посредством некоторого количества
Figure 00000074
направленных сигналов
Figure 00000075
, которые могут рассматриваться как общие плоские волны из равномерно распределенных направлений. Эти направленные сигналы предсказываются из доминирующих направленных сигналов
Figure 00000076
, где выводятся параметры предсказания
Figure 00000077
. В заключение, вычисляется и выводится остаток
Figure 00000078
между исходным представлением HOA
Figure 00000079
и представлением HOA
Figure 00000080
доминирующих направленных сигналов вместе с представлением HOA
Figure 00000081
предсказанных направленных сигналов из равномерно распределенных направлений.
Перед тем, как углубляться в подробности, следует упомянуть, что изменения направлений между последовательными кадрами может вести к нарушению непрерывности всех вычисленных сигналов в течение конструирования. Следовательно, мгновенные оценки соответствующих сигналов для перекрывающихся кадров вычисляются первыми, которые имеют длину 2B. Во-вторых, результаты последовательных перекрывающихся кадров сглаживаются с использованием соответствующей оконной функции. Каждое сглаживание, однако, вводит задержку одиночного кадра.
Вычисление мгновенных доминирующих направленных сигналов
Вычисление мгновенных доминирующих направленных сигналов на этапе или стадии 30 из оцененных направлений источников звука в
Figure 00000082
для текущего кадра
Figure 00000083
последовательностей коэффициентов HOA основывается на сопоставлении режимов, как описано в M.A. Poletti, "Three-Dimensional Surround Sound Systems Based on Spherical Harmonics", J. Audio Eng. Soc., 53(11), страницы 1004-1025, 2005. В частности, ищутся те направленные сигналы, чье представление HOA дает результатом наилучшее приближение заданного сигнала HOA.
Дополнительно, без потери общности, предполагается, что каждая оценка направления
Figure 00000084
активного доминирующего источника звука может однозначно определяться посредством вектора, имеющего угол наклона
Figure 00000085
и азимутальный угол
Figure 00000086
(см. фиг. 5 для иллюстрации) согласно
Figure 00000087
. (3)
Во-первых, матрица режимов на основе оценок направлений активных источников звука вычисляется согласно
Figure 00000088
(4)
Figure 00000089
,
где
Figure 00000090
(5)
Figure 00000091
.
В уравнении (4),
Figure 00000092
обозначает количество активных направлений для k-ого кадра и
Figure 00000093
,
Figure 00000094
показывает их индексы.
Figure 00000095
обозначает вещественозначные сферические гармоники, которые определены в разделе Определение вещественозначных сферических гармоник.
Во-вторых, вычисляется матрица
Figure 00000096
, содержащая мгновенные оценки всех доминирующих направленных сигналов для (k-1)-го и k-го кадров, определенная как
Figure 00000097
, (6)
где
Figure 00000098
,
Figure 00000099
. (7)
Это выполняется на двух этапах. На первом этапе, выборки направленного сигнала в строках, соответствующих неактивным направлениям, устанавливаются на нуль, т.е.
Figure 00000100
, если
Figure 00000101
, (8)
где
Figure 00000102
показывает набор активных направлений. На втором этапе, выборки направленного сигнала, соответствующие активным направлениям, получаются посредством сначала расположения их в матрице согласно
Figure 00000103
. (9)
Эта матрица затем вычисляется, чтобы минимизировать евклидову норму ошибки
Figure 00000104
. (10)
Решение дается посредством
Figure 00000105
. (11)
Временное сглаживание
Для этапа или стадии 31, сглаживание описывается только для направленных сигналов
Figure 00000106
, так как сглаживание других типов сигналов может выполняться полностью аналогичным способом. Оценки направленных сигналов
Figure 00000107
,
Figure 00000108
, чьи выборки содержатся в матрице
Figure 00000109
согласно уравнению (6), подвергаются оконной обработке посредством соответствующей оконной функции
Figure 00000110
:
Figure 00000111
. (12)
Эта оконная функция должна удовлетворять условию, что получается '1' при ее сложении с ее сдвинутой версией (предполагается сдвиг B выборок) в области перекрытия:
Figure 00000112
. (13)
Пример для такой оконной функции дается посредством периодического окна Хэнна, определенного посредством
Figure 00000113
для
Figure 00000114
. (14)
Сглаженные направленные сигналы для (k-1)-го кадра вычисляются посредством соответствующей суперпозиции подвергнутых оконной обработке мгновенных оценок согласно
Figure 00000115
. (15)
Выборки всех сглаженных направленных сигналов для (k-1)-ого кадра располагаются в матрице
Figure 00000116
(16)
Figure 00000117
,
где
Figure 00000118
. (17)
Предполагается, что сглаженные доминирующие направленные сигналы
Figure 00000119
являются непрерывными сигналами, которые последовательно вводятся в перцепционные кодеры.
Вычисление представления HOA сглаженных доминирующих направленных сигналов
Из
Figure 00000120
и
Figure 00000121
, вычисляется представление HOA сглаженных доминирующих направленных сигналов на этапе или стадии 32 в зависимости от непрерывных сигналов
Figure 00000122
, чтобы имитировать такие же операции, как должны выполняться для конструирования HOA. Так как изменения оценок направлений между последовательными кадрами могут вести к нарушению непрерывности, как только снова вычисляются мгновенные представления HOA перекрывающихся кадров длины
Figure 00000123
и результаты последовательных перекрывающихся кадров сглаживаются посредством использования соответствующей оконной функции. Следовательно, представление HOA
Figure 00000124
получается посредством
Figure 00000125
Figure 00000126
, (18)
где
Figure 00000127
(19)
Figure 00000128
и
Figure 00000129
(20)
Figure 00000130
Представление остаточного представления HOA посредством направленных сигналов на регулярной сетке
Из
Figure 00000131
и
Figure 00000132
(т.е.
Figure 00000133
, задержанного на задержку 381 кадра), остаточное представление HOA посредством направленных сигналов на регулярной сетке вычисляется на этапе или стадии 33. Цель этой операции состоит в том, чтобы получать направленные сигналы (т.е. функции общих плоских волн), сталкивающиеся из некоторых фиксированных, почти равномерно распределенных направлений
Figure 00000134
,
Figure 00000135
(также упоминаемых как направления сетки), чтобы представлять остаток
Figure 00000136
.
Сначала, по отношению к направлениям сетки матрица режимов
Figure 00000137
вычисляется как
Figure 00000138
, (21)
где
Figure 00000139
. (22)
Так как направления сетки являются фиксированными в течение всей процедуры сжатия, матрица режимов
Figure 00000140
должна вычисляться только один раз.
Направленные сигналы на соответствующей сетке получаются как
Figure 00000141
(23)
Figure 00000142
.
Предсказание направленных сигналов на регулярной сетке из доминирующих направленных сигналов
Из
Figure 00000143
и
Figure 00000144
, направленные сигналы на регулярной сетке предсказываются на этапе или стадии 34. Предсказание направленных сигналов на регулярной сетке, состоящей из направлений сетки
Figure 00000145
,
Figure 00000146
из направленных сигналов, основывается на двух последовательных кадрах для целей сглаживания, т.е. увеличенный кадр сигналов сетки
Figure 00000147
(длины
Figure 00000148
) предсказывается из увеличенного кадра сглаженных доминирующих направленных сигналов
Figure 00000149
. (24)
Во-первых, каждый сигнал сетки
Figure 00000150
,
Figure 00000151
, содержащийся в
Figure 00000152
, назначается доминирующему направленному сигналу
Figure 00000153
,
Figure 00000154
, содержащемуся в
Figure 00000155
. Назначение может основываться на вычислении нормализованной взаимнокорреляционной функции между сигналом сетки и всеми доминирующими направленными сигналами. В частности, этот доминирующий направленный сигнал назначается сигналу сетки, который обеспечивает наивысшее значение нормализованной взаимнокорреляционной функции. Результат назначения может формулироваться посредством функции назначения
Figure 00000156
, назначающей
Figure 00000157
-ый сигнал сетки
Figure 00000158
-ому доминирующему направленному сигналу.
Во-вторых, каждый сигнал сетки
Figure 00000159
предсказывается из назначенного доминирующего направленного сигнала
Figure 00000160
.
Предсказанный сигнал сетки
Figure 00000161
вычисляется посредством задержки и масштабирования из назначенного доминирующего направленного сигнала
Figure 00000162
как
Figure 00000163
,(25)
где
Figure 00000164
обозначает коэффициент масштабирования и
Figure 00000165
показывает задержку выборки. Эти параметры выбираются для минимизации ошибки предсказания.
Если мощность ошибки предсказания больше, чем мощность самого сигнала сетки, предполагается, что предсказание потерпело неудачу. Затем, соответствующие параметры предсказания могут устанавливаться на любое недействительное значение.
Следует отметить, что являются возможными также другие типы предсказания. Например, вместо вычисления коэффициента масштабирования полного диапазона, также является разумным определять коэффициенты масштабирования для перцепционно ориентированных частотных диапазонов. Однако эта операция улучшает предсказание за счет увеличенной величины дополнительной информации.
Все параметры предсказания могут располагаться в матрице параметров как
Figure 00000166
. (26)
Предполагаtтся, что все предсказанные сигналы
Figure 00000167
,
Figure 00000168
, располагаются в матрице
Figure 00000169
.
Вычисление представления HOA предсказанных направленных сигналов на регулярной сетке
Представление HOA предсказанных сигналов сетки вычисляется на этапе или стадии 35 из
Figure 00000170
согласно
Figure 00000171
. (27)
Вычисление представления HOA остаточной компоненты окружающего звукового поля
Из
Figure 00000172
, которое является сглаженной по времени версией (на этапе/стадии 36) для
Figure 00000173
, из
Figure 00000174
, которое является задержанной на два кадра версией (задержки 381 и 383) для
Figure 00000175
, и из
Figure 00000176
, которое является задержанной на один кадр версией (задержка 382) для
Figure 00000177
, представление HOA остаточной компоненты окружающего звукового поля вычисляется на этапе или стадии 37 посредством
Figure 00000178
. (28)
Реконструкция HOA
Перед подробным описанием обработки индивидуальных этапов или стадий на фиг. 4 в деталях, обеспечивается краткое описание.
Направленные сигналы
Figure 00000179
по отношению к равномерно распределенным направлениям предсказываются из декодированных доминирующих направленных сигналов
Figure 00000180
с использованием параметров предсказания
Figure 00000181
. Далее, полное представление HOA
Figure 00000182
конструируется из представления HOA
Figure 00000183
доминирующих направленных сигналов, представления HOA
Figure 00000184
предсказанных направленных сигналов и остаточной окружающей компоненты HOA
Figure 00000185
.
Вычисление представления HOA доминирующих направленных сигналов
Figure 00000186
и
Figure 00000187
вводятся в этап или стадию 41 для определения представления HOA доминирующих направленных сигналов. После вычисления матриц режимов
Figure 00000188
и
Figure 00000189
из оценок направлений
Figure 00000190
и
Figure 00000191
, на основе оценок направлений активных источников звука для k-ого и (k-1)-ого кадров, представление HOA доминирующих направленных сигналов
Figure 00000192
получается посредством
Figure 00000193
(29)
где
Figure 00000194
(30)
Figure 00000195
и
Figure 00000196
(31)
Figure 00000197
Предсказание направленных сигналов на регулярной сетке из доминирующих направленных сигналов
Figure 00000198
и
Figure 00000199
вводятся в этап или стадию 43 для предсказания направленных сигналов на регулярной сетке из доминирующих направленных сигналов. Увеличенный кадр предсказанных направленных сигналов на регулярной сетке состоит из элементов
Figure 00000200
согласно
Figure 00000201
, (32)
которые предсказываются из доминирующих направленных сигналов посредством
Figure 00000202
. (33)
Вычисление представления HOA предсказанных направленных сигналов на регулярной сетке
На этапе или стадии 44 для вычисления представления HOA предсказанных направленных сигналов на регулярной сетке, представление HOA предсказанных направленных сигналов сетки получается посредством
Figure 00000203
, (34)
где
Figure 00000204
обозначает матрицу режимов по отношению к предварительно определенным направлениям сетки (см. уравнение (21) для определения).
Конструирование представления звукового поля HOA
Из
Figure 00000205
(т.е.
Figure 00000206
, задержанного посредством задержки 42 кадра),
Figure 00000207
(которое является сглаженной по времени версией для
Figure 00000208
на этапе/стадии 45) и
Figure 00000209
, полное представление звукового поля HOA наконец конструируется на этапе или стадии 46 как
Figure 00000210
.(35)
Основы системы Амбисоник высшего порядка
Система Амбисоник высшего порядка основывается на описании звукового поля внутри компактной области интереса, о которой предполагается, что она является свободной от источников звука. В этом случае пространственно-временное поведение звукового давления
Figure 00000211
в момент времени t и положении x внутри области интереса является физически полностью определенным посредством однородного волнового уравнения. Последующее основывается на сферической системе координат, как показано на фиг. 5. Ось x указывает на положение вперед, ось y указывает влево, и ось z указывает вверх. Положение в пространстве
Figure 00000212
представляется посредством радиуса
Figure 00000213
(т.е. расстояния до начала координат), угла наклона
Figure 00000214
, измеренного от полярной оси z, и азимутального угла
Figure 00000215
, измеренного против часовой стрелки в плоскости x-y от оси x.
Figure 00000216
обозначает транспозицию.
Можно показать (см. E.G. Williams, "Fourier Acoustics", volume 93 of Applied Mathematical Sciences, Academic Press, 1999), что преобразование Фурье звукового давления по отношению к времени, обозначенное посредством
Figure 00000217
, т.е.
Figure 00000218
,(36)
где ω обозначает угловую частоту и i обозначает мнимую единицу, может быть разложено в ряд сферических гармоник согласно
Figure 00000219
, (37)
где
Figure 00000220
обозначает скорость звука и k обозначает угловой индекс моды, который связан с угловой частотой
Figure 00000221
как
Figure 00000222
,
Figure 00000223
обозначает сферические функции Бесселя первого рода, и
Figure 00000224
обозначает вещественозначные сферические гармоники порядка n и степени m, которые определены в разделе Определение вещественозначных сферических гармоник. Коэффициенты разложения
Figure 00000225
зависят только от углового индекса моды k. Отметим, что неявно предполагается, что звуковое давление является пространственно ограниченным по диапазону. Таким образом, ряд является усеченным по отношению к индексу порядка n на верхнем пределе N, который называется порядком представления HOA.
Если звуковое поле представляется посредством суперпозиции бесконечного количества гармонических плоских волн разных угловых частот ω и прибывает из всех возможных направлений, определенных посредством кортежа углов
Figure 00000226
, можно показать (см. B. Rafaely, "Plane-wave Decomposition of the Sound Field on a Sphere by Spherical Convolution", J. Acoust. Soc. Am., 4(116), страницы 2149-2157, 2004), что соответствующая функция комплексной амплитуды плоской волны
Figure 00000227
может быть выражена посредством разложения по сферическим гармоникам
Figure 00000228
, (38)
где коэффициенты разложения
Figure 00000229
относятся к коэффициентам разложения
Figure 00000230
как
Figure 00000231
. (39)
Предполагая, что индивидуальные коэффициенты
Figure 00000232
являются функциями угловой частоты
Figure 00000233
, применение обратного преобразования Фурье (обозначаемого как
Figure 00000234
) обеспечивает функции временной области
Figure 00000235
(40)
для каждого порядка n и степени m, которые могут быть собраны в одиночном векторе
Figure 00000236
(41)
Figure 00000237
.
Индекс положения функции временной области
Figure 00000238
внутри вектора
Figure 00000239
дается посредством
Figure 00000240
.
Последний формат системы Амбисоник обеспечивает дискретизированную версию
Figure 00000241
с использованием частоты дискретизации
Figure 00000242
как
Figure 00000243
, (42)
где
Figure 00000244
обозначает период дискретизации. Элементы
Figure 00000245
упоминаются как коэффициенты системы Амбисоник. Отметим, что сигналы временной области
Figure 00000246
и, следовательно, коэффициенты системы Амбисоник являются вещественозначными.
Определение вещественозначных сферических гармоник
Вещественозначные сферические гармоники
Figure 00000247
даются посредством
Figure 00000248
, (43)
где
Figure 00000249
.(44)
Ассоциированные функции Лежандра
Figure 00000250
определяются как
Figure 00000251
(45)
с полиномом Лежандра
Figure 00000252
и, в отличие от вышеупомянутого учебника E.G. Williams, без члена фазы Кондона-Шортли
Figure 00000253
.
Пространственное разрешение системы Амбисоник высшего порядка
Функция общей плоской волны
Figure 00000254
, прибывающая из направления
Figure 00000255
, представляется в HOA посредством
Figure 00000256
. (46)
Соответствующая пространственная плотность амплитуд плоской волны
Figure 00000257
дается посредством
Figure 00000258
(47)
Figure 00000259
. (48)
Можно видеть из уравнения (48), что она является произведением функции общей плоской волны
Figure 00000260
и функции пространственной дисперсии
Figure 00000261
, для которой можно показать, что она зависит только от угла
Figure 00000262
между
Figure 00000263
и
Figure 00000264
, имеющего свойство
Figure 00000265
. (49)
Как ожидается, в пределе бесконечного порядка, т.е.
Figure 00000266
, функция пространственной дисперсии переходит в дельта функцию Дирака
Figure 00000267
, т.е.
Figure 00000268
. (50)
Однако в случае конечного порядка N, вклад общей плоской волны из направления
Figure 00000269
размывается в соседние направления, где степень размытости уменьшается с увеличением порядка. График нормализованной функции
Figure 00000270
для разных значений N показан на фиг. 6. Следует отметить, что любое направление
Figure 00000271
поведения временной области пространственной плотности амплитуд плоской волны является кратным его поведения в любом другом направлении. В частности, функции
Figure 00000272
и
Figure 00000273
для некоторых фиксированных направлений
Figure 00000274
и
Figure 00000275
являются высоко коррелированными друг с другом по отношению к времени t.
Дискретная пространственная область
Если пространственная плотность амплитуд плоской волны дискретизируется при некотором количестве
Figure 00000276
пространственных направлений
Figure 00000277
,
Figure 00000278
, которые являются почти равномерно распределенными на единичной сфере, получаются
Figure 00000279
направленных сигналов
Figure 00000280
. Собирая эти сигналы в вектор
Figure 00000281
, (51)
можно проверить посредством использования уравнения (47), что этот вектор может быть вычислен из непрерывного представления системы Амбисоник
Figure 00000282
, определенного в уравнении (41), посредством простого матричного умножения как
Figure 00000283
, (52)
где
Figure 00000284
обозначает объединенные транспозицию и сопряжение, и
Figure 00000285
обозначает матрицу режимов, определенную посредством
Figure 00000286
, (53)
где
Figure 00000287
. (54)
Так как направления
Figure 00000288
являются почти равномерно распределенными на единичной сфере, матрица режимов, в общем, является обратимой. Следовательно, непрерывное представление системы Амбисоник может быть вычислено из направленных сигналов
Figure 00000289
посредством
Figure 00000290
. (55)
Оба уравнения составляют преобразование и обратное преобразование между представлением системы Амбисоник и пространственной областью. В этой заявке эти преобразования называются сферическое гармоническое преобразование и обратное сферическое гармоническое преобразование.
Так как направления
Figure 00000291
являются почти равномерно распределенными на единичной сфере,
Figure 00000292
, (56)
что оправдывает использование
Figure 00000293
вместо
Figure 00000294
в уравнении (52). Предпочтительно, все упомянутые отношения являются действительными для дискретной временной области, также.
На стороне кодирования также как на стороне декодирования новая обработка может выполняться посредством одиночного процессора или электронной схемы, или посредством нескольких процессоров или электронных схем, работающих параллельно и/или
работающих в разных частях новой обработки.
Изобретение может применяться для обработки соответствующих звуковых сигналов, которые могут воспроизводиться или проигрываться на компоновке громкоговорителей в домашней среде или на компоновке громкоговорителей в кинотеатре.

Claims (42)

1. Способ для сжатия представления системы Амбисоник высшего порядка (обозначаемой НОА) для звукового поля, при этом упомянутый способ содержит:
из текущего временного кадра коэффициентов НОА, оценку направлений доминирующих источников звука;
разложение упомянутого представления НОА на доминирующие направленные сигналы во временной области и остаточную компоненту НОА, при этом упомянутая остаточная компонента НОА преобразуется в дискретную пространственную область, чтобы получать функции плоских волн в равномерных направлениях дискретизации, представляющие упомянутую остаточную компоненту НОА, и при этом упомянутые функции плоских волн предсказываются из упомянутых доминирующих направленных сигналов, тем самым обеспечивая параметры, описывающие упомянутое предсказание, и соответствующая ошибка предсказания из упомянутого предсказания преобразуется назад в область НОА;
уменьшение текущего порядка упомянутой остаточной компоненты НОА до более низкого порядка, что дает в результате остаточную компоненту НОА уменьшенного порядка;
декоррелирование упомянутой остаточной компоненты НОА уменьшенного порядка, чтобы получать соответствующие сигналы временной области остаточной компоненты НОА;
перцепционное кодирование упомянутых доминирующих направленных сигналов и упомянутых сигналов временной области остаточной компоненты НОА, чтобы обеспечивать сжатые доминирующие направленные сигналы и сжатые сигналы остаточной компоненты.
2. Способ по п. 1, в котором упомянутое декоррелирование упомянутой остаточной компоненты НОА уменьшенного порядка выполняется посредством преобразования упомянутой остаточной компоненты НОА уменьшенного порядка в соответствующее число порядка эквивалентных сигналов в пространственной области с использованием сферического гармонического преобразования.
3. Способ по п. 1, в котором упомянутое декоррелирование упомянутой остаточной компоненты НОА уменьшенного порядка выполняется посредством преобразования упомянутой остаточной компоненты НОА уменьшенного порядка в соответствующее число порядка эквивалентных сигналов в пространственной области с использованием сферического гармонического преобразования, где сетка равномерных направлений дискретизации вращается, и посредством обеспечения дополнительной информации, обеспечивающей возможность обращения упомянутого декоррелирования.
4. Способ по п. 1, в котором упомянутое перцепционное кодирование содержит совместное сжатие упомянутых доминирующих направленных сигналов и упомянутых сигналов временной области остаточной компоненты НОА.
5. Способ по п. 1, в котором упомянутое разложение включает в себя:
вычисление из оцененных направлений источников звука для текущего кадра коэффициентов НОА доминирующих направленных сигналов, за которым следует временное сглаживание, дающее в результате сглаженные доминирующие направленные сигналы;
вычисление из упомянутых оцененных направлений источников звука и упомянутых сглаженных доминирующих направленных сигналов представления НОА сглаженных доминирующих направленных сигналов;
представление соответствующего остаточного представления НОА посредством направленных сигналов на регулярной сетке;
из упомянутых сглаженных доминирующих направленных сигналов и упомянутого остаточного представления НОА посредством направленных сигналов, предсказание направленных сигналов на регулярной сетке и вычисление оттуда представления НОА предсказанных направленных сигналов на регулярной сетке, за которым следует временное сглаживание;
вычисление из упомянутых сглаженных предсказанных направленных сигналов на регулярной сетке, из задержанной на два кадра версии упомянутого текущего кадра коэффициентов НОА, и из задержанной на один кадр версии упомянутых сглаженных доминирующих направленных сигналов представления НОА остаточной компоненты окружающего звукового поля.
6. Устройство для сжатия представления системы Амбисоник высшего порядка (обозначаемой НОА) для звукового поля, при этом упомянутое устройство содержит:
средство оценки, которое оценивает направления доминирующих источников звука из текущего временного кадра коэффициентов НОА;
средство разложения, которое осуществляет разложение упомянутого представления НОА на доминирующие направленные сигналы во временной области и остаточную компоненту НОА, при этом упомянутая остаточная компонента НОА преобразуется в дискретную пространственную область, чтобы получать функции плоских волн в равномерных направлениях дискретизации, представляющие упомянутую остаточную компоненту НОА, и при этом упомянутые функции плоских волн предсказываются из упомянутых доминирующих направленных сигналов, тем самым обеспечивая параметры, описывающие упомянутое предсказание, и соответствующая ошибка предсказания из упомянутого предсказания преобразуется назад в область НОА;
средство уменьшения порядка, которое уменьшает текущий порядок упомянутой остаточной компоненты НОА до более низкого порядка, что дает в результате остаточную компоненту НОА уменьшенного порядка;
средство декоррелирования, которое декоррелирует упомянутую остаточную компоненту НОА уменьшенного порядка, чтобы получать соответствующие сигналы временной области остаточной компоненты НОА;
средство кодирования, которое осуществляет перцепционное кодирование упомянутых доминирующих направленных сигналов и упомянутых сигналов временной области остаточной компоненты НОА, чтобы обеспечивать сжатые доминирующие направленные сигналы и сжатые сигналы остаточной компоненты.
7. Устройство по п. 6, в котором упомянутое декоррелирование упомянутой остаточной компоненты НОА уменьшенного порядка выполняется посредством преобразования упомянутой остаточной компоненты НОА уменьшенного порядка в соответствующее число порядка эквивалентных сигналов в пространственной области с использованием сферического гармонического преобразования.
8. Устройство по п. 6, в котором упомянутое декоррелирование упомянутой остаточной компоненты НОА уменьшенного порядка выполняется посредством преобразования упомянутой остаточной компоненты НОА уменьшенного порядка в соответствующее число порядка эквивалентных сигналов в пространственной области с использованием сферического гармонического преобразования, где сетка равномерных направлений дискретизации вращается, и посредством обеспечения дополнительной информации, обеспечивающей возможность обращения упомянутого декоррелирования.
9. Устройство по п. 6, в котором упомянутое перцепционное кодирование упомянутых доминирующих направленных сигналов и упомянутых сигналов временной области остаточной компоненты НОА выполняется совместно.
10. Устройство по п. 6, в котором упомянутое разложение включает в себя:
вычисление из оцененных направлений источников звука для текущего кадра коэффициентов НОА доминирующих направленных сигналов, за которым следует временное сглаживание, дающее в результате сглаженные доминирующие направленные сигналы;
вычисление из упомянутых оцененных направлений источников звука и упомянутых сглаженных доминирующих направленных сигналов представления НОА сглаженных доминирующих направленных сигналов;
представление соответствующего остаточного представления НОА посредством направленных сигналов на регулярной сетке;
из упомянутых сглаженных доминирующих направленных сигналов и упомянутого остаточного представления НОА посредством направленных сигналов, предсказание направленных сигналов на регулярной сетке и вычисление оттуда представления НОА предсказанных направленных сигналов на регулярной сетке, за которым следует временное сглаживание;
вычисление из упомянутых сглаженных предсказанных направленных сигналов на регулярной сетке, из задержанной на два кадра версии упомянутого текущего кадра коэффициентов НОА, и из задержанной на один кадр версии упомянутых сглаженных доминирующих направленных сигналов представления НОА остаточной компоненты окружающего звукового поля.
11. Устройство по п. 10, в котором упомянутое предсказание направленных сигналов на регулярной сетке вычисляется посредством задержки и масштабирования полного диапазона из назначенного доминирующего направленного сигнала.
12. Устройство по п. 10, в котором при упомянутом предсказании направленных сигналов на регулярной сетке определяются коэффициенты масштабирования сетки для перцепционно-ориентированных частотных диапазонов.
13. Способ для восстановления сжатого представления системы Амбисоник высшего порядка (обозначаемой НОА), при этом способ содержит:
перцепционное декодирование сжатых доминирующих направленных сигналов и сжатых сигналов остаточной компоненты, чтобы обеспечивать восстановленные доминирующие направленные сигналы и восстановленные сигналы временной области, представляющие остаточную компоненту НОА в пространственной области;
повторную корреляцию упомянутых восстановленных сигналов временной области, чтобы получать соответствующую остаточную компоненту НОА уменьшенного порядка;
увеличение порядка упомянутой остаточной компоненты НОА уменьшенного порядка до исходного порядка, чтобы обеспечивать восстановленную остаточную компоненту НОА исходного порядка;
использование упомянутых восстановленных доминирующих направленных сигналов, упомянутой восстановленной остаточной компоненты НОА исходного порядка и оцененных направлений доминирующих источников звука для генерирования восстановленного и реконструированного кадра коэффициентов НОА.
14. Устройство для восстановления сжатого представления системы Амбисоник высшего порядка (обозначаемой НОА), при этом устройство содержит:
средство декодирования, которое осуществляет перцепционное декодирование сжатых доминирующих направленных сигналов и сжатых сигналов остаточной компоненты, чтобы обеспечивать восстановленные доминирующие направленные сигналы и восстановленные сигналы временной области, представляющие остаточную компоненту НОА в пространственной области;
средство повторной корреляции, которое осуществляет повторную корреляцию упомянутых восстановленных сигналов временной области, чтобы получать соответствующую остаточную компоненту НОА уменьшенного порядка;
средство увеличения порядка, которое увеличивает порядок упомянутой остаточной компоненты НОА уменьшенного порядка до исходного порядка, чтобы обеспечивать восстановленную остаточную компоненту НОА исходного порядка;
средство реконструкции, которое генерирует восстановленный и реконструированный кадр коэффициентов НОА посредством использования упомянутых восстановленных доминирующих направленных сигналов, упомянутой восстановленной остаточной компоненты НОА исходного порядка и оцененных направлений доминирующих источников звука.
RU2015128090A 2012-12-12 2013-12-04 Способ и устройство для сжатия и восстановления представления системы амбисоник высшего порядка для звукового поля RU2623886C2 (ru)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
EP12306569.0 2012-12-12
EP12306569.0A EP2743922A1 (en) 2012-12-12 2012-12-12 Method and apparatus for compressing and decompressing a higher order ambisonics representation for a sound field
PCT/EP2013/075559 WO2014090660A1 (en) 2012-12-12 2013-12-04 Method and apparatus for compressing and decompressing a higher order ambisonics representation for a sound field

Related Child Applications (1)

Application Number Title Priority Date Filing Date
RU2017118830A Division RU2744489C2 (ru) 2012-12-12 2013-12-04 Способ и устройство для сжатия и восстановления представления системы амбисоник высшего порядка для звукового поля

Publications (2)

Publication Number Publication Date
RU2015128090A RU2015128090A (ru) 2017-01-17
RU2623886C2 true RU2623886C2 (ru) 2017-06-29

Family

ID=47715805

Family Applications (2)

Application Number Title Priority Date Filing Date
RU2017118830A RU2744489C2 (ru) 2012-12-12 2013-12-04 Способ и устройство для сжатия и восстановления представления системы амбисоник высшего порядка для звукового поля
RU2015128090A RU2623886C2 (ru) 2012-12-12 2013-12-04 Способ и устройство для сжатия и восстановления представления системы амбисоник высшего порядка для звукового поля

Family Applications Before (1)

Application Number Title Priority Date Filing Date
RU2017118830A RU2744489C2 (ru) 2012-12-12 2013-12-04 Способ и устройство для сжатия и восстановления представления системы амбисоник высшего порядка для звукового поля

Country Status (12)

Country Link
US (7) US9646618B2 (ru)
EP (4) EP2743922A1 (ru)
JP (6) JP6285458B2 (ru)
KR (5) KR102202973B1 (ru)
CN (9) CN104854655B (ru)
CA (6) CA3125246C (ru)
HK (1) HK1216356A1 (ru)
MX (6) MX344988B (ru)
MY (2) MY169354A (ru)
RU (2) RU2744489C2 (ru)
TW (6) TW202338788A (ru)
WO (1) WO2014090660A1 (ru)

Families Citing this family (46)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP2665208A1 (en) 2012-05-14 2013-11-20 Thomson Licensing Method and apparatus for compressing and decompressing a Higher Order Ambisonics signal representation
EP2743922A1 (en) * 2012-12-12 2014-06-18 Thomson Licensing Method and apparatus for compressing and decompressing a higher order ambisonics representation for a sound field
US9685163B2 (en) 2013-03-01 2017-06-20 Qualcomm Incorporated Transforming spherical harmonic coefficients
EP2800401A1 (en) 2013-04-29 2014-11-05 Thomson Licensing Method and Apparatus for compressing and decompressing a Higher Order Ambisonics representation
US9769586B2 (en) 2013-05-29 2017-09-19 Qualcomm Incorporated Performing order reduction with respect to higher order ambisonic coefficients
US9466305B2 (en) 2013-05-29 2016-10-11 Qualcomm Incorporated Performing positional analysis to code spherical harmonic coefficients
EP2824661A1 (en) 2013-07-11 2015-01-14 Thomson Licensing Method and Apparatus for generating from a coefficient domain representation of HOA signals a mixed spatial/coefficient domain representation of said HOA signals
CN105981100B (zh) 2014-01-08 2020-02-28 杜比国际公司 用于改善对声场的高阶高保真度立体声响复制表示进行编码所需的边信息的编码的方法和装置
US9489955B2 (en) 2014-01-30 2016-11-08 Qualcomm Incorporated Indicating frame parameter reusability for coding vectors
US9922656B2 (en) 2014-01-30 2018-03-20 Qualcomm Incorporated Transitioning of ambient higher-order ambisonic coefficients
CN109410961B (zh) 2014-03-21 2023-08-25 杜比国际公司 用于对压缩的hoa信号进行解码的方法、装置和存储介质
EP4089674A1 (en) 2014-03-21 2022-11-16 Dolby International AB Method for decompressing a compressed hoa signal and apparatus for decompressing a compressed hoa signal
EP2922057A1 (en) 2014-03-21 2015-09-23 Thomson Licensing Method for compressing a Higher Order Ambisonics (HOA) signal, method for decompressing a compressed HOA signal, apparatus for compressing a HOA signal, and apparatus for decompressing a compressed HOA signal
US10770087B2 (en) * 2014-05-16 2020-09-08 Qualcomm Incorporated Selecting codebooks for coding vectors decomposed from higher-order ambisonic audio signals
US9620137B2 (en) 2014-05-16 2017-04-11 Qualcomm Incorporated Determining between scalar and vector quantization in higher order ambisonic coefficients
US9852737B2 (en) 2014-05-16 2017-12-26 Qualcomm Incorporated Coding vectors decomposed from higher-order ambisonics audio signals
US9792924B2 (en) * 2014-06-27 2017-10-17 Dolby Laboratories Licensing Corporation Apparatus for determining for the compression of an HOA data frame representation a lowest integer number of bits required for representing non-differential gain values
EP2960903A1 (en) 2014-06-27 2015-12-30 Thomson Licensing Method and apparatus for determining for the compression of an HOA data frame representation a lowest integer number of bits required for representing non-differential gain values
WO2015197517A1 (en) * 2014-06-27 2015-12-30 Thomson Licensing Coded hoa data frame representation that includes non-differential gain values associated with channel signals of specific ones of the data frames of an hoa data frame representation
US9922657B2 (en) 2014-06-27 2018-03-20 Dolby Laboratories Licensing Corporation Method for determining for the compression of an HOA data frame representation a lowest integer number of bits required for representing non-differential gain values
EP3164868A1 (en) * 2014-07-02 2017-05-10 Dolby International AB Method and apparatus for decoding a compressed hoa representation, and method and apparatus for encoding a compressed hoa representation
US9838819B2 (en) * 2014-07-02 2017-12-05 Qualcomm Incorporated Reducing correlation between higher order ambisonic (HOA) background channels
EP2963948A1 (en) * 2014-07-02 2016-01-06 Thomson Licensing Method and apparatus for encoding/decoding of directions of dominant directional signals within subbands of a HOA signal representation
WO2016001355A1 (en) * 2014-07-02 2016-01-07 Thomson Licensing Method and apparatus for encoding/decoding of directions of dominant directional signals within subbands of a hoa signal representation
EP2963949A1 (en) * 2014-07-02 2016-01-06 Thomson Licensing Method and apparatus for decoding a compressed HOA representation, and method and apparatus for encoding a compressed HOA representation
KR102363275B1 (ko) * 2014-07-02 2022-02-16 돌비 인터네셔널 에이비 Hoa 신호 표현의 부대역들 내의 우세 방향 신호들의 방향들의 인코딩/디코딩을 위한 방법 및 장치
US9847088B2 (en) * 2014-08-29 2017-12-19 Qualcomm Incorporated Intermediate compression for higher order ambisonic audio data
US9747910B2 (en) 2014-09-26 2017-08-29 Qualcomm Incorporated Switching between predictive and non-predictive quantization techniques in a higher order ambisonics (HOA) framework
US10140996B2 (en) * 2014-10-10 2018-11-27 Qualcomm Incorporated Signaling layers for scalable coding of higher order ambisonic audio data
EP3007167A1 (en) * 2014-10-10 2016-04-13 Thomson Licensing Method and apparatus for low bit rate compression of a Higher Order Ambisonics HOA signal representation of a sound field
US10468037B2 (en) 2015-07-30 2019-11-05 Dolby Laboratories Licensing Corporation Method and apparatus for generating from an HOA signal representation a mezzanine HOA signal representation
US10257632B2 (en) 2015-08-31 2019-04-09 Dolby Laboratories Licensing Corporation Method for frame-wise combined decoding and rendering of a compressed HOA signal and apparatus for frame-wise combined decoding and rendering of a compressed HOA signal
US9961467B2 (en) 2015-10-08 2018-05-01 Qualcomm Incorporated Conversion from channel-based audio to HOA
US9961475B2 (en) 2015-10-08 2018-05-01 Qualcomm Incorporated Conversion from object-based audio to HOA
US10249312B2 (en) * 2015-10-08 2019-04-02 Qualcomm Incorporated Quantization of spatial vectors
SG11201803909TA (en) * 2015-11-17 2018-06-28 Dolby Laboratories Licensing Corp Headtracking for parametric binaural output system and method
US9881628B2 (en) * 2016-01-05 2018-01-30 Qualcomm Incorporated Mixed domain coding of audio
CN108476373B (zh) * 2016-01-27 2020-11-17 华为技术有限公司 一种处理声场数据的方法和装置
EP3338462B1 (en) 2016-03-15 2019-08-28 Fraunhofer Gesellschaft zur Förderung der Angewand Apparatus, method or computer program for generating a sound field description
CN107945810B (zh) * 2016-10-13 2021-12-14 杭州米谟科技有限公司 用于编码和解码hoa或多声道数据的方法和装置
US10332530B2 (en) * 2017-01-27 2019-06-25 Google Llc Coding of a soundfield representation
JP6811312B2 (ja) 2017-05-01 2021-01-13 パナソニック インテレクチュアル プロパティ コーポレーション オブ アメリカPanasonic Intellectual Property Corporation of America 符号化装置及び符号化方法
US10657974B2 (en) * 2017-12-21 2020-05-19 Qualcomm Incorporated Priority information for higher order ambisonic audio data
US10264386B1 (en) * 2018-02-09 2019-04-16 Google Llc Directional emphasis in ambisonics
JP2019213109A (ja) * 2018-06-07 2019-12-12 日本電信電話株式会社 音場信号推定装置、音場信号推定方法、プログラム
CN111193990B (zh) * 2020-01-06 2021-01-19 北京大学 一种抗高频空间混叠的3d音频***及实现方法

Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
RU2361288C2 (ru) * 2005-04-15 2009-07-10 Фраунхофер-Гезелльшафт Цур Фердерунг Дер Ангевандтен Форшунг Е.Ф. Устройство и способ для формирования сигнала управления многоканальным синтезатором и устройство и способ многоканального синтеза
US20100198601A1 (en) * 2007-05-10 2010-08-05 France Telecom Audio encoding and decoding method and associated audio encoder, audio decoder and computer programs
CN101977349A (zh) * 2010-09-29 2011-02-16 华南理工大学 Ambisonic声重发***解码的优化改进方法
RU2450369C2 (ru) * 2007-09-25 2012-05-10 Моторола Мобилити, Инк., Устройство и способ для кодирования многоканального звукового сигнала
WO2012061148A1 (en) * 2010-10-25 2012-05-10 Qualcomm Incorporated Systems, methods, apparatus, and computer-readable media for head tracking based on recorded sound signals
EP2469742A2 (en) * 2010-12-21 2012-06-27 Thomson Licensing Method and apparatus for encoding and decoding successive frames of an ambisonics representation of a 2- or 3-dimensional sound field

Family Cites Families (30)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
SG45281A1 (en) * 1992-06-26 1998-01-16 Discovision Ass Method and arrangement for transformation of signals from a frequency to a time domain
JP2004500595A (ja) 1999-11-12 2004-01-08 ジェリー・モスコヴィッチ 水平方向3スクリーンlcd表示装置
FR2801108B1 (fr) 1999-11-16 2002-03-01 Maxmat S A Analyseur chimique ou biochimique a regulation de la temperature reactionnelle
US8009966B2 (en) * 2002-11-01 2011-08-30 Synchro Arts Limited Methods and apparatus for use in sound replacement with automatic synchronization to images
EP1829424B1 (en) * 2005-04-15 2009-01-21 Dolby Sweden AB Temporal envelope shaping of decorrelated signals
US8139685B2 (en) * 2005-05-10 2012-03-20 Qualcomm Incorporated Systems, methods, and apparatus for frequency control
JP4616074B2 (ja) * 2005-05-16 2011-01-19 株式会社エヌ・ティ・ティ・ドコモ アクセスルータ、サービス制御システム、サービス制御方法
TW200715145A (en) * 2005-10-12 2007-04-16 Lin Hui File compression method of digital sound signals
US8374365B2 (en) * 2006-05-17 2013-02-12 Creative Technology Ltd Spatial audio analysis and synthesis for binaural reproduction and format conversion
US8165124B2 (en) * 2006-10-13 2012-04-24 Qualcomm Incorporated Message compression methods and apparatus
EP2118887A1 (en) * 2007-02-06 2009-11-18 Koninklijke Philips Electronics N.V. Low complexity parametric stereo decoder
GB2467668B (en) * 2007-10-03 2011-12-07 Creative Tech Ltd Spatial audio analysis and synthesis for binaural reproduction and format conversion
WO2009067741A1 (en) * 2007-11-27 2009-06-04 Acouity Pty Ltd Bandwidth compression of parametric soundfield representations for transmission and storage
EP2205007B1 (en) * 2008-12-30 2019-01-09 Dolby International AB Method and apparatus for three-dimensional acoustic field encoding and optimal reconstruction
RU2520329C2 (ru) * 2009-03-17 2014-06-20 Долби Интернешнл Аб Усовершенствованное стереофоническое кодирование на основе комбинации адаптивно выбираемого левого/правого или среднего/побочного стереофонического кодирования и параметрического стереофонического кодирования
US20100296579A1 (en) * 2009-05-22 2010-11-25 Qualcomm Incorporated Adaptive picture type decision for video coding
US8705750B2 (en) * 2009-06-25 2014-04-22 Berges Allmenndigitale Rådgivningstjeneste Device and method for converting spatial audio signal
EP2268064A1 (en) * 2009-06-25 2010-12-29 Berges Allmenndigitale Rädgivningstjeneste Device and method for converting spatial audio signal
WO2011041834A1 (en) * 2009-10-07 2011-04-14 The University Of Sydney Reconstruction of a recorded sound field
KR101717787B1 (ko) * 2010-04-29 2017-03-17 엘지전자 주식회사 디스플레이장치 및 그의 음성신호 출력 방법
EP2451196A1 (en) * 2010-11-05 2012-05-09 Thomson Licensing Method and apparatus for generating and for decoding sound field data including ambisonics sound field data of an order higher than three
EP2450880A1 (en) * 2010-11-05 2012-05-09 Thomson Licensing Data structure for Higher Order Ambisonics audio data
EP2665208A1 (en) * 2012-05-14 2013-11-20 Thomson Licensing Method and apparatus for compressing and decompressing a Higher Order Ambisonics signal representation
US9190065B2 (en) * 2012-07-15 2015-11-17 Qualcomm Incorporated Systems, methods, apparatus, and computer-readable media for three-dimensional audio coding using basis function coefficients
EP2688066A1 (en) 2012-07-16 2014-01-22 Thomson Licensing Method and apparatus for encoding multi-channel HOA audio signals for noise reduction, and method and apparatus for decoding multi-channel HOA audio signals for noise reduction
CN104471641B (zh) * 2012-07-19 2017-09-12 杜比国际公司 用于改善对多声道音频信号的呈现的方法和设备
EP2743922A1 (en) * 2012-12-12 2014-06-18 Thomson Licensing Method and apparatus for compressing and decompressing a higher order ambisonics representation for a sound field
EP2765791A1 (en) * 2013-02-08 2014-08-13 Thomson Licensing Method and apparatus for determining directions of uncorrelated sound sources in a higher order ambisonics representation of a sound field
EP2800401A1 (en) * 2013-04-29 2014-11-05 Thomson Licensing Method and Apparatus for compressing and decompressing a Higher Order Ambisonics representation
US9769586B2 (en) * 2013-05-29 2017-09-19 Qualcomm Incorporated Performing order reduction with respect to higher order ambisonic coefficients

Patent Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
RU2361288C2 (ru) * 2005-04-15 2009-07-10 Фраунхофер-Гезелльшафт Цур Фердерунг Дер Ангевандтен Форшунг Е.Ф. Устройство и способ для формирования сигнала управления многоканальным синтезатором и устройство и способ многоканального синтеза
US20100198601A1 (en) * 2007-05-10 2010-08-05 France Telecom Audio encoding and decoding method and associated audio encoder, audio decoder and computer programs
RU2450369C2 (ru) * 2007-09-25 2012-05-10 Моторола Мобилити, Инк., Устройство и способ для кодирования многоканального звукового сигнала
CN101977349A (zh) * 2010-09-29 2011-02-16 华南理工大学 Ambisonic声重发***解码的优化改进方法
WO2012061148A1 (en) * 2010-10-25 2012-05-10 Qualcomm Incorporated Systems, methods, apparatus, and computer-readable media for head tracking based on recorded sound signals
EP2469742A2 (en) * 2010-12-21 2012-06-27 Thomson Licensing Method and apparatus for encoding and decoding successive frames of an ambisonics representation of a 2- or 3-dimensional sound field

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
BURNETT IAN et al, "Encoding Higher Order Ambisonics with AAC". *

Also Published As

Publication number Publication date
CN109410965B (zh) 2023-10-31
US20180310112A1 (en) 2018-10-25
MX2023008863A (es) 2023-08-15
EP2743922A1 (en) 2014-06-18
RU2744489C2 (ru) 2021-03-10
JP6285458B2 (ja) 2018-02-28
KR102202973B1 (ko) 2021-01-14
US20220159399A1 (en) 2022-05-19
MX2022008694A (es) 2022-08-08
US10038965B2 (en) 2018-07-31
CN109616130B (zh) 2023-10-31
CN117037812A (zh) 2023-11-10
TWI729581B (zh) 2021-06-01
CN109410965A (zh) 2019-03-01
MX344988B (es) 2017-01-13
KR102546541B1 (ko) 2023-06-23
CA2891636A1 (en) 2014-06-19
JP2022130638A (ja) 2022-09-06
TW201926319A (zh) 2019-07-01
TW201435858A (zh) 2014-09-16
CN109545235A (zh) 2019-03-29
MX2022008693A (es) 2022-08-08
HK1216356A1 (zh) 2016-11-04
MY169354A (en) 2019-03-26
CA3125248A1 (en) 2014-06-19
JP7100172B2 (ja) 2022-07-12
MX2015007349A (es) 2015-09-10
JP6869322B2 (ja) 2021-05-12
JP2020074008A (ja) 2020-05-14
TWI681386B (zh) 2020-01-01
US10609501B2 (en) 2020-03-31
CN109616130A (zh) 2019-04-12
JP2023169304A (ja) 2023-11-29
CN109448743A (zh) 2019-03-08
CN117392989A (zh) 2024-01-12
JP7353427B2 (ja) 2023-09-29
KR102664626B1 (ko) 2024-05-10
CN109545235B (zh) 2023-11-17
CN109448743B (zh) 2020-03-10
KR20150095660A (ko) 2015-08-21
KR20230098355A (ko) 2023-07-03
TWI788833B (zh) 2023-01-01
TW202338788A (zh) 2023-10-01
CN117037813A (zh) 2023-11-10
EP3996090A1 (en) 2022-05-11
US9646618B2 (en) 2017-05-09
TW202209302A (zh) 2022-03-01
US20200296531A1 (en) 2020-09-17
CN109448742B (zh) 2023-09-01
CA2891636C (en) 2021-09-21
TWI645397B (zh) 2018-12-21
TW201807703A (zh) 2018-03-01
EP3496096A1 (en) 2019-06-12
TWI611397B (zh) 2018-01-11
EP3496096B1 (en) 2021-12-22
RU2015128090A (ru) 2017-01-17
JP2021107938A (ja) 2021-07-29
EP2932502A1 (en) 2015-10-21
RU2017118830A (ru) 2018-10-31
US11546712B2 (en) 2023-01-03
CN104854655A (zh) 2015-08-19
CA3168326A1 (en) 2014-06-19
CA3168322A1 (en) 2014-06-19
CN104854655B (zh) 2019-02-19
US10257635B2 (en) 2019-04-09
CA3125248C (en) 2023-03-07
US20190239020A1 (en) 2019-08-01
RU2017118830A3 (ru) 2020-09-07
CA3125246A1 (en) 2014-06-19
US20230179940A1 (en) 2023-06-08
US11184730B2 (en) 2021-11-23
JP2015537256A (ja) 2015-12-24
KR102428842B1 (ko) 2022-08-04
MY191376A (en) 2022-06-21
KR20240068780A (ko) 2024-05-17
JP6640890B2 (ja) 2020-02-05
KR20220113839A (ko) 2022-08-16
CA3125246C (en) 2023-09-12
KR20210007036A (ko) 2021-01-19
US20170208412A1 (en) 2017-07-20
JP2018087996A (ja) 2018-06-07
US20150332679A1 (en) 2015-11-19
CN109448742A (zh) 2019-03-08
WO2014090660A1 (en) 2014-06-19
CA3125228A1 (en) 2014-06-19
MX2022008695A (es) 2022-08-08
CA3125228C (en) 2023-10-17
MX2022008697A (es) 2022-08-08
CA3168322C (en) 2024-01-30
TW202013354A (zh) 2020-04-01
EP2932502B1 (en) 2018-09-26

Similar Documents

Publication Publication Date Title
RU2623886C2 (ru) Способ и устройство для сжатия и восстановления представления системы амбисоник высшего порядка для звукового поля
RU2823441C2 (ru) Способ и устройство для сжатия и восстановления представления системы амбисоник высшего порядка для звукового поля