KR100209870B1 - 오디오 신호의 순서화된 타임 시퀸스 처리 방법 및 오디오 신호 전송 방법 - Google Patents

오디오 신호의 순서화된 타임 시퀸스 처리 방법 및 오디오 신호 전송 방법 Download PDF

Info

Publication number
KR100209870B1
KR100209870B1 KR1019900016433A KR900016433A KR100209870B1 KR 100209870 B1 KR100209870 B1 KR 100209870B1 KR 1019900016433 A KR1019900016433 A KR 1019900016433A KR 900016433 A KR900016433 A KR 900016433A KR 100209870 B1 KR100209870 B1 KR 100209870B1
Authority
KR
South Korea
Prior art keywords
frequency
signal
discrete
coefficients
generating
Prior art date
Application number
KR1019900016433A
Other languages
English (en)
Other versions
KR910008975A (ko
Inventor
브란덴부르크 카를하인쯔
데이빗 죤스턴 제임스
Original Assignee
죤 제이.키세인
아메리칸 텔리폰 앤드 텔레그라프 캄파니
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 죤 제이.키세인, 아메리칸 텔리폰 앤드 텔레그라프 캄파니 filed Critical 죤 제이.키세인
Publication of KR910008975A publication Critical patent/KR910008975A/ko
Application granted granted Critical
Publication of KR100209870B1 publication Critical patent/KR100209870B1/ko

Links

Classifications

    • HELECTRICITY
    • H03ELECTRONIC CIRCUITRY
    • H03MCODING; DECODING; CODE CONVERSION IN GENERAL
    • H03M7/00Conversion of a code where information is represented by a given sequence or number of digits to a code where the same, similar or subset of information is represented by a different sequence or number of digits
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04BTRANSMISSION
    • H04B1/00Details of transmission systems, not covered by a single one of groups H04B3/00 - H04B13/00; Details of transmission systems not characterised by the medium used for transmission
    • H04B1/66Details of transmission systems, not covered by a single one of groups H04B3/00 - H04B13/00; Details of transmission systems not characterised by the medium used for transmission for reducing bandwidth of signals; for improving efficiency of transmission
    • H04B1/665Details of transmission systems, not covered by a single one of groups H04B3/00 - H04B13/00; Details of transmission systems not characterised by the medium used for transmission for reducing bandwidth of signals; for improving efficiency of transmission using psychoacoustic properties of the ear, e.g. masking effect

Landscapes

  • Engineering & Computer Science (AREA)
  • Computer Networks & Wireless Communication (AREA)
  • Signal Processing (AREA)
  • Theoretical Computer Science (AREA)
  • Compression, Expansion, Code Conversion, And Decoders (AREA)
  • Transmission Systems Not Characterized By The Medium Used For Transmission (AREA)

Abstract

본원 방법은 주파수 함수로서 오디오 신호의 인지되는 잡음 마스킹 레벨의 추정값을 결정하는 것이다. (i) 신호의 샘플된 값의 각 블럭에 대한 실제의 주파수 성분(진폭 및 위상)과, (ii) 사전 블럭에서의 값을 토대로한 이들 성분에 대한 예측된 값 사이의 유클리드 거리에 관련된 랜덤한 메트릭을 발생함으로써, 잡음 마스킹 함수를 형성하는데 유용한 보다 상세한 정보를 제공하는 음조 인덱스를 형성하는 것이 가능하다. 오디오 레코딩 또는 전송동안 코딩 및 디코딩하는 것에 이 기술의 응용이 예시되어 있다.

Description

오디오 신호의 순서화된 타임 시퀀스 처리 방법 및 오디오 신호 전송 방법
제1도는 본 발명에 따른 전체 시스템의 블럭도.
제2도는 본 발명에 따른 코더의 실시예에 적용되는 마스킹 임계 처리를 설명하는 순서도.
제3(a)도 내지 제3(d)도는 본 발명의 실시예의 코딩하는 여러 단계에서의 처리 결과를 도시한 도면.
* 도면의 주요부분에 대한 부호의 설명
105 : 프리 프로세서 115 : 양자화기/코더
120 : 기록 또는 전송 매체 130 : 디코더
150 : 포스트 프로세서
[발명의 분야]
본 발명은 음성이나 음악 정보를 표시하는 오디오 신호와 같은 시변 신호의 코딩에 관한 것이다.
[발명의 배경]
소비자, 산업체, 스튜디오 및 연구소에서 고질의 오디오 신호를 기억하여 처리하고 통신시키는 제품에 대한 수요가 증가하고 있다. 예를들면, 음악을 녹음하는데 있어 가장 오랜동안 대중들이 사용하여 왔던 축음기가 소위 콤팩트 디스크(CD) 디지탈 레코딩으로 대부분 대체되었다. 최근에, 디지탈 오디오 테이프(DAT) 장치는 고질의 오디오 장치를 더욱 개선시켰고 편리하게 이용할 수 있도록 하였다. 예를들어, 1989년 10월에 출간된 IEEE Spectrum 34 내지 38페이지에 Tan과 Vermeulen이 발표한 데이타 기억용 디지탈 오디오 테이프 논문을 참조하자. 고선명 텔레비젼(HDTV)에 관한 최근의 관심은 고질의 오디오를 어떻게 이와같은 시스템에 효과적으로 제공할 수 있는가에 관한 것이다.
상업적으로 이용가능한 CD 및 DAT 시스템이 정교한 패리티 및 에러 정정 코드를 사용하지만, 고질의 오디오 신호용 소스 정보를 효율적으로 코딩하는 어떠한 표준도 현재 이들 장치에는 존재하지 않는다. Tan과 Vermeulen은 다른 여러 기술중에서(특정되지 않은) 데이타 압축 기술이 DAT 장치의 용량 및 전송 속도를 시간중에 10배까지 증가시킬 수 있음을 지적하고 있다.
인간의 청각 응답이 가청 주파수의 잡음 또는 바람직하지 않는 가청 주파수 음향 신호에 의해 마스킹될 수 있다는 것이 공지되어 왔다. 1970년, 뉴욕에서 J.V. Tobias씨에 의해 출간된 과학 논평지인 현대의 청각 이론의 기초중 제5장에 B. Scharf씨가 발표한 임계 대역이란 논문을 참조하자. 이들 논문은 오디오 신호용 코더를 설계하는데 유용하다. 예를들어, 1979년 12월에 미합중국 청각협회의 잡지 제66권 1647 내지 1652 페이지에 M. R. Schroeder씨 등이 발표한 인간 귀의 마스킹 특성을 개발하므로써 최적화되는 디지탈 음성 코더라는 논문을 참조하자.
1987년 11월에 출간된 소비자 전자공학에 관한 IEEE Trans 제 CE-33 권중 제4권에 E. F. Schroeder 및 H. J. Platte씨가 발표한 MSC':CD-음질 및 256 IT/SEC를 갖는 스테레오 오디오 코딩이란 논문은 CD에 적용가능한 인지할 수 있는 엔코딩 절차(perceptual encoding procedure)에 관해 기술한다.
1988년 2월 통신시에 선택되는 에리어에 관한 IEEE Trans 314 내지 434 페이지에 J. D. Johnston씨가 발표한 인지할 수 있는 잡은 표준을 이용한 오디오 신호의 변환 코딩이라는 논문은 진보된 오디오 신호용 인지할 수 있는 코딩 기술을 서술하고 있다. 특히, 이 논문에 기술된 시스템은 인간 청각 모델을 사용하여 변환 코더로 수행되는 단기간의 스펙트럼 마스킹 기능을 파생시킨다. 신호 주파수 분석 및 마스킹 기능을 토대로 용장도(redundancy)를 추출하므로써 비트율을 감소시킨다. 이 기술은 코딩될 신호의 소위 임계 대역에 걸쳐서 스펙트럼의 형태를 표시하는 소위 음조 측정(tonality measure)을 이용하여 양자화 잡음 효과를 보다 양호하게 제어한다.
[발명의 요약]
본 발명은 상기 Johnston 논문에 기술된 음조 토대로한 인지할 수 있는 코딩 기술(the tonality based perceptual coding techniques)을 개선한 것이다. 본원 발명이 개선한 것중 한가지는 음조 메트릭값(tonality metric values)을 계산하는데 있어 스펙트럼-폭(spectrum-ωide)을 토대로 분석하는 것이 아니라 한 주파수 라인씩 분석하는 것이다. 현재 프레임(current-frame)만으로 상기 한 라인씩 계산하는 것보다 오히려 입력 전력 스펙트럼의 연속 프레임의 내력(history)을 토대로 상기 한 라인씩 계산하는 것이 유용하다. 그래서, 본 발명은 한 임계-대역씩을 토대로 추정하는 것보다 차라리 한 라인씩을 토대로 추정하므로써 인지할 수 있는 임계의 개선된 추정값을 결정한다. 적합한 경우에, 임계 대역 마스킹 임계값이 사용될 수 있다.
특히, 본 발명의 음조 추정값은 다수의, 전형적으로 2개의 사전 시간 프레임의 통계치(statistic)를 이용하여 현재 시간 프레임의 소정 전력 스펙트럼 주파수 라인값을 예측한다. 이 처리는 현재 프레임의 실제 라인 및 예측된 라인간의 유클리드 거리를 이용하여 각 스펙트럼 라인의 음조(또는 잡음)를 추정하는 것을 특징으로 한다. 예측된 값 및 실제값을 이용하여 추정값을 정규화하면은 이들 계산을 손쉽게할 수 있다는 것이 입증되었다. 그리고나서, 이들 음조 추정값은 예를들어 임계-대역을 토대로 결합되어 실제 음조의 추정값을 얻는다. 이것이 각 주파수에 대해 행해지므로써 기록, 전송 또는 그외 다른 사용을 위해 결국 코딩될 주파수 정보를 양자화하는데 사용될 잡음-마스킹 임계를 결정한다. 활용되는 비트는 계산된 임계를 토대로 각 주파수에 대한 값을 양자화 하도록 할당되며, 임계가 높은 경우 보다 적은 비트가 필요로 되는 반면, 임계가 낮은 경우 보다 미세한 양자화(finer quantization)(낮은 양자화 잡음)가 요구된다.
예를들면, Schroeder씨 등이 발표한 논문에 일반적으로 기술된 것과 같이, 종래 공지된 스프레딩(spreading) 동작은 본 발명의 개선된 마스킹 임계 결정 처리의 또다른 수행시에 사용된다.
그리고나서, 신호를 특징화하는 임계 정보 및 스펙트럼 정보는 전송 채널이나 또는 기록 매체로 전송되는데, 이 매체로 부터 디코딩 및 사용하기 위한 정보가 얻어진다.
이하 첨부된 도면을 참조로 하여 본원 명세서를 더욱 상세히 설명하기로 한다.
[상세한 설명]
본원을 간단화하기 위하여, 1988년 2월에 발간된 통신시에 선택되는 에리어에 관한 IEEE 잡지 6권중 제2권에 J.D. Johnston씨가 발표한 인지할 수 있는 잡음 표준을 이용한 오디오 신호의 변환 코딩이라는 논문 및 본원에 서술된 K. Brandenburg씨가 1988년 3월 10일에 출원한 국제특허출원서(PCT) 제ωO88/01811호를 참조하였다.
본 발명의 일반적인 내용은 종래 기술에 널리 공지된 타잎의 변환 코더에 관한 특허원에서 알 수 있고 상기 Johnston 및 Schroeder 등의 논문에 서술되어 있다.
또한, 예를들어, N. S. Jayant와 P. Noll씨가 발표한 파형의 디지탈 코딩-음성 및 비디오의 원리 및 응용이라는 논문중 특히 제12장의 변환 코딩을 참조하자.
상기 출원서 ωO88/01811는 변환 코딩에 관한 하나의 대안으로서 사용될 수 있는 소위 OCF 코더를 기술하고 있다.
제1도는 본 발명을 통합한 시스템의 전체 구성을 보여준다. 상기 도면에서, 입력(100)의 아나로그 신호는 프리 프로세서(105)에 인가되는데, 상기 프로세서에서 상기 아나로그 신호가 샘플화되고(전형적으로 32KHz에서) 각각의 샘플이 표준 방식의 디지탈 시퀀스(전형적으로 16비트)로 변환된다. 그리고 나서, 프리 프로세서(105)는 예를들어, 오디오 입력의 16msec에 대응하는 예를들어 512 디지탈 값의 프레임(또는 블럭 또는 세트)에서 상기 디지탈값을 그룹화한다.
전형적으로 50% 정도로 인접 프레임을 오버랩하는 것이 유리하다는 것이 증명되었다. 즉, 각 프레임이 512개의 순서화된 디지탈값을 포함할지라도, 이들 값들중 256개는 상기 값에 선행하는 512-값 프레임으로부터 반복된다. 따라서, 각각의 입력 디지탈값은 먼저 프레임의 두번째 절반 부분으로서, 그리고나서 프레임의 첫번째 절반 부분으로서 두개의 연속적인 프레임에 나타난다.
상기 프레임은 1987년에 출간된 IEEE ICASSP 제2161 내지 2164 페이지에 Princen, J. 씨 등이 발표한 시간 영역 에일어싱 소거를 토대로한 필터 뱅크 설계를 이용한 서브-밴드 변환 코딩이라는 논문에 기술된 예를들면 수정된 이산 코싸인 변환(MDCT)을 이용한 표준 방식으로 변환된다. 여러 표준 형태중 하나인 널리 공지된 단기간의 고속 푸리에 변환(FFT)이 당업자라면 알 수 있는 바와 같이 이와 같은 사용에 적합하다. 상기 MDCT로부터 발생한 257개의 복소 계수(complex coefficients)의 세트(제로-주파수, 나이키스트 주파수 및 모든 중간 주파수)가 입력 신호의 단기간의 주파수 스펙트럼을 나타낸다.
상기 복소 계수는 결과적으로, 각기 r 및 phi로서 표시된 극좌표 또는 진폭 및 위상 성분으로 손쉽게 표시된다.
비록 제1도에 명백하게 도시되지는 않았지만, 본 발명은 공지된 프리-에코(pre-echo) 및 동적 윈도윙 기술(dynamic ωindoωing techniques)을 사용할 수 있다. 상기 기술을 선택하는 동안, 이러한 기술이 본 발명을 토대로한 시스템에 어떻게 결합되는지를 후술한다.
제1도에 도시된 인지할 수 있는 코더 블럭(110)이 본 발명의 인지할 수 있는 마스킹 추정 개선을 포함하고 이에 대해 후술될 것이다. 제1도의 양자화기/코더 블럭(115)은 상술된 변환 또는 OCF 코더를 포함한다. 또한 디코딩에 사용되어질 적합한 사이드 정보의 코드화된 표시를 발생하는 수단 및 비트 할당 기술이 포함된다.
제1도의 블럭(120)은 양자화기/코더(115)의 코딩된 출력이 인가되는 기록 매체 또는 전송 매체를 표시한다. 양자화기/코더(115)로부터 나오는 출력 신호를 적절히 포맷하여 변조하는 것이 매체 블럭(120)에 포함된다. 이러한 기술은 종래 널리 공지되었고 특정 매체, 전송 또는 기록 속도 및 다른 시스템 파라미터에 의해 행해진다.
또한, 상기 매체(120)가 잡음 또는 다른 나쁜 영향을 포함한다면, 종래 기술에서 널리 공지된 바와 같이, 부가적인 에러-제어 장치 또는 공정을 필요로 한다. 따라서, 예를들면, 상기 매체가 표준 CD 장치와 유사한 광학 기록 매체이면, 상기 매체에 공통 형태인 용장 코딩(redundancy coding)이 본 발명에 의해 사용될 수 있다.
상기 매체가 예를들면, 방송, 전화 또는 인공위성 매체와 같은 전송용 매체중 한가지인 경우, 다른 적합한 에러 제어 메카니즘이 사용될 수 있다. 상기 매체를 수용(또는 상기 매체의 효과에 대항)하기 위한 임의의 변조, 용장도 또는 그외 다른 코딩은 채널 또는 다른 매체로부터 디코더로 전달시에 반전될 것이다. 그러므로 양자화기/코더(115)에 의해 제공된 원래의 코딩된 정보가 재생 장치에 인가될 것이다.
특히, 이들 코딩된 신호가 제1도에 도시된 디코더(130) 및 인지가능한 디코더(140)에 인가될 것이다. 일반적으로 종래의 기술에 공지되고 앞서 인용된 Johnston씨 논문에 기술된 바와 같이, 인지할 수 있는 코더(110)에 의해 파생되고 양자화기/코더(115) 및 매체(120)를 통해 인지할 수 있는 디코더(140)에 전달되는 일부 정보는 사이드 정보(side information) 특성이 있다. 이러한 사이드 정보가 이하에 상세하게 후술되고 상기 Johnston씨 논문에 기술되어 있다. 입력 정보의 스펙트럼 계수에 관계하여 매체(120)를 통해 양자화기/코더(115)에 의해 제공된 다른 정보가 디코더(130)에 직접 제공된다.
상기 사이드 정보를 처리한 후에, 인지할 수 있는 디코더(140)는 추가 정보를 디코더(130)에 제공하여 상기 디코더(130)가 프리-프로세서(105)에 발생된 원래의 스펙트럼 신호를 거의 또는 전혀 인지할 수 있는 왜곡을 초래함이 없이 재생하도록 한다. 그리고나서, 이들 재생된 신호는 포스트-프로세서(150)에 인가되는데, 여기서 역 MDCT 또는 그와 동등한 동작 및 D/A 기능이 종래 기술에서 공지된 바와 같이 성취되어 출력(160)상에서 원래의 아나로그 신호를 재생한다. 상기 출력(160)상의 출력은 입력(100)상에 공급된 출력과 거의 동일하기 때문에 청취자에 의해 감지될 수 있는 형태이다.
[인지할 수 있는 임계값]
발명의 배경에서 상술된 전체 시스템 구성과 베이스 라인 또는 기준으로서 상기 인용된 Johnston씨 논문과 구조에 따라서, 본 발명에 따른 임계값 추정을 계산하는 개선된 공정이 기술될 것이다.
제2도는 인지할 수 있는 코더(110)에서 성취되는 공정을 도시하는 순서도이다. 첨부된 리스팅(1)은 본원의 일부분을 형성한다. 상기 리스팅은 잡음 마스킹 임계 발생에 관한 본 발명의 양상에 따른 주석편에서 설명된 FORTRAN 프로그램 리스팅 반영 공정이다. 본원에 기술된 바와 같은 상기 FORTRAN 공정을 이해하는데 유용한 기준은 1988년 7월 Alliant 컴퓨터 시스템사에서 발간한 FX/FORTRAN 프로그램의 핸드북이다. 마찬가지로, Alliant 컴퓨터 시스템사에서 제조한 범용 컴퓨터가 리스팅(1)의 프로그램을 실행하기 위해 사용된다. 표 1은 리스팅(1)의 프로그램과 관련하여 사용되는 상수의 목록이다.
한편 종래의 기술에서 널리 공지된 특정 프로그램 언어가 리스팅에 사용되었지만, 당업자는 다른 언어가 본 발명의 특정 응용에 적합하다는 것을 알 수 있을 것이다. 이와 유사하게, 상수, 샘플링 속도 및 그외 다른 특정값이 단지 설명을 위해서만 사용된 것인지, 본 발명의 권리 범위를 제한하는 것으로서 해석되서는 않된다.
제2도 및 리스팅 1이 본 발명의 실시예를 더욱 자세하게 이해할 수 있도록 상술될 것이다.
제2도에 도시된 기능(200)은 본 발명에 따른 개선된 마스킹 임계 추정을 결정하는데 수행되는 공정 시작을 도시한다. 블럭(210)은 제2도의 블럭(220)으로 표시되는 표 1로부터 알 수 있는 절대 임계값을 이용하여 초기화하는 기능을 표시한다. 이들 초기화 또는 개시 동작이 서브루틴 strt( )에 의해 리스팅 1에서 상세하게 서술된다. 이 서브루틴에서, 임계 발생표 ithr 및 bval이 우선적으로 설정된다. i가 예를들어 종래 기술에 널리 공지되어 있고 Johnston 논문에 기술된 임계 대역에 대한 인덱스로서 사용된다는 것을 알아야만 된다. 임계 대역의 문맥에서의 i는 0 내지 25 의 값을 갖는다. 리스팅 1에 나타나는 다른 여러가지 임계 발생시 다른 여러가지 처리를 하기 위하여 인덱스 i는 상이한 범위로 사용될 수 있다.
strt( )에서, absloω는 청취의 절대 임계를 설정하기 위한 표시값이 할당된 상수이다. rzotz는 소망의 샘플링 속도이다.rnorm은 스프레딩 기능과 관련하여 사용되는 표준화 변수이다. openas는 ascii 파일을 오픈닝(opening)하기 위해 사용되는 간단한 연산자이다. db는 표엔트리(table entries)를 계산하는데 사용되는 더미(dummy) 변수이다.
실제 임계 계산은 서브루틴 thrgen으로 시작한다. 변수 r 및 phi는 물론 제1도의 프리 프로세서(105)에 의해 제공되는 스펙트럼 계수이다. 이들은 257값(제로 주파수, 나이키스트 주파수 및 모든 중간 성분)을 갖는 벡터이다.
인지할 수 있는 임계값을 계산하는 다음 단계는 각 임계 대역 j내의 신호 에너지의 음조 t(j) 계산이다. 상기 연산은 제2도에서 블록(230)으로 표시되어 있다. 음조 메트릭은
dr(ω)=rt-1(ω)-rt-2(ω)와
dø(ω)=øt-1(ω)-øt-2(ω)
을 형성하므로써 리스팅 1의 프로그램에 따라서 결정된다.
dr와 dø은 앞선 계산 블럭들, 즉 rt-1(ω)와 øt-1(ω) 및 두번째 계산 블럭들, 즉 rt-2(ω)와 øt-2(ω)의 반경 (r(ω)) 및 위상(ø(ω)) 간의 차이다. 이 계산은 주파수 라인(ω) 기준에 의해 주파수 라인상에서 행해진다. 사용될 수 있는 동적 윈도잉 기술(dynamic uindoωing technique)에 의해 블럭이 축소된다면, 주파수 라인은 2배로 되어 주파수 라인수가 동일하게 된다는 것을 주목하라. 부가적으로, 이와같은 동적 윈도잉 컨텍스트에 따라서 상기 차는 승산되어 하나의 서로 다른 크기로된 블록에 걸쳐서(추정된) 차를 표시한다.
dr 및 dø 값과 사전 r 및 ø로부터, 현재 블록에 대한 예측된 반경 및 위상이,
r(ω)=rt-1(ω)-dr(ω)
ø(ω)=øt-1(ω)-dø(ω)
에 의해 계산된다. 여기서, ω와 차신호는, 존재한다면, 동적 윈도잉에 대해 적절하게 다시 조정된다.
현재 스펙트럼에 대한 상기 값과 실제값으로부터 랜덤한 메트릭 (c(ω))이에 의해 계산된다.
c 값은 t(j)의 계산을 통하여 각 임계 대역의 적절한 임계값을 계산하도록 후에 사용된다.
그 다음, 임계 대역 에너지 계산은 제2도의 블록(240)으로 표시된 바와 같이 된다.
각 임계 대역내의 에너지는이고 합산된 임의 메트릭 c(j)은이다.
c(j)는 음조 음조 인데스, 즉, 두단계 tmp(j)=max(. 0.5, min(. 5, c(j)))에 있어서의 t(j)로 변환되고 나서, t(j)=. 43*ln tmp(j)-. 299가 된다. 스프레딩되지 않은 임계값을 파생할 수 있다.
파워 및 음조값으로부터, 스프레딩되지 않은 임계값 uthr(j)이 계산된다. 먼저, 주파수 및 음조에 대응하는 마스킹 SNR(snrdb(j))에 대한 적당한 값은 데시벨로 계산되는데, 즉 snrdb(j)=max(max(24.5, 15.5+j)*t(j)+5.5*(1. - t(j)), fmin(j))으로 계산된다. 여기서 fmin는 db당 보다는 오히려 에너지 비율로서 표 2내에 주어져 있다. 그리고나서, 마스크된 잡음 에너지대 신호 에너지의 비율이 계산되며, 즉이고 스프레딩되지 않은 임계값이 계산되며, 즉, uthr(j)=p(j)*snr(j)이 된다.
스프레딩된 임계값(sthr)은 스프레딩되지 않은 임계값, snr(j) 및 임계 대역 에너지(sthr(j)=max(uthr(j), snr(j)*p(i)*mask(i-j)[ij])에 따른 p(j))로 부터 계산되며, 여기서 mask(i-j)는 본 문헌내에 공지된 또는 리스팅 1의 종단에서의 서브루틴으로 계산된 바와 같은 형의 표를 토대로한 함수이다. 스프레딩 연산에 의한 레벨 변화를 보상하기 위하여, 표준화 인자 rnorm는 리스팅 1 내에서 초래된다.
스프레딩 및 표준화 이후, 스프레딩된 표준화 임계값은 절대 임계값 및 제한된 임계값 1thr(j)로 대체되는 최대값과 비교된다. 1thr(j)=max(thr(j), absthr(j))인데, 여기서 absthr(j)는 표 1에서 표로 만들어져 있다. 절대 임계값은 실제 블록 길이용으로 조정되는 것을 주목하자.
마침내, 임계값은 협대역 프리에코 문제점에 대해 블록 길이 팩터에 대해 적당하다면 어디서든지 조정후에 검사된다. 그리고나서, 최종 임계값 thr(j)이 계산된다.
thr(j)=min(1thr(j), 2*thr(j) 및 그리고나서 othr는 갱신된다.
othr(j)=1thr(j).
임계값 1thr(j)는 제1도의 양자화/코더(115)에서 수행된 연산에 사용되는 1xmin(j)로 명명된 변수로 손쉽게 변환된다.
임계값 계산 절차의 최종 단계는 현행 신호 블록용으로 필요한 비트수를 추정하는데 사용되는 엔트로피 측정치(entropy measure)를 계산하는 것이다. 상술된 Johnston 논문은 이 기술을 상세하게 기술하고 있다. 다음의 식은 인지할 수 있는 엔트로피를 규정한다.
이것이 인지할 수 있는 임계 처리를 완료한다. 상술되고 리스팅 1에 기술된 인지할 수 있는 임계 처리의 출력은 제1도의 양자화/코더(115)가 상술된 바와 같이 전송 또는 기억용 입력 신호 정보를 효과적으로 엔코딩하도록 사용하는 임계값을 설정한다. 유니트(115)에서 양자화한 다음 디코딩하는데 유용하다고 입증된 다른 정보는 각 주파수에 대한 스펙트럼 피크 정보이다. 스펙트럼 계수 정보의 전체 범위는 물론 상기 유니트(115)가 코딩하도록 하는데 활용될 수 있다. 유니트(115)에 전송되는 임계값 및 스펙트럼 피크 정보는 또한 코딩된 스펙트럼과 더불어 전송되는 사이드 정보를 발생시킨 다음 디코딩하는데 사용되고 고품질 재생(포스트 프로세서 및 D/A 유니트(150)에서 포스트 처리한 후)하도록 사용된다. 사이드 정보의 정확한 형태는 양자화/코더(115) 및 디코더(130)에 좌우되지만, 전형적으로 양자화 단계 크기 정보를 포함한다.
제3(a)도 내지 제3(d)도는 본 발명의 실시예에 따라서 처리되는 결과를 적절한 형태로 도시한 것이다 제3(a)도에서, 입력 파워 스펙트럼(51)은 각 임계 대역에 대한 일정한 스펙트럼 값을 나타내는 소위 바크 스펙트럼(bark spectrum)(52)과 대조된다. 실제로는, 본 발명의 기술은 각 주파수의 스펙트럼 성분을 결정하여 수평 단계를 일반적으로 보다 정확한 표시인 곡선으로 대체하는 것이다. 그러나, 제3(a)도 내지 제3(d)도의 목적(상기에서 인용한 Johnston 논문의 제4도에 기초)은 실제 스펙트럼의 상세를 제공하는 것보다는 각종 스테이지동안, 임계값의 상대 변화를 도시하는 것이다.
제3(b)도는 스프레딩 전의 스펙트럼과 비교될 때 스프레딩 후의 스펙트럼의 관계를 도시한다. 제3(c)도는 상술한 Phsycoacoustic 임계 팩터를 토대로한 스펙트럼으로 조절한 결과를 도시한다. 마침내, 표준화 및 절대 임계값이 고려될 때, 제3(d)도에 나타나는 곡선(55) 상의 최종 임계값이 도달된다.
제1도에 도시된 중간 블럭(120)의 수신기 또는 디코더측에서, 디코더(130)는 양자화 형태로 스펙트럼 정보를 수신하여 기록 또는 전송 매체로부터 공급되는 사이드 정보를 토대로 원래 스펙트럼을 인지할 수 있게 정확한 표시를 재구성한다. 이 사이드 정보는 스펙트럼 정보로부터 손쉽게 분리되고 제1도의 인지할 수 있는 디코딩 유니트(140)에 의해 처리된다. 원래 스펙트럼을 재구성하는 정확한 방법은 양자화/코더(115)의 기능에 좌우된다. 예컨대, 단계 크기가 사이드 정보로서 명백히 통신된다면, 상기 정보는 디코딩되어 스펙트럼 정보 신호를 해석하기 위해 디코더(130)에 공급된다. 수신된 비트 스트림의 비트를 특정 신호 특성에 할당하는 방법에 관한 정보는 또한 디코딩되어 스펙트럼 정보를 해석하는데 사용된다. 마찬가지로, 동적 윈도잉, 프리에코, 스케일링 및 다른 파라미터에 관한 매체(20)의 디코더측에 도달하는 어떠한 정보도 디코딩되어 코딩 스펙트럼 정보를 해석하는데 사용된다.
지금까지의 실시예에 대한 설명에서는 특정의 프로그래밍 언어 및 프로세서 형태에 관하여 예를들어 설명하였지만, 이 분야의 통상의 지식을 가진 사람이라면, 그 밖의 다른 사양도 특정한 경우에 바람직함을 알 수 있을 것이다. 예컨대, 일반 소비자용의 제품 규격에서는 ATT사, Intel사 /또는 Motorola사 등의 고성능 범용 또는 특수용의 마이크로 프로세서가 사용될 수도 있다. 예컨대 ATT사의 DSP-32 디지탈 신호 처리칩은 위에서 서술한 형태의 처리를 행하는데 유용하다. 그밖의 다른 경우, 공지된 칩 설계 기법에 기초한 특수 목적의 설계도 이상 설명한 처리를 행하는데 이용할 수 있다.
음조 메트릭은 현재의 블럭으로부터 나오는 r(ω)와 ø(ω)값 및 2개의 이전 블럭으로부터 나오는 대응값간의 차를 이용하는 실시예에서 결정하였다. 적당한 경우에서는, 이들 변수를 평가하는데 있어서, 예측되는 현재값을 형성하기 위한 기초로서, 오직 하나의 이전값을 이용하거나, 2개의 이전값보다 많은 여러개를 이용하여 형성하는 것도 바람직하다.
이와 같이, 상기 임의의 변수값이 각 스펙트럼 주파수 라인에 대해 계산할지라도, 상기 모든 라인에 대한 것보다 작은 것에 대한 값을 계산하는 것이 처리상 경제적으로 유용할 수도 있다.
상부 대역 엣지는 20KHz로 설정된다(블럭 길이 256에서는 라인 214, 블럭 길이 512에서는 라인 428) 다음 표는 블럭 길이 512에서 사용된다. 블럭 길이 256용 표는 512 블럭 길이용 표로부터 쉽게 계산될 수 있다. 또한 다른 샘플링 비율에 대한 표도 이 리스트로부터 쉽게 계산될 수 있다.

Claims (22)

  1. 제1주파수 계수 세트를 포함하는 이산 주파수 스펙트럼을 각각 갖는 순서화된 블럭 세트로 세분되는 오디오 신호의 순서화된 타임 시퀀스를 처리하는 방법에 있어서, (a) 적어도 하나의 주파수 계수를 각각 포함하는 다수의 주파수 그룹으로 상기 제1주파수 계수 세트를 그룹화하는 단계와, (b) 상기 주파수 그룹 각각의 주파수 계수에 대해 상기 주파수 계수의 예측도(predictability)를 반영하는 랜덤한 메트릭을 결정하는 단계와, (c) 상기 랜덤한 메트릭을 토대로 음조 함수값을 주파수 함수로서 결정하는 단계와, (d) 상기 음조 함수를 토대로 각 주파수 그룹의 주파수 계수에 대한 잡음 마스킹 임계값을 추정하는 단계를 포함하는 오디오 신호의 순서화된 타임 시퀀스 처리 방법.
  2. 제1항에 있어서, 각 주파수 그룹에 대한 상기 잡음 마스킹 임계값을 토대로 상기 제1주파수 계수 세트를 양자화하는 단계를 더 포함하는 오디오 신호의 순서화된 타임 시퀀스 처리 방법.
  3. 제2항에 있어서, 상기 양자화 단계는 상기 양자화되는 잡음이 상기 각 주파수 그룹에 대한 상기 잡음 마스킹 임계값 이하로 떨어지도록 상기 주파수 그룹 각각의 상기 주파수 계수 각각에 대한 양자화 레벨을 할당하는 단계를 포함하는 오디오 신호의 순서화된 타임 시퀀스 처리 방법.
  4. 제1주파수 계수 세트를 포함하는 이산 주파수 스펙트럼을 각각 갖는 순서화된 블럭 세트로 세분되는 오디오 신호의 순서화된 타임 시퀀스를 처리하는 방법에 있어서, (a) 적어도 하나의 주파수 계수를 각각 포함하는 다수의 주파수 그룹으로 상기 제1주파수 계수 세트를 그룹화하는 단계와, (b) 음조 인덱스 세트를 발생시키는 단계로서, 상기 음조 인덱스 세트는 상기 주파수 그룹 각각에 대한 음조 인덱스를 포함하고 적어도 하나의 사전 블럭에 대응하는 상기 제1주파수 계수 세트중 적어도 하나의 계수를 토대로 하는 상기 음조 인덱스 세트 발생 단계를 포함하는 오디오 신호의 순서화된 타임 시퀀스 처리 방법.
  5. 제4항에 있어서, 상기 음조 인덱스 세트를 토대로 각각의 잡음 마스킹 임계값 세트를 발생시키는 단계를 더 포함하는 오디오 신호의 순서화된 타임 시퀀스 처리 방법.
  6. 제5항에 있어서, 각 주파수 그룹에 대한 상기 잡음 마스킹 입계값을 토대로 상기 주파수 계수 각각을 양자화하는 단계를 더 포함하는 오디오 신호의 순서화된 타임 시퀀스 처리 방법.
  7. 제6항에 있어서, 상기 양자화 단계는 상기 양자화되는 잡음이 각 주파수 그룹에 대한 상기 잡음 마스킹 임계값 이하로 떨어지도록 상기 주파수 그룹 각각의 주파수 계수 각각에 대한 양자화 레벨을 할당하는 단계를 포함하는 오디오 신호의 순서화된 타임 시퀀스 처리 방법.
  8. (a) 제1주파수 계수 세트를 포함하는 이산 주파수 스펙트럼을 각각 갖는 순서화된 블럭 세트로 세분화된 오디오 신호의 순서화된 시간 시퀀스를 처리하는 단계와, (b) 각 블럭에 대해: (1) 적어도 하나의 주파수 계수를 각각 포함하는 다수의 주파수 그룹으로 상기 제1주파수 계수 세트를 그룹화하는 단계와, (2) 상기 주파수 그룹의 상기 주파수 계수 각각에 대해 상기 주파수 계수의 예측도를 반영하는 랜덤한 메트릭을 결정하는 단계와, (3) 상기 랜덤한 메트릭을 토대로 음조 함수값을 주파수 함수로서 결정하는 단계와, (4) 상기 음조 메트릭을 토대로 각 주파수 그룹에 대한 잡음 마스킹 임계값을 추정하는 단계와, (5) 상기 양자화되는 잡음이 각 주파수 그룹에 대한 상기 잡음 마스킹 임계값 이하로 떨어지도록 상기 주파수 계수 각각을 양자화하는 단계와, (6) 상기 양자화된 주파수 계수를 표시하는 신호를 포함하는 기록 신호를 기억 매체에 인가하는 단계와, (7) 상기 기억 매체에 기억된 상기 신호를 기록하는 단계를 포함하는 공정에 따라서 제조되는 기억 매체.
  9. 제8항에 있어서, 상기 기억 매체는 콤팩트 디스크인 기억 매체.
  10. 제8항에 있어서, 상기 기억 매체는 자기 기억 수단인 기억 매체.
  11. 오디오 신호 전송 방법에 있어서, (a) 제1주파수 계수 세트를 포함하는 이산 주파수 스펙트럼을 각각 갖는 순서화된 블럭 세트로 세분되는 오디오 신호의 순서화된 타임 시퀀스를 처리하는 단계와, (b) 각 블럭에 대해: (1) 적어도 하나의 주파수 계수를 각각 포함하는 다수의 주파수 그룹으로 상기 제1주파수 계수 세트를 그룹화하는 단계와, (2) 상기 주파수 그룹의 상기 주파수 계수 각각에 대해 상기 주파수 계수의 예측도를 반영하는 랜덤한 메트릭을 결정하는 단계와, (3) 상기 랜덤한 메트릭을 토대로 음조 함수값을 주파수 함수로서 결정하는 단계와, (4) 상기 음조 함수를 토대로 각 주파수 그룹에 대한 잡음 마스킹 임계값을 추정하는 단계와, (5) 상기 양자화되는 잡음이 각 주파수 그룹에 대한 상기 잡음 마스킹 임계값 이하로 떨어지도록 상기 주파수 계수 각각을 양자화하는 단계와, (6) 상기 양자화된 주파수 계수를 표시하는 신호를 포함하는 전송 신호를 전송 매체에 인가하는 단계를 포함하는 오디오 신호 전송 방법.
  12. 제11항에 있어서, 상기 전송 매체는 방송 전송 매체인 오디오 신호 전송 방법.
  13. 제11항에 있어서, 상기 전송 매체는 전기 도통 매체인 오디오 신호 전송 방법.
  14. 제11항에 있어서, 상기 전송 매체는 광학 전송 매체인 오디오 신호 전송 방법.
  15. 제11항에 있어서, 상기 처리 단계는 이산 주파수 스펙트럼 신호를 발생시키는 단계를 더 포함하는 오디오 신호 전송 방법.
  16. 제15항에 있어서, 상기 이산 주파수 스펙트럼 신호 발생 단계는 이산 퓨리에 계수 신호를 발생시키는 단계를 포함하는 오디오 신호 전송 방법.
  17. 제4항에 있어서, 상기 처리 단계는 이산 주파수 스펙트럼 신호를 발생시키는 단계를 더 포함하는 오디오 신호 전송 방법.
  18. 제17항에 있어서, 상기 이산 주파수 스펙트럼 신호 발생 단계는 이산 퓨리에 계수 신호를 발생시키는 단계를 포함하는 오디오 신호 전송 방법.
  19. 제8항에 있어서, 상기 처리 단계는 이산 주파수 스펙트럼 신호를 발생시키는 단계를 더 포함하는 오디오 신호 전송 방법.
  20. 제10항에 있어서, 상기 이산 주파수 스펙트럼 신호 발생 단계는 이산 퓨리에 계수 신호 발생 단계를 포함하는 오디오 신호 전송 방법.
  21. 제11항에 있어서, 상기 처리 단계는 이산 주파수 스펙트럼 신호를 발생시키는 단계를 더 포함하는 오디오 신호 전송 방법.
  22. 제21항에 있어서, 상기 이산 주파수 스펙트럼 신호 발생 단계는 이산 퓨리에 계수 신호를 발생시키는 단계를 포함하는 오디오 신호 전송 방법.
KR1019900016433A 1989-10-18 1990-10-16 오디오 신호의 순서화된 타임 시퀸스 처리 방법 및 오디오 신호 전송 방법 KR100209870B1 (ko)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
US07/423,088 US5040217A (en) 1989-10-18 1989-10-18 Perceptual coding of audio signals
US423088 1989-10-18

Publications (2)

Publication Number Publication Date
KR910008975A KR910008975A (ko) 1991-05-31
KR100209870B1 true KR100209870B1 (ko) 1999-07-15

Family

ID=23677639

Family Applications (1)

Application Number Title Priority Date Filing Date
KR1019900016433A KR100209870B1 (ko) 1989-10-18 1990-10-16 오디오 신호의 순서화된 타임 시퀸스 처리 방법 및 오디오 신호 전송 방법

Country Status (7)

Country Link
US (2) US5040217A (ko)
EP (1) EP0424016B1 (ko)
JP (1) JP2756515B2 (ko)
KR (1) KR100209870B1 (ko)
CA (1) CA2027136C (ko)
DE (1) DE69028675T2 (ko)
HK (1) HK220296A (ko)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US8560304B2 (en) 2007-04-30 2013-10-15 Samsung Electronics Co., Ltd. Method and apparatus for encoding and decoding high frequency band

Families Citing this family (148)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5341457A (en) * 1988-12-30 1994-08-23 At&T Bell Laboratories Perceptual coding of audio signals
USRE40280E1 (en) 1988-12-30 2008-04-29 Lucent Technologies Inc. Rate loop processor for perceptual encoder/decoder
US5434948A (en) * 1989-06-15 1995-07-18 British Telecommunications Public Limited Company Polyphonic coding
US5115240A (en) * 1989-09-26 1992-05-19 Sony Corporation Method and apparatus for encoding voice signals divided into a plurality of frequency bands
JP2969862B2 (ja) * 1989-10-04 1999-11-02 松下電器産業株式会社 音声認識装置
US6695477B1 (en) * 1989-10-25 2004-02-24 Sony Corporation Audio signal reproducing apparatus
JPH03139700A (ja) * 1989-10-25 1991-06-13 Sony Corp オーディオ信号再生装置
US5388181A (en) * 1990-05-29 1995-02-07 Anderson; David J. Digital audio compression system
DE4020656A1 (de) * 1990-06-29 1992-01-02 Thomson Brandt Gmbh Verfahren zur uebertragung eines signals
CA2105387A1 (en) * 1991-03-05 1992-09-06 Antony H. Crossman Variable bit rate speech encoder
US5317672A (en) * 1991-03-05 1994-05-31 Picturetel Corporation Variable bit rate speech encoder
GB2257606B (en) * 1991-06-28 1995-01-18 Sony Corp Recording and/or reproducing apparatuses and signal processing methods for compressed data
GB2258372B (en) * 1991-08-02 1995-05-31 Sony Corp Apparatus for and methods of recording and/or reproducing digital data
DE4212339A1 (de) * 1991-08-12 1993-02-18 Standard Elektrik Lorenz Ag Codierverfahren fuer audiosignale mit 32 kbit/s
EP0535889B1 (en) * 1991-09-30 1998-11-11 Sony Corporation Method and apparatus for audio data compression
JP3310682B2 (ja) * 1992-01-21 2002-08-05 日本ビクター株式会社 音響信号の符号化方法及び再生方法
US5285498A (en) * 1992-03-02 1994-02-08 At&T Bell Laboratories Method and apparatus for coding audio signals based on perceptual model
EP0559348A3 (en) 1992-03-02 1993-11-03 AT&T Corp. Rate control loop processor for perceptual encoder/decoder
JP3446216B2 (ja) * 1992-03-06 2003-09-16 ソニー株式会社 音声信号処理方法
US5495552A (en) * 1992-04-20 1996-02-27 Mitsubishi Denki Kabushiki Kaisha Methods of efficiently recording an audio signal in semiconductor memory
JP3278900B2 (ja) * 1992-05-07 2002-04-30 ソニー株式会社 データ符号化装置及び方法
JP3153933B2 (ja) * 1992-06-16 2001-04-09 ソニー株式会社 データ符号化装置及び方法並びにデータ復号化装置及び方法
JP3508146B2 (ja) * 1992-09-11 2004-03-22 ソニー株式会社 ディジタル信号符号化復号化装置、ディジタル信号符号化装置及びディジタル信号復号化装置
JP3185413B2 (ja) * 1992-11-25 2001-07-09 ソニー株式会社 直交変換演算並びに逆直交変換演算方法及びその装置、ディジタル信号符号化及び/又は復号化装置
JP3123286B2 (ja) * 1993-02-18 2001-01-09 ソニー株式会社 ディジタル信号処理装置又は方法、及び記録媒体
JP3186292B2 (ja) * 1993-02-02 2001-07-11 ソニー株式会社 高能率符号化方法及び装置
US5579404A (en) * 1993-02-16 1996-11-26 Dolby Laboratories Licensing Corporation Digital audio limiter
JP3123290B2 (ja) * 1993-03-09 2001-01-09 ソニー株式会社 圧縮データ記録装置及び方法、圧縮データ再生方法、記録媒体
JP3186307B2 (ja) * 1993-03-09 2001-07-11 ソニー株式会社 圧縮データ記録装置及び方法
JP3173218B2 (ja) * 1993-05-10 2001-06-04 ソニー株式会社 圧縮データ記録方法及び装置、圧縮データ再生方法、並びに記録媒体
US5581654A (en) * 1993-05-25 1996-12-03 Sony Corporation Method and apparatus for information encoding and decoding
KR100458969B1 (ko) * 1993-05-31 2005-04-06 소니 가부시끼 가이샤 신호부호화또는복호화장치,및신호부호화또는복호화방법
US5765126A (en) * 1993-06-30 1998-06-09 Sony Corporation Method and apparatus for variable length encoding of separated tone and noise characteristic components of an acoustic signal
US5664057A (en) * 1993-07-07 1997-09-02 Picturetel Corporation Fixed bit rate speech encoder/decoder
TW272341B (ko) * 1993-07-16 1996-03-11 Sony Co Ltd
TW327223B (en) * 1993-09-28 1998-02-21 Sony Co Ltd Methods and apparatus for encoding an input signal broken into frequency components, methods and apparatus for decoding such encoded signal
DE69428435T2 (de) * 1993-11-04 2002-07-11 Sony Corp., Tokio/Tokyo Signalkodierer, signaldekodierer, aufzeichnungsträger und signalkodiererverfahren
US5774844A (en) * 1993-11-09 1998-06-30 Sony Corporation Methods and apparatus for quantizing, encoding and decoding and recording media therefor
US5488665A (en) * 1993-11-23 1996-01-30 At&T Corp. Multi-channel perceptual audio compression system with encoding mode switching among matrixed channels
US5608713A (en) * 1994-02-09 1997-03-04 Sony Corporation Bit allocation of digital audio signal blocks by non-linear processing
JPH07261797A (ja) * 1994-03-18 1995-10-13 Mitsubishi Electric Corp 信号符号化装置及び信号復号化装置
WO1995027335A1 (fr) * 1994-04-01 1995-10-12 Sony Corporation Methode et dispositif de codage et de decodage d'informations, methode de transmission d'informations et support d'enregistrement de l'information
JP3277677B2 (ja) * 1994-04-01 2002-04-22 ソニー株式会社 信号符号化方法及び装置、信号記録媒体、信号伝送方法、並びに信号復号化方法及び装置
JP3186412B2 (ja) * 1994-04-01 2001-07-11 ソニー株式会社 情報符号化方法、情報復号化方法、及び情報伝送方法
JPH07322252A (ja) * 1994-05-23 1995-12-08 Canon Inc 画像符号化装置
JP3250376B2 (ja) * 1994-06-13 2002-01-28 ソニー株式会社 情報符号化方法及び装置並びに情報復号化方法及び装置
JP3277699B2 (ja) * 1994-06-13 2002-04-22 ソニー株式会社 信号符号化方法及び装置並びに信号復号化方法及び装置
JP3277705B2 (ja) 1994-07-27 2002-04-22 ソニー株式会社 情報符号化装置及び方法、並びに情報復号化装置及び方法
JP3341474B2 (ja) * 1994-07-28 2002-11-05 ソニー株式会社 情報符号化方法及び復号化方法、情報符号化装置及び復号化装置、並びに情報記録媒体
US5625743A (en) * 1994-10-07 1997-04-29 Motorola, Inc. Determining a masking level for a subband in a subband audio encoder
EP0709981B1 (en) * 1994-10-28 2002-01-09 RAI RADIOTELEVISIONE ITALIANA (S.p.A.) Subband coding with pitchband predictive coding in each subband
US5654952A (en) * 1994-10-28 1997-08-05 Sony Corporation Digital signal encoding method and apparatus and recording medium
KR970011727B1 (en) * 1994-11-09 1997-07-14 Daewoo Electronics Co Ltd Apparatus for encoding of the audio signal
JP3557674B2 (ja) * 1994-12-15 2004-08-25 ソニー株式会社 高能率符号化方法及び装置
JP3371590B2 (ja) * 1994-12-28 2003-01-27 ソニー株式会社 高能率符号化方法及び高能率復号化方法
EP0720316B1 (en) * 1994-12-30 1999-12-08 Daewoo Electronics Co., Ltd Adaptive digital audio encoding apparatus and a bit allocation method thereof
US5646961A (en) * 1994-12-30 1997-07-08 Lucent Technologies Inc. Method for noise weighting filtering
KR970003559Y1 (ko) * 1994-12-30 1997-04-18 기아자동차 주식회사 차량의 열변형 방지가 가능한 인스트루먼트 코어
US5699479A (en) * 1995-02-06 1997-12-16 Lucent Technologies Inc. Tonality for perceptual audio compression based on loudness uncertainty
US5682463A (en) * 1995-02-06 1997-10-28 Lucent Technologies Inc. Perceptual audio compression based on loudness uncertainty
FR2730594B1 (fr) * 1995-02-09 1997-03-21 France Telecom Procede de quantification vectorielle sur reseau contrainte en debit
KR100346734B1 (ko) * 1995-09-22 2002-11-23 삼성전자 주식회사 고속분석필터및합성필터를구비한오디오부호화기및복호화기
JPH1084284A (ja) * 1996-09-06 1998-03-31 Sony Corp 信号再生方法および装置
JP3496411B2 (ja) * 1996-10-30 2004-02-09 ソニー株式会社 情報符号化方法及び復号化装置
US6147010A (en) * 1996-11-14 2000-11-14 Micron Technology, Inc. Solvent prewet and method to dispense the solvent prewet
US6463405B1 (en) 1996-12-20 2002-10-08 Eliot M. Case Audiophile encoding of digital audio data using 2-bit polarity/magnitude indicator and 8-bit scale factor for each subband
US5845251A (en) * 1996-12-20 1998-12-01 U S West, Inc. Method, system and product for modifying the bandwidth of subband encoded audio data
US5864820A (en) * 1996-12-20 1999-01-26 U S West, Inc. Method, system and product for mixing of encoded audio signals
US6477496B1 (en) 1996-12-20 2002-11-05 Eliot M. Case Signal synthesis by decoding subband scale factors from one audio signal and subband samples from different one
US6516299B1 (en) 1996-12-20 2003-02-04 Qwest Communication International, Inc. Method, system and product for modifying the dynamic range of encoded audio signals
US6782365B1 (en) 1996-12-20 2004-08-24 Qwest Communications International Inc. Graphic interface system and product for editing encoded audio data
US5864813A (en) * 1996-12-20 1999-01-26 U S West, Inc. Method, system and product for harmonic enhancement of encoded audio signals
SE512719C2 (sv) * 1997-06-10 2000-05-02 Lars Gustaf Liljeryd En metod och anordning för reduktion av dataflöde baserad på harmonisk bandbreddsexpansion
US6111844A (en) * 1997-07-03 2000-08-29 At&T Corp. Quality degradation through compression/decompression
US6266419B1 (en) * 1997-07-03 2001-07-24 At&T Corp. Custom character-coding compression for encoding and watermarking media content
DE19730129C2 (de) * 1997-07-14 2002-03-07 Fraunhofer Ges Forschung Verfahren zum Signalisieren einer Rauschsubstitution beim Codieren eines Audiosignals
DE19730130C2 (de) * 1997-07-14 2002-02-28 Fraunhofer Ges Forschung Verfahren zum Codieren eines Audiosignals
DE19840853B4 (de) * 1997-10-24 2004-12-09 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Verfahren und Vorrichtungen zum Codieren eines Audiosignals
US6091773A (en) * 1997-11-12 2000-07-18 Sydorenko; Mark R. Data compression method and apparatus
US6243424B1 (en) 1998-03-27 2001-06-05 Ibiguity Digital Corporation Method and apparatus for AM digital broadcasting
US20060265091A1 (en) * 1998-08-14 2006-11-23 Bruce Mihura Audio entertainment system for storing and playing audio information
CA2246532A1 (en) 1998-09-04 2000-03-04 Northern Telecom Limited Perceptual audio coding
US6122610A (en) * 1998-09-23 2000-09-19 Verance Corporation Noise suppression for low bitrate speech coder
JP2000165251A (ja) * 1998-11-27 2000-06-16 Matsushita Electric Ind Co Ltd オーディオ信号符号化装置及びそれを実現したマイクロホン
US6418404B1 (en) * 1998-12-28 2002-07-09 Sony Corporation System and method for effectively implementing fixed masking thresholds in an audio encoder device
SE9903553D0 (sv) 1999-01-27 1999-10-01 Lars Liljeryd Enhancing percepptual performance of SBR and related coding methods by adaptive noise addition (ANA) and noise substitution limiting (NSL)
US6480820B1 (en) 1999-09-20 2002-11-12 Advanced Cochlear Systems, Inc. Method of processing auditory data
DE19947877C2 (de) * 1999-10-05 2001-09-13 Fraunhofer Ges Forschung Verfahren und Vorrichtung zum Einbringen von Informationen in einen Datenstrom sowie Verfahren und Vorrichtung zum Codieren eines Audiosignals
US7215772B2 (en) 1999-11-09 2007-05-08 Chaoticom, Inc. Method and apparatus for remote digital key generation
US7286670B2 (en) * 1999-11-09 2007-10-23 Chaoticom, Inc. Method and apparatus for chaotic opportunistic lossless compression of data
US7215776B1 (en) 1999-11-09 2007-05-08 University Of New Hampshire Method and apparatus for the compression and decompression of audio files using a chaotic system
US6549544B1 (en) 1999-11-10 2003-04-15 Ibiquity Digital Corporation Method and apparatus for transmission and reception of FM in-band on-channel digital audio broadcasting
US6523147B1 (en) 1999-11-11 2003-02-18 Ibiquity Digital Corporation Method and apparatus for forward error correction coding for an AM in-band on-channel digital audio broadcasting system
US6499010B1 (en) * 2000-01-04 2002-12-24 Agere Systems Inc. Perceptual audio coder bit allocation scheme providing improved perceptual quality consistency
SE0001926D0 (sv) 2000-05-23 2000-05-23 Lars Liljeryd Improved spectral translation/folding in the subband domain
JP2005512108A (ja) * 2000-06-20 2005-04-28 ユニバーシティ オブ ニュー ハンプシャー カオスシステムを使用してオーディオファイルの圧縮及び解凍を行うための方法及び装置
US7110547B2 (en) * 2000-06-20 2006-09-19 University Of New Hampshire Method and apparatus for the compression and decompression of image files using a chaotic system
US7035873B2 (en) * 2001-08-20 2006-04-25 Microsoft Corporation System and methods for providing adaptive media property classification
US6963975B1 (en) * 2000-08-11 2005-11-08 Microsoft Corporation System and method for audio fingerprinting
US6732180B1 (en) 2000-08-08 2004-05-04 The University Of Tulsa Method to inhibit the identification and retrieval of proprietary media via automated search engines utilized in association with computer compatible communications network
EP1199711A1 (en) * 2000-10-20 2002-04-24 Telefonaktiebolaget Lm Ericsson Encoding of audio signal using bandwidth expansion
US7069208B2 (en) * 2001-01-24 2006-06-27 Nokia, Corp. System and method for concealment of data loss in digital audio transmission
US7447639B2 (en) 2001-01-24 2008-11-04 Nokia Corporation System and method for error concealment in digital audio transmission
US6915264B2 (en) 2001-02-22 2005-07-05 Lucent Technologies Inc. Cochlear filter bank structure for determining masked thresholds for use in perceptual audio coding
DE10134471C2 (de) * 2001-02-28 2003-05-22 Fraunhofer Ges Forschung Verfahren und Vorrichtung zum Charakterisieren eines Signals und Verfahren und Vorrichtung zum Erzeugen eines indexierten Signals
US7177803B2 (en) * 2001-10-22 2007-02-13 Motorola, Inc. Method and apparatus for enhancing loudness of an audio signal
US7240001B2 (en) 2001-12-14 2007-07-03 Microsoft Corporation Quality improvement techniques in an audio encoder
US20100042406A1 (en) * 2002-03-04 2010-02-18 James David Johnston Audio signal processing using improved perceptual model
GB2388502A (en) * 2002-05-10 2003-11-12 Chris Dunn Compression of frequency domain audio signals
US7333930B2 (en) 2003-03-14 2008-02-19 Agere Systems Inc. Tonal analysis for perceptual audio coding using a compressed spectral representation
US20040165734A1 (en) * 2003-03-20 2004-08-26 Bing Li Audio system for a vehicle
US6813661B2 (en) 2003-03-20 2004-11-02 Bing Li Portable audio system
US7724827B2 (en) * 2003-09-07 2010-05-25 Microsoft Corporation Multi-layer run level encoding and decoding
US7447317B2 (en) 2003-10-02 2008-11-04 Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V Compatible multi-channel coding/decoding by weighting the downmix channel
US7460990B2 (en) 2004-01-23 2008-12-02 Microsoft Corporation Efficient coding of digital media spectral data using wide-sense perceptual similarity
CA2554757A1 (en) * 2004-01-29 2005-08-11 Chaoticom, Inc. Systems and methods for providing digital content and caller alerts to wireless network-enabled devices
US7539870B2 (en) * 2004-02-10 2009-05-26 Microsoft Corporation Media watermarking by biasing randomized statistics
DE602005005640T2 (de) * 2004-03-01 2009-05-14 Dolby Laboratories Licensing Corp., San Francisco Mehrkanalige audiocodierung
US7505902B2 (en) * 2004-07-28 2009-03-17 University Of Maryland Discrimination of components of audio signals based on multiscale spectro-temporal modulations
US7676362B2 (en) * 2004-12-31 2010-03-09 Motorola, Inc. Method and apparatus for enhancing loudness of a speech signal
US8280730B2 (en) 2005-05-25 2012-10-02 Motorola Mobility Llc Method and apparatus of increasing speech intelligibility in noisy environments
JP4639966B2 (ja) * 2005-05-31 2011-02-23 ヤマハ株式会社 オーディオデータ圧縮方法およびオーディオデータ圧縮回路並びにオーディオデータ伸張回路
KR100718132B1 (ko) * 2005-06-24 2007-05-14 삼성전자주식회사 오디오 신호의 비트스트림 생성 방법 및 장치, 그를 이용한부호화/복호화 방법 및 장치
US7562021B2 (en) * 2005-07-15 2009-07-14 Microsoft Corporation Modification of codewords in dictionary used for efficient coding of digital media spectral data
US7630882B2 (en) * 2005-07-15 2009-12-08 Microsoft Corporation Frequency segmentation to obtain bands for efficient coding of digital media
US8599925B2 (en) * 2005-08-12 2013-12-03 Microsoft Corporation Efficient coding and decoding of transform blocks
US8090587B2 (en) * 2005-09-27 2012-01-03 Lg Electronics Inc. Method and apparatus for encoding/decoding multi-channel audio signal
CN101427307B (zh) * 2005-09-27 2012-03-07 Lg电子株式会社 编码/解码多声道音频信号的方法和装置
ES2296489B1 (es) * 2005-12-02 2009-04-01 Cesar Alonso Abad Metodo escalable de compresion de audio e imagenes.
KR101411900B1 (ko) * 2007-05-08 2014-06-26 삼성전자주식회사 오디오 신호의 부호화 및 복호화 방법 및 장치
US7774205B2 (en) * 2007-06-15 2010-08-10 Microsoft Corporation Coding of sparse digital media spectral data
US7761290B2 (en) 2007-06-15 2010-07-20 Microsoft Corporation Flexible frequency and time partitioning in perceptual transform coding of audio
US8990073B2 (en) * 2007-06-22 2015-03-24 Voiceage Corporation Method and device for sound activity detection and sound signal classification
US8046214B2 (en) * 2007-06-22 2011-10-25 Microsoft Corporation Low complexity decoder for complex transform coding of multi-channel sound
US7885819B2 (en) 2007-06-29 2011-02-08 Microsoft Corporation Bitstream syntax for multi-process audio decoding
US8412340B2 (en) * 2007-07-13 2013-04-02 Advanced Bionics, Llc Tonality-based optimization of sound sensation for a cochlear implant patient
US8249883B2 (en) 2007-10-26 2012-08-21 Microsoft Corporation Channel extension coding for multi-channel source
KR101454867B1 (ko) 2008-03-24 2014-10-28 삼성전자주식회사 오디오 신호 압축 방법 및 장치
KR101619972B1 (ko) 2008-10-02 2016-05-11 한국전자통신연구원 이산 여현 변환/이산 정현 변환을 선택적으로 이용하는 부호화/복호화 장치 및 방법
US8223985B2 (en) * 2009-04-22 2012-07-17 General Electric Company Masking of pure tones within sound from a noise generating source
US20100324915A1 (en) * 2009-06-23 2010-12-23 Electronic And Telecommunications Research Institute Encoding and decoding apparatuses for high quality multi-channel audio codec
US20110257978A1 (en) * 2009-10-23 2011-10-20 Brainlike, Inc. Time Series Filtering, Data Reduction and Voice Recognition in Communication Device
US8925024B2 (en) 2009-12-31 2014-12-30 The Nielsen Company (Us), Llc Methods and apparatus to detect commercial advertisements associated with media presentations
JP5732994B2 (ja) * 2011-04-19 2015-06-10 ソニー株式会社 楽曲検索装置および方法、プログラム、並びに記録媒体
EP2717263B1 (en) * 2012-10-05 2016-11-02 Nokia Technologies Oy Method, apparatus, and computer program product for categorical spatial analysis-synthesis on the spectrum of a multichannel audio signal
RU2660605C2 (ru) 2013-01-29 2018-07-06 Фраунхофер-Гезелльшафт Цур Фердерунг Дер Ангевандтен Форшунг Е.Ф. Концепция заполнения шумом
US9848222B2 (en) 2015-07-15 2017-12-19 The Nielsen Company (Us), Llc Methods and apparatus to detect spillover
US10043527B1 (en) 2015-07-17 2018-08-07 Digimarc Corporation Human auditory system modeling with masking energy adaptation

Family Cites Families (18)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US28488A (en) * 1860-05-29 Eataet-machiite
US28276A (en) * 1860-05-15 Bedstead-fastening
USRE28276E (en) 1963-06-06 1974-12-17 Milk fermenting product and method of making same
US3420742A (en) * 1964-10-16 1969-01-07 Dairy Technics Inc Milk fermenting product and method of making same
USRE28488E (en) 1973-11-19 1975-07-22 Milk fermenting product
JPS59129900A (ja) * 1983-01-18 1984-07-26 日本電信電話株式会社 帯域分割符号化方式
JPS6027459A (ja) * 1983-07-22 1985-02-12 Sumitomo Metal Ind Ltd 通電ロ−ル及び鋳片の溶損防止装置
JPS60159800A (ja) * 1984-01-30 1985-08-21 日本電気株式会社 適応予測変換符号化方式
CA1229681A (en) * 1984-03-06 1987-11-24 Kazunori Ozawa Method and apparatus for speech-band signal coding
DE3639753A1 (de) * 1986-11-21 1988-06-01 Inst Rundfunktechnik Gmbh Verfahren zum uebertragen digitalisierter tonsignale
JPH0833746B2 (ja) * 1987-02-17 1996-03-29 シャープ株式会社 音声・楽音の帯域分割符号化装置
JPH032559Y2 (ko) * 1987-03-11 1991-01-23
JPS63237100A (ja) * 1987-03-26 1988-10-03 沖電気工業株式会社 音声検出器
JPS63281200A (ja) * 1987-05-14 1988-11-17 沖電気工業株式会社 音声区間検出方式
JP2586043B2 (ja) * 1987-05-14 1997-02-26 日本電気株式会社 マルチパルス符号化装置
JPS6446880A (en) * 1987-08-17 1989-02-21 Fuji Xerox Co Ltd Image processor
US5341457A (en) * 1988-12-30 1994-08-23 At&T Bell Laboratories Perceptual coding of audio signals
US5285498A (en) * 1992-03-02 1994-02-08 At&T Bell Laboratories Method and apparatus for coding audio signals based on perceptual model

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US8560304B2 (en) 2007-04-30 2013-10-15 Samsung Electronics Co., Ltd. Method and apparatus for encoding and decoding high frequency band
KR101355376B1 (ko) * 2007-04-30 2014-01-23 삼성전자주식회사 고주파수 영역 부호화 및 복호화 방법 및 장치
USRE47824E1 (en) 2007-04-30 2020-01-21 Samsung Electronics Co., Ltd. Method and apparatus for encoding and decoding high frequency band

Also Published As

Publication number Publication date
US5040217A (en) 1991-08-13
EP0424016A3 (en) 1992-09-02
USRE36714E (en) 2000-05-23
DE69028675T2 (de) 1997-02-13
DE69028675D1 (de) 1996-10-31
CA2027136C (en) 2001-01-16
JP2756515B2 (ja) 1998-05-25
EP0424016A2 (en) 1991-04-24
JPH03144700A (ja) 1991-06-20
HK220296A (en) 1997-01-03
EP0424016B1 (en) 1996-09-25
CA2027136A1 (en) 1991-04-19
KR910008975A (ko) 1991-05-31

Similar Documents

Publication Publication Date Title
KR100209870B1 (ko) 오디오 신호의 순서화된 타임 시퀸스 처리 방법 및 오디오 신호 전송 방법
KR970007661B1 (ko) 스테레오포닉 오디오 신호의 입력세트 코딩방법
Pan Digital audio compression
US5341457A (en) Perceptual coding of audio signals
US5537510A (en) Adaptive digital audio encoding apparatus and a bit allocation method thereof
US5664056A (en) Digital encoder with dynamic quantization bit allocation
JP2923406B2 (ja) オーディオ信号処理方法
US5737718A (en) Method, apparatus and recording medium for a coder with a spectral-shape-adaptive subband configuration
KR100242864B1 (ko) 디지탈 신호 부호화 장치 및 방법
KR100310214B1 (ko) 신호인코딩또는디코딩장치와레코딩매체
US5699484A (en) Method and apparatus for applying linear prediction to critical band subbands of split-band perceptual coding systems
JP5175028B2 (ja) デジタル信号の符号化方法及び装置ならびに復号化方法及び装置
JP3153933B2 (ja) データ符号化装置及び方法並びにデータ復号化装置及び方法
KR100721499B1 (ko) 디지탈 신호 처리 장치 및 디지탈 신호 처리 방법
WO1995013660A1 (fr) Appareil de quantification, procede de quantification, codeur a haute efficacite, procede de codage a haute efficacite, decodeur, supports d'enregistrement et de codage a haute efficacite
US5754127A (en) Information encoding method and apparatus, and information decoding method and apparatus
KR0137472B1 (ko) 오디오 신호 코딩 방법
KR100556505B1 (ko) 재생 및 기록 장치, 디코딩 장치, 기록 장치, 재생 및 기록 방법, 디코딩 방법, 및 기록 방법
Johnson et al. Adaptive transform coding incorporating time domain aliasing cancellation
US5832426A (en) High efficiency audio encoding method and apparatus
US6647063B1 (en) Information encoding method and apparatus, information decoding method and apparatus and recording medium
US6765930B1 (en) Decoding apparatus and method, and providing medium
JPH08123488A (ja) 高能率符号化方法、高能率符号記録方法、高能率符号伝送方法、高能率符号化装置及び高能率符号復号化方法
Teh et al. Subband coding of high-fidelity quality audio signals at 128 kbps
KR100340368B1 (ko) 고능률부호화장치,복호화장치및디지털데이터도출방법

Legal Events

Date Code Title Description
A201 Request for examination
E902 Notification of reason for refusal
E701 Decision to grant or registration of patent right
GRNT Written decision to grant
G170 Re-publication after modification of scope of protection [patent]
FPAY Annual fee payment

Payment date: 20100413

Year of fee payment: 12

EXPY Expiration of term