PL173718B1 - Sposób i urządzenie do kodowania sygnałów cyfrowych - Google Patents

Sposób i urządzenie do kodowania sygnałów cyfrowych

Info

Publication number
PL173718B1
PL173718B1 PL94307740A PL30774094A PL173718B1 PL 173718 B1 PL173718 B1 PL 173718B1 PL 94307740 A PL94307740 A PL 94307740A PL 30774094 A PL30774094 A PL 30774094A PL 173718 B1 PL173718 B1 PL 173718B1
Authority
PL
Poland
Prior art keywords
signal
components
component
coding
circuit
Prior art date
Application number
PL94307740A
Other languages
English (en)
Other versions
PL307740A1 (en
Inventor
Kyoya Tsutsui
Mito Sonohara
Original Assignee
Sony Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Sony Corp filed Critical Sony Corp
Publication of PL307740A1 publication Critical patent/PL307740A1/xx
Publication of PL173718B1 publication Critical patent/PL173718B1/pl

Links

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04BTRANSMISSION
    • H04B14/00Transmission systems not characterised by the medium used for transmission
    • H04B14/02Transmission systems not characterised by the medium used for transmission characterised by the use of pulse modulation
    • H04B14/04Transmission systems not characterised by the medium used for transmission characterised by the use of pulse modulation using pulse code modulation
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/04Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
    • G10L19/06Determination or coding of the spectral characteristics, e.g. of the short-term prediction coefficients
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/002Dynamic bit allocation
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/012Comfort noise or silence coding
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/02Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
    • G10L19/0212Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders using orthogonal transformation
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/04Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
    • G10L19/16Vocoder architecture
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04BTRANSMISSION
    • H04B1/00Details of transmission systems, not covered by a single one of groups H04B3/00 - H04B13/00; Details of transmission systems not characterised by the medium used for transmission
    • H04B1/66Details of transmission systems, not covered by a single one of groups H04B3/00 - H04B13/00; Details of transmission systems not characterised by the medium used for transmission for reducing bandwidth of signals; for improving efficiency of transmission
    • H04B1/667Details of transmission systems, not covered by a single one of groups H04B3/00 - H04B13/00; Details of transmission systems not characterised by the medium used for transmission for reducing bandwidth of signals; for improving efficiency of transmission using a division in frequency subbands
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L25/00Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
    • G10L25/03Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 characterised by the type of extracted parameters
    • G10L25/18Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 characterised by the type of extracted parameters the extracted parameters being spectral information of each sub-band

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Signal Processing (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Computational Linguistics (AREA)
  • Acoustics & Sound (AREA)
  • Multimedia (AREA)
  • Spectroscopy & Molecular Physics (AREA)
  • Computer Networks & Wireless Communication (AREA)
  • Compression, Expansion, Code Conversion, And Decoders (AREA)
  • Signal Processing For Digital Recording And Reproducing (AREA)

Abstract

1. Sposób kodowania sygnalów cyfro- wych, zwlaszcza do kodowania sygnalu wejsciowego, który poddaje sie transforma- cji na skladowe czestotliwosciowe, zna- mienny tym, ze rozdziela sie skladowe czestotliwosciowe na dwa sygnaly, z któ- rych pierwszy sygnal zawiera skladowe cha- rakterystyki dzwieku, a drugi sygnal zawie- ra pozostale skladowe, stanowiace sklado- we charakterystyki szumu, nastepnie prze- prowadza sie kodowanie ze zmienna dlu- goscia kodu pierwszego sygnalu i przepro- wadza sie kodowanie drugiego sygnalu. FIG.1 ( 5 4 ) Sposób i urzadzenie do kodowania sygnalów cyfrowych PL PL

Description

Przedmiotem wynalazku jest sposób i urządzenie do kodowania sygnałów cyfrowych, zwłaszcza do wydajnego kodowania informacji takich jak wejściowe dane cyfrowe, przy czym zakodowany sygnał podlega następnie transmisji.
Istnieją różne wydajne techniki kodowania sygnałów akustycznych lub sygnałów mowy. Jednym przykładem jest kodowanie z podziałem pasma (Sub Band Coding - SBC), które jest nie blokującym podziału pasma częstotliwości systemem dla dzielenia sygnału akustycznego w dziedzinie czasu na składowe sygnału w wielu pasmach częstotliwości w każdej założonej jednostce czasu, bez zaimplementowania blokowania dla ich zakodowania. Innym przykładem jest kodowanie transformacyjne, które jest systemem blokującym podział pasma częstotliwości, dzielącym sygnał w dziedzinie czasu na bloki w każdej założonej jednostce czasu dla przetransformowania odpowiednich sygnałów na odpowiednie bloki w dziedzinie częstotliwości (transformacja widmowa), dzieląc w ten sposób sygnały przetransformowane, na składowe sygnału w licznych pasmach częstotliwości dla zakodowania ich w każdym odpowiednim paśmie częstotliwości. Ponadto, znany jest również sposób wydajnego kodowania, w którym kodowanie dzielonego pasma i kodowanie transformacyjne są łączone. W tym przypadku, sygnał w dziedzinie czasu jest dzielony na sygnały w licznych pasmach przez wspomniane kodowanie podzielonego pasma, a następnie wykonywana jest transformacja widmowa sygnałów wszystkich pasm na sygnały w dziedzinie częstotliwości dla zrealizowania kodowania przetransformowanych widmowych sygnałów każdego pasma.
Jako filtr stosowany do podziału pasma w sposobie kodowania dzielonego pasma lub w sposobie łączonego kodowania, stosowany jest tzw. filtr QMF. Taki filtr jest opisany na przykład w publikacji R.E. Crochiere’a pt. Digital coding of speech in subbands (Cyfrowe kodowanie mowy w podpasmach), Bell Syst. Tech. J. Vol. 55, nr 8 1976.
Ponadto, sposób filtracyjnego dzielenia na pasma o jednakowej szerokości został opisany np. w publikacji ICASSP 83 BOSTON, pt. Polyphase Quadrature filters - A new subband coding technique (Wielofazowe filtry kwadraturowe - Nowy sposób kodowania podpasm), Jospeph H. Rothweiler.
Ponadto, wspomniana transformacja widmowa może być realizowana jako transformacja dzieląca wejściowy sygnał akustyczny na bloki w każdej założonej chwili czasu (ramce) w celu wykonania dyskretnej transformacji Fouriera DFT, dyskretnej transformacji kosinusowej DCT lub zmodyfikowanej transformacji kosinusowej MDCT, na każdym odpowiednim bloku, przez co przekształca się sygnały z dziedziny czasu na sygnały w dziedzinie częstotliwości. Wspomniana zmodyfikowana dyskretna transformacja kosinusowa MDCT jest opisana w publikacji ICASP 1987, pt. Subband/Transform Coding Using Filter Bank Designs Based on Time Domain Aliasing Cancellation, J.P. Princen A.B. Bradley Univ. of Surrey Royal Melbourne Inst, of Tech.
Dzięki kwantyzacji sygnałów każdego z oddzielnych pasm przez filtrową lub widmową transformację w taki sposób, możliwe jest kontrolowanie pasm, w których mają miejsce szumy oraz wykonywanie wydajniejszego kodowania pod względem zmysłu słuchu, poprzez za4
173 718 stosowanie maskowań. Ponadto, w przypadku, gdy realizuje się podejście polegające na wykonywaniu normalizacji, dla każdego odpowiedniego pasma, na przykład przez maksymalną wartość bezwzględnych wartości składowych sygnału w odpowiednich pasmach, przed zastosowaniem kwantyzacji, możliwe jest dalsze zwiększenie wydajności kodowania.
Ponadto, jako sposób wykonywania podziału pasma częstotliwości przez dzielenie szerokości pasma w celu kwantyzacji odpowiednich składowych oddzielnych pasm częstotliwości, wykorzystuje się podział pasma, w którym np. brana jest pod uwagę charakterystyka słuchu człowieka. Mianowicie, istnieją przypadki, gdy sygnał akustyczny jest dzielony na składowe w licznych (np. 25) pasmach w taki sposób, że szerokość pasm rośnie wraz z przesuwaniem się w stronę większych częstotliwości. W takim przypadku, wykonywane jest kodowanie przez określony przydział bitów dla każdego pasma lub kodowanie przez elastyczny przydział bitów dla każdego pasma. Na przykład, kodowanie współczynnika danej uzyskanego po przetworzeniu w operacji zmodyfikowanej dyskretnej transformacji kosinusowej MDCT jest wykonywane przez elastyczny przydział bitów w zależności od współczynnika zmodyfikowanej dyskretnej transformacji kosinusowej MDCT danej dla każdego odpowiedniego pasma, uzyskanego z przetwarzania metodą zmodyfikowanej dyskretnej transformacji kosinusowej MDCT każdego odpowiedniego bloku.
Jako techniki przydziału bitów znane są dwie metody. Jedna z nich przedstawiona jest w publikacji IEEE Transactions of Acoustics, Speech and Signal Processing, vol. ASSP-25, nr 4, sierpień 1977. Przydział bitów jest wykonywany na podstawie wielkości sygnałów każdego odpowiedniego pasma. Zgodnie z tym, widmo skwantowanego szumu staje się płaskie, a energia szumu minimalna. Jednakże, jeśli nie wykonuje się maskowania pod względem słyszalności, poziom szumu nie jest optymalny. Ponadto, w publikacji ICASSP 1980, pt. The criticlal band coder - digital encoding of perceptual requirements of auditory system M.A. Kransner MIT, opisany jest drugi sposób, w którym wykorzystuje się maskowanie charakterystyką słyszalności w celu uzyskania odpowiednich stosunków sygnał-szum dla każdego odpowiedniego pasma w celu wykonania stałego przydziału bitów. Jednakże, zgodnie z tym sposobem, jeśli przydział bitów jest ustalony, nawet jeśli mierzona jest charakterystyka wejściowej fali sinusoidalnej, wartości charakterystyki nie mogą osiągnąć tak dobrych wielkości.
W europejskim zgłoszeniu patentowym nr 0525809A2, opublikowanym dnia 03 02 93, w biuletynie 93/05, zaproponowano wydajne urządzenie kodujące, w którym wszystkie bity używane do przydziału są rozdzielane w postaci stałego wzoru przydziału bitów wyznaczonego wcześniej dla każdego odpowiedniego małego bloku oraz w postaci bitów do wykonywania przydziału bitów w zależności od wielkości sygnałów odpowiednich bloków w celu umożliwienia, by ich stosunek zależał od wejściowego sygnału tak, ze stosunek tych bitów do bitów stałego wzoru przydziału staje się większy wraz z tym, jak widmo sygnału staje się bardziej wyrównane.
Zgodnie z tym sposobem, w przypadku, gdy energia koncentruje się przy pojedynczej składowej widma tak jak w przypadku fali sinusoidalnej, większa liczba bitów jest przydzielana do bloku zawierającego tę składową widma, przez co uzyskuje się możliwość wyraźnej poprawy całej charakterystyki sygnał-szum. Ponieważ charakterystyka słuchu człowieka jest szczególnie czuła na sygnały posiadające ostrą składową widma, poprawa charakterystyki sygnał-szum przez zastosowanie tej metody nie tylko wykazuje poprawę w cyfrowej wartości pomiaru, lecz również wydatnie poprawia jakość dźwięku z punktu widzenia charakterystyki słuchu.
Znanych jest wiele sposobów poza wspomnianym sposobem przydziału bitów. Jeśli model odnoszący się do charakterystyki słuchu jest precyzyjniejszy i zwiększone są możliwości urządzenia kodującego, może być wykonywane wydajniejsze kodowanie z punktu widzenia charakterystyki słuchu.
Szum zawarty w sygnale akustycznym charakterystyki dźwięku, której energia składowych koncentruje się na określonych częstotliwościach, jest z reguły bardziej słyszalny w porównaniu z szumem w sygnale akustycznym, w którym energia jest równomiernie rozmieszczona w szerokim paśmie częstotliwości, przez co stanowi dużą przeszkodę w słuchaniu. Po173 718 nadto, jeśli składowe widmowe posiadające dużą energię, tzn. składowe charakterystyki dźwięku, nie są kwantowane z wystarczająco dobrą dokładnością, w przypadku gdy te składowe widmowe są ponownie przekształcane na sygnały falowe w dziedzinie czasu dla połączenia ich w bloki przed lub po tym przekształceniu, zniekształcenia pomiędzy blokami stają się duże i występują w połączeniu, gdy syntetyzowane są sygnały falowe sąsiednich bloków czasowych, co oczywiście znacznie przeszkadza prawidłowej słyszalności. Z tego powodu, przy kodowaniu składowych charakterystyki dźwięku, kwantyzacja musi być wykonywana z wystarczająco dużą liczbą bitów. Jednak w przypadku, gdy dokładności kwantyzacji są wyznaczane dla każdego założonego pasma częstotliwości, konieczny jest przydział w jednostkach kodujących wielu bitów dla dużej liczby składowych pasma, w których skład wchodzą składowe charakterystyki dźwięku, dla przeprowadzenia kwantyzacji, wynikiem czego jest niska wydajność kodowania. W związku z tym, poprawa wydajności kodowania bez pogarszania jakości dźwięku, w szczególności jeśli chodzi o sygnały akustyczne, jest trudna do wykonania tradycyjnymi sposobami.
Sposób według wynalazku jest stosowany do kodowania sygnałów cyfrowych, zwłaszcza do kodowania sygnału wejściowego, który poddaje się transformacji na składowe częstotliwościowe. Sposób ten charakteryzuje się tym, że rozdziela się składowe częstotliwościowe na dwa sygnały, z których pierwszy sygnał zawiera składowe charakterystyki dźwięku, a drugi sygnał zawiera pozostałe składowe, stanowiące składowe charakterystyki szumu. Następnie przeprowadza się kodowanie ze zmienną długością kodu pierwszego sygnału i przeprowadza się kodowanie drugiego sygnału.
Korzystnym jest, że informacje o amplitudzie pierwszego sygnału normalizuje się z zastosowaniem współczynników normalizacji, a następnie stosuje się kodowanie ze zmienną długością kodu. Pierwszy sygnał poddaje się kodowaniu ze zmienną długością kodu na podstawie reguł transformacji. Regułę transformacji wybiera się w zależności od względnego położenia w dziedzinie częstotliwości maksymalnej składowej częstotliwościowej składowych pierwszego sygnału i pozostałych składowych częstotliwościowych.
Korzystnym jest, że dla maksymalnej składowej częstotliwościowej stosuje się regułę transformacji, która jest przystosowana do wykonywania przekształcenia na krótsze kody w przypadku informacji o większej amplitudzie. Do poszczególnych składowych częstotliwościowych z wyjątkiem maksymalnej składowej częstotliwościowej, stosuje się regułę transformacji, która jest przystosowana do przydzielania krótszych kodów informacjom o mniejszych wartościach amplitudy. Jako sygnał wejściowy stosuje się sygnał akustyczny.
W odmiennym rozwiązaniu sposób kodowania sygnałów cyfrowych według wynalazku charakteryzuje się tym, że rozdziela się składowe częstotliwościowe przekształconego sygnału wejściowego na dwa sygnały, z których pierwszy sygnał zawiera składowe charakterystyki dźwięku, a drugi sygnał zawiera pozostałe składowe, stanowiące składowe charakterystyki szumu. Informację o amplitudzie poszczególnych składowych charakterystyki dźwięku pierwszego sygnału normalizuje się z zastosowaniem współczynników normalizacji, a znormalizowaną informację o amplitudzie poddaje się kwantyzacji dla ich zakodowania. Następnie poddaje się zakodowaniu drugi sygnał, przy czym w etapie kodowania pierwszego sygnału wydziela się, w postaci zakodowanej, sygnał pozostający w zależności od składowych częstotliwościowych, z wyjątkiem składowej o maksymalnej częstotliwości w porównaniu ze składowymi charakterystyki dźwięku.
Korzystnym jest, że w etapie rozdzielania wielokrotnie wydziela się składowe częstotliwościowe nachodzące na siebie w dziedzinie częstotliwości. Współczynniki normalizacji ustala się tak, że ze zmniejszeniem ich wartości wzrasta dokładność. Jako sygnał wejściowy stosuje się sygnał akustyczny.
Urządzenie według wynalazku jest przeznaczone do kodowania sygnałów cyfrowych i jest zaopatrzone w układ transformacji sygnału wejściowego na składowe częstotliwościowe, układ kodowania tych składowych oraz generator sekwencji kodu. Urządzenie tego rodzaju charakteryzuje się tym, ze do wyjścia układu transformacji jest dołączony układ rozdzielania składowych sygnału, który jednym swym wyjściem jest połączony z układem kodowania
173 718 składowych charakterystyki dźwięku połączonym, poprzez układ kodowania ze zmienną długością kodu, z układem generatora sekwencji kodu. Drugie wyjście układu rozdzielania składowych sygnału jest połączone z układem kodowania składowych charakterystyki szumu, który jest dołączony do układu generatora sekwencji kodu, którego wyjście, poprzez koder wykrywania i korygowania błędów, układ modulacji danych EFM oraz głowicę zapisu, jest połączony z nośnikiem zapisu danych.
Korzystnym jest, że układ rozdzielania składowych sygnału jest dołączony do wyjścia układu transformacji poprzez zespół przełączników połączonych z układem sterowania przełączników i sumatorem, który poprzez lokalny dekoder, jest połączony z wyjściem układu kodowania składowych charakterystyki dźwięku.
Zgodnie z wynalazkiem, opracowano urządzenie do kodowania sygnałów, które poprawia wydajność kodowania bez pogorszenia jakości dźwięku sygnału akustycznego odtwarzanego z nośnika zapisu.
W przypadku kodowania sygnału wejściowego podzielonego na oddzielne składowe sygnału, a więc składowe charakterystyki dźwięku, dla których energia koncentruje się dla określonych specyficznych częstotliwości oraz pozostałe składowe, czyli składowe z wyjątkiem składowych charakterystyki dźwięku, dla których energia jest równomiernie rozmieszczona w szerokim paśmie częstotliwości, kodowanie o zmiennej długości kodu jest wykonywane w sposób wydajny dla sygnałów składowych charakterystyki dźwięku, przez co realizuje się bardziej efektywne kodowanie. Ponadto, dla współczynników widmowych o maksymalnej wartości bezwzględnej kodowana jest jedynie wartość dodatnia lub ujemna, przez co realizuje się bardziej wydajne kodowanie.
Przedmiot wynalazku w przykładach wykonania jest odtworzony na rysunku, na którym fig. 1 przedstawia schemat blokowy urządzenia do kodowania według wynalazku, fig. 2 schemat blokowy urządzenia do dekodowania sygnału zakodowanego w urządzeniu z fig. 1, fig. 3 - sieć działań ilustrującą sposób przetwarzania sygnałów w układzie oddzielania składowych sygnału, fig. 4 - wykres widmowy wyjaśniający wydzielanie składowych charakterystyki dźwięku, fig. 5 - wykres przedstawiający składowe charakterystyki szumu, w którym składowe charakterystyki dźwięku są usunięte z pierwotnego widma sygnału przy kodowaniu sygnału, fig. 6 - wykres przydziału widma sygnału, fig. 7 - wykres widmowy sygnału będącego różnicą sygnału widmowego z fig. 6 i sygnału uzyskanego po zakodowaniu i zdekodowaniu jednej składowej charakterystyki dźwięku, fig. 8 - wykres wyjaśniający regułę transformacji widma skłądowych charakterystyki dźwięku, fig. 9 - schemat blokowy układu do kodowania charakterystyki dźwięku, fig. 10 - schemat blokowy układu do dekodowania charakterystyki dźwięku, fig. 11 - schemat wyjaśniający zapis sekwencji kodu uzyskanej na wyjściu systemu kodowania sygnału, fig. 12 - schemat blokowy znanego układu do kodowania sygnałów, fig. 13 - schemat blokowy znanego układu transformacji, fig. 14 - schemat blokowy znanego układu do kodowania składowej sygnału, fig. 15 - schemat blokowy znanego urządzenia do dekodowania, fig. 16 - schemat blokowy znanego układu transformacji odwrotnej, fig. 17 wykres widmowy wyjaśniający znany sposób kodowania, fig. 18 - schemat blokowy drugiego przykładu zespołu syntezy i odwrotnej transformacji, według wynalazku, fig. 19 - schemat blokowy drugiego przykładu wykonania urządzenia do kodowania według wynalazku, fig. 20A - tabelę kodów pokazującą zasadę transformacji względem maksymalnego współczynnika widmowego, a fig. 20B przedstawia tabelę kodów pokazującą zasadę transformacji brzegowych współczynników widmowych w przypadku, gdy ta sama reguła transformacji została zastosowana do wszystkich składowych brzegowych.
Na figurze 1 przedstawiony jest schemat blokowy urządzenia do kodowania sygnałów cyfrowych według wynalazku. Do zacisku wejściowego 600 jest doprowadzony sygnał w postaci fali akustycznej. Ta fala akustyczna jest transformowana na składowe częstotliwościowe sygnału w układzie transformacji 601, a sygnał wynikowy jest przesyłany do układu oddzielania składowych sygnału 602.
W układzie oddzielania składowych sygnału 602 składowe częstotliwościowe sygnału otrzymane z układu transformacji 601 są dzielone na składowe charakterystyki dźwięku
173 718 posiadające ostry rozkład widma oraz pozostałe składowe sygnału, tzn. składowe charakterystyki szumu, posiadające płaski rozkład widma. Składowe charakterystyki dźwięku są kodowane w układzie kodowania składowych charakterystyki dźwięku 603, a składowe charakterystyki szumu, które są pozostałymi składowymi charakterystyki sygnału, są kodowane przez układ kodowania składowych charakterystyki szumu 604. Sygnał wyprowadzony z układu kodowania składowych charakterystyki dźwięku 603 jest kodowany w układzie kodowania ze zmienną długością kodu 610. Sygnały wyjściowe z układu kodowania ze zmienną długością kodu 610 oraz z układu kodowania składowych charakterystyki szumu 604 są wprowadzane do układu generatora sekwencji kodu 605. Wygenerowana sekwencja kodu jest odprowadzana z tego układu. Koder wykrywania i korygowania błędów ECC 606 dodaje kod korekcji błędów do sekwencji kodu z układu generatora sekwencji kodu 605. Sygnał wyjściowy z kodera wykrywania i korygowania błędów ECC 606 jest modulowany w układzie modulacji danych EFM 607. Tak uzyskany zmodulowany sygnał jest doprowadzony do głowicy zapisu 608, za pomocą której zapisuje się na dysk 609 sekwencję kodu wyprowadzoną z układu modulacji danych EFM 607.
Jako układ transformacji 601 korzystnie stosuje się wiele znanych układów transformacji. Na przykład, sygnał wejściowy może być bezpośrednio transformowany na sygnał widmowy przez zmodyfikowaną dyskretną transformację kosinusowąMDCT, ale również dyskretna transformacja Fouriera DFT lub dyskretna transformacja kosinusowa DCT, mogą być zastosowane do przetwarzania widmowego, zamiast transformacji MDCT.
Ponadto, gdy sygnał może być podzielony na składowe częstotliwości przez filtr dzielący pasmo, jak juz opisano, oraz jeśli kodowanie jest efektywnie wykonywane w szczególności w przypadku, gdy energia koncentruje się dla określonych lub szczególnych częstotliwości, korzystne jest zastosowanie sposobu transformacji na składowe częstotliwości poprzez opisanąjuż transformację widmową, która wymaga względnie małej ilości operacji.
Ponadto, układ kodowania składowych charakterystyki dźwięku 603 i układ kodowania składowych charakterystyki szumów 604 mogą być korzystnie zrealizowane w konfiguracji pokazanej na fig. 14.
Na figurze 2 przedstawiono schemat blokowy urządzenia do dekodowania sygnałów zakodowanych w urządzeniu z fig. 1. Sekwencja kodu odtworzona z dysku 609 za pomocą głowicy odczytu 708 jest dostarczona do układu demodulacji danych EFM 709. W układzie demodulacji danych EFM 709 przeprowadzana jest demodulacja wejściowej sekwencji kodu. Zdemodulowana sekwencja kodu zostaje dostarczona do dekodera wykrywania i korygowania błędów ECC 710, w którym dokonywana jest korekcja błędów. Układ rozkładu sekwencji kodu 701 rozpoznaje, na podstawie informacji o składowej charakterystyki dźwięku ze skorygowanej sekwencji kodu, która część kodu należy do składowej charakterystyki dźwięku, dla podzielenia wejściowej sekwencji kodu na kody składowych charakterystyki dźwięku i kody składowych charakterystyki szumu. Ponadto, układ rozkładu sekwencji kodu 701 wydziela informację dotyczącą składowej charakterystyki dźwięku z wejściowej sekwencji kodu i wysyła ją do bloku syntezy 704. Kody składowych charakterystyki dźwięku poddane są dekodowaniu ze zmienną długością kodu w układzie dekodera ze zmienną długością kodu 715 i są wysyłane do układu dekodowania składowych charakterystyki dźwięku 702, a kody składowych charakterystyki szumu są wysyłane do układu dekodowania składowych charakterystyki szumu 703, w których to układach, odpowiednio, wykonywana jest odwrotna kwantyzacja i normalizacja, a odpowiednie składowe zostają zdekodowane. Następnie, zdekodowane sygnały z układu dekodowania składowych charakterystyki dźwięku 702 i z układu dekodowania składowych charakterystyki szumu 703 są przesyłane do wykonania syntezy odpowiadającej dzieleniu sygnału w układzie oddzielania składowych sygnału 602 z fig. 1.
W bloku syntezy 704 dodaje się zdekodowany sygnał składowej charakterystyki dźwięku do założonej pozycji zdekodowanej składowej charakterystyki szumu na podstawie informacji o pozycji składowej charakterystyki dźwięku dostarczonej z układu rozkładu sekwencji kodu 701, przez co wykonuje się syntezę w dziedzinie częstotliwości składowej charakterystyki szumu i składowej charakterystyki dźwięku. Następnie, tak zsyntezowany zdekodowany
173 718 sygnał przechodzi przez blok odwrotnej transformacji 705, wykonujący odwrotną transformację do wykonywanej przez układ transformacji 601 z fig. 1, tak że sygnał z dziedziny częstotliwości odzyskuje swą pierwotną postać w dziedzinie czasu. Wyjściowy sygnał w postaci fali powstający na wyjściu bloku odwrotnej transformacji 705 jest wyprowadzony na zacisk wyjściowy 707. Należy zaznaczyć, że kolejność wykonywania odwrotnej transformacji i syntezy może być odwrotna. W takim przypadku, układ syntezy i odwrotnej transformacji 711 z fig. 2 jest skonstruowany tak, jak pokazano na fig. 18. Blok odwrotnej transformacji 712 będący częścią układu odwrotnej transformacji i syntezy 711 wykonuje odwrotną transformację składowej charakterystyki szumu w dziedzinie częstotliwości pochodzącej z układu dekodowania składowej charakterystyki szumu 703, na sygnał w dziedzinie częstotliwości. Blok odwrotnej transformacji 713 umieszcza zdekodowany sygnał składowej charakterystyki dźwięku z układu dekodującego składowe charakterystyki dźwięku 702 w położeniu w dziedzinie częstotliwości wskazanej przez informację położenia dotyczącą składowej charakterystyki dźwięku pobranej z układu rozkładu sekwencji kodowej 701, dla wykonania odwrotnej transformacji i wygenerowania w dziedzinie czasu sygnału składowej charakterystyki dźwięku. Blok syntezy 714 w dziedzinie czasu łączy sygnał składowych charakterystyki szumu z bloku transformacji odwrotnej 712 i sygnał składowych charakterystyki dźwięku z bloku odwrotnej transformacji 713, przez co powstaje pierwotny sygnał w postaci fali.
Dla bloków odwrotnej transformacji 705, 712, 713 może być zastosowana konfiguracja podobna do konfiguracji z fig. 16.
Na figurze 3 przedstawiono przebieg procesu oddzielania składowych charakterystyki dźwięku w układzie oddzielania składowych sygnału 602 urządzenia kodującego z fig. 1. Na fig. 3, współczynnik I oznacza numery sygnałów widmowych, współczynnik N oznacza całkowitą ilość sygnałów widmowych, a współczynniki P i R oznaczają założone współczynniki. Składowa charakterystyki dźwięku jest wyznaczana na podstawie następujących prawidłowości. W przypadku, gdy wartość bezwzględna określonego widmowego sygnału jest większa niż innych składowych charakterystyki w sąsiedztwie, różnica pomiędzy wartością bezwzględną i wartością maksymalną spośród wartości sygnałów widmowych w odpowiednim przedziale czasu (blok w transformacji widmowej) ma założoną wartość lub jest większa, natomiast suma składowej widmowej i sąsiadujących z nią składowych widmowych (np. sąsiednie składowe w obu kierunkach) wskazuje wartość założonego współczynnika lub większą dotyczącego energii w założonym paśmie zawierającym te składowe widmowe, ten sygnał widmowy i sygnały widmowe sąsiadujące z nim w obydwu kierunkach, są uważane za składowe charakterystyki dźwięku. Należy zauważyć, że jako założone pasmo do porównywania stosunku dystrybucji energii, może być zastosowane pasmo takie, że jego szerokość jest wąska dla małych częstotliwości, natomiast jest szeroka dla dużych częstotliwości, biorąc pod uwagę krytyczne wartości szerokości pasma związane z granicami słyszalności.
Zgodnie z fig. 3, na początku procesu, w kroku SI, pod zmienną A0 podstawiana jest maksymalna bezwzględna wartość widmowa. W kroku S2, numer widmowego sygnału I jest ustawiany na 1. W kroku S3, określona bezwzględna wartość widmowa w określonym przedziale czasu jest podstawiana pod zmienną A.
W kroku S4 rozstrzygane jest, czy bezwzględna wartość widmowa jest maksymalną wartością widmową większą niż wszystkie inne lokalnie widoczne składowe. W rezultacie, jeśli to nie jest maksymalna wartość widmowa (NIE), proces przechodzi do kroku S10. W przeciwnym przypadku, gdy jest to maksymalna wartość widmowa (TAK), proces przechodzi do kroku S5.
W kroku S5, porównywany jest stosunek zmiennej A przechowującej bezwzględną wartość widmową w odpowiadającym przedziale czasu zawierającym maksymalną bezwzględną wartość widmową do zmiennej A0 przechowującej maksymalną bezwzględną wartość widmową ze współczynnikiem P określającym założoną wielkość (A/A0 > P). W efekcie, jeśli A/A0 jest większe niż P (TAK), proces przechodzi do kroku S6. W przeciwnym przypadku (NIE), proces przechodzi do operacji S10.
173 718
W kroku S6, wartość energii sąsiadujących widm (np. suma energii widmowych składowych widmowych sąsiadujących z odpowiednią składową widma w obydwu kierunkach) ze składową o rozpatrywanej widmowej wartości bezwzględnej (maksymalnej), jest podstawiana pod zmienną X. W następnym kroku S7, wartość energii w założonym paśmie zawierającym maksymalną bezwzględną wartość widmową i sąsiadujące z nią składowe widma, są podstawione pod zmienną Y.
W następnym kroku S8, stosunek pomiędzy X oznaczającą wartość energii i Y oznaczającą wartość energii w założonym paśmie, jest porównywany z założonym współczynnikiem R (X/Y > R). W efekcie, jeśli X/Y jest większe niż R (TAK), proces przechodzi do kroku S9. W przeciwnym przypadku (NIE), proces przechodzi do kroku SIO.
W kroku S9, w przypadku, gdy energia maksymalna w widmie o maksymalnej wartości i sąsiadujących z nim składowych widmowych wskazuje wielkość większą lub równą założonej wartości odnoszącej się do energii w założonym paśmie zawierającym te składniki widmowe, sygnał o maksymalnej bezwzględnej wartości składowej widmowej i sygnały składowych widmowych, są traktowane jako składowa charakterystyki dźwięku, którą trzeba zarejestrować.
W następnym kroku SIO, rozstrzygane jest, czy numer I sygnału widmowego zarejestrowanego w kroku S9 i całkowita ilość N wszystkich sygnałów widmowych są sobie równe (I=N). W rezultacie, w przypadku gdy są one równe (TAK), proces jest zakończony. W przeciwnym przypadku (NlE), proces przechodzi do kroku S11. W tym kroku inkrementuje się I w celu zwiększenia o jeden numer sygnału widmowego. Następnie, proces powraca do kroku S3 i powyżej opisane operacje są powtarzane. Układ oddzielania składowych sygnału 602 dostarcza składową lub składowe częstotliwościowe, które zostały uznane za składowe charakterystyki dźwięku przez opisany proces, do układu kodowania charakterystyki dźwięku 603 oraz dostarcza inne składowe częstotliwościowe, takie jak składowe charakterystyki szumu, do układu kodowania składowej charakterystyki szumu 6θ4. Ponadto, układ oddzielania składowych sygnału 602 dostarcza numer informacji o częstotliwości, która została uznana za składową charakterystyki dźwięku oraz informację o jej położeniu, do układu generatora sekwencji kodu 605.
Na figurze 4 przedstawiono wykres widmowy w określonym stanie, w którym składowe charakterystyki dźwięku są oddzielane od innych składowych częstotliwości w sposób juz opisany. W przykładzie pokazanym na fig. 4, wybrane zostały cztery składowe charakterystyki dźwięku oznaczone przez TCa, TCb, TCc, TCD. Gdy te składowe charakterystyki dźwięku są rozmieszczone w taki sposób, że koncentrują się na małej liczbie sygnałów widmowych, tak jak na fig. 4, nawet jeśli te składowe są kwantowane z dobrą dokładnością, nie wymaga się tak dużej liczby bitów, jaka jest oferowana. Z tego powodu, gdy składowe charakterystyki dźwięku są następnie normalizowane po to, by kwantować znormalizowane składowe poprawiając przez to sprawność kodowania, jeśli sygnały widmowe składające się na dźwięk są względnie nieliczne, proces normalizacji i/lub rekwantyzacji może zostać pominięty w celu uproszczenia urządzenia.
Na figurze 5 przedstawiono wykres widmowy, w którym przedstawione są składowe charakterystyki szumu, z usuniętymi składowymi charakterystyki dźwięku z pierwotnego sygnału widmowego. Jak pokazano na fig. 5, składowe charakterystyki dźwięku zostały usunięte (wyzerowane) z pierwotnego sygnału widmowego w odpowiednich pasmach b1 b5. W tym przypadku, współczynniki normalizacji w odpowiednich jednostkach kodujących otrzymują małą wartość. W związku z tym, kwantowanie generowanych szumów może być zredukowane do małej ilości bitów.
Chociaż opisano podejście polegające na oddzielaniu składowych charakterystyki dźwięku dla umożliwienia wyzerowania składowych charakterystyki dźwięku i składowych sygnału z nimi sąsiadujących, przez co uzyskuje się możliwość efektywnego kodowania, można również stosować sposób kodowania składowych sygnału otrzymanych poprzez odjęcie sygnału uzyskanego z zakodowania składowych charakterystyki dźwięku późniejszego ich zdekodowania, od pierwotnego sygnału widmowego.
173 718
Urządzenie do kodowania sygnałów według tej metody zostanie opisane z nawiązaniem do fig. 19. Te same numery odnośników dotyczą zasadniczo tych samych zespołów, jak na fig. 1, a ich objaśnienie zostało pominięte.
Sygnał widmowy z wyjścia układu transformacji 601 jest doprowadzony do układu wydzielania składowej charakterystyki dźwięku 802 przez przełącznik 801 sterowany za pomocą układu sterującego 808. Układ wydzielania składowej charakterystyki dźwięku 802 wyznacza składową charakterystyki dźwięku w sposób już opisany w nawiązaniu do fig. 3, dla dostarczania jedynie wyróżnionej składowej charakterystyki dźwięku do układu kodującego składową charakterystyki dźwięku 603. Następnie, układ wydzielania składowej charakterystyki dźwięku 802 wyprowadza informację o ilości składowych charakterystyki dźwięku oraz informację o środku jej położenia, do układu generatora sekwencji kodu 605. Układ kodowania składowej charakterystyki dźwięku 603 wykonuje normalizację i kwantyzację na wejściowej składowej charakterystyki dźwięku, wysyłając znormalizowaną i skwantowaną składową charakterystyki dźwięku do układu kodowania ze zmienną długością kodu 610 i do lokalnego dekodera 804. Układ kodowania 610 wykonuje kodowanie ze zmienną długością kodu na znormalizowanej i skwantowanej składowej charakterystyki dźwięku i dostarcza uzyskany kod o zmiennej długości do zespołu generatora sekwencji kodowej 605. Lokalny dekoder 804 wykonuje odwrotną kwantyzację i denormalizację skwantowanej i znormalizowanej składowej charakterystyki dźwięku, dekodując sygnał do postaci pierwotnej składowej charakterystyki dźwięku.
Należy zauważyć, że skwantowany szum jest zawarty, w tym momencie, w zdekodowanym sygnale. Sygnał wyjściowy z lokalnego dekodera 804 jest doprowadzany do sumatora 805, jako pierwszy skwantowany sygnał. Poza tym, pierwotny sygnał widmowy z układu transformacji 601 jest doprowadzony do sumatora 805 przez przełącznik 806 sterowany za pomocą układu sterującego 808. Sumator 805 odejmuje pierwszy zdekodowany sygnał od pierwotnego sygnału widmowego, wyprowadzając sygnał pierwszej różnicy. W przypadku, gdy sekwencja procesu wydzielania, kodowania, dekodowania i wyznaczania różnicy składowej charakterystyki dźwięku, została wykonana pierwszy raz w czasie procesu, wspomniany sygnał pierwszej różnicy jest doprowadzony jako składowa charakterystyki szumu do układu kodowania składowej charakterystyki szumu 604 przez przełącznik 807, sterowany przez układ sterujący przełącznikami 808. Następnie, sekwencja procesu wydobywania, kodowania, dekodowania, wyznaczania różnicy składowej charakterystyki dźwięku jest powtarzana, sygnał pierwszej różnicy jest doprowadzany do układu wydzielania składowej charakterystyki dźwięku 802 przez przełącznik 801. Układ wydzielania składowej charakterystyki dźwięku 802, układ kodowania składowej charakterystyki dźwięku 603, lokalny dekoder 804, wykonująproces taki sam jak poprzednio.
Dzięki temu, drugi zdekodowany sygnał jest dostarczony do sumatora 805. Poza tym, sygnał pierwszej różnicy jest doprowadzony do sumatora 805 przez przełącznik 806. Sumator 805 odejmuje drugi zdekodowany sygnał od pierwszego sygnału różnicy, wyprowadzając drugi sygnał różnicy. Następnie, gdy sekwencja kodowania, dekodowania, wyznaczania różnicy składowej charakterystyki dźwięku została wykonana drugi raz w czasie procesu, sygnał drugiej różnicy jest doprowadzony do układu kodowania składowej charakterystyki szumu 604 przez przełącznik 807, jako składowa charakterystyki szumu. W przypadku, gdy sekwencja procesu wydobywania, kodowania, dekodowania, wyznaczania różnicy składowej charakterystyki dźwięku jest dalej powtarzana, przetwarzanie identyczne z opisanym jest wykonywane przez układ wydzielania składowej charakterystyki dźwięku 802, układ kodowania składowej charakterystyki dźwięku 603, lokalny dekoder 804 i sumator 805. Układ sterujący przełącznikami 808 przechowuje wartość progową mówiącą o ilości składowych charakterystyki dźwięku oraz steruje przełącznikiem 807 w taki sposób, że sekwencja procesu wydzielania, kodowania, dekodowania i wyznaczania różnicy jest zakończona w przypadku, gdy liczba informacyjna składowej charakterystyki dźwięku uzyskanej z układu wydobywania składowej charakterystyki dźwięku jest większa od założonej wartości progowej. Ponadto, w układzie kodowania składowej charakterystyki dźwięku 603, może być zrealizowany sposób polegają173 718 cy na tym, że gdy wydzielanie jest zakończone, kończona jest sekwencja procesu wydzielania, kodowania, dekodowania i wyznaczania różnicy składowej charakterystyki dźwięku.
Na figurach 6 i 7 przedstawiono wyjaśnienie opisanego sposobu, przy czym na fig. 7 pokazano sygnał widmowy, w którym sygnał uzyskany po kodowaniu określonej składowej charakterystyki dźwięku, a następnie zakodowany, został odjęty od sygnału widmowego z fig. 6. Ponadto, składowe narysowane przerywanymi liniami są składowymi wybranymi z sygnału widmowego z fig. 7, a składającymi się na składową charakterystyki dźwięku, co sprawia, że poprawia się dokładność kodowania sygnału widmowego. Przy powtarzaniu tej operacji, możliwe jest wykonywanie kodowania z dużą dokładnością. W przypadku zastosowania tej metody, nawet jeśli maksymalna ilość bitów przeznaczonych do kwantyzacji składowej charakterystyki dźwięku nie jest duża, dokładność kodowania jest wystarczająco duża. Zgodnie z tym, zaletą tego rozwiązania jest, że można zredukować ilość bitów niezbędnych do zapisania kwantyzacji. Ponadto, metoda wydzielania składowych charakterystyki dźwięku w sposób wieloetapowy może być stosowana nie tylko w przypadku, gdy sygnał odpowiadający sygnałowi po zakodowaniu składowej charakterystyki dźwięku i następnie zdekodowaniu, jest odejmowany od pierwotnego sygnału widmowego, lecz również w przypadku, gdy sygnał widmowy wydzielonej składowej charakterystyki dźwięku jest zerowany.
Jeśli w przedstawionym przykładzie urządzenia do kodowania pierwotny sygnał w postaci falowej jest rozkładany na składowe charakterystyki dźwięku i składowe charakterystyki szumu, które następnie są kodowane, przez co wykonuje się bardziej wydajne kodowanie, sposób opisany poniżej jest zastosowany w połączeniu z kodowaniem składowych charakterystyki dźwięku, przez co możliwe jest wykonywanie bardziej efektywnego kodowania.
Dla odpowiednich składowych charakterystyki dźwięku, energia koncentruje się na współczynniku widmowym, gdzie wartość bezwzględna jest największa, który jest nazywany maksymalnym współczynnikiem widmowym i brzegowych współczynnikach, które są nazywane brzegowymi współczynnikami widmowymi. W takim przypadku, nie występuje żadne odchylenie w dystrybucji wartości, gdy odpowiednie współczynniki są kwantowane, a stan (sposób) dystrybucji maksymalnego współczynnika widmowego i brzegowych współczynników widmowych znacznie różnią się od siebie, w zależności od względnego położenia w dziedzinie częstotliwości. Jeśli współczynniki widmowe składające się na odpowiednie składowe charakterystyki dźwięku są normalizowane poprzez współczynnik normalizacji wyznaczony przez maksymalny współczynnik widmowy, tzn. odpowiednie współczynniki widmowe składające się na składowe charakterystyki dźwięku są dzielone przez maksymalny współczynnik widmowy, to maksymalny współczynnik widmowy po kwantyzacji stanie się prawie równy 1 lub -1. W przeciwieństwie, jeśli składowe charakterystyki dźwięku mają charakterystykę, zgodnie z którą, współczynniki widmowe gwałtownie maleją, a maksymalny współczynnik widmowy znajduje się w ich środku, brzegowe współczynniki po kwantyzacji rozmieszczone przy wyższych częstotliwościach mają wartość bliską zeru.
W przypadku jeśli nie występują dysproporcje w rozłożeniu wartości, które mają być kodowane, wykorzystany jest znany, tzw. kod o zmiennej długości do wykonania kodu o mniejszej średnicy długości słowa, dzięki czemu możliwe jest wykonywanie efektywnego kodowania.
Biorąc to pod uwagę, w przykładzie wykonania urządzenia do kodowania sygnałów, odpowiednie składowe charakterystyki dźwięku są dzielone na maksymalny współczynnik widmowy i brzegowe współczynniki widmowe, dla zastosowania różnych kodów o zmiennej długości do odpowiednich współczynników widmowych, przez co realizuje się efektywne kodowanie.
Należy zauważyć, że gdy składowe charakterystyki dźwięku mają ostrą dystrybucję widma w dziedzinie częstotliwości, dystrybucja wartości w przypadku, gdy widmowe współczynniki brzegowe są normalizowane i kwantowane, silnie zależy od względnego położenia w dziedzinie częstotliwości wspomnianych brzegowych współczynników widmowych i maksymalnego współczynnika widmowego. Biorąc to pod uwagę, pożądane jest realizowanie podejścia polegającego na dalszej klasyfikacji (podziale) brzegowych współczynników widmo12
173 718 wych na kilka zbiorów (grup) w zależności od względnego położenia w dziedzinie częstotliwości względem maksymalnego współczynnika widmowego, dla przetransformowania ich zgodnie z regułami transformacji na kody o zmiennej długości dla każdego oddzielnego zbioru (grupy).
Jako metodę klasyfikacji względnego położenia korzystnie stosuje się metodę wykonywania klasyfikacji ze względu na bezwzględne wartości różnic w dziedzinie częstotliwości względem maksymalnych współczynników widmowych.
Zgodnie z widmem składowych charakterystyki dźwięku pokazanym na fig. 8, trzy reguły transformacji, tzn. reguła transformacji dotycząca maksymalnego współczynnika widmowego ECc, reguła transformacji dotycząca brzegowych współczynników widmowych ECb i ECd oraz reguła dotycząca brzegowych współczynników widmowych ECa i ECe, są zastosowane do wykonania przetworzenia na kody o zmiennej długości. Oczywiście, kodowanie ze zmienną długością może być wykonywane według tej samej reguły transformacji dla wszystkich brzegowych współczynników widmowych, dla uproszczenia całego procesu.
Przykład tablicy kodów prezentujący regułę transformacji względem maksymalnego współczynnika widmowego jest przedstawiony na fig. 20A. Przykład tablicy kodów prezentujący regułę brzegowych współczynników widmowych w przypadku, gdzie ta sama reguła jest użyta dla wszystkich brzegowych współczynników widmowych, jest przedstawiony na fig. 20B.
Maksymalny współczynnik widmowy po normalizacji i kwantyzacji, tzn. skwantowana maksymalna wartość widmowa, jest równy lub bliski 1 lub -1, jak już wspomniano. Jak pokazano na fig. 20A, skoro 00 i 01, które są kodami o długościach mniejszych niż długości kodów dla innych wartości, możliwe jest wydajne zakodowanie maksymalnego współczynnika widmowego.
Brzegowe współczynniki widmowe po normalizacji i kwantyzacji, tzn. skwantowane wartości brzegowych składowych widmowych stają się równe lub bliskie 0, tak jak to już opisano. Dzięki temu, jak przedstawiono na fig. 20B, gdy dla 0, które ma kod krótszy niż kody dla innych wartości, jest przypisane 0 (zero), wówczas możliwe jest efektywne zakodowanie brzegowych współczynników widmowych.
Jeśli są dostarczone liczne tablice kodów względem maksymalnego współczynnika widmowego i liczne tablice kodów względem brzegowych współczynników widmowych, można uzyskać dowolną dokładność kwantyzacji wyznaczaną w układzie 603 do kodowania składowej charakterystyki dźwięku, przy wybraniu odpowiedniej tablicy kodów w zależności od założonej dokładności kwantyzacji, przez co można wykonywać wydajniejsze kodowanie.
Na figurze 9 przedstawiono przykład układu do kodowania ze zmienną długością kodu 610, który mieści się w urządzeniu z fig. 1. W układzie z fig. 9, składowe charakterystyki dźwięku doprowadzone do zacisku 800 są klasyfikowane (rozdzielane) ze względu na położenie w dziedzinie częstotliwości względem maksymalnej składowej widma, przez układ sterujący 801. Tak sklasyfikowane składowe widma są, odpowiednio, wysyłane do układu kodowania maksymalnego współczynnika widmowego 802, układu kodowania brzegowego współczynnika widmowego 803 i układu kodowania brzegowego współczynnika kodowego 804. W tych odpowiednich układach wspomniane składowe widma są kodowane w dziedzinie częstotliwości według wspomnianych już reguł transformacji. Zakodowane sygnały wyjściowe z odpowiednich układów kodujących 802, 803, 804 są wyprowadzane z zacisku wyjściowego 805 układu sterującego 801.
Na figurze 10 przedstawiono przykład układu dekodowania ze zmienną długością kodu 715, który mieści się w urządzeniu z fig. 2. W układzie z fig. 10, kody składowych charakterystyki dźwięku wprowadzone przez zacisk wejściowy 900, są klasyfikowane w sposób odpowiadający klasyfikacji przeprowadzonej w układzie z fig. 9. Tak sklasyfikowane kody są wysyłane, odpowiednio, do układu dekodowania maksymalnego współczynnika widmowego 902, do układu dekodowania brzegowego współczynnika widmowego 903 i do układu dekodowania brzegowego współczynnika kodowego widmowego 904. W tych układach, wspomniane kody są dekodowane według reguł odwrotnej transformacji, odpowiadających re173 718 gułom już opisanej transformacji. Zdekodowane sygnały wyjściowe z wyjść odpowiednich układów dekodujących 902, 903, 904, są odprowadzane poprzez zacisk wyjściowy 905 układu sterującego 901.
Na figurze 11 przedstawiono przykład, w którym sygnał widmowy, z fig. 4, jest kodowany za pomocą urządzenia do kodowania zgodnie z opisanym przykładem wykonania. Tak uzyskane sekwencje kodu są zapisywane na nośniku zapisu. W tym przykładzie wykonania, informacja o składowej charakterystyki dźwięku nr ten (np. ten = 4 w przykładzie z fig. 11) jest najpierw zapisywana na nośnik. Następnie, informacje o składowej charakterystyki dźwięku tCA, tcs, tcc, tcD oraz składowe charakterystyki szumu ncb nc2, nc3, nc4, nc5, zostają zapisane we wspomnianej kolejności. W informacji o składowej charakterystyki dźwięku tcA, tcs, tcc, tco, informacja o położeniu środkowym CP wskazująca pozycję środka widma składowej charakterystyki dźwięku (np. 15 w przypadku, np., składowej charakterystyki dźwięku tcB), informacja o dokładności kwantyzacji wskazująca ilość bitów dla kwantyzacji (np. 6 w przypadku, np., składowej charakterystyki dźwięku tcs) oraz informacja o współczynniku normalizacji, są zapisywane wraz z odpowiednimi informacjami o składowych sygnału SCa, SCb, SCc, SCd, SCe, które zostały poddane normalizacji i kwantyzacji oraz następnie zostały zakodowane kodem o zmiennej długości. W tym przypadku, reguły transformacji kodów o zmiennej długości są założone zgodnie z żądaną dokładnością kwantyzacji. Urządzenie do dekodowania przeprowadza dekodowanie kodu o zmiennej długości zgodnie z informacją o dokładności kwantyzacji.
Na przykład w przypadku, gdy dokładność kwantyzacji jest ściśle zalezna od częstotliwości, zbędne jest zapisywanie informacji o dokładności. Należy zaznaczyć, ze jeśli pozycja składowej środka widma odpowiedniej składowej charakterystyki dźwięku jest używana jako pozycja informacji o składowych charakterystyki dźwięku w opisanym juz przykładzie wykonania, może być zapisywana pozycja składowej widma o najniższej częstotliwości (np. 14, w przypadku składowej charakterystyki dźwięku TCb).
Ponadto, w odniesieniu do informacji o składowej charakterystyce szumu, informacja o dokładności kwantyzacji (np. 2 w przypadku składowej charakterystyki szumu nc) oraz informacja o współczynniku normalizacji, są zapisywane wraz ze znormalizowanymi odpowiednimi informacjami o składowych SCb SC2,..., SC3.
W przypadku, gdy informacja o dokładności kwantyzacji wynosi zero, kodowanie dla danego przypadku nie jest wykonywane w układzie kodowania. W przypadku, gdy dokładność kodowania jest ściśle wyznaczona dla każdego pasma, podobnie jak powyżej, nie jest konieczne zapisywanie informacji o dokładności kwantyzacji.
Na figurze 11 przedstawiono przykład objaśniający rodzaj i porządek informacji rejestrowanych na nośniku zapisu. Na przykład, informacja dotycząca informacji o składowych sygnału SCa, SCb, SCc, SCd, SCe, jest zakodowana kodami o zmiennej długości.
Przedstawione urządzenie do kodowania sygnałów ma zdolność dostarczania informacji o amplitudzie, dotyczącej maksymalnego współczynnika widmowego odpowiedniej składowej charakterystyki dźwięku, jedynie za pomocą informacji o współczynniku normalizacji, umożliwiając przez to wykonywanie bardziej wydajnego kodowania. Układ kodowania składowej charakterystyki dźwięku 603 wykonuje normalizację i kwantyzację, dla składowych częstotliwości, jedynie dla maksymalnego współczynnika widmowego odpowiednich składowych charakterystyki dźwięku. Należy zauważyć, że można zastosować strukturę układu, w której normalizacja i kwantyzacja są wykonywane dla wszystkich odpowiednich składowych charakterystyki dźwięku, również dla tych zawierających maksimum widmowe, w układzie kodowania składowej charakterystyki dźwięku, a skwantowana wartość odpowiadająca maksimum widma nie jest umieszczona w sekwencji kodu generowanego w następnym etapie przez układ 605. W przypadku, gdy wykonywane jest takie kodowanie, informacja o składowej sygnału SCc zawiera kody wskazujące jedynie wartość dodatnią lub ujemną, jak w przykładzie z fig. 11.
Gdy wartość zbliżona do informacji o amplitudzie maksimum widmowego jest wybrana jako współczynnik normalizacji, w przypadku, gdy współczynniki normalizacji są zapisywane
173 718 na nośnik, możliwe jest uzyskanie przybliżonych wartości informacji o amplitudzie maksimów widmowych z tych współczynników normalizacji. Na przykład, w przypadku, gdy informacja widmowa jest wykonywana przez zmodyfikowaną dyskretną transformację kosinusową MDCT lub dyskretną transformację kosinusową DCT, przybliżona wartość maksimum widmowego może być uzyskana z kodów wskazujących wartość dodatnią i ujemną oraz informację o współczynniku normalizacji. Ponadto, na przykład, w przypadku, gdy informacja widmowa jest realizowana przez dyskretną transformację Fouriera DFT, przybliżona wartość maksimum widmowego może być odzyskana jedynie ze składowej fazowej. Dzięki temu można pominąć zapisywanie informacji uzyskanej przez skwantowanie informacji o amplitudzie dla odpowiedniego maksimum widmowego. Ta metoda jest szczególnie efektywna w przypadkach, gdy normalizacja może być wykonywana z dużą dokładnością.
W takim przypadku, gdy dokładność współczynnika normalizacji jest niewystarczająca w urządzeniu do kodowania sygnałów, może zaistnieć przypadek, że dokładność maksymalnego współczynnika widmowego nie będzie wystarczająco zapewniona. Jednakże, zastosowanie sposobu, w którym wykorzystuje się konfigurację urządzenia, przedstawionego na fig. 19, do wydzielania składowych charakterystyki dźwięku, umożliwia usunięcie wspomnianego problemu. Jak pokazano na fig. 6 i 7, zgodnie z niniejszym sposobem, istnieje duże prawdopodobieństwo, ze składowe częstotliwości nachodzące na siebie, w dziedzinie częstotliwości, są wydzielane wielokrotnie, jako składowe charakterystyki dźwięku. W takim przypadku, pożądane jest wykonanie nieliniowego ustalenia dla wykonywania ustalania dla każdego założonego przedziału, np. poprzez wykorzystanie skali logarytmicznej, aby zgodnie ze zmniejszaniem wartości współczynnika normalizacji, rosła dokładność.
Jeśli liczne składowe częstotliwościowe podlegają syntezie w urządzeniu do dekodowania, nawet w przypadku, gdy dokładność jakiegoś współczynnika normalizacji nie jest wystarczająca, możliwe jest zapewnienie określonego stopnia dokładności. Ponadto, chociaż opisano głównie przykład, w którym sygnał akustyczny jest kodowany przez urządzenie kodujące według przykładu wykonania wynalazku, kodowanie według wynalazku może być wykonywane dla dowolnych sygnałów w postaci fali. Należy zaznaczyć, że kodowanie w tym wynalazku jest szczególnie wydajne w przypadku sygnałów akustycznych, w których składowe charakterystyki dźwięku mają podstawowe znaczenie dla zmysłu słuchu.
Ponadto, dysk 609 z opisanego przykładu wykonania może być, np., nośnikiem magnetooptycznym, optycznym lub typem nośnika optycznego ze zmienną fazą. Ponadto, półprzewodnik lub karta identyfikacyjna, mogą być zastosowane oprócz nośnika taśmowego, jako nośnik zastępujący dysk 609.
Ponadto, chociaż opisano przypadek, w którym tylko składowe charakterystyki dźwięku koduje się kodem ze zmienną długością, składowe charakterystyki szumu mogą być również kodowanie kodem ze zmienną długością.
Na figurze 12 przedstawione zostało znane urządzenie do kodowania, którego zasada stosowana jest w rozwiązaniu według wynalazku. W urządzeniu tym, sygnał w postaci fali akustycznej doprowadzony jest do zacisku wejściowego 100 i zostaje przekształcany na składowe częstotliwościowe sygnału w układzie transformacji 101. Następnie, odpowiednie składowe są kodowane w układzie kodowania składowej sygnału 102. Układ generatora sekwencji kodu 103 generuje sekwencję kodu i odprowadza ją przez zacisk wyjściowy 104.
Znany układ transformacji 101 z fig. 12 jest pokazany na fig. 13. Jak przedstawiono na fig. 13, sygnał doprowadzony przez zacisk 200 (zacisk 100 z fig. 12) jest dzielony na sygnały w trzech pasmach częstotliwości przez dwa stopnie filtrów rozdzielania 201, 202. W pierwszym filtrze rozdzielania 201, sygnał z zacisku 200 jest obcinany o połowę. W drugim filtrze podziału pasma 202, jeden ze zmniejszonych sygnałów przez filtr podziału pasma 201 jest ponownie obcinany o połowę i stanowi 1/4 sygnału wejściowego. Szerokość pasm dwóch sygnałów wyjściowych filtru podziału pasma 202 stanowią 1/4 szerokości pasma sygnału doprowadzanego do zacisku 200.
Sygnały odpowiednich trzech pasm podzielonych przez filtry 201, 202 stają się składowymi sygnału widmowego po przejściu przez układy transformacji 203, 204, 205, korzystnie
173 718 wykonujące zmodyfikowaną dyskretną transformację kosinusową MDCT. Wyjścia tych układów transformacji 203, 204, 205 są dołączone do układu kodowania składowej sygnału 102 z fig. 12.
Znana konfiguracja układu kodowania składowej sygnału 102 z fig. 12 jest pokazana na fig. 14. Jak przedstawiono na fig. 14, sygnał pojawiający się na wejściu układu kodowania składowej sygnału 102 doprowadzony jest do zacisku 300 i przechodzi normalizację dla każdego założonego pasma w układzie normalizacji 301 i jest przesyłany do układu kwantyzacji 303. Ponadto, sygnał doprowadzony do zacisku 300 jest również przesyłany do układu wyznaczania dokładności kwantyzacji 302.
W układzie kwantyzacji 303 stosuje się kwantyzację sygnału z układu normalizacji 301 na podstawie wyliczonej dokładności kwantyzacji pochodzącej z układu wyznaczania dokładności kwantyzacji 302. Sygnał wyjściowy układu kwantyzacji 303 jest odprowadzony z zacisku 304 i jest przesłany do układu generatora sekwencji kodu 103 z fig. 12. W wyjściowym sygnale na zacisku 304 zawarta jest informacja o współczynniku normalizacji z układu normalizacji 301 i informacja o dokładności kwantyzacji z układu wyznaczania dokładności kwantyzacji 302 oraz skwantowane składowe sygnału z układu kwantyzacji 303.
Konfiguracja znanego urządzenia do dekodowania, przystosowanego do dekodowania akustycznych sygnałów z sekwencji kodów generowanych przez urządzenie do kodowania o strukturze z fig. 12 i wyprowadzania zdekodowanego sygnału, jest pokazany na fig. 15. Kody odpowiednich składowych sygnału są wydzielone przez układ rozkładu sekwencji kodu 401 wygenerowanej przez układ o konfiguracji takiej jak na fig. 12, który to kod jest doprowadzany do zacisku 400. Odpowiednie składowe sygnału są odtwarzane (rekonstruowane) przez układ dekodowania składowej sygnału 402 z tych kodów. Następnie, w układzie odwrotnej transformacji 403 stosuje się odwrotną transformację odpowiadającą transformacji wykonanej w układzie transformacji 101 z fig. 12. W ten sposób uzyskuje się sygnał akustyczny. Ten falowy sygnał akustyczny jest odprowadzony poprzez zacisk wyjściowy 404.
Znana konfiguracja układu odwrotnej transformacji 403 z fig. 15 jest pokazana na fig. 16. Układ ten odpowiada przykładowi konfiguracji układu transformacji z fig. 13. Sygnały doprowadzone z układu dekodowania składowej sygnału 402 przez zaciski 501, 502, 503 są przetwarzane przez układy odwrotnej transformacji 504, 505, 506 wykonujące odwrotną transformację widma odpowiadającą transformacji widma układu z fig. 13. Sygnały odpowiednich pasm uzyskane z tych układów odwrotnej transformacji 504, 505, 506 są łączone w dwóch stopniach filtrów syntezy pasm 507, 508.
Wyjścia układów odwrotnej transformacji 505 i 506 są dołączone do filtru syntezy pasm 507, w którym są łączone. Następnie, wyjście filtru syntezy pasm 507 i wyjście układu odwrotnej transformacji 504 są dołączone do drugiego filtru syntezy pasm 508. Sygnał wyjściowy drugiego filtru syntezy pasm 508 jest odprowadzony z zacisku 509 (zacisk 404 z fig. 15).
Na figurze 17 wyjaśniono sposób kodowania przeprowadzanego w urządzeniu do kodowania pokazanym na fig. 12. W przykładzie z fig. 17, sygnał widmowy jest sygnałem uzyskanym z układu transformacji z fig. 13. Na figurze 17 przedstawiono, w decybelach, poziomy bezwzględnych wartości sygnałów widmowych (składowe sygnału) przetwarzanych za pomocą zmodyfikowanej dyskretnej transformacji kosinusowej MDCT.
Na figurze 17, sygnał wejściowy jest przekształcony na 64 sygnały widmowe w każdym założonym bloku czasowym. Te sygnały widmowe są połączone w grupy, określane jako jednostki kodowania, odpowiadające pięciu założonym pasmom bt-bs, jak zaznaczono na fig. 17 oraz przechodzą normalizację i kwantyzację. W tym przykładzie, szerokości pasm odpowiednich jednostek kodowania są węższe dla pasm o mniejszych częstotliwościach i szersze dla pasm o większych częstotliwościach po to, by kontrolować występowanie kwantyzacji szumu w odniesieniu do własności charakterystyki słyszalności.
Jednakże w opisanym sposobie pasma, w których składowe częstotliwości są kwantowane, są ustalone. Z tego powodu, jeśli np. składowe widma koncentrują się w obszarze w okolicy pewnych konkretnych częstotliwości, jeśli próbuje się kwantować te składowe
173 718 widma z wystarczającą dokładnością, trzeba przydzielić wiele bitów dia dużej liczby pozostałych składowych widma z wystarczającą dokładnością, trzeba przydzielić wiele bitów dla dużej liczby pozostałych składowych widma przynależących do tego samego pasma, co te składowe widma.
Jak wynika z fig. 17, gdy normalizacja jest wykonywana w przypadku, gdy sygnały są łączone w założone pasma, wartości współczynnika normalizacji są normalizowane na podstawie ogólnego współczynnika normalizacji wyznaczanego przez składową charakterystyki dźwięku, np. w paśmie częstotliwości b3, gdzie składowa charakterystyki dźwięku jest zawarta w sygnale.
Zgodnie z przedstawionym opisem, w urządzeniu do kodowania sygnałów, po przetransformowaniu sygnału wejściowego na składowe częstotliwości dla wydzielenia przetransformowanego sygnału wyjściowego jako pierwszego sygnału składającego się ze składowych charakterystyki dźwięku oraz jako drugiego sygnału składającego się z innych składowych, odpowiednie sygnały składowe pierwszego sygnału są kodowane kodem o zmiennej długości, przez co możliwe jest wysoce wydajne kodowanie składowych charakterystyki dźwięku sygnału rozłożonego na składowe charakterystyki szumu i składowe charakterystyki dźwięku. Przez to, poprawia się wydajność kodowania dla całego sygnału falowego. Jeśli tak skompresowane sygnały są zapisywane na nośniku, pojemność zapisu zostaje znacznie zwiększona. W dodatku, gdy sygnały uzyskane z odtwarzania takiego nośnika są dekodowane, można uzyskać np. sygnały akustyczne.
FIG.1
FIG.2
173 718
C START )
T
FIG.3
173 718
TCB
POZIOM -- POZIOM
FJG.4
| b1 | b2 | b3 I b4 | b5
CZĘSTOTLr
FIG.5
173 718
POZIOM —- POZIOM
FIG.6
I b1 | b2 |b3_I_b4|b5
CZĘSTOTL. —FIG.7
FIG.8
173 718 ,610
I----------------------------j
FIG.9 ,715
FIG.10
FIG.12
FIG.13
- -Γ301 303
FIG.14
173 718
INF.O SKŁADOWEJ CHARAKT. DŹWIĘKU nr ten = 4
INF.O SKŁADOWEJ CHARAKT. DŹWIĘKU
A /
INF.O SKŁADOWEJ CHARAKT. DŹWIĘKU _tCB
INF.O SKŁADO- 's
WEJ CHARAKT.
DŹWIĘKU , te
INF.O SKŁADOWEJ CHARAKT. DŹWIĘKU
D
SKŁADOWA CHARAKTERYSTYKI SZUMU _
SKŁADOWA CHA- \ RAKTERYSTYKI SZUMU nC2
SKŁADOWA CHARAKTERYSTYKI
SZUMU „ nCj
SKŁADOWA CHARAKTERYSTYKI SZUMU nC4
z / / INF. 0 POŁOŻENIU ŚRODKOWYM CP = 15
/ / / s INF. 0 DOKŁADNOŚCI KWANTYZACJI = fi
s / / INF. o, WSPÓŁCZ. NORMALIZACJI
INF. 0 SKŁADOWEJ SYGNAŁU SCa
INF. 0 SKŁADOWEJ SYGNAŁU scb
X INF. 0 SKŁADOWEJ SYGNAŁU SCc
X X X INF. 0 SKŁADOWEJ SYGNAŁU Sed
X X X INF. 0 SKŁADOWEJ SYGNAŁU SCe
INF. 0 DOKŁADNOŚCI KWANTYZACJI = 2
INF. 0 WSPÓŁCZ. NORMALIZACJI
\ \ \ \ INF. 0 SKŁADOWEJ SYGNAŁU SC-j-
\ \ \ \ INF. 0 SKŁADOWEJ SYGNAŁU SC?
\ \ \ \ \ \ \ 1
INF. 0 SKŁADOWEJ SYGNAŁU SCg
SKŁADOWA CHARAKTERYSTYKI SZUMU nC5
FIG.11
173 718
FIG.15
FIG.16
cząSToTL. -FIG.17
7II
FIG.18
173 718
FIG.19
173 718
KWANTO- WARTOŚĆ KOD
+ 1 00
+ 2/3 100
+ 1/3 110
+ 0 1111
-1/3 1110
-2/3 101
-1 01
FIG.20A
KWANTO- WAĆ WARTOŚĆ KOD
+ 1 1110
+ 2/3 1100
+ 1/3 100
+ 0 0
-1/3 101
-2/3 1101
-1 1111
FIG.20B
Departament Wydawnictw UP RP. Nakład 90 egz
Cena 4,00 zł

Claims (13)

  1. Zastrzeżenia patentowe
    1. Sposób kodowania sygnałów cyfrowych, zwłaszcza do kodowania sygnału wejściowego, który poddaje się transformacji na składowe częstotliwościowe, znamienny tym, że rozdziela się składowe częstotliwościowe na dwa sygnały, z których pierwszy sygnał zawiera składowe charakterystyki dźwięku, a drugi sygnał zawiera pozostałe składowe, stanowiące składowe charakterystyki szumu, następnie przeprowadza się kodowanie ze zmienną długością kodu pierwszego sygnału i przeprowadza się kodowanie drugiego sygnału.
  2. 2. Sposób według zastrz. 1, znamienny tym, że informacje o amplitudzie pierwszego sygnału normalizuje się z zastosowaniem współczynników normalizacji, a następnie stosuje się kodowanie ze zmienną długością kodu.
  3. 3. Sposób według zastrz. 2, znamienny tym, że pierwszy sygnał poddaje się kodowaniu ze zmienną długością kodu na podstawie reguł transformacji.
  4. 4. Sposób według zastrz. 3, znamienny tym, że regułę transformacji wybiera się w zależności od względnego położenia w dziedzinie częstotliwości maksymalnej składowej częstotliwościowej składowych pierwszego sygnału i pozostałych składowych częstotliwościowych.
  5. 5. Sposób według zastrz. 3, znamienny tym, że dla maksymalnej składowej częstotliwościowej stosuje się regułę transformacji, która jest przystosowana do wykonywania przekształcenia na krótsze kody w przypadku informacji o większej amplitudzie.
  6. 6. Sposób według zastrz. 3, znamienny tym, że do poszczególnych składowych częstotliwościowych z wyjątkiem maksymalnej składowej częstotliwościowej, stosuje się regułę transformacji, która jest przystosowana do przydzielania krótszych kodów informacjom o mniejszych wartościach amplitudy.
  7. 7 Sposób według zastrz. 1, znamienny tym, ze jako sygnał wejściowy stosuje się sygnał akustyczny.
  8. 8. Sposób kodowania sygnałów cyfrowych, zwłaszcza do kodowania sygnału wejściowego, który poddaje się transformacji na składowe częstotliwościowe, znamienny tym, ze rozdziela się składowe częstotliwościowe przekształconego sygnału wejściowego na dwa sygnały, z których pierwszy sygnał zawiera składowe charakterystyki dźwięku, a drugi sygnał zawiera pozostałe składowe, stanowiące składowe charakterystyki szumu, informację o amplitudzie poszczególnych składowych charakterystyki dźwięku pierwszego sygnału normalizuje się z zastosowaniem współczynników normalizacji, a znormalizowaną informację o amplitudzie poddaje się kwantyzacji dla ich zakodowania, następnie poddaje się zakodowaniu drugi sygnał, przy czym w etapie kodowania pierwszego sygnału wydziela się, w postaci zakodowanej, sygnał pozostający w zależności od składowych częstotliwościowych, z wyjątkiem składowej o maksymalnej częstotliwości w porównaniu ze składowymi charakterystyki dźwięku.
  9. 9. Sposób według zastrz. 8, znamienny tym, że w etapie rozdzielania wielokrotnie wydziela się składowe częstotliwościowe nachodzące na siebie w dziedzinie częstotliwości.
  10. 10. Sposób według zastrz. 8, znamienny tym, że współczynniki normalizacji ustala się tak, ze ze zmniejszaniem ich wartości wzrasta dokładność.
  11. 11. Sposób według zastrz. 8, znamienny tym, że jako sygnał wejściowy stosuje się sygnał akustyczny.
  12. 12. Urządzenie do kodowania sygnałów cyfrowych, zaopatrzone w układ transformacji sygnału wejściowego na składowe częstotliwościowe, układ kodowania tych składowych oraz generator sekwencji kodu, znamienne tym, ze do wyjścia układu transformacji (601) jest dołączony układ rozdzielania składowych sygnału (602), który jednym swym wyjściem jest połączony z układem kodowania składowych charakterystyki dźwięku (603) połączonym, po173 718 przez układ kodowania ze zmienną długością kodu (610), z układem generatora sekwencji kodu (605),przy czym drugie wejście układu rozdzielania składowych sygnału (602) jest połączone z układem kodowania składowych charakterystyki szumu (604), który jest dołączony do układu generatora sekwencji kodu (605), którego wyjście, poprzez koder wykrywania i korygowania błędów (606), układ modulacji danych EFM (607) oraz głowicę zapisu (608), jest połączony z nośnikiem zapisu danych (609).
  13. 13. Urządzenie według zastrz. 12, znamienne tym, że układ rozdzielania składowych sygnału (802) jest dołączony do wyjścia układu transformacji (601) poprzez zespół przełączników (801, 806, 807) połączonych z układem sterowania przełączników (808) i sumatorem (805), który poprzez lokalny dekoder (804) jest połączony z wyjściem układu kodowania składowych charakterystyki dźwięku (603).
PL94307740A 1993-06-30 1994-06-29 Sposób i urządzenie do kodowania sygnałów cyfrowych PL173718B1 (pl)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
JP18332293 1993-06-30
PCT/JP1994/001056 WO1995001680A1 (fr) 1993-06-30 1994-06-29 Dispositif de codage de signaux numeriques, son dispositif de decodage, et son support d'enregistrement

Publications (2)

Publication Number Publication Date
PL307740A1 PL307740A1 (en) 1995-06-12
PL173718B1 true PL173718B1 (pl) 1998-04-30

Family

ID=16133682

Family Applications (2)

Application Number Title Priority Date Filing Date
PL94322680A PL174314B1 (pl) 1993-06-30 1994-06-29 Sposób i urządzenie do dekodowania sygnałów cyfrowych
PL94307740A PL173718B1 (pl) 1993-06-30 1994-06-29 Sposób i urządzenie do kodowania sygnałów cyfrowych

Family Applications Before (1)

Application Number Title Priority Date Filing Date
PL94322680A PL174314B1 (pl) 1993-06-30 1994-06-29 Sposób i urządzenie do dekodowania sygnałów cyfrowych

Country Status (10)

Country Link
US (1) US5765126A (pl)
EP (2) EP1083674B1 (pl)
JP (1) JP3721582B2 (pl)
KR (1) KR100368854B1 (pl)
CN (2) CN1099777C (pl)
BR (1) BR9405445A (pl)
DE (2) DE69432538T2 (pl)
PL (2) PL174314B1 (pl)
RU (1) RU2131169C1 (pl)
WO (1) WO1995001680A1 (pl)

Families Citing this family (35)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
TW327223B (en) * 1993-09-28 1998-02-21 Sony Co Ltd Methods and apparatus for encoding an input signal broken into frequency components, methods and apparatus for decoding such encoded signal
JP3250376B2 (ja) * 1994-06-13 2002-01-28 ソニー株式会社 情報符号化方法及び装置並びに情報復号化方法及び装置
JP3277699B2 (ja) * 1994-06-13 2002-04-22 ソニー株式会社 信号符号化方法及び装置並びに信号復号化方法及び装置
US6167093A (en) * 1994-08-16 2000-12-26 Sony Corporation Method and apparatus for encoding the information, method and apparatus for decoding the information and method for information transmission
US5774837A (en) * 1995-09-13 1998-06-30 Voxware, Inc. Speech coding system and method using voicing probability determination
JP3282661B2 (ja) * 1997-05-16 2002-05-20 ソニー株式会社 信号処理装置および方法
ES2190578T3 (es) * 1997-06-23 2003-08-01 Liechti Ag Metodo para la compresion de grabaciones de ruido ambiental, metodo para la deteccion de los elementos de programa de las mismas, dispositivo y programa de ordenador para su aplicacion.
DE69720527T2 (de) * 1997-09-30 2004-03-04 Infineon Technologies Ag Verfahren zur kodierung eines sprachsignals
US6965697B1 (en) * 1998-07-15 2005-11-15 Sony Corporation Coding apparatus and method, decoding apparatus and method, data processing system, storage medium, and signal
US6311154B1 (en) 1998-12-30 2001-10-30 Nokia Mobile Phones Limited Adaptive windows for analysis-by-synthesis CELP-type speech coding
US6298322B1 (en) * 1999-05-06 2001-10-02 Eric Lindemann Encoding and synthesis of tonal audio signals using dominant sinusoids and a vector-quantized residual tonal signal
US20020049586A1 (en) * 2000-09-11 2002-04-25 Kousuke Nishio Audio encoder, audio decoder, and broadcasting system
US6801887B1 (en) 2000-09-20 2004-10-05 Nokia Mobile Phones Ltd. Speech coding exploiting the power ratio of different speech signal components
JP2005506581A (ja) * 2001-10-19 2005-03-03 コーニンクレッカ フィリップス エレクトロニクス エヌ ヴィ 正弦波モデルパラメータの周波数差分符号化
WO2003085644A1 (en) * 2002-04-11 2003-10-16 Matsushita Electric Industrial Co., Ltd. Encoding device and decoding device
US6973579B2 (en) 2002-05-07 2005-12-06 Interdigital Technology Corporation Generation of user equipment identification specific scrambling code for the high speed shared control channel
JP3900000B2 (ja) * 2002-05-07 2007-03-28 ソニー株式会社 符号化方法及び装置、復号方法及び装置、並びにプログラム
KR100462611B1 (ko) * 2002-06-27 2004-12-20 삼성전자주식회사 하모닉 성분을 이용한 오디오 코딩방법 및 장치
PL376861A1 (pl) * 2002-11-29 2006-01-09 Koninklijke Philips Electronics N.V. Kodowanie sygnału audio
AU2006232364B2 (en) 2005-04-01 2010-11-25 Qualcomm Incorporated Systems, methods, and apparatus for wideband speech coding
TWI317933B (en) 2005-04-22 2009-12-01 Qualcomm Inc Methods, data storage medium,apparatus of signal processing,and cellular telephone including the same
CN1831940B (zh) * 2006-04-07 2010-06-23 安凯(广州)微电子技术有限公司 基于音频解码器的音调和节奏调节方法
KR101261524B1 (ko) * 2007-03-14 2013-05-06 삼성전자주식회사 노이즈를 포함하는 오디오 신호를 저비트율로부호화/복호화하는 방법 및 이를 위한 장치
RU2451998C2 (ru) * 2007-09-19 2012-05-27 Квэлкомм Инкорпорейтед Эффективный способ проектирования набора фильтров для mdct/imdct в приложениях для кодирования речи и аудиосигналов
US8548815B2 (en) 2007-09-19 2013-10-01 Qualcomm Incorporated Efficient design of MDCT / IMDCT filterbanks for speech and audio coding applications
RU2464540C2 (ru) * 2007-12-13 2012-10-20 Квэлкомм Инкорпорейтед Быстрые алгоритмы для вычисления 5-точечного dct-ii, dct-iv и dst-iv, и архитектуры
US8631060B2 (en) 2007-12-13 2014-01-14 Qualcomm Incorporated Fast algorithms for computation of 5-point DCT-II, DCT-IV, and DST-IV, and architectures
CN101903944B (zh) 2007-12-18 2013-04-03 Lg电子株式会社 用于处理音频信号的方法和装置
EP2252996A4 (en) * 2008-03-05 2012-01-11 Voiceage Corp SYSTEM AND METHOD FOR ENHANCING A DECODED TONAL SIGNAL SIGNAL
US8498874B2 (en) * 2009-09-11 2013-07-30 Sling Media Pvt Ltd Audio signal encoding employing interchannel and temporal redundancy reduction
EP2489036B1 (en) * 2009-10-12 2015-04-15 Nokia Technologies OY Method, apparatus and computer program for processing multi-channel audio signals
EP2523473A1 (en) 2011-05-11 2012-11-14 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Apparatus and method for generating an output signal employing a decomposer
JP6021498B2 (ja) 2012-08-01 2016-11-09 任天堂株式会社 データ圧縮装置、データ圧縮プログラム、データ圧縮システム、データ圧縮方法、データ伸張装置、データ圧縮伸張システム、および圧縮データのデータ構造
EP2720222A1 (en) * 2012-10-10 2014-04-16 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Apparatus and method for efficient synthesis of sinusoids and sweeps by employing spectral patterns
RU2573248C2 (ru) * 2013-10-29 2016-01-20 Федеральное государственное бюджетное образовательное учреждение высшего профессионального образования Московский технический университет связи и информатики (ФГОБУ ВПО МТУСИ) Способ измерения спектра информационных акустических сигналов телерадиовещания и устройство для его осуществления

Family Cites Families (62)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US3973081A (en) * 1975-09-12 1976-08-03 Trw Inc. Feedback residue compression for digital speech systems
US4170719A (en) * 1978-06-14 1979-10-09 Bell Telephone Laboratories, Incorporated Speech transmission system
US4184049A (en) * 1978-08-25 1980-01-15 Bell Telephone Laboratories, Incorporated Transform speech signal coding with pitch controlled adaptive quantizing
US4455649A (en) * 1982-01-15 1984-06-19 International Business Machines Corporation Method and apparatus for efficient statistical multiplexing of voice and data signals
US4535472A (en) * 1982-11-05 1985-08-13 At&T Bell Laboratories Adaptive bit allocator
JPS59223032A (ja) * 1983-06-01 1984-12-14 Sony Corp ディジタル信号伝送装置
DE3506912A1 (de) * 1985-02-27 1986-08-28 Telefunken Fernseh Und Rundfunk Gmbh, 3000 Hannover Verfahren zur uebertragung eines audiosignals
US4748579A (en) * 1985-08-14 1988-05-31 Gte Laboratories Incorporated Method and circuit for performing discrete transforms
JPH0734291B2 (ja) * 1986-07-28 1995-04-12 株式会社日立製作所 デイジタル信号記録再生システム
US4797926A (en) * 1986-09-11 1989-01-10 American Telephone And Telegraph Company, At&T Bell Laboratories Digital speech vocoder
JPH061916B2 (ja) * 1986-10-28 1994-01-05 日本電気株式会社 帯域分割符号化復号化装置
DE3688980T2 (de) * 1986-10-30 1994-04-21 Ibm Verfahren zur Multigeschwindigkeitskodierung von Signalen und Einrichtung zur Durchführung dieses Verfahrens.
DE3639753A1 (de) * 1986-11-21 1988-06-01 Inst Rundfunktechnik Gmbh Verfahren zum uebertragen digitalisierter tonsignale
JP2751201B2 (ja) * 1988-04-19 1998-05-18 ソニー株式会社 データ伝送装置及び受信装置
NL8700985A (nl) * 1987-04-27 1988-11-16 Philips Nv Systeem voor sub-band codering van een digitaal audiosignaal.
US4827336A (en) * 1987-12-18 1989-05-02 General Electric Company Symbol code generation processing from interframe DPCM of TDM'd spatial-frequency analyses of video signals
IL89672A (en) * 1988-04-29 1994-04-12 Motorola Inc Spectral efficient method of transmitting information signal
JP2638091B2 (ja) * 1988-06-24 1997-08-06 ソニー株式会社 データ伝送方法
CA2002015C (en) * 1988-12-30 1994-12-27 Joseph Lindley Ii Hall Perceptual coding of audio signals
US5109417A (en) * 1989-01-27 1992-04-28 Dolby Laboratories Licensing Corporation Low bit rate transform coder, decoder, and encoder/decoder for high-quality audio
US5142656A (en) * 1989-01-27 1992-08-25 Dolby Laboratories Licensing Corporation Low bit rate transform coder, decoder, and encoder/decoder for high-quality audio
US4932062A (en) * 1989-05-15 1990-06-05 Dialogic Corporation Method and apparatus for frequency analysis of telephone signals
DE69031517T2 (de) * 1989-06-30 1998-02-26 Nippon Electric Co Variable Blocklängenkodierung für unterschiedliche Charakteristiken der Eingangsabtastwerte
JP2844695B2 (ja) * 1989-07-19 1999-01-06 ソニー株式会社 信号符号化装置
US5054075A (en) * 1989-09-05 1991-10-01 Motorola, Inc. Subband decoding method and apparatus
JPH03109824A (ja) * 1989-09-22 1991-05-09 Sony Corp ディジタル信号符号化装置
JP2906483B2 (ja) * 1989-10-25 1999-06-21 ソニー株式会社 ディジタル音声データの高能率符号化方法及びディジタル音声データの復号化装置
US5115240A (en) * 1989-09-26 1992-05-19 Sony Corporation Method and apparatus for encoding voice signals divided into a plurality of frequency bands
JPH03117919A (ja) * 1989-09-30 1991-05-20 Sony Corp ディジタル信号符号化装置
US5185800A (en) * 1989-10-13 1993-02-09 Centre National D'etudes Des Telecommunications Bit allocation device for transformed digital audio broadcasting signals with adaptive quantization based on psychoauditive criterion
JPH03132228A (ja) * 1989-10-18 1991-06-05 Victor Co Of Japan Ltd 直交変換信号符号化復号化方式
US5040217A (en) * 1989-10-18 1991-08-13 At&T Bell Laboratories Perceptual coding of audio signals
JP2870050B2 (ja) * 1989-10-18 1999-03-10 ソニー株式会社 ディジタルデータの高能率符号化方法
US5235623A (en) * 1989-11-14 1993-08-10 Nec Corporation Adaptive transform coding by selecting optimum block lengths according to variatons between successive blocks
US5081681B1 (en) * 1989-11-30 1995-08-15 Digital Voice Systems Inc Method and apparatus for phase synthesis for speech processing
JP2827410B2 (ja) * 1990-03-14 1998-11-25 ソニー株式会社 デイジタルデータの高能率符号化方法
JP2913731B2 (ja) * 1990-03-07 1999-06-28 ソニー株式会社 ディジタルデータの高能率符号化方法
JP2861238B2 (ja) * 1990-04-20 1999-02-24 ソニー株式会社 ディジタル信号符号化方法
US5367608A (en) * 1990-05-14 1994-11-22 U.S. Philips Corporation Transmitter, encoding system and method employing use of a bit allocation unit for subband coding a digital signal
US5222289A (en) * 1990-07-10 1993-06-29 Gemcor Engineering Corp. Method and apparatus for fastening
JP3141241B2 (ja) * 1990-08-24 2001-03-05 ソニー株式会社 ディスク記録装置及びディスク再生装置
US5244705A (en) * 1990-08-24 1993-09-14 Sony Corporation Disc-shaped recording medium
US5049992A (en) * 1990-08-27 1991-09-17 Zenith Electronics Corporation HDTV system with receivers operable at different levels of resolution
US5226084A (en) * 1990-12-05 1993-07-06 Digital Voice Systems, Inc. Methods for speech quantization and error correction
US5134475A (en) * 1990-12-11 1992-07-28 At&T Bell Laboratories Adaptive leak hdtv encoder
JP2853717B2 (ja) * 1991-03-08 1999-02-03 日本電気株式会社 可変ビット型adpcmトランスコーダ
RU2090973C1 (ru) * 1991-03-29 1997-09-20 Сони Корпорейшн Способ кодирования сигналов
EP0506394A2 (en) * 1991-03-29 1992-09-30 Sony Corporation Coding apparatus for digital signals
JP3395192B2 (ja) * 1991-05-25 2003-04-07 ソニー株式会社 ディジタルオーディオ信号再生装置、ディスクプレーヤの再生ポーズ回路及びディスク再生装置の再生制御回路
KR100268623B1 (ko) * 1991-06-28 2000-10-16 이데이 노부유끼 압축 데이타 기록 재생 장치 및 신호 처리 방법
DE4225434A1 (de) * 1991-08-02 1993-02-04 Sony Corp Vorrichtung zur aufzeichnung und wiedergabe von komprimierten digitalen daten auf bzw. von einem aufzeichnungstraeger und dabei anwendbares verfahren zur bitentfernung
DE69232251T2 (de) * 1991-08-02 2002-07-18 Sony Corp Digitaler Kodierer mit dynamischer Quantisierungsbitverteilung
JP3178026B2 (ja) * 1991-08-23 2001-06-18 ソニー株式会社 ディジタル信号符号化装置及び復号化装置
DE69227570T2 (de) * 1991-09-30 1999-04-22 Sony Corp Verfahren und Anordnung zur Audiodatenkompression
JP3141450B2 (ja) * 1991-09-30 2001-03-05 ソニー株式会社 オーディオ信号処理方法
JP3134455B2 (ja) * 1992-01-29 2001-02-13 ソニー株式会社 高能率符号化装置及び方法
JP3104400B2 (ja) * 1992-04-27 2000-10-30 ソニー株式会社 オーディオ信号符号化装置及び方法
KR0150955B1 (ko) * 1992-05-27 1998-10-15 강진구 비트고정을 위한 영상압축방법과 신장방법 및 그 장치
JPH0629934A (ja) * 1992-07-10 1994-02-04 Nippon Hoso Kyokai <Nhk> 適応差分符号化伝送方法
JP3508146B2 (ja) * 1992-09-11 2004-03-22 ソニー株式会社 ディジタル信号符号化復号化装置、ディジタル信号符号化装置及びディジタル信号復号化装置
JP3343962B2 (ja) * 1992-11-11 2002-11-11 ソニー株式会社 高能率符号化方法及び装置
JP3186413B2 (ja) * 1994-04-01 2001-07-11 ソニー株式会社 データ圧縮符号化方法、データ圧縮符号化装置及びデータ記録媒体

Also Published As

Publication number Publication date
EP1083674B1 (en) 2003-04-16
DE69432538D1 (de) 2003-05-22
KR950703231A (ko) 1995-08-23
CN1099777C (zh) 2003-01-22
PL174314B1 (pl) 1998-07-31
EP1083674A2 (en) 2001-03-14
EP0663739A1 (en) 1995-07-19
DE69428030T2 (de) 2002-05-29
US5765126A (en) 1998-06-09
CN1113096A (zh) 1995-12-06
DE69428030D1 (de) 2001-09-27
EP1083674A3 (en) 2001-04-11
JP3721582B2 (ja) 2005-11-30
RU2131169C1 (ru) 1999-05-27
WO1995001680A1 (fr) 1995-01-12
BR9405445A (pt) 1999-09-08
CN1217502C (zh) 2005-08-31
PL307740A1 (en) 1995-06-12
EP0663739A4 (en) 1998-09-09
KR100368854B1 (ko) 2003-05-17
CN1440144A (zh) 2003-09-03
DE69432538T2 (de) 2004-04-01
EP0663739B1 (en) 2001-08-22

Similar Documents

Publication Publication Date Title
PL173718B1 (pl) Sposób i urządzenie do kodowania sygnałów cyfrowych
CA2140779C (en) Method, apparatus and recording medium for coding of separated tone and noise characteristics spectral components of an acoustic signal
KR100310214B1 (ko) 신호인코딩또는디코딩장치와레코딩매체
US5825979A (en) Digital audio signal coding and/or deciding method
JP3203657B2 (ja) 情報符号化方法及び装置,情報復化方法及び装置,情報伝送方法,並びに情報記録媒体
JP3277692B2 (ja) 情報符号化方法、情報復号化方法及び情報記録媒体
US5805770A (en) Signal encoding apparatus, signal decoding apparatus, recording medium, and signal encoding method
JPH0846518A (ja) 情報符号化方法及び復号化方法、情報符号化装置及び復号化装置、並びに情報記録媒体
JPH08166799A (ja) 高能率符号化方法及び装置
JP3685823B2 (ja) 信号符号化方法及び装置、並びに信号復号化方法及び装置
JPH0846516A (ja) 情報符号化方法及び装置、情報復号化方法及び装置、並びに記録媒体
JP3465697B2 (ja) 信号記録媒体
JP3465698B2 (ja) 信号復号化方法及び装置
JPH07336231A (ja) 信号符号化方法及び装置、信号復号化方法及び装置、並びに記録媒体
MXPA95004960A (en) Method and information coding device, method and information decoding device, method of transmission of information, and means of registration of information