DK172621B1 - Fremgangsmåde til transmission af digitaliserede audiosignaler - Google Patents

Fremgangsmåde til transmission af digitaliserede audiosignaler Download PDF

Info

Publication number
DK172621B1
DK172621B1 DK198804050A DK405088A DK172621B1 DK 172621 B1 DK172621 B1 DK 172621B1 DK 198804050 A DK198804050 A DK 198804050A DK 405088 A DK405088 A DK 405088A DK 172621 B1 DK172621 B1 DK 172621B1
Authority
DK
Denmark
Prior art keywords
subband
signal
masking
signals
information
Prior art date
Application number
DK198804050A
Other languages
English (en)
Other versions
DK405088A (da
DK405088D0 (da
Inventor
Gerhard Stoll
Martin Link
Guenter Theile
Original Assignee
Bayerische Rundfunkwerbung
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Family has litigation
First worldwide family litigation filed litigation Critical https://patents.darts-ip.com/?family=6314427&utm_source=***_patent&utm_medium=platform_link&utm_campaign=public_patent_search&patent=DK172621(B1) "Global patent litigation dataset” by Darts-ip is licensed under a Creative Commons Attribution 4.0 International License.
Application filed by Bayerische Rundfunkwerbung filed Critical Bayerische Rundfunkwerbung
Publication of DK405088A publication Critical patent/DK405088A/da
Publication of DK405088D0 publication Critical patent/DK405088D0/da
Application granted granted Critical
Publication of DK172621B1 publication Critical patent/DK172621B1/da

Links

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04HBROADCAST COMMUNICATION
    • H04H20/00Arrangements for broadcast or for distribution combined with broadcast
    • H04H20/86Arrangements characterised by the broadcast information itself
    • H04H20/88Stereophonic broadcast systems
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04BTRANSMISSION
    • H04B1/00Details of transmission systems, not covered by a single one of groups H04B3/00 - H04B13/00; Details of transmission systems not characterised by the medium used for transmission
    • H04B1/66Details of transmission systems, not covered by a single one of groups H04B3/00 - H04B13/00; Details of transmission systems not characterised by the medium used for transmission for reducing bandwidth of signals; for improving efficiency of transmission
    • H04B1/665Details of transmission systems, not covered by a single one of groups H04B3/00 - H04B13/00; Details of transmission systems not characterised by the medium used for transmission for reducing bandwidth of signals; for improving efficiency of transmission using psychoacoustic properties of the ear, e.g. masking effect

Landscapes

  • Engineering & Computer Science (AREA)
  • Signal Processing (AREA)
  • Computer Networks & Wireless Communication (AREA)
  • Compression, Expansion, Code Conversion, And Decoders (AREA)
  • Reduction Or Emphasis Of Bandwidth Of Signals (AREA)
  • Transmission Systems Not Characterized By The Medium Used For Transmission (AREA)
  • Telephone Function (AREA)
  • Amplifiers (AREA)
  • Signal Processing Not Specific To The Method Of Recording And Reproducing (AREA)

Description

i DK 172621 B1
Opfindelsen angår en fremgangsmåde af den i indledningen til krav 1 angivne art.
I forbindelse med transmission af digitale au-dioslgnaler er det fra "Journal of the Audio Enginee-5 ring Society," November, 1979, Bind 27, nr. 11, pp 855-865;"The Bell System Technical Journal," September 1981, pp 1633-1653; "IEEE International Conference on ASSP, 1982, Proceedings, pp 1684-1687, kendt ved en lineær kvantisering at opdele det bredbåndede, digitale 10 audlosignal ved hjælp af en bank af QMF-filtre (QMF = quadrature mirror filter) i et antal underbåndssignaler og at udsætte de resulterende underbåndssignaler for en datareduktion, eksempelvis ved en adaptiv PKM eller DPKM kodning.
15 Fra DE patentskrift nr. 3.440.613 er det også kendt, at vælge kvantiseringen af nytteinformationen indenfor hvert underbåndssignal således, at kvantise-ringsstøjen netop dækkes af nytteinformationen i det pågældende underbånd, hvilket også kan føre til data-20 reduktion. Den med kendt teknik opnåelige datareduktionsfaktor er på ca. 4, hvilket betyder, at informationsstrømmen for et digitalt højkvalitets audlosignal reduceres fra ca. 500 kbit/s til ca. 125 kbit/s uden subjektiv reduktion i kvalitet.
25 Til opnåelse af en endnu større datareduktion er det fra EP patentskrift nr. 0.193.143, DE-OS 3.506.912 og "Rundfunktechnische Mitteilungen", bind 30 (1986), nr. 3, pp 117-123 kendt, at foretage en spektral analyse af det bredbåndede audlosignal ved hjælp af en dis-30 kret Fourier transformation (f.eks. en fast-Fourier transformation), og at foretage kodning af visse relevante spektrale værdier indenfor forskellige frekvensgrupper alt efter størrelsen og fasen, således at der opnås en større datareduktion under hensyntagen til det 35 menneskelige høresystems maskeringsegenskaber defineret af maskeringstærskelværdler og afhængig af forskellige kvalitetskriterier.
DK 172621 B1 2
Det til Fourier transformation fornødne analysetidsvindue er imidlertid på ca. 25 ms. Denne værdi udgør et kompromis til opfyldelse af kravene hvad angår dels den spektrale opløsning, dels den tidsmæssige 5 opløsning i det menneskelige høresystem. Den spektrale opløsning, der kan opnås med dette analysetidsvindue, er kun på 40 Hz, hvorfor der i området for de lave frekvenser, hvor det menneskelige høresystems frekvens-gruppebredde kun er på 100 Hz, kun kan overføre 2 spek-10 trale værdier. De resulterende sidebånd ligger derfor i hosliggende frekvensgrupper, således at man ikke kan udelukke mærkbare reduktioner i kvalitet. På den anden side er det 25 ms analysetidsvindue valgt som et kompromis for langt for det menneskelige høresystems 15 tidsopløsning. Da denne tidsmæssige unøjagtighed for nyttesignaler der indeholder impulser, fører til mærkbar forvrængning, må amplitudeværdierne for de spektrale komposanter der ligger forud i tiden øges, for at nedsætte forvrængningen, men dette fører ikke altid til 20 de ønskede resultater. Dertil kommer at indenfor studieteknologi med digitale audiosignaler må bloklængder på ca. 5 ms ikke overskrides, når der ved "redigering" af digitaliserede audiosignaler skal kunne foretages ikke-hørebare afbrydelser. Desuden er der navnlig 1 25 modtageren et unødigt omfattende processor-udstyr til gentransformering af signaler der i det højfrekvente område er blevet transformeret på sendersiden, eftersom hensyntagen til psykoakustiske kriterier, kun foregår for frekvensgrupper.
30 Desuden, hvad angår sidstnævnte kendte metode, kræver genvindingen af de spektrale værdier i modtageren afhængigt af størrelsen og fasen og den inverse Fourier transformation i modtageren, transmissionen af sekundære informationer. Disse sekundære informationer 35 andrager en relativt stor procentdel af den totale in^ formationsstrøm, og kræver en særlig effektiv fejlbe- DK 172621 B1 3 akyttelse, hvilket tilsvarende øger informationsstrømmen i det kodede signal der skal udsendes. Endelig er det i kilden kodede signal i den kendte teknik følsomt overfor bitfejl på grund af interferenser eftersom am-5 plituden såvel som fasen af hver spektral værdi udsendes i blokke, d.v.s. kun ca. 1 gang for hvert 25 ms, således at en bitfejl fremkalder et interferensspektrum indenfor dette tidsinterval. Den forstyrrende effekt af en impuls på 25 ms er væsentlig større end for en im-10 puls på f.eks. 1 ms, hvilket for den ovenfor kendte teknik med opdeling i underbånd er årsagen til fejlbehæftet transmission af en underbåndssampleværdi.
I modsætning hertil er det opfindelsens formål fuldt ud at udnytte det menneskelige høresystems maske-j 5 ringsegenskaber i en metode af den ovenfor nævnte art under samtidig undgåelse af en Fourier transformation, således at en begrænset total informationsstrøm dynamisk fordeles over de spektrale komposanter af nyttesignalet med den bedst mulige kvalitet uden behov for 2o yderligere foranstaltninger vedrørende transmissionen af sekundær information, fejlbeskyttelse eller signalbehandling i modtageren.
Dette opnås ifølge opfindelsen ved de i den kendetegnende del af krav l angivne foranstaltninger. Hen-25 sigtsmæssige foranstaltninger ved og modifikationer af fremgangsmåden ifølge opfindelsen fremgår af underkravene.
Opfindelsen beror på den betragtning at den gensidige maskering af de spektrale kompossanter af nytte-30 signalet såvel som maskeringen af kvantiseringsstøjen finder sted ikke alene en for de respektive underbånd men også over flere hosliggende underbånd. For fuldt ud at udnytte denne maskeringseffekt skal kvantiseringen af underbåndssignalerne styres afhængigt af den maske-35 ringstærskel der skyldes de forskellige spektrale komposanter af nyttesignalet. Kalkulationen af den dertil DK 172621 B1 4 fornødne styreinformation udføres som funktion af signalet under hensyntagen til forudgående maskering (pre-masking), simultan maskering og post-maskering af det menneskelige høresystem. Da den fornødne totale infor-5 mationsstrøm for et således kodet audiosIgnal fluktuerer som funktion af signalet og da informationsstrømmen for det udsendte, kodede audiosignal desuden skal holdes konstant, kan den resulterende signalafhængige informationsstrømreserve benyttes til hos senderen at 10 tage hensyn til yderligere kriterier. Den signalafhaengige informationsstrømreserve kan gøres fuldstændigt eller delvis tilgængelig for kvantiseringen af under-båndsslgnalerne således at afstanden mellem underbåndssignalernes kvantiseringsstøjniveauer og den resulte-15 rende maskeringstærskel øges. Informationsstrømreserven kan gøres fuldstændigt eller delvis tilgængelig som fejlbeskyttelse for de ved multiplexdrift udsendte, kodede underbåndssignaler og for fejlbeskyttelse af et multiplex raster således at omfanget af beskyttelse mod 20 fejl i multiplex signalet øges.
Opfindelsen forklares nærmere i det følgende under henvisning til den skematiske tegning hvor fig. la og 2a viser blokdiagrammer over kredsløbsbestanddelene i senderen og modtageren under imple-25 menteringen af en første udførelsesform for fremgangsmåden ifølge opfindelsen, fig. Ib og 2b en anden udførelsesform, analogt med fig. la og 2a, fig. lc og 2c en tredie udførelsesform, analogt 30 med fig. lb og 2b, fig. Id og 2d en fjerde udførelsesform, analogt med fig. lc og 2c, med yderligere spektral analyse (FFT) hos senderen, fig. le et blokdiagram vedrørende implementerin-35 gen af en trinvis reduktion af data i henhold til den første udførelsesform for fremgangsmåden ifølge opfindelsen.
DK 172621 B1 5 fig. 3 et blokdiagram over de i fig. la, lb og 2a angivne trin til dynamisk fordeling af informationsstrømmen, fig. 4 eksempler på tre forskellige maskerings-5 tærskelkurver, der afviger ved frekvenspositionen af maskeringsaudiosignalet, fig. 5 den i fig. 4 viste mellemste maskeringstærskelkurves afhængighed af fire forskellige niveauer af maskeringsaudiosignalet, 10 fig. 6 et frekvensdiagram hvori de harmoniske af vokalen /3/ er tegnet med prikker medens den resulterende maskeringstærskel er tegnet med en fuldt optrukken streg, fig. 7 et tidsdiagram der angiver premaskering, 15 simultan maskering og post-maskering for det menneskelige audiosystem, fig. 8 et underbåndfrekvenssystem for en udførelsesform med ialt 24 underbånd, og med maskeringstærskelkurverne tegnet som angivet i fig. 4, 20 fig. 9 identiske volumenkurver for smalbåndet støj som funktion af båndbredde, fig. 10 den strukturelle udformning af banker af QMF filtre hos senderen og modtageren i henhold til henholdsvis fig. la og 2a, lb og 2b, 25 fig. 11 et blokdiagram over transkodningstrinnet i henhold til fig. la og lb, fig. 12 en skematisk repræsentation til bestemmelse af en skaleringsfaktor for de otte sampleværdier af et digitaliseret audiosignal, 30 fig. 13 en skematisk repræsentation af samme art som i fig. 12, men hvor der kun benyttes hveranden skaleringsfaktor til transmission, medens de ikke-udsendte skaleringsfaktorer rekonstrueres ved hjælp af såkaldte associationsbit der angiver, hvorvidt den pågældende 35 ikke-udsendte skaleringsfaktor er tilknyttet den foregående eller den efterfølgende, udsendte skaleringsfaktor.
DK 172621 B1 6 fig. 14 et eksempel på den audiosignalafhængige tidskurve for den totale informationsstrøm der kræves til kodning, fig. 15 et eksempel på den til kodning fornødne 5 audiosignalafhængige tidskurve for den totale informationsstrøm og informationsstrømreserven hvis informationsstrømmen i multiplex signalet holdes konstant, og fig. 16 et eksempel på den til kodning i henhold til fig. 15 fornødne audiosignalafhængige tidskurve for 10 den totale informationsstrøm med informationsstrømreserven brugt primært til dynamisk fejlbeskyttelse.
Som vist i fig. la deles et digitaliseret audio-signal, eksempelvis et højkvalitets radiosignal op i et antal underbåndsignaler, eksempelvis 24 underbåndsig-15 naler. Opdelingen af det digitale audiosignal i underbånd foregår fortrinsvis ved hjælp af en filterbank l bestående af QMF-filtre (QMF * quadrature mirror filters) hvis udformning og virkemåde fremgår klarere af fig. 10 og forklares nærmere nedenfor. Indgangssignalet 20 til filterbanken 1 har eksempelvis en båndbredde på 16 kHz og er kvantiseret lineært med en opløsning på 16 bit. Man kunne anvende en større båndbredde og en højere opløsning, eksempelvis 20 kHz og 18 bit.
De 24 underbåndsignalers tætte informations-25 strømme, der er til stede ved udgangen fra filterbanken 1 reduceres i et efterfølgende transkodningstrin 2.
De transkodede underbåndsignaler udsættes for speciel fejlbeskyttelse i et trin 7 - dette trin beskrives nærmere senere - og føres til en multiplexer 3 der i den 30 viste udførelsesform ved tidsmultiplex overfører de 24 underbåndsignaler til en transmissionsbane, f.eks. radiotransmissionsbane.
Til reduktion af informationsstrømmen kan man anvende metoder til reduktion af redundans og metoder 35 til reduktion af irrelevans, eventuelt en kombination af begge metoder. Metoder til reduktion af redun- DK 172621 B1 7 dans fjerner den information, der ikke er nødvendig til rekonstruktion af det oprindelige signal. I modsætning hertil tjener metoden til reduktion af irrelevans til at undertrykke den information, som det menneskelige 5 audiosystem ikke kræver for at skelne mellem det rekonstruerede signal og det oprindelige signal. Ved en metode til reduktion af irrelevans vælges kvantiseringen af nyttesignalet indenfor hvert underbånd eksempelvis således, at kvantiseringsstøjen lige netop dækkes af 10 nyttesignalet. I en metode til reduktion af irrelevans og redundans anvendes der eksempelvis adaptive PKM eller DPKM- processorer i underbåndene og de udformes således, at rekonstruktionen af det oprindelige signal ikke er helt mulig, men det resulterende fejlsignal li-15 ge netop dækkes af nyttesignalet.
En passende udførelsesform for kombineret reduktion af irrelevans og redundans i underbåndene beskrives nærmere nedenfor. Kvantiseringen af underbåndsigna-lerne udføres på basis af maskeringstærsklen og på ba-20 sis af skaleringsfaktorer. Skaleringsfaktorerne klassificerer spidsværdierne af underbåndsignalniveauerne indenfor et tidsinterval, der svarer til det menneskelige høresystems opløsningsevne. De udsættes for en yderligere reduktion af irrelevans og redundans. Transmissio-25 nen foregår i multiplexsignalet, idet fejlbeskyttelsestrinnet 8 har specielle egenskaber som beskrives nærmere senere.
Dynamisk fordeling af informationsstrøm.
En invariant fordeling af informationsstrømmen 30 til underbåndene er uhensigtsmæssig 1 relation til optimal reduktion af irrelevans eftersom maskeringstærskelkurven er en funktion af nyttesignalets spektrale og tidsmæssige struktur. Derfor styres kvantiseringen af underbåndsignalerne i henhold til opfindelsen i trin 2 35 ("dynamisk fordeling" af den til rådighed værende informationsstrøm til underbåndene).
DK 172621 B1 8
Styresignalerne for kvantiseringen af underbånd-signalerne i transkodningstrinnet 2 tilvejebringes i et trin 5 på basis af det menneskelige høresystems spektrale og tidsmæssige maskeringstærskelværdier. Med 5 disse styresignaler i trin 2 fordeles informationsstrømmen dynamisk til de enkelte underbånd under hensyntagen til det menneskelige høresystems pre-maske-ring, simultan maskering og post-maskering; dette beskrives nærmere senere under henvisning til fig. 5-8.
10 Dette indbefatter: a) ingen eller kun delvis transmission af underbåndene af nyttesignalet, der dækkes af hosliggende underbånd af det samme nyttesignal, og b) kvantisering af underbånd af nyttesignalet 15 der ikke er (helt) dækket af hosliggende underbånd af det samme nyttesignal, kun med en sådan grad af finhed at den resulterende kvantiseringsstøj dækkes af det højere nyttesignalniveau af de hosliggende underbåndsig-naler.
20 På denne måde er det muligt at opnå en højere lrrelevansreduktion end 1 den kendte teknik.
Tidligere kendte metoder udfører en reduktion af informationsstrømmen ved, at kvantiseringen af under-båndsignalerne foregår på basis af den effektive maske-25 ring indenfor et underbånd. For en metode der kun vedrører reduktion af irrelevans kan man med tilnærmelse anvende den ligning, der er givet i DE patentskrift nr.
3.440.613: DK 172621 B1 9 kes på følgende måde: n rmin 2 ^foi “ fui^ * ld min tbit/s]
Den resulterende, fornødne informationsstrøm er 5 konstant og for en opløsning i 24 underbånd er den på ca. 100 kbit/s.
Denne værdi er reduceret under hensyntagen til underbåndsignalernes gensidige maskering. For et bredbåndet, tilnærmelsesvis ensartet maskerende nyttesignal 10 kan opløsningen for samtlige underbånd, der på frekvensaksen befinder sig ovenover det første underbånd, reduceres således at den fornødne informationsstrøm reduceres med ca. 30%. For et smalbåndet nyttesignal er en større datareduktion i princippet mulig, fordi in-15 formationsstrømmen kan sættes på nul i mange underbånd.
I princippet fører den signalafhængige, styrede kvantisering af underbåndsignalerne til en nødvendig informationsstrøm, der i hovedsagen er funktion af nyttesignalets spektrale og tidsmæssige struktur, og som 20 således fluktuerer i afhængighed af signalet, tilnærmelsesvis over et område fra 20 til 70 kbit/s. Den hensigtsmæssige udnyttelse af en informationsstrøm, der fluktuerer i afhængighed af signalet, skal omtales mere detaljeret nedenfor.
25 Skalerlngsfaktor.
I udførelsesformen i henhold til fig. la udføres transkodningen af underbåndsignalerne ikke alene på basis af maskeringstærskelkriteriet, nemlig ved reduktion af irrelevans med styring fra trin 5, men også på basis 30 af skaleringsfaktorer, der klassificerer spidsværdierne af underbåndsignalniveauerne indenfor et givet tidsinterval og bestemmer opløsningen for hvert underbåndsig-nal indenfor tidsintervallet for transkodningsprocessen. Detaljerne vedrørende bestemmelsen af skalerings-35 faktorerne i trin 4, og deres vurdering under transkodningen i trin 2 samt deres transmission skal beskrives DK 172621 B1 10 nærmere senere. Der er tre grunde til at skaleringsfak-torerne er hensigtsmæssige for underbåndsignalerne: 1. Skaleringsfaktorerne for underbåndsignalerne indeholder alle de fornødne informationer for en be- 5 stemmelse af styrevariablen i henhold til maskeringstærskelkriteriet i trin 5. Transmissionen af skale-ringsfaktorer som sekundær information er derfor tilstrækkelig til udførelse af den omvendte transkodning hos modtageren, jfr. fig. 2a. De modtagne skalerings-10 faktorer giver information vedrørende fordelingen af den totale informationsstrøm over underbåndene.
2. Da spidsværdien af underbåndsignalniveauet, klassificeret af skaleringsfaktoren, ikke kan overskrides af sampleværdierne af det pågældende underbåndsig- 15 nal, kan støjniveauet indenfor hvert underbånd, frembragt ved bit-fejl, derfor ikke overskride spidsværdien af underbåndsignalniveauet med mere end nøjagtigheden i klassifikationen. Derfor vil bit-fejl i princippet tilvejebringe et støj spektrum, der for det meste maskeres 20 af nyttesignalet. Selvom der er et maksimum af bitfejl, eksempelvis total ødelæggelse af alle sampleværdier, vil skaleringsfaktoren der i så fald stadigvæk er til stede, sikre at støjspektrets indhyllingskurve tilnærmelsesvis svarer til nyttesignalets indhyllingskurve 25 hvilket betyder at et talesignal stadigvæk er forståeligt.
3. Da skaleringsfaktorerne for underbåndsignalerne indeholder alle de fornødne informationer til bestemmelse af styrevariablen i henhold til maskerings- 30 tærskelkriteriet er det nødvendigt at sikre en høj grad af beskyttelse af denne information mod bit-fejl under transmissionen. Dette kan eksempelvis gøres ved indføring af redundans. På grund af denne indføring af redundans er det særligt vigtigt at minimere transmissio-35 nen af skaleringsfaktorer. Dette kan opnås med en minimal, nødvendig ordlængde (jfr. det afsnit, der handler DK 172621 B1 11 om dannelse af skaleringsfaktor), og en transmissionsgentagelsesfrekvens som er funktion af signalets statistiske aspekter og af det menneskelige høresystems krav.
5 Det menneskelige høresystems krav kan opfyldes ved at man udnytter den tidsmæssige maskering, primært virkningen af post-maskeringen (reduktion af irrelevans). Dette betyder, at når radiosignalet henfalder hurtigt, behøver skaleringsfaktorerne ikke at være nøj-10 agtigt bestemt, idet de kan approximeres på basis af interpolationer af tidligere eller senere skalerings-faktorer. Da tidsmæssig pre-maskering generelt er meget kort og i høj grad afhænger af signalet (1 til 20 ms), må skaleringsfaktorerne udsendes hyppigere i de tilfæl-15 de, hvor signalerne vokser hurtigt.
Redundansreduktionen under transmissionen af skaleringsfaktorerne er opnået ved, at for sådanne un-derbåndsignaler, hvis niveau ikke ændrer sig eller kun ændrer sig lidt over en given tidsperiode, udsendes 20 skaleringsfaktorerne kun sjældent.
På grund af det forhold at skaleringsfaktorerne ikke behøver at blive udsendt pr. tidsblok for samtlige underbånd, men også kan bestemmes ved interpolation i afhængighed af det menneskelige høresystems krav og af 25 audiosignalet, kan man opnå en transmissionsmængde for samtlige skaleringsfaktorer på ca. 10 til 20 kbit/s.
Da transkodningen hos modtageren alene styres af de detekterede skaleringsfaktorer, er de kodede, multi-plexerede underbåndsignaler særlig ufølsomme overfor 30 bit-fejl interferens, når skaleringsfaktoren udsættes for effektiv fejlbeskyttelse i trin 8 i senderen. Fordelen ved brug af skaleringsfaktorer i forhold til andre datareduktionsmetoder såsom adaptiv PKM eller DPKM ligger således i det forhold, at der sikres en høj 35 ufølsomhed overfor bit-fejl når alene strømmen af sekundær information vedrørende skaleringsfaktorene ef- DK 172621 B1 12 fektivt beskyttes. Størrelsen af denne strøm af sekundær information fluktuerer i afhængighed af signalet, tilnærmelsesvis over et område fra 10 til 20 kbit/s fordi de tidsintervaller (bloklængder), hvori bestem-5 melsen af skaleringsfaktorerne - med henblik på reduktion af irrelevans og redundans - svarer til det menneskelige høresystems tidsmæssige maskering og til de respektive underbåndsignalers tidsstruktur.
Til transmission af transkodede underbåndsigna-10 ler og skaleringsfaktorer kræves der således en total informationsstrøm der afhængigt af signalet fluktuerer i et område fra 30 til 90 kbit/s.
Anvendelse af den fluktuerende Informationsstrøm.
15 Den signalafhængige fluktuation af den totale informationsstrøm, der kræves til kodning, kan hensigtsmæssigt benyttes til implementering af fremgangsmåden ifølge opfindelsen.
Fig. 14 viser et eksempel på en kurve, der som 20 funktion af tiden repræsenterer den totale informationsstrøm. Den punkterede streg repræsenterer gennemsnittet af den fornødne, totale informationsstrøm (ca.
60 kbit/s). Denne værdi kunne bruges som grundlag, hvis samtlige fluktuationer indenfor et bredt tidsinterval 25 kunne udlignes ved hjælp af et tilsvarende stort bufferlager. Dette er ikke muligt i tilfælde af transmissionen af et audlosignal, idet der er tale om et tilsvarende lang forsinkelsestid, men hvad angår oplagring af audiosignalet ligger der deri en første hensigtsmæs-30 sig udførelsesform for fremgangsmåden ifølge opfindelsen: 1) Informationsstrømmen i multiplexsignalet fluktueret.
Hvis multiplexsignalet formes således, at in-35 formationsstrømmen ved udgangen fra den i fig. la viste multiplexer 3 fluktuerer på samme måde som den totale DK 172621 B1 13 informationsstrøm, der bruges for de kodede audiosignal ved indgangene til trin 7 og 8, er der særlig høj datareduktion, hvis der er tale om oplagring. Med specielle former for oplagring, f.eks. computer-diskette kan man 5 endog udelade trinene 3, 7 og 8 således at den totale informationsstrøm, der skal oplagres, ikke behøver at være større end den totale fornødne informationsstrøm.
Det langfristede gennemsnit af total informationsstrøm, der skal oplagres, kan endog ligge under 60 10 kbit/s, for hvis en komplet udsendelse oplagres vil alle de kortvarige pauser (f.eks. i et talesignal) kun kræve en meget lille informationsstrøm (ca. 10 til 15 kbit/s, primært for skaleringsfaktorerne). Der efterlades således mindre end 40 kbit/s til oplagring af tale-15 signal.
2) informationsstrømmen i multiplexsignalet er konstant.
I tilfælde af transmissionen af multiplexsigna-let er det en fordel, at det har konstant informations-20 strøm. Da den af bufferlageret indførte forsinkelse kun må være lille, er der kun mulighed for en mindre kompensering for fluktuationerne i den totale informationsstrøm. De resterende fluktuationer vises som et eksempel i fig. 15. Den punkterede linie angiver den 25 konstante informationsstrøm i multiplexsignalet (90 kbit/s). Det øvre område repræsenterer således en informationsstrømreserve, der fluktuerer i afhængighed af signalet, og som kan udnyttes på forskellige måder: a) større afstand fra den resulterende m.aske-30 ringstærskel til kvantiseringsstøjniveauet (større signal/støj-forhold), b) fejlbeskyttelse 1 trin 7 og 8 og dannelse af multiplexsignal i trin 3 (dynamisk fejlbeskyttelse), c) transmission af enhver ønsket yderligere in-35 formation i multiplexsignalet, som ikke er kritisk med hensyn til tid og som er uafhængig af audiosignalet, DK 172621 B1 14 eksempelvis "schedule Informations" eller radiotekst information (transmission af yderligere signaler).
Det er klart at informationsstrømsreserven kan udnyttes med en hvilken som helst kombination af disse 5 tre muligheder. Det forøgede signal/støj-forhold og den dynamiske fejlbeskyttelse skal beskrives nærmere senere.
For det dynamiske signal/støj-forhold gælder følgende betragtninger: 10 Metoder med kodning hos kilden, hvorved irrele vansen i de digitale audiosignaler undertrykkes fuldstændigt (d.v.s. hvor man fuldt ud udnytter virkningen af spektral pre-maskering, simultant maskering og post-maskering) kan i visse anvendelsessituationer forårsage 15 problemer: - I det tilfælde, hvor sådanne kildekodningsmetoder benyttes i kaskade, kan kvantiseringsstøjen overskride maskeringstærskelværdierne. Hvis f.eks. oplagring og transmission af et radioprogramsignal skulle 20 finde sted under anvendelse af en sådan kildekodningsmetode, ville reduktioner i kvalitet kunne høres for kritiske audiosignaler.
- I tilfældet af en efterfølgende fremhævelse eller reduktion af visse frekvenskomposanter af nytte- 25 signalet hos modtageren, kan den spektrale maskering af nyttesignalet ændre sig så meget, at der er mærkbar reduktion af kvalitet. Denne fare foreligger hvis niveauet af et underbåndsignal der maskerer hosliggende un-derbåndsignaler nedsættes hos modtageren eller hvis ni-30 veauet af et underbåndsignal, der er helt eller delvis maskeret af et hosliggende underbåndsignal øges hos modtageren.
For i sådanne anvendelsessituationer at udelukke kvalitetsreduktioner udføres den dynamiske fordeling af 35 informationsstrømmen i henhold til opfindelsen ikke alene for at opnå maksimal datareduktion, men også for DK 172621 B1 15 at opnå en såkaldt "mask-to-noise reserve". Denne mask-to-noise reserve fluktuerer i afhængighed af signalet, tilnærmelsesvis proportionalt med informationstrømre-serven, jfr. eksemplet i fig. 15. Hvis nyttesignalet 5 eksempelvis er så smalbåndet at informationsstrømmen er på nul i mange underbånd, vil informationsstrømmen (og dermed opløsningen) øges for disse underbåndsignaler, der fremkalder maskering. En sådan forøgelse udføres i det omfang informationsstrømreserven tillader det. Der-10 for er opløsningen i maskerende underbåndsignaler under visse forhold væsentligt større end krævet af maskeringstærskelkriteriet .
Fordelen ved denne form for dynamisk fordeling af informationsstrømmen til underbåndene ligger i, at 15 lydniveauer eksempelvis udsendes med meget høj opløsning (eksempelvis 16 til 18 bit i lineær kvantisering). Transmissionen af en enkelt spektral linie med 16 bit opløsning i et underbånd, der har en bredde på 500 Hz kræver teoretisk 16 kbit/s. I betragtning af aliasing-20 forvrængninger (som omtales nærmere senere under henvisning til fig. 3), kræves der imidlertid en bit strøm, der er tilnærmelsesvis dobbelt så stor. Afhængigt af frekvensbeliggenheden er der således to eller flere spektrale linier der udsendes simultant uden mål-25 bar reduktion i kvalitet, hvis systemet er baseret på underbånd af bredde på ca. 500 Hz og på en bit-strøm i multiplexsignalet på ca. 90 kbit/s. Signifikante funktioner af de i fig. la og 2a viste underbånd-transmis-sionsbaner kan således nemt overvåges ved målinger, 30 idet der f.eks. udsendes sinustoner af hvilken som helst ønsket frekvens og amplitude.
De efterfølgende betragtninger gælder for dynamisk fejlbeskyttelse:
Kanalkodning, d.v.s. fejlbeskyttelse af de 35 transkodede sampleværdier i trin 7, af skaleringsfakto-rerne i trin 8, og dannelsen af multiplexsignalet i DK 172621 B1 16 trin 3, kræver en yderligere Informationsstrøm. Som følge heraf består informationsstrømmen 1 multiplex-signalet af de informationsstrømme, der benyttes til kildekodning og kanalkodning.
5 Den dynamiske informationsstrømreserve, der er til rådighed når der er konstant informationsstrøm i multiplexsignalet, kan benyttes til kanalkodning på en sådan måde, at omfanget af fejlbeskyttelse i multiplexsignalet styres som funktion af den momentant eksiste-10 rende informationstrømreserve (dynamisk fejlbeskyttelse). Omfanget af fejlbeskyttelse kan hensigtsmæssigt styres i trin. Eksempelvis viser fig. Ib en informationsstrøm til dynamisk fejlbeskyttelse hvor strømmen fluktuerer trinvis i afhængighed af signalet (området 15 mellem den punkterede streg og den trappeformede kurve). Den informationsstrøm der udtrykkes af den trappeformede kurve, repræsenterer også den totale informationsstrøm, der er tilgængelig for kildekodning. Den er noget bredere end den totale, fornødne informations-20 strøm.
Den dynamiske fejlbeskyttelse fører til en forøgelse af det gennemsnitlige omfang af fejlbeskyttelse svarende til gennemsnittet af informationstrømreserve der er til rådighed. Derfor er sandsynligheden for for-25 styrrelse på grund af bit-fejl reduceret.
Den dynamiske fejlbeskyttelse indebærer yderligere at de audiosignaler, der kræver nedsat total informationsstrøm, udsendes med et højt omfang af fejlbeskyttelse og de audiosignaler, der kræver tæt Infor-30 mationsstrøm udsendes med en lavere grad af fejlbeskyttelse. Denne karakteristiske fejlbeskyttelse har en yderligere fordelagtig indflydelse eftersom audiosignaler, der kræver en nedsat, total informationsstrøm kun i mindre omfang maskerer de støj signaler, der skyldes 35 bit-fejl. Det er navnlig disse følsomme audiosignaler, der får en højere grad af beskyttelse. For eksempelvis DK 172621 B1 17 et talesignal er der især under en pause i talen eller også under en svag musikpassage kun behov for en særlig beskeden total informationsstrøm, hvorfor graden af fejlbeskyttelse er særlig høj.
5 Det er hensigtsmæssigt at udforme graden af dy namisk fejlbeskyttelse således, at den subjektive støjeffekt ved en given bit-fejlhyppighed tilnærmelsesvis er uafhængig af audioslgnalet.
Kvalitetsgraduering.
10 Et yderligere træk ved kildekodningsmetoden i- følge opfindelsen er muligheden for bestemmelse af kvaliteten af kildekodning ved trin 6 hos senderen, jfr. fig. Ib. Kriterierne for kvantisering af underbåndsi-gnalerne, bestemt 1 trin 5 som beskrives nærmere senere 15 under henvisning til fig. 4 til Θ, vurderes ved kvalitetsbestemmelse i trin 6. Dette foregår på følgende måde: a) Den totale informationsstrøm, der er til rådighed til kodning af audiosignalet, fastlægges af kva- 20 litetsbestemmelsen.
b) Der foretages vurdering af aspekten af det allerede beskrevne "forøgede signal/støj-forhold" for den dynamiske fordeling. "Maske-til-støj-reserven" dimensioneres som funktion af kvalitetsbestemmelsen.
25 c) Maskeringstærskelkriteriet formes således i afhængighed af kvalitetsbestemmelsen, at visse kritiske nyttesignaler, der kræver en tæt total informationsstrøm, og forekommer sjældent, indeholder en mærkbar, men ikke generende reduktion i kvalitet. Eksempelvis 30 bestemmes kvalitetsgradueringerne af den sandsynlighed hvormed disse reduktioner i kvalitet forekommer.
d) Afhængigt af kvalitetsbestemmelsen sættes et antal underbåndsignaler på nul for kritiske nyttesignaler. Dette gøres med prioritering af underbåndsignaler, 35 der har større båndbredde og større informationsstrøm og ydermere på basis af minimal støjeffekt. Man undgår DK 172621 B1 18 den relativt høje støjeffekt med utilstrækkelig opløsning i visse underbåndsignaler ved at man for disse underbånds ignaler opnår en yderligere informationsstrøm ved at sætte ikke-signifikante underbåndsignaler på 5 nul. ikke-signifikante underbåndsignaler er de signaler, der har et lavere niveau og kun yder et ikke-sig-nifikant bidrag til opfattelsen af tonekvaliteten.
Den signifikante faktor er at en reduktion af den totale informationsstrøm knytter sig til en minimal 10 reduktion i kvaliteten, fordi den dynamiske fordeling af informationsstrømmen til underbåndene i trin 5 kun udføres på basis af den til rådighed værende, totale informationsstrøm men også på basis af specifikke kvalitetskriterier .
15 Gennem en trinvis reduktion i kvalitet er det muligt i stedet for et enkelt nyttesignal, at udsende to eller flere simultane nyttesignaler med den samme informationsstrøm i multiplexslgnalet. Da kvalitetsbestemmelsen i trin 6 bestemmer den til rådighed værende, 20 totale informationsstrøm for hvert nyttesignal, vælges kvalitetsgradueringen således, at kvalitetsvalget fastsætter antallet af sendbare kanaler og omvendt. Med henblik herpå foretages der en passende omskiftning af en kanalblok 9 (fig· lb) °g multiplextrinnet 3.
25 Skifteinformationen udsendes også i multiplexslgnalet således at der hos modtageren kan foretages en efter kvalitet adaptiv dekodning. Fejlbeskyttelsen af skifteinformationen skabes ved at den udsendes hyppigere end nødvendigt, f.eks. med tidsintervaller på 100 ms.
30 Mellem kvalitetstrinnene og antallet af kanaler kan man eksempelvis have følgende korrelation: 35 DK 172621 B1 19
Anvendelse Kvalitet Antal Bitstren strøm af pr.
___kanaler__kanal oplagring, radio 5 /studio 1 1 200 kbit/s oplagring, radio /standard 2 2 100 kbit/s radio/kommentar 3 3 65 kbit/s radio/telefon 4 6 33 kbit/s
En reduktion af informationsstrømmen for hver kanal fører karakteristisk kun til en kvalitetsreduktion for de nyttesignaler, der selv efter undertrykkelse af irrelevans og reduktion af redundans kræver en 15 større informationsstrøm end tilladt, eksempelvis i henhold til ovenstående tabel. Den i henhold til opfindelsen skabte, trinvise reduktion af informationsstrømmen adskiller sig ved at sandsynligheden for optræden af kvalitetsreducerede signaler bliver lavere end i de 20 kendte metoder til trinvis reduktion af informationsstrømmen. Sandsynligheden for optræden af kvalitetsreducerede talesignaler er på nul for kvalitetstrinnene 1-3 i tabellen, og er lavere end 100% for kvalitets-trinnet 4, med graden af kvalitetsreduktion væsentlig 25 lavere end for den for telefonsignaler normale båndbreddereduktion .
Modtager.
Der henvises til fig. 2a. De fejlbeskyttede, transkodede underbåndsignaler, de tilhørende fejlbe-30 skyttede skaleringsfaktorer og informationen vedrørende det kvalitetstrin, der er sat ind hos senderen, genvindes i demultiplexertrinnet 13 hos modtageren, ved hjælp af informationen vedrørende kvalitetstrinnet, kan antallet af alternative kanaler fremvises på displayet 35 16 (fig. 2b) således at lytteren er i stand til med en kanal vælgeomskifter 19 at sætte ind de data, som de- DK 172621 B1 20 multiplexertrinnet 13 skal afgive. Trinene 17 og 18 tjener til at undertrykke skaleringsfaktorerne og at foretage fejlkorrigering på basis af fejlbeskyttelsesdataene for,de transkodede underbåndsignaler. Hos mod-5 tageren tjener skaleringsfaktorerne som indgangsinformation til trin 15 til styring af fordelingen af informationsstrømmen over underbåndene. Trin 15 er derfor identisk med trin 5 hos senderen, jfr. fig. 3. På basis af den i trin 15 frembragte styreinformation, 10 skaleringsfaktorerne og informationen om kvalitetstrin, foretages der i trinnet 12 den omvendte transkodning i forhold til trin 2 i senderen således, at der afgives 16 til 18 bit lineært kvantiserede underbåndsignaler til en bank 11 af inverse QMF filtre, hvorfra det 15 bredbåndede digitale audiosignal kan genvindes. Detaljerne vedrørende udformningen af og virkemåden for QMF filterbanken 11 beskrives nærmere under henvisning til fig. 10.
En anden udførelsesform for fremgangsmåden iføl-20 ge opfindelsen illustreres i fig. lc for senderen og fig. 2c for modtageren. Kodningen hos modtageren i fig, lc er identisk med den ovenfor beskrevne udførelsesform ifølge fig. lb. Afvigelsen derfra ligger i at styreinformationen vedrørende fordelingen af informations-25 strømmen over underbåndene udsendes - i fig. lc - i multiplexsignalet, idet der foretages fejlbeskyttelse af styreinformationen i trin 8b. Effektiviteten af denne fejlbeskyttelse dimensioneres på samme måde som for fejlbeskyttelsen af skaleringsfaktorerne i trinnet 8a.
30 Under dekodningen i modtageren i fig. 2c foretages der ikke som i fig. 2b ny bestemmelse af styreinformationen på basis af skaleringsfaktorerne (dette er tilfældet med trin 15 i fig. 2b) men den tilvejebringes direkte ud fra multiplexsignalet. I trinnene 18a og 18b fjer-35 nes fejlbeskyttelsesdataene for skaleringsfaktorerne og styreinformationen og der foretages fejlkorrigering.
DK 172621 B1 21
Til sammenligning med den udførelsesform, der illustreres i fig. lb og 2b kræver den her omtalte anden udførelsesform et mindre omfang af udstyr hos modtageren eftersom den fornødne styreinformation til en-5 hver transkodning i trin 12 ikke behøver at nybestem-mes. Den fornødne yderligere informationsstrøm til transmission og fejlbeskyttelse af styreinformationen er tilnærmelsesvis af samme størrelsesorden som for skaleringsfaktoren.
10 Yderligere udførelsesformer og hensigtsmæssig træk og motifikationer ved fremgangsmåden ifølge opfindelsen, navnlig i henhold til fig. Id, 2d og le, beskrives nærmere nedenfor.
Detaljerne af metoden.
15 Styring af informationsstrøm.
Den under henvisning til fig. 3 nærmere beskrevne trin 5 til udledning af maskeringstærskelkriteriet indbefatter separat bestemmelse af tærskelværdierne for spektral maskering i blok 5.1 og tærskelværdierne for 20 tidsmæssig maskering i blok 5.2. Dette gøres under hensyntagen til den til rådighed værende totale informationsstrøm gennem trin 5.5 og afhængigt af specifikke kvalitetstrinkriterier i trin 5.6. Trinene 5.1, 5.2 og 5.5 er indkoblet i serie, idet trinet 5.1 er forbundet 25 med udgangen på trin 4 og en styreindgang til trin 5.5 er forbundet med trin 6. Desuden er en første styreindgang til trin 5.1 ligeledes forbundet med trin 6 medens en anden styreindgang til trin 5.1 er forbundet 5.6.
Da der forekommer aliasing-forvrængninger i QMF 30 filterbanken 1 når hosliggende underbåndsignaler kvantiseres meget forskelligt, giver et trin 5.4 en ønsket værdi hvad angår de maksimale tilladelige kvan-tiseringsfor-skelle mellem hosliggende underbåndsignaler, ved hvilke forskelle aliasing-forvrængningerne 35 forbliver uhørbare. Med henblik herpå styrer trinnet 5.4 udgangstrinnet 5.3 som er forbundet med udgangen på DK 172621 B1 22 trinnet 5.5. På denne måde tjener udgangstrinnet 5.3 til at bestemme fordelingen af kvantisering under hensyntagen til den af blokkene 5.1 og 5.2 givne maskeringstærskel, den af trinnet 5.5 afgivne, til rådighed 5 værende totale informationsstrøm og den af trinnet 5.4 givne aliasing-forvrængning.
Maskerinqstærskelkrlterium.
En statisk fordeling af kvantiseringen af udgangssignalerne indenfor de separate underbånd, i hen-10 hold til kendt teknik, tager kun hensyn til maskeringen af kvantiseringsstøjen i disse underbånd med nyttesignalet i det samme bånd. Hvis man i henhold til kendt teknik betragter maskeringen af kvantiseringsstøjen indenfor underbåndene, er det i henhold til ligningen (1) 15 og med den valgte opdeling af det bredbåndede signal i 24 underbånd muligt at opnå en reduktion i datamængden på ca. 400 kbit/s, sammenlignet med en 16 bit lineær PKM kodning. I modsætning hertil giver den dynamiske, d.v.s. signalafhængige styring af kvantiseringen af un-20 derbåndsignalerne i henhold til opfindelsen mulighed for dels yderligere at reducere datamængden under opretholdelse af den samme subjektive kvalitet og at opnå en yderligere signalspecifik kvalitetsreserve, dels at opnå en mere omfattende kvalitetsreserve uden reduktion 25 i datamængden.
Spektrale maskeringstærskler.
Styringen af kvantiseringen i henhold til opfindelsen udføres under hensyntagen til den maskeringseffekt et underbåndssignal med højt niveau har på de hos-30 liggende underbånd. I den opstilling i underbånd, der er vist i fig. 8, kan denne maskeringseffekt benyttes i hovedsagen i et frekvensområde over 2 kHz, idet underbånd med den samme nummeriske bredde på 500 Hz danner basis for området op til 8 kHz. Til forskel derfra står 35 frekvensselektiviteten hos det menneskelige høresystem og dermed også den spektrale maskering i relation til DK 172621 B1 23 en konstant relativ båndbredde, de såkaldte frekvensgrupper. De absolutte, konstante båndbredder, der vælges i den i fig. 8 viste opstilling i henhold til opfindelsen, svarer tilnærnelsesvis til bredden af fre-5 kvensgruppen i området fra 2 til 4 kHz og er væsentligt smallere i frekvensområdet over 4 kHz end frekvensgrupperne i det menneskelige høresystem. Som følge heraf kan maskeringen af hosliggende underbåndsignaler i det pågældende område forventes at være større, hvilket vi-10 ses skematisk i fig. 8.
Fig. 4 illustrerer maskeringstærsklerne for støj ved frekvensgrupper med centerfrekvens på 250 Hz, l kHz og 4 kHz. I alle tre viste tilfælde er niveauet af maskeringsstøjen på L = 60 dB. Medens maskeringstærsklerne 15 - tegnet på en logaritmisk frekvensakse - tilnærmelsesvis har den samme form ved centerfrekvenserne på i kHz og 4 kHz, er kurven væsentligt bredere ved centerfrekvensen på 250 Hz.
Medens niveauet af forstyrrende støj blev valgt 20 som værende konstant er forskellen i maksimum af maskeringstærskel kun vist i punkteret streg (60 dB-linie ved 250 Hz på ca. 2 dB, medens forskellen ved 4 kHz vokser til 5 dB). Desuden vokser maskeringstærsklerne ved den lavere flanke hurtigere, ca. 100 dB/oktav og 25 henfalder betydeligt langsommere ved de høje frekvenser. Dette betyder, at lave, kraftige toner især maskerer høje, svagere toner.
Stejlheden af den øvre flanke er en funktion af niveauet af den maskerende lyd. Denne afhængighed er 30 vist i fig. 5. Med de lave niveauer falder maskeringstærsklerne stejlt i retning mod de høje frekvenser, medens der ved de mellemste niveauer og endnu tydeligere med de høje niveauer, er et langsommere henfald. For et niveau på 70 dB er henfaldet på ca. 40 dB/oktav. Derfor 35 er maskeringstærsklens frekvensafhængighed yderligere afhængig af niveauet af forstyrrende støj.
DK 172621 B1 24
De signaler, der skal udsendes består typisk ikke alene af en enkelt tone, men også af flere harmoniske (f.eks. musikinstrument, stemt tale) eller bredbåndet støj, f.eks. sibylanter. Afhængig af beskaffenheden 5 af disse harmoniskes amplituder er maskeringstærsklerne for sådanne signaler meget forskellige. Eksempelvis har en trompet mange harmoniske, der giver en meget mere bredbåndet maskering end en fløjte, hvis toner har et spektrum, der nærmest består af en enkelt linie. Fig. 6 10 viser eksempelvis maskeringstærsklerne for vokalen /3/.
Niveauet af de enkelte harmoniske er markeret med sorte prikker og den resulterende maskeringstærskel er vist med en fuldt optrukken streg. Til trods for partiel gensidig maskering kan de første ni harmoniske opfattes 15 medens den tiende og den ellevte harmoniske primært maskeres af den ottende harmoniske. Harmoniske nr. 13 til 17 maskeres - på grund af deres lave niveau - af den relativt stærke tolvte harmoniske.
Den spektrale maskering af et hvilket som helst 20 ønsket lydsignal kan kalkuleres i blok 5.1 (fig. 3) på følgende måde (detaljerne vedrørende kalkulation af maskeringstærskler er beskrevet i publikationen "Algorithm for Extraction of Pitch and Pitch Salience from Complex Tonal Signals"; i J. Acoust. Soc. Am 71, 1982, 25 pp 679-688), af E. Terhardt, G. Stoll og M. Seewann.
^HSi (fui* " - (3.64 (fui/kHz)"°·8 - 6.5 exp (-0.6 (fuj/kHz · 3.3)2] + 10"3 (fui/Wlz)4) [dB] (3) 30 hvor IiRns^ er tærsklen for hørbarhed i stille rum for det i"^e underbånd, som er tilgængelig i tabelform ved grænsefrekvenserne *ui for underbåndet i.
Følgende ligning gælder for tonaliteten z som et mål for frekvensgruppen i det menneskelige høresystem: 35 z (13 arc tan [0,76 (f/kHz)] + 3.5 arc tan (f/7.5 kHz)2) [Bark] (4) DK 172621 B1 25 hvor z ligeledes er tilgængelig i tabelform. For stejlheden S af den nedre flanke af maskeringstærsklen gælder følgende ligning: S * 27 dB/Bark (5) 5 For stejlheden S af den øvre flanke af maske ringstærsklen gælder følgende ligning: 8-(-24- (0.23 kHz/foi) + (0.2 · Li/dB)) (dB/Bark) hvor f0i er den øvre grænsefrekvens og er signalniveauet for det pågældende underbånd i.
10 Den efterfølgende ligning gælder for stimulus fordelingen indenfor underbåndet i, hvilken fordeling udgør basis for spektral maskering: lEK <Fui) “ Ljc - S (ζ^ - Zj_) (7).
Ligning (7) beskriver maskering af et underbånd 15 K over et underbånd i. Den totale gensidige maskering fra de forskellige underbåndsignaler resulterer af en summation af amplituderne af stimulus fordelingen indenfor de enkelte underbånd. Maskeringen af signalniveauet Lindenfor underbåndet i på basis af signalerne i 20 de 23 andre underbånd, kalkuleres på følgende måde:
LXi * Li - 10 lg|~(j;4ioLEk(fui)/20dB)2 + 10LrH(fui)/10dB] + 6 dB —k=l -J
i/k
Et underbåndsignal med signalniveau maskeres 25 fuldstændigt hvis LX^ < 0 dB. En partiel maskering forekommer hvis La > LX^ > 0 dB.
Tidsmæssige maskeringstærskler.
Fordelingen af kvantisering til forskellige underbånd forekommer ikke alene i afhængighed af den 30 spektrale maskering, men også af den tidsmæssige maskering. Man kan skelne mellem tre tidsområder for maskering, jfr. fig. 7. Pre-maskering finder sted i tidsområdet før ""masker1 en" er blevet koblet ind. Hvis masker og test-sound indkobles simultant, er der tale om 35 simultan maskering. Efter at maskeren er koblet ud forekommer der post-maskering.
DK 172621 B1 26
Den typiske varighed af pre-maskering ligger i området fra 10 til 20 ms. Niveaustigninger skal være fuldt rekonstruerede indenfor dette relativt korte tidsinterval. For korte test sound impulser afhænger 5 den simultane maskering af impulsvarigheden T. For længere impulsvarigheder er maskeringstærsklen uafhængig af varigheden. Hvis impulsvarigheden afkortes (T < 200 ms) vokser maskeringstærsklen med en stigning på - 10 dB/dekade.
10 Post-maskering strækker sig ca. 200 ms efter ud kobling af masker. Post-maskeringstærsklerne holder værdien af maskeringstærsklen indenfor de første 5 ms efter udkobling, og efter 200 ms opnås værdien af hør-barhedstærsklen i stille rum. Effekten af post-maske-15 ring - på grund af dennes varighed - spiller en meget mere signifikant rolle end effekten af pre-maskering. Post-maskering er ydermere afhængig af den tid, hvori masker'en er indkoblet. Hvis masker'en kun indkobles i en meget kort tid (T < 5 ms) falder post-maskerings-20 tærsklen til værdien for hørbarhedstærsklen i stille rum allerede efter 20 ms.
Brug af maskerinqstærskler.
De spektrale og tidsmæssige maskeringsegenskaber benyttes i transkoderen 2 hos senderen, jfr. fig. la, 25 til finere kvantisering af signalerne i de underbånd, der ikke maskeres eller kun maskeres lidt af hosliggende underbåndsignaler, end kvantisering af de signaler, der maskeres kraftigt og derfor er vanskelige at opfatte. Signaler i underbånd der maskeres fuldstændigt, 30 d.v.s. ligger under den resulterende maskeringstærskel behøver ikke at blive udsendt. Signalet i det pågældende underbånd kan sættes på nul. For at kunne dekode de transkodede signal i trin 12 hos modtageren (fig. 2a) må den i trin 5 frembragte styreinformation være til 35 stede 1 trin 12. For at forhindre co-transmlssion af denne styreinformation, benyttes skaleringsfaktorerne DK 172621 B1 27 for de enkelte underbånd som IndgangsinformatIon til trin 5, og disse skaleringsfaktorer udsendes i multi-plexsignalet, under alle omstændigheder som sekundær information. Derfor er den inverse transkoder 12 hos 5 modtageren i stand til alene på basis af sit kendskab til skaleringsfaktorerne for de enkelte underbånd og ved anvendelse af de samme kriterier for den resulterende maskeringstærskel, som i trin 5 hos senderen, præcist at knytte denne kvantisering med den lineære 10 kvantisering (eksempelvis opløsning på 16 til 18 bit pr. sample-værdi).
Betragtninger vedrørende aliasing-forvrænqnln- ger.
Udover den gensidige maskering fra hosliggende 15 underbånd skal der også til fordeling af kvantisering indenfor underbåndene tages hensyn til det omfang, hvori man kan skelne aliasing-forvrængninger. Disse forvrængninger skyldes den ikke-ideelle båndpasfiltre-ring i QMF filterbanken l, hvis udgangssignal samples 20 med en frekvens, der netop svarer til den minimale samplingsfrekvens på det dobbelte af den båndbredde, der er mulig for et ideelt filter. På grund af QMF filterstrukturen i banken 1 vil de aliasing-forvrængninger der ligger indenfor transmissionsområdet for et filter 25 i filterbanken l imidlertid kun fjernes praktisk taget totalt såfremt signalet har den samme opløsning i hosliggende båndpasfiltre. I den opstilling af underbånd, der er anvist i fig. 8 er aliasing-forvrængningerne kritiske hvad angår det omfang hvori de kan skelnes, 30 især indenfor området af de seks nedre underbånd, eftersom båndbredden af de anvendte QMF filtre er større end bredden af en frekvensgruppe, jfr. fig. 8. I de høje frekvenser er aliasing-forvrængningerne mindre kritiske eftersom QMF filtrene for de pågældende under-35 bånd har en væsentligt smallere bredde i forhold til frekvensgrupperne, og derfor maskeres kraftigere af nyttesignalet.
DK 172621 B1 28
For at undgå hørbarheds- eller aliasing-for-vrængningerne må højden af kvantiseringstrlnnene i de nedre underbånd, mellem hosliggende bånd, vælges så lige som muligt, medens de øvre underbånd kan have højere 5 forskelle i højden af deres kvantlseringstrin mellem hosliggende underbånd.
Bufferlaqre.
For yderligere at reducere informationsstrømmen kræves der bufferlagre hos senderen og hos modtageren i 10 transkoderne 2 og 12 for de enkelte underbåndsignaler, hvilket beskrives nærmere senere under henvisning til fig. 11. Sådanne bufferlagre gør det muligt at forsinke signalerne med en tid der tilnærmelsesvis svarer til post-maskeringstærskelværdlerne for det menneskelige 15 høresystem.
En forsinkelse af audiosignalet på mellem 200 ms og 500 ms er dels optimal overfor det menneskelige hø-resystems tidsmæssige maskeringstærskelværdier, dels velegnet til praktisk brug. Denne signalforsinkelse er 20 nødvendig for at sikre en effektiv fordeling af informationsstrømmen, ikke alene over til de forskellige underbånd, men også overfor de respektive tidsblokke for hvilke der er foretaget bestemmelse af skaleringsfakto-rer. En fordeling af informationsstrømmen der varierer 25 indenfor et tidsvindue får øget betydning, specielt under hensyntagen til de tidsmæssige maskeringstærskler.
Eksempelvis kan en hurtig stigning i niveauet af under-båndsignalerne transkodes meget præcist og hurtige fald i niveau, der på grund af det relativt langsommere hen-30 fald i post-maskeringstærskler maskeres kraftigere, kan transkodes med tilstrækkelig nøjagtighed. Tidsfordelingen i kvantiseringen udføres her - på samme måde som for den spektrale fordeling af de enkelte underbånd -på basis af maskeringstærskelkriteriet under hensynta-35 gen til trin 5.5 i fig. 3 for at opretholde et minimalt "maske/støj-forhold". Dette kan eksempelvis opnås ved DK 172621 B1 29 at bufferlageret overfører et styresignal der indeholder information om tilstanden i bufferlageret, til trinnet 5.5.
Fejlbeskyttelse af de transkodede underbåndslq- 5 naler.
Beskyttelsen af sampleværdierne mod transmission af fejl foregår i trin 7 (fig. la) og kan af følgende grunde forenkles væsentligt.
Den forstyrrende virkning af fejlbehæftede, mod- 10 tagne sampleværdier strækker sig ikke over hele audlo-båndbredden, men begrænses til bredden af det pågældende underbånd. Den maksimale amplitude af forstyrrelsen 1 det pågældende underbånd begrænses ved transmissionen af en skaleringsfaktor. Dette betyder at den spektrale 15 fordeling af fejlbehæftede, modtagne sampleværdier nogenlunde svarer til den spektrale struktur af nyttesignalet og giver derfor den størst mulige maskering af forstyrrelse forårsaget af transmission af fejl 1 sampleværdierne.
20 Da lydstyrken - med båndpasbegrænset støj på konstant niveau - afhænger af båndbredden er det hensigtsmæssigt at prioritere undgåelsen af interferens i underbånd af båndbredde større end frekvensgrupperne af det menneskelige høresystem overfor forstyrrelser i 25 smallere underbånd. Støj med en båndbredde på mere end 2 frekvensgrupper giver den samme lydstyrkeopfattelse, med et gennemsnitligt støj trykniveau, som støj der er hævet med 3 dB men kun har bredden af frekvensgrupperne, jfr. fig. 9.
30 For at bibringe forstyrrelserne en minimal ind flydelse på lydstyrken bør støj spektret reduceres til bredden af en frekvensgruppe. Da båndbredden i den i fig. 8 anviste opdeling af underbånd somme'tider overskrider væsentligt bredden af frekvensgrupperne i de 35 fem nederste underbånd (det første underbånd strækker sig over ialt fem frekvensgrupper), må sampleværdierne DK 172621 B1 30 for de to nederste underbånd udsættes for effektiv beskyttelse medens sampleværdierne i det tredie til det femte underbånd må beskyttes tilstrækkeligt.
QMF-flltrerlnq _i trinnene 1^ 03 11.
5 Behandlingstrinnene hos senderen og hos modtage ren, jfr. fig. la og 2a, illustreres efter det i fig.
10 viste funktionsskema.
QMF filterbanken 1, der får tilført det digitale audiosignal, består af en kaskade af QMF-filtre, der 10 successivt opdeler audiosignalspektret, i det foreliggende eksempel deles dette spektrum op i 24 underbånd-signaler. Hvert MF-filter udgør et såkaldt "finite impulse response"-filter (FIR-filter) der deler et digitalt indgangssignal op i to underbånd, der er spejlsym-15 metriske i forhold til grænsefrekvensen. Med henblik herpå vælges grænsefrekvensen for det ekvivalente lav-pasfilter således, at den svarer til en halvdel af indgangssignalets båndbredde.
Stejlheden af flankerne af lavpasfilterkarakte-20 ristikken er proportional med antallet af koefficienter i FIR-Iavpasfilteret. Kalkulationen af koefficienterne er beskrevet i publikationen "Multirate Digital Signal Processing", Chrochiere og Rabiner, publiceret af Prentice Hall, Englewood Cliffs, NJ, USA. Hvert MF-filter 25 deler sit signal op i to størrelsesmæssigt ens underbånd og skærer således sin samplingsfrekvens til det halve, således at den informationsmængde, der går igennem filteret i princippet forbliver uændret. Det er kun ordlængden på 20 til 23 bits af sampleværdierne, der 30 overføres gennem de kaskadekoblede MF-f iltre, der er noget større end for indgangssignalet, der sædvanligvis har en længde på 16 til 18 bit, hvorved fjernes afrundingsfejl der skyldes kaskadestrukturen. En frekvensfordeling i 24 bånd ved en samplingsfrekvens på 32 kHz 35 opnås ved at dele området fra 0 til 8 kHz op i 16 bånd på hver 500 Hz, medens området fra 8 til 16 kHz deles DK 172621 B1 31 op 1 8 bånd på hver l kHz, jfr. fig. 8. For at kunne gennemføre dette kræves der 5, henholdsvis 4 kaskadekoblede MF-filtre. De uundgåelige aliasing-forvrængnin-ger, der beror på at der ikke er endeligt stejle flan-5 ker på den ekvivalente lavpasfilterkarakteristik af MF-filtrene, kompenseres for under tilbagefiltrering, hvis kvantiseringen er identisk i hosliggende underbånd.
Kaskadekoblingen udnytter altid filterbankens kvalitet optimalt eftersom tidslængden af FIR-lavpas-10 filteret - med det samme antal koefficienter og dermed stejlheden pr. Hertz vokser 1 de sidste kaskadeforbundne trin. Fireogtres koefficienter pr. filter er tilstrækkelige til filtrering idet man har fundet ud af at stejlheden af filterflankerne ikke behøver at være 15 større end den maksimale stejlhed af maskeringstærskelkurven .
Hvis det samme sæt koefficienter benyttes i hvert filtertrin bliver filterstejlheden desto større, på grund af de forudgående spektrale opdelinger, jo la-20 vere samplingsfrekvensen er. I de sidste kaskadekoblede filtre er denne stejlhed ikke absolut nødvendig eftersom den ikke er gennemført ved samtlige båndgrænser.
Hvis man derfor i de sidste kaskadekoblede filtre anvender filtre med færre koefficienter er det primært 25 signalforsinkelsestiden der reduceres, hvilket har betydning i tidstro anvendelser, eksempelvis radioudsendelse. Til opnåelse af den fornødne flankestejlhed for det menneskelige høresystem kan man nøjes med 16 filterkoefficienter i den sidste filterkaskade.
30 Reelle filtre udviser en residuel ripple-spæn- ding der selvom den ikke har nogen mærkbar effekt på frekvensresponsen (rest-ripple-spænding < 0,002 dB) dog kan give en hørbar "filter-ringning", når der er tale om meget kortvarige impulser. Disse impulser er sekun-35 dære impulser, der tilvejebringes 10 ms til 100 ms før og efter hovedimpulsen og har et niveau på ca. -80 dB i DK 172621 B1 32 forhold til nyttesignalet. Til undgåelse af sådanne signalfejl, der under visse forhold kan være hørbare, udsættes signalet inden den aktuelle kodning for frem-adfiltrering og tilbagefiltrering men ikke for datare-5 duktion. Det fejlsignal, der tilvejebringes ved denne fremad- og tilbagefiltrering separeres og adderes med modsat fortegn til det oprindelige signal der skal kodes. På denne måde er der tilstrækkelig undertrykkelse af filtrenes forstyrrende egenskaber i koderen og 10 dekoderen.
Transkodnlng og bestemmelse af skalerlngsfaktorer i trin 2 og 4.
I transkodertrinnet 2 reduceres de ankommende under båndsignalers opløsning fra 16 (18) bit til 1,5 15 bit pr. sampleværdi. Dette betyder en reduktion 1 antallet af trin for sampleværdlerne i hvert underbånd.
Med henblik herpå lokaliseres først størrelsen af maksimal sampleværdi for hvert underbånd i forhold til et givet antal tidssuccessive sampleværdier (· blok) og 20 denne størrelse knyttes til et klassifikationsskema.
Dette skema indbefatter 64 klasser, der hver svarer til 6 bit som opdeler det dynamiske område af en 16 bit PKM (96 dB) i 96/64 dB = 1,5 dB pr. trin. Det trinnummer, der svarer til den maksimale sampleværdi repræsenterer 25 skaleringsfaktoren for den pågældende sekvens af sampleværdier. Den i trin 4 bestemte skaleringsfaktor tilføres transkodertrinnet 2, der yderligere modtager fra trin 5 information om det for hver blok fornødne antal kvantiseringstrin (baseret på det her anvendte maske-30 ringskriterium), og fra trin 6 yderligere informationer om den ønskede kvalitet for kildekodningen.
Som det fremgår af fig. 11 indbefatter trin 2 en styrebar forstærker 2.1 til lineær kvantisering af underbånds ignaler, hvilken forstærker styres af skale-35 ringsfaktoren fra trin 4. De forstærkede underbåndsig-naler føres gennem en styrebar forsinkelseskreds 2.2, DK 172621 B1 33 der leræves af hensyn til de tidsmæssige maskeringstærskler (jfr. det afsnit, der handler om "bufferlagre" ). De forstærkede og forsinkede underbåndsignaler udsættes for ny kvantisering i kvantiseringskredsen 5 2.3, der styres fra trinene 5 og 6.
Det område i positiv og negativ retning, der repræsenteres af skaleringsfaktoren deles op af det pågældende givne antal kvantiseringstrin. Resultatet er af højden af trinnene er mindre for de små værdier af 10 skaleringsfaktor svarende til smalle værdiområder, således at der dermed også er en større opløsning end for større værdier af skaleringsfaktor svarende til bredere værdiområder. Ved opdeling af det bredbåndede nyttesignal i underbåndsignaler er det derfor muligt at få en 15 højere opløsning for de enkelte spektrale komposanter, der har et lavt niveau, end muligt med en global kvantisering af det bredbåndede nyttesignal, hvori sådanne spektrale komposanter på lavt niveau opløses med den samme begrænsede nøjagtighed som de spektrale komposan-20 ter, der har et højt niveau.
For på den ene side at kunne følge med niveaustigninger under hensyntagen til den relativt korte pre maskering i det menneskelige høresystem og på den anden side ikke at være tvunget til at udsende skaleringsfak-25 toren for hyppigt, tilvejebringes skaleringsfaktoren eksempelvis for hver 4. sampleværdi, men man sender kun hveranden skaleringsfaktor. For i modtageren at kunne genskabe de ikke-udsendte skaleringsfaktorer, udsendes der en informationsbit for de "grupper på 4" der hører 30 til de udeladte skalerlngsfaktorer, hvilken informationsbit angiver gyldigheden af den forudgående eller den efterfølgende skaleringsfaktor for skalering af den pågældende blok på "gruppe af 4". Disse relationer beskrives under henvisning til og vises skematisk i fig.
35 12 og 13.
Fig. 12 illustrerer dannelsen af skaleringsfaktoren for en niveaukurve med blokke, der hver er på 8 DK 172621 B1 34 sampleværdier. Fig. 13 viser den samme niveaukurve for blokke, der hver er på 4 sampleværdier og hvor det kun er hveranden skaleringsfaktor på 6 bit, der udsendes samtidigt med at der anvendes en yderligere informa-5 tionsbit således, at der nu i stedet for at udsende 6 bit/8 sampleværdier, udsendes 7 bit/8 sampleværdier.
Som det ses i fig. 13 detekteres stigningen i niveau mellem skaleringsfaktorerne Sn og Sn+1 tidsmæssigt set med en større nøjagtighed end i det i fig. 12 viste 10 tilfælde. Den nødvendigvis kraftige kvantiseringsstøj i fig. 12 (høj værdi af Sn) for de fire første sampleværdier der hører til skaleringsfaktoren Sn viser sig at være lavere på grund af den lavere skaleringsfaktor i fig. 13, med tilsvarende finere kvantiseringstrin. Selv 15 for tidsmæssigt meget korte niveauværdispidser (tidsmæssigt mindre end 4 sample værdier) er der tidsmæssigt set en bedre tilnærmelse til niveaustigningen ved hjælp af den yderligere informationsbit (fig. 13), medens det tilhørende niveauhenfald har mindre betydning på grund 20 af den væsentligt længere post-maskering af det menneskelig høresystem, således at selv lange "støj-haler" kan tolereres.
Skaleringsfaktoren og de yderligere informationsbit tilvejebringes for hvert underbånd på følgende 25 måde, idet man for forståelsens skyld antager, at det kun er de skaleringsfaktorer, der har lige Indeks, S2n, ^3n+2' ..... der udsendes.
Sjyj < < S2n+2 nærmeste niveauværdi 30 S2n < S2n+1 * S2n+2 S2n+2 fra S2n+1 S2n > S2n+i > S2n+2 nærmeste niveauværdi S2n > S2n+1 < S2n+2 S2n+l fra S2n
For at gøre dette stive klassifikationsskema for 35 skaleringsfaktoren finere i 1,5 dB-trinene, udsendes der yderligere information til minimering af den fejl, DK 172621 B1 35 der dannes ved denne klassifikation. En yderligere information på 3 bit tilordnes hver B. sampleværdi i frekvensområderne fra 1,5 til 3,5 kHz og fra 3,5 til 8 kHz. I henhold til fig. 8 angiver denne yderligere In-5 formation den totale afvigelse fra 1,5 dB-rasteret i (1/8). 1,5 dB trin for samtlige underbånd der dækker disse to frekvensområder. Dette er til fordel for f.eks. separate toner, hvis niveauændringer kan udsendes med en præcision på ca. 0,2 dB.
10 Valget af dette finere raster bør kun foretages på basis af en minimal kvadratisk fejl, således at det kun er stærkt modulerede underbånd, der bestemmer det fine raster. Derfor er den yderligere information af følgende grunde ikke anvendelig for samtlige underbånd: 15 I det i fig. 8 anviste, valgte underbåndskema er båndbredden af de tre laveste underbånd op til 1,5 kHz væsentligt større end båndbredden af frekvensgrupperne for det menneskelige høresystem, således at maskeringen indenfor disse tre underbånd er relativt svag. Derfor 20 kræver disse tre underbånd en relativt større opløsning på f.eks. 10,6 bit/sampleværdi for underbåndene fra 0,5 til 1 kHz. På grund af den relativt høje opløsning for disse underbånd er ulemperne ved klassifikationen uden betydning for skaleringsfaktoren under 1 kHz. Over 8 25 kHz er 1,5 dB klassifikationen tilstrækkelig.
En yderligere egenskab ved transkodertrinnet 2 er at en skaleringsfaktor med størrelse på nul behandles således, at for alle reducerede sampleværdiinforma-tioner udsendes den pågældende blok af det pågældende 30 underbåndsignal ikke. Det samme gælder, hvis trin 5 noterer at skaleringsfaktoren i et givet underbånd ligger under den pågældende maskeringstærskel (gensidig maskering) således, at trin 5 giver trin 4 besked om at "skaleringsfaktoren skal sættes på nul".
35 Desuden kan trin 4 indbefatte en støjblok, der for hvert underbånd kan indkobles for at afskaffe en DK 172621 B1 36 tom kanals støj, unøjagtigheder i A/D-konverteringen og lignende. I denne forbindelse kan der være tale om justerbare tærskler.
I kvantiseringen i trin 2 skal der være et ulige 5 antal kvantiseringstrin for at undgå at værdier nær nul konstant skifter mellem 2 kvantiseringstrin, idet der ellers ville være komposanter, som ligger langt over signalniveauet for underbåndet. Det er ikke alle trinnumre der direkte kan konverteres til digitale værdier 10 uden at man går glip af brugbare værdier, og nedsætter transmissionskapaciteten. Til eksempelvis fremvisning af tre mulige trin, er der behov for to informationsbit, idet den fjerde mulige kombination af sådanne 2 bit imidlertid forbliver uanvendt og vil her betyde et 15 merforbrug af information på 33%.
Sådanne tab i transmissionskapaciteten kan minimeres ved, at flere sampleværdier sammenkodes i et enkelt dataord. Eksempelvis giver fem sampleværdier, der hver er på tre trin 24 3 - 35 mulige kombinationer som 20 kan udsendes med 8 bit, d.v.s. 256 trin, med lavere irrelevans og beskeden behov for kodning.
Yderligere spektral analyse til opnåelse af styreinformation.
En anden udførelsesform for fremgangsmåden iføl-25 ge opfindelsen er illustreret i fig. Id for senderen og fig. 2d for modtageren. En væsentlig del af styreinformationen for kvantiseringen af sampleværdierne opnås ud fra audiosignalets spektrale kurve. Til opnåelse af denne information udsættes audiosignalet for en Fourier 30 opdeling hos senderen, hvilket eksempelvis kan opnås ved hjælp af en fast Fourier-transformation. Denne Fou-rier-transformation giver i hovedsagen følgende fordele: - mere præcis spektral repræsentation sammenlig-35 net med en båndpas-opdeling af audiosignalet, - tonekomposanterne kan skelnes fra de støj lignende komposanter af et audiosignal, DK 172621 B1 37 - mere præcis spektral analyse og differentiering mellem tonekomposanter og støj lignende komposan-ter, hvilket sikrer en mere effektiv bestemmelse af maskeringstærsklerne i forhold til det tilfælde, hvor 5 styrevariablerne kun opnås på basis af et begrænset antal af underbåndsignaler, - reduktion af den fornødne mængde hardware hos modtageren samtidig med at der er kortere forsinkelse i transmissionen af audiosignalet og den samme transmis- 10 sionstakt for multiplexsignalet, som man opnår uden denne yderligere foranstaltning.
Reduktionen i hardware skyldes det forhold, at der kun er behov for færre båndpasfiltre. Det lave antal båndpasfiltre betyder primært, at der stilles mind-15 re krav til processoren, hvilket har en positiv indvirkning på udviklingen af en prisbillig modtager. Bredere underbånd giver en kortere total forsinkelse i systemet. Fig. Id og 2d indikerer denne reduktion i hardware idet der i stedet for de 24 underbånd i den fore-20 gående udførelsesform, nu kun anvendes 16 underbånd.
Den principielt større datastrøm for transkodede underbåndssignaler som følge af de bredere underbånd, kan tilnærmelsesvis opvejes ved en mere præcis bestemmelse af maskeringstærsklerne.
25 En tilstrækkelig spektral opløsning i området for de lave frekvenser af audiosignalet kunne opnås med en spektral repræsentation af hosliggende bidragsværdier på ca. Δf = 10 Hz. Da den afgørende fordel ved en præcis spektral bestemmelse er given for bestemmel-30 sen af de simultane hørbarhedstærskler (22 ud af ialt 24 frekvensgrupper for det menneskelige høresystem ligger indenfor frekvensområdet op til 10 kHz), er en spektral analyse op til ca. 10 kHz tilstrækkelig. Hvis amplitudespektret spektralt repræsenteres af 512 reelle 35 værdier, indebærer dette at der er en frekvensafstand åf på 20 Hz mellem hosliggende værdier. En mere præcis DK 172621 B1 38 frekvensbestemmelse er mulig på basis af en vurdering af hosliggende frekvenspunkter ved hjælp af passende interpolations algoritmer.
Udover styrevariablerne fra FFT-analysen indbe-5 fatter indgangsværdierne til blokken for dynamisk fordeling af informationsstrømmen (jfr. fig. id) også sty-revariabler til bestemmelse' af kvalitet, kanalnummeret og skaleringsfaktorerne for de enkelte underbånd. Ved sammenligning mellem styrevariablerne på basis af FFT-10 analysen og skaleringsfaktorerne kan aliasing-forvræng-ninger, der ikke længere kompenseres fuldt ud for i modtageren ved forskelle i kvantisering af underbånd-signalerne, betragtes som værende tilstrækkelig præcise under den dynamiske fordeling af informationsstrømmen.
15 Trinvis datareduktion.
i forskellige anvendelser af fremgangsmåden i-følge opfindelsen er det fordelagtigt at foretage trinvis reduktion af dataene i audiosignalet. Ved eksempelvis transmission af audiosignaler af høj kvalitet mel-20 lem to studier, skal datareduktionen findes således sted, at der er en tilstrækkelig "maske til støj "-reserve til at tillade en efterfølgende behandling uden tab i kvalitet (studiekvalitet, jfr. de afsnit, der handler om "anvendelse af fluktuerende informations-25 strøm", "forøget signal/støj-forhold" og "kvalitetsgraduering" ). Til yderligere fordeling og/eller oplagring er der ikke behov for øget signal/støj-forhold, hvorfor audiosignalerne, der er kodet for studiekvalitet kan underkastes en mere omfattende datareduktion.
30 En fordel ved fremgangsmåden ifølge opfindelsen ligger i at de forskellige kvalitetsgraduationer for audiosignaler, der er kodet i henhold til opfindelsen, er "downward compatible", hvilket betyder at f.eks. et multiplexsignal på 192 kbit/s, kan konverteres til et 35 multiplexsignal på 128 kbit/s ved hjælp af en speciel transkoder, hvor 192 kbit/s-kodningen sikrer et øget DK 172621 B1 39 signal/støj-forhold (yderligere behandling er mulig) medens 128 kbit/s-kodningen giver et lavere signal/ støj-forhold og en højere grad af fejlbeskyttelse.
Fig. le viser en udførelsesform for en sådan 5 transkoder. Den består af trinnene 12, 13, 15, 17 og 18 i dekoderen ifølge fig. 2a og trinnene 2, 3, 5, 7 og 8 i fig. la. Den er karakteriseret ved at det 192 kbit/s kodede audiosignal ikke genvindes og registreres komplet men ved at den sekundære information (skalerings-10 faktorer) opnået udfra det oprindelige signal danner grundlag for den nye kodning i den højre del af transkoderen (trinene 2, 3, 5, 7 og 8). Herved undgår man en reduktion af signal/støj-forholdet på grund af kaskadekoblingen. Da den inverse filtrering og den fremadgåen-15 de filtrering (trinene henholdsvis 11 og 1 i fig. 2a og la) er udeladt, er der nu i den i fig. 1 anviste transkoder en kort forsinkelse (ca. 4 ms).
20 25 30 35

Claims (25)

1. Fremgangsmåde ved transmission eller oplag-5 ring af digitaliserede audiosignaler, hvor på sendesiden eller produktionssiden: a) audiosignalet repræsenteres digitalt ved hjælp af et antal spektrale underbåndsignaler med tids-diskrete, kvantiserede sampleværdier til stede for 10 hvert underbåndsignal, b) kvantiseringen af sampleværdierne ændres (kodes) i de individuelle underbånd på basis af de respektive maskeringstærskler for det menneskelige høresystem i retning mod en reduktion af information, idet stør- 15 reisen af den fornødne totale informationsstrøm til transmission eller oplagring af alle kodede underbåndsignaler, varierer i afhængighed af audiosignalets spektrale og tidsmæssige struktur, og c) de kodede underbåndsignaler udsendes eller 20 oplagres, på playback siden: d) de kodede underbåndsignaler dekodes, og e) de dekodede underbåndsignaler kombineres til et bredbåndet, digitalt audiosignal, kendeteg- 25. e t ved, at kvantiseringen af sampleværdierne i underbåndene styres på basis af niveauværdierne for hvert underbåndsignal eller på basis af niveauinformationer der er udledt derfra, således at kvantiseringsstøjni-veauerne for de enkelte underbåndsignaler tilnærmelses-30 vis ligger i samme afstand fra den af de individuelle underbåndsignaler resulterende maskeringstærskel, og at afstandene mellem kvantiseringsstøjniveauerne for un-derbåndsignalerne og den resulterende maskeringstærskel indstilles af forskellen mellem den fornødne totale in-35 formationsstrøm og den totale informationsstrøm, der er til rådighed for kodning. DK 172621 B1
2. Fremgangsmåde ifølge krav 1, kendetegnet ved, at størrelsen af den til rådighed værende totale informationsstrøm er variabel og eventuelt tilnærmelsesvis lig med den fornødne totale informa- 5 tionsstrøm og at dekodningen på playback-siden afpasses herefter.
3. Fremgangsmåde ifølge krav log2, kende-tegnet ved, at kvantiseringsstøjniveauerne for underbåndsignalerne ligger under eller over den resul- 10 terende maskeringstærskel.
4. Fremgangsmåde ifølge ethvert af kravene 1-3, kendetegnet ved, at de underbåndsignaler, der kun influerer lidt på audiosignalets tonalitet og hvis niveauværdier ligger over den resulterende maske- 15 ringstærskel sættes på nul, såfremt kvantiseringsstøj- niveauerne for underbåndsignalerne ligger over den resulterende maskeringstærskel.
5. Fremgangsmåde ifølge krav 4, kende- t e g net ved, at der kun sættes på nul så mange 20 underbånd som nødvendigt til reduktion af kvantlse- ringsstøjniveauet for underbåndsignalerne i det omfang nævnte niveau ligge lige netop under den resulterende maskeringstærskel.
6. Fremgangsmåde ifølge krav 5, kende- 25 tegnet ved, at de underbånd, der har den absolut største båndbredde sættes på nul.
7. Fremgangsmåde ifølge ethvert af kravene 1-6, kendetegnet ved, at størrelsen af informationsstrømmen for et kodet nyttesignal reduceres trin- 30 vis, tilnærmelsesvis med en heltalsfaktor på n og at der 1 stedet for udsendes n-i yderligere nyttesignaler.
8. Fremgangsmåde ifølge krav i, kende tegnet ved, at den resulterende maskeringstærskel opnås på basis af niveauværdierne i hvert underbånd un- 35 der hensyntagen til de gældende naturlove for pre-ma- skering, simultan maskering og post-maskering. DK 172621 B1
9. Fremgangsmåde ifølge krav 8, k ende-tegnet ved, at de tidsmæssige maskeringstærskler tages i betragtning på basis af underbåndniveauværdier der er tilgængelige indenfor et tidsvindue på ca. 500 5 ms.
10. Fremgangsmåde ifølge krav 1, kendetegnet ved, at de underbåndsignaler, hvis niveauværdier ligger under den resulterende maskeringstærskel kodes ikke eller kun kodes med lav opløsning. 10 li. Fremgangsmåde ifølge krav 1, kende tegnet ved, at størrelsen af kvantiseringstrinne-ne for underbåndsignalerne dimensioneres således, at de under opdelingen af det digitaliserede audiosignal i underbåndsignaler forekommende aliasing-forvrængninger 15 ligger under maskeringstærsklen for det menneskelige høresystem.
12. Fremgangsmåde ifølge krav 1, kendetegnet ved, at der på sendersiden foretages bestemmelse af en skaleringsfaktor for hvert digitalise- 20 ret underbåndsignal, hvilken skaleringsfaktor klassificerer spidsværdien af underbåndsignalniveauet indenfor et defineret tidsinterval, at der, under kodning af hvert underbåndsignal foretages bestemmelse af opløsningen af det pågældende 25 underbåndsignal på basis af den bestemte skaleringsfaktor, at de bestemte skaleringsfaktorer udsendes sammen med de kodede underbåndsignaler, og at de udsendte skaleringsfaktorer benyttes til 30 dekodning af de modtagne, kodede underbåndsignaler med henblik på genskabelse af det oprindelige underbåndsignal.
13. Fremgangsmåde ifølge krav 12, kendetegnet ved, at antallet af klassificeringstrin 35 til bestemmelse af skaleringsfaktoren vælges således at opfattelsestærsklen for ændringerne i niveau indenfor det tilhørende underbånd ikke nås. DK 172621 B1
14. Fremgangsmåde ifølge krav 12 eller 13, kendetegnet ved, at tidsintervallet for klassificering af spidsværdien for det pågældende un-derbåndsignal bestemmes således, at det svarer til den 5 tidmæssige maskering i det menneskelige høresystem, og i afhængighed af den tidsmæssige struktur i underbånd-signalet indenfor det tilhørende underbånd.
15. Fremgangsmåde ifølge ethvert af kravene 12-14, kendetegnet ved, at der for hver blok af 10 underbåndsignalet bestående af en sekvens af sampleværdier foretages bestemmelse af skaleringsfaktoren alene for den første halvdel af blokken, og at der for den anden halvdel af blokken anvendes skaleringsfaktoren for den første halvdel af den samme blok, eller for den 15 efterfølgende blok.
16. Fremgangsmåde ifølge ethvert af krave 1-15, kendetegnet ved, at styreinformationen til kvantisering af sampleværdierne i underbåndene, både hos senderen og hos modtageren, opnås ud fra skale- 20 ringsfaktorerne for underbåndsignalerne.
17. Fremgangsmåde ifølge krav 1, 8, 9 og 16, kendetegnet ved, at styreinformationerne til kvantisering af sampleværdierne kun tilvejebringes hos senderen og at denne information yderligere udsendes 25 til genkvantisering hos modtageren.
18. Fremgangsmåde ifølge krav 17, kendetegnet ved, at styreinformationen til kvantisering af sampleværdierne tilvejebringes, hos senderen, på basis af en valgt spektral analyse af det digitale 30 audiosignal.
19. Fremgangsmåde ifølge krav 1 og 12, kendetegnet ved, at skaleringsfaktorerne forud for transmissionen udsættes for en større fejlbeskyttelse end de transkodede sampleværdier af underbåndsignaler- 35 ne.
20. Fremgangsmåde ifølge krav 1, 17 og 18, kendetegnet ved, at styreinformationen inden DK 172621 B1 transmissionen udsættes for en større fejlbeskyttelse end de transkodede sampleværdier for underbåndsignaler-ne.
21. Fremgangsmåde ifølge krav 19 og 20, k e n -5 detegnet ved, at fejlbeskyttelsen af skale- ringsfaktorerne og/eller af styreinformationerne i underbånd af større relativ båndbredde er højere end i underbånd af smallere relativ båndbredde.
22. Fremgangsmåde ifølge krav l, kende-10 tegnet ved, at de transkodede sampleværdier udsættes for fejlbeskyttelse i underbåndene således, at der er større fejlbeskyttelse i de underbånd der har større relativ båndbredde, end i underbånd der har mindre relativ båndbredde.
23. Fremgangsmåde ifølge krav i og 19-22, kendetegnet ved, at mængden af information til fejlbeskyttelse (grad af fejlbeskyttelse) bestemmes på basis af den spektrale og tidsmæssige struktur af det digitale audiosignal således: 20. at der for audiosignaler der kræver en lille total informationsstrøm til transmission skabes en høj grad af fejlbeskyttelse, og at der for audiosignaler der kræver en større total informationsstrøm til transmission skabes en la-25 vere grad af fejlbeskyttelse.
24. Fremgangsmåde ifølge krav 23, kendetegnet ved, at den signalafhængige grad af fejlbeskyttelse dimensioneres således, at subjektiv interferens fremkaldt af bitfejl ikke er større for svagt 30 maskerende audiosignaler, end for stærkt maskerende audiosignaler .
25. Fremgangsmåde ifølge krav l, kendetegnet ved, at hvis en niveautærskelværdi ikke nås for et underbåndsignal, transkodes dettes sample- 35 værdier ikke.
26. Fremgangsmåde ifølge ethver af kravene 4-6 og 12-16, kendetegnet ved, at skalerlngsfak- DK 172621 B1 toren for et underbånd indeholder information om, hvorvidt sampléværdierne for dette underbånd er på nul indenfor en blok og ikke udsendes.
DK198804050A 1986-11-21 1988-07-20 Fremgangsmåde til transmission af digitaliserede audiosignaler DK172621B1 (da)

Applications Claiming Priority (4)

Application Number Priority Date Filing Date Title
DE3639753 1986-11-21
DE19863639753 DE3639753A1 (de) 1986-11-21 1986-11-21 Verfahren zum uebertragen digitalisierter tonsignale
PCT/EP1987/000723 WO1988004117A1 (en) 1986-11-21 1987-11-20 Process for transmitting digital audio-signals
EP8700723 1987-11-20

Publications (3)

Publication Number Publication Date
DK405088A DK405088A (da) 1988-07-20
DK405088D0 DK405088D0 (da) 1988-07-20
DK172621B1 true DK172621B1 (da) 1999-03-08

Family

ID=6314427

Family Applications (1)

Application Number Title Priority Date Filing Date
DK198804050A DK172621B1 (da) 1986-11-21 1988-07-20 Fremgangsmåde til transmission af digitaliserede audiosignaler

Country Status (9)

Country Link
US (1) US4972484A (da)
EP (1) EP0290581B1 (da)
JP (1) JP2599624B2 (da)
KR (1) KR950014066B1 (da)
AT (1) ATE66553T1 (da)
DE (2) DE3639753A1 (da)
DK (1) DK172621B1 (da)
FI (1) FI84538C (da)
WO (1) WO1988004117A1 (da)

Families Citing this family (234)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
NL8700985A (nl) * 1987-04-27 1988-11-16 Philips Nv Systeem voor sub-band codering van een digitaal audiosignaal.
DE3721478A1 (de) * 1987-06-30 1989-01-12 Thomson Brandt Gmbh Verfahren zur uebertragung und/oder aufzeichnung und wiedergabe von digitalisierten audiosignalen
NL8720747A (nl) * 1987-08-26 1989-07-03 Vnii Radiovesh Priema Akustiki Stelsel voor het coderen en decoderen van geluidprogrammasignalen.
USRE40280E1 (en) 1988-12-30 2008-04-29 Lucent Technologies Inc. Rate loop processor for perceptual encoder/decoder
US5341457A (en) * 1988-12-30 1994-08-23 At&T Bell Laboratories Perceptual coding of audio signals
US5222189A (en) * 1989-01-27 1993-06-22 Dolby Laboratories Licensing Corporation Low time-delay transform coder, decoder, and encoder/decoder for high-quality audio
US5109417A (en) * 1989-01-27 1992-04-28 Dolby Laboratories Licensing Corporation Low bit rate transform coder, decoder, and encoder/decoder for high-quality audio
US5142656A (en) * 1989-01-27 1992-08-25 Dolby Laboratories Licensing Corporation Low bit rate transform coder, decoder, and encoder/decoder for high-quality audio
DE69026278T3 (de) 1989-01-27 2002-08-08 Dolby Lab Licensing Corp Adaptiv Bitzuordnung für Audio-Koder und Dekoder
US5752225A (en) * 1989-01-27 1998-05-12 Dolby Laboratories Licensing Corporation Method and apparatus for split-band encoding and split-band decoding of audio information using adaptive bit allocation to adjacent subbands
AU643677B2 (en) * 1989-01-27 1993-11-25 Dolby Laboratories Licensing Corporation Low time-delay transform coder, decoder, and encoder/decoder for high-quality audio
DE3943880B4 (de) * 1989-04-17 2008-07-17 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Digitales Codierverfahren
JPH02288520A (ja) * 1989-04-28 1990-11-28 Hitachi Ltd 背景音再生機能付き音声符号復号方式
NL9000338A (nl) * 1989-06-02 1991-01-02 Koninkl Philips Electronics Nv Digitaal transmissiesysteem, zender en ontvanger te gebruiken in het transmissiesysteem en registratiedrager verkregen met de zender in de vorm van een optekeninrichting.
US5040217A (en) * 1989-10-18 1991-08-13 At&T Bell Laboratories Perceptual coding of audio signals
JPH03181232A (ja) * 1989-12-11 1991-08-07 Toshiba Corp 可変レート符号化方式
DE3942570A1 (de) * 1989-12-22 1991-07-04 Inst Rundfunktechnik Gmbh Verfahren zum uebertragen von digitalen informationen, insbesondere toninformationen, in einem fernsehkanal
US6389010B1 (en) * 1995-10-05 2002-05-14 Intermec Ip Corp. Hierarchical data collection network supporting packetized voice communications among wireless terminals and telephones
US5502789A (en) * 1990-03-07 1996-03-26 Sony Corporation Apparatus for encoding digital data with reduction of perceptible noise
JP2913731B2 (ja) * 1990-03-07 1999-06-28 ソニー株式会社 ディジタルデータの高能率符号化方法
US5367608A (en) * 1990-05-14 1994-11-22 U.S. Philips Corporation Transmitter, encoding system and method employing use of a bit allocation unit for subband coding a digital signal
JP2751564B2 (ja) * 1990-05-25 1998-05-18 ソニー株式会社 ディジタル信号符号化装置
JP2906646B2 (ja) * 1990-11-09 1999-06-21 松下電器産業株式会社 音声帯域分割符号化装置
US5365553A (en) * 1990-11-30 1994-11-15 U.S. Philips Corporation Transmitter, encoding system and method employing use of a bit need determiner for subband coding a digital signal
DE4102324C1 (da) * 1991-01-26 1992-06-17 Institut Fuer Rundfunktechnik Gmbh, 8000 Muenchen, De
DE4203436A1 (de) * 1991-02-06 1992-08-13 Koenig Florian Datenreduzierte sprachkommunikation
US5559900A (en) * 1991-03-12 1996-09-24 Lucent Technologies Inc. Compression of signals for perceptual quality by selecting frequency bands having relatively high energy
EP0506394A2 (en) * 1991-03-29 1992-09-30 Sony Corporation Coding apparatus for digital signals
US5278826A (en) * 1991-04-11 1994-01-11 Usa Digital Radio Method and apparatus for digital audio broadcasting and reception
US5315583A (en) * 1991-04-11 1994-05-24 Usa Digital Radio Method and apparatus for digital audio broadcasting and reception
GB2257606B (en) * 1991-06-28 1995-01-18 Sony Corp Recording and/or reproducing apparatuses and signal processing methods for compressed data
DE4124493C1 (da) * 1991-07-24 1993-02-11 Institut Fuer Rundfunktechnik Gmbh, 8000 Muenchen, De
EP0525774B1 (en) * 1991-07-31 1997-02-26 Matsushita Electric Industrial Co., Ltd. Digital audio signal coding system and method therefor
GB2258372B (en) * 1991-08-02 1995-05-31 Sony Corp Apparatus for and methods of recording and/or reproducing digital data
ES2164640T3 (es) * 1991-08-02 2002-03-01 Sony Corp Codificador digital con asignacion dinamica de bits de cuantificacion.
JP3178026B2 (ja) * 1991-08-23 2001-06-18 ソニー株式会社 ディジタル信号符号化装置及び復号化装置
EP0535889B1 (en) * 1991-09-30 1998-11-11 Sony Corporation Method and apparatus for audio data compression
US10361802B1 (en) 1999-02-01 2019-07-23 Blanding Hovenweep, Llc Adaptive pattern recognition based control system and method
US8352400B2 (en) 1991-12-23 2013-01-08 Hoffberg Steven M Adaptive pattern recognition based controller apparatus and method and human-factored interface therefore
DE4202140A1 (de) * 1992-01-27 1993-07-29 Thomson Brandt Gmbh Verfahren zur uebertragung digitaler audio-signale
JP3134455B2 (ja) * 1992-01-29 2001-02-13 ソニー株式会社 高能率符号化装置及び方法
EP0559348A3 (en) 1992-03-02 1993-11-03 AT&T Corp. Rate control loop processor for perceptual encoder/decoder
DE4209544A1 (de) * 1992-03-24 1993-09-30 Inst Rundfunktechnik Gmbh Verfahren zum Übertragen oder Speichern digitalisierter, mehrkanaliger Tonsignale
JP2693893B2 (ja) * 1992-03-30 1997-12-24 松下電器産業株式会社 ステレオ音声符号化方法
DE4211945C1 (da) * 1992-04-09 1993-05-19 Institut Fuer Rundfunktechnik Gmbh, 8000 Muenchen, De
JP3278900B2 (ja) * 1992-05-07 2002-04-30 ソニー株式会社 データ符号化装置及び方法
US5414859A (en) * 1992-05-27 1995-05-09 Tandy Corporation Interprocessor communication protocol with built-in error prevention encoding
US5594601A (en) * 1992-05-27 1997-01-14 Tandy Corporation Method of programming audio tracks in a sequential medium
JP3153933B2 (ja) * 1992-06-16 2001-04-09 ソニー株式会社 データ符号化装置及び方法並びにデータ復号化装置及び方法
JP2976701B2 (ja) * 1992-06-24 1999-11-10 日本電気株式会社 量子化ビット数割当方法
US5890104A (en) * 1992-06-24 1999-03-30 British Telecommunications Public Limited Company Method and apparatus for testing telecommunications equipment using a reduced redundancy test signal
GB9213459D0 (en) * 1992-06-24 1992-08-05 British Telecomm Characterisation of communications systems using a speech-like test stimulus
WO1995015035A1 (en) * 1993-11-25 1995-06-01 British Telecommunications Public Limited Company Method and apparatus for testing telecommunications equipment
US5301363A (en) * 1992-06-29 1994-04-05 Corporate Computer Systems, Inc. Method and apparatus for adaptive power adjustment of mixed modulation radio transmission
WO1995022816A1 (en) * 1992-06-29 1995-08-24 Corporate Computer Systems, Inc. Method and apparatus for adaptive power adjustment of mixed modulation radio transmission
DE4222623C2 (de) * 1992-07-10 1996-07-11 Inst Rundfunktechnik Gmbh Verfahren zum Übertragen oder Speichern von digitalisierten Tonsignalen
DE4229372C2 (de) * 1992-09-03 1997-07-03 Inst Rundfunktechnik Gmbh Verfahren zum Übertragen oder Speichern der Quantisierungsinformation bei einer bitratenreduzierenden Quellcodierung
JP3508146B2 (ja) * 1992-09-11 2004-03-22 ソニー株式会社 ディジタル信号符号化復号化装置、ディジタル信号符号化装置及びディジタル信号復号化装置
JP3127600B2 (ja) * 1992-09-11 2001-01-29 ソニー株式会社 ディジタル信号復号化装置及び方法
US6252909B1 (en) * 1992-09-21 2001-06-26 Aware, Inc. Multi-carrier transmission system utilizing channels of different bandwidth
US5408580A (en) * 1992-09-21 1995-04-18 Aware, Inc. Audio compression system employing multi-rate signal analysis
DE4234015A1 (de) * 1992-10-09 1994-04-14 Thomson Brandt Gmbh Verfahren und Vorrichtung zur Wiedergabe eines Audiosignals
JP3343962B2 (ja) * 1992-11-11 2002-11-11 ソニー株式会社 高能率符号化方法及び装置
JP3185413B2 (ja) * 1992-11-25 2001-07-09 ソニー株式会社 直交変換演算並びに逆直交変換演算方法及びその装置、ディジタル信号符号化及び/又は復号化装置
US5402124A (en) * 1992-11-25 1995-03-28 Dolby Laboratories Licensing Corporation Encoder and decoder with improved quantizer using reserved quantizer level for small amplitude signals
DE4239506A1 (de) * 1992-11-25 1994-05-26 Inst Rundfunktechnik Gmbh Verfahren zur bitratenreduzierenden Quellcodierung für die Übertragung und Speicherung von digitalen Tonsignalen
CA2106440C (en) * 1992-11-30 1997-11-18 Jelena Kovacevic Method and apparatus for reducing correlated errors in subband coding systems with quantizers
JP3123286B2 (ja) * 1993-02-18 2001-01-09 ソニー株式会社 ディジタル信号処理装置又は方法、及び記録媒体
JP3123290B2 (ja) * 1993-03-09 2001-01-09 ソニー株式会社 圧縮データ記録装置及び方法、圧縮データ再生方法、記録媒体
DE4308175C2 (de) * 1993-03-15 1995-09-07 Inst Rundfunktechnik Gmbh Verfahren zum Wiedergeben eines ein- oder mehrkanaligen digitalen, blockweise codierten Tonsignals
EP0649137A4 (en) * 1993-04-14 1998-10-21 Sony Corp SIGNAL TRANSFORMATION METHOD AND APPARATUS AND RECORDING MEDIUM.
JP3173218B2 (ja) * 1993-05-10 2001-06-04 ソニー株式会社 圧縮データ記録方法及び装置、圧縮データ再生方法、並びに記録媒体
ATE211326T1 (de) * 1993-05-31 2002-01-15 Sony Corp Verfahren und vorrichtung zum kodieren oder dekodieren von signalen und aufzeichnungsmedium
EP0705501B1 (en) * 1993-06-21 1999-11-17 BRITISH TELECOMMUNICATIONS public limited company Method and apparatus for testing telecommunications equipment using a reduced redundancy test signal
BR9405445A (pt) * 1993-06-30 1999-09-08 Sony Corp Aparelho codificador e decodificador de sinal apropriado para codificar um sinal de entrada e decodificar um sinal codificado, suporte de gravação onde sinais codificados são gravados, e processo de codificação e de decodificação de sinal para codificar um sinal de entrada e decodificar um sinal codificado.
TW272341B (da) * 1993-07-16 1996-03-11 Sony Co Ltd
NL9301358A (nl) * 1993-08-04 1995-03-01 Nederland Ptt Transcodeerinrichting.
US5581653A (en) * 1993-08-31 1996-12-03 Dolby Laboratories Licensing Corporation Low bit-rate high-resolution spectral envelope coding for audio encoder and decoder
TW327223B (en) * 1993-09-28 1998-02-21 Sony Co Ltd Methods and apparatus for encoding an input signal broken into frequency components, methods and apparatus for decoding such encoded signal
KR100330290B1 (ko) * 1993-11-04 2002-08-27 소니 가부시끼 가이샤 신호부호화장치,신호복호화장치,및신호부호화방법
WO1995013660A1 (fr) * 1993-11-09 1995-05-18 Sony Corporation Appareil de quantification, procede de quantification, codeur a haute efficacite, procede de codage a haute efficacite, decodeur, supports d'enregistrement et de codage a haute efficacite
KR960003628B1 (ko) * 1993-12-06 1996-03-20 Lg전자주식회사 디지탈신호의 부호화/복호화 방법 및 장치
JPH07160297A (ja) * 1993-12-10 1995-06-23 Nec Corp 音声パラメータ符号化方式
KR0134318B1 (ko) * 1994-01-28 1998-04-29 김광호 채널간의 마스킹특성을 고려한 비트할당장치 및 그 방법과 복호화장치
JP3186412B2 (ja) * 1994-04-01 2001-07-11 ソニー株式会社 情報符号化方法、情報復号化方法、及び情報伝送方法
JP3277677B2 (ja) * 1994-04-01 2002-04-22 ソニー株式会社 信号符号化方法及び装置、信号記録媒体、信号伝送方法、並びに信号復号化方法及び装置
CA2163371C (en) * 1994-04-01 2005-09-20 Kyoya Tsutsui Information encoding method and apparatus, information decoding method and apparatus, information transmission method, and information recording medium
DE4430864C2 (de) * 1994-08-31 2003-04-30 Mayah Comm Gmbh Verfahren zum unbemerktem Übertragen und/oder Speichern von Zusatzinformationen innerhalb eines quellencodierten, datenreduzierten Audiosignals
US6549666B1 (en) * 1994-09-21 2003-04-15 Ricoh Company, Ltd Reversible embedded wavelet system implementation
US6873734B1 (en) 1994-09-21 2005-03-29 Ricoh Company Ltd Method and apparatus for compression using reversible wavelet transforms and an embedded codestream
US5654952A (en) * 1994-10-28 1997-08-05 Sony Corporation Digital signal encoding method and apparatus and recording medium
JP3557674B2 (ja) * 1994-12-15 2004-08-25 ソニー株式会社 高能率符号化方法及び装置
US5774846A (en) * 1994-12-19 1998-06-30 Matsushita Electric Industrial Co., Ltd. Speech coding apparatus, linear prediction coefficient analyzing apparatus and noise reducing apparatus
JP3371590B2 (ja) * 1994-12-28 2003-01-27 ソニー株式会社 高能率符号化方法及び高能率復号化方法
US5646961A (en) * 1994-12-30 1997-07-08 Lucent Technologies Inc. Method for noise weighting filtering
JP3046213B2 (ja) * 1995-02-02 2000-05-29 三菱電機株式会社 サブバンド・オーディオ信号合成装置
JP3307138B2 (ja) * 1995-02-27 2002-07-24 ソニー株式会社 信号符号化方法及び装置、並びに信号復号化方法及び装置
KR100211830B1 (ko) * 1995-03-16 1999-08-02 윤종용 미니디스크의 적응변환 오디오 코딩회로
US5781452A (en) * 1995-03-22 1998-07-14 International Business Machines Corporation Method and apparatus for efficient decompression of high quality digital audio
US5706335A (en) * 1995-04-10 1998-01-06 Corporate Computer Systems Method and appartus for transmitting coded audio signals through a transmission channel with limited bandwidth
US6041295A (en) * 1995-04-10 2000-03-21 Corporate Computer Systems Comparing CODEC input/output to adjust psycho-acoustic parameters
US6700958B2 (en) * 1995-04-10 2004-03-02 Starguide Digital Networks, Inc. Method and apparatus for transmitting coded audio signals through a transmission channel with limited bandwidth
US6301555B2 (en) 1995-04-10 2001-10-09 Corporate Computer Systems Adjustable psycho-acoustic parameters
DE19515805C2 (de) * 1995-04-29 1997-08-07 Inst Rundfunktechnik Gmbh Verfahren zur Datenreduktion eines digitalisierten Tonsignals
US5706392A (en) * 1995-06-01 1998-01-06 Rutgers, The State University Of New Jersey Perceptual speech coder and method
JPH08328599A (ja) * 1995-06-01 1996-12-13 Mitsubishi Electric Corp Mpegオーディオ復号器
GB9604315D0 (en) * 1996-02-29 1996-05-01 British Telecomm Training process
JPH11511313A (ja) * 1995-08-16 1999-09-28 スターガイド デジタル ネットワークス,インコーポレイティド 音声信号および映像信号伝送用の帯域幅の動的割当て方法
AU720245B2 (en) * 1995-09-01 2000-05-25 Starguide Digital Networks, Inc. Audio file distribution and production system
US5960390A (en) * 1995-10-05 1999-09-28 Sony Corporation Coding method for using multi channel audio signals
DE59509663D1 (de) * 1995-10-21 2001-11-08 Micronas Gmbh Logischer Block für einen Viterbi-Decoder
JPH10512131A (ja) 1995-10-24 1998-11-17 フィリップス エレクトロニクス ネムローゼ フェンノートシャップ サブバンドエンコーダ/デコーダにおける反復復号化および符号化
US5956674A (en) * 1995-12-01 1999-09-21 Digital Theater Systems, Inc. Multi-channel predictive subband audio coder using psychoacoustic adaptive bit allocation in frequency, time and over the multiple channels
JP3427149B2 (ja) * 1996-01-26 2003-07-14 三菱電機株式会社 符号化信号の復号回路及びその同期制御方法, 同期検出回路及び同期検出方法
EP0880235A1 (en) * 1996-02-08 1998-11-25 Matsushita Electric Industrial Co., Ltd. Wide band audio signal encoder, wide band audio signal decoder, wide band audio signal encoder/decoder and wide band audio signal recording medium
US6119083A (en) * 1996-02-29 2000-09-12 British Telecommunications Public Limited Company Training process for the classification of a perceptual signal
US5825320A (en) * 1996-03-19 1998-10-20 Sony Corporation Gain control method for audio encoding device
US5996022A (en) 1996-06-03 1999-11-30 Webtv Networks, Inc. Transcoding data in a proxy computer prior to transmitting the audio data to a client
DE19629132A1 (de) * 1996-07-19 1998-01-22 Daimler Benz Ag Verfahren zur Verringerung von Störungen eines Sprachsignals
JP3318825B2 (ja) * 1996-08-20 2002-08-26 ソニー株式会社 デジタル信号符号化処理方法、デジタル信号符号化処理装置、デジタル信号記録方法、デジタル信号記録装置、記録媒体、デジタル信号伝送方法及びデジタル信号伝送装置
TW384434B (en) 1997-03-31 2000-03-11 Sony Corp Encoding method, device therefor, decoding method, device therefor and recording medium
GB2325584B (en) * 1997-05-01 2000-03-29 Ricoh Kk Decompression system using inverse wavelet transform
DE19727938B4 (de) * 1997-07-01 2006-12-14 Mayah Communications Gmbh Verfahren und Vorrichtung zum Codieren von Signalen
JPH11143497A (ja) * 1997-11-10 1999-05-28 Matsushita Electric Ind Co Ltd 圧縮されたテーブルを用いてサブバンドごとに量子化係数を復号化する方法
US7194757B1 (en) 1998-03-06 2007-03-20 Starguide Digital Network, Inc. Method and apparatus for push and pull distribution of multimedia
US8284774B2 (en) 1998-04-03 2012-10-09 Megawave Audio Llc Ethernet digital storage (EDS) card and satellite transmission system
US6160797A (en) 1998-04-03 2000-12-12 Starguide Digital Networks, Inc. Satellite receiver/router, system, and method of use
US7272556B1 (en) * 1998-09-23 2007-09-18 Lucent Technologies Inc. Scalable and embedded codec for speech and audio signals
US6975254B1 (en) * 1998-12-28 2005-12-13 Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. Methods and devices for coding or decoding an audio signal or bit stream
SE9903553D0 (sv) * 1999-01-27 1999-10-01 Lars Liljeryd Enhancing percepptual performance of SBR and related coding methods by adaptive noise addition (ANA) and noise substitution limiting (NSL)
US7966078B2 (en) 1999-02-01 2011-06-21 Steven Hoffberg Network media appliance system and method
US20020105955A1 (en) * 1999-04-03 2002-08-08 Roberts Roswell R. Ethernet digital storage (EDS) card and satellite transmission system including faxing capability
JP4287545B2 (ja) 1999-07-26 2009-07-01 パナソニック株式会社 サブバンド符号化方式
JP4242516B2 (ja) 1999-07-26 2009-03-25 パナソニック株式会社 サブバンド符号化方式
US6446037B1 (en) 1999-08-09 2002-09-03 Dolby Laboratories Licensing Corporation Scalable coding method for high quality audio
GB0003954D0 (en) * 2000-02-18 2000-04-12 Radioscape Ltd Method of and apparatus for converting a signal between data compression formats
CA2316384A1 (en) * 2000-03-03 2001-09-03 Advanced Interactive Canada, Inc. Audio transmission in the video stream with adaptive gain
US6895374B1 (en) * 2000-09-29 2005-05-17 Sony Corporation Method for utilizing temporal masking in digital audio coding
EP1244094A1 (de) * 2001-03-20 2002-09-25 Swissqual AG Verfahren und Vorrichtung zur Bestimmung eines Qualitätsmasses eines Audiosignals
US7116787B2 (en) * 2001-05-04 2006-10-03 Agere Systems Inc. Perceptual synthesis of auditory scenes
US7644003B2 (en) * 2001-05-04 2010-01-05 Agere Systems Inc. Cue-based audio coding/decoding
US6807528B1 (en) 2001-05-08 2004-10-19 Dolby Laboratories Licensing Corporation Adding data to a compressed data frame
CN1244904C (zh) * 2001-05-08 2006-03-08 皇家菲利浦电子有限公司 声频信号编码方法和设备
US8918073B2 (en) 2002-03-28 2014-12-23 Telecommunication Systems, Inc. Wireless telecommunications location based services scheme selection
US9154906B2 (en) 2002-03-28 2015-10-06 Telecommunication Systems, Inc. Area watcher for wireless network
US8027697B2 (en) 2007-09-28 2011-09-27 Telecommunication Systems, Inc. Public safety access point (PSAP) selection for E911 wireless callers in a GSM type system
US8126889B2 (en) 2002-03-28 2012-02-28 Telecommunication Systems, Inc. Location fidelity adjustment based on mobile subscriber privacy profile
US8290505B2 (en) 2006-08-29 2012-10-16 Telecommunications Systems, Inc. Consequential location derived information
US7426380B2 (en) 2002-03-28 2008-09-16 Telecommunication Systems, Inc. Location derived presence information
US20070238455A1 (en) * 2006-04-07 2007-10-11 Yinjun Zhu Mobile based area event handling when currently visited network doe not cover area
US8666397B2 (en) 2002-12-13 2014-03-04 Telecommunication Systems, Inc. Area event handling when current network does not cover target area
US7619995B1 (en) * 2003-07-18 2009-11-17 Nortel Networks Limited Transcoders and mixers for voice-over-IP conferencing
US7424293B2 (en) 2003-12-02 2008-09-09 Telecommunication Systems, Inc. User plane location based service using message tunneling to support roaming
US7260186B2 (en) * 2004-03-23 2007-08-21 Telecommunication Systems, Inc. Solutions for voice over internet protocol (VoIP) 911 location services
US20080126535A1 (en) 2006-11-28 2008-05-29 Yinjun Zhu User plane location services over session initiation protocol (SIP)
US20080090546A1 (en) 2006-10-17 2008-04-17 Richard Dickinson Enhanced E911 network access for a call center using session initiation protocol (SIP) messaging
US7805313B2 (en) * 2004-03-04 2010-09-28 Agere Systems Inc. Frequency-based coding of channels in parametric multi-channel coding systems
US7406412B2 (en) * 2004-04-20 2008-07-29 Dolby Laboratories Licensing Corporation Reduced computational complexity of bit allocation for perceptual coding
US7411546B2 (en) 2004-10-15 2008-08-12 Telecommunication Systems, Inc. Other cell sites used as reference point to cull satellite ephemeris information for quick, accurate assisted locating satellite location determination
US6985105B1 (en) 2004-10-15 2006-01-10 Telecommunication Systems, Inc. Culled satellite ephemeris information based on limiting a span of an inverted cone for locating satellite in-range determinations
US7629926B2 (en) 2004-10-15 2009-12-08 Telecommunication Systems, Inc. Culled satellite ephemeris information for quick, accurate assisted locating satellite location determination for cell site antennas
US7113128B1 (en) 2004-10-15 2006-09-26 Telecommunication Systems, Inc. Culled satellite ephemeris information for quick, accurate assisted locating satellite location determination for cell site antennas
US7720230B2 (en) * 2004-10-20 2010-05-18 Agere Systems, Inc. Individual channel shaping for BCC schemes and the like
US8204261B2 (en) * 2004-10-20 2012-06-19 Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. Diffuse sound shaping for BCC schemes and the like
JP5106115B2 (ja) * 2004-11-30 2012-12-26 アギア システムズ インコーポレーテッド オブジェクト・ベースのサイド情報を用いる空間オーディオのパラメトリック・コーディング
US7787631B2 (en) * 2004-11-30 2010-08-31 Agere Systems Inc. Parametric coding of spatial audio with cues based on transmitted channels
DE602005017302D1 (de) * 2004-11-30 2009-12-03 Agere Systems Inc Synchronisierung von parametrischer raumtonkodierung mit extern bereitgestelltem downmix
US7903824B2 (en) * 2005-01-10 2011-03-08 Agere Systems Inc. Compact side information for parametric coding of spatial audio
US7353034B2 (en) 2005-04-04 2008-04-01 X One, Inc. Location sharing and tracking using mobile phones or other wireless devices
US8660573B2 (en) * 2005-07-19 2014-02-25 Telecommunications Systems, Inc. Location service requests throttling
US7933385B2 (en) 2005-08-26 2011-04-26 Telecommunication Systems, Inc. Emergency alert for voice over internet protocol (VoIP)
US9282451B2 (en) 2005-09-26 2016-03-08 Telecommunication Systems, Inc. Automatic location identification (ALI) service requests steering, connection sharing and protocol translation
US7825780B2 (en) 2005-10-05 2010-11-02 Telecommunication Systems, Inc. Cellular augmented vehicle alarm notification together with location services for position of an alarming vehicle
US7626951B2 (en) 2005-10-06 2009-12-01 Telecommunication Systems, Inc. Voice Over Internet Protocol (VoIP) location based conferencing
US8467320B2 (en) 2005-10-06 2013-06-18 Telecommunication Systems, Inc. Voice over internet protocol (VoIP) multi-user conferencing
US7907551B2 (en) 2005-10-06 2011-03-15 Telecommunication Systems, Inc. Voice over internet protocol (VoIP) location based 911 conferencing
US8150363B2 (en) 2006-02-16 2012-04-03 Telecommunication Systems, Inc. Enhanced E911 network access for call centers
US8059789B2 (en) 2006-02-24 2011-11-15 Telecommunication Systems, Inc. Automatic location identification (ALI) emergency services pseudo key (ESPK)
US9167553B2 (en) 2006-03-01 2015-10-20 Telecommunication Systems, Inc. GeoNexus proximity detector network
US7471236B1 (en) * 2006-03-01 2008-12-30 Telecommunication Systems, Inc. Cellular augmented radar/laser detector
US7899450B2 (en) 2006-03-01 2011-03-01 Telecommunication Systems, Inc. Cellular augmented radar/laser detection using local mobile network within cellular network
US8208605B2 (en) 2006-05-04 2012-06-26 Telecommunication Systems, Inc. Extended efficient usage of emergency services keys
US8532266B2 (en) 2006-05-04 2013-09-10 Telecommunication Systems, Inc. Efficient usage of emergency services keys
WO2008057477A2 (en) 2006-11-03 2008-05-15 Telecommunication Systems, Inc. Roaming gateway enabling location based services (lbs) roaming for user plane in cdma networks without requiring use of a mobile positioning center (mpc)
US8050386B2 (en) 2007-02-12 2011-11-01 Telecommunication Systems, Inc. Mobile automatic location identification (ALI) for first responders
JP5071479B2 (ja) 2007-07-04 2012-11-14 富士通株式会社 符号化装置、符号化方法および符号化プログラム
US8185087B2 (en) 2007-09-17 2012-05-22 Telecommunication Systems, Inc. Emergency 911 data messaging
US9413889B2 (en) 2007-09-18 2016-08-09 Telecommunication Systems, Inc. House number normalization for master street address guide (MSAG) address matching
US7929530B2 (en) 2007-11-30 2011-04-19 Telecommunication Systems, Inc. Ancillary data support in session initiation protocol (SIP) messaging
US9130963B2 (en) 2011-04-06 2015-09-08 Telecommunication Systems, Inc. Ancillary data support in session initiation protocol (SIP) messaging
JP5262171B2 (ja) 2008-02-19 2013-08-14 富士通株式会社 符号化装置、符号化方法および符号化プログラム
US8576991B2 (en) 2008-03-19 2013-11-05 Telecommunication Systems, Inc. End-to-end logic tracing of complex call flows in a distributed call system
KR20090110242A (ko) * 2008-04-17 2009-10-21 삼성전자주식회사 오디오 신호를 처리하는 방법 및 장치
KR20090110244A (ko) * 2008-04-17 2009-10-21 삼성전자주식회사 오디오 시맨틱 정보를 이용한 오디오 신호의 부호화/복호화 방법 및 그 장치
KR101599875B1 (ko) * 2008-04-17 2016-03-14 삼성전자주식회사 멀티미디어의 컨텐트 특성에 기반한 멀티미디어 부호화 방법 및 장치, 멀티미디어의 컨텐트 특성에 기반한 멀티미디어 복호화 방법 및 장치
US8068587B2 (en) 2008-08-22 2011-11-29 Telecommunication Systems, Inc. Nationwide table routing of voice over internet protocol (VOIP) emergency calls
US8892128B2 (en) 2008-10-14 2014-11-18 Telecommunication Systems, Inc. Location based geo-reminders
WO2010044837A1 (en) * 2008-10-14 2010-04-22 Telecommunication Systems, Inc. Location based proximity alert
US9301191B2 (en) 2013-09-20 2016-03-29 Telecommunication Systems, Inc. Quality of service to over the top applications used with VPN
US8867485B2 (en) 2009-05-05 2014-10-21 Telecommunication Systems, Inc. Multiple location retrieval function (LRF) network having location continuity
US20110257978A1 (en) * 2009-10-23 2011-10-20 Brainlike, Inc. Time Series Filtering, Data Reduction and Voice Recognition in Communication Device
WO2012005769A1 (en) 2010-07-09 2012-01-12 Telecommunication Systems, Inc. Location privacy selector
US8336664B2 (en) 2010-07-09 2012-12-25 Telecommunication Systems, Inc. Telematics basic mobile device safety interlock
US8942743B2 (en) 2010-12-17 2015-01-27 Telecommunication Systems, Inc. iALERT enhanced alert manager
US8688087B2 (en) 2010-12-17 2014-04-01 Telecommunication Systems, Inc. N-dimensional affinity confluencer
WO2012141762A1 (en) 2011-02-25 2012-10-18 Telecommunication Systems, Inc. Mobile internet protocol (ip) location
US8990074B2 (en) * 2011-05-24 2015-03-24 Qualcomm Incorporated Noise-robust speech coding mode classification
US8649806B2 (en) 2011-09-02 2014-02-11 Telecommunication Systems, Inc. Aggregate location dynometer (ALD)
US9479344B2 (en) 2011-09-16 2016-10-25 Telecommunication Systems, Inc. Anonymous voice conversation
WO2013048551A1 (en) 2011-09-30 2013-04-04 Telecommunication Systems, Inc. Unique global identifier for minimizing prank 911 calls
US9313637B2 (en) 2011-12-05 2016-04-12 Telecommunication Systems, Inc. Wireless emergency caller profile data delivery over a legacy interface
US9264537B2 (en) 2011-12-05 2016-02-16 Telecommunication Systems, Inc. Special emergency call treatment based on the caller
US8984591B2 (en) 2011-12-16 2015-03-17 Telecommunications Systems, Inc. Authentication via motion of wireless device movement
US9384339B2 (en) 2012-01-13 2016-07-05 Telecommunication Systems, Inc. Authenticating cloud computing enabling secure services
US8688174B2 (en) 2012-03-13 2014-04-01 Telecommunication Systems, Inc. Integrated, detachable ear bud device for a wireless phone
US9544260B2 (en) 2012-03-26 2017-01-10 Telecommunication Systems, Inc. Rapid assignment dynamic ownership queue
US9307372B2 (en) 2012-03-26 2016-04-05 Telecommunication Systems, Inc. No responders online
US9338153B2 (en) 2012-04-11 2016-05-10 Telecommunication Systems, Inc. Secure distribution of non-privileged authentication credentials
WO2014028712A1 (en) 2012-08-15 2014-02-20 Telecommunication Systems, Inc. Device independent caller data access for emergency calls
US9208346B2 (en) 2012-09-05 2015-12-08 Telecommunication Systems, Inc. Persona-notitia intellection codifier
US9456301B2 (en) 2012-12-11 2016-09-27 Telecommunication Systems, Inc. Efficient prisoner tracking
US8983047B2 (en) 2013-03-20 2015-03-17 Telecommunication Systems, Inc. Index of suspicion determination for communications request
US9408034B2 (en) 2013-09-09 2016-08-02 Telecommunication Systems, Inc. Extended area event for network based proximity discovery
US9516104B2 (en) 2013-09-11 2016-12-06 Telecommunication Systems, Inc. Intelligent load balancer enhanced routing
US9479897B2 (en) 2013-10-03 2016-10-25 Telecommunication Systems, Inc. SUPL-WiFi access point controller location based services for WiFi enabled mobile devices
WO2019091573A1 (en) * 2017-11-10 2019-05-16 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Apparatus and method for encoding and decoding an audio signal using downsampling or interpolation of scale parameters
WO2019091576A1 (en) 2017-11-10 2019-05-16 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Audio encoders, audio decoders, methods and computer programs adapting an encoding and decoding of least significant bits
EP3483880A1 (en) 2017-11-10 2019-05-15 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Temporal noise shaping
EP3483882A1 (en) 2017-11-10 2019-05-15 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Controlling bandwidth in encoders and/or decoders
EP3483879A1 (en) 2017-11-10 2019-05-15 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Analysis/synthesis windowing function for modulated lapped transformation
EP3483886A1 (en) 2017-11-10 2019-05-15 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Selecting pitch lag
EP3483884A1 (en) 2017-11-10 2019-05-15 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Signal filtering
EP3483878A1 (en) 2017-11-10 2019-05-15 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Audio decoder supporting a set of different loss concealment tools
EP3483883A1 (en) 2017-11-10 2019-05-15 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Audio coding and decoding with selective postfiltering

Family Cites Families (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
DE3171990D1 (en) * 1981-04-30 1985-10-03 Ibm Speech coding methods and apparatus for carrying out the method
DE3171311D1 (en) * 1981-07-28 1985-08-14 Ibm Voice coding method and arrangment for carrying out said method
JPS5921039B2 (ja) * 1981-11-04 1984-05-17 日本電信電話株式会社 適応予測符号化方式
DE3440613C1 (de) * 1984-11-07 1986-04-10 Institut für Rundfunktechnik GmbH, 8000 München Verfahren zum digitalen Übertragen eines Rundfunk-Programmsignals
DE3506912A1 (de) * 1985-02-27 1986-08-28 Telefunken Fernseh Und Rundfunk Gmbh, 3000 Hannover Verfahren zur uebertragung eines audiosignals
US4831636A (en) * 1985-06-28 1989-05-16 Fujitsu Limited Coding transmission equipment for carrying out coding with adaptive quantization

Also Published As

Publication number Publication date
DK405088A (da) 1988-07-20
FI883446A (fi) 1988-07-20
KR950014066B1 (en) 1995-11-20
FI883446A0 (fi) 1988-07-20
FI84538B (fi) 1991-08-30
DE3639753A1 (de) 1988-06-01
EP0290581A1 (de) 1988-11-17
ATE66553T1 (de) 1991-09-15
US4972484A (en) 1990-11-20
JPH01501435A (ja) 1989-05-18
JP2599624B2 (ja) 1997-04-09
EP0290581B1 (de) 1991-08-21
FI84538C (fi) 1991-12-10
DE3772381D1 (de) 1991-09-26
WO1988004117A1 (en) 1988-06-02
DE3639753C2 (da) 1988-09-15
DK405088D0 (da) 1988-07-20

Similar Documents

Publication Publication Date Title
DK172621B1 (da) Fremgangsmåde til transmission af digitaliserede audiosignaler
KR100242864B1 (ko) 디지탈 신호 부호화 장치 및 방법
EP1367566B1 (en) Source coding enhancement using spectral-band replication
DK166933B1 (da) Fremgangsmaade til overfoering af et audiosignal
KR0165545B1 (ko) 디지탈 신호 인코딩 장치
US5451954A (en) Quantization noise suppression for encoder/decoder system
AU644170B2 (en) Adaptive-block-length, adaptive-transform, and adaptive-window transform coder, decoder, and encoder/decoder for high-quality audio
EP0154381B1 (en) Digital speech coder with baseband residual coding
KR100419546B1 (ko) 신호부호화방법및장치,신호복호화방법및장치,및신호전송방법
US6421802B1 (en) Method for masking defects in a stream of audio data
Sinha et al. Audio compression at low bit rates using a signal adaptive switched filterbank
EP1933305B1 (en) Audio encoding device and audio encoding method
EP0799531A1 (en) Method and apparatus for applying waveform prediction to subbands of a perceptual coding system
TW201506910A (zh) 音頻編碼器及解碼器
JPH08204576A (ja) 信号符号化装置及び信号復号化装置
JP2963710B2 (ja) 電気的信号コード化のための方法と装置
JPH06242797A (ja) 変換符号化装置のブロックサイズ決定法
Wei et al. Optimum bit allocation and decomposition for high quality audio coding
Teh et al. Subband coding of high-fidelity quality audio signals at 128 kbps
Boland et al. Hybrid LPC And discrete wavelet transform audio coding with a novel bit allocation algorithm
EP0734617A1 (en) Transmission system utilizing different coding principles
Rabipour Sub-band Coding of Speech
McClintock Maintaining Audio Quality in the IBOC Era
Farrugia Combined speech and audio coding with bit rate and bandwidth scalability

Legal Events

Date Code Title Description
B1 Patent granted (law 1993)
PUP Patent expired