SE507370C2 - Metod och anordning för att alstra komfortbrus i linjärprediktiv talavkodare - Google Patents

Metod och anordning för att alstra komfortbrus i linjärprediktiv talavkodare

Info

Publication number
SE507370C2
SE507370C2 SE9603332A SE9603332A SE507370C2 SE 507370 C2 SE507370 C2 SE 507370C2 SE 9603332 A SE9603332 A SE 9603332A SE 9603332 A SE9603332 A SE 9603332A SE 507370 C2 SE507370 C2 SE 507370C2
Authority
SE
Sweden
Prior art keywords
frames
speech
background noise
descriptive
frame
Prior art date
Application number
SE9603332A
Other languages
English (en)
Other versions
SE9603332D0 (sv
SE9603332L (sv
Inventor
Ingemar Johansson
Original Assignee
Ericsson Telefon Ab L M
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Ericsson Telefon Ab L M filed Critical Ericsson Telefon Ab L M
Priority to SE9603332A priority Critical patent/SE507370C2/sv
Publication of SE9603332D0 publication Critical patent/SE9603332D0/sv
Priority to AU41423/97A priority patent/AU4142397A/en
Priority to JP51355198A priority patent/JP2001506764A/ja
Priority to PCT/SE1997/001491 priority patent/WO1998011536A1/en
Priority to US08/928,523 priority patent/US5978761A/en
Publication of SE9603332L publication Critical patent/SE9603332L/sv
Publication of SE507370C2 publication Critical patent/SE507370C2/sv

Links

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/012Comfort noise or silence coding

Landscapes

  • Engineering & Computer Science (AREA)
  • Computational Linguistics (AREA)
  • Signal Processing (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Physics & Mathematics (AREA)
  • Acoustics & Sound (AREA)
  • Multimedia (AREA)
  • Noise Elimination (AREA)
  • Compression, Expansion, Code Conversion, And Decoders (AREA)

Description

lO 15 2 PJ UI O 507 370 Ovanstående metod utnyttjas exempelvis i znobila radiokommuni- kationssystem för att spara batterienergi i_ de- mobila terminalerna samt för att hushålla med radiobandbredd, det vill såga minimera utsändning av radioenergi då en given radiokanal inte behöver utnyttjas för överföring av talinformation. Dock är metoden även tillämpbar i andra typer av telekommunikations- system, där det är angeläget att minimera utnyttjad bandbredd per talförbindelse.
Det är förut känt att vid diskontinuerlig talkodning låta en talkodarenhet skicka en SID-ranm var Nzte ram då VAD-enheten detekterar icke-tal. Vid kända tillämpningar, såsom exempelvis i GSM-systemet, skickas approximativt två SID-ramar per sekund (GSM = Qlobal System for Mobile communicaion).
De i SID-ramarna inkluderade parametrarna: estimerad bakgrunds- brusnivà och estimerat brusspektrum beräknas som ett medelvärde av ett aktuellt estimat och estimat från ett antal föregående ramar. Mottagaren interpolerar dessutom mellan mottagna parametervärden över N~l mellanliggande datapositioner för att på mottagarsidan erhålla en jämnt varierande representation av bakgrundsbruset på sändarsidan.
Då VAD-enheten växlar från att alstra den första till att alstra den andra tillståndssignalen, det vill säga från att detektera tal till att detektera icke-tal, appliceras normalt ett tidsintervali av en given längd (Tl) - så kallad hangover - inom vilket talkodarenheten fortsätter att leverera talramar, såsom om den mottagna ljudinformationen hade varit mänskligt tal. Om (TJ fortfarande registrerar VAD-enheten efter hangover-tiden .Ck ,e-tal genereras en SID-ram. Orsaken till detta förfarande är H bland annat att korta talpauser inuti meningar inte ska tolkas som icke-tal, utan att talramsgeneratorn vid dessa tillfällen lO 20 30 5n7 370 ska förbli aktiverad. Tillämpning av hangover löser emellertid inte de problem somv brustransienter med högt energiinnehåll förorsakar. Dessa brustransienter riskerar nämligen att av VAD- enheten tolkas som tal och om så sker kommer talramsgeneratorns parametrar att anpassas till brustransientens spektrala egenskaper, vilket leder till en kraftig degenerering av talramsgeneratorns tillstånd. En förutsättning för tillämpning av hangover“ är därför att den föregående talsekvensen varit längre än en andra förutbestämd tid (TQ.
Då VAD-enheten växlar från att alstra den andra till att alstra den första tillståndssignalen, det vill säga från icke-tal till tal, vidtas normalt ingen motsvarande åtgärd, utan talrams- generatorn startas omedelbart.
I den europeiska patentansökan EP-Al-O 544 101 anges ett exempel på hur man på mottagarsidan kan återskapa en bakgrundsbrusnivå ur mottagna ramar, vilka beskriver bakgrundsbruset mellan överförda talsekvenser. Patentskriften WO-Al-95/15550 redogör för en metod att ur så kallade noise-only-ramar beräkna medelvärdet av bakgrundsbrusniván för ett antal historiska o ramar, den aktuella ramen och upp till tva förväntade framtida ramar. Den beräknade bakgrundsbrusnivån elimineras därefter ur den mottagna talsignalen i syfte att skapa en resulterande signal vars brushalt är minimal.
Då VAD-enheten växlar från att alstra den första till att alstra den andra tillståndssignalen, det vill säga från tal till icke- tal, föreligger det en risk att den eller de senast mottagna SID-ramarnas parametrar har påverkats av den nyligen avslutade a. talsekvensen. Dessa parametrar bestäms nämligen som ett medelvärde av aktuell ram och ett antal föregående ramar. I GSM- standarden löses detta problem genom att en ny SID-ram. inte 10 20 507 570 sänds om föregående talsekvens varit så kort att hangover inte har aktiverats, det vill säga att talsekvensen har varit-kortare än tiden (T2). Istället sänder man vid dessa tillfällen en kopia av den SID-ram som skickats närmast före nämnda talsekvens. Se ETSI, TCH-HS, GSM Recommendation 6.41, “Discontinous Transmission (DTX) for Half Rate Speech Traffic Channels”.
Enligt GSM-standarden sparas på sändarsidan den senast sända SID-ramen då VAD-enheten växlar från det andra till det första tillståndet, det vill säga från icke-tal till tal, för att eventuellt använda SID-ramen såsom angivits ovan. Parametrarna i denna SID-ram kan emellertid också vara missvisande, eftersom de kan ha påverkats av ljud från den begynnande talsekvensen.
Risken för detta är särskilt VAD-enhetens tillständssignal växlas omedelbart efter det att en SID-ram har stor om levererats. Om bakgrundsbrusnivän därtill är hög växlar sannolikt VAD-enheten tillståndssignal mera frekvent än vad som motiveras av talinformationen på sändarsidan, eftersom vissa talljud under tal. dessa omständigheter ibland feltolkas som icke- REDOGÖRELSE FÖR UPPFINNINGEN Ett ändamål med föreliggande uppfinning är att minimera degenerering av SID-ramarnas parametrar vid såväl växling från den första till den andra, som från den andra till den första av VAD-enhetens tillständssignaler. oreliggande uppfinning presenterar en lösning på de problem som "11 defekta SID-ramar, det vill säga SID-ramar vars parametrar i någon mening är missvisande, orsakar pä mottagarsidan.
Uppfinningen syftar vidare till att reducera höga brus- transienters inverkan på SID-ramarnas medelvärde, så att dessa transienter förhindras från att få genomslag på mottagarsidan. 10 1 2 b) 5 O Ul C) 507 370 Detta åstadkommes enligt den föreslagna metoden genom att en eller flera av de SID-ramarj som beskriver bakgrundsbruset och vilka mottagits direkt före en talram inte tas med vid beräkningen av det aktuella bakgrundsbruset. Istället tas en eller flera SID-ramar, vilka mottagits ännu något tidigare med vid beräkningen av det aktuella bakgrundsbruset. Metoden enligt uppfinningen är därvid kännetecknad så som det framgår av patentkrav 1.
Enligt en föredragen utföringsform exkluderas från beräkningen av det aktuella bakgrundsbruset. endast den SID-ram, vilken närmast föregår en talram. Metoden enligt uppfinningen är därvid kännetecknad så som det framgår av patentkrav 2.
Den föreslagna anordningen är en datamottagare, vars uppgift är att rekonstruera en talsignal ur mottagna dataramar. Dataramarna kan vara antingen talramar eller ramar, vilka beskriver bakgrundsbruset sändarsidan. Anordningen innefattar på styrenhet för styrning av övriga i anordningen ingående en första minnesenhet för lagring av talramar, en andra minnesenhet för lagring' av bakgrundsbrusbeskrivande ramar, en dataramsdirigerande enhet som styr de mottagna dataramarna till respektive minnesenhet samt en rekonstruktionsenhet, vilken återskapar en ljudsignal ur de mottagna dataramarna. I UI tyrenheten ingår i sin tur en minnesutskiftningsenhet som styr den första och den sista minnespcsition i den andra minnesen-e:en från vilka utskiftning av data ska ske. Utskiftade data, det vill säga de bakgrundsbrusbeskrivande ramarna, förs till avkodningsenheten tillsammans med. de :alramarna mottagna för rekonstruktion av den överförda ljudsignalen. Genom att ange de minnespositioner mellan vilka utskiftning av data ska ske kan man således välja vilken del av den överförda brusinformationen som skall beaktas vid rekonstruktionen av ljudsignalen. l0 15 2 l'\) 0 U! 507 370 Anordningen enligt uppfinningen är därvid kännetecknad sà som det framgår av patentkrav 6.
Den föreslagna metoden och anordningen erbjuder en såväl enkel som effektiv implementering av avkodningsalgoritmerna för kommunikationssystem, vilka tillämpar diskontinuerlig tal- överföring. Detta är ett resultat av att lösningen dels är oberoende av vilken VAD- och VOX-algoritm som sändaren tillämpar och dels att hangover-tiden, det vill säga det tidsintervall inom vilket talkodaren fortsätter att leverera talramar trots att VAD-enheten registrerar icke-tal, kort.
FIGURBESKRIVNING Figur 1 visar ett förut känt arrangemang av en VAD-enhet och en talkodarenhet; Figur 2a-b visar i diagramform ett förut känt sätt att applicera hangover vid utsändning av dataramar från en talkodarenhet, vilken styrs av en VAD-enhet; Figur 3a-b illustrerar hur den i figur 2a-b visade hangover- tiden pà ett förut känt sätt kan påverka utsändning av dataramar vid överföring av en viss sekvens talinformation; Figur 4 illustrerar i diagramform de dataramar som enligt en förut känd metod överförs dä en inkommande ljudsignal bestär av en talsekvens, vilken före äs av en period av icke-tal; Figur 5 illustrerar i diagramform de dataramar som enligt en känd förut metod överförs dä inkommande En talsekvens följs av en period av icke-tal; kan hàllas förhållandevis- (507 370 Figur 6a visar ett exempel över hur en VAD-enhet pà ett förut känt sätt växlar mellan' en första och en andra tillstàndssignal i enlighet med variationerna hos en ljudsignal; 5 Figur 6b illustrerar de dataramar som en talkodarenhet levererar då den erhåller ljudinformation enligt det exempel som visas i figur 6a; Figur 6c illustrerar vilka av dataramarna i figur 6b som avkodningsenheten på mottagarsidan enligt den 10 föreslagna metoden utnyttjar vid àterskapande av den ljudsignal, som åsyftas i figur 6a; Figur 7 visar ett blockschema över den uppfinningsenliga anordningen; 15 Uppfinningen kommer nu att beskrivas närmare med hjälp av föredragna utföringsformer och med hänvisning till bifogade ritningar.
FÖREDRAGNA UTFÖRINGSFORMER 20 Figur 1 visar ett förut känt arrangemang av en VAD-enhet (110) och en talkodarenhet (120), där VAD-enheten (110) för varje mottagen sekvens av ljudinformation (S) avgör huruvida ljudet representerar mänskligt tal eller inte. Om 'VAD-enheten (LLQ) detekterar att en given ljudsekvens (S) representerar tal 25 skickas en första tillstàndssignal (l) till en talramsgenerator ( 21) i talkodarenheten (120), som därigenom styrs att utifrån } ljudsekvensen (S) leverera en talram (Fg innehållande kodad talinformation. Om däremot ljudsekvensen (S) av VAD-enheten (110) bedöms vara icke-tal skickas en andra tillständssignal (2) *___ L. ill en SID-generator (122) i talkodarenheten (120), som bJ C) lO 15 20 25 507 370 därigenom styrs att utifrån ljudsekvensen (S) var N:te ram leverera en SID-ram (F55), vilken innehåller parametrar som beskriver ljudets (S) frekvensspektrum och energinivä. Under mellanliggande N-1 möjliga tillfällen att sända data genererar däremot SID-ramsgeneratorn inte någon information. Varje genererad talram (FS) och SID-ram (FNB) passerar en kombineringsenhet (123), vilken levererar ramarna (FS, FHD) på en gemensam utgång i form av dataramar (F).
I figur 2a visas ett diagram över en utsignal (VAD(t)) frän en VAD-enhet vars insignal är en ljudsignal. Längs diagrammets vertikala axel anges den tillstàndssignal (1 eller 2) som VAD- enheten levererar medan den horisontella axeln är en tidsaxel (t).
Figur 2b illustrerar i diagramform de dataramar (F(t)) som enligt en förut känd metod genereras av en talkodarenhet dä denna styrs av VAD-enheten ovan. Längs diagrammets vertikala axel anges typ av dataram (F(t)), det vill säga om aktuell ram är en talram (FS) eller en SID-ram (FQD) och längs den horisontella axeln representeras tiden (t). lnledningsvis detekterar VAD-enheten mänskligt tal, varför den första tillståndssignalen (1) levereras och talkodarenheten genererar talramar (Fg _ Vid en första tidpunkt (tfi upphör emellertid talsignalen och VAD-enheten växlar till den andra tillständssignalen (2). Vid en andra tidpunkt (tz) har hangover- tiden (TI) löpt ut och talkcdarenheten börjar alstra SID-ramar Figur 3a och Bb illustrerar i diagramform samma parametrar som figur 2a och 2b, men då insignalen till VAD-enheten först utgörs av en talsignal, vilken inkluderar en kort paus och då ljudsignalen avslutningsvis utsätts för ett kraftigt, transient bakgrundsljud. Vid en första tidpunkt (t3) detekterar VAD- enneten att ljudsignalen bestàr av icke-tal och levererar därför den andra kortare tid än tillständssignalen (2). Inom en 507 370 hangover-tiden (TI) fortsätter dock talsignalen och VAD-enheten levererar äter den första tillständssignalen (1). -Eftersom talpausen varit kortare än hangover-tiden (Tl) fortsätter talkodarenheten att sända talramar (FS) utan att skicka nägra 5 SID-ramar (Fan). Vid en andra tidpunkt (t4) upphör talsignalen, varför VAD-enheten levererar den andra tillständssignalen (2).
Efter hangover-tiden (TQ, vid en tredje tidpunkt (tg registrerar VAD-enheten fortfarande icke-tal, vilket föranleder talkodarenheten att börja generera SID-ramar (ïsm) istället för 10 talramar (FS). Vid en ännu nágot senare tidpunkt (ts) inkluderar ljudsignalen en kraftig ljudimpuls, vars längd är kortare än en förutbestämd Ininimitid (TJ _ Ljudimpulsen tolkas felaktigt av VAD-enheten som mänskligt tal och den första tillstàndssignalen (1) levereras därför. Dä ljudimpulsens varaktighet understigit 15 minimitiden (T2) appliceras ingen hangover, utan talkodarenheten fortsätter att leverera SID-ramar sä snart ljudimpulsen avklingat. igur 4 visas ett diagram över de dataramar (F(n}), som enligt H1 T i. en förut känd metod alstras och överförs dä en inkommande 29 ljudsignal består av en inledande period av icke-tal vilken följs av en talsekvens. Som en första dataram (?(O)) skickas en första bakgrundsbrusbeskrivande ram (F§;N¶). En andra bakgrundsbrusbeskrivande ram (Fänfll) skickas som en andra dataram (F(N)) N dataramstillfällen senare. Under de 25 mellanliggande N-1 tillfällena dà dataramar kunde ha skickats är sändaren tyst och ingen information överförs. Istället interpolerar avkodaren på mottagarsidan under denna tid fram N-1 bakgrundsbrusbeskrivande parametrar. I diagrammet illustreras detta som prickade staplar. Ytterligare N dataramstillfällen 33 senare skickas som en dataram (F(2N)) en tredje bakgrunds- brusbeskrivande ram (F§DQ]). Som nästa dataram (F(2N+1)) skickas en talram (F¿3]), eftersom VAD-enheten vid detta tillfälle förutsätts ha registrerat talinformation. VAD-enheten fortsätter 20 25 30 507 570 lO att registrera tal under de följande j dataramstillfällena, varför talkodarenheten under denna tid skickar ut (Fsßl Fs[3+j]>- j jalramar I figur 5 visas ett diagram över de dataramar (F(n)), som enligt en förut känd metod alstras och överförs då en inkommande ljudsignal består av en talsekvens vilken följs av icke-tal. Så VAD-enheten länge detekterar talinformation (FSBJ - Fs[3+j])- har detekterat icke-tal och en eventuell hangover-tid har löpt levererar talkodarenheten talramar Sá snart VAD-enheten ut börjar emellertid talkodarenheten att skicka en SID-ram vid vart N:te dataramstillfälle. I detta exempel skickas en första SID-ram dataram (F(x+l)N)).
(F¶DÜ+4]) som en N datarams~ (Fsn>[j+5]> Under de nællanliggande N-l tillfällena då tillfällen senare skickas en andra SID-ram (F(x+2)N)).
SOITI en dataram dataramar kunde ha skickats, men då sändaren är tyst interpolerar avkodaren på mottagarsidan fram N-l bakgrundsbrusbeskrivande parametrar, vilket i diagrammet illustreras som prickade staplar. Ytterligare N datarams- tillfällen senare skickas en tredje bakgrundsbrusbeskrivande ram som en dataram (F(x+3)N)).
Figur 6a illustrerar i ett diagram hur en VAD-enhets tillstånds- signaler (VAD(t)) på ett förut känt sätt växlar då ljud- _nsignalen till VAD-enheten i tur och ordning består av icke- tal, tal och icke-tal. Diagrammets vertikala axel anger tillståndssignal (1, 2) och den horisontella axeln utgör en tidsaxel (t). igur 6b åskådliggör schematiskt den typ av dataramar (F(n)) som levereras från en förut känd. talkodarenhet, vilken ges samma insignal som den_ i figur 6a åsyftade VAD-enheten. Längs den vertikala axeln representeras typ av dataram (FS, och längs FSID) 7 den horisontella axeln anges dataramarnas ordningsnummer (n). lO 15 20 25 ll Figur 6c åskådliggör vilka dataramar (F'(n)) som enligt den föreslagna metoden beaktas av mottagaren vid rekonstruktion av den ljudsignal, vilken kodats av den i figur 6b åsyftade talkodarenheten. Längs den vertikala axeln representeras typ av dataram (FS, Fün) och längs den horisontella axeln anges dataramarnas ordningsnummer (n).
Inledningsvis detekterar VAD-enheten icke-tal, varför talkodar- enheten styrs att vid vart N:te dataramstillfälle generera en SID-ram (Fsmhn-2L PMU [m-IL Fsm hfl). Då VAD-enheten vid en första tidpunkt (tv) detekterar talinformation' växlar dess tillstándssignal från det andra (2) till det första (1) tillståndet. Samtidigt börjar talkodarenheten att som utsignal (F(n)) leverera talramar (F¿m+lL..., F¿m+1+jD istället för SID-ramar (FEB). Vid en andra tidpunkt (ta) detekterar äter VAD- enheten icke-tal, vilket resulterar i att talkodarenheten efter en eventuell hangover-tid genererar en SID-ram (FsnJm+j+2L F¶Dhwj+3], F¶DhHj+4]) vid vart N:te dataramstillfälle.
Då avkodarenheten på mottagarsidan avkodar de mottagna dataramarna utnyttjas inte ett första bestämt antal, K, av de SID-ramar (Fänfifl), vilka överförts närmast före sekvensen av talramar (FJm+l],..., F¿m+l+j]). Parametrarna i dessa SID-ramar (Fxchfl) kan nämligen vara påverkade av ljudet från den begynnande talsekvensen och därför ge en missvisande beskrivning v det aktuella bakgrundsbruset. I Q) detta exempel antas K vara :, vilket alltså innebär att endast den SID-ram (Pag UM), som D- skickats närmast före den första talramen {F¿m+l]) inte tas med vid rekonstruktion av ljudsignalen. Istället för att beakta (Fsm [mp parametrar ur åtminstone en av de närmast föregående SID-ramarna parametrarna i denna SID-ram motsvarande utnyttjas 10 15 20 25 507 570 12 (Egïn [m-1D . I figur 6c illustreras detta genom att den mzte dataramen av F' ersätts med en kopia av F'(m-1). ~ Vid avkodning av de mottagna dataramarna utnyttjas inte heller ett andra bestämt antal, M, av de SID-ramar (F¶DhHj+2], FüDfiwj+3],...), vilka överförts närmast efter sekvensen av talramar (F¿m+lL..., P¿m+l+jD, ty även parametrarna i. dessa SID-ramar (Fswhn+j+2L FSn{m+j+3],...) kan vara störda av den nyligen avslutade talsekvensen. I det illustrerade exemplet antas M vara ett, vilket alltsä innebär att endast den SID-ram (FSmÜn+j+2]), som skickats direkt efter den sista talramen (F¶m+1+j]) inte tas med vid rekonstruktion av ljudsignalen.
Istället för att beakta parametrarna i denna SID-ram (FSn{m+j+2D utnyttjas motsvarande parametrar ur åtminstone en av de SID- ramar (Fsmhn-1D, vilka skickats före sekvensen av talramar (F¿m+l],..., FJm+l+j]). Den sist sända SID-raw1 sonl kan tas i anspråk får högst ha ett ordningsnummer som är K+l lägre än den örsta talramen (F¿m+lh, det vill (K+1) = H1 säga m+l - m-K.
HJ ftersom K i detta exempel antas vara ett är Fsnim-l] den sist sända SID-rawl som här kan utnyttjas. I figur 6c illustreras detta genom att även dataramen med ordningsnummer m+j+2 av F' ersätts med en kopia av F'(m-1).
Ett blockschema over en anordning för utförande av metoden uppfinningen visas i figur 7. Inkommande dataramar (F) förs dels till en dataramsdirigerande enhet (710) och dels till (720). En centralenhet (721) i styrenheten (720) detekterar för varje mottagen dataram (F) om den aktuella dataramen (F) är en talram (FS) eller en bakgrundsbrus- beskrivande ram (Fun). En första styrsignal (cl) frän fw centralenheten (721) styr den dataramsdirigerande enheten (/LO) att leverera en inkommande dataram (F) till en första 10 t\) (_) k.) LH 507 370 13 minnesenhet (730) om dataramen (F) är en talram (FS) och till en andra minnesenhet (740) om dataramen (F) är en bakgrundsbrus- beskrivande ram Vid en inkommande (FMC). talram (FS) sätts styrsignalen (cl) till ett första värde, exempelvis ett och vid en inkommande bakgrundsbrusbeskrivande ram (Fsm) sätts styrsignalen (cl) till ett andra värde, exempelvis noll.
Centralenheten (721) genererar även en andra styrsignal (cg, vilken styr en minnesutskiftningsenhet (722) att ange minnespositioner (p) i den andra minnesenheten (740) fràn vilka data läses ut ur minnesenheten (740). En avkodningsenhet (760) utnyttjas pà mottagarsidan för att rekonstruera den pa sändarsidan alstrade ljudsignalen (S), vilken med hjälp av dataramarna (F) har överförts till mottagarsidan. Dataramar (F) beskrivande mänskligt tal (FQ hämtas till avkodningsenheten (760) fràn den första minnesenheten (730) för rekonstruktion av överförd talinformation. Vid rekonstruktion av bakgrundsbruset pà sändarsidan hämtas dataramar (F) frán den andra minnesenheten (740), vilken innehåller bakgrundsbrusbeskrivande ramar (Fsm).
Talramar (Fy utläses i samma ordning som de har lagrats i minnesenheten (730), det vill säga först in först ut, medan utläsning av bakgrundsbrusbeskrivande ramar (Pga) styrs med hjälp av den andra styrsignalen (cz) enligt den metod som beskrivits i anslutning till figur 6a-c ovan. De dataramar (F'), vilka ligger till grund för en rekonstruerad ljudsignal (É) och som utgör insignal till avkodningsenheten (760) skiljer sig således något frän de dataramar (F) vilka mottagits, eftersom K bakgrundsbrusbeskrivande ramar (Fan) före sekvenser av talramar (FS) och M bakgrundsbrusbeskrivande ramar (FSD) efter sekvenser av talramar (P3 har exkluderats och ersatts med kopior av tidigare mottagna bakgrundsbrusbeskrivande ramar (FEB).

Claims (6)

lO }_1 U'| 20 25 507 370 14 PATENTKRAV
1. Metod i ett telekommunikationssystem, inom vilket talinformation (S) överförs från en sändarsida till en mottagarsida, varvid talinformationen (S) för en given talförbindelse överförs diskontinuerligt i form av dataramar (F), vilka kan utgöras av dels talramar (FS) och dels bakgrundsbrusbeskrivande ramar (FEB), för att pà mottagarsidan skapa ett bakgrundsbrus ur mottagna bakgrundsbrusbeskrivande ramar (Fan), varvid parametrar vilka beskriver bakgrundsbruset pä sändarsidan beräknas genom interpolering mellan informations- innehållet i två eller flera av de mottagna bakgrundsbrus- beskrivande ramarna (Fab), k ä n n e t e c k n a d av att ï< av de bakgrundsbrusbeskrivande ramar (F¶DR]), vilka närmast föregår en talram (FSB]) exkluderas vid nämnda beräkning av de parametrar' som beskriver bakgrundsbruset för en given dataram (F(2N)), samt att en eller flera tidigare (Fs:D[0]f Fsrn[1]) bakgrundsbruset för nämnda dataram {F(2N)). mottagna bakgrundsbrus- beskrivande ramar utnyttjas för att beräkna
2. Metod enligt krav l, k ä n n e t e c k n a d av att K = 1.
3. Metod enligt krav 1 eller 2, k ä n n e t e c k n a d av att M av de bakgrundsbrusbeskrivande ramar' (FSn{j+4], följer närmast efter en mottagen sekvens av talramar (FJ3] - F¿3+jD parametrar som beskriver bakgrundsbruset, exkluderas vid nämnda beräkning av de samt (Fsiø[Ü]f vilka har mottagits F¿3+j]) att P4 bakgrundsbrusbeskrivande ramar FQDUJ) av de bakgrundsbrusbeskrivande ramar (Egg) före nämnda sekvens av talramar (FJ3] - utnyttjas för att beräkna bakgrundsbruset. lO 15 20 l«5n7 570 15
4. Metod enligt krav 3, k ä n n e t e c k n a d av att M = 1.
5. Metod enligt något av kraven l-4, k ä n n e t e c k n a d av att nämnda parametrar anger bakgrundsbrusets effektnivà och spektrala fördelning.
6. Anordning för att ur mottagna dataramar (F), vilka kan utgöras av dels talramar (FS) och dels bakgrundsbrusbeskrivande ramar (Fsm), generera en rekonstruerad talsignal (É) innefattande följande enheter: en styrenhet (720), en första minnesenhet (730) för lagring av' talramar (FS), en andra minnesenhet (740) för lagring av bakgrundsbrusbeskrivande ramar (Fflo), en dataramsdirigerande enhet (710), vilken styr en mottagen dataram (F) till den första minnesenheten (730) om den aktuella dataramen (F) är en talram (FS) och till den andra minnesenheten (740) om den aktuella dataramen (F) är en bakgrundsbrusbeskrivande ram (Ffln) samt en avkodningsenhet (760) i vilken dataramar (F) avkodas och bildar den rekonstruerade talsignalen (É), k ä n n e t e c k n a d av att styrenheten (720) innefattar en minnesutskiftningsenhet (722) för at styra minnespositioner (p) i den andra minnesenheten (740) fràn vilka utlàsning av bakgrundsbrus- beskrivande ramar (Fgn) till avkodningsenheten (760) sker.
SE9603332A 1996-09-13 1996-09-13 Metod och anordning för att alstra komfortbrus i linjärprediktiv talavkodare SE507370C2 (sv)

Priority Applications (5)

Application Number Priority Date Filing Date Title
SE9603332A SE507370C2 (sv) 1996-09-13 1996-09-13 Metod och anordning för att alstra komfortbrus i linjärprediktiv talavkodare
AU41423/97A AU4142397A (en) 1996-09-13 1997-09-05 Method and arrangement in a telecommunication system
JP51355198A JP2001506764A (ja) 1996-09-13 1997-09-05 遠隔通信システムにおける方法および配置
PCT/SE1997/001491 WO1998011536A1 (en) 1996-09-13 1997-09-05 Method and arrangement in a telecommunication system
US08/928,523 US5978761A (en) 1996-09-13 1997-09-12 Method and arrangement for producing comfort noise in a linear predictive speech decoder

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
SE9603332A SE507370C2 (sv) 1996-09-13 1996-09-13 Metod och anordning för att alstra komfortbrus i linjärprediktiv talavkodare

Publications (3)

Publication Number Publication Date
SE9603332D0 SE9603332D0 (sv) 1996-09-13
SE9603332L SE9603332L (sv) 1998-03-14
SE507370C2 true SE507370C2 (sv) 1998-05-18

Family

ID=20403869

Family Applications (1)

Application Number Title Priority Date Filing Date
SE9603332A SE507370C2 (sv) 1996-09-13 1996-09-13 Metod och anordning för att alstra komfortbrus i linjärprediktiv talavkodare

Country Status (5)

Country Link
US (1) US5978761A (sv)
JP (1) JP2001506764A (sv)
AU (1) AU4142397A (sv)
SE (1) SE507370C2 (sv)
WO (1) WO1998011536A1 (sv)

Families Citing this family (12)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6240383B1 (en) * 1997-07-25 2001-05-29 Nec Corporation Celp speech coding and decoding system for creating comfort noise dependent on the spectral envelope of the speech signal
US7072832B1 (en) 1998-08-24 2006-07-04 Mindspeed Technologies, Inc. System for speech encoding having an adaptive encoding arrangement
US6256606B1 (en) * 1998-11-30 2001-07-03 Conexant Systems, Inc. Silence description coding for multi-rate speech codecs
KR100317810B1 (ko) * 1998-12-31 2001-12-22 서평원 디지털 계위 구조의 리프레머 및 프레임 손실 검사 장치
JP3451998B2 (ja) * 1999-05-31 2003-09-29 日本電気株式会社 無音声符号化を含む音声符号化・復号装置、復号化方法及びプログラムを記録した記録媒体
JP3670217B2 (ja) * 2000-09-06 2005-07-13 国立大学法人名古屋大学 雑音符号化装置、雑音復号装置、雑音符号化方法および雑音復号方法
US20030120484A1 (en) * 2001-06-12 2003-06-26 David Wong Method and system for generating colored comfort noise in the absence of silence insertion description packets
GB0129369D0 (en) * 2001-12-07 2002-01-30 Filtrona United Kingdom Ltd Method and apparatus for marking articles
US7746797B2 (en) * 2002-10-09 2010-06-29 Nortel Networks Limited Non-intrusive monitoring of quality levels for voice communications over a packet-based network
EP2186090B1 (en) * 2007-08-27 2016-12-21 Telefonaktiebolaget LM Ericsson (publ) Transient detector and method for supporting encoding of an audio signal
CN100555414C (zh) * 2007-11-02 2009-10-28 华为技术有限公司 一种dtx判决方法和装置
DK3550562T3 (da) 2013-02-22 2020-11-23 Ericsson Telefon Ab L M Fremgangsmåder og indretninger til DTX-hangover i audiokodning

Family Cites Families (15)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5537509A (en) * 1990-12-06 1996-07-16 Hughes Electronics Comfort noise generation for digital communication systems
GB2256351B (en) * 1991-05-25 1995-07-05 Motorola Inc Enhancement of echo return loss
JP2518765B2 (ja) * 1991-05-31 1996-07-31 国際電気株式会社 音声符号化通信方式及びその装置
JP3432822B2 (ja) * 1991-06-11 2003-08-04 クゥアルコム・インコーポレイテッド 可変速度ボコーダ
JP3167385B2 (ja) * 1991-10-28 2001-05-21 日本電信電話株式会社 音声信号伝送方法
JPH07129195A (ja) * 1993-11-05 1995-05-19 Nec Corp 音声復号化装置
WO1995015550A1 (en) * 1993-11-30 1995-06-08 At & T Corp. Transmitted noise reduction in communications systems
JP3182032B2 (ja) * 1993-12-10 2001-07-03 株式会社日立国際電気 音声符号化通信方式及びその装置
US5657422A (en) * 1994-01-28 1997-08-12 Lucent Technologies Inc. Voice activity detection driven noise remediator
FI100932B (sv) * 1995-04-12 1998-03-13 Nokia Telecommunications Oy Överföring av DTMF-signaler i ett radiotelefonsystem
FI105001B (sv) * 1995-06-30 2000-05-15 Nokia Mobile Phones Ltd Förfarande för utredning av väntetiden i en talavkodare i diskontinuerlig sändning och en talavkodare samt en sändare-mottagare
FR2739995B1 (fr) * 1995-10-13 1997-12-12 Massaloux Dominique Procede et dispositif de creation d'un bruit de confort dans un systeme de transmission numerique de parole
US5689615A (en) * 1996-01-22 1997-11-18 Rockwell International Corporation Usage of voice activity detection for efficient coding of speech
US5794199A (en) * 1996-01-29 1998-08-11 Texas Instruments Incorporated Method and system for improved discontinuous speech transmission
US5881373A (en) * 1996-08-28 1999-03-09 Telefonaktiebolaget Lm Ericsson Muting a microphone in radiocommunication systems

Also Published As

Publication number Publication date
SE9603332D0 (sv) 1996-09-13
AU4142397A (en) 1998-04-02
JP2001506764A (ja) 2001-05-22
US5978761A (en) 1999-11-02
SE9603332L (sv) 1998-03-14
WO1998011536A1 (en) 1998-03-19

Similar Documents

Publication Publication Date Title
SE507370C2 (sv) Metod och anordning för att alstra komfortbrus i linjärprediktiv talavkodare
KR920022903A (ko) 가변 속도 인코더의 제어 방법 및 장치
CA2211347C (en) An encoding method and apparatus using a control circuit switching between two backward adaptive encoders for transmission
JPS5915544B2 (ja) デイジタル信号多重伝送方式
CN101335003B (zh) 噪声生成装置、及方法
SE518941C2 (sv) Anordning och förfarande relaterande till kommunikation av tal
GB2285372A (en) Method and apparatus for multiplexing fixed length message data and variably coded speech
KR920704534A (ko) 선택 호출 시스템 및 인터리브 신호 발생 방법
EP1998319A3 (en) Variable rate vocoder
US5953411A (en) Method and apparatus for maintaining audio sample correlation
EP1686742A3 (en) Communiction control device and method for an ATM system applicable to an ABR mode
JPH07123242B2 (ja) 音声信号復号化装置
FI73111C (sv) Kopplingsanordning för utjämnande av fasskillnader mellan linjetakten på en till en PCM-telefoncentral anslutande PCM-tidsmultiplexledning och centraltakten hos denna telefoncentral.
DE69727256D1 (de) Sprachkodierer hoher Qualität mit niedriger Bitrate
JP3416331B2 (ja) 音声復号化装置
EP1194925B1 (en) Bi-directional pitch enhancement in speech coding systems
US5974374A (en) Voice coding/decoding system including short and long term predictive filters for outputting a predetermined signal as a voice signal in a silence period
US6038529A (en) Transmitting and receiving system compatible with data of both the silence compression and non-silence compression type
RU2002123881A (ru) Кодирование определения скорости
WO2002049364A3 (en) Method and apparatus for adaptive bit rate control in an asynchronized encoding system
JPH1141286A (ja) 音声パケット生成回路
JP3092037B2 (ja) 音声情報多重伝送方法
JPH05108098A (ja) 音声符号化装置
JP2834010B2 (ja) 音声符号化復号化装置
Ho et al. Improved lost frame recovery techniques for ITU-T G. 723.1 speech coding system

Legal Events

Date Code Title Description
NUG Patent has lapsed