DE69626088T2 - Bestimmung der Linienspektrumfrequenzen zur Verwendung in einem Funkfernsprecher - Google Patents

Bestimmung der Linienspektrumfrequenzen zur Verwendung in einem Funkfernsprecher

Info

Publication number
DE69626088T2
DE69626088T2 DE1996626088 DE69626088T DE69626088T2 DE 69626088 T2 DE69626088 T2 DE 69626088T2 DE 1996626088 DE1996626088 DE 1996626088 DE 69626088 T DE69626088 T DE 69626088T DE 69626088 T2 DE69626088 T2 DE 69626088T2
Authority
DE
Germany
Prior art keywords
polynomials
lpc
zero
frequencies
polynomial
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Lifetime
Application number
DE1996626088
Other languages
English (en)
Other versions
DE69626088D1 (de
Inventor
Vesa T. Ruoppila
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Intellectual Ventures I LLC
Original Assignee
Nokia Oyj
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Nokia Oyj filed Critical Nokia Oyj
Publication of DE69626088D1 publication Critical patent/DE69626088D1/de
Application granted granted Critical
Publication of DE69626088T2 publication Critical patent/DE69626088T2/de
Anticipated expiration legal-status Critical
Expired - Lifetime legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/04Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L25/00Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
    • G10L25/03Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 characterised by the type of extracted parameters
    • G10L25/24Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 characterised by the type of extracted parameters the extracted parameters being the cepstrum

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Signal Processing (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Computational Linguistics (AREA)
  • Acoustics & Sound (AREA)
  • Multimedia (AREA)
  • Compression, Expansion, Code Conversion, And Decoders (AREA)
  • Mobile Radio Communication Systems (AREA)
  • Noise Elimination (AREA)
  • Monitoring And Testing Of Transmission In General (AREA)

Description

  • Diese Erfindung betrifft im allgemeinen Sprach-Kodier-Verfahren und Vorrichtungen und insbesondere linear-prädiktive (LPC) Sprach- und Audiokodier-Techniken, die ein Linienspektrum eines LPC-Filters verwenden.
  • Linear-prädiktive Kodierung (LPC) ist eine bekannte Technik, um ein Sprachsignal zu analysieren und um das Signal in Terme von Koeffizienten zu charakterisieren, die kodiert, übertragen, empfangen und dekodiert werden, um eine Näherung des ursprünglichen Signals rück zu gewinnen. Die Parameter eines LPC-Filters werden als ein Teil des Informationsstroms kodiert und gesendet. Die Frequenzen im Linienspektrum weisen nützliche Eigenschaften zur Quantisierung und Interpolation auf, die sie zu einer attraktiveren Darstellung als polynominale oder Reflexionskoeffizienten machen.
  • Das Verfahren zum Ableiten der Frequenzen im Linienspektrum ist jedoch in bekannten Typen von Sprach-Kodierern rechenaufwändig, die Frequenzen im Linienspektruni verwenden. Dieser Nachteil wird besonders ersichtlich, wenn es in Echtzeit oder im wesentlichen in Echtzeit in einem Sprach-Kodierer zum Beispiel eines digitalen Mobiltelephons implementiert ist.
  • Eine erste potentielle Aufgabe dieser Erfindung ist es, eine einfache und effiziente Technik bereitzustellen, um die Komplexität der Berechnung der Frequenz im Linienspektrum zu reduzieren.
  • Eine zweite potentielle Aufgabe dieser Erfindung ist es, ein Funktelephon bereitzustellen, das einen LPC-basierenden Sprach/Audio-Kodierer aufweist, der Frequenzen im Linienspektrum verwendet, die in Übereinstimmung mit dem Verfahren dieser Erfindung erhalten werden.
  • Die vorhergehenden und andere Probleme und die potentiellen Aufgaben der Erfindung werden vorzugsweise gelöst und verwirklicht durch Verfahren und Vorrichtungen in Übereinstimmung mit Ausführungsformen dieser Erfindung. Gemäß der Erfindung werden ein Verfahren wie in Anspruch 1 dargelegt, eine Vorrichtung wie in Anspruch 5 dargelegt und ein Verfahren wie in Anspruch 8 dargelegt bereitgestellt.
  • In dieser Erfindung wird ein Verfahren zum Bestimmen von Frequenzen im Linienspektrum eines LPC-Filters offenbart. Das Prädiktor-Polynom des LPC-Filters wird in symmetrische und antisymmetrische zusätzliche Polynome bzw. Ersatzpolynome zerlegt, deren Nullstellen die Frequenzen im Linienspektrum des Filters bestimmen. In anderen Worten, die Frequenzdarstellung des Linienspektrums wird bestimmt, indem die Nullstellen der zwei zusätzlichen Polynome bestimmt werden. Aufgrund der Symmetrie der zusätzlichen Polynome werden ihre Nullstellen vorzugsweise aus zwei Kosinus-Reihen gelöst. In Sprach-Codices wird dies normalerweise durch einen Bisektions-Algorithmus und durch Anwendung der Definition von Tschebyscheffschen Polynomen erreicht, um die Kosinus-Reihen auszuwerten.
  • Eine potentielle Aufgabe dieser Erfindung ist es, die Komplexität der Berechnung der Frequenz im Linienspektrum zu verringern. Diese kann erhalten werden, indem die Kosinus-Reihen in Polynome unter Verwendung der expliziten Formen der Tschebyscheffschen Polynome umgeschrieben werden. Dies ermöglicht eine Auswertung der Reihen durch verschachtelte Multiplikationen. Die schon berechneten Nullstellen werden zudem sukzessive aus dem Polynom durch Polynomdeflation eliminiert. Dieser Vorgang und die Eigenschaften der zusätzlichen Polynome können ermöglichen, die Startwerte in dem Nullstellen-Auffind-Algorithmus derart zu wählen, so dass eine Nullstelle durch nur wenige Iterationen unter Verwendung der Nullstelle des anderen Polynoms gefunden wird. Die Erfindung kann deshalb die arithmetischen Operationen erheblich verringern, die benötigt werden, um die Frequenzen im Linienspektrum zu berechnen. Das Verfahren dieser Erfindung weist daher das Potential auf, mit relativ geringer Komplexität implementiert zu werden und außerdem unter Verwendung von Festpunkt- Arithmetik verwirklicht zu werden.
  • Die vorstehend dargestellten und anderen Merkmale der Erfindung werden in der folgenden detaillierten Beschreibung der Erfindung ersichtlicher, wenn sie in Verbindung mit den angefügten Zeichnungen gelesen wird, wobei:
  • Fig. 1 ein Blockdiagramm ist, das einen Sprach-Kodierer zeigt, der eine Frequenzdarstellung eines Linienspektrums des LPC-Filters verwendet.
  • Fig. 2 ein Flussdiagramm ist, das ein Verfahren beschreibt, um die vorliegende Erfindung zu implementieren. Der Vorgang, der zum Berechnen der Nullstellen der zusätzlichen Polynome R und S (der Block Berechne Nullstelle) verwendet wird, wird in Fig. 3 detaillierter dargelegt.
  • Fig. 3 ein Flussdiagramm eines Verfahrens ist, um das Newtonsche Verfahren zu implementieren. Das Polynom G = R, falls i ungerade ist. Anderenfalls ist G = S. G'(X) beschreibt die erste Ableitung des Polynoms G an dem Punkt x. Ein zusätzlicher Verfeinerungs- bzw. Präzisierungs-Vorgang ist oft nicht notwendig, wenn einen ausreichende numerische Genauigkeit eingesetzt wird.
  • Fig. 4A-4D stellt den Fortgang der Technik (Algorithmus (29)) dar, die Polynomdeflation verwendet.
  • Ein vereinfachtes Blockdiagramm eines Sprach-Kodierers 10, der die Frequenzdarstellung des Linienspektrums des LPG-Filters verwendet, ist in Fig. 1 gezeigt. Der Sprach-Kodierer 10 kann ein Teil eines Funktelephons bilden, wie zum Beispiel eine digitale zellulare Benutzer- Endvorrichtung oder eine persönliche Kommunikator-Vorrichtung. Ein Eingangs-Audiosignal, wie zum Beispiel ein Sprachsignal, das von einem Sprach-Transducer oder Mikrophon 5 erhalten wird, wird durch einen Analog-zu-Digital (A/D) Konverter 12 in eine digitale Form umgewandelt. Die digitale Ausgabe des A/D Konverters wird durch Aufteilen des Signals in Rahmen günstiger Länge, typischerweise in der Größenordung einiger zehn Millisekunden, vorbearbeitet. Es sollte bemerkt werden, dass die A/D Umwandlung nicht notwendig ist, wenn das Signal bereits in digitaler Form vorliegt. Nach der Vorbearbeitung wird das Signal einem LPC-Analyse- Block 14 zugeführt. Die LPC-Analyse erzeugt Koeffizienten für einen LPC-Filter, auf den hier ebenfalls als ein LPC-Analyse-Filter 16 bezug genommen wird. Die Ausgabe des LPC-Analyse- Blocks 14 wird in eine Frequenzdarstellung eines Linienspektrums (LSF) in Block 18 umgewandelt. Die LSF Koeffizienten können in Block 20 quantisiert werden und dann in Block 22 interpoliert werden, um einen LPC-Analyse-Filter für jeden Sprach-Unterrahmen zu erstellen. Als Beispiel und für einen Sprach-Rahmen mit einer Lauer von 20 Millisekunden können vier Unterrahmen von 5 Millisekunden verwendet werden, wobei der Analyse-Filter für jeden Unterrahmen separat erstellt wird. Nach dem LPC-Filtern in Block 16 werden die Koeffizienten eines Langzeit-Prädiktions- (LTP) Filters ermittelt und das Residuum wird in dem Block erzeugt, der als LTP-Analyse und Filtern 24 bezeichnet ist. Das Residuum wird in dem Erregungs- Kodier-Block 26 kodiert und das resultierende Residuum, d. h. ein kodiertes Erregungssignal, wird mit den quantisierten LSF Koeffizienten in einen Bitstrom gemultiplext (Block 28), der an einen Sprach-Dekodierer (nicht gezeigt) über einen Kommunikationskanal 30 übertragen wird. Der Kommunikationskanal 30 ist zum Beispiel ein Funkkanal, der die mobile Endvorrichtung mit einerBasisstation (nicht gezeigt) durch einen Sender 32 und eine Antenne 34 verbindet. Die "Seit-Införmations"-Eingabe an dem Multiplexer 28 bestimmt zum Beispiel den Betriebsmodus des Sprach-Kodierers, insbesondere für Codices mit variabler Rate wie zum Beispiel QCELP. Bei einem Sprach-Kodierer, der in einem Modus mit fester Rate arbeitet, kann diese Eingabe nicht notwendig sein.
  • Die folgende detaillierte Beschreibung der Erfindung betrifft vor allem den Betrieb des LPC zu LSF Blocks 18 von Fig. 1. Die vorliegende Erfindung benötig keine Modifikationen an anderen Blöcken, die in Fig. 1 gezeigt sind. Es ist ebenfalls zu bemerken, dass die LPC zu LSF Umwandlung nicht in einem Dekodierer gegenwärtiger Sprach-Codices verwendet wird. Der Dekodierer des Sprach-Codex wird außerdem in dieser Beschreibung nicht betrachtet, obwohl ein Dekodierer, der eine LPC zu LSF Umwandlung verwendet, ebenfalls innerhalb des Schutzumfangs der Lehre dieser Erfindung liegt.
  • 1.1. Frequenzdarstellung des Linienspektrums
  • Das Prädiktor-Polynom vom n-ten Grad des LPC-Filters
  • (1) An(z) = 1 + α&sub1;Z&supmin;¹ + ... + αnZ-n
  • erfüllt die Rekursionsformel
  • (2) An+1(z) = An(z)+ kn+1z-n-1An(z-1),
  • wobei k&sub1;, k&sub2;, ..., kn+1 Reflexionskoeffizienten sind. Die Rekursionsformel (2) wird als Levinson- Durbin-Lösung der Yule-Walker-Gleichungen bezeichnet. Sie drückt die Beziehung zwischen den Präiktor-Polynomen vom (n + 1)-ten und n-ten Grad aus. Es wird zum Zweck dieser Beschreibung angenommen, dass alle Wurzeln des Prädiktor-Polynoms innerhalb des Einheitskreises liegen, d. h. dass das Prädiktor-Polynom eine minimale Phase aufweist.
  • Durch setzten von kn+1 = 1, ergibt die Rekursionsformel das Polynom:
  • (3) Pn+1(z) An(z) + z-n-1An(z&supmin;¹).
  • Durch Definition ist (3) ein symmetrisches Polynom in einem Sinne, dass es die Beziehung erfüllt:
  • Pn+1(z)= z-n-1Pn+1(z&supmin;¹)
  • In ähnlicher Weise erhält man durch Setzen von kn+1 = -1 in (2) ein antisymmetrisches Polynom
  • (4) Qn+1(z) = -z-n-1Qn+1(z&supmin;¹)
  • Aus (3) und (4) folgt, dass das Prädiktor-Polynom (1) in eine Summe von symmetrischen und antisynimetrischen Polynomen zerlegt werden kann:
  • (5) An(z) = ¹/&sub2;(Pn+1(z) + Qn+1(z)).
  • Die Wurzeln der Polynome Pn+1(z) und Qn+1(z) bestimmen tatsächlich die Frequenzen im Linienspektrum des Prädiktor-Polynoms. Soong und Juang ("Line spectrum pair (LSP) and speech data compression", Proceedings of IEEE International Conference on Acoustics, Speech, and Signal Processing, San Diego, CA, pp.1.10.1-1.10.4, März 1984) haben gezeigt, dass, wenn An(z) eine minimale Phase aufweist, dann liegen die Wurzeln von Pn+1(z) und Qn+1(z) auf dem Einheitskreis und die Wurzeln einfach und voneinander verschieden sind. Pn+1(z) und Qn+1(z) können deshalb wie folgt faktorisiert werden:
  • wobei ω&sub1;, ω&sub2;, ..., ωn die Phasenwinkel der Nullstellen der Polynome
  • (8) P(z) (1 - 2z&supmin;¹cosωi + z&supmin;²)
  • (9) Q(z) (1 - 2z&supmin;¹cosωi + z&supmin;²)
  • sind, so dass
  • (10) 0 < &omega;&sub1;, < &omega;&sub2; < ... < &omega;n < &pi;
  • wobei &omega;&sub1;, &omega;&sub2;, ..., &omega;n die Frequenzen im Linienspektrum von An(z) sind.
  • Man beachte, dass beide Polynome Pn+1(z) und Qn+1(z) symmetrisch sind und der Grad von P(z) 2mP ist, wobei
  • Der Grad des Polynoms Q(z) ist 2mQ, wobei
  • Bei expliziter Verwendung der Symmetrie des Polynoms, kann das in (8) definierte P(z) in der Form geschrieben werden
  • (11) P(Z) = 1 + p&sub1;z&supmin;¹ + p&sub2;z&supmin;² + ... + p&sub2;z-2mp+2 + p&sub1;z-2mp+1 + z-2mp = z-mp{(zmp + z-mp) + p&sub1;(zmp-1) + ... + pmp},
  • wobei p&sub1;, p&sub2;, ..., pmp die Koeffizienten von P(z) sind. Durch Ersetzen z = ej&omega; und durch verwenden der Beziehung
  • zk + z-k = ej&omega;k + e-j&omega;k = 2cos&omega;k
  • ergibt Gleichung (11)
  • (12) P(&omega;) = e-j&omega;mp{2cosmp&omega; + 2p&sub1;cos(mp - 1)&omega; + ... + pmp}.
  • Das symmetrische Polynom Q(z) kann in ähnlicher Weisse in die Form umgeschrieben werden
  • (13) Q(&omega;) = e-j&omega;mQ{2cosmQ&omega; + 2q&sub1;cos(mQ - 1)&omega; + ... + qmQ}},
  • wobei q&sub1;, q&sub2;, ..., qmQ die Koeffizienten des Polynoms Q(z) sind.
  • Aus Gleichung (8) folgt, dass die Frequenzen &omega;&sub1;, &omega;&sub3;, ..., &omega;2mp im Linienspektrum die Nullstellen von P(&omega;) in dem Intervall [0,&pi;] sind. Die Frequenzen &omega;&sub2;, &omega;&sub4;, ..., &omega;2mQ im Linienspektrum sind entsprechend die Nullstellen von Q(&omega;), wenn &omega; [0,&pi;]. Die Frequenzen im Linienspektruni von An(z) können daher durch lösen der Nullstellen der Reihen ermittelt werden.
  • (14) R(&omega;) cosmp&omega; + p&sub1;cos(mp - 1)&omega; + ... + (1/2) pmp,
  • (15) S(&omega;) cosQ&omega; + q&sub1;cos(mQ - 1)&omega; + ... + (1/2)qmQ,
  • wobei &omega; [0,&pi;]. In einem QCELP Sprach-Kodierer zum Beispiel werden die Frequenzen im Linienspektrum direkt aus (14) und (15) gelöst (siehe, als Beispiel, TIA/EIA/IS-96-A, Speech Service Option Standard for Wideband Spread Spectrum Digital Cellular System (1994)). Es ist jedoch wünschenswerter, die Kosinus-Reihen in Polynome umzuschreiben, um der Auswertung von trigonometrischen Funktionen zu begegnen. Dies wird in dem folgenden Abschnitt genauer diskutiert.
  • Die Beziehungen zwischen den Koeffizienten des Prädiktor-Polynoms und den Koeffizienten der Kosinus-Reihen (14) und (15) können aus Gleichung (3), (4) und (6)-(9) abgeleitet werden.
  • 1.2 Tschebyscheffsche Polynome
  • Die Tschebyscheffschen Polynome der ersten Art sind durch die Rekursionsformel
  • (16) Tk+1(x) = 2xTk(x) - Tk-1(x), k = 1, 2, ...
  • definiert, wobei die Anfangsbedingungen T&sub0;(x) = 1 und T&sub1;(x) = x. Für x in dem Intervall [-1,1] weisen die Tschebyscheffschen Polynome die geschlossene Form auf
  • (17) Tk(x) = cos{karccosx}, k = 0,1, ...
  • Die expliziten Formen der ersten wenigen Tk sind
  • T&sub2;(x) = cos{2arccosx } = 2x² - 1,
  • T&sub3;(x) = cos{3arccosx} = 4x³ - 3x,
  • T&sub4;(x) = cos{4arccosx} = 8x&sup4; - 8x² + 1,
  • T&sub5;(x) = cos{5arccosx} = 16x&sup5; - 20x³ + 5x.
  • Durch Wechseln einer Variablen
  • (18) &omega; = arccosx
  • und Verwenden von (12), Gleichungen (14) und (15) ergibt sich:
  • (19) R(x) = Tmp (x) + p&sub1;Tmp-1(x) + ... +(1/2)Pmp,
  • (20) S(x) = TmQ(x) + q&sub1;TmQ-1) + ... + (1/2)qmQ.
  • Die Frequenzen {&omega;i} im Linienspektrum können durch Lösen der Gleichungen R(x) = 0 und S(x) = 0 für x in dem Intervall [-1,1] bestimmt werden. Sobald die Wurzeln {xi} gelöst sind, sind die entsprechenden Frequenzen im Linienspektrum durch &omega;i = arccosx, gegeben.
  • Verschiedene Verfahren sind in der Literatur vorgeschlagen worden, um die Nullstellen von (14) und (15) zu lösen. Um einen Hintergrund für die Lehre dieser Erfindung bereitzustellen, wird ein kurzer Überblick über einige Algorithmen gegeben, die in der Literatur dargelegt sind. Die Verfahren, die in einigen gegenwärtig standardisierten Sprach-Codices verwendet werden, werden ebenfalls diskutiert.
  • Der Vorgang, der durch Soong und Juang eingeführt wurde, wertet (14) und (15) auf einem feinen Gitter durch diskrete Kosinus-Transformation aus. Vorzeichenwechsel an benachbarten Gitterpunkten isolieren Intervalle, die Wurzeln enthalten. Nachdem ein Vorzeichenwechsel erfasst wurde, wird das Intervall bisektoriert bis eine ausreichend genaue numerische Schätzung für die Nullstelle erhalten wird. Ein ähnlicher auf Bisektion basierender Algorithmus wird ebenfalls in dem QCELP Sprach-Codex verwendet (d. h. TIA/EIA/IS-96-A, Speech Service Option Standard for Wideband Spread Spectrum Digital Cellular System (1994)). In QCELP werden jedoch die Gleichungen (14) und (15) durch direkte Berechnung aller Terme der Reihen ohne Transformationen ausgewertet. Da eine große Anzahl an trigonometrischen Funktionen auszuwerten ist, wird der Algorithmus zwangsläufig komplex und die numerische Genauigkeit kann in einer Festpunkt-Umsetzung gering sein.
  • Kang und Fransen ("Application of line spectrum pairs to low bit rate speech encoders", Proceedings of IEEE International Conference on Acoustics, Speech, and Signal Processing, Tampa, FL, pp. 7.3.1-7.3.4, März 1984) haben Autokorrelations-basierende und Verhältnisfilterbasierende Verfahren zum Auffinden von Frequenzen im Linienspektrum vorgeschlagen. Diese zwei Verfahren erfordern jedoch ebenfalls eine Auswertung einer großen Anzahl an trigonometrischen Funktionen.
  • Um der Auswertung von trigonometrischen Funktionen zu begegnen, haben Kabal und Ramachandran ("The computation of line spectrum frecluencies using Chebyshev polynomials", "IEEE Transactions on Acoustics, Speech and Signal Processing, vol. 34, no. 6, pp. 1419-1426, 1986) vorgeschlagen, dass die Kosinus-Reihen (14) und (15) in die Form (19) und (20) umgewandelt werden. Dann können die Frequenzen {&omega;i} im Linienspektrum durch die Nullstellen von (19) und (20) in dem Intervall [-1,1] bestimmt werden. Kabal und Ramachandran verwenden ebenfalls den Bisektions-Algorithmus Gleichungen (19) und (2) werden auf einem Gitter ausgewertet, um Vorzeichenwechsel an benachbarten Gitterpunkten zu lokalisieren. Nachdem ein Vorzeichenwechsel erfasst worden ist, wird die Nullstelle durch sukzessive Bisektion des Intervalls berechnet. Da dieses Verfahren gegenwärtig in einigen Sprach-Codices verwendet wird, z. B. in (TIA/EIS/IS-96-641 TDMA Cellular/PCS-Radio Interface-Enhanced Full-Rate Speech Codec (1996)), wird es in dem nächsten Anschnitt detaillierter beschrieben.
  • Saoudi et al. ("A new efficient algorithm to compute ihe LSP parameters for speech coding", Signal Processing, vol. 28, pp. 201-212, 1992) formuliert das Problem um. Das heißt, dass sie einen Algorithmus einführen, der Frequenzen im Linienspektrum aus Eigenwerten von tridiagonale symmetrischen Matrizen ohne Berechnung des Prädiktor-Polynoms lösen. Die Eigenwerte werden durch das Bisektions-Verfahren berechnet. Saoudi et al. vergleichten ebenfalls die Komplexität einiger Algorithmen, die eingeführt wurden, um die Frequenzen im Linienspektrum zu berechnen. Leider sind die Ergebnisse des Vergleichs nicht umfassend.
  • Es ist ebenfalls zu bemerken, dass Chan ("Computation of LSF parameters from reflection coefficients", Electronic Letters, vol. 27, no. 19, pp. 1773-1774, 1991 und "Efficient interconversion algorithm for PARCOR and LSP parameters", in Proceedings of International Symposüum on Speech, Image Processing and Neural Networks, Hong Kong, pp. 603-606, 13-16 April 1994) ein Verfahren eingeführt hat, um Polynome Pk=1(z) und Qk=1,2,n(z) für k zu bilden, ohne explizit die Koeffizienten des Prädiktor-Polynoms zu berechnen. Dieser Ansatz löst jedoch das Nullstellen-Auffind-Problem nicht.
  • Wie vorstehend erwähnt wurde, haben Kabal und Ramachandran vorgeschlagen, dass die Kosinus-Reihen (14) und (15) in die Form (19) und (20) durch Ausnutzen der Tschebyscheffschen Polynome umgeschrieben werden. Dies ermöglicht eine Auswertung der Gleichungen mit einer einfachen Rekursion und ohne trigonometrische Funktionen. Kabal und Ramachandran verwendeten die Eigenschaft (10) oder äquivalent
  • (21) 1 > x&sub1; > x&sub2; > ... > xn > -1,
  • um die Komplexität ihres Algorithmus zu verringern.
  • (22) Algorithmus
  • (a) Initialisierung. Berechne die Koeffizienten (19) und (20), wenn An(z) gegeben ist. Teile die obere Hälfte des Einheitskreises in N Unterintervalle [&omega;Gk, &omega;G(k+1)], k = 1,2, ..., N auf, so dass &omega;G1 = 0 und &omega;GN = &pi;. Bilde die Gitterpunkte {&omega;Gk} auf die reelle Achse durch xGk = cos&omega;Gk ab und beginne die Suche für das Polynom R(x).
  • (b) Überprüfe, ob das zu untersuchende Polynom einen Vorzeichenwechsel in dem Intervall [&omega;Gk, &omega;G(k+1)] zeigt.
  • (c) Wenn ein Vorzeichenwechsel erfasst wird, lokalisiere die Nullstelle x, aus dem Intervall [&omega;Gk, &omega;G(k+1)] durch das Bisektions-Verfahren. Nachdem die Nullstelle gefunden worden ist, setzte mit der Suche mit einem anderen Polynom fort.
  • (d) Setzte k := k + 1. Setze mit (b) fort, bis alle n Nullstellen gefunden sind oder alle Intervalle durchsucht worden sind.
  • Obwohl der Algorithmus (22) dafür bekannt ist, in Sprach-Codices eingesetzt zu werden, weist er einige Nachteile auf. Zum Beispiel, wenn einige Nullstellen der Polynome ausreichend nah zueinander sind, weist der Algorithmus die Tendenz auf, die Nullstellen zu übersehen, da der Vorzeichenwechsel nicht erfasst wird. Dieser Nachteil kann umgangen werden, indem das Gitter enger gemacht wird. In anderen Worten, die Intervalle werden ausreichend klein gemacht, so dass zwei oder mehr Wurzeln nicht in dem gleichen Intervall auftreten können. Die letztendliche Wahl des Gitterintervalls ist immer ein Kompromiss zwischen einer Zuverlässigkeit und Rechenlast. Das heißt, wenn das Gitterintervall dichter gemacht wird, steigt die totale Rechenlast ebenso an.
  • In Übereinstimmung mit der Lehre dieser Erfindung, wird eine Verringerung in der Komplexität der Sprach-Kodierung und insbesondere der Berechnung von Frequenzen im Linienspektrum möglich gemacht. In Übereinstimmung mit der Lehre dieser Erfindung wird eine signifikante Verbesserung durch Auswerten von (19) und (20) mit einer Rekursion erreicht, die weniger arithmetische Operationen benötigt als die Verfahren, die in den gegenwärtigen Sprach- Kodierern verwendet werden.
  • Ferner eliminiert das Verfahren in Übereinstimmung mit der Lehre dieser Erfindung sukzessive schon gefundene Nullstellen aus den Polynomen. Der Vorgang ist als Polynomdeflation oder als synthetische Division in der numerischen Analysis, siehe z. B. Kincaid and Chaney, bekannt. Die Anwendung von Polynomdeflation ermöglicht die Beseitigung des Vorzeichenwechsel- Erfassungsvorgangs aus dem Algorithmus. Ein andere Vorteil besteht darin, dass effiziente Algorithmen (die bessere Konvergenzeigenschaften aufweisen als das Bisektions-Verfahren) zusammen mit der Eigenschaft (21) ausgenutzt werden können, um die Nullstellen zu lokalisieren. Zum Beispiel garantiert der Algorithmus, wenn Nullstellen durch das Newtonsche Verfahren berechnet werden, alle Frequenzen im Linienspektrum zu finden, wenn eine ausreichende numerische Genauigkeit verwendet wird.
  • Die Verfahren dieser Erfindung werden in der folgenden Diskussion detaillierter dargelegt.
  • Betrachtet man jetzt die Auswertung von R(x) und S(x) für einen gegebenen Wert x in dem Intervall [-1,1]. Die auszuwertenden Tschebyscheffschen Reihen (19) und ebenso (20) können dargestellt werden als
  • (23) R(x) = pmp-kTk(x) + (1/2)pmp akTk (x),
  • mit p&sub0; = 1, a&sub0; = (1/2)pmp und ak = pmp-k. Die Summation in (23) reduziert sich zu
  • (24) R(x) = akTk(x) = b&sub0;(x) - b&sub2;(x) + a&sub0;,
  • wobei b&sub0;(x) und b&sub2;(x() durch die inverse Rekursionsformel gegeben sind
  • bk(x) = 2xbk+1(x) - bk+2(x) + k,
  • bmp(x) = bmp+1(x) = 0.
  • Kabal und Ramachandran haben diese Technik in ihrem Algorithmus verwendet.
  • Obwohl (23) ein numerisch robustes Verfahren für die; Auswertung der Tschebyscheffschen Reihen ist, erfordert es in dieser speziellen Anwendung (mp + 1) Multiplikationen und (2mp - 1) Additionen. Ebenso erhöhen zahlreiche Datenverschiebungs-Operationen die Arbeitslast in einer DSP Implementation.
  • In dieser Erfindung wird stattdessen ein effizienteres Verfahren verwendet. Um R(x) und S(x) auszuwerten, wird stattdessen (19) und (20) in die Polynome
  • (25) R(x) = r&sub0;xmp + r&sub1;xmp-1 + ... + rmp,
  • (26) S(x) = s&sub0;xmQ + s&sub1;xmQ-1 + ... + smQ,
  • mit den expliziten Formen der Tschebyscheffschen Polynome umgewandelt. Die Polynome (25) und (26) können dann durch den Vorgang verschachtelter Multiplikationen ausgewertet werden, der ebenfalls als Hornerscher Algorithmus bekannt ist (siehe zum Beispiel Kincaid und Cheney, Numerical Analysis: Mathematics of Scientific Computing, Books/Cole Publishing Company, 1991).
  • Der Hornersche Algorithmus erzeugt R(x) = b&sub0;(x) und in ähnlicher Weise S(x) durch die inverse Rekursionsbeziehung
  • (27) bk(x) = xbk+1(x) + rk
  • mit einen Startwert bmp(x) = rmp. Die Gleichung (27) benötigt mp Multiplikationen und mp Additionen. Die Rekursion (27) kann natürlich ebenfalls in anderen mathematisch äquivalenten Formen verwendet werden.
  • Beispiel
  • Die Überlegung wird für den Fall durchgeführt, dass der Grad von An(z) zehn (n = 10) ist. Somit mp = 5. Die Umwandlung von (10) zu (25) ergibt die Polynom-Koeffizienten
  • r&sub0; = 16, r&sub1; = 8p&sub1;,
  • r&sub2; = 4p&sub2; - 20, r&sub3; = 2p&sub3; - 8p&sub1;,
  • r&sub4; = -3p&sub2; + p&sub4; + 5, r&sub3; = p&sub1; - p&sub3; + P&sub5;/2
  • wenn das Polynom
  • R(x) = {16x&sup5; - 20x³ + 5x} + p&sub1;{8x&sup4; - 8x² + 1}
  • + p&sub2;{48x³ - 3x } + p&sub3;{2x² - 1 } + p&sub4;x + p&sub5;/2
  • in der offenen Form geschrieben ist. In dieser Form benötigt die Auswertung von R(x) unter Verwendung des Hornerschen Algorithmus 5 Multiplikationen und 5 Additionen, während das Verfahren (24) 6 Multiplikationen und 9 Additionen benötigen würde. Die Differenz beträgt insgesamt 5 Operationen (plus Datenverschiebungs-Operationen in einer Festpunkt-Implementation). Wie erkannt werden kann, werden die Polynome in einigen Sprach-Kodierern hunderte Male in einem einzelnen Sprachrahmen während der Berechnung von Frequenzen im Linienspektrum ausgewertet und infolgedessen kann eine große Anzahl an Operationen eliminiert werden. Die Berechnung von r&sub0;, r&sub1;, ..., r&sub5; benötigt sechs Additionen und sechs Multiplikationen. Diese Koeffizienten werden jedoch normalerweise nur einmal pro Rahmen berechnet.
  • Eine Erörterung wird nun über die Aspekte der Polynomdeflation dieser Erfindung geführt. Es wird zuerst darauf hingewiesen, dass es möglich ist, die Überprüfung von Vorzeichenwechsel zu vermeiden, wenn schon gefundene Nullstellen sukzessive aus den Polynomen R(x) und S(x) oder in äquivalenter Weise aus R(&omega;) und S(&omega;) eliminiert werden. In der numerischen Analysis ist dieser Vorgang als Polynomdeflation oder synthetische Division bekannt. Die Polynomdeflation basiert auf der Beziehung
  • (28) R(x) = r&sub0;(x - x&sub1;)(x - x&sub3;) ... ra(x - x&sub1;)RQ(x).
  • Zum Beispiel wird angenommen, dass n gerade ist und eine Nullstelle x = x&sub1; von R(x) lokalisiert worden ist. Die verbleibenden Nullstellen x&sub3;, ..., xn-1 sind ebenfalls Nullstellen von R(x). Um diese Nullstellen zu berechnen, kann das Polynom R(x) durch das Quotienten- Polynom RQ(x) ersetzt werden. Auf dies wird als die Polynomdeflation bezug genommen. Der Vorgang kann wiederholt werden; sobald eine Nullstelle gefunden wird, kann sie herausgeteilt werden. Auf diese Art kann die Nullstellen-Auffind-Technik mit Polynomen von geringerem und geringerem Grad arbeiten. Die bekannten Nullstellen können aus dem Polynom unter Verwendung des Hornerschen Algorithmus entfernt werden. Die Verwendung von Polynomdeflation spart eindeutig arithmetische Operationen ein.
  • Jetzt kann der Algorithmus, der Polynomdeflation zur Berechnung der Frequenzen im Linienspektrum verwendet, in Übereinstimmung mit der Lehre dieser Erfindung wie folgt zusammengefasst werden:
  • (29) Algorithmus
  • (a) Initialisierung. Berechne die Koeffizienten von (25) und (26), wenn An(z) gegeben ist. Beginne die Suche mit dem Polynom R(x) mit einem Startwert x&sub0; = 1. Setzte k = 1.
  • (b) Berechne die Nullstelle xk (-1, xk-1) durch das Newtonsche Verfahren. Die vorherige Nullstelle xk-1 ist ein vernünftiger Startwert. Siehe Fig. 3.
  • (c) Verfeinere bzw. Präzisiere die numerische Schätzung der Nullstelle xk durch Aufnehmen von zusätzlichen Schritten in das Newtonsche Verfahren unter Verwendung des nichtdeflationierten Polynoms (Fig. 3). Es ist zu bemerken, dass dieser Verfeinerungs- bzw. Präzisierungs-Schritt von der numerischen Schätzung optional ist.
  • (d) Wenn der Grad des Polynoms zwei ist, löse die letzte Nullstelle analytisch (siehe nächster Abschnitt). Anderenfalls eliminiere die Nullstelle xk aus dem Polynom durch die Polynomdivisions-Technik. Setzte die Suche mit dem anderen Polynom fort.
  • (e) Setzte k := k + 1. Setzt mit (b) fort, bis alle Nullstellen gefunden sind.
  • Lösung der letzten Nullstelle von R(x) und S(x)
  • Wenn die deflationierten Polynome R(x) und S(x) vom Grad 2 sind und ihre andere Nullstelle bekannt ist, kann die letzte der Polynome analytisch gelöst werden. Betrachte zum Beispiel das Polynom
  • RQ = rQ0x² + rQ1x + rQ2,
  • das durch Dividieren schon gefundener Nullstellen aus dem Polynom R(x) erhalten wird. Nullstellen von RQ(x) werden mit xQ1 und xQ2 bezeichnet.
  • Nimmt man an, dass die Nullstelle xQ1 schon gefunden worden ist und ist es die Aufgabe, xQ2 zu lösen. Da die Polynomdivision (rQOx² + rQ1x + rQ2)/(x - xQ1) den Quotienten RQ1 = rQ0x + rQ1 + rQ0xQ1 ergibt, wird die Nullstelle xQ2 ohne weiteres aus der Gleichung RQ1 = 0 erhalten. Die Gleichung ergibt xQ2 = -xQ1 - rQ1/rQ0. Durch diese Weise ist die Berechnung der Quadratwurzel unnötig, die aus der Lösung von RQ1 = 0 folgt. Zudem werden nicht notwenige Newtonsche Iterationen nicht benötigt.
  • Dieser Vorgang wird in Schritt (d) von Algorithmus (29) angewendet, d. h. in dem Block Löse die letzte Nullstelle in Fig. 2.
  • Das Newtonsche Verfahren ist in Fig. 3 detaillierter beschrieben. Sowohl der Wert des ersten Polynoms als auch seine erste Ableitung werden durch das Hornersche Verfahren effektiv berechnet.
  • Fehler in der numerischen Schätzung von xk akkumulieren sich, wenn k sich erhöht, da die Nullstellen der sukzessiven Quotientenpolynome mehr und mehr von den Nullstellen des nichtdeflationierten Polynoms abweichen. Diesen wird begegnet, indem die Nullstellen, die durch Schritt (b) von Algorithmus (29) gegeben sind, verfeinert. bzw. präzisiert werden. Die Nullstelle kann duch Aufnehmen zusätzlicher Schritte in dem Newtonschen Verfahren aber nun bei Verwendung der nichtdeflationierten Polynome (Fig. 3) verfeinert bzw. präzisiert werden. Wenn jedoch eine adäquate numerische Genauigkeit eingesetzt wird, ist der Verfeinerungs- bzw. Präzisierungs-Schritt normalerweise nicht notwendig.
  • Der Term 1/G'(x), der in dem Newtonschen Verfahren verwendet wird, kann approximiert werden, indem zum Beispiel seine Werte in einem geeigneten Bereich von G'(x) tabelliert werden. Wenn diese Approximation als GA(x) bezeichnet wird, kann der Newtonsche Schritt xk := xk - G(xk)/G'(xk) in die Form xk := xk - G(xk)GA(xk) vereinfacht werden. Somit wird die Divisionsoperation nicht benötigt. Es ist jedoch offensichtlich, dass die Approximation die Korivergenzeigenschaften des Nullstellen-Auffinders schwächt, obwohl sie ebenfalls die Komplexität der Festpunkt-Implementation verringert.
  • Zusätzlich zu dem Newtonschen Verfahren können andere Algorithmen; wie zum Beispiel das Sekantenverfahren, siehe Kincaid und Cheney, für das Lokalisieren oder Verfeinern bzw. Präzisieren der Nullstellen verwendet werden.
  • Die Startwerte können ebenfalls verschieden gewählt werden. Zum Beispiel kann der Algorithmus von x&sub0; = -1 aus starten. In diesem Fall würden die Schätzungen von Nullstellen, die durch das Verfahren gegeben sind, in aufsteigender Reihenfolge: -1 < x&sub1; < x&sub2; < ... < xn < 1 vorliegen.
  • Es sollte bemerkt werden, dass alle Gleichungen, die in dem Algorithmus (29) benötigt werden, auch einfach unmittelbar in Übereinstimmung mit der Lehre dieser Erfindung aus der allgemeineren Form des Polynoms An(z) abgeleitet werden können; das heißt,
  • An(z) = a&sub0; + a&sub1;z&supmin;¹ + ... +anz-n.
  • Die Lehre der vorliegenden Erfindung ist folglich nicht auf die All-Pol Form des LPC-Filters beschränkt.
  • Fig. 4A-4D stellen den Fortgang der Technik (Algorithmus (29)) dar, die Polynomdeflation einsetzt. Die Nullstellen der Polynome R(x) und S(x), die A&sub1;&sub0;(z) entsprechen, sind in Fig. 4A durch Kreuze (x) bzw. Kreise (o) dargestellt. Der Nullstellen-Lokalisiervorgang wird von x&sub0; = 1 aus begonnen (Fig. 4B). Nachdem die erste Nullstelle x&sub1; gefunden worden ist, wird (x - x&sub1;) aus dem Polynom R(x) dividiert. Das Polynom R(x) nach der ersten Deflation ist in Fig. 4C gezeigt. Die Suche wird als nächstes mit S(x) unter Verwendung von x1 als ein Startwert fortgeführt. Wenn x&sub2; lokalisiert worden ist, wird der Vorgang wieder zu dem deflationierten R(x) Polynom zurück geschaltet und x&sub2; dient als ein neuer Startwert. Der Vorgang wird fortgeführt, bis alle Nullstellen gefunden worden sind. Fig. 4D stellt das Polynom R(x) nach zwei Deflationen dar.
  • Es kann daher verstanden werden, dass die Erfindung in einem Aspekt ein Verfahren lehrt, Frequenzen im Linienspektrum eines linear-prädiktiven Kodierer- (LPC) Filters zu bestimmen, der durch symmetrische und antisymmetrischen Polynome ausgedrückt wird, deren Nullstellen die Frequenzen im Linienspektrum des LPC-Filters bestimmen. Das Verfahren umfasst die Sehritte (a) Ausdrücken der Polynome unter Verwendung von expliziten Formen Tschebyscheffscher Polynome; (b) iteratives Lösen einer Nullstelle eines ersten der Polynome unter Verwendung einer Nullstelle des anderen der Polynome; und (c) sukzessives Eliminieren von Nullstellen aus den Polynomen durch Polynomdivision, um so die Frequenzen im Linienspektrum zu bestimmen.
  • Bezugnehmend auf den Schritt des iterativen Lösen, sollte bemerkt werden, dass das erste Polynom entweder das symmetrische oder das antisymmetrische Polynom sein kann, wobei in diesem Fall das andere Polynom dann das antisymmetrische bzw. das symmetrische Polynom ist. Bezug kann gemäß diesem Schritt ebenfalls auf Elemente (b) und (d) von Algorithmus (29), die Gleichung xk = xk - 1 in Fig. 3 und die zwei getrennten Äste (k ungerade/gerade) in Fig. 2 genommen werden. Es sollte ferner bemerkt werden, dass irgendeine der Nullstellen des ersten Polynoms unter Verwendung der Nullstellen des anderen Polynoms gelöst werden kann.
  • 1.3 Frequenzdarstellung des Immittanz-Spektrums
  • Für ein detailliertes Verständnis dieses Anschnitts kann auf Y. Bistritz und S. Peller, "Immittance spectrum pairs (ISP) for speech encoding" in Proceedings of IEEE International Conference on Acoustics, Speech, and Signal Processing, Minneapolis; MI, U.S A., Vol. 2, pp. 9-12, 27-30. April 1993 Bezug genommen werden.
  • Die Frequenzdarstellung des Immittanz-Spektrums des LPC-Filters basiert auf einer ähnlichen Polynomzerlegung eines Prädiktor-Polynoms wie die Frequenzdarstellung des Linienspektrums. Die Frequenzdarstellung des Immittanz-Spektrums (siehe Y. Bistritz und Peller) wird erhalten, wenn das Polynom An(z) zerlegt wird als
  • (30) An{z) = (1/2)(Pn(z) + Qn(z)),
  • wobei
  • (31) Pn(z) An(z) + z-nAn(z&supmin;¹),
  • (32) Qn(z) An(Z) + z-nAn(z&supmin;¹).
  • Das symmetrische Polynom Pn(z) und das antisymmetrische Polynom Qn(z) weisen ebenfalls ähnliche Eigenschaften wie die Polynome (3) und (4) auf. Die Wurzeln von Pn(z) und Qn(z) liegen auf dem Einheitskreis und sie sind einfach und voneinander verschieden. Pn(z) und Qn(z) können daher wie folgt faktorisiert werden:
  • wobei K = -(kn + 1)/(kn - 1) und &omega;&sub1;, &omega;&sub2;, ..., &omega;n-1 die Phasenwinkel der Nullstellen der Polynome sind.
  • (35) P(z) (1 - 2z&supmin;¹cos&omega;i + z&supmin;²)
  • (36) Q(z) (1 - 2z&supmin;¹cos&omega;i + z&supmin;²)
  • so dass
  • 0 < &omega;&sub1; < &omega;&sub2; < ... < &omega;n-1 < &pi;
  • Die Phasenwinkel &omega;&sub1;, &omega;&sub2;, ..., &omega;n-1 und der Parameter k ergeben eine eindeutige Parametrisierung für den LPC-Filter. Die Eigenschaften der Frequenzen im Immittanz-Spektrum und ihre Beziehung zu Frequenzen im Linienspektrum wurden detaillierter von Bistritz und Peller diskutiert.
  • Es sollte bemerkt werden, dass die Polynorne (35) und (36) nicht identisch mit den Polynomen sind, die in (3) und (4) definiert sind.
  • Die Grade der symmetrischen Polynome P(z) und Q(z), die in (35) und (36) definiert sind, sind 2mp bzw. 2mQ, wobei
  • und
  • Zum Beispiel, wenn der Grad des Prädiktor-Polynoms zehn ist (n = 10), dann mp = 5 und mQ = 4. Das Polynom A&sub1;&sub0;(z) weist nur n - 1 = mp + mQ = 9 Frequenzen im Immittanz-Spektrum auf. Dies ist der am meisten ersichtliche Unterschied zu der Frequenzdarstellung des Linienspektrums. Es ist ebenfalls zu bemerken, dass die Frequenzen im Immittanz-Spektrum im allgemeinen nicht durch die Frequenzen im Linienspektrum gelöst werden können.
  • Die Beziehungen unter den Koeffizienten von An(z) und den Koeffizienten der Polynome Pn(z) und Qn(z) werden einfach unmittelbar aus den Gleichungen
  • (38) P(z) = 1 + p&sub1;z&supmin;¹ + p&sub2;z&supmin;² + ... + p&sub2;z-2mp+2 + p&sub1;z-2mp+1 + z-2mp
  • (39) Q(Z) = 1 + q&sub2;z&supmin;¹ + q&sub2;z&supmin;² + ... + q&sub2;z-2mp+2 + q&sub1;z-2mp+1 + z-2mq
  • und den Gleichungen (31)-(34) erhalten. Die Gleichungen (38) und (39) können in der Form (25) und (26) geschrieben werden, indem wie vorstehend beschrieben fortgefahren wird. Die Frequenzen &omega;&sub1;, &omega;&sub2; ..., &omega;n-1 im Immittanz-Spektrum können daher in Übereinstimmung mit dieser Erfindung durch die in dem Algorithmus (29) zusammengefassten Techniken gelöst werden.
  • Obwohl vorstehend im Kontext eines Audio-Kodierers für die Verwendung in einem Funktelephon beschrieben, sollte erkannt werden, dass die Lehren dieser Erfindung nicht nur auf den Einsatz in nur dieser einen wichtigen Anwendung beschränkt ist. Zum Beispiel und wiederum bezugnehmend auf Fig. 1 kann der Audio-Kodierer in einem PC oder einer Workstation verwendet werden, die mit einem Netzwerk verbunden sind. Der Kommunikationskanal 30 kann dann ein Draht-basierendes Netzwerk (z. B. das Internet) sein.
  • Obwohl die Erfindung speziell unter Bezugnahme auf bevorzugte Ausführungsformen davon gezeigt und beschrieben wurde, wird von Fachleuten verstanden werden, dass Änderungen in der Form oder Details darin gemacht werden können, ohne den Schutzumfang der Erfindung, wie durch die angefügten Ansprüche definiert, zu verlassen.

Claims (11)

1. Verfahren zum Bestimmen von Frequenzen im Linienspektrum eines linear-prädiktiven Kodier-(LPC)-Filters, der als symmetrische und antisymmetrische Polynome ausgedrückt wird, deren Nullstellen die Frequenzen im Linienspektrum des LPC-Filters bestimmen, die Schritte umfassend:
- Ausdrücken der Polynome unter Verwendung expliziter Formen von Tschebyscheffschen Polynomen;
- iteratives Lösen einer Nullstelle eines ersten der Polynome unter Verwendung einer Nullstelle des anderen der Polynome; und
- sukzessives Eliminieren von Nullstellen von den Polynomen durch Polynom- Division, um so die Frequenzen im Linienspektrum zu bestimmen.
2. Verfahren gemäß Anspruch 1 und ferner einen Schritt zum Übermitteln eines LPC-kodierten Signals an einen Kommunikationskanal umfassend.
3. Verfahren gemäß Anspruch 2, wobei der Schritt des Übermittelns das LPC-kodierte Signal an einen Funk-Kommunikationskanal übermittelt.
4. Verfahren gemäß irgendeinem der vorstehenden Ansprüche, wobei die Nullstelle des anderen der Polynome als ein Anfangswert für das iterative Lösen der Nullstelle des ersten der Polynome verwendet wird.
5. Mobilstation, die in der Lage ist, über einen Kommunikationskanal drahtlos zu kommunizieren, wobei die Mobilstation einen Sprach-Wandler zum Ausgeben eines Sprachsignals einschließt und ferner einschließend:
- einen linear-prädiktiven Kodierer (LPC) mit einem Eingang, der an das Sprachsignal gekoppelt ist, und einem Ausgang, der an den Kommunikationskanal gekoppelt ist; wobei der LPC umfasst:
- einen LPC Filter mit einem ersten Eingang, der an das Sprachsignal gekoppelt ist, und einem Ausgang;
- einen LPC Analyseblock mit einem Eingang, der an das Sprachsignal gekoppelt ist, und einem Ausgang, um LPC Koeffizienten für den LPC Filter zu erzeugen; und
- einen Umwandelblock mit einem Eingang, der an den Ausgang von dem LPC- Analyseblock gekoppelt ist, um die LPC-Koeffizienten in eine Darstellung einer Frequenz im Linienspektrum (LSF) davon umzuwandeln, wobei der Umwandelblock einen Ausgang aufweist, der an einen zweiten Eingang des LPC-Filters gekoppelt ist; wobei
der LPC-Filter symmetrische und antisymmetrische zusätzliche Polynome umfasst, deren Nullstellen die Frequenzen im Linienspektrum des LPC-Filters bestimmen und wobei der Umwandelblock erste Mittel einschließt, um die zusätzlichen Polynome unter Verwendung expliziter Formen von Tschebyscheffschen Polynomen auszudrücken;
zweite Mittel, um eine Nullstelle eines ersten der Polynome unter Verwendung einer Nullstelle des anderen der Polynome iterativ zu lösen; und
der Umwandelblock ferner dritte Mittel umfasst, um sukzessiv Nullstellen aus den Polynomen durch Polynom-Division zu eliminieren, um so die Frequenzen im Immittanz- Spektrum zu bestimmen.
6. Mobilstation gemäß Anspruch 5 und ferner einen Quantisierungsblock und einen Interpolationsblock umfassend, die in Reihe zwischen den Ausgang des Umwandelblocks und des zweiten Eingangs des LPC-Analysefilters gekoppelt sind.
7. Mobilstation gemäß Anspruch 5 oder 6, wobei das dritte Mittel auf einen Grad eines gegebenen der Polynome, der zwei ist, reagiert, um die letzte Nullstelle analytisch zu bestimmen.
8. Verfahren zum Bestimmen der Frequenzen im Immittanz-Spektrum eines linear-prädiktiven Kodier-(LPC)-Filters, die als symmetrische und antisymmetrische Polynome ausgedrückt werden, deren Nullstellen die Frequenzen im Immittanz-Spektrum bestimmen, die Schritte umfassend:
- Ausdrücken der Polynome unter Verwendung expliziter Formen von Tschebyscheffschen Polynomen;
- iteratives Lösen einer Nullstelle eines ersten der Polynome unter Verwendung einer Nullstelle des anderen der Polynome; und
- sukzessives Eliminieren von Nullstellen von den Polynomen durch Polynom-Division, um so die Frequenzen im Immittanz-Spektrum zu bestimmen.
9. Verfahren gemäß Anspruch 8 und ferner einen Schritt von Übermitteln eines LPC-kodierten Signals an einen Kommunikationskanal umfassend.
10. Verfahren gemäß Anspruch 9, wobei der Schritt des Übermittelns das LPC-kodierte Signal an einen Funk-Kommunikationskanal übermittelt.
11. Verfahren gemäß irgendeinem der Ansprüche 8 bis 10, wobei die Nullstelle des anderen der Polynome als ein Anfangswert für das iterative Lösen der Nullstelle des ersten der Polynome verwendet wird.
DE1996626088 1995-11-15 1996-11-07 Bestimmung der Linienspektrumfrequenzen zur Verwendung in einem Funkfernsprecher Expired - Lifetime DE69626088T2 (de)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
US678795P 1995-11-15 1995-11-15
US73582796A 1996-10-23 1996-10-23

Publications (2)

Publication Number Publication Date
DE69626088D1 DE69626088D1 (de) 2003-03-13
DE69626088T2 true DE69626088T2 (de) 2003-10-09

Family

ID=26676063

Family Applications (1)

Application Number Title Priority Date Filing Date
DE1996626088 Expired - Lifetime DE69626088T2 (de) 1995-11-15 1996-11-07 Bestimmung der Linienspektrumfrequenzen zur Verwendung in einem Funkfernsprecher

Country Status (2)

Country Link
EP (1) EP0774750B1 (de)
DE (1) DE69626088T2 (de)

Families Citing this family (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
FR2783651A1 (fr) * 1998-09-22 2000-03-24 Koninkl Philips Electronics Nv Dispositif et procede de filtrage d'un signal de parole, recepteur et systeme de communications telephonique
EP2916319A1 (de) 2014-03-07 2015-09-09 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Konzept zur Codierung von Information
EP3349212A1 (de) * 2017-01-13 2018-07-18 Nokia Technologies Oy Verfahren zur bestimmung von spektrallinienfrequenzen
CN110070894B (zh) * 2019-03-26 2021-08-03 天津大学 一种改进的多个病理单元音识别方法

Family Cites Families (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
GB9002282D0 (en) * 1990-02-01 1990-03-28 Psion Plc Encoding speech
SE467806B (sv) * 1991-01-14 1992-09-14 Ericsson Telefon Ab L M Metod att kvantisera linjespektralfrekvenser (lsf) vid beraekning av parametrar foer ett analysfilter ingaaende i en talkodare

Also Published As

Publication number Publication date
EP0774750A2 (de) 1997-05-21
EP0774750A3 (de) 1998-08-05
DE69626088D1 (de) 2003-03-13
EP0774750B1 (de) 2003-02-05

Similar Documents

Publication Publication Date Title
DE69032551T2 (de) Einrichtung zur Sprachkodierung
DE69529356T2 (de) Wellenforminterpolation mittels Zerlegung in Rauschen und periodische Signalanteile
DE69518452T2 (de) Verfahren für die Transformationskodierung akustischer Signale
DE68907629T2 (de) Vektorquantisierung für eine Anordnung zur harmonischen Sprachcodierung.
DE3789476T2 (de) Digitaler Vocoder.
DE3853916T2 (de) Digitaler-sprachkodierer mit verbesserter vertoranregungsquelle.
DE69530442T2 (de) Vorrichtung zur Sprachkodierung
DE69214969T2 (de) Verfahren und Vorrichtung zur Erzeugung von Hilfsinformationen zur Ausführung einer Suche in einem Kodebuch mit geringer Dichte
DE69724126T2 (de) Audiosignalkodier- und dekodierverfahren und audiosignalkodierer und -dekodierer
DE69009545T2 (de) Verfahren zur Sprachanalyse und -synthese.
DE69618422T2 (de) Verfahren zur Sprachdekodierung und tragbares Endgerät
DE69232892T2 (de) Sprachkodierungssystem
DE3874427T2 (de) Linearer praediktionsvocoder mit code-anregung.
DE69420431T2 (de) Sprachkodierungssystem
DE69322313T2 (de) C.E.L.P. - Vocoder
DE69223335T2 (de) Sprachkodiersystem
DE2229149A1 (de) Verfahren zur Übertragung von Sprache
DE69729527T2 (de) Verfahren und Vorrichtung zur Kodierung von Sprachsignalen
DE60221927T2 (de) Vorrichtung und Programm zur Schallcodierung
DE69426860T2 (de) Sprachcodierer und Verfahren zum Suchen von Codebüchern
DE69314389T2 (de) Zweimoden langzeitprädiktion in sprechkodierung
DE69033510T2 (de) Numerischer sprachkodierer mit verbesserter langzeitvorhersage durch subabtastauflösung
DE69610915T2 (de) Verfahren zur quantisierung des verstärkungsfaktors für die linear-prädiktive sprachkodierung mittels analyse-durch-synthese
DE69411407T2 (de) Vorrichtung zum Kodieren von Sprachspektrumparametern mit der kleinstmöglichen Bitzahl
DE69420682T2 (de) Sprachdekodierer

Legal Events

Date Code Title Description
8364 No opposition during term of opposition
8327 Change in the person/name/address of the patent owner

Owner name: SPYDER NAVIGATIONS LLC, WILMINGTON, DEL., US