EP0291377A1 - Dispositif de transcodage entre réseaux de transmission à débits différents, et son utilisation dans un système de transmission multidébits - Google Patents

Dispositif de transcodage entre réseaux de transmission à débits différents, et son utilisation dans un système de transmission multidébits Download PDF

Info

Publication number
EP0291377A1
EP0291377A1 EP88401018A EP88401018A EP0291377A1 EP 0291377 A1 EP0291377 A1 EP 0291377A1 EP 88401018 A EP88401018 A EP 88401018A EP 88401018 A EP88401018 A EP 88401018A EP 0291377 A1 EP0291377 A1 EP 0291377A1
Authority
EP
European Patent Office
Prior art keywords
transcoding
parameters
speech
networks
bit rates
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Withdrawn
Application number
EP88401018A
Other languages
German (de)
English (en)
Inventor
Alain Albarello
Philippe Sidin
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Thales SA
Original Assignee
Thomson CSF SA
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Thomson CSF SA filed Critical Thomson CSF SA
Publication of EP0291377A1 publication Critical patent/EP0291377A1/fr
Withdrawn legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/04Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
    • G10L19/06Determination or coding of the spectral characteristics, e.g. of the short-term prediction coefficients

Definitions

  • the invention relates to communication networks, and more particularly to the interconnection of networks using digital coders, in particular vocoders, and links with different bit rates.
  • vocoders There are currently different types of vocoders and in particular vocoders of the "LPC" type (in English “Linear Predictive Coding"), that is to say speech coders using linear prediction to carry out coding.
  • LPC Linear Predictive Coding
  • the problem is that these vocoders, all based on the same speech modeling, exist in different bit rates, according to the bandwidths authorized by the transmission media used.
  • speed coders 800 bits per second, or 2400 bits per second in particular used in HF link systems or on telephone pairs; moreover, there are vocoders with higher bit rate, for example 4800 bits, 9600 bits, or more, in particular for transmission systems by radio channels (VHF or UHF), wired or wireless.
  • VHF radio channels
  • UHF radio channels
  • the solution consists in returning to the analog speech signal, by synthesizing the digital information coming from a vocoder of a certain type, and recoding the synthesized speech to transmit it, via a vocoder of the type suitable for the second network.
  • a vocoder of the type suitable for the second network a vocoder of the type suitable for the second network.
  • speech analysis-synthesis operations are carried out in cascade.
  • each analysis-synthesis degrades the initial signal at each transcoding stage. After two successive analyzes / syntheses, the degradation of the signal is already very noticeable.
  • the vocoder of lower bit rate that is to say 800 bits per second, is very sensitive to the distortions that the analog signals may have suffered, in particular due to a previous analysis / synthesis.
  • the signal encoded by a 2400 bit or 4800 bit per second vocoder or more, synthesized and recoded by an 800 bit per second vocoder is unintelligible after synthesis by the 800 bit per second vocoder.
  • the connection between two correspondents each from a network at a certain speed requires a doubling of the equipment.
  • the object of the invention is to offer a possibility of interoperability between networks operating at different bit rates, without it being necessary to switch back to the analog information signal, in particular the speech signal, and by keeping the quality at best possible, that is to say that given by the lowest bit rate vocoder involved in the link considered.
  • the connections between high speed vocoders are not degraded.
  • the subject of the invention is a device for transcoding between transmission networks with different bit rates, purely digital, programmable, in particular for ensuring the interface between networks comprising vocoders with different bit rates based on the same speech modeling, ie for the example given on the linear prediction model.
  • a device for transcoding between information transmission networks in which the successive frames of data transmitted at different rates have the same duration and transmit a set of parameters characteristic of an information segment to be transmitted, the characterization and the format of the different parameters being variable according to the speed authorized in networks, is characterized in that it comprises an input interface circuit associated with memory resources containing the preset transcoding tables necessary for transcoding the various parameters of a characterization and of a given format associated with a first network according to a characterization and / or a possibly different format associated with a second network, and an output interface circuit programmable according to the speed of the receiving network, the processor being programmed to carry out the necessary transcoding operations to all possible frame conversions.
  • the invention also relates to the use of such transcoding devices in a multi-bit transmission system.
  • the model retained for the linear prediction coding "LPC 10" is as follows: the phonation process by which the vocal cords (source) excite the vocal tract (variable filter) is modeled by a voiced signal source (constructed from 'periodic pulses) or unseen (built from white noise) which excites a digital filter with 10 coefficients.
  • a voiced signal source constructed from 'periodic pulses
  • unseen built from white noise
  • a vocoder at 2400 bits per second transmits for each speech segment of 22.5 milliseconds: - the coefficients of a filter representing the vocal tract; - a voicing indicator; - the period of the fundamental for voiced or "pitch" sounds, inverse of the melody frequency; - a measurement of the energy in the speech segment considered.
  • a vocoder at 800 bits per second transmits parameters of the same type as the previous ones but with additional coding: - the filter representing the vocal tract is no longer transmitted in explicit form, that is to say with its own coefficients, but for each speech segment we search within a pre-established dictionary of 1024 filters for the most close to the filter that a 2400 bit per second vocoder would use. For the frame considered, the index of this filter considered to be the closest neighbor is then transmitted; - the fundamental period for voiced sounds; - the measurement of the energy in the speech segment.
  • one of the most effective techniques during speech synthesis consists in using a so-called "multi-pulse" coding which uses the same modeling "LPC 10" of the filter to represent the vocal tract, but in which the analysis is supplemented by the calculation of the error between the speech signal to be coded and the signal which one would obtain with the resulting analysis of linear prediction coding.
  • This error is then minimized by an algorithm which determines the position and the amplitude of pulses which will be transmitted to the filter to carry out the synthesis of the speech signal.
  • the model transmitted then consists of the following elements: - the coefficients of the filter representing the vocal tract; - the energy in the corresponding speech segment; - the period of the fundamental which is used for long-term prediction, that is to say for the repetition of the corrective pulses previously found by the modeling of the error; - the amplitude and the position of the new pulses found for the current frame.
  • the voicing indicator is not transmitted in explicit form.
  • the analysis uses this indicator for the a priori repetition of the pulses.
  • FIG. 1 represents a transmission system in which three networks with different bit rates have been diagrammed: a first network R1, makes it possible to communicate a first set of mobile transceivers, for example boats, M1, M2 ... by HF radio link, this network using vocoders at a rate suitable for these links, ie D1.
  • a second network R2 makes it possible to communicate a second set of transceivers, for example fixed stations, S1, S2 ... connected by wired links, this network using vocoders at a bit rate adapted to these links, ie D2 .
  • a third network R3 makes it possible to communicate a third set of mobile transceivers, for example planes A1, A2, A3 ... by UHF radio links, this network using vocoders at a third rate, D3.
  • the invention provides transcoding devices, purely digital programmable, multi-bit, capable of transcoding the digital frame resulting from the analysis by a vocoder with a bit rate given in a digital frame usable in synthesis by a vocoder at any of the other possible bit rates.
  • the network stations being transceivers, each transcoding device is double for transcoding in both directions.
  • FIG. 2 schematically represents the transcoding devices necessary for a multi-network with three bit rates, of the type represented in FIG. 1.
  • a first transcoding device makes it possible to communicate the networks R1 and R2 by performing a transcoding of a frame at the rate D1 to a frame at the rate D2 for the transmission by a mobile M i of R1 and the mobile reception A j of R2 , part 12, and a transcoding of a frame at bit rate D2 to a frame at bit rate D1 for transmission by a mobile A j and reception by a mobile M i , part 21.
  • a second bilateral transcoding device 23, 32 is necessary to make the networks R2 and R3 communicate and a third transcoding device 13, 31 is necessary to make the networks R1 and R3 communicate.
  • FIG. 3 schematically represents the frames as a function of time for a speech segment at the four rates indicated above: 8000 bits / s, 2400 bits / s, 4800 bits / s and 9600 bits per second.
  • the frame always has the same duration, 22.5 ms, and makes it possible to transmit 18 bits, 54 bits, 108 bits or 216 bits respectively.
  • the filter is not transmitted in explicit form, but by the index of a pre-established filter I F chosen as closest to the calculated filter, in a dictionary of 1024 filters.
  • super-frames composed of 3 frames of 22.5 ms are formed by performing an inter-frame differential coding of the energy measurements E M1 , E M2 , E M3 of these three. frames and periods of "Pitch", P1 P2, P3.
  • Each superframe therefore comprises 1 synchronization eb, the indices of the filters transmitted on 10 bits, 30 bits for the super-frame.
  • the energy and the "Pitch" period measured E M and P are coded by differential coding on 3 frames which leads to 11 eb for the coded energy values (E M1 , E M2 , E M3 ) ci, to 9 eb for the periods (P1, P2, P3) ci and 3 eb voicing indicators i1, i2, i3.
  • the filter is transmitted explicitly in a field F of 41 eb, a field of 5 eb is provided to transmit a measurement of the energy E M in the frame, a P field of 7 eb transmits the Pitch period and 1 eb indicates whether the speech segment considered is voiced or unvoiced.
  • the bit distribution for unvoiced frames is slightly different.
  • a pulse field I makes it possible to code the position of the amplitude of corrective pulses.
  • FIG. 4 represents the functional diagram of the transcoding operations of the multi-bit programmable device according to the invention.
  • transcoding 1 consists, by using the dictionary of filters, 2, of transforming the index of the filter I F in explicit coefficients of the filter designated by this index, F, and to decode the fields (E M , P) ci coded inter-frames, to transmit, for each frame, a measurement of the energy E M and a value of Pitch P period.
  • the parameters are then in 2400 bit format. The receiver only has to transmit them in series at this speed.
  • the field I is used to insert in the frame a predetermined code I o (reference 3 in FIG. 4), which signals that the link has passed through a vocoder with a speed lower than or equal to 2400 bits / s and that therefore, the information relating to the pulses has never existed or has been lost if the link, initially starting from a higher speed vocoder has passed through a network at lower speed.
  • This preset code has a format adapted to the bit rate to be transmitted.
  • the only operation to to perform is a transcoding of the pulse field I so that the pulses, positions and amplitudes are coded in the same way.
  • the corresponding transcoding operations, 6 and 7 in FIG. 4 make it possible to pass respectively from 9600 and 16000 bits / s frames to a 4800 bits / s frame.
  • the transcoding operations 8 and 9 make it possible to pass respectively 4800 and 16000 bits / s frames to a frame 9600 bits / s
  • the transcoding operations 10, 11 allow to pass respectively 48OO and 9600 bits / s frames to a 16000 bit / s frame.
  • the transcoding device shown in FIG. 5 comprises a serial input interface circuit 100, programmable at the rate on the reception side, a processing processor 110 with the memories necessary for the different transcoding tables, 120 useful for the operations described above with reference to FIG. 4, as well as the memory 130 necessary for the dictionary of filters, and a serial output interface circuit 140 coupled to the processor and programmable at the rate on the transmission side.
  • the programming of the processor to carry out the operations described with reference to FIG. 4 for the different possible bit rates is within the reach of the skilled person. For duplex links, resources are doubled. Otherwise the circuits are managed in alternation, according to the procedures conventional in this technique.
  • the invention is not limited to the embodiment described and shown. In particular, it is possible to use the invention no longer for the transmission of speech, but for the transmission of any type of digital information in multi-bit networks, provided that the information is transmitted by means of frames organized in fields. characteristics of parameter sets, and that all the essential parameters can be transcoded from one frame at a first bit rate to a frame at another bit rate.
  • the advantage of such a device is that it makes it possible to directly process digital data without making a synthesis and a new coding; thus the degradation in transmission quality is not greater than that imposed by the lower bit rate encoder inserted in the chain.

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Spectroscopy & Molecular Physics (AREA)
  • Computational Linguistics (AREA)
  • Signal Processing (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Acoustics & Sound (AREA)
  • Multimedia (AREA)
  • Compression, Expansion, Code Conversion, And Decoders (AREA)

Abstract

Le dispositif de transcodage entre réseaux de transmission à débits différents comporte un circuit d'interface d'entrée série (100) adapté à la réception de signaux numériques tramés comportant les paramètres du modèle associé à un segment de signal analogique, un processeur de traitement (110) effectuant un transcodage des paramètres dans le format associé au débit d'entrée, en paramètres au format associé au débit de sortie, en faisant appel à des mémoires (120, 130), table de transcodage ou mémoire dictionnaires, et un circuit d'interface de sortie (140) qui transmet la trame numérique résultant du transcodage, adaptée au débit de sortie.
Application, notamment aux systèmes de transmission utilisant des vocodeurs à débits différents, mais utilisant le même modèle pour le signal de parole à transmettre.

Description

  • L'invention se rapporte aux réseaux de communication, et plus particulièrement à l'interconnexion de réseaux mettant en oeuvre des codeurs numériques, notamment des vocodeurs, et des liaisons à débits différents.
  • Pour la clarté de l'exposé la description qui suit fait référence à des vocodeurs.
  • Il existe actuellement différents types de vocodeurs et notamment des vocodeurs type "LPC" (en anglais "Linear Predictive Coding"), c'est-à-dire des codeurs de parole utilisant la prédiction linéaire pour réaliser le codage. Le problème est que ces vocodeurs, tous basés sur la même modélisation de la parole, existent en différents débits, selon les bandes passantes autorisées par les supports de transmission utilisés. Ainsi, il existe des codeurs de débit 800 bits par seconde, ou 2400 bits par seconde, notamment utilisés dans les systèmes de liaison HF ou sur paires téléphoniques ; par ailleurs, il existe des vocodeurs à débit supérieur, par exemple 4800 bits, 9600 bits, ou plus, notamment pour les systèmes de transmission par voies radio (VHF ou UHF), filaires ou hertziennes. Toutefois la qualité globale de restitution diminue avec le débit utilisé.
  • Actuellement, pour faire communiquer entre eux des utili­sateurs situés dans des réseaux utilisant des vocodeurs de types différents, la solution consiste à revenir au signal analogique de parole, en réalisant la synthèse des informations numériques issues d'un vocodeur d'un certain type, et à recoder la parole synthétisée pour la transmettre, via un vocodeur du type adapté au second réseau. Ainsi, on réalise en cascade plusieurs opérations d'analyse-synthèse de parole. Or, chaque analyse-synthèse dégrade le signal initial à chaque étape du transcodage. Après deux analyses/synthèses successives, la dégradation du signal est déjà très sensible. De plus, le vocodeur de plus bas débit, c'est-à-dire 800 bits par seconde, est très sensible aux distorsions qu'ont pu subir les signaux analogiques notamment du fait d'une analyse/synthèse précédente. Pratiquement, le signal encodé par un vocodeur 2400 bits ou 4800 bits par seconde ou plus, synthétisé et recodé par un vocodeur 800 bits par seconde est inintelligible après la synthèse par le vocodeur 800 bits par seconde. Bien entendu la liaison entre deux correspondants issus chacun d'un réseau à un certain débit nécessite un doublement des équipements.
  • L'invention a pour objet d'offrir une possibilité d'interopérabilité entre réseaux fonctionnant à débits diffé­rents, sans qu'il soit nécessaire de repasser au signal analogique d'information, notamment au signal de parole, et en gardant aux liaisons la qualité la meilleure possible, c'est-à-dire celle donnée par le vocodeur de plus bas débit impliqué dans la liaison considérée. Ainsi, en particulier lorsque des vocodeurs de débits différents coexistent dans un réseau les liaisons entre vocodeurs haut débit ne sont pas dégradées.
  • Plus particulièrement, l'invention a pour objet un dispo­sitif de transcodage entre réseaux de transmission à débits différents, purement numérique, programmable, pour assurer notamment l'interface entre réseaux comportant des vocodeurs de débits différents basés sur la même modélisation de la parole, soit pour l'exemple donné sur le modèle de prédiction linéaire.
  • Selon l'invention un dispositif de transcodage entre réseaux de transmission d'information dans lesquels les trames successives de données transmises à débits différents ont la même durée et transmettent un jeu de paramètres caractéristiques d'un segment d'information à transmettre, la caractérisation et le format des différents paramètres étant variables selon le débit autorisé dans les réseaux, est caractérisé en ce qu'il comporte un circuit d'interface d'entrée associé à des ressources mémoires contenant les tables de transcodage préétablies nécessaires au transcodage des différents paramètres d'une caractérisation et d'un format donné associés à un premier réseau selon une caractérisation et/ou un format éventuellement différents associés à un second réseau, et un circuit d'interface de sortie programmable selon le débit du réseau récepteur, le processeur étant programmé pour réaliser les opérations de transcodage nécessaires à toutes les conversions de trames possibles.
  • L'invention a également pour objet l'utilisation de tels dispositifs de transcodage dans un système de transmission multidébits.
  • L'invention sera mieux comprise et d'autres caractéristi­ques apparaîtront à l'aide de la description qui suit en réfé­rence aux figures annexées.
    • La figure 1 est un schéma général représentant un exemple de système de communications utilisant plusieurs réseaux mettant en oeuvre chacun des vocodeurs de types différents ;
    • La figure 2 est le schéma représentant les dispositifs de conversion nécessaires pour l'interconnexion de 3 réseaux à débits différents ;
    • La figure 3 est un diagramme représentant les trames issues de vocodeurs à 4 débits différents ;
    • La figure 4 est un schéma fonctionnel représentant le traitement réalisé par le dispositif de transcodage selon l'in­vention.
    • La figure 5 est le schéma du dispositif de transcodage.
  • Le modèle retenu pour le codage par prédiction linéaire "LPC 10" est le suivant : le processus de phonation par lequel les cordes vocales (source) excitent le conduit vocal (filtre variable) est modélisé par une source de signal voisé (construit à partir d'impulsions périodiques) ou non voisé (construit à partir de bruit blanc) qui excite un filtre numérique à 10 coefficients. Pour transmettre des informations susceptibles de permettre la reconstitution d'un signal image d'un signal de parole émis, il est donc possible de transmettre une série de paramètres caractéristiques de la parole à coder, transmis en série après multiplexage par trames de durée égale à la durée des segments de parole analysés. Ces paramètres sont les suivants :
        - les coefficients du filtre numérique ;
        - l'énergie contenue dans la parole émise ;
        - un indicateur précisant si la tranche de parole analy­sée est voisée ou non voisée.
        - la période du fondamental, ou "pitch", inverse de la fréquence de mélodie pour les sons voisés.
  • Ce n'est donc plus la parole qui est transmise, mais seulement les paramètres significatifs, sous forme de trames pour des segments de parole de durée déterminée, par exemple 22,5 millisecondes.
  • Tous les vocodeurs dits "LPC" utilisent ce type de mo­dèle, et transmettent sous forme numérique soit directement les valeurs issues de l'analyse, soit des valeurs approchées prises dans des jeux prédéterminés de valeurs possibles, suivant les débits autorisés.
  • Ainsi, un vocodeur à 2400 bits par seconde transmet pour chaque segment de parole de 22,5 millisecondes :
        - les coefficients d'un filtre représentant le conduit vocal ;
        - un indicateur de voisement ;
        - la période du fondamental pour les sons voisés ou "pitch", inverse de la fréquence de mélodie ;
        - une mesure de l'énergie dans le segment de parole con­sidéré.
  • De la même manière un vocodeur à 800 bits par seconde transmet des paramètres du même type que les précédents mais avec un codage complémentaire :
        - le filtre représentant le conduit vocal n'est plus transmis sous forme explicite, c'est-à-dire avec ses coeffi­cients propres, mais à chaque segment de parole on recherche au sein d'un dictionnaire préétabli de 1024 filtres le filtre le plus proche du filtre qu'utiliserait un vocodeur 2400 bits par seconde. Pour la trame considérée l'indice de ce filtre considé­ré comme le plus proche voisin est alors transmis ;
        - la période du fondamental pour les sons voisés ;
        - la mesure de l'énergie dans le segment de parole.
  • Ces deux dernières valeurs, période du fondamental et énergie subissent un codage différentiel sur trois trames de façon à réduire le nombre de bits à transmettre.
        - un indicateur de voisement.
  • Pour les vocodeurs de débit supérieur, typiquement 4800 à 9600 bits par seconde, voire 16000 b/s, l'une des techniques la plus performante lors de la synthèse de parole consiste à utiliser pour le codage un codage dit "multi-impulsionnel" qui utilise la même modélisation"LPC 10" du filtre pour représenter le conduit vocal, mais dans lequel l'analyse est complétée par le calcul de l'erreur entre le signal de parole à coder et le signal qu'on obtiendrait avec l'analyse résultant du codage à prédiction linéaire. Cette erreur est alors minimisée par un algorithme qui détermine la position et l'amplitude d'impulsions qui seront transmises au filtre pour réaliser la synthèse du signal de parole. Plus le débit autorisé est grand, plus le nombre d'impulsions correctrices par trame peut être élevé. Le modèle transmis alors est constitué des éléments suivants :
        - les coefficients du filtre représentant le conduit vocal ;
        - l'énergie dans le segment de parole correspondant ;
        - la période du fondamental qui est utilisée pour la prédiction à long terme, c'est-à-dire pour la répétition des impulsions correctrices trouvées précédemment par la modélisation de l'erreur ;
        - l'amplitude et la position des nouvelles impulsions trouvées pour la trame courante.
  • Dans ce type de vocodeur, l'indicateur de voisement n'est pas transmis sous forme explicite. Cependant l'analyse utilise cet indicateur pour la répétition a priori des impulsions.
  • Cette analyse montre que les données transmises dans les trames successives différent d'un vocodeur de type "LPC" à un autre vocodeur de même type mais de débit différent.
  • Or il est nécessaire que des réseaux de transmission utilisant des liaisons de débits différents, et les vocodeurs associés puissent communiquer entre eux.
  • Le figure 1 représente un système de transmission dans lequel on a schématisé trois réseaux à débits différents : un premier réseau R1, permet de faire communiquer un premier ensemble d'émetteurs-récepteurs mobiles, par exemple des ba­teaux, M1, M2... par liaison radio HF, ce réseau utilisant des vocodeurs à un débit adapté à ces liaisons, soit D1. Un second réseau R2 permet de faire communiquer un second ensemble d'émetteurs-récepteurs, par exemple des stations fixes, S1, S2... reliées par des liaisons filaires, ce réseau utilisant des vocodeurs à un débit adapté à ces liaisons, soit D2. Enfin un troisième réseau R3 permet de faire communiquer un troisième ensemble d'émetteurs-récepteurs, mobiles, par exemple des avions A1, A2, A3... par liaisons radio UHF, ce réseau utili­sant des vocodeurs à un troisième débit, D3.
  • Pour que les liaisons soient possibles entre deux émetteurs-récepteurs quelconques de ces réseaux, l'invention prévoit des dispositifs de transcodage, purement numériques programmables, multidébits, susceptibles d'effectuer le transcodage de la trame numérique issue de l'analyse par un vocodeur à un débit donné en une trame numérique utilisable en synthèse par un vocodeur à l'un quelconque des autres débits possibles. Les postes des réseaux étant émetteurs-récepteurs, chaque dispositif de transcodage est double pour effectuer les transcodages dans les deux sens.
  • La figure 2 représente schématiquement les dispositifs de transcodage nécessaires pour un multi-réseau à trois débits, du type représenté sur la figure 1.
  • Un premier dispositif de transcodage permet de faire communiquer les réseaux R1 et R2 en effectuant un transcodage d'une trame au débit D1 à une trame au débit D2 pour l'émission par un mobile Mi de R1 et la réception mobile Aj de R2, partie 12, et un transcodage d'une trame au débit D2 à une trame au débit D1 pour l'émission par un mobile Aj et la réception par un mobile Mi, partie 21.
  • De même, un second dispositif de transcodage bilatéral 23, 32 est nécessaire pour faire communiquer les réseaux R2 et R3 et un troisième dispositif de transcodage 13, 31 est néces­saire pour faire communiquer les réseaux R1 et R3.
  • La figure 3 représente schématiquement les trames en fonction du temps pour un segment de parole aux quatre débits indiqués ci-dessus : 8000 bits/s, 2400 bits/s, 4800 bits/s et 9600 bits par seconde. Bien entendu la trame a toujours la même durée, 22.5 ms, et permet de transmettre respectivement 18 bits, 54 bits, 108 bits ou 216 bits.
  • On a montré à titre d'exemple comment ces trames étaient utilisées pour transmettre les paramètres caractéristiques men­tionnés ci-dessus :
  • A 800 bits/s, le filtre n'est pas transmis sous forme explicite, mais par l'indice d'un filtre IF préétabli choisi comme le plus proche du filtre calculé, dans un dictionnaire de 1024 filtres. De plus, pour réduire le débit de données à transmettre, des super-trames composées de 3 trames de 22.5 ms sont formées en effectuant un codage différentiel inter-trames des mesures de l'énergie EM1, EM2, EM3 de ces trois trames et des périodes de "Pitch", P₁ P₂, P₃. Chaque super-trame comporte donc 1 e.b de synchronisation, les indices des filtres transmis sur 10 bits, soit 30 bits pour la super-trame. L'énergie et la période de "Pitch" mesurées EM et P, sont codées par le codage différentiel sur 3 trames qui conduit à 11 e.b pour les valeurs d'énergie codées (EM1, EM2, EM3)c.i, à 9 e.b pour les périodes (P₁, P₂, P₃)c.i et à 3 e.b indicateurs de voisement i₁, i₂, i₃.
  • A 2400 bits/s, pour une trame voisée, après 1 e.b de synchronisation SY, le filtre est transmis explicitement dans un champ F de 41 e.b, un champ de 5 e.b. est prévu pour transmettre une mesure de l'énergie EM dans la trame, un champ P de 7 e.b permet de transmettre la période de Pitch et 1 e.b indique si le segment de parole considéré est voisé ou non voisé. La répartition des bits pour les trames non voisées est légèrement différente.
  • A 4800 bits/s et à 9600 bits/s, après 1 e.b de synchronisation SY le filtre est transmis explicitement comme dans le 2400 bits/s F(41 bits), l'énergie dans la trame est transmise dans un champ E (et non plus seulement une mesure de cette énergie) et la période de Pitch dans un champ P. De plus un champ impulsions I permet de coder la position de l'amplitude d'impulsions correctrices.
  • La figure 4 représente le schéma fonctionnel des opérations de transcodage du dispositif programmable multidébits selon l'invention.
  • On a représenté les différents débits possibles lors de l'analyse, côté émetteur, et les différents débits possibles lors de la synthèse, côté récepteur. Les différentes étapes de transcodage nécessaires ont été indiquées dans ce schéma fonctionnel.
  • Bien entendu, lorsque le débit de l'émetteur et celui du récepteur sont identiques, il n'y a aucun transcodage à faire et le dispositif de transcodage est transparent.
  • Pour passer d'un débit 800 bits/s à un débit 2400 bits/s, le transcodage 1 consiste, en faisant appel au dictionnaire des filtres, 2, à transformer l'indice du filtre IF en coefficients explicites du filtre désigné par cet indice, F, et à décoder les champs (EM, P)c.i codés inter-trames, pour transmettre, pour chaque trame, une mesure de l'énergie EM et une valeur de période Pitch P. Les paramètres sont alors au format 2400 bits. Le récepteur n'a plus qu'à les transmettre en série à ce débit.
  • Pour passer du débit 800 bits par seconde à un débit supérieur à 2400 bits par seconde, le champ I est utilisé pour insérer dans la trame un code prédéterminé Io(référence 3 sur la figure 4), qui signale que la liaison a transité via un vocodeur à débit inférieur ou égal à 2400 bits/s et que donc, l'information relative aux impulsions n'a jamais existé ou a été perdue si la liaison, partant initialement d'un vocodeur à débit plus élevé a transité par un réseau à plus bas débit. Ce code préétabli a un format adapté au débit à transmettre. Le jeu de paramètres est alors au format nécessaire, soit (F, E, P, i, I)₄₈₀₀, (F, E, P, i,I)₉₆₀₀ ou (F, E, P, i, I)₁₆₀₀₀ avec dans les trois cas I = Io au format nécessaire.
  • Inversement, pour passer d'une liaison à 2400 bits/s à une liaison à 800 bits/s, il est nécessaire, en faisant appel au dictionnaire des filtres 2, de rechercher quel est l'indice IF du filtre du dictionnaire le plus proche de celui dont les coef­ficients sont présents dans le champ F, et de coder la mesure de l'énergie EM et la période Pitch P différentiellement sur trois trames pour obtenir les paramètres caractéristiques d'un vocodeur 800 bits/s, soit (IF,(EM,P)ci,i)₈₀₀. C'est la phase représentée en 4 sur la figure 4.
  • Pour passer d'un débit supérieur à 2400 bits/s à 2400 bits/s, il faut au contraire supprimer le champ I qui n'est plus utile, et ramener les valeurs de E et P par transcodage aux formats nécessaires. Puis, du format correspondant à 2400 bits, il est possible de se ramener au format 800 bits/s via l'opération de transcodage 4.
  • Pour passer d'un débit supérieur à 2400 bits à un autre débit supérieur à 2400 bits par seconde la seule opération à effectuer est un transcodage du champ impulsion I pour que les impulsions, positions et amplitudes, soient codées de la même manière. Les opérations de transcodage correspondantes, 6 et 7 sur la figure 4, permettent de passer respectivement des trames 9600 et 16000 bits/s à une trame 4800 bits/s. De même les opérations de transcodage 8 et 9 permettent de passer respectivement des trames 4800 et 16000 bits/s à une trame 9600 bits/s, et les opérations de transcodage 10, 11 permettent de passer respectivement des trames 48OO et 9600 bits/s à une trame 16000 bits/s.
  • Pour réaliser ces différentes opérations de transcodage, le dispositif de transcodage représenté sur la figure 5 comporte un circuit interface d'entrée série 100, programmable au débit côté réception, un processeur de traitement 110 avec les mémoires nécessaires pour les différentes tables de transcodage, 120 utiles aux opérations décrites ci-dessus en référence à la figure 4, ainsi que la mémoire 130 nécessaire au dictionnaire des filtres, et un circuit d'interface de sortie série 140 couplé au processeur et programmable au débit côté émission. La programmation du processeur pour réaliser les opérations décrites en référence à la figure 4 pour les différents débits possibles est à la portée de l'homme de l'art. Pour les liaisons en duplex, les ressources sont doublées. Sinon les circuits sont gérés en alternat, selon les procédures classiques dans cette technique.
  • L'invention n'est pas limitée au mode de réalisation décrit et représenté. En particulier, il est possible d'utiliser l'invention non plus pour la transmission de parole, mais pour la transmission de tout type d'information numérisée dans des réseaux multidébits, pourvu que l'information soit transmise au moyen de trames organisées en champs caractéristiques de jeux de paramètres, et que tous les paramètres essentiels puis­sent être transcodés d'une trame à un premier débit dans une trame à un autre débit.
  • Ainsi ce système est applicable à la transmission d'ima­ges numérisées transmises à des débits différents pourvu que les mêmes paramètres essentiels soient exprimés dans des codes compatibles.
  • L'avantage d'un tel dispositif est qu'il permet de trai­ter directement les données numériques sans faire une synthèse et un nouveau codage ; ainsi la dégradation de qualité de la transmission n'est pas supérieure à celle qu'impose le codeur de plus bas débit inséré dans la chaîne.

Claims (4)

1. Dispositif de transcodage entre réseaux de transmission d'information dans lesquels les trames successives de données transmises à débits différents ont la même durée et transmettent un jeu de paramètres caractéristiques d'un segment d'information à transmettre, la caractérisation et le format des différents paramètres étant variables selon le débit autorisé dans les réseaux, caractérisé en ce qu'il comporte un circuit d'interface d'entrée (100) associé à des ressources mémoires (120, 130) contenant les tables de transcodage préétablies nécessaires au transcodage des différents paramètres d'une caractérisation et d'un format donné associés à un premier réseau selon une caractérisation et/ou un format éventuellement différents associés à un second réseau, et un circuit d'interface de sortie (140) programmable selon le débit du réseau récepteur, le processeur étant programmé pour réaliser les opérations de transcodage nécessaires à toutes les conversions de trames possibles.
2. Dispositif de transcodage selon la revendication 1, caractérisé en ce que, les réseaux étant des réseaux d'émetteurs-récepteurs utilisant des codeurs de parole à débits différents, toutes les trames comportent des jeux de paramètres associés à un même modèle du signal analogique de parole et correspondent à des segments de parole de durée fixée, indépendante du débit, le dispositif de transcodage assurant la conversion des trames aux différents débits des codeurs de parole.
3. Dispositif de transcodage selon la revendication 2, caractérisé en ce que les codeurs de parole étant des codeurs à prédiction linéaire, un jeu de paramètres comporte toujours une information caractéristique d'un filtre représentant le conduit vocal (IF ou F), une information caractéristique de l'énergie dans le segment de parole codé, (EM ou E) la période du fondamental (P), et un indicateur de voisement (i), et peut également comprendre pour les plus forts débits une information caractéristique d'impulsions correctrices, non essentielles lors de la synthèse, les informations essentielles étant toujours transcodées lorsque nécessaire, les autres étant supprimées lors d'un transfert vers un réseau qui n'utilise pas ce type d'informations.
4. Utilisation d'au moins un dispositif de transcodage selon l'une quelconque des revendications 1 à 3 dans un système de transmission multidébit.
EP88401018A 1987-05-04 1988-04-26 Dispositif de transcodage entre réseaux de transmission à débits différents, et son utilisation dans un système de transmission multidébits Withdrawn EP0291377A1 (fr)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
FR8706250A FR2615025B1 (fr) 1987-05-04 1987-05-04 Dispositif de transcodage entre reseaux de transmission a debits differents et son utilisation dans un systeme de transmission multidebits
FR8706250 1987-05-04

Publications (1)

Publication Number Publication Date
EP0291377A1 true EP0291377A1 (fr) 1988-11-17

Family

ID=9350737

Family Applications (1)

Application Number Title Priority Date Filing Date
EP88401018A Withdrawn EP0291377A1 (fr) 1987-05-04 1988-04-26 Dispositif de transcodage entre réseaux de transmission à débits différents, et son utilisation dans un système de transmission multidébits

Country Status (2)

Country Link
EP (1) EP0291377A1 (fr)
FR (1) FR2615025B1 (fr)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO1995022819A1 (fr) * 1994-02-16 1995-08-24 Qualcomm Incorporated Vocodeur asic
AU725711B2 (en) * 1994-02-16 2000-10-19 Qualcomm Incorporated Block normalisation processor

Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP0138073A1 (fr) * 1983-09-29 1985-04-24 Siemens Aktiengesellschaft Convertisseur pour le transfert de données entre vocodeurs à canaux et à prédiction linéaire pour la transmission de signaux digitaux de parole au moyen de systèmes de transmission à bande réduite

Patent Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP0138073A1 (fr) * 1983-09-29 1985-04-24 Siemens Aktiengesellschaft Convertisseur pour le transfert de données entre vocodeurs à canaux et à prédiction linéaire pour la transmission de signaux digitaux de parole au moyen de systèmes de transmission à bande réduite

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
ICASSP 80, IEEE INTERNATIONAL CONFERENCE ON ACOUSTICS, SPEECH AND SIGNAL PROCESSING, Denver, 9-11 avril 1980, vol. 3, pages 719-724, IEEE, New York, US; J.D. TOMCIK et al.: "CVSD to LPC conversion using noise tolerant analysis" *
ICASSP 80, IEEE INTERNATIONAL CONFERENCE ON ACOUSTICS, SPEECH AND SIGNAL PROCESSING, Tampa, 26-29 mars 1985, vol. 1, pages 248-251, IEEE, New York, US; J. ROTHWEILER et al.: "A multiple rate low rate voice CODEC" *

Cited By (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO1995022819A1 (fr) * 1994-02-16 1995-08-24 Qualcomm Incorporated Vocodeur asic
EP0758123A3 (fr) * 1994-02-16 1997-03-12 Qualcomm Incorporated Circuit bouchon pour la normalisation
US5727123A (en) * 1994-02-16 1998-03-10 Qualcomm Incorporated Block normalization processor
US5784532A (en) * 1994-02-16 1998-07-21 Qualcomm Incorporated Application specific integrated circuit (ASIC) for performing rapid speech compression in a mobile telephone system
AU697822B2 (en) * 1994-02-16 1998-10-15 Qualcomm Incorporated Vocoder asic
US5926786A (en) * 1994-02-16 1999-07-20 Qualcomm Incorporated Application specific integrated circuit (ASIC) for performing rapid speech compression in a mobile telephone system
AU725711B2 (en) * 1994-02-16 2000-10-19 Qualcomm Incorporated Block normalisation processor
SG87819A1 (en) * 1994-02-16 2002-04-16 John G Mcdonough Vocoder asic

Also Published As

Publication number Publication date
FR2615025B1 (fr) 1989-12-22
FR2615025A1 (fr) 1988-11-10

Similar Documents

Publication Publication Date Title
EP1372289B1 (fr) Création d'une trame de description de silence pour engendrer un bruit de confort
JP4927257B2 (ja) 可変レートスピーチ符号化
EP1316087B1 (fr) Dissimulation d'erreurs de transmission dans un signal audio
ES2257098T3 (es) Codificacion periodica de vocales.
ES2266003T3 (es) Suavizador de la ganancia en un descodificador de señal de habla y audio de banda ancha.
FR2520539A1 (fr) Procede et systeme de traitement des silences dans un signal de parole
US7260523B2 (en) Sub-band speech coding system
JPH10307599A (ja) スプラインを使用する波形補間音声コーディング
FR2929466A1 (fr) Dissimulation d'erreur de transmission dans un signal numerique dans une structure de decodage hierarchique
EP0428445B1 (fr) Procédé et dispositif de codage de filtres prédicteurs de vocodeurs très bas débit
KR20010087391A (ko) 시간 동기식 파형 보간법을 이용한 피치 프로토타입파형으로부터의 음성 합성
EP0865029A1 (fr) Interpolation de formes d'onde par décomposition en bruit et en signaux périodiques
FR2702075A1 (fr) Procédé de génération d'un filtre de pondération spectrale du bruit dans un codeur de la parole.
CA2293165A1 (fr) Methode de transmission de donnees dans des canaux de transmission de la voix sans fil
FR2781110A1 (fr) Procede et dispositif de transmission de donnees sur un canal de paroles
EP0291377A1 (fr) Dispositif de transcodage entre réseaux de transmission à débits différents, et son utilisation dans un système de transmission multidébits
WO2023165946A1 (fr) Codage et décodage optimisé d'un signal audio utilisant un auto-encodeur à base de réseau de neurones
FR2589653A1 (fr) Dispositif de mise en oeuvre d'un code a faible disparite accumulee en transmission numerique a haut debit et procede de codage utilisant un tel dispositif
EP2691953B1 (fr) Traitement dans le domaine code d'un signal audio code par codage micda
FR2859566A1 (fr) Procede de transmission d'un flux d'information par insertion a l'interieur d'un flux de donnees de parole, et codec parametrique pour sa mise en oeuvre
EP0275751B1 (fr) Procédé et dispositif de transmission numériques de signaux vocaux par voie radio
JP3122540B2 (ja) ピッチ検出装置
RU2394284C1 (ru) Способ сжатия и восстановления речевых сигналов для систем кодирования с переменной скоростью передачи
EP0454552A2 (fr) ProcédÀ© et dispositif de codage bas débit de la parole
Kirillov et al. Algorithm to Control Primary Codec Under the Influence of Interference in Communication Channel

Legal Events

Date Code Title Description
PUAI Public reference made under article 153(3) epc to a published international application that has entered the european phase

Free format text: ORIGINAL CODE: 0009012

AK Designated contracting states

Kind code of ref document: A1

Designated state(s): DE GB IT NL

17P Request for examination filed

Effective date: 19890320

RAP3 Party data changed (applicant data changed or rights of an application transferred)

Owner name: THOMSON-CSF

17Q First examination report despatched

Effective date: 19900927

RAP1 Party data changed (applicant data changed or rights of an application transferred)

Owner name: THOMSON-CSF

STAA Information on the status of an ep patent application or granted ep patent

Free format text: STATUS: THE APPLICATION IS DEEMED TO BE WITHDRAWN

18D Application deemed to be withdrawn

Effective date: 19940803