FR2773653A1 - Dispositifs de codage/decodage de donnees, et supports d'enregistrement memorisant un programme de codage/decodage de donnees au moyen d'un filtre de ponderation frequentielle - Google Patents

Dispositifs de codage/decodage de donnees, et supports d'enregistrement memorisant un programme de codage/decodage de donnees au moyen d'un filtre de ponderation frequentielle Download PDF

Info

Publication number
FR2773653A1
FR2773653A1 FR9900029A FR9900029A FR2773653A1 FR 2773653 A1 FR2773653 A1 FR 2773653A1 FR 9900029 A FR9900029 A FR 9900029A FR 9900029 A FR9900029 A FR 9900029A FR 2773653 A1 FR2773653 A1 FR 2773653A1
Authority
FR
France
Prior art keywords
data
frequency
section
coding
frequency bands
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
FR9900029A
Other languages
English (en)
Other versions
FR2773653B1 (fr
Inventor
Nobuyoshi Kaiki
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Sharp Corp
Original Assignee
Sharp Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Sharp Corp filed Critical Sharp Corp
Publication of FR2773653A1 publication Critical patent/FR2773653A1/fr
Application granted granted Critical
Publication of FR2773653B1 publication Critical patent/FR2773653B1/fr
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10KSOUND-PRODUCING DEVICES; METHODS OR DEVICES FOR PROTECTING AGAINST, OR FOR DAMPING, NOISE OR OTHER ACOUSTIC WAVES IN GENERAL; ACOUSTICS NOT OTHERWISE PROVIDED FOR
    • G10K15/00Acoustics not otherwise provided for
    • G10K15/02Synthesis of acoustic waves
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10HELECTROPHONIC MUSICAL INSTRUMENTS; INSTRUMENTS IN WHICH THE TONES ARE GENERATED BY ELECTROMECHANICAL MEANS OR ELECTRONIC GENERATORS, OR IN WHICH THE TONES ARE SYNTHESISED FROM A DATA STORE
    • G10H1/00Details of electrophonic musical instruments
    • G10H1/0033Recording/reproducing or transmission of music for electrophonic musical instruments
    • G10H1/0041Recording/reproducing or transmission of music for electrophonic musical instruments in coded form
    • G10H1/0058Transmission between separate instruments or between individual components of a musical system
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10HELECTROPHONIC MUSICAL INSTRUMENTS; INSTRUMENTS IN WHICH THE TONES ARE GENERATED BY ELECTROMECHANICAL MEANS OR ELECTRONIC GENERATORS, OR IN WHICH THE TONES ARE SYNTHESISED FROM A DATA STORE
    • G10H3/00Instruments in which the tones are generated by electromechanical means
    • G10H3/12Instruments in which the tones are generated by electromechanical means using mechanical resonant generators, e.g. strings or percussive instruments, the tones of which are picked up by electromechanical transducers, the electrical signals being further manipulated or amplified and subsequently converted to sound by a loudspeaker or equivalent instrument
    • G10H3/125Extracting or recognising the pitch or fundamental frequency of the picked up signal
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10HELECTROPHONIC MUSICAL INSTRUMENTS; INSTRUMENTS IN WHICH THE TONES ARE GENERATED BY ELECTROMECHANICAL MEANS OR ELECTRONIC GENERATORS, OR IN WHICH THE TONES ARE SYNTHESISED FROM A DATA STORE
    • G10H2240/00Data organisation or data communication aspects, specifically adapted for electrophonic musical tools or instruments
    • G10H2240/011Files or data streams containing coded musical information, e.g. for transmission
    • G10H2240/046File format, i.e. specific or non-standard musical file format used in or adapted for electrophonic musical instruments, e.g. in wavetables
    • G10H2240/066MPEG audio-visual compression file formats, e.g. MPEG-4 for coding of audio-visual objects
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10HELECTROPHONIC MUSICAL INSTRUMENTS; INSTRUMENTS IN WHICH THE TONES ARE GENERATED BY ELECTROMECHANICAL MEANS OR ELECTRONIC GENERATORS, OR IN WHICH THE TONES ARE SYNTHESISED FROM A DATA STORE
    • G10H2250/00Aspects of algorithms or signal processing methods without intrinsic musical character, yet specifically adapted for or used in electrophonic musical processing
    • G10H2250/131Mathematical functions for musical analysis, processing, synthesis or composition
    • G10H2250/215Transforms, i.e. mathematical transforms into domains appropriate for musical signal processing, coding or compression
    • G10H2250/235Fourier transform; Discrete Fourier Transform [DFT]; Fast Fourier Transform [FFT]
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10HELECTROPHONIC MUSICAL INSTRUMENTS; INSTRUMENTS IN WHICH THE TONES ARE GENERATED BY ELECTROMECHANICAL MEANS OR ELECTRONIC GENERATORS, OR IN WHICH THE TONES ARE SYNTHESISED FROM A DATA STORE
    • G10H2250/00Aspects of algorithms or signal processing methods without intrinsic musical character, yet specifically adapted for or used in electrophonic musical processing
    • G10H2250/541Details of musical waveform synthesis, i.e. audio waveshape processing from individual wavetable samples, independently of their origin or of the sound they represent
    • G10H2250/571Waveform compression, adapted for music synthesisers, sound banks or wavetables
    • G10H2250/575Adaptive MDCT-based compression, e.g. using a hybrid subband-MDCT, as in ATRAC

Landscapes

  • Physics & Mathematics (AREA)
  • Engineering & Computer Science (AREA)
  • Acoustics & Sound (AREA)
  • Multimedia (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • General Health & Medical Sciences (AREA)
  • Compression, Expansion, Code Conversion, And Decoders (AREA)

Abstract

L'invention concerne un dispositif de codage de données (201), comprenant un banc de filtres d'analyse (212) pour diviser des données d'entrée en bandes de fréquences; une section de conversion temps-fréquence (214) pour convertir les données divisées en paramètres d'un domaine fréquentiel pour chaque bande de fréquences; et une section de pondération (215) pour pondérer les paramètres à l'aide de coefficients de pondération possédant l'une au moins de caractéristiques d'atténuation d'une distorsion dans le domaine fréquentiel du banc de filtres (212); et d'atténuation d'une distorsion dans le domaine fréquentiel d'un banc de filtres de synthèse d'un dispositif de décodage de données associé au dispositif (201).L'invention concerne également le dispositif de décodage de données, un dispositif de codage/ décodage de données et un support d'enregistrement de programme de codage/ décodage de données.

Description

Dissositifs de codage/décodage de données. et supports d'enregistrement mémorisant un programme de codaqe/décodage de données au moven d'un filtre de pondération fréguentielle
La présente invention concerne un dispositif et un procédé de codage de données d'entrée, telles qu'un son musical, par analyse et compression des données, et/ou de décodage des données codées afin de reproduire les données d'entrée. La présente invention concerne également des supports d'enregistrement contenant un programme de codage et/ou décodage de données.
D'une manière générale, un procédé de codage/décodage utilisé dans des dispositifs de codage/décodage de son musical est nécessaire pour obtenir une haute reproductibilité du son musical, une faible quantité de traitement, et une grande compressibilité.
Ainsi, jusqu'à maintenant, pour comprimer le son musical, des données de forme d'onde du son musical sont converties d'un domaine temporel dans un domaine fréquentiel. Les composantes d'une bande de fréquences non utilisées dans le domaine fréquentiel sont supprimées de la transmission. En outre, une largeur binaire de transmission pour chaque bande de fréquences est limitée en fonction de modèles psychoacoustiques humains (principalement des modèles de masquage simultané et des modèles d'intensité sonore). De cette manière, un taux de compression élevé peut être atteint. Le codage de sousbande (ci-après appelé SBC) est une méthode connue de conversion du domaine temporel dans le domaine fréquentiel. Conformément à la méthode de codage de sousbande, un filtre passe-bande est utilisé pour ne laisser passer que des bandes de fréquences souhaitées afin de diviser ainsi le signal en bandes de fréquences. Dans ce cas, un échantillonnage décroissant est exécuté pour réduire la quantité de calculs et de données. Ceci se traduit de manière désavantageuse par un repliement du spectre dû à l'influence du lobe secondaire du filtre.
Pour réduire au minimum l'influence du repliement du spectre, il est nécessaire d'utiliser une structure de filtre comportant un ordre plus élevé, ce qui a pour conséquence désavantageuse d augmenter la quantité de calculs. Pour résoudre ce problème, une technique utilisant des bancs de filtres miroirs en quadrature (QMF) a été largement adoptée pour éliminer l'influence du repliement du spectre lors de la synthèse du son musical.
D'autre part, une méthode couramment utilisée pour convertir le domaine temporel en domaine fréquentiel comporte un procédé faisant appel à une technique de codage par transformée (ci-après appelée TFC), telle qu'un codage par transformée cosinusoïdale discrète modifiée (MDCT). Selon une méthode dans laquelle la technique TFC est combinée avec la technique SBC, la stabilité d'un signal dans chaque bande de fréquences est examinée. Puis, si le signal est stable, une fenêtre d'analyse est allongée pour augmenter un pouvoir séparateur en fréquence. Si le signal n'est pas stable, la fenêtre d'analyse est raccourcie pour augmenter un pouvoir séparateur en temps. De cette manière, un son musical est codé avec un taux de compression élevé et une grande reproductibilité.
La méthode de codage acoustique adaptative par transformée (ATRAC) adoptée pour des mini-disques (MD), et la Couche 3 du groupe d'experts en images animées (MPEG) 1 et 2 sont des méthodes de compression de son musical caractéristiques bien connues qui font appel à la technique TFC et à la technique SBC en combinaison.
Dans la Couche 3 (voir JIS-X4323 et IS0/IEC 11172-3) du MPEG, le banc de QMF est utilisé pour le SBC, puis l'analyse MDCT est utilisée pour le TFC afin de coder et de décoder des données de forme d'onde du son musical.
Dans la Couche 3 du MPEG, un dispositif de réduction d'une distorsion de mutation est utilisé pour éviter une mauvaise influence du banc de QMF.
La figure 8 est un schéma fonctionnel montrant un dispositif conventionnel de codage de son musical 101 servant à comprimer et à coder des données de forme d'onde d'un son musical, et un dispositif de décodage de son musical 102 servant à décoder-les données codées par le dispositif de codage de son musical 101.
En référence à cette figure, le dispositif de codage de son musical 101 comporte une section d'entrée de son musical 110, une section d'analyse de bandes de fréquences (filtres passe-bande) 112, une section de conversion temps-fréquence 114, un section de quantification 116, une section de calcul de modèles psychoacoustiques 118, une section d'intégration 117, et une section de sortie de données codées 119. Le dispositif de décodage de son musical 102 comporte une section d'entrée de données codées 129, une section de désintégration 127, une section de quantification inverse 126, une section de conversion fréquence-temps 124, une section de synthèse de bandes de fréquences (filtres passe-bande) 122, et une section de sortie de son musical 120.
Le fonctionnement du dispositif de codage de son musical 101 et du dispositif de décodage de son musical 102 va être expliqué ci-après.
Au départ, dans le dispositif de codage de son musical, lorsqu'elle reçoit son musical, la section d'entrée de son musical 110 découpe les données de forme d'onde du son musical en zones d'analyse et fournit les données de forme d'onde du son musical ainsi découpées à la section d'analyse de bandes de fréquences 112 et à la section de calcul de modèles psychoacoustiques 118.
Puis, dans la section d'analyse de bandes de fréquences 112, les données de forme d'onde du son musical sont soumises à un filtrage à l'aide de filtres passebande (comprenant des filtres passe-haut et passe-bas) qui ne laissent passer que des bandes de fréquences souhaitées. Par conséquent, les données de forme d'onde du son musical sont divisées en de multiples données de forme d'onde temporelle ne comprenant chacune qu'une bande de fréquences spécifique. Ensuite, les données de forme d'onde temporelle sont soumises à un échantillonnage décroissant en vue d'une conversion par échantillonnage.
La section d'analyse de bande de fréquences 112 délivre les données de forme d'onde temporelle divisées et soumises à la conversion par échantillonnage à la section de conversion temps-fréquence 114.
Puis, la section de conversion temps-fréquence 114 convertit les multiples données de forme d'onde temporelle comprenant chacune la bande de fréquences spécifique en paramètres d'un domaine fréquentiel pour chaque bande de fréquences à l'aide d'une technique telle que la technique
MDCT. Les paramètres ainsi obtenus sont ensuite fournis à la section de quantification 116.
A l'aide de la technique FFT ou d'une technique similaire, la section de calcul de modèles psychoacoustiques 118 analyse les fréquences des données de forme d'onde de son musical reçues de la section d'entrée de son musical 110. Puis, cette section 118 détermine la précision de bits de quantification à utiliser pour une quantification dans chaque bande de fréquences, en fonction de modèles psychoacoustiques, tels que des modèles de masquage simultané et d'intensité sonore, et fournit à la section de quantification 116 un signal indiquant la précision des bits de quantification déterminée.
Ensuite, en fonction de la précision des bits de quantification pour chaque bande de fréquences, déterminée par la section de calcul de modèles psychoacoustiques 118, la section de quantification 116 réduit la précision de chaque paramètre qui indique une caractéristique dans le domaine fréquentiel de chaque fréquence et qui a été généré à partir des données de forme d'onde temporelle par la section de conversion temps-fréquence 114. La section 116 fournit à la section d'intégration 117 des données codées quantifiées, telles que le facteur d'échelle de chaque fréquence, la précision de quantification et les données quantifiées, par exemple.
La section d'intégration 117 convertit les données codées quantifiées générées par la section de quantification 116, telles que le facteur d'échelle de chaque fréquence, la précision de quantification et les données quantifiées, en une suite de bits afin de réaliser un taux de compression élevé en vue de la transmission (ou du stockage) des données codées. Lorsqu'elle reçoit la suite de bits de la section d'intégration 117, la section de sortie de données codées 119 la délivre sous la forme de données codées à un chemin ou à un canal de transmission, ou à un support de stockage.
Le fonctionnement du dispositif de décodage de son musical 102 va être décrit ci-après. Les données codées sous la forme de la suite de bits présente sur le canal de transmission ou dans le moyen de stockage sont fournies à la section d'entrée de données codées 129. Puis, la section d'entrée de données codées 129 fournit les données codées à la section de désintégration 127. La section de désintégration 127 décode la suite de bits pour la transformer en données codées quantifiées, telles que le facteur d'échelle de chaque fréquence, la précision de quantification et les données quantifiées, qui sont ensuite fournies à la section de quantification inverse 126.
Puis, la section de quantification inverse 126 réalise la quantification inverse des données codées quantifiées, décodées par la section de désintégration 127 pour convertir les données en paramètres de chaque bande de fréquences, et pour ramener la précision paramétrique à une précision de calcul de la section de conversion fréquence-temps 124. Puis, les paramètres ainsi obtenus de chaque fréquence sont fournis à la section de conversion fréquence-temps 124.
Lorsqu'elle reçoit les paramètres de chaque fréquence à partir de la section de quantification inverse 126, la section de conversion fréquence-temps 124 convertit les composantes fréquentielles en composantes temporelles à l'aide de la technique IMDCT, ou d'une technique similaire pour ainsi fournir des données-de forme d'onde temporelle qui sont ensuite délivrées en sortie à la section de synthèse de bandes de fréquences (filtres passe-bande) 122.
Ensuite, dans la section de synthèse de bandes de fréquences 122, l'échantillonnage croissant et la conversion par échantillonnage des données de forme d'onde temporelle sont exécutés pour chacune des bandes de fréquences spécifiques divisées. Puis, les signaux ainsi générés sont soumis à un filtrage à l'aide de filtres passe-bande (comprenant des filtres passe-haut et passebas) qui ne laissent passer que les bandes de fréquences souhaitées. De multiples données de forme d'onde temporelle ne comprenant chacune qu'une bande de fréquences spécifique sont ensuite synthétisées pour être décodées en données de forme d'onde de son musical.
Puis, la section de sortie de son musical 120 synthétise les données de forme d'onde de son musical décodées, reçues de la section de synthèse de bandes de fréquences (filtre passe-bande) 122, zone d'analyse par zone d'analyse, et délivre en sortie le son résultant.
Dans le dispositif de codage de son musical 101 et le dispositif de décodage de son musical 102, des signaux sont appliqués aux filtres passe-bande (comprenant des filtres passe-haut et passe-bas) pour transmettre uniquement les bandes de fréquences souhaitées en vue de la division des signaux en bandes de fréquences, comme dans le cas du codage SBC. Dans ce cas, les courbes de réponse en fréquence dans une bande passante, une bande coupée et une bande de transition varient en fonction de la conception du filtre passe-bande. De manière idéale, la courbe de réponse de la bande passante doit être aussi plane que possible, la bande de transition doit être réduite au maximum afin de réduire au minimum des composantes de repliement du spectre, et la courbe de coupure de la bande coupée doit être remarquable.
Cependant, lorsque l'on conçoit un filtre doté de caractéristiques idéales, ordre du filtre est inévitablement très élevé et les vitesses de transmission de signaux inévitablement lentes. Ainsi, on a pris l'habitude d'employer des filtres conçus pour avoir des ordres aussi peu élevés que possible compte tenu du coût et de considérations similaires, pourvu que ces filtres ne posent pas de problème lorsqu'ils sont utilisés dans la pratique.
La présente invention a précisément pour but de proposer un dispositif de codage et/ou décodage de données, telles qu'un son musical, qui permette d'améliorer la précision de la forme d'onde des données à un faible coût, à l'aide de filtres d'ordres relativement peu élevés. L'invention a également pour but de proposer un support d'enregistrement contenant un programme de codage/décodage de données pour exécuter une telle opération de codage/décodage.
Pour atteindre les buts ci-dessus et selon un premier aspect de la présente invention, il est proposé un dispositif de codage de données caractérisé en ce qu'il comprend un banc de filtres d'analyse de bandes de fréquences destiné à diviser des données d'entrée en plusieurs bandes de fréquences; une section de conversion temps-fréquence destinée à convertir les données divisées en paramètres d'un domaine fréquentiel pour chacune des bandes de fréquences; et une section de pondération de codage destinée à pondérer les paramètres du domaine fréquentiel, à l'aide de coefficients de pondération respectifs, coefficients de pondération qui possède l'une au moins de caractéristiques d'atténuation d'une distorsion dans le domaine fréquentiel du banc de filtres d'analyse de bandes de fréquences; et d'atténuation d'une distorsion dans le domaine fréquentiel d'un banc de filtres de synthèse de bandes de fréquences devant être utilisé dans un dispositif de décodage de données destiné à être associé au dispositif de codage de données.
Dans ce dispositif de codage, le banc de filtres d'analyse de bandes de fréquences divise des données, telles qu'un son musical, en plusieurs bandes de fréquences. Puis, la section de conversion temps-fréquence convertit les données pour chaque bande de fréquences en paramètres correspondant à des gammes de fréquences. La section de pondération de codage pondère chaque paramètre pour corriger la courbe de réponse en fréquence du côté codage ou du côté décodage afin que celle-ci soit plane.
A titre de variante, la section de pondération de codage pondère chaque paramètre pour corriger aussi bien la courbe de réponse en fréquence du côté codage que la courbe de réponse en fréquence du côté décodage afin que celles-ci soient aplanies. Dans ce cas, une synthèse de la courbe de réponse en fréquence du côté codage et de la courbe de réponse en fréquence du côté décodage peut être corrigée au niveau du côté codage.
Ainsi, conformément à la présente invention, il n'est pas nécessaire de se preoccuper de la planéité de la courbe de réponse en fréquence dans la bande passante des filtres utilisés pour le codage SBC (codage de sousbande), entre autres. Ceci permet une réduction de l'ordre des filtres et simplifie, par conséquent, la structure de ceux-ci. Il est donc possible de réaliser un dispositif de codage ayant des performances semblables à celles d'un dispositif conventionnel, à un coût réduit. En revanche, si une structure de filtre équivalente à la structure conventionnelle est adoptée, la présente invention permet d'obtenir un dispositif de codage ayant une qualité supérieure et un taux de compression plus élevé.
En outre, dans le cas d'un système de codage de données conçu pour traiter des données ayant une précision de 16 bits, par exemple, la bande passante du banc de filtres d'analyse de bandes de fréquences est conçue pour avoir une courbe de réponse en frequence nécessaire pour traiter les donnees ayant une precision de 16 bits.
Toutefois, pour traiter des données ayant une précision supérieure à 16 bits, par exemple une précision de 20 ou 24 bits, la précision de la bande passante du filtre conçu pour une précision de 16 bits est insuffisante dans de nombreux cas. Bien que d'une manière générale, le côté décodage soit standardisé, le côté codage ne l'est pas, ce qui signifie que le côté codage peut souvent adopter une méthode souhaitée. Ainsi, en prenant en compte côté codage l'influence de la précision des filtres du côté décodage, il est possible d'atteindre une précision de forme d'onde de données supérieure à une précision de 16 bits, sans modification des spécifications du côté décodage.
Selon un deuxième aspect de la présente invention, il est proposé un dispositif de codage de données caractérisé en ce qu'il comprend un banc de filtres d'analyse de bandes de fréquences destiné à diviser des données d'entrée en plusieurs bandes de fréquences; une section de conversion temps-fréquence destinée à convertir les données divisées en paramètres d'un domaine fréquentiel pour chacune des bandes de fréquences; et une section de pondération de codage servant à pondérer les donnees destinées à être fournies en entrée au banc de filtres d'analyse de bandes de fréquences et/ou les données, divisées par le banc de filtres d'analyse de bandes de fréquences, destinées à être fournies en entrée à la section de conversion temps-fréquence, à l'aide de coefficients de pondération respectifs, coefficients de pondération qui possède l'une au moins de caractéristiques d'atténuation d'une distorsion dans le domaine frequentiel du banc de filtres d'analyse de bandes de fréquences; et d'atténuation d'une distorsion dans le domaine fréquentiel d'un banc de filtres de synthèse de bandes de fréquences devant être utilisé dans un dispositif de décodage de données destiné à être associé au dispositif de codage de données.
Dans ce dispositif de codage de données, la section de pondération de codage pondère les données avant qu'elles ne soient divisées en bandes de fréquences et/ou après qu'elles ont été divisées en bandes de fréquences, mais avant leur conversion en paramètres du domaine fréquentiel, afin de corriger la courbe de réponse en fréquence du côté codage ou du côté décodage pour que celle-ci soit aplanie d'un côté ou de l'autre. A titre de variante, la section de pondération de codage pondère les données avant qu'elles ne soient divisées en bandes de fréquences et/ou après qu'elles ont été divisées en bandes de fréquences, mais avant leur conversion en paramètres du domaine fréquentiel, afin de corriger à la fois la courbe de réponse en fréquence du côte codage et la courbe de réponse en fréquence du côté décodage pour que cette courbe de réponse en frequence soit aplanie aussi bien du côté codage que du côté décodage.
Ce dispositif de codage de données selon le deuxième aspect de la presente invention a des effets semblables à ceux du dispositif de codage de données selon le premier aspect de l'invention.
Selon un troisième aspect de la présente invention, il est proposé un dispositif de décodage de données destiné à decoder des données qui ont été divisees en de multiples bandes de fréquences par un banc de filtres d'analyse de bandes de fréquences, puis converties en paramètres d'un domaine fréquentiel pour chaque bande de fréquences afin d'être codées. Ce dispositif de décodage de données de l'invention est caractérisé en ce qu'il comprend une section de conversion fréquence-temps destinée à convertir les paramètres du domaine fréquentiel en données d'un domaine temporel pour chaque bande de fréquences; un banc de filtres de synthèse de bandes de fréquences destiné à synthétiser les données converties des multiples bandes de fréquences; et une section de pondération de décodage servant à pondérer les paramètres destinés à être fournis en entrée à la section de conversion fréquence-temps, à l'aide de coefficients de pondération respectifs, coefficients de pondération qui possède l'une au moins de caractéristiques d'atténuation d'une distorsion dans le domaine fréquentiel du banc de filtres de synthèse de bandes de fréquences; et d'atténuation d'une distorsion dans le domaine fréquentiel du banc de filtres d'analyse de bandes de fréquences devant être utilisé dans un dispositif de codage de données destiné à être associé au dispositif de décodage de données.
Dans ce dispositif de décodage de données, avant que la section de conversion fréquence-temps ne convertisse les paramètres du domaine frequentiel en données du domaine temporel pour chaque bande de fréquences, la section de pondération de décodage pondère chaque paramètre pour corriger la courbe de réponse en fréquence du côté décodage ou du côté codage afin que cette courbe de réponse en fréquence soit aplanie du côté décodage ou du côté codage. A titre de variante, la section de pondération de décodage pondère chaque paramètre pour corriger à la fois la courbe de réponse en fréquence du côté décodage et la courbe de reponse en fréquence du côté codage afin que les courbes de réponse en fréquence des côtés décodage et codage soient aplanies. Dans ce cas, une synthèse de la courbe de réponse en fréquence du côté codage et de la courbe de réponse en fréquence du côté décodage peut être corrigée au niveau du côté décodage.
Ainsi, conformément à la présente invention, il n'est pas nécessaire de se préoccuper de la planéité de la courbe de réponse en fréquence dans la bande passante des filtres utilisés pour le codage SBC, entre autres. Ceci permet une réduction de l'ordre des filtres et simplifie, par conséquent, la structure de ceux-ci. Il est donc possible de réaliser un dispositif de décodage ayant des performances semblables à celles d'un dispositif de décodage conventionnel, à un coût réduit. En revanche, si une structure de filtre équivalente à la structure conventionnelle est adoptée, la presente invention permet d'obtenir un dispositif de décodage offrant une qualité supérieure et un taux de compression plus élevé.
Selon un quatrième aspect de la présente invention, il est proposé un dispositif de codage/décodage de données destiné à coder des données, puis à décoder les données codées pour reproduire ces données, caractérisé en ce qu'il comprend l'un ou l'autre des dispositifs de codage de données ci-dessus combiné avec le dispositif de décodage décrit précédemment.
Dans ce dispositif de codage/décodage de données, la courbe de réponse en fréquence du côté codage et celle du côté décodage sont corrigées afin que la courbe de réponse en fréquence soit aplanie des deux côtés.
Selon un cinquième aspect de la présente invention, il est également proposé un support d'enregistrement de programme contenant un programme destiné à coder des données, caractérisé en ce que le programme comporte les étapes qui consistent à diviser des données d'entrée en plusieurs bandes de fréquences à l'aide d'un banc de filtres d'analyse de bandes de fréquences; à convertir les données divisées en paramètres d'un domaine fréquentiel pour chacune des bandes de fréquences; et à pondérer les paramètres du domaine fréquentiel à l'aide de coefficients de pondération respectifs, coefficients de pondération qui possèdent l'une au moins de caractéristiques d'atténuation d'une distorsion dans le domaine fréquentiel du banc de filtres d'analyse de bandes de fréquences; et d'atténuation d'une distorsion dans le domaine fréquentiel d'un banc de filtres de synthèse de bandes de fréquences destiné à être utilisé au niveau d'un côté décodage de données.
Dans un autre mode de réalisation, le programme de codage de données comporte les étapes qui consistent à diviser des données d'entrée en plusieurs bandes de fréquences à l'aide d'un banc de filtres d'analyse de bandes de fréquences; à convertir les données divisées en paramètres d'un domaine fréquentiel pour chacune des bandes de fréquences; et à pondérer les données d'entrée avant qu'elles ne soient soumises à une division en bandes de fréquences et/ou les données divisées après qu'elles ont été soumises à la division en bandes de fréquences, mais avant leur conversion en paramètres, à l'aide de coefficients de pondération respectifs, coefficients de pondération qui possèdent l'une au moins de caractéristiques d'atténuation d'une distorsion dans le domaine fréquentiel du banc de filtres d'analyse de bandes de fréquences; et d'atténuation d'une distorsion dans le domaine fréquentiel d'un banc de filtres de synthèse de bandes de fréquences destiné à être utilisé au niveau d'un côté décodage des données.
Selon un sixième aspect de la présente invention, il est proposé un support d'enregistrement de programme contenant un programme destiné à décoder des données qui ont été divisées en de multiples bandes de fréquences par un banc de filtres d'analyse de bandes de fréquences, puis converties en paramètres d'un domaine fréquentiel pour chaque bande de fréquences afin d'être codées. Ce programme de décodage comprend les étapes qui consistent à convertir les paramètres en données d'un domaine temporel pour chaque bande de fréquences; à synthétiser les données converties des multiples bandes de fréquences à l'aide d'un banc de filtres de synthèse de bandes de fréquences; et à pondérer les paramètres avant leur conversion en données du domaine temporel, à l'aide de coefficients de pondération, coefficients de pondération qui possèdent l'une au moins de caractéristiques d'atténuation d'une distorsion dans le domaine fréquentiel du banc de filtres de synthèse de bandes de fréquences; et d'atténuation d'une distorsion dans le domaine fréquentiel du banc de filtres d'analyse de bandes de fréquences destiné à être utilisé au niveau d'un côté codage.
Ce qui précède, ainsi que d'autres buts, caractéristiques et avantages de la présente invention, ressortira plus clairement de la description détaillée suivante de modes de réalisation préférés donnée à titre d'exemple nullement limitatif en référence aux dessins annexés dans lesquels:
les figures lA et 1B sont des schémas fonctionnels montrant respectivement la structure d'un dispositif de codage de données et d'un dispositif de décodage de données selon un premier mode de réalisation préféré de la présente invention;
la figure 2 est un schéma fonctionnel montrant la structure d'un dispositif de codage de données selon un second mode de réalisation preféré de la presente invention;
la figure 3 est un diagramme montrant un exemple de la courbe de réponse en fréquence d'un banc de filtres
QMF;
la figure 4 est un diagramme montrant un exemple de la courbe de réponse en fréquence qui doit être éliminée par une section de pondération de codage;
la figure 5 est un organigramme décrivant une procédure de codage exécutée par une section de codage du dispositif de codage de la figure 1;
la figure 6 est un organigramme décrivant une procédure de décodage exécutée par une section de décodage du dispositif de décodage de la figure 1;
la figure 7 est un organigramme décrivant une procédure de codage exécutée par une section de codage du dispositif de codage de la figure 2; et
la figure 8 est un schéma fonctionnel montrant la structure d 'un dispositif conventionnel de codage/décodage de son musical.
Premier mode de réalisation
En référence aux schémas fonctionnels des figures 1A et 1B qui représentent respectivement la structure d'un dispositif de codage de son musical proposé à titre d'exemple d'un dispositif de codage de données selon la présente invention, et d'un dispositif de décodage de son musical proposé à titre d'exemple d'un dispositif de décodage de données selon l'invention, le dispositif de codage de son musical 201 de la figure 1A comporte une section d'entrée de son musical (appelée simplement "section d'entrée" ci-après) 210, une section d'analyse de bandes de fréquences (filtres passe-bande) 212 servant de banc de filtres d'analyse de bandes de fréquences, une section de conversion temps-fréquence 214, une section de pondération de codage 215, une section de quantification 216, une section de calcul de modèles psychoacoustiques 218, une section d'intégration 217, une section de sortie de données codées 219, et une section de commande de codage 230. Comme on peut le voir sur la figure 1B, le dispositif de décodage de son musical 202 comporte une section d'entrée de données codées 229, une section de désintégration 227, une section de quantification inverse 226, une section de pondération de décodage 225, une section de conversion fréquence-temps 224, une section de synthèse de bandes de frequences (filtres passe-bande) 222 servant de banc de filtres de synthèse de bandes de fréquences, une section de sortie de son musical (appelée simplement "section de sortie" ci-après) 220, et une section de commande de décodage 240.
Le fonctionnement du dispositif de codage de son musical 201 et celui du dispositif de décodage de son musical 202 vont être décrits dans la partie qui suit.
Initialement, dans le dispositif de codage de son musical 201, lorsqu'elle reçoit le son musical, la section d'entrée 210 découpe des données de forme d'onde du son musical en zones d'analyse et fournit les données de forme d'onde de son musical ainsi découpées à la section d'analyse de bandes de fréquences 212 et à la section de calcul de modèles psychoacoustiques 218.
Puis, dans la section d'analyse de bandes de fréquences 212, les données de forme d'onde du son musical sont soumises à un filtrage à l'aide de filtres passe bande (comprenant des filtres passe-haut et passe-bas) qui ne laissent passer que des bandes de fréquences souhaitées. Par conséquent, les données de forme d'onde du son musical sont divisées en de multiples données de forme d'onde temporelle qui ne comprennent chacune qu'une bande de fréquences spécifique. Les données de forme d'onde temporelle sont ensuite soumises à un échantillonnage décroissant en vue d'une conversion par échantillonnage. La section d'analyse de bandes de fréquences 112 délivre les données de forme d'onde temporelle divisées et soumises à la conversion par échantillonnage à la section de conversion temps-fréquence 214.
Puis, la section de conversion temps-fréquence 214 convertit les multiples données de forme d'onde temporelle comprenant chacune la bande de fréquences spécifique en paramètres dans le domaine frequentiel de chaque bande de fréquences à l'aide d'une technique telle que la technique
MDCT. Les paramètres ainsi obtenus sont ensuite fournis à la section de pondération de codage 215.
La section de pondération de codage 215 pondère alors les paramètres dans le domaine fréquentiel correspondant à chaque bande de fréquences reçus de la section de conversion temps-fréquence 214 et fournit les paramètres pondérés à la section de quantification 216. A ce momentlà, la section de pondération de codage 215 exécute l'un au moins des traitements (1) et (2) indiqués ci-après.
(1) Pour atténuer des distorsions dans le domaine
fréquentiel du filtre passe-bande de la section
d'analyse de bandes de fréquences 212 du dispositif
de codage 201, la section de pondération de codage
215 multiplie le paramètre de chaque gamme de
fréquences par un coefficient de pondération
prédéterminé correspondant.
(2) Pour atténuer des distorsions dans le domaine
fréquentiel des filtres passe-bande de la section de
synthèse de bandes de fréquences 222 du dispositif
de décodage 202, la section de pondération de codage
215 multiplie le paramètre de chaque gamme de
fréquences par un coefficient de pondération
prédéterminé correspondant.
Le traitement de la section de pondération de codage 215 est indiqué par l'Equation 1 ci-après:
Fi = Wi Fi ..... (Equation 1) dans laquelle
Fi: paramètre dans le domaine fréquentiel
Wi: coefficient de pondération
i: fréquence
Puis, sur la base de la précision des bits de quantification de chaque bande de fréquences, calculées par la section de calcul de modèles psychoacoustiques 218, la section de quantification 216 réduit ou atténue la précision de chaque paramètre pondéré du domaine fréquentiel. La section de quantification 216 fournit à la section d'intégration 217 des données codées quantifiées, telles qu'un facteur d'échelle de chaque bande de fréquences, la précision de quantification et les données quantifiées, par exemple.
Dans la partie qui suit, il est proposé un exemple utilisant un banc de filtres miroirs en quadrature (QMF) pour la section d'analyse de bandes de fréquences 212 et la technique MDCT pour la section de conversion tempsfréquence 214.
La figure 3 représente le banc QMF qui comporte 48 prises et la courbe (l'ondulation dans la bande passante: 0,02 dB) d'une bande de transition normalisée 0,0625, conformément à la description donnée dans la publication de J.D. Johnston: "Famille de filtres conçue pour être utilisée dans des bancs de filtres miroirs en quadrature", 1980 IEEE. Le banc de filtres QMF est appliqué une seule fois pour exécuter un échantillonnage décroissant afin de diviser un signal en deux bandes de fréquences. La figure 4 montre la courbe de réponse en fréquence du banc QMF dans toutes les bandes comprenant l'échantillonnage décroissant exécuté au cours de la division en bandes de fréquences. La courbe de réponse en fréquence représente ce qui doit être éliminé par la section de pondération de codage 215. Après le filtrage à l'aide du banc QMF, la section de conversion tempsfréquence 214 calcule un coefficient MDCT indiquant une courbe de réponse en fréquence d'une zone d'analyse (256 points, par exemple), en fonction d'une forme d'onde temporelle de la zone d'analyse. Pour éliminer l'influence de la courbe de réponse en fréquence du banc de filtres
QMF de la figure 4 sur les coefficients MDCT, le dispositif de codage de données 201 comprend la section de pondération de codage 215 qui effectue l'opération de l'Equation 1 pour annuler la courbe de réponse en fréquence de la figure 4. Un exemple des coefficients de pondération Wi de l'Equation 1 est donné dans le Tableau 1 ci-après.
TABLEAU 1
Coefficient 0 1,000109
Coefficient 1 1,000103
Coefficient 2 1,000086
Coefficient 3 1,000059
Coefficient 4 1,000024 Coefficient 0,99999
Coefficient 6 ou99994
Coefficient 7 Ot999il
Coefficient 8 Out99987 Coefficient | g 0t 0,99985
Coefficient 10 0,99984
Coefficient 11 0,99983
Coefficient 12 0Z99984
Coefficient 13 0,99986
Coefficient 14 0,99989
Coefficient 15 0,99992
Coefficient 16 0,99995
Coefficient 17 ou99999
Coefficient 18 1)000021
Coefficient 19 1,000045
Coefficient 20 1,00006
Coefficient 240 Or99992
Coefficient 241 0)99989
Coefficient 242 0,99986
Coefficient 243 0,99984
Coefficient 245 0,9983
Coefficient 246 0,99984
Coefficient 247 0,999ss5
Coefficient 248 0,99987
Coefficient 249 0,99991
Coefficient 250 0199994
Coefficient 251 0,99999
Coefficient 252 1,000024
Coefficient 253 1,000059
Coefficient 254 1t000086
Coefficient 255 1ss000103
Le Tableau 1 indique une partie seulement de coefficients 0 à 255 à utiliser pour l'analyse d'une zone individuelle au niveau de 256 points.
Le traitement de codage peut etre exécuté par une section de codage 231 (indiquée en trait discontinu sur la figure 1A) constituée de la section d'analyse de bandes de fréquences 212, de la section de conversion tempsfréquence 214, de la section de pondération de codage 215, de la section de quantification 216, de la section d'intégration 217, et de la section de calcul de modèles psychoacoustiques 218, sous le contrôle de la section de commande de codage 230. Dans ce cas, la section de commande de codage 230 est constituée d'un ordinateur, et le traitement de codage de données est exécuté conformément à un programme. Le matériel formant la section de codage 231 de la figure 1A peut alors être remplacé par les étapes de programme indiquées dans l'organigramme de la figure 5 qui va être décrit ci-après.
La figure 5 représente l'organigramme qui décrit le déroulement du traitement de codage de son musical à exécuter par la section de commande de codage 230. Le traitement de codage à exécuter à chaque étape de l'organigramme de la figure 5 est le suivant.
Au début du traitement de codage du son musical, ce dernier est reçu en entrée à l'étape S1, et la forme d'onde du son musical est découpée zone d'analyse par zone d'analyse, ou en unités de zones d'analyse. Puis, le programme passe à l'étape S2 pour exécuter l'analyse des bandes de fréquences. A l'étape S2, la forme d'onde de son musical d'entrée découpée est soumise à un filtrage à l'aide d'un filtre passe-bande (comprenant un filtre passe-haut et un filtre passe-bas) qui ne laisse passer que des bandes de fréquences souhaitées. Ainsi, la forme d'onde du son musical est divisée en de multiples données de forme d'onde temporelle comprenant chacune une bande de fréquences spécifique. Puis, un échantillonnage décroissant des données de forme d'onde temporelle est exécuté en vue d'une conversion fréquentielle par échantillonnage.
Le programme passe ensuite à l'étape de conversion temps-fréquence S3 au cours de laquelle les données de forme d'onde temporelle divisées comprenant chacune une seule bande de fréquences spécifique sont converties en paramètres du domaine fréquentiel correspondant à chaque bande de fréquences à l'aide d'une technique telle que la technique MDCT.
Au cours de l'étape de calcul de modèles psychoacoustiques S4, une analyse fréquentielle des données de forme d'onde de son musical découpées est exécutée à l'aide de la technique FFT, ou d'une technique similaire, afin de déterminer la précision de bits de quantification à utiliser pour effectuer une quantification dans chaque bande de fréquences, sur la base des modèles psychoacoustiques, tels qu'un modèle de masquage simultané et/ou un modèle d'intensité sonore.
Puis, au cours de l'étape de pondération fréquentielle S5, les paramètres du domaine fréquentiel correspondant à chaque bande de fréquences sont pondérés.
Au cours de l'étape de pondération fréquentielle S5, l'un au moins des traitements (3) et (4) suivants est exécuté.
(3) Le paramètre de chaque fréquence est multiplié par
un coefficient de pondération prédéterminé
correspondant afin d'atténuer des distorsions dans
le domaine fréquentiel du-filtre passe-bande utilisé
au cours de l'étape d'analyse de bandes de
fréquences S2.
(4) Le paramètre de chaque fréquence est multiplié par
un coefficient de pondération prédéterminé
correspondant afin d'atténuer des distorsions dans
le domaine fréquentiel d'un filtre passe-bande
utilisé au cours d'une étape de synthèse de bandes
de fréquences du processus de décodage.
Le traitement réalisé au cours de l'étape de pondération fréquentielle S5 est représenté par l'Equation 1 indiquée précédemment.
Le programme passe ensuite à l'étape de quantification S6. Au cours de cette étape, en fonction de la précision des bits de quantification correspondant à chaque bande de fréquences, calculée au cours de l'étape de calcul de modèles psychoacoustiques S4, la précision de chaque paramètre pondéré du domaine fréquentiel est réduite ou atténuée. Des données codées quantifiées, telles que le facteur d'échelle de chaque domaine fréquentiel, la précision de quantification et les données quantifiées, sont alors obtenues. Le programme passe ensuite à l'étape S7 en vue d'effectuer une intégration.
Au cours de l'étape d'intégration S7, les données codées quantifiées, telles que le facteur d'échelle de chaque domaine fréquentiel, la précision de quantification et les données quantifiées, obtenues au cours de l'étape de quantification S6 sont converties en une suite de bits afin d'augmenter un taux de compression pour la transmission (ou le stockage) des données codées quantifiées. Puis, le programme passe à l'étape S8 au cours de laquelle la suite de bits est délivrée en sortie sous la forme de données codées.
La procédure décrite ci-dessus peut être mise en oeuvre à l'aide d'un support d'enregistrement de programme stockant le programme de codage exécuté par l'ordinateur qui constitue la section de commande de codage 230 (voir figure 1A).
Dans le dispositif de décodage de son musical 202, la section de quantification inverse 226 exécute une quantification inverse des données codées quantifiées qui ont été séparées par la section de désintégration 227. La conversion a pour résultat de fournir le paramètre de chaque fréquence, la précision du paramètre étant ramenée à la précision de calcul propre à la section de conversion fréquence-temps 224. Puis, les paramètres ainsi obtenus pour les fréquences respectives sont fournis à la section de pondération de décodage 225.
Ensuite, la section de pondération de décodage 225 pondère les paramètres du domaine fréquentiel correspondant à chaque bande de fréquences, reçus de la section de quantification inverse 226, et fournit les paramètres pondérés à la section de conversion fréquencetemps (filtres passe-bande) 224.
La section de pondération de décodage 225 exécute l'un au moins des traitements (5) et (6) suivants.
(5) Pour atténuer des distorsions dans le domaine
fréquentiel du filtre passe-bande de la section de
synthèse de bandes de fréquences 222, le paramètre
de chaque fréquence est multiplié par un coefficient
de pondération prédéterminé correspondant.
(6) Pour atténuer des distorsions dans le domaine
fréquentiel des filtres passe-bande de la section
d'analyse de bandes de fréquences 212, le paramètre
de chaque fréquence est multiplié par un coefficient
de pondération prédéterminé correspondant.
La section de pondération de décodage 225 exécute une opération représentée par l'Equation 1 indiquée précédemment.
Lorsqu'elle reçoit les paramètres de chaque fréquence pondérés par la section de pondération de décodage 225, la section de conversion fréquence-temps 224 convertit les composantes fréquentielles en données de forme d'onde temporelle de composantes temporelles, à l'aide d'une technique, telle que la technique IMDCT. Les données de forme d'onde temporelle résultantes sont fournies à la section de synthèse de bandes de fréquences 222.
La multiplication des paramètres du domaine fréquentiel par les coefficients de pondération prédéterminés respectifs peut être exécutée aussi bien dans le dispositif de codage de son musical 201 que dans le dispositif de décodage de son musical 202, à l'aide de la section d'analyse de bandes de fréquences 212 et de la section de synthèse de bandes de fréquences 222, de façon à atténuer des distorsions dans le domaine fréquentiel des filtres passe-bande tant de la section d'analyse de bandes de fréquences 212 que de la section de synthèse de bandes de fréquences 222.
Le traitement de décodage peut être exécuté par une section de décodage 241 (indiquée en trait discontinu sur la figure 1B) formée de la section de synthèse de bandes de fréquences 222, de la section de conversion fréquencetemps 224, de la section de pondération de décodage 225 et de la section de quantification inverse 226 sous le contrôle de la section de commande de décodage 240. Dans ce cas, la section de commande de décodage 240 est constituée d'un ordinateur, le traitement de décodage étant exécuté conformément à un programme. Le matériel constituant la section de décodage 241 représentée sur la figure 1B peut alors être remplacé par les étapes de programme indiquées dans l'organigramme de la figure 6 qui va être décrit ci-après.
La figure 6 est un organigramme qui représente le déroulement du décodage de son musical exécuté par le dispositif de décodage de son musical 202. En référence à cette figure, l'opération de décodage de son musical à exécuter au cours de chaque étape va être décrite ci-après.
Au début du traitement de décodage du son musical, une suite de bits résultant d'une compression de données de son musical est reçue en entrée à l'étape S11.
Le programme passe ensuite à une étape de désintégration S12 au cours de laquelle, pour chaque cycle d'analyse, une suite de bits d'entrée est décodée en données codées quantifiées, telles que le facteur d'échelle du domaine fréquentiel, la précision de quantification et les données quantifiées.
Puis, le programme passe à une étape de quantification inverse S13 au cours de laquelle les données codées quantifiées, qui ont été séparées au cours de l'étape de désintégration S12, sont soumises à une quantification inverse. Ainsi, une conversion dans le paramètre de chaque fréquence est réalisée, et la précision du paramètre est ramenée à la même précision de calcul que celle d'une étape de conversion fréquence-temps
S15. Le programme passe ensuite à l'étape de pondération fréquentielle S14.
Au cours de l'étape de pondération fréquentielle S14, l'un au moins des traitements (7) et (8) suivants est exécuté.
(7) Pour atténuer des distorsions dans le domaine
fréquentiel du filtre passe-bande utilisé au cours
de l'étape de synthèse de bandes de fréquences S16,
le paramètre de chaque fréquence est multiplié par
un coefficient de pondération prédéterminé
correspondant.
(8) Pour atténuer des distorsions dans le domaine
fréquentiel des filtres passe-bande utilisés au
cours de l'étape d'analyse de bandes de fréquences
de la section de codage, le paramètre de chaque
fréquence est multiplié par un coefficient de
pondération prédéterminé correspondant.
Le traitement exécuté au cours de l'étape de pondération fréquentielle S14 est représenté par l'Equation 1 indiquée précédemment.
Puis, le programme passe à l'étape de conversion fréquence-temps S15 au cours- de laquelle, lors de la réception du paramètre pondéré de chaque fréquence, une composante fréquentielle est convertie en données de forme d'onde temporelle qui constituent une composante temporelle, à l'aide de la technique IMDCT, ou d'une technique similaire. Puis, le programme passe à une étape de synthèse de bandes de fréquences (filtres passe-bande)
S16.
Au cours de l'étape S16, les données de forme d'onde temporelle divisées comprenant chacune une seule bande de fréquences spécifique sont soumises à un échantillonnage croissant en vue d'une conversion par échantillonnage.
Puis, les signaux générés sont appliqués aux filtres passe-bande (comprenant des filtres passe-haut et passebas) pour ne transmettre que des bandes de fréquences souhaitées. Ensuite, les données de forme d'onde temporelle transmises comprenant des bandes de fréquences spécifiques sont synthétisées. De cette manière, les données codées sont décodées en données de forme d'onde du son musical.
Le programme passe ensuite à une étape de sortie de son musical S17 au cours de laquelle plusieurs données de forme d'onde du son musical décodées sont synthétisées zone d'analyse par zone d'analyse pour reconstituer le son musical qui est ensuite délivré en sortie.
La procédure décrite ci-dessus peut être mise en oeuvre à l'aide d'un support d'enregistrement de programme stockant le programme de décodage exécuté par la section de commande de décodage 240 (voir figure 1B) constituée d'un ordinateur.
Comme cela ressort de manière évidente de la description ci-dessus, dans le dispositif de codage de son musical 201 et le dispositif de décodage de son musical 202, des sons musicaux sont codés et décodés avec une meilleure qualité de son et par un traitement comportant un moins grand nombre d'opérations que dans le dispositif de codage/décodage conventionnel. Ceci s'explique par le fait que le dispositif de codage de son musical 201 et le dispositif de décodage de son musical 202 sont équipés des éléments constitutifs (d savoir la section de pondération de codage 215 et la section de pondération de décodage 225) nécessaires à la correction des courbes de réponse en fréquence des filtres passe-bande respectivement prévus dans la section d'analyse de bandes de fréquences 212 et la section de synthèse de bandes de fréquences 222.
Autrement dit, ce mode de réalisation considère les courbes de réponse en fréquence des filtres, ou du banc de filtres, du point de vue de l'ensemble du système, et non les courbes de réponse en fréquence des filtres en ignorant la relation avec les autres organes. Par conséquent, la précision de la forme d'onde du son musical peut être améliorée grâce à l'utilisation de filtres d'ordres relativement peu élevés. Le côté codage et le côté décodage comportent souvent tous deux des filtres ayant la même caractéristique. Dans ce cas, la caractéristique des filtres peut être corrigée par correction, du côté codage ou du côté décodage, d'une synthèse des caractéristiques des filtres placés des deux côtés, ce qui simplifie la structure du circuit. En outre, si le dispositif de codage et le dispositif de décodage comportent tous deux des moyens de correction (section de pondération), comme dans le présent mode de réalisation, les filtres du dispositif de codage et du dispositif de décodage peuvent avoir des caractéristiques différentes.
D'autre part, dans le cas d'un procédé de codage de son musical conçu pour traiter un son musical avec une précision de 16 bits par exemple, la bande passante du banc de filtres d'analyse de bandes de fréquences est conçue pour avoir une courbe de réponse en fréquence répondant de manière satisfaisante aux exigences du traitement du son musical avec une précision de 16 bits.
Toutefois, pour traiter un son musical avec une précision supérieure à 16 bits, telle qu'une précision de 20 bits ou de 24 bits, par exemple, la précision de la bande passante du filtre conçue pour une précision de 16 bits est souvent insuffisante. Bien qu'en général, le côté décodage soit standardisé, le côté codage ne l'est pas, ce qui signifie qu'il est souvent possible d'adopter une méthode souhaitée pour le côté codage. Ainsi, en prenant en compte l'influence de la précision des filtres du côté décodage pour concevoir le côté codage, il est possible d'obtenir la forme d'onde de son musical avec une précision supérieure à celle prévue par les spécifications, sans modification de ces dernières. Dans ce cas, un effet similaire peut être obtenu sans correction de la courbe de réponse en fréquence par un codage TFC (codage par transformée), mais par adjonction d'un filtre destiné à corriger la courbe de réponse en fréquence du côté codage.
Second mode de réalisation
En référence à la figure 2 qui représente un schéma fonctionnel de la structure d'un autre exemple du dispositif de codage de données de la présente invention, un dispositif de codage de son musical 301 possède une structure équivalente à celle du dispositif conventionnel de codage de son musical 101 de la figure 8 auquel sont ajoutées une section de prépondération 311 et une section de postpondération 313. Les éléments 310, 312, 314, 316, 317, 318 et 319 du dispositif de codage de son musical 301 de la figure 2 correspondent respectivement aux éléments 110, 112, 114, 116, 117, 118 et 119 de la figure 8. La section de prépondération 311 est placée entre la section d'entrée 310 et la section d'analyse de bandes de fréquences 312, tandis que la section de postpondération 313 est placée entre la section d'analyse de bandes de fréquences 312 et la section de conversion temps-fréquence 314.
Le fonctionnement du dispositif de codage de son musical 301 va être décrit ci-après principalement en ce qui concerne les éléments constitutifs supplémentaires de celui-ci.
Chacune de la section de prépondération 311 et de la section de postpondération 313 comporte un filtre de pondération fréquentielle qui reçoit une forme d'onde du domaine temporel et délivre une forme d'onde du domaine temporel à laquelle est ajoutée une valeur de pondération dans le domaine fréquentiel. Dans ce cas, qu'une section de pondération soit placée en amont ou en aval de la section d'analyse de bandes de fréquences (filtres passebas) 312 qui sert de banc de filtres de division en bandes, l'entrée dans la section de pondération consiste en des données du domaine temporel. C'est la raison pour laquelle la section de prépondération 311 et la section de postpondération 313 peuvent être constituées d'un filtre de pondération fréquentielle utilisant une forme d'onde temporelle comme entrée.
Ici, pour atténuer une distorsion dans le domaine fréquentiel d'un filtre passe-bande d'une section de synthèse de bandes de fréquences côté décodage, les données de forme d'onde de son musical destinées à être fournies en entrée à ladite section d'analyse de bandes de fréquences 312 et les données de forme d'onde temporelle divisées par la section d'analyse de bandes de fréquences 312 sont toutes pondérées, en fonction d'un coefficient de pondération prédéterminé, par la section de prépondération 311 et la section de postpondération 313 constituées d'un filtre de pondération fréquentielle.
Le filtre de pondération fréquentielle est représenté par l'Equation 2 suivante:
Figure img00280001

..... (Equation 2) dans laquelle x(n) est un nième forme d'onde temporelle, et ak est un kième coefficient de pondération d'un ordre (M+1).
Les données de forme d'onde de son musical destinées à etre fournies en entrée à la section d'analyse de bandes de fréquences 312 ainsi que les données de forme d'onde temporelle divisées par cette section d'analyse de bandes de fréquences 312 peuvent être pondérées, en fonction d'un coefficient de pondération prédéterminé, par la section de prépondération 311 et la section de postpondération 313 afin d'atténuer une distorsion dans le domaine fréquentiel du filtre passe-bande de la section d'analyse de bandes de fréquences 312 en même temps que la distorsion dans le domaine fréquentiel du filtre passe-bande de la section de synthèse de bandes de fréquences située du côté décodage.
A titre de variante, l'une de ces sections de pondération 311 et 313 peut être supprimée, et seules les données de forme d'onde de son musical destinées à être fournies en entrée à la section d'analyse de bandes de fréquences 312, ou les données de forme d'onde temporelle divisées par ladite section d'analyse de bandes de fréquences 312 peuvent être pondérées.
Le traitement de codage peut être exécuté par une section de codage 331 (indiquée en trait discontinu sur la figure 2) constituée de la section de prépondération 311, de la section d'analyse de bandes de fréquences (filtres passe-bande) 312, de la section de postpondération 313, de la section de conversion temps-fréquence 314, de la section de quantification 316, de la section d'intégration 317, et de la section de calcul de modèles psychoacoustiques 318 sous le contrôle d'une section de commande de codage 330. Dans ce cas, la section de commande de codage 330 est formée d'un ordinateur, et le traitement de codage de données est exécuté conformément à un programme. Le matériel constituant la section de codage 331 de la figure 2 peut alors être remplacé par les étapes de programme indiquées dans l'organigramme de la figure 7 qui va être décrit ciapres.
L'organigramme de la figure 7 décrit l'opération de codage exécutée par le dispositif de codage de son musical 301. Le traitement de codage de son musical à exécuter à chaque étape va être décrit ci-après en référence à cette figure. Comparé au traitement de codage représenté sur la figure 5, le traitement de codage représenté sur la figure 7 comporte en plus une étape de prépondération fréquentielle S22 et une étape de postpondération fréquentielle S24, tandis que l'étape de pondération fréquentielle S5 est supprimée. Les deux étapes S22 et S24 supplémentaires sont conçues pour avoir un effet similaire à celui de l'étape de pondération fréquentielle S5 supprimée.
En référence à la figure 7, l'étape de prépondération fréquentielle S22 et l'étape de postpondération fréquentielle S24 utilisent un filtre de pondération fréquentielle qui reçoit une forme d'onde du domaine temporel et délivre une forme d'onde du domaine temporel à laquelle est ajoutée une valeur de pondération correspondant à un domaine fréquentiel. Précisément, que l'étape de pondération soit placée avant ou après une étape de division en bandes S23 (mais avant une étape S25 de conversion temps-fréquence), l'entrée dans le filtre de pondération fréquentiel utilisé au cours de l'étape de pondération consiste en des données du domaine temporel.
Le filtre de pondération fréquentielle utilisé au cours de l'étape de prépondération S22 et de l'étape de postpondération S24 est représenté par l'Equation 2 indiquée précédemment.
Les données de forme d'onde de son musical destinées à être divisées en fréquence au niveau de cette étape d'analyse de bandes de fréquences S23 et/ou les données de forme d'onde temporelle divisées au cours de l'étape d'analyse de bandes de fréquences S23 sont pondérées, en fonction d'un coefficient de pondération prédéterminé, au cours de l'étape de prépondération S22 et/ou de l'étape de postpondération S24, respectivement, afin d'atténuer une distorsion dans le domaine fréquentiel d'un filtre passe-bande d'une section de synthèse de bandes de fréquences située côté décodage.
Les données de forme d'onde de son musical et les données de forme d'onde temporelle divisées peuvent être pondérées, en fonction d'un coefficient de pondération prédéterminé, au cours de l'étape de prépondération S22 et de l'étape de postpondération S24, afin d'atténuer une distorsion dans le domaine fréquentiel du filtre passebande destiné à être utilisé au cours de l'étape de division en bandes S23, en même temps que la distorsion dans le domaine fréquentiel du filtre passe-bande de la section de synthèse de bandes de fréquences située côté décodage.
A titre de variante, l'une de ces étapes de pondération S22 et S24 peut être supprimée, auquel cas seules les données de forme d'onde du son musical ou les données de forme d'onde temporelle divisées peuvent être pondérées.
La procédure décrite ci-dessus peut être mise en oeuvre à l'aide d'un support d'enregistrement de programme contenant le programme de codage exécuté par un ordinateur constituant la section de commande de codage 330 (voir figure 2).
I1 est évident que, conformément à ce second mode de réalisation de la présente invention, des sons musicaux peuvent être codés et décodés avec une plus grande qualité de son et grâce à un traitement comportant un moins grand nombre d'opérations que la méthode de codage/décodage conventionnelle, grâce à la section de prépondération 311 et à la section de postpondération 313 prévues pour compenser la courbe de réponse en fréquence des filtres passe-bande utilisés pour la division en bandes côté codage et pour la synthèse de bandes côté décodage.
Il convient de noter que lorsque la distorsion dans le domaine fréquentiel peut être atténuée par une combinaison des filtres passe-bande de la section d'analyse de bandes de fréquences 212, des filtres passebande de la section de synthèse de bandes de fréquences 222, et de l'une quelconque, ou d'une combinaison, de la section de pondération de codage 215, de la section de pondération de décodage 225, de la section de prépondération 311 et de la section de postpondération 313, il n'est pas nécessaire d'atténuer la courbe de réponse en fréquence des filtres passe-bande de la section d'analyse de bandes de fréquences 212 et de la section de synthèse de bandes de fréquences 222.
Bien que la description précédente ait porté sur des modes de réalisation préférés de la présente invention, celle-ci n'est évidemment pas limitée aux exemples particuliers décrits et illustrés ici, et l'homme de l'art comprendra aisément qu'il est possible d'y apporter de nombreuses variantes et modifications sans pour autant sortir du cadre de l'invention. Ainsi, par exemple, dans les premier et second modes de réalisation, les dispositifs de codage de son musical 201 et 301 et le dispositif de décodage de son musical 202 ont été décrits.
L'invention peut toutefois s'appliquer à un dispositif de codage/décodage de son musical dans lequel le dispositif de codage de son musical et le dispositif de décodage de son musical sont intégrés. En outre, bien qu'un son musical soit traité dans les premier et second modes de réalisation, il va sans dire que la présente invention peut s'appliquer au codage et au décodage de données autres que des données de son musical.

Claims (8)

REVENDICATIONS
1. Dispositif de codage de données (201), caractérisé en ce qu'il comprend:
un banc de filtres d'analyse de bandes de fréquences (212) destiné à diviser des données d'entrée en plusieurs bandes de fréquences;
une section de conversion temps-fréquence (214) destinée à convertir les données divisées en paramètres d'un domaine fréquentiel pour chacune des bandes de fréquences; et
une section de pondération de codage (215) destinée à pondérer les paramètres du domaine fréquentiel, à l'aide de coefficients de pondération respectifs, coefficients de pondération qui possèdent l'une au moins de caractéristiques:
d'atténuation d'une distorsion dans le domaine fréquentiel du banc de filtres d'analyse de bandes de fréquences (212); et
d'atténuation d'une distorsion dans le domaine fréquentiel d'un banc de filtres de synthèse de bandes de fréquences (222) devant être utilisé dans un dispositif de décodage de données (202) destiné à être associé au dispositif de codage de données (201).
2. Dispositif de codage de données (301), caractérisé en ce qu'il comprend:
un banc de filtres d'analyse de bandes de fréquences (312) destiné à diviser des données d'entrée en plusieurs bandes de fréquences;
une section de conversion temps-fréquence (314) destinée à convertir les données divisées en paramètres d'un domaine fréquentiel pour chacune des bandes de fréquences; et
une section de pondération de codage (311, 313) destinée à pondérer les données devant être fournies en entrée au banc de filtres d'analyse de bandes de fréquences (312) et/ou les données divisées par le banc de filtres d'analyse de bandes de fréquences, devant être fournies en entrée à la section de conversion tempsfréquence (314), à l'aide de coefficients de pondération respectifs, coefficients de pondération qui possèdent l'une au moins de caractéristiques:
d'atténuation d'une distorsion dans le domaine fréquentiel du banc de filtres d'analyse de bandes de fréquences (312); et
d'atténuation d'une distorsion dans le domaine fréquentiel d'un banc de filtres de synthèse de bandes de fréquences (222) devant être utilisé dans un dispositif de décodage de données (202) destiné à être associé au dispositif de codage de données (301).
3. Dispositif de décodage de données (202) destiné à décoder des données qui ont été divisées en de multiples bandes de fréquences par un banc de filtres d'analyse de bandes de fréquences (212, 312), puis converties en paramètres d'un domaine fréquentiel pour chaque bande de fréquences, afin d'être codées, caractérisé en ce qu'il comprend:
une section de conversion fréquence-temps (224) destinée à convertir les paramètres du domaine fréquentiel en données d'un domaine temporel pour chaque bande de fréquences;
un banc de filtres de synthèse de bandes de fréquences (222) destiné à synthétiser les données converties des multiples bandes de fréquences; et
une section de pondération de décodage (225) destinée à pondérer les paramètres devant être fournis en entrée à la section de conversion fréquence-temps (224), à l'aide de coefficients de pondération respectifs, coefficients de pondération qui possèdent l'une au moins de caractéristiques:
d'atténuation d'une distorsion dans le domaine fréquentiel du banc de filtres de synthèse de bandes de fréquences (222); et
d'atténuation d'une distorsion dans le domaine fréquentiel du banc de filtres d'analyse de bandes de fréquences (212, 312) devant être prévu dans un dispositif de codage de données (201, 301t destiné à être associé au dispositif de décodage de données (202).
4. Dispositif de codage/décodage de données destiné à coder des données, puis à décoder les données codées afin de reproduire les données, caractérisé en ce qu'il comprend un dispositif de codage de données (201) selon la revendication 1 et un dispositif de décodage de données (202) selon la revendication 3.
5. Dispositif de codage/décodage de données destiné à coder des données, puis à décoder les données codées afin de reproduire les données, caractérisé en ce qu'il comprend un dispositif de codage de données (301) selon la revendication 2 et un dispositif de décodage de données (202) selon la revendication 3.
6. Support d'enregistrement de programme contenant un programme destiné à coder des données, caractérisé en ce que le programme comprend les étapes qui consistent à:
diviser (S1) des données d'entrée en plusieurs bandes de fréquences à l'aide d'un banc de filtres d'analyse de bandes de fréquences;
convertir (S3) les données divisées en paramètres d'un domaine fréquentiel pour chacune des bandes de fréquences; et
pondérer (S5) les paramètres du domaine fréquentiel à l'aide de coefficients de pondération respectifs, coefficients de pondération qui possèdent l'une au moins de caractéristiques:
d'atténuation d'une distorsion dans le domaine fréquentiel du banc de filtres d'analyse de bandes de fréquences (212); et
d'atténuation d'une distorsion dans le domaine fréquentiel d'un banc de filtres de synthèse de bandes de fréquences (222) devant être utilisé au niveau d'un côté décodage de données.
7. Support d'enregistrement de programme contenant un programme comprend à coder des données, caractérisé en ce que le programme comporte les étapes qui consistent à:
diviser (S23) des données d'entrée en plusieurs bandes de fréquences à l'aide d'un banc de filtres d'analyse de bandes de fréquences;
convertir (S25) les données divisées en paramètres d'un domaine fréquentiel pour chacune des bandes de fréquences; et
pondérer (S22, S24) les données d'entrée avant qu'elles ne soient soumises à une division en bandes de fréquences et/ou les données divisées après qu'elles ont été soumises à la division en bandes de fréquences, mais avant qu'elles ne soient converties en paramètres, à l'aide de coefficients de pondération respectifs, coefficients de pondération qui possèdent l'une au moins de caractéristiques:
d'atténuation d'une distorsion dans le domaine fréquentiel du banc de filtres d'analyse de bandes de fréquences (312); et
d'atténuation d'une distorsion dans le domaine fréquentiel d'un banc de filtres de synthèse de bandes de fréquences (222) devant etre utilisé au niveau d'un côté décodage de données.
8. Support d'enregistrement de programme contenant un programme destiné à décoder des données qui ont été divisées en de multiples bandes de fréquences par un banc de filtres d'analyse de bandes de fréquences (212, 312), puis converties en paramètres d'un domaine fréquentiel pour chaque bande de fréquences afin d'être codées, caractérisé en ce que le programme comprend les étapes qui consistent à:
convertir (S15) les paramètres en données d'un domaine temporel pour chaque bande de fréquences;
synthétiser (S16) les données converties des multiples bandes de fréquences à l'aide d'un banc de filtres de synthèse de bandes de fréquences; et
pondérer (S14) les paramètres avant qu'ils ne soient convertis en données du-domaine temporel, à l'aide de coefficients de pondération respectifs, coefficients de pondération qui possèdent l'une au moins de caractéristiques:
d'atténuation d'une distorsion dans le domaine fréquentiel du banc de filtres de synthèse de bandes de fréquences; et
d'atténuation d'une distorsion dans le domaine fréquentiel du banc de filtres d'analyse de bandes de fréquences devant prévu au niveau d'un côté codage de données.
FR9900029A 1998-01-05 1999-01-05 Dispositifs de codage/decodage de donnees, et supports d'enregistrement memorisant un programme de codage/decodage de donnees au moyen d'un filtre de ponderation frequentielle Expired - Fee Related FR2773653B1 (fr)

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP00051798A JP3504485B2 (ja) 1998-01-05 1998-01-05 楽音符号化装置および楽音復号化装置および楽音符号化復号化装置およびプログラム記憶媒体

Publications (2)

Publication Number Publication Date
FR2773653A1 true FR2773653A1 (fr) 1999-07-16
FR2773653B1 FR2773653B1 (fr) 2001-05-25

Family

ID=11475974

Family Applications (1)

Application Number Title Priority Date Filing Date
FR9900029A Expired - Fee Related FR2773653B1 (fr) 1998-01-05 1999-01-05 Dispositifs de codage/decodage de donnees, et supports d'enregistrement memorisant un programme de codage/decodage de donnees au moyen d'un filtre de ponderation frequentielle

Country Status (2)

Country Link
JP (1) JP3504485B2 (fr)
FR (1) FR2773653B1 (fr)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP1536410A1 (fr) * 2003-11-26 2005-06-01 Samsung Electronics Co., Ltd. Méthode et dispositif pour le codage/décodage d'un flux binaire audio MPEG-4 BSAC avec information auxiliaire

Non-Patent Citations (3)

* Cited by examiner, † Cited by third party
Title
DIETHORN: "A low-complexity, background-noise reduction preprocessor for speech encoder", 1997 IEEE WORKSHOP ON SPEECH CODING FOR TELECOMMUNICATIONS, 7 September 1997 (1997-09-07) - 10 September 1997 (1997-09-10), Pocono Manor, PA, US, pages 45 - 46, XP002120620, ISBN: 0-7803-4073-6 *
GOSSE ET AL.: "Optimizing the synthesis filter bank in audio coding for minimum distortion using a frequency weighted psychoacoustic criterion", 1995 IEEE ASSP WORKSHOP ON APPLICATIONS OF SIGNAL PROCESSING TO AUDIO AND ACOUSTICS, 15 October 1995 (1995-10-15) - 18 October 1995 (1995-10-18), NEW PALTZ, NY, US, pages 191 - 194, XP002120593, ISBN: 0-7803-3064-1 *
SATT ET AL.: "Design of uniform DFT filter banks optimized for subband coding of speech", IEEE TRANSACTIONS ON ACOUSTICS, SPEECH AND SIGNAL PROCESSING, vol. 37, no. 11, 1 November 1989 (1989-11-01), pages 1672 - 1679, XP000074456 *

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP1536410A1 (fr) * 2003-11-26 2005-06-01 Samsung Electronics Co., Ltd. Méthode et dispositif pour le codage/décodage d'un flux binaire audio MPEG-4 BSAC avec information auxiliaire
US7974840B2 (en) 2003-11-26 2011-07-05 Samsung Electronics Co., Ltd. Method and apparatus for encoding/decoding MPEG-4 BSAC audio bitstream having ancillary information

Also Published As

Publication number Publication date
FR2773653B1 (fr) 2001-05-25
JP3504485B2 (ja) 2004-03-08
JPH11194799A (ja) 1999-07-21

Similar Documents

Publication Publication Date Title
EP0782128B1 (fr) Procédé d'analyse par prédiction linéaire d'un signal audiofréquence, et procédés de codage et de décodage d'un signal audiofréquence en comportant application
EP2104936B1 (fr) Codage par transformee, utilisant des fenetres de ponderation et a faible retard
EP1989706B1 (fr) Dispositif de ponderation perceptuelle en codage/decodage audio
EP1905010B1 (fr) Codage/décodage audio hiérarchique
EP1593116B1 (fr) Procédé pour le traitement numérique différencié de la voix et de la musique, le filtrage de bruit, la création d'effets spéciaux et dispositif pour la mise en oeuvre dudit procédé
FR2897733A1 (fr) Procede de discrimination et d'attenuation fiabilisees des echos d'un signal numerique dans un decodeur et dispositif correspondant
EP3014611B1 (fr) Extension améliorée de bande de fréquence dans un décodeur de signaux audiofréquences
WO2010031951A1 (fr) Attenuation de pre-echos dans un signal audionumerique
WO2023165946A1 (fr) Codage et décodage optimisé d'un signal audio utilisant un auto-encodeur à base de réseau de neurones
FR2773653A1 (fr) Dispositifs de codage/decodage de donnees, et supports d'enregistrement memorisant un programme de codage/decodage de donnees au moyen d'un filtre de ponderation frequentielle
EP0989544A1 (fr) Dispositif et procédé de filtrage d'un signal de parole, récepteur et système de communications téléphonique
EP1192619B1 (fr) Codage et decodage audio par interpolation
EP2126904B1 (fr) Procede et dispositif de codage audio
EP1192621B1 (fr) Codage audio avec composants harmoniques
EP1192618B1 (fr) Codage audio avec liftrage adaptif
WO2001003121A1 (fr) Codage et decodage audio avec composants harmoniques et phase minimale
EP1194923B1 (fr) Procedes et dispositifs d'analyse et de synthese audio
FR2990552A1 (fr) Traitement d'amelioration de la qualite des signaux audiofrequences
EP1192620A1 (fr) Codage et decodage audio incluant des composantes non harmoniques du signal
FR2980620A1 (fr) Traitement d'amelioration de la qualite des signaux audiofrequences decodes
FR2737360A1 (fr) Procedes de codage et de decodage de signaux audiofrequence, codeur et decodeur pour la mise en oeuvre de tels procedes

Legal Events

Date Code Title Description
ST Notification of lapse

Effective date: 20100930