Les technologies clés

* Technologies de l'information et de la communication

Algorithmes de compression et de décompression de l'image et du son

Fiche Technologie-clé n : 36

VERSION 3


Présentation de la technologie

*Définition

Les sons et les images, fixes ou animées, nécessitent des capacités de stockage importantes et des débits de transmission élevés. Il s'avère en conséquence fondamental, afin de réduire les capacités et débits nécessaires, de les comprimer. Pour ce faire, on réduit la quantité d'informations utilisée pour définir un son ou une image en exploitant les redondances intrinsèques à ces informations et/ou en adaptant le contenu informationnel aux capacités limitées du système utilisateur (oeil de l'être humain par exemple). Cette opération permet une diffusion davantage optimisée sur les réseaux et/ou un stockage plus efficace sur supports magnétiques ou optiques. Les documents seront ensuite restitués par décompression en fin de cycle.

*Techniques mises en oeuvre :

Afin d'obtenir le meilleur rapport qualité restituée/capacités utilisées, les techniques mises en oeuvre ont pour but de conserver dans le signal les informations les plus significatives (non redondantes et perceptibles par le système utilisateur). D'une manière générale, on distingue deux classes de techniques :

La quasi totalité des normes de codage de l'image comportent des pertes. C'est le cas des normes de visiophonie et visioconférence citées ci-après, de MPEG1 et MPEG2. Il existe un mode sans perte dans JPEG, mais avec un taux de compression faible.

Pour la vidéo, on peut supprimer 2 types de redondances :

Les normes de compression d'images utilisées dans la visiophonie et la visioconférence (H261 et H263) ainsi que MPEG1 et MPEG2 utilisent la DCT et la compensation de mouvements. On utilise également la redondance des valeurs à transmettre en attribuant aux valeurs les plus fréquentes les mots de code les plus courts, ce qui contribue à la réduction des informations à transmettre (technique dite de codes à longueurs variables). Ces techniques de codes à longueurs variables sont réversibles et sont également utilisées pour la compression de fichiers informatiques.

Pour le codage des signaux audio, les phénomènes de masquage auditif sont largement exploités par une analyse fréquentielle (analyse en sous-bandes) et une quantification optimisée.

Les algorithmes de codage de la parole les plus performants utilisent une modélisation du système phonatoire (gorge, cordes vocales), ce qui permet d'obtenir des débits de quelques Kilobits par seconde.

Objectifs de la technologie

*Contexte concurrentiel et économique

Le monde des télécommunications utilise déjà de manière significative les technologies de compression, notamment pour la téléphonie mobile (GSM, DCS, CT2, DECT ... ). Les techniques numériques de compression/décompression connaissent aujourd'hui un essor très important dans le secteur de la télévision, et ce à la fois pour les aspects professionnels et grand public (cf. les bouquets numériques récemment lancés dans le monde entier). La compression d'images sera également essentielle pour la mise en oeuvre des futurs systèmes à la demande dans lesquels des films (et autres objets multimédia) seront stockés sur des serveurs pour être ensuite mis à disposition des utilisateurs finaux au travers de réseaux de distribution numérique. La radio est également gagnée par le numérique et ses techniques de compression. L'électronique de loisir constitue aussi un marché porteur pour ces technologies. Il en est ainsi des jeux vidéo, en local ou en réseau, qui nécessitent des ressources graphiques et sonores en constante augmentation. Le développement d'Internet et des services en ligne va multiplier la demande en objets multimédia (images fixes, images animées, sons) nécessitant d'être comprimés. Le numérique et ses possibilités de compression/décompression gagnera peu à peu tous les systèmes (téléphonie, télévision, radio, ... ). Les techniques mises en jeu sont, pour chacun des domaines visés, issues d'une connaissance des performances du système utilisateur et des outils électroniques au moyen desquels les algorithmes développés seront mis en oeuvre.

La plupart des normes de compression vidéo (normes de visiphonie et de visioconférence citées ci-dessous, MPEG1, MPEG2) spécifient l'organisation des données compressées générées par un codeur (train numérique) et la façon de les utiliser dans les décodeurs pour reconstruire l'information (récupération des images) ; mais elles ne définissent pas la façon dont l'opération de compression elle-même doit être réalisée. Cela permet l'inter-opérabilité des décodeurs mais ne garantit pas un niveau de qualité pour un train binaire répondant à la syntaxe spécifiée. Les industriels fabriquant des codeurs disposent ainsi d'une marge de manoeuvre importante pour générer des informations compressées conformes à la syntaxe. Il est possible de réaliser des codeurs relativement simples mais peu performants (de mauvaise qualité à bas débit et nécessitant des débits élevés pour une bonne qualité) ou des codeurs plus complexes mais très performants.

Les industriels cherchent, dans la mesure du possible, et en fonction des applications visées (et du prix de la bande passante) pour un débit donné, à réaliser la compression offrant la meilleure qualité d'image et inversement, pour une qualité d'image donnée, à utiliser le plus parcimonieusement possible la bande passante. La mise en oeuvre de telles compressions optimisées permet d'obtenir un avantage compétitif de premier plan vis-à-vis de ses concurrents. Par ailleurs, cette flexibilité dans le codage permet d'adapter au mieux la compression à l'application et permet une large diffusion de la norme MPEG2 dans des domaines très divers.

En matière de codage de la parole, 2 objectifs sont poursuivis :

Implications économiques des progrès réalisés en compression :

Les techniques de compression numérique permettent de rendre la diffusion numérique très attractive car beaucoup moins gourmande en bande passante que la diffusion analogique (8 programmes numériques de qualité standard pour 1 programme analogique par satellite ou sur réseau câblé).

Il faudra de moins en moins de débit pour une application donnée. Par ailleurs, dans le même temps, avec l'introduction de la fibre optique, les réseaux disposeront de capacités de plus en plus importantes et seront de moins en moins coûteux. Les systèmes de stockage (optiques, magnétiques) seront également de moins en moins onéreux. En d'autres termes, l'octet stocké ou transporté, coûtera de moins en moins cher. Les progrès réalisés en compression d'une part, l'augmentation des capacités des réseaux d'autre part nécessitera, pour les opérateurs de réseaux, la recherche de nouvelles applications de plus en plus consommatrices en débits.

*Fonctions remplies :

Réduction de la quantité d'informations numériques nécessaire pour définir un son ou une image fixe ou animée avant de le stocker (serveurs de production, serveurs vidéo pour services à la demande, DVD, ...) ou de le transmettre (par satellite, câble, hertzien, réseau de télécommunication). Les fonctions de compression ou de décompression trouvent leur place dans les serveurs, les terminaux de type set top box ou PC, les équipements d'accès aux réseaux.

Environnement technologique

*Technologies concurrentes :

L'emploi des techniques de compression résulte d'un compromis permanent entre :

Il existe différentes méthodes de compression, adaptées aux types d'applications que l'on souhaite mettre en oeuvre :