FIche7 1 1
FIche7 1 1
FIche7 1 1
I) Le son acoustique
Le son est une vibration de l'air, c'est-à-dire une suite de pressions et de dépressions des molécules de l'air par
rapport à une moyenne, qui est la pression atmosphérique. D'ailleurs pour s'en convaincre, il suffit de placer un
objet bruyant (un réveil par exemple) sous une cloche à vide pour s'apercevoir que l'objet initialement bruyant
n'émet plus de son dès qu'il n'est plus entouré d'air.
La façon la plus simple de reproduire un son est de faire vibrer un objet. De cette façon un violon émet un son
lorsque l'archet fait vibrer ses cordes, un piano émet une note lorsque l'on frappe une touche, car un marteau vient
frapper une corde et la faire vibrer.
Pour reproduire des sons, on utilise des haut-parleurs. Il s'agit en fait d'une membrane reliée à un électro-aimant,
qui, suivant les sollicitations d'un courant électrique va aller en avant et en arrière très rapidement, ce qui provoque
une vibration de l'air, c'est-à-dire du son. Les ondes sonores peuvent être représentées graphiquement en faisant
apparaître les suites de pressions et de dépressions de l’air (ou bien de l'électricité dans l'électro-aimant) en fonction
du temps. On obtient alors une représentation sinusoïdale de la forme suivante :
amplitude
pressions
dépressions
La fréquence d’un son est déterminée par le nombre de vibrations par seconde. Par exemple, une fréquence de
440 hertz (Hz) produit 440 pressions et 440 dépressions en une seconde.
Sur la représentation ci-dessus, la hauteur de l’onde représente l’amplitude du son (niveau sonore), et sa longueur
dans le temps indique sa fréquence. Par conséquent, un son grave aura une longueur d’onde plus importante alors
qu’un son aigu se traduira par une onde courte.
Cette représentation d'un son est appelée sinusoïde. Un son pur à la sinusoïde parfaite se rencontre rarement
dans la réalité (le son de la flûte en est très proche). On peut remarquer sur la sinusoïde ci-dessous, une fréquence
fondamentale, à laquelle se superposent d’autres fréquences plus élevées correspondant à des vibrations
supplémentaires. Si ces fréquences sont des multiples entiers de la fréquence fondamentale, elles sont appelées des
harmoniques, sinon il s’agit de partiels.
Un son composé d’une fondamentale et d’harmoniques sera mélodique (harpe, guitare, piano …). Une sonorité
mêlant des partiels à la fondamentale sera moins harmonieuse voir désagréable (cloche, instruments de percussion
…).
Lorsque l’on additionne des harmoniques et des partiels, les fréquences fondamentales donnent naissance à des
formes d’onde différentes. Il en existe trois sortes que l’on nomme formes carrées, en dents de scie et triangulaires.
Ce sont elles qui en partie, nous permettent de différencier le timbre de nos instruments
L’oreille humaine n’est sensible qu’à une certaine plage de fréquences (bande passante) qui s’étend
approximativement de 20 Hz (soit 20 vibrations allers-retours) à 20 kHz (soit 20.000 allers-retours). En dessous de
20 Hz, on appelle ces fréquences des infrasons et au dessus de 20 kHz, on parle d’ultrasons.
Il faut préciser que notre oreille n’est pas linéaire sur toute cette bande passante, c'est-à-dire qu’elle est plus
sensible à certaines fréquences qu’à d’autres. En particulier, les fréquences pour lesquelles nous sommes le sensible
se situent entre 2 et 4 kHz ce qui correspond à une résonance de notre conduit auditif. Par contre, nous percevons
moins bien les graves et les aigus et c’est pour cela que le correcteur de loudness, qui équipe beaucoup de chaîne
hi-fi, amplifie ces fréquences afin de compenser ce manque de sensibilité à bas volume sonore.
Pour mesurer un niveau d’intensité sonore, soit une pression acoustique, on utilise le décibel (dB). Il existe
plusieurs sortes de décibels selon qu’il s’agisse d’une mesure acoustique (dB SPL) ou d’une mesure électrique (dBu,
dBV, dBLW…).
L’enregistrement numérique est basé sur le principe de la transformation d’une onde acoustique continue en une
succession de clichés pris à intervalles réguliers. Nous pouvons comparer ce principe avec celui du cinéma ; avec
plus de 24 images défilant sous nos yeux à chaque seconde, le film nous apparaît comme continu. Pour le domaine
audio, un peu plus de 40.000 « images » par seconde seront nécessaires afin que le son reproduit nous semble
continu. Ces « images » en audio numérique se nomment échantillons (sample en anglais), d’où l’appellation
d’échantillonnage pour la numérisation d’un son.
On parle donc, de fréquence d’échantillonnage pour désigner la quantité d’échantillons prélevés en une
seconde.
Cette fréquence d’échantillonnage détermine la bande passante du signal audio. La plus haute fréquence audible qui
sera enregistrée efficacement sera égale à la moitié de la fréquence d’échantillonnage. Si on prend le Compact Disc
Audio comme exemple, sa fréquence d’échantillonnage est de 44.100 échantillons par seconde donc la fréquence la
plus aigu qui sera enregistrée est 22.050 Hz.
Si on échantillonne une fréquence supérieure à cette fréquence maximum, on verra apparaître un son non
harmonique appelé aliasing.
Nous venons de voir l’analyse de notre forme d’onde dans le temps, c'est-à-dire en fréquence, mais il manque une
information relative à l’amplitude (niveau sonore) afin de pouvoir numériser cette onde sonore. Il s’agit de la
quantification.
Chaque échantillon est mesuré afin lui donner une valeur de niveau sonore la plus proche de celle de la forme
d’onde du son original.
Cette mesure s’effectue en fonction d’une échelle avec plusieurs niveaux de quantification. Plus il y a de niveaux de
quantification, plus le codage de la forme d’onde originale est précis.
La transformation de la forme d’onde en informations codées se fait en système binaire, c'est-à-dire en une
codification réalisée avec des « 0 » et des « 1 ». Chaque élément d’une série de « 0 » et de « 1 » prendra
l’appellation de bit. Un ensemble de plusieurs bits prend le nom de mot numérique.
Dans le processus de codage, un nombre important de bits signifiera une quantification plus complète et plus
précise. Par exemple, un mot numérique de 2 bits pourra exprimer 4 niveaux de quantification (00, 01, 10, 11). Un
mot de 3 bits donnera 8 niveaux possibles (000, 001, 010, 011, 100, 101, 110, 111).
Par conséquent, nous pouvons en déduire que le signal d’un Compact Disc Audio, dont la quantification est de 16
bits et la fréquence d’échantillonnage est de 44,1 kHz, est analysé 44.100 fois par seconde et sur une échelle de
65.536 niveaux.