Les Bases Du Son
Les Bases Du Son
Les Bases Du Son
La différence entre un son et un bruit se base sur plusieurs points de vue et ne vont pas être mesuré
de la même manière ;
→ Physique, un son est ordonné et peut être répétitif ou périodique, un bruit présente un caractère
aléatoire.
→ Psycho-acoustique, un son est un bruit que l’on veut écouter et le bruit est un son que l’on juge
indésirable.
Les deux sont une propagation mécanique d’ondes de pression dans un milieu élastique.
L’intensité acoustique d’un point de vue physique, c’est l’énergie qui traverse une surface donnée.
Le tympan, la capsule d’un microphone, etc. On a un flux d’énergie qui vient d’une source sonore,
la puissance acoustique en watt acoustique (W a). Le flux d’énergie (→Ia) va être une partie de cette
source sonore à travers la surface S.
*La surface est une surface d’air, c’est un débit capté ensuite par l’objet.
Une source sonore doit être caractérisée par son énergie globale, sa puissance acoustique et non pas
seulement par la pression qu’elle va délivrée à une distance donnée sur un axe donnée.
Par exemple, une personne qui joue d’un instrument dans une pièce à côté, l’on va reconnaître la
puissance acoustique de l’instrument, si c’est un piano ou une guitare, c’est pareil pour une
enceinte.
Si l’on met une enceinte acoustique qui fonctionne en pression et qui traduit sa variation de pression
vers un mur, l’on va faire un couplage maximum de l’enceinte au mur. Si l’on se met dans un lieu
«en mode vitesse» sans variation de pression, l’enceinte va avoir du mal à transférer l’énergie.
*Si l’on met des bass-traps où il n’y a pas de pression, car ils agissent en pression, ils ne vont pas
être utiles. La température est négligeable. Notre oreille est sensible aux variations de niveaux et
fonctionne en différence et de façon temporelle.
La source sonore est lié à l’environnement par le phénomène de couplage, elle va transférée de
l’énergie plus ou moins importante suivant le couplage à la salle. La source sonore a une certaine
dynamique qui sera indépendante du couplage à la salle.
Cf. Le Groupe de recherches musicales (GRM) est un centre de recherche musicale dans le domaine du son et des
musiques électroacoustiques. Pierre Schaeffer crée en 1958 le GRM, qui rejoint deux ans plus tard le Service de la
recherche de la Radio-télévision française.
Cf. Un filtre en peigne est utilisé en traitement du signal pour ajouter une version retardée du signal à lui-même,
provoquant des interférences destructives ou constructives. La réponse en fréquence du filtre se présente sous la forme
d'une série de pics régulièrement espacés, d'où le nom de «filtre en peigne». Le facteur de qualité équivalent (la pente
du filtre) est extrêmement important.
Cf. PSI AUDIOAVAA C214 PIÈGE À BASSES ACTIF : Le tout nouveau piège à basses actif AVAA214 établit de
nouvelles normes en matière d'acoustique ambiante. La technologie innovante AVAA prend le contrôle des modes
ambiants dans la gamme de fréquences impressionnante de 15 Hz à 160 Hz sans avoir recours à des calibrages ou à
des réglages laborieux. Le résultat est une reproduction des basses d'une pureté incomparable, en particulier dans les
environnements d'écoute critiques tels que les studios professionnels ou les salles audiophiles.
Cf. Trinnov OPTIMIZER est le logiciel d’optimisation du couplage enceinte-pièce, des algorithmes pour le couplage
enceinte-pièce dans les domaines temporel, fréquentiel, et en niveau pour compenser les modes propres, premières
réflexions et améliorer la réponse impulsionnelle de n’importe quelle configuration d’enceintes depuis la stéréo
jusqu’à 64 canaux immersifs en passant par les systèmes LCRS, 5.1 et 7.1. La gestion des presets ainsi que des
paramètres additionnels pour plus de précision et les pièces complexes sont inclus.
Les caractéristiques du signal acoustique d’un son pur (un sinus à 1000Hz), une fonction
sinusoïdale avec une fonction périodique, une seule période passant par un maximum, 0 et un
minimum. On va avoir une vitesse d’évolution de la pression acoustique. Cette vitesse, c’est la
pulsation (ou vitesse angulaire). L’oméga c’est la pulsation en radiant/s. La période est (t).
La période c’est le temps que mets le signal pour passer d’un 0 à 0, c’est l’aller-retour. La
fréquence, c’est l’inverse de la période.
Pourquoi la phase est plus présente sur le bas du spectre ? La longueur d’onde est plus grande, donc
on va plus facilement avoir une opposition de phase. Dans l’aigu, c’est beaucoup moins perceptible.
Dans le haut du spectre, on va avoir un phénomène de dé-timbrage qui joue sur la stéréo et la
localisation du son.
La formule permet de connaître la longueur d’onde puisque c est une constante. Les propriétés
sonores du grave à l’aigu vont être différentes. Le son se différencie totalement de la lumière. On
peut faire de l’acoustique géométrique dans l’aigu et de l’acoustique statistique dans le grave, ce
n’est pas faisable à l’inverse.
Cf. la maison de la radio de Paris construite en 1974 est un cas d’école pour la création du bâtiment circulaire. On a des
studios en portion de camembert permettant une meilleure acoustique.
Dans cette exemple, l’obstacle va atténuer le grave mais pas du tout l’aigu, car la longueur d’onde
de l’aigu est plus longue. Il faut éviter de mettre les écrans et/ou obstacles devant les enceintes pour
éviter l’effet d’obstacle dans les aigus.
4. Analyse spectrale et temporelle d’un son, le timbre
Le timbre va être lié aux variations temporelles et fréquentielles du signal. Si l’on analyse le spectre
du son harmonique, on va retrouver des fréquences spécifiquement séparée.
Dans les sons complexes harmoniques ou périodiques, on dispose d’un terme qui s’appelle la
décomposition en série de Fourier ; toute fonction périodique peut se décomposer en une somme
d’oscillations sinusoïdales. Cette somme est appelée série de Fourier. N’importe quel son
périodique peut être analysé sous forme d’une somme de son pur.
Toute fonction non-périodique (une attaque de piano, lorsque le marteau frappe la corde) peut
s’exprimer comme une superposition continue de Fourier de la forme générale :
Les spectres de fréquences que l’on voit sont l’application de cette formule.
Les transformées de Fourier rapide (FTT) : Important de comprendre qu’il agit dans une fenêtre
temporelle à connaître car elle peut déformée, il y a une convolution entre la fenêtre et le signal à
traiter. Il faut déterminer ce que l’on veut mesurer, et faire attention aux artefacts.
Une convolution, c’est une interaction entre l’analyse spectrale de la fenêtre temporelle et l’analyse
spectrale du signal, c’est une multiplication de coefficient. Elle va venir modifier la formule que
l’on fait en elle-même. On évite d’arrêter la fenêtre de mesure sur des crêtes.
Lorsque l’on met une réverbération sur un signal, on fait un convolution, c’est pour cela qu’on
l’appelle réverbération à convolution. On superpose la fenêtre de mesure d’un local avec un signal
pur. On fait un produit de convolution. Alors que la réverbération algorithmique est basée sur des
algorithmes, la réverbération à convolution utilise des réponses impulsionnelles, qui sont des
enregistrements d'espaces réels . Vous pouvez envoyer votre audio dans ces espaces pour un effet de
réverbération hyper réaliste.
La sensation de niveau sonore est lié au BeL. I 0 représente le seuil d’audition, c’est la plus petite
intensité décelable à l’oreille. Lorsque l’on augmente d’un bel, on double la sensation sonore, le
BeL est une unité physiologique adaptée à l’audition.
Dans 1 BeL, nous avons donc 10 décibels.
L’on peut mesurer la pression acoustique, l’évolution de la pression en fonction de notre oreille
puisque celle-ci dispose aussi de capteur. On mesure la pression avec un sonomètre. On a une
formule qui permet de passer du niveau de pression au niveau d’intensité. L’intensité acoustique
c’est l’énergie sonore globale et la pression acoustique n’est qu’une partie de cette énergie sonore.
L’impédance acoustique (Za), c’est une résistance au passage de la pression. Dans l’air libre, c’est
environ 410Ωa. En acoustique, l'impédance caractérise la résistance d'un appareil, comme les
enceintes haut-parleurs, à un signal audio émis par une source de courant continu. Cette impédance
se calcule en Ohms (Ω). C’est l’absorption d’un courant acoustique, plus l’ampli casque est
puissant, plus l’impédance doit être importante.
Cette formule permet de connaître l’énergie sonore mise en jeu. En mesurant P, on va pouvoir
connaître Ia. Le dBSPL signifie «Sound Pression Level». Volontairement, le niveau de pression
acoustique dans l’air est égal au niveau d’intensité, si l’on prend 90dB SPL, c’est égal à 90dB de
niveau d’intensité. L’unité de I a est toujours en watt/m². L’impédance acoustique vers un mur n’est
plus de 410Ωa car il n’y a pas de vitesse, contrairement en champ libre. Si l’énergie sonore n’est
que sous forme de vitesse, il n’y a pas de son, car il faut aussi de la pression. Par exemple, dans une
chambre sourde, il y a de la pression partout.
L’on peut également mesurer la puissance acoustique d’une source en wattacoustique.
Si l’on a une source sonore qui émet une puissance acoustique ; à une certaine distance, on va en
capter une partie, si l’on arrive à capter toute l’énergie sonore, on va forcément avoir un niveau de
puissance acoustique supérieur à une distance supérieur. Lorsque l’on est dans le grave, il faut être
assez loin et inversement dans l’aigu.
Si l’on multiplie l’intensité acoustique par 10, on augmente de 10dB, on double la sensation sonore.
C’est valable uniquement à 1000Hz.
*Expérience audiométrique, on va avoir un son avec un 0 relatif, puis augmenter de 10dB à chaque fois, l’on va avoir
l’impression de doubler la sensation sonore. Tous le monde a un double de sensation sonore dans ces conditions, c’est
universel.
Imaginons que l’on veut remplacer un amplificateur de 50w afin d’obtenir le double de niveau
ressent. La puissance à prévoir pour le futur amplificateur sera de 500w, car il faut faire x10.
Un bruit blanc a autant d’énergie dans le bas que dans l’aigu, mais l’on aura une impression d’aigu
plus fort alors que physiquement c’est lui le plus équilibré fréquentiellement. La phase est aléatoire
dans un bruit, il n’y a pas de relation de phase. Le bruit rose est utilisé en sonorisation pour
l’équilibre spectrale en phase finale, il n’y a pas de notion et d’information temporelle. Les octaves
sont liées à cette échelle logarithmique. Dans la nature, il y a plus d’énergie de façon naturelle dans
le grave que dans l’aigu. On va créer la musique à l’image de notre sensibilité auditive.
*Un dirac est une impulsion très brève (l’étincelle d’une gazinière, le tic), c’est un spectre de bruit blanc. C’est
exactement le même bruit énergétiquement qu’un bruit blanc mais instantané. La différence entre les deux est la relation
de phase. C’est utilisé pour les mesures par réponse impulsionnelle dans les salles.
On va avoir la même sensation de niveau d’écoute dans le grave que dans l’aigu dans les conditions
suivantes : 1000Hz à 40dBSPL et 100Hz à 50 dBSPL ou 40Hz à 70 dBSPL. Le dB n’est pas linéaire en
fonction de la fréquence, d’où cette courbe.
Cela signifie que lors d’un mix à un niveau de 60 dB (relativement faible et intime), on va
forcément, psycho-acoustiquement mettre plus de grave que de médium-aigu. On va faire un mix
adapté à un niveau faible, mais lorsque l’on va l’écouter à 80 dB, on ne le retrouvera plus. C’est
pour cela qu’il faut aligner les niveaux lors du mix dans le circuit de production et calibrer le
système d’écoute.
*Imaginons que l’on émet un son pur à 60dB à 1000Hz avec un ampli générant 1 watt électrique. Si l’on change la
fréquence à 30Hz, il faudra donc passer à 90dB, et notre nouvelle puissance électrique de l’amplificateur sera de 1000
watt, car pour augmenter de 10dB, on multiplie par 10 la puissance (passer de 60dB à 90dB donc de 1 watt à 1000
watt).
Les courbes de pondération fréquentielle ; Si un son est produit avec une pression sonore égale sur
l'ensemble du spectre de fréquences, il pourrait être représenté dans le graphique ci-dessous par la
ligne de pondération Z. Ce que les humains sont physiquement capables d'entendre est représenté
par la courbe de pondération A. Les sons acoustiques contiennent plus de basses et de hautes
fréquences que ce que les humains perçoivent. La courbe de pondération C représente ce que les
humains entendent lorsque le son est augmenté ; nous devenons plus sensibles aux basses
fréquences. Les pondérations A et C sont donc les plus significatives pour décrire la réponse en
fréquence de l'oreille humaine aux sons du monde réel.
Comme les mesures acoustiques du niveau sonore sont souvent motivées par l'effet des sons sur
l'homme, le filtre de pondération A est couramment utilisé. Le filtre de pondération C est souvent
appliqué lorsqu'il s'agit de représenter les niveaux maximum. La pondération Z (pas de pondération
et donc pas de filtre) peut être appliqué, par exemple, lorsqu'une analyse de la source sonore est
requise plutôt que l'effet du son sur l'homme, par exemple pour tester la réponse en fréquence des
haut-parleurs produits dans un processus de fabrication.
On va donc énormément atténuer les bruits grave que l’on va évaluer, on va sous-estimer le bruit
réel, notre oreille à une capacité d’éjection du bruit, entre le moment d’écoute et lorsqu’on l’écoute
pas, il va y avoir une différence perçu.
Par exemple, un petit moustique est un cas parfait pour l’onde sphérique. Il émet autant de son
depuis sa petite source sans obstacle, dans toute les directions. Dans l’air, l’énergie va s’amenuiser
par dissipation. Si l’on prend (Ia = Intensité acoustique et Wa = watt acoustique) cette formule, plus
on augmente le rayon r, Ia va diminuer puisque Wa est constant, le niveau diminue donc lorsque l’on
s’éloigne d’une source. C’est la base de la prise de son avec un microphone, c’est par exemple un
des effets de proximité.
On a une diminution de 6dB à chaque fois que l’on double la distance de la source sonore. On sait
aussi que Log(ab) = Log(a) + Log(b).
Si l’on a une prise de son Lp = 90dBSPL avec une prise du son à 1 mètre de distance, la source sonore
omnidirectionnelle aura un Lw = 101dB, à calculer à l’aide de la formule de droite ;
Pour l’application à la prise de son, nous avons ensuite la courbe de décroissance d’un son (en
rouge diagonale) par rapport à une échelle de distance logarithmique. Nous faisons généralement
une prise de son dans un local avec un son de manière constante et nous avons un champ réverbéré
constant en fonction de la distance par rapport à la source. Nous avons un endroit particulier où le
niveau du son réfléchi est égal au niveau du son direct ; c’est la distance critique. À cette endroit
précis, nous allons entendre la somme des deux (ligne rouge horizontale et diagonale), nous allons
donc entendre la courbe violette. Si nous sommes très prêt de la source sonore, nous n’entendrons
que la source direct et inversement, si l’on est loin, nous n’entendrons que la source réverbéré.
À la distance critique (dC), nous aurons +3dB à cause de l’addition de niveau identique. Appliquer
à la prise de son, sur ce point critique, nous allons faire une prise de son de type acoustique
naturelle. Si l’on fait une prise de son de proximité, on se positionne au début et si l’on fait une
prise de son d’ambiance, on se positionne vers la fin.
Lorsqu’on fait du mixage, l’idée c’est d’écouter le mix et pas la salle. Si l’on écoute une guitare en
chambre sourde, tu peux absolument tout entendre à -80dB, si tu le fais ailleurs, tu ne l’entendras
plus du tout de la même façon. Plus l’on est précis dans le mix, moins l’on est transportable, il faut
un lieu assez mat (pas trop) et ensuite on va calibrer les enceintes pour créer une courbe de
transportabilité du mixage.
Le rayon de courbure d’une onde sphérique va devenir une onde plane, il n’y a plus d’expansion et
l’onde va se dissiper de manière régulière, lorsqu’on est suffisamment loin de la source. Une onde
sphérique se transforme en onde plane au-delà de 10 fois la longueur d’onde, il n’y a plus de
décroissance par rapport à la distance et elle conserve son niveau par dissipation, il y aura quand
même une diminution par l’impédance acoustique, le frottement. L’on va aussi conserver sa
directivité ! L’onde plane va porter plus loin que l’onde sphérique.
*Sachant que lambda est égal à c/f, soit 340m/s (célérité du son) et f = x Hz. Quelles sont les longueur nécessaire pour
rendre un son directif grâce à une guide d’onde ? 17cm pour 20kHz et 170m pour 20Hz. Cela explique pourquoi les
hauts-parleurs sont généralement omnidirectionnel dans le grave et directive dans l’aigu. C’est aussi pour cela que l’on
a crée des pavillons repliés pour gagner de la distance dans l’aigu. On détourne le problème en sono en faisant des
caissons de cardio avec des haut-parleurs derrière détruisant l’onde par opposition de phase.
Pour l’addition des niveaux sonores ; supposons que nous ayons deux enceintes avec deux signaux,
des générateurs de bruits roses décorrélés, différents. Ce qui va s’additionner, c’est l’énergie ou
l’intensité acoustique. Donc si l’intensité acoustique de la première enceinte est égale à celle de la
deuxième, et avec cette formule, nous aurons une augmentation de +3dB si les sources sont
distinctes.
Donc, si nous avons deux source à 80dB, nous aurons +3dB. Si nous avons une source de 80dB et
une autre de 78dB, nous aurons une augmentation de +2,1dB. Si nous avons une source de 80dB et
une autre de 70dB, nous aurons à peine plus de 80dB. C’est donc la base du mixage, c’est ce que
l’on applique d’une manière inconsciente. Lorsqu’on additionne 2 niveaux identiques, l’on va
augmenter de +3dB.
Les premières mixeurs sont les orchestres, pour équilibrer l’ensemble, on a calculé que l’on met
plusieurs violons pour un violoncelle.
Donc dans cette exemple, N1 + N2 = +2,2dB et N3 + N4 = +2,2dB donc un total de 4,2dB. On peut
se permettre d’ignorer N5. On passe donc de 85dB à 89,2dB.
Si les deux sources sont très proches et/ou corrélées en phase électrique, la distance est très inférieur
(distance < lambda/2), ce n’est pas l’énergie qui va s’accumuler mais la pression acoustique ! Donc
à la place d’avoir +3dB, nous aurons +6dB, c’est ce que l’on appelle le couplage des sources.
Par exemple, à 100Hz, la longueur d’onde est de 3,40m, si l’on divise par deux, cela fait 1,70m et
donc si l’on met les deux enceintes à 30cm, elles sont couplées. Attention, ce sera différent à
1000Hz, car plus délicat pour les tweeter.
Pour la rotation de phase, si les signaux sont en phase, on aura une amplitude supérieur ou le double
de tension. Si l’on est en opposition de phase à 180°, nous annulons la tension. Et si l’on est en
quadrature à 90° nous allons obtenir un signal mais qui sera bien différent, nous aurons une
augmentation du volume aux croisements. On va obtenir un signal «inventé», on va faire du
phasing.
Une rotation de phase va créer une distorsion temporelle, puisque le son ne va pas arriver de la
même façon à notre oreille. Dans le grave, le décalage va être négligeable mais pas dans l’aigu. On
va avoir des annulations ponctuels à certaines fréquences dans le médium-aigu.
Quand on fait du mixage, lorsqu’on mixe une basse et une grosse caisse, les deux vont fatalement
changer de son car les deux signaux vont ponctuellement se croiser et l’on va avoir un phénomène
de dé-timbrage.
Un quadripôle est un objet électrique avec deux pôles d’entrée (P e) et de sortie (Ps), on a une
puissance électrique, en watt électrique, à la sortie et à l’entrée. Le rapport en puissance est la
puissance en sortie divisé par la puissance en entrée. Si l’on a puissance de sortie de10 w et 1w en
puissance d’entrée, on aura Gp = 10dB. C’était applicable au début dans la téléphonie par Graham
Bell.
Donc si l’on veut 30dB de gain, il faut qu’il sorte 1000 fois plus de puissance qu’à son entrée.
Nous avons ensuite le gain en tension que l’on sait mesurer. Il fonctionnera pareil que le gain de
puissance mais avec le volt comme unité de mesure. Si l’on double la tension, on aura +6dB à cause
du 20log. Si l’on double la puissance, on aura +3dB.
En général ce que l’on manipule c’est la tension et non la puissance, plutôt utilisée à la fin pour
amplifier le signal sur des haut-parleurs.
Le gain en dB est donc le rapport en puissance entre une sortie et une entrée, ça caractérise un
appareil. On va avoir des gains normalisés sur les amplis de sonorisation. Pour ce qui est du niveau
de puissance, on va le noter en dB m, le «m» venant de mW, milliwatt. Le Db m vient du PTT, des
postes de télé-communication à l’origine.
À l’époque des PTT, avec un générateur d’une impédance de sortie de 600ohm et un récepteur avec
une impédance d’entrée de 600ohm c’était voulu pour obtenir le maximum de puissance électrique
transmise, c’est une adaptation d’impédance en puissance acoustique. Ce n’est pas tout à fait le cas
en audio. Ci-dessous, l’application de la loi d’ohm. U0 en audio est de 0,775Veff. Quasiment jamais
en audio nous n’avons une impédance de 600ohm.
Par exemple, la formule ci-dessous est à connaître. Dans une console, c’est important de connaître
cela pour déterminer l’alignement des niveaux, à savoir la moyenne d’attaque dont notre appareil à
besoin pour fonctionner. Si on l’attaque trop faible nous aurons du bruit de fond, si l’on attaque trop
fort, nous aurons de la saturation, c’est une gestion du niveau. Le dB u revient à la même chose que
mesurer un volt sauf que notre oreille est sensible au dB donc on le mesure comme cela. Si l’on sait
que l’on a augmenté de 10dB, on comprend qu’on a une sensation du double, si l’on explique qu’on
a augmenté de 20 la tension, ça ne se ressent pas.
Quant on étalonne une magnétophone à bandes, on utilise un voltmètre en se mettant sur la tête
d’enregistrement et l’on voit ce qui rentre dans la console pour voir si les têtes fonctionnent
correctement. On va mesurer en tension et l’on va le communiquer en dB.
Certains appareils de mesure fonctionnent purement en dBv mais en audio professionnel on utilisera
principalement des dBu.
3. L’adaptation d’impédance
L’adaptation est un problème souvent présent en audio qui va expliquer presque la moitié des
problématique en audio analogique et/ou numérique. En audio, on veut perdre un minimum de
tension entre les points et faire une adaptation en tension. On va essayer le plus possible d’avoir une
impédance de sortie du générateur très faible devant la résistance de charge du récepteur, c’est
valable lorsque la résistance du fil de lésion est très faible aussi. On va détériorer l’adaptation en
tension si le câble est trop long et l’on va perdre du niveau.
Une adaptation correcte en tension, c’est quand R c (correcteur de charge) est supérieur ou égal à 10
fois la résistance du générateur, on peut à partir de là estimer que l’on a presque rien perdu, la
tension U1 aux bornes du récepteur sera à peu près égal à la tension maximum que peut fournir
notre générateur. Par exemple, on a un générateur avec une impédance de sortie inférieur à 200ohm
et que l’impédance d’entrée du récepteur soit supérieur à 5kohm. Par exemple, l’impédance de
sortie d’un microphone électro-statique est d’environ 50ohm et l’impédance d’entrée d’une carte
son est d’environ 2-3kohm.
4. Paramètres et défauts du signal
En électronique, la bande passante d'un système est l'intervalle de fréquences dans lequel
l'affaiblissement du signal est inférieur à une valeur spécifiée. C'est une façon sommaire de
caractériser la fonction de transfert d'un système, pour indiquer la gamme de fréquences qu'un
système peut raisonnablement traiter.
Dans un appareil donné, on a un niveau de bruit de fond et un niveau de saturation. On peut utiliser
des amplis à tube pour volontairement utiliser le niveau de saturation. Le niveau moyen ou PML est
le niveau nominal noté Nn. Nous avons le niveau de saturation (clipping, écrêtage ou overload), le
bruit de fond (noise floor) et le niveau nominal (79 dB c) correspond généralement à -18dBFS
(permitted maximum level). Nous avons ensuite la marge de surmodulation (headroom) entre le
niveau de saturation et le niveau PLM (la réserve) et le rapport signal/bruit (signal to noise ratio).
Il faut faire attention à ce qu’est le niveau de bruit de fond. On s’aperçoit que le bruit de fond
minimum pour n’importe quel élément est le bruit d’agitation thermique des composants dans les
résistances (fil de cuivre, etc.). N’importe quel molécule mécanique où se déplace le courant d’une
manière électrique va avoir un bruit d’agitation moléculaire minimum, il s’appelle le bruit théorique
minimum et sera liée à la température, la bande passante et à la valeur de l’impédance de la charge à
l’entrée du système.
Si l’on met un console de mixage avec en entrée un pré-ampli micro à 200ohm, le minimum de
bruit que l’on peut avoir est de -130,8dBu (voir schéma). Le bruit de fond sera lié à l’impédance de
sortie du microphone.
Un microphone à ruban à toujours un transformateur de sortie autour de 200ohm. Le ruban lui à par
contre une faible impédance, le niveau de signal sera plus faible parallèlement de l’ordre de
0,1mv/p. Quand on élève le niveau, on amplifie le bruit de fond.
Ici, nous avons le gain à 50dB. On met une résistance de 200ohm à l’entrée de la console et le bruit
de fond théorique sera de -130,8dBu ce qui signifie que lorsqu’on l’amplifie, cela va donner -76dB u
mesuré à la sortie. Quant au bruit ramené à l’entrée, nous avons en sortie de console (parfaite), au
minimum -76dBu, donc avec cette console-là à l’entrée -126dBu avec un facteur de bruit de 4,8dB. Il
faut avoir un facteur de bruit le plus petit possible.
On a plusieurs pistes, elles vont dialoguer les unes avec les autres ; pour mesurer la diaphonie entre
deux pistes, on met une charge en sortie et un générateur de signal (1000Hz, etc..) sur la tranche A
et sur la seconde entrée, on met la charge et l’on mesure à la sortie. On va mesurer ce signal
différentiel, s’il n’y a pas de diaphonie, on atteint 0dB. S’il y a 70dB, on va le retrouver à 70dB en
dessous sur l’autre tranche. C’est lié à la construction des circuits, à une mauvaise séparation des
circuits, le blindage des câbles, les montages asymétriques et sera conditionné par le prix.
Ici, nous avons un vecteur imaginaire qui tourne dans le sens trigonométrique avec un signal
d’entrée et de sortie. Il y a forcément un temps de propagation dans le fil entre les deux
entrées/sorties. Le vecteur de sortie va être en retard pulsionnel et l’on va avoir un angle qui
s’appelle l’angle de phase et sera lié au retard entre les signaux. Ce n’est pas un défaut, c’est un
défaut s’il était différent en fonction de la fréquence entre les signaux.
Il ne faut pas confondre une rotation de phase et une inversion de la polarité. Il y a un retard
constant qui garantit le respect des timbres. Avec des filtres FIR, on peut faire des rotations de
phases sans effectuer de changement d’amplitude pour calibrer des enceintes. Ci-dessous, l’on peut
voir que la phase n’est pas droite. Plus la pente est élevée, plus le retard est important. Un retard en
dessous de 5-10ms est quasiment inaudible. Si l’on veut que le retard soit constant, l’on veut que la
phase ne soit pas constante, elle doit être linéaire et non pas droite.
L’écoute monitoring est à l’ingénieur du son ce que la lumière du soleil est au peintre, il ne sait
pas si sa peinture va être regarder dans n’importe quelle condition d’éclairage, il sait seulement qu’à
la lumière du soleil ses rapports de couleur et sa cohérence sera retrouvée partout. C’est la raison
pour laquelle il faut une écoute neutre.
L’on dit souvent qu’avec les formats MP3, de streaming, les téléphones, on se fiche de plus en plus
de la qualité. C’est l’erreur à ne pas commettre car il faut faire de la qualité en amont pour que ça
sonne sur des petit haut-parleurs, des iphones, etc.
1. Principe général
2. Principe des micros et hauts-parleurs
On se rend compte ensuite que les trois circuits ci-dessous ne sont pas linéaire. On a une chute du
courant à partir de la fréquence de coupure électrique (Fe) et dépendra de la taille de la bobine
mobile.
Dans le circuit mécanique, lorsqu’on introduit une force en newton constante, on s’aperçoit que la
vitesse vibratoire va croître, passer par un maximum (Fm) qui est la fréquence de résonance
principal du haut-parleur souvent situé dans le grave, puis va diminuer, c’est la loi de Hook, elle
dépendra de la masse et de la rigidité de la suspension du haut-parleur.
Plus la suspension est souple, plus la fréquence de résonance (Fm) est basse et plus la masse est
élevée, plus la fréquence de résonance est basse aussi. Imaginons un tweeter qui fonctionne bien
dans l’aigu, il faut une masse faible et une suspension très rigide et à l’inverse pour les graves. C’est
pour cela qu’un tweeter ne ressemble pas à un boomer.
Pour la partie acoustique, on introduit un débit constant et identique en vitesse vibratoire quelque
soit la fréquence au niveau des molécules d’air qui touche la membrane, on s’aperçoit que la
puissance acoustique va augmenter avec la fréquence et arriver à un maximum qui s’appelle Fa
(fréquence de coupure acoustique) et correspond au niveau maximum d’énergie transmis dans l’air.
Ce que l’on va entendre dans les haut-parleurs sera la somme des ces trois circuits. L’ensemble n’est
pas linéaire.
Par exemple, dans la partie acoustique, le haut-parleur bouge mais ne transmets pas d’énergie à
l’air, c’est ce que l’on va appeler le couplage du local. L’air environnant des haut-parleurs va
intervenir sachant que l’impédance acoustique de l’air dépend de la salle ! L’impédance acoustique
vers un mur n’est pas la même qu’au milieu du salle ou en champ libre. Dans cette zone, le haut-
parleur bouge mais ne transmet pas de son utile à l’air.
Quand on met un haut-parleur dans une grande salle prêt des murs, il n’aura pas les mêmes basses
qu’un haut-parleur au milieu d’une petite salle.
Si l’on fait la somme de ces trois fonctions de transferts, l’on obtient l’image ci-dessous. La courbe
total du haut-parleur est la courbe noire. Chaque haut-parleur va avoir une zone d’utilisation
optimale.
Il faut aussi faire attention à la directivité du haut-parleur compte tenu de son diamètre. La conicité
du haut-parleur est faite pour compenser le temps de propagation du son entre la fin et le début de la
membrane et maîtriser sa directivité.
*La vitesse de propagation dans le béryllium est beaucoup plus rapide que dans la fibre de verre et le tweeter aura plus
de restitution dynamique.
Le haut-parleur tout seul émet en opposition de phase de l’autre côté. Il émet d’un côté en
surpression et une dépression de l’autre, le signal s’annule en cas de ce court-circuit acoustique, on
aurait pas de grave. On va tenter d’étendre et de maîtriser la réponse dans le grave. Nous avons à
l’intérieur du matériel amortissant.
*Un DSP pour Digital Signal Processor en anglais est un processeur spécialisé dans le traitement numérique du
signal. Son architecture est optimisée pour traiter une grande quantité de données en parallèle à chaque cycle
d'horloge. Ce mode de fonctionnement est très efficace pour traiter des signaux numériques (filtrage, compression,
extraction, etc.) comme de la vidéo ou de la musique. Un DSP pour Digital Sound Processing désigne les
effets acoustiques recréés par un processeur numérique pour donner l'impression à l'utilisateur qu'il se trouve dans
une salle de concert, une église, ou un bar de quartier, à partir d'un signal stéréo traditionnel. On trouve ces modes
DSP dans les amplificateurs audio vidéo multicanaux.
*C’est une enceinte qui a pour caractéristique d’être munie d’un ou plusieurs évents appelés aussi résonateurs. Un
évent est une sortie d’air matérialisée par un tube plus ou moins long et d’un diamètre plus ou moins grand qui vient en
ajout du haut parleur. L’intérêt de l’évent dans une enceinte Bass-reflex est de venir renforcer les basses fréquences
(sons graves), celles qui te font vibrer, quand le haut parleur commence à baisser en efficacité. Une enceinte bass-reflex
agit alors comme un résonateur accordé. Le son produit par l’onde arrière du haut parleur va «exciter» le
résonateur/évent et c’est ce dernier qui, en résonnant, va amplifier une gamme de fréquences spécifiques. La difficulté
consiste donc à sélectionner parfaitement tous les paramètres pour faire résonner et amplifier la bonne plage de
fréquence et avoir le meilleur résultat possible dans les sons graves.
Quant aux caractéristiques techniques d’une enceinte, nous avons premièrement la sensibilité (ou le
rendement) qui est mesurée dans l’axe. Ensuite la puissance électrique maximal, la bande-passante
et la courbe de réponse dans l’axe, la directivité (omnidirectionnel, croissante ou constante) et la
distorsion et la linéarité.
Neville Thiele et Richard Small ont grandement fait évoluer les enceintes acoustiques dans les
années 1970. Une enceinte correct pour un studio professionnel coûtera autour des 1000 euros.
Ne jamais oubliez de dissocier le plan artistique et le plan objectif lorsqu’on écoute du son. Il n’y a
pas de perfection de mixage ou de mastering. Il faut s’obliger à faire des choix musicaux. L’intérêt
d’un apprentissage d’écoute est de permettre de traduire une intention artistique sous forme
objective à l’oreille. On va être capable de rendre cette intention tangible, c’est le métier
d’ingénieur/technicien du son en choisissant ses outils, son univers, avec de l’expérience, etc. Les
enceintes sont les diffuseurs de notre création. Même une enceinte qui n’est pas neutre permet de
faire de bons mix, il faut par contre savoir l’objectiviser et en compenser les défauts.
La pression acoustique sera détecté par la surface de la membrane (en m 2). Plus la surface est
grande, plus l’on va capter de pression.
Nous avons ensuite les microphones mixtes qui fonctionnent en pression et en vitesse. Il y a deux
possibilités de fonctionnement ; un microphone à pression avec un labyrinthe acoustique ou à
double membrane, donc un microphone cardioïde qui fonctionne 50% acoustiquement en pression
et 50% acoustiquement en gradient de pression. L’hyper-cardioïde sera rapprochera plus d’un
bidirectionnel et l’hypo-cardioïde (75% en omnidirectionnel et 25% en bidirectionnel) se
rapprochera d’un omnidirectionnel.
L’on peut normalement rapidement reconnaître la classification acoustique d’un micro à son visuel.
*Lorsque l'on parle de signal audio, on distingue également de manière générale les connexions symétriques et
asymétriques. En effet, les câbles employés dans votre installation Hi-Fi peuvent avoir une incidence sur la restitution
sonore de votre système. Techniquement, la différence réside dans le nombre de conducteurs utilisés pour avoir un
signal symétrique ou non. Les câbles de modulation asymétriques ne sont dotés que de deux conducteurs, la masse et
le signal, tandis que les câbles symétriques présentent 3 conducteurs : un point chaud, un point froid ainsi que la
masse. L'exemple le plus classique sont les câbles de modulation RCA qui sont asymétriques et les câbles de
modulation XLR qui sont symétriques.
Dans le cas d’un signal symétrique, on a besoin d’une Bien que présentant des couches d'isolation et de blindage
masse, d’un point chaud et d’un point froid. Pour les performantes remédiant à la plupart des interférences
signaux stéréo, on a besoin d‘une masse, d’une voie EMI/RFI externes, une connexion asymétrique n'est pas
gauche et d’une voie droite. Les deux fils d’un câble jack aussi performante qu'une connexion symétrique, mieux
6,35 mm TRS peuvent être utilisés avec une polarité protégée contre les interférences. C'est pourquoi dans le
inverse (comme nous l’avons expliqué ci-haut), mais ils milieu audio professionnel les connexions symétriques
peuvent également servir pour envoyer deux signaux sont systématiquement privilégiées, notamment pour les
différents vers l’écouteur droit et l’écouteur gauche d’un câblages de longues distances.
casque ou d’un appareil similaire.
*Une boîte de direct, communément appelée DI (pour « direct injection box »), vous permet de convertir un signal
asymétrique en un signal symétrique. Ces boîtes sont souvent utilisées sur scène pour transformer le signal asymétrique
provenant d’une guitare acoustique en un signal symétrique. Ainsi, il est possible de couvrir des distances de plusieurs
dizaines de mètres sans être gêné par les bruits indésirables. Sachez que l’appareil qui reçoit le signal doit également
posséder une connexion symétrique. En général, une boîte de direct doit être branchée sur une entrée micro, qui est
presque toujours symétrique. Notez enfin que vous pouvez brancher un câble asymétrique sur une connexion
symétrique sans aucun problème. Dans ce cas, vous n’aurez pas de liaison symétrique, mais le signal passera comme il
faut.
La masse est un point commun à plein d’appareil où le potentiel est normalement de 0 volt, il ne
faut pas confondre la masse et la terre (un potentiel fixe de la terre). La variation de signal se
retrouvera dans le point chaud. On prend un fil blindé avec une tresse pour éviter les ondes
traversantes et celui-ci est relié à la masse. Le récepteur va récupérer le point chaud à travers une
résistance de charge. Les grandes longueurs de fil vont créer des capacités.
*Une «boucle de masse» apparaît lorsque vous connectez ensemble deux périphériques audio ou plus qui présentent des
potentiels de masse différents. Deux prises de courant peuvent, par exemple, provenir de différentes phases. Les
tensions ne sont jamais tout à fait les mêmes et vous pouvez entendre cette différence sous la forme d’un ronflement. Il
est donc préférable d’utiliser une seule prise de courant pour votre installation audio. Dans les grands bâtiments, il est
parfois impossible d’utiliser une seule prise. Si vous ne pouvez pas faire autrement et qu’une boucle de masse se
produit, il est possible de résoudre ce problème en utilisant une boîte de direct (DI) ou un isolateur de boucle de masse.
Vous utilisez des boîtes de direct (DI) pour connecter un appareil asymétrique sur une entrée symétrique. La plupart des
boîtes de direct possèdent également une fonction «Ground Lift» conçue pour interrompre la boucle de masse. Les
isolateurs de boucle de masse possèdent un transformateur qui convertit le signal électrique en champ magnétique et
inversement. Étant donné qu’il n’y a pas de contact physique, la boucle de masse est cassée.
4. L’alignement des niveaux en production
Comme indicateurs de niveaux, nous avons le vu-mètre et le crête-mètre en dB u mais pas tous le
temps suivant le signal que l’on met. Et permet d’avoir une idée visuelle de ce que l’on entend. Le
crête-mètre va avoir un temps de monter d’environ 10ms et affichera le résultat exact en dB. Le vu-
mètre mettra beaucoup plus de temps et n’arrivera jamais sur une courte période à la valeur réel, il
lui faudra plus de temps. Leur différence sont leur constante de temps normalisé. Dans le crête-
mètre, on aura une impression de puissance moins importante car notre oreille à aussi une constante
de temps qui n’est pas instantané. Le vu-mètre sera plus en adéquation avec notre constante auditive
(qui n’est que peu/pas lié à l’âge). Pour l’oreille ce sera d’environ 50ms mais ce sera différent en
fonction de la fréquence, on peut arriver à 2-3ms dans les aigus. Le vu-mètre a donc été fait
empiriquement. L’intérêt d’avoir les deux et que nous avons des informations complémentaires.
Ce qui est important à comprendre, c’est que la correspondance de dB u avec ce que nous indique un
vu-mètre ou un crête-mètre va être complètement dépendant du type du signal. Le vu-mètre ne va
pas nous indiquer la même valeur pour des signaux différents alors qu’ils auront peut-être la même
valeur en dBu. Sur un signal sinusoïdale, pas musicale, 0 VU = +4 dB u. Sur un signal musical,
statistiquement, c’est autour de +12 et ça correspond au niveau de sortie nominal d’une console.
Le crête-mètre est utile pour voir si l’on ne sature pas et mesurer les crête de modulation où 0 crête
= +12 dBu. Le temps de descente sera d’environ 1,5 seconde car il faut pouvoir le visualiser. Il a un
temps de monter instantanément et un temps de descente long.
Le niveau d’alignement préconisé par les normes AES ou ITU entre la console au Portugal et à
Strasbourg par exemple, est de s’aligner à +2 VU, -6 au crête-mètre correspondant à +6 dB u en
sortie de console. On s’aligne néanmoins généralement à 0 VU. Tout ceci sur un signal à 1000Hz, et
non pas un signal musical, ça dépend toujours du signal. Le crête-mètre permet de voir
essentiellement si tu satures. Le vu-mètre donne une indication de l’impression subjective de
niveau. Maintenant, nous lisons de plus en plus des nu-mètre sur les DAW, donc des vu-mètre
numérique. Ici, nous parlons uniquement pour l’instant d’analogique (console et magnéto à bande).
Les LUFS sont un niveau de ressenti, lié à la fonction de temps un peu comme le RMS, c’est une
moyenne. Il faut considérer que le VU-mètre est un volt-mètre qui correspond à notre impression
auditive et à l’évolution du signal.
5. Les traitements de signal analogique
Nous avons premièrement les traitements fréquentiels avec les filtres passe-haut et passe-bas, les
filtres passe-bande et/ou Baxendal et des filtres paramétriques. En analogique, quand on modifie
l’amplitude d’un signal à l’aide d’un traitement, on modifie sa phase. On fait varier autour de cette
modification fréquentiel des modifications temporelles, les deux sont liées, ce sont des filtres IIR.
Lorsqu’on fait des égalisations de local, c’est intéressant de toucher à la phase.
Par exemple, sur une coupure, on va prendre plus de retard sur un filtre en pente raide qu’en pente
douce. Lorsque l’on fait un filtre de ce type là, on va venir modifier les rapports d’amplitude et de
temps entre les fréquences, le résultat sera donc auditif.
*Les sons (qu’ils soient instrumentaux, naturels, vocaux, etc.) sont rarement des sons purs, excepté les ondes
sinusoïdales obtenues par synthèse. Ce qui nous permet d’identifier un son (on parle de timbre ou de couleur), c’est le
mélange de sa fondamentale et de ses harmoniques. La fréquence fondamentale est la fréquence principale, celle qui
détermine la «note» du son produit. C’est aussi la plus forte en matière de volume. Les autres fréquences, qui
contribuent à la «personnalité» du son, sont appelées harmoniques. Vous ne les entendez pas comme des notes séparées
et elles ne sont pas aussi fortes que la fondamentale. Il est important de bien comprendre cette notion quand on en vient
à l’égalisation de vos pistes. Parce que cela signifie que la plupart des sons sont porteurs d’informations sur un
éventail assez large du spectre fréquentiel, et pas uniquement autour de leur fondamentale. Donc un son avec une
fréquence fondamentale haute contiendra aussi de l’information dans le bas de son spectre. Il est crucial d’avoir ça à
l’esprit pour réaliser les meilleurs mixes possibles.
Nous avons ensuite les traitements temporels avec les compresseurs, les limiters, le phasing, les
noise-gates, les expanseurs de dynamique et les ducker.
Un noise-gate fonctionne un peu à l’inverse d’un compresseur, tant qu’il n’y a pas de niveau en
entrée suffisant, il n’y a rien en sortie. Un noise-gate peut servir par exemple à couper la fin d’une
réverbération. Attention, un compresseur ne va pas rajouter de l’énergie, car celle-ci est reliée d’une
certaine manière à la dynamique. Si tu souhaites qu’un son apparaisse plus fort, avec plus de patate,
ce sera plutôt lié à son volume.
1. Principe général
Nous enregistrons un signal analogique et nous entrons dans une carte son. Nous entrons donc tout
d’abord dans un filtre anti-aliasing (analogique) qui permet de filtrer les fréquences élevées dans
l’extrême aigu. Une fois ces fréquences éliminées qui peuvent amener à des perturbations, on va
arriver dans un convertisseur analogique-numérique (ADC). On va digitaliser et échantillonner le
son analogique, en passant d’un signal continu à un signal discontinu. L’ADC va «hacher» le signal
à une certaine fréquence d’échantillonnage et le rendre discontinu au niveau temporel.
*F.A.R est un filtre anti-repliement pour éviter le phénomène de repliement de spectre qui est totalement numérique et
donc uniquement mathématique.
Le codage de canal et de voie ne sera pas le même en cinéma qu’en musique. Attention car le
numérique n’est pas composé uniquement de 0 et de 1. Il y a aussi entre temps certaines corrections
d’erreurs à l’aide d’algorithme pour replacer correctement le binaire. Dans la restitution, nous
aurons le lissage et le CNA (convertisseur numérique-analogique).
Le bit-float est un ajustement du nombre de bit variable en fonction du niveau du signal moyen que
l’on va détecter. L’intérêt du bip flottant est parce que l’on est en dB, on est pas linéaire en niveau.
Dans les niveaux les plus élevés on a besoin de moins de bit que dans les niveaux les plus faibles.
En 32-bit float, on sera peut-être en 32 dans les niveaux faibles et 16 dans les niveaux élevés à
cause de la courbe logarithmique des dB.
Pour réduire le bruit de quantification, on va augmenter le nombre de bit et donc réduire les
escaliers. L’application en cinéma, chez Dolby par exemple, on codé le signal directement sur la
pellicule dans les perforation, on codait le signal du LFE en 8-bit car il n’y avait que du grave mais
à ne pas faire avec de l’aigu.
3. Lecture du signal, lissage