Blog   Forum

Bits, DR, dynamique, rapport signal/bruit, etc

Cet article est constitué d’informations techniques disponibles par ailleurs sur le net. Il m’a semble intéressant de les regrouper en y ajoutant quelques commentaires plus personnels.

Le « numérique » est source de très nombreuses confusions, et je ne suis pas certain d’en être moi-même aujourd’hui totalement exempt.
Pour appréhender les questions du numérique, il me semble essentiel de connaitre un minimum de choses sur la façon dont une piste audio est générée. C’est à dire du côté des convertisseurs Analogique-Numérique à la prise de son, et c’est un domaine qui intéresse très peu (et c’est compréhensible) les « audiophiles ».

Il semble exister des nombres « magiques » mais dont l’origine est très différente, comme 96 ou 6. Y a-t-il derrière ces chiffres un grand horloger ou n’est-ce que l’effet du hasard? Peu importe. L’ésotérisme, ce sera pour plus tard.

Les bits

Si avec 10 décimales, pi=3.141592654
avec 0 décimale pi=3, avec 1 décimale pi=3.1, avec 5 décimales pi=3.14192

Si l’on veut représenter un nombre fini de valeurs régulièrement réparties entre 0 et 1, cela revient par exemple à choisir le nombre de décimales retenues. Avec 1 décimale, on va avoir 0, 0.1, 0.2, 0.3, 0.4, 0.5 0.6, 0.7 0.8 0.9 et 1.

Mais en informatique, on préfère de loin la base 2 à la base 10, et on préfère aussi les entiers aux nombres avec virgule. Le nombre de bits est alors exactement équivalent au nombre de décimales précédemment décrit.

En base 2, on n’a que 2 « valeurs », 0 et 1. Avec 1 bit, on n’a que deux valeurs possibles, 0 et 1.
Avec 2 bits, on a 0, 1, 10 et 11, soit 4 valeurs possibles.

Avec le fameux 16 bits, on a 2 puissance 16 valeurs possibles, soit 65536.
Avec 24 bits, on a 2 puissance 24 valeurs possibles, soit 16777216 valeurs.
Avec N bits, on a 2N valeurs possibles.

A ce stade, il faut bien saisir qu’une « piste audio » est la représentation d’un signal audio avec un système à N bits. On est bien dans le domaine de conversion Analogique-Numérique.

Les dB

Une première source de « confusion »trouble » est le terme « dB ». La définition rigoureuse est 10 fois le log du rapport de deux puissances, c’est donc une grandeur « sans unité », le dB est l’unité d’une grandeur qui n’en a pas…

Quand il s’agit de « volume sonore », je préfère utilisé le terme dBSPL, cela évite les méprises.

Mais il existe aussi les « dBFS », dB Full Scale. Cela n’a de sens qu’en numérique, ces dBFS sont toujours associés à une représentation d’un système à N bits.

0 dBFS est par définition associé à la valeur la plus grande. Avec 16 bits, 0 dBFS est associé à 65535. Avec 24 bits, 0 dBFS est associé à 16777215.

A chaque valeur en dessous de la valeur maximale, les dBFS vont décroitre et seront toujours négatifs. Une valeur positive de dBFS n’a pas de sens. Voici comment on passe d’une valeur n au dBFS associé en 16 bits.

dBFS = 10 log(n2/(655352) = 20 log(n/65535)

En anticipant sur les DAC, un bit va être associé à une tension. Une puissance c’est une tension au carré, d’où le carré dans la formule ci-dessus.

On va retrouver par exemple pour la « valeur milieu » 65535/2″ en 16 bits:
20log (0.5) = – 6 dBFS (en ayant arrondi)

En 24 bits, on trouvera la même chose pour la valeur milieu: – 6 dBFS.

Première apparition du nombre « magique » 6…

Mais la jungle des dB ne s’arrête pas là.
Pour des raisons en fait assez complexes, pour un système numérique à N bits représentant un signal (sans question d’audio du tout!), il existe un « rapport signal/bruit numérique ». Ce rapport signal/bruit numérique s’exprime en dB, et c’est approximativement 6xN.

Seconde apparition du 6.

Mais ce rapport signal bruit numérique n’est associé à aucune électronique, à aucun signal analogique, à aucune reproduction sonore de la piste. Il existe un « bruit » numérique intrinsèquement attaché à chaque piste et qui provient du passage d’un signal à sa représentation par un système à N bits. Et rien d’autre, y compris en dehors de l’audio.

Je fournirai plus loin une video de Jipi Horn explicative ainsi qu’un document. J’en ferai une synthèse à la hache pour ceux qui n’auraient pas le temps de suivre en détails les calculs de Jipi Horn ou du document.

DR

DR signifie « Dynamic Range ». C’est un sujet qui ne devrait pas poser de problèmes de compréhension insurmontables, qui en plus peut être « vérifié » avec un voltmètre et un sonomètre, pour peu qu’on ne rejette pas en bloc tout ce qui est « théorique » tant les résultats sont très surprenants. Mais il existe quand même quelques écueils de compréhension.

Tout est expliqué ici.

Au cas où le site ne soit plus en ligne, j’en ai fait un pdf.

Le petit « miracle » lié au numérique, est que l’on peut calculer assez précisément la puissance utilisée pour reproduire une piste en fonction des caractéristiques des enceintes, de la distance d’écoute, d’une des caractéristique de la pièce (distance critique), et du volume moyen d’écoute souhaité.

Une des « difficultés » est de saisir ce qu’est un volume moyen d’écoute. C’est pourtant ce qui est mesuré par un sonomètre sur une plage de temps donnée.

La seconde difficulté est d’admettre qu’il faut des puissances étonnamment élevées pour passer les pics d’une piste « bien enregistrée » et d’éventuellement remettre en cause ses choix d’amplification et d’enceintes. Quant aux amplificateurs peu puissants mais forts en courant, il s’agit d’une légende audiophile qui consiste à effectuer une compression dynamique de la piste pour pouvoir passer les pics. On n’écoute pas la piste, mais une version compressée, par exemple par les transfos de sortie d’amplificateurs à tubes (je n’ai rien contre et j’en ai possédé un certain nombre).

Exemple pour ma propre configuration, dernière piste de (disponible sur Qobuz):

Son DR est de 20, pour écouter au niveau moyen de 85 dBSPL, enceintes Vivid G2S2 de 89 dB de rendement (encore des dB…), 6 ohm d’impédance, à 3 mètres, distance critique de 3 mètres, la puissance moyenne nécessaire est de 4.7 Watt.
Mais pour passez ses pics, il faut… 237 Watt. Et là, ou bien on admet, on réfléchit, on re-écoute avec une amplification adaptée, on mesure éventuellement, ou bien on rejette en bloc. Je n’ai jamais rencontré de comportement intermédiaire chez les audiophiles.

Cette piste est « difficile » pour cette première raison, mais aussi parce qu’elle comporte des passages très « doux ». Si le bruit de fond de la pièce d’écoute et/ou des électroniques est élevé, on va avoir tendance à augmenter le volume pour simplement entendre ces passages, mais alors on peut alors se retrouver à des niveaux sonores quasiment insupportables pour les passages forts.

Les calculs peuvent être faits en ligne ici.

Troncature et dither

Imaginons que l’on ait une représentation d’un signal par un système à 2N bits et que l’on veuille passer à un système à 2M bits. Par exemple, transformer une piste audio 24/44 à 16/44 pour fixer les idées;

Ce faisant, on va nécessairement faire des approximations sur les valeurs à l’arrivée parce que cela revient à diviser toutes les valeurs du système à 24 bits par 28=256 et que la division ne va pas « tomber juste » sauf pour certaines valeurs. On va donc commettre une « erreur », une approximation que l’on appelle erreur de troncature. La question qui peut paraitre iconoclaste est est de décider comment on va choisir la valeur (entière) à l’arrivée après cette division. Bah, on n’a qu’à prendre la valeur la plus proche! Et bien non. En faisant comme ça, on crée de chouettes distorsions d’origine numérique pour toutes les fréquences et cumulatives qui plus est. On utilise alors des algorithmes de « dither » qui vont remplacer ces distorsions par un bruit blanc à -96 dBFS pour du 16 bits à l’arrivée, à -144 dBFS pour du 24 bits.

Quand cela est-il utile?

Les prises de son sont faites a minima en 32 bits (24 bits à l’origine du CD). La création d’une piste de CD en 16 bits va donc devoir passer le nombre de bits de la prise de son de 32 ou 24 bits à 16 bits. Utiliser du dither est alors indispensable.

Lorsqu’on utilise de la « correction numérique », on va passer la piste de 16 ou 24 bits à a minima 32 bits, voire 64 bits, voire 64 bits flottants pour pourvoir des calculs sans accumulation explosive d’erreurs d’arrondis. Le « retour » à une piste 24 bits (tous les DAC actuels travaillent sur 24 bits) doit s’accompagner de dither, même si les effets de non-dither vers une piste 24 bits sont moins spectaculaires que pour du 16 bits.

La non utilisation de dither est sans doute à l’origine d’un certain nombre de catastrophes lors de la production initiale de CD pendant quelques années. Ecoutez les 3 versions de Thriller de Michaël Jackson…

Bruno Putzeys, le papa des Kii, le rappelle d’ailleurs dans une interview: « l’oubli » du dither par un certain nombre d’ingénieurs du son et de concepteurs d’enceintes amplifiées avec DSP qui travaille a minima en 32 bits (Bruno Putzeys utilise du 64 bits flottants, Roon aussi…) est problématique.

Le rapport signal bruit numérique

On entre ici dans quelque chose de vraiment complexe et difficilement compréhensible tant qu’on n’a pas mis le nez dedans. Bien que cela ait un intérêt pratique inexistant, il m’a semblé utile de fournir quelques informations à ce sujet pour tordre le cou à certaines idées reçues.

On ne peut pas parler de rapport signal/bruit d’une représentation en N bits par 2N valeurs. Tout simplement parce qu’un rapport signal/bruit est le rapport entre le signal le plus fort et le signal le plus faible (sans distorsion ou autre altération) et que dans une représentation par 2N valeurs, 0 est la valeur la plus faible possible et qu’elle est parfaitement définie. Le rapport signal bruit serait alors infini.

Mais si l’on regarde la valeur la plus petite possible non nulle en 16 bits, c’est 1. Son dBFS associé est donc:
20log(1/65535) = – 96.3 dBFS

Première apparition du nombre magique « 96 ».

L’écart maximal, en 16 bits, entre le signal non nul le plus faible et le signal le plus fort, est donc de 96 dB. Ce qui est déjà énorme!! J’ai la chance d’avoir une pièce dont le bruit de fond mesuré est de 17 dBSPL, ce qui sous réserve que ampli, enceintes, pièce et oreilles le permettent, le niveau maximal atteignable est alors de 113 dBSPL.

Venons en au coeur de ce chapitre: il existe un bruit intrinsèque à la représentation d’un signal (audio ou pas) par un système de 2N valeurs.
En allant brutalement au résultat, en faisant quelques hypothèses pas trop simplificatrices, et dans le cas d’un signal sinusoïdal, le rapport signal/bruit est donné par la formule suivante:

SNR = 6.02xN + 1.76

Avec N = 16, on trouve SNR = 98.08 dB
Mais pour un signal triangulaire, on a:

SNR = 6.02xN

Et pour 16 bits, on trouve… SNR = 96 dB.

Le rapport signal/bruit de la représentation d’un signal par un système à 2N valeurs dépend du signal lui même et se trouve quelque part autour de 96-98 dB.

Mais…ce bruit, par des technologies de noise shaping (trop complexe à aborder ici), on sait en reporter une bonne partie au delà du spectre audible par sur-échantillonnage.

On peut ainsi monter sans difficulté ce rapport signal bruit à 110 dB, voire plus.

Mais il faut bien saisir que ce bruit intrinsèque à la représentation par 2N valeurs n’a pas grand chose à voir avec l’écart de niveau possible de 96 dB en 16 bits.
Avec du noise shaping, on diminue ce bruit intrinsèque jusqu’à 110 dB de rapport signal/bruit, alors que l’écart maximal de niveau reste à 96 dB en 16 bits.

Document à ce sujet. (Lien original).

L’équivalence rapport signal/bruit analogique et nombre de bits, par exemple sur ASR, est difficilement compréhensible. Par exemple pour le Tambaqui il est mesuré un excellent rapport signal/bruit analogique de 120 dB, et il est dit que c’est 20 bits de résolution, en divisant 120 par 6. Mais pourquoi donc?

Alpha-Audio me semble plus raisonnable dans ses commentaires de mesures, en disant simplement par exemple que le niveau de bruit du MSB Premier est de -165 dB, sans chercher à passer à des bits…

16 bits, 24 bits, 44, 88…

Disposer d’une piste en 24 bits donne l’avantage d’une plus grande précision des échantillons et devrait donc permettre au DAC de « mieux » reconstruire un signal analogique, même si les différences de tension associées à l’augmentation de la définition reste faible. En profiter demande un excellent rapport signal bruit global (voir § suivant). De la même manière, des échantillons au delà du 16 ème bit peuvent arriver jusqu’aux enceintes, malgré une très faible tension, et fournir un peu plus de signaux faibles et de « détails » ou d’ambiance.

En ce qui concerne la fréquence d’échantillonnage, sujet non abordé dans cet article, avec des micros qui plafonnent dans l’immense majorité des cas à 20 kHz, il n’y a pas un fifrelin d’information supplémentaire en fréquence dans le 24/176 par rapport au 24/44, Nyqist et Shannon sont passés par là.

Mais comme vu plus haut, on peut avoir utilisé du noise shaping pour diminuer le bruit numérique intrinsèque en augmentant la fréquence d’échantillonnage. J’ai pourtant des doutes là dessus. Usuellement, c’est un Master à « haute fréquence » qui est d’abord produit, par exemple en DXD (352.8 kHz), Master dont les versions à plus faible fréquence sont issues.

Depuis plusieurs années, en dehors du streaming qui permet de découvrir facilement les nouvelles production, j’essaie d’acquérir les albums dans leur version Master quand elle est indiquée (notamment sur NativeDSD). Juste un principe de précaution.

Rapport signal bruit global

Pour ce thème, ce sont juste quelques pistes de réflexions et informations
C’est, il me semble, une caractéristique essentielle d’une « chaine » hifi. Dans le vocabulaire audiophile, c’est ce que je pense se rapporter le plus à la « transparence ». Les bits le plus en direct de la piste aux enceintes.

On oublie souvent, je pense, que le bruit (analogique) créé par un DAC ou un préamplificateur analogique va être… amplifié.

Pour qu’un bruit n’arrive pas aux enceintes, je ne vois que trois approches:
– ne pas le créer
– le minimiser
– le filtrer

La première source de bruit n’est pas le DAC et sa partie conversion, mais tout le matériel informatique qui y est connecté ou intégré. Ce bruit est injecté dans le système. Va-t-il jusqu’au enceintes? Peut-il être minimisé? Filtré? A chacun de se faire son idée.
Quand par exemple, on essaie des switchs les uns après les autres, parfois de manière un peu stakhanoviste, on essaie simplement de minimiser le bruit créé par ce maillon, sans tenir compte de ce qu’il y a « avant ». Le rationnel de la démarche me parait insuffisant quand je ne connais qu’un seul switch qui ait des propriétés de filtrage de bruit par conception (Ansuz).

Voici une série de mesures de bruit de … switchs.

Quand l’ordinateur qui lit les pistes est « dans » le DAC comme dans les Esoteric N05XD et Esoteric N01XD, cet ordinateur est lui même source de bruit. La comparaison des schémas de ces deux appareils montrent clairement des différences de ce point de vue. 2 unités de calculs pour le 01, 1 seule qui sert à la fois aux traitements numériques et à la conversion dans le 05. Des isolations présentes dans le 01, absentes dans le 05.

MSB, qui de mon point de vue conçoit et fabrique les meilleurs DAC actuellement a été jusqu’à concevoir une interface qui isole totalement le DAC du monde informatique par fibre optique, la lecture des pistes restant en dehors du DAC, DAC qui n’en reçoit que les bits par liaison optique dans un protocole propriétaire.

Le second maillon possible après le DAC est un préampli analogique. Il est très complexe (et assez onéreux même en Chine) de concevoir un préamplificateur analogique dont le rapport signal bruit soit excellent.

En dehors du vinyle, un préamplificateur analogique ne sert qu’à… diminuer le volume de sortie du DAC.

Un préamplificateur entre un DAC et un bloc de puissance ne peut que dégrader plus ou moins fortement le rapport signal bruit global. Un préamplificateur va commencer par amplifier la sortie du DAC et donc amplifier le bruit généré par le DAC pour ensuite atténuer ce signal global, le tout en générant lui même du bruit, le tout allant ensuite être amplifié par le bloc de puissance.

D’un autre côté, un volume numérique « bien fait » (en 24 bits a minima pour des pistes 16 bits, et en 32 bits minima pour des pistes 24 bits, et avec dither) ne perd strictement rien, ni résolution, ni précision, jusqu’à des niveaux d’atténuation très élevés (-48dBFS).

Quand il arrive que le volume numérique d’un DAC semble amener des dégradations, il faut sans doute chercher ailleurs que dans le volume numérique lui-même.
Par exemple, toutes les caractéristiques des étages de sortie des DAC sont données en sortie « plein pot » (impédance notamment…quand elle est fournie). Mais avec un niveau de sortie atténué et non plus « plein pot », il arrive très souvent que des DAC aux étages de sortie « moyens » voient leur impédance de sortie varier assez fortement, ce qui dégrade bien les performances en fonction du volume.
Mais il existe des DAC très abordables, comme le Gustard X26Pro dont l’étage de sortie est particulièrement bien conçu et qui peuvent sans problème directement driver un bloc de puissance, en faisant l’économie de la perte de transparence d’un préamplificateur.

Vient ensuite l’amplification qui va… amplifier tout le bruit en amont.

Pour ceux qui utilisent d’autres dispositifs entre DAC et amplification (AD et filtres pour de la multi-amplification par exemple), il reste à vérifier si le bruit créé par ces dispositifs vaut la peine par rapport au gain amené par ces dispositifs.

En ce qui concerne la multi-amplification, j’avoue ne pas être un grand fan pour cette raison. Les filtres passifs utilisés sur des enceintes modernes sont à pente très raide qui sont optimaux sauf pour la mise en phase des HP, ce qui peut se faire en amont du DAC par convolution.
Par ailleurs, il existe à présent de nombreux amplificateurs de puissance à prix très contenu et aux performances mesurées et écoutées remarquables.
Question indiscrète au adeptes de la multi-amplification: le gain à l’écoute provient-il de la multi-amplification ou plus simplement du changement d’amplification?
Cela ne signifie naturellement pas qu’il n’existe pas de systèmes multi-amplifiés remarquables!! Les Kii en sont le plus bel exemple. Mais pour les Kii, il n’y a pas que la multi-amplification qui est à l’origine de leurs qualités.

Pseudo conclusion

Ai-je fait le tour de la question? Bien sur que non!! Mais il me semble utile d’avoir en tête toutes ces questions avant de commencer à parler de technologies de conversion par exemple.