24. août 2018

Intelligibilité de la parole dans les systèmes de sonorisation

Article du "vdt-Magazin"

Intelligibilité de la parole dans les systèmes de sonorisation

"Désolé, je n'ai pas compris." Si une telle pensée traverse la tête d'un auditeur, il y a de fortes chances que la sonorisation ne fonctionne pas comme prévu - que ce soit dans une salle de concert ou dans une gare. La mesure de l'intelligibilité de la parole ne fournit pas seulement des informations distinctes sur l'état actuel d'un système de sonorisation, elle fournit également des indices importants pour l'optimiser.

Le 24 décembre 1915, le premier système de sonorisation à grande échelle au monde fut utilisé pour amplifier la parole et la musique lors d'un événement public à San Francisco. Environ 100 000 auditeurs ont reçu des informations vocales claires et intelligibles. Il est bon de souligner que les 100 dernières années ont conduit à la perfection ultime des systèmes de sonorisation et que la mauvaise intelligibilité de la voix est un vestige d'une époque révolue, mais la pratique quotidienne de la sonorisation est différente. La difficulté de compréhension du discours et un son généralement désagréable font encore partie du répertoire de certains systèmes de sonorisation fixes ou utilisés en tournée. Il est agaçant de payer le prix fort pour voir son groupe préféré et que les voix soient à peine intelligibles, mais c'est clairement dangereux et même illégal si les alertes vocales ne sont pas compréhensibles.

Qu'est-ce que l'intelligibilité de la parole? 
Le terme Intelligibilité de la parole décrit combien de la clarté et du caractère distinctif de l'information parlée sont préservés lors de la transmission par un système de sonorisation. Au début de l'histoire de l'audio, des tests manuels ont été utilisés pour évaluer l'intelligibilité de la parole des systèmes de sonorisation : Un orateur, depuis son pupitre, lisait des mots et des syllabes dénués de sens, qui étaient ensuite écrits par l'auditoire aussi correctement que possible. Le résultat était donné sous forme de pourcentage, où 100 % aurait été un score parfait. Dans les années 1940,les laboratoires Bell développaient les premières méthodes de mesure électronique pour l'intelligibilité de la parole. Les ALCons (Articulation Loss of Consonants) font référence à la perte sur l'articulation des consonnes, où le pourcentage représente les mots ou consonnes mal compris. Une valeur ALCons de 0,00% signifie donc une transmission sans erreur (pas de consonnes perdues).

Mesure de l'intelligibilité de la parole avec le  XL2 NTi Audio
Mesure de l'intelligibilité de la parole avec le XL2 NTi Audio

Les méthodes de mesure modernes, telles que STI (Speech Transmission Index) ou STIPA (Speech Transmission Index of Public Address Systems), tentent de représenter le résultat par un nombre unique, en incluant autant de facteurs d'interférence que possible ( comme dans la réalité). Le résultat est exprimé sous la forme d'une valeur numérique (STI) comprise entre 0,00 (aucune intelligibilité) et 1,00 (intelligibilité vocale parfaite). Une bonne amplification sonore donne des résultats compris entre 0,45 et 0,65, même dans les pièces acoustiquement défavorables et entre 0,70 et 0,90 dans les pièces acoustiquement bonnes. Pour comparaison : une bonne chaîne de transmission en studio permet d'obtenir des valeurs STI typiques comprises entre 0,90 et 0,97 (mesurées par l'auteur) entre le microphone de la cabine et le moniteur de la salle de contrôle.

Amis et ennemis de l'intelligibilité de la parole
Techniquement parlant, une bonne intelligibilité de la parole est toujours donnée si la profondeur de modulation de la parole ou du signal de test est maintenue sans modification. Le signal est transmis sans aberrations et sans masquage de l'amplitude, dans le spectre et sur l'axe des temps.

Une bonne intelligibilité de la parole a de nombreux ennemis, mais aussi des amis puissants. Voici un aperçu des pièges les plus fréquents, d'où la solution peut être tirée.

L'acoustique de la pièce est l'un des facteurs d'influence les plus importants. Des temps de réverbération longs (RT60) ainsi que des réflexions tardives (environ 80 à 150 ms) agissent comme un "brouillage" qui obstrue l'amplitude de modulation utile du signal vocal en le couvrant, rendant ainsi plus difficile la reconnaissance de l'information.

Des haut-parleurs mal positionnés avec des caractéristiques directionnelles inappropriées peuvent fournir un son pour la pièce, en direction de murs opposés et de façades vitrées, mais pas directement vers l'auditeur. En conséquence, le son directement émis par les haut-parleurs à la position de l'auditoire peut être proportionnellement plus faible que le niveau de bruit (réflexions, interférences), l'intelligibilité de la parole diminue.

Les systèmes de sonorisation sous-dimensionnés qui ne permettent pas de couvrir le bruit d'un auditoire bruyant ou dont le message transmis se fond dans le bruit d'un train entrant sont un autre problème. Encore une fois, le rapport signal/bruit s'est détérioré et l'intelligibilité de la parole a diminué. Les systèmes de sonorisation de taille suffisante doivent pouvoir fournir au moins 10 à 15 dB de plus que le bruit de fond le plus fort, avec des limites naturelles (protection auditive) et des effets de masque gênants à prendre en compte.

Les effets de masquage psychoacoustique contribuent également à la perte de l'intelligibilité de la parole. La parole prononcée peut être couverte par , non seulement, des sources de bruit externes, mais aussi par la parole elle-même, en particulier à des niveaux de voix très élevés. Les composantes basses fréquences de la parole peuvent masquer les sons plus discrets et plus aigus et ainsi empêcher leur perception. Les distorsions linéaires et non linéaires du trajet de transmission constituent une autre perturbation. Ces perturbations ne sont pas seulement causées par un écrêtage du signal et de mauvaises enceintes, mais souvent par un traitement du signal bien intentionné, mais mal mis en œuvre. Une compression trop importante de la dynamique, des limiteurs surdimensionnés, des amplifications ou coupures inutiles dans la gamme de fréquences et une réduction trop avare des données peuvent aggraver l'intelligibilité de la parole.


Meaning of STI-values in practice
Signification des valeurs STI dans la pratique
 

Alors méfiez-vous ! Des lectures accompagnées musicalement dans d'anciens hangars d'avions, du théâtre d'improvisation dans des piscines vides, des annonces sur les quais lors de l'arrivée d'un train, dans tous ces cas, une planification très précise et un effort technique considérable sont nécessaires pour atteindre une intelligibilité raisonnable ou du moins tolérable de la parole.

---
© 2018 par Karl M. Slavik
Texte: Karl M. Slavik

Tous les droits de cet article, y compris la photo de présentation, appartiennent à vdt-Magazin. Le contenu de cet article ainsi que le téléchargement en pdf ne peuvent pas être utilisés à des fins commerciales sans l'autorisation de vdt-Magazin.

Vous voulez lire l'article en entier? Téléchargez l'article!

Vous voulez en savoir plus sur la mesure de STI?

Visitez le site de vdt-Magazin.

Categories: Audio-Acoustic Installations

Tags: