Inteligibilidad del habla o de la voz STI

La comprensibilidad de un anuncio (de emergencia) en un espacio público puede ser de suma importancia para los presentes. Especialmente en las estaciones de tren y aeropuertos, centros de congresos y centros comerciales, estadios, aulas y salones de clase, etc.

Para garantizar una buena inteligibilidad del habla, es necesario, por tanto, un procedimiento de medición objetiva que ofrezca resultados relevantes y reproducibles. La respuesta está en la medición del Índice de Transmisión del Habla (STI). (Englisch «Speech Transmission Index»)

¿Cómo funciona la medición de la inteligibilidad del habla STI?

Cuando se analiza la acústica del habla, se observa que los sonidos vocales humanos se caracterizan por dos rasgos:

  1. están en el rango de frecuencia de unos 100 Hz a 10 kHz
  2. contienen una modulación lenta (entre 0,63 y 12,5 Hz) de sus intensidades

En otras palabras, la transmisión de la información en el habla se logra mediante la modulación por parte del hablante de la señal de sonido que produce. Sin embargo, si estas modulaciones se pierden (parcialmente) durante la transmisión, la inteligibilidad se ve afectada.

Espectro del habla a largo plazo

Decisivo para una buena inteligibilidad del habla es cuán bien se conservan las modulaciones de la señal del habla transmitida. El método STIPA se basa en la medición de la función de transferencia de modulación MTF. Los resultados individuales del MTF de las bandas de octava indican lo bien que se conservan las modulaciones en las diferentes bandas de frecuencia. En cada banda de octava se prueban las relaciones de modulación mr1 y mr2 (para cada una de las dos frecuencias de modulación).

Ejemplos de la seña de banda de octava de 1 kHz con diferentes modulaciones

El enfoque para medir las 98 combinaciones es bastante complejo y difícil de aplicar en los dispositivos portátiles. Por lo tanto, se utiliza con menos frecuencia en la práctica. Sin embargo, este método completo de STI representa la solución más detallada para medir la preservación de la inteligibilidad del habla y se utiliza siempre que los enfoques alternativos no proporcionan resultados fiables debido a las condiciones ambientales desfavorables.

En la práctica, se utiliza sobre todo el método STIPA (Englisch   «Speech Transmission Index for Public Address»). Se limita a 14 de estas combinaciones y se ha desarrollado especialmente para los dispositivos portátiles. El resultado está disponible en 15 segundos con aproximadamente el mismo valor informativo.

Asumiendo que no hay ruido ambiental fuerte e impulsivo ni una fuerte distorsión no lineal, el método STIPA proporciona resultados con una precisión comparable a la del método STI completo. Sin embargo, si hay ruido ambiental impulsivo durante las horas normales de funcionamiento, la medición se suele realizar en un momento más conveniente, por ejemplo, durante la noche.

En el lugar de medición, el instrumento de medición determina la respuesta en frecuencia y la medida en que se han modificado las modulaciones transmitidas. Con la ayuda de un modelo psicoacústico se calcula el resultado normalizado de las STI. Un valor de STI = 1 representa la perfecta comprensibilidad, mientras que STI = 0 significa que el contenido de la información se ha perdido completamente.

 

El valor de STI Clasificación de calidad según la IEC 60268-16
0 ... 0.3 Malo
0.3 ... 0.45 Débil
0.45 ... 0.6 Apropiado
0.6 ... 0.75 Bueno
0.75 ... 1 Excelente

Alternativamente, el resultado también puede mostrarse como un valor CIS (Englisch «Common Intelligibility Scale»), que se calcula de la siguiente manera CIS = 1 + log(STI).

Desafíos

Los ruidos externos e impulsivos, presentes durante una medición de STI, se sobreponen a la señal de prueba y así falsifican el resultado. Por esta razón, la medición de la STI debe realizarse siempre en un entorno lo más silencioso posible, es decir, sin ruidos molestos como el ruido de una máquina o una persona.

La influencia del ruido se incluye entonces en el resultado medido de la STI:

  1. Determinación del ruido de fondo típico de una zona poblada.
  2. Medición de STI en una habitación vacía (por ejemplo, de noche).
  3. Vincular los dos resultados al resultado final.

¿Cómo funciona una medición de STIPA?

Determinar el nivel de ruido de fondo

El nivel de ruido de fondo se mide en condiciones típicas, es decir, en presencia de público. El LAeq se graba y almacena en resolución de octava durante 30 segundos (o más). Si se produce un ruido fuerte atípico durante esta grabación, la medición debe repetirse.

Medición de STI

La medición de STI suele darse generalmente en una habitación vacía, es decir, en ausencia de público (por ejemplo, durante la noche).

Nota: en ciertos lugares - por ejemplo, en una pequeña estación de ferrocarril en medio de una zona residencial - puede que no sea posible realizar mediciones de STI por la noche, ya que esto perturbaría la paz y la tranquilidad de los residentes. En tales casos, la medición de las STI se realiza durante el día, es decir, en condiciones normales de funcionamiento, mientras que no se requiere una corrección posterior del resultado de las STI con un nivel de ruido de fondo previamente registrado.

Hay dos alternativas para reproducir la señal de la prueba de STI.

  1. Alimentación electrónica en el sistema de sonido o megafonía, por ejemplo, por medio del generador de señales MR-PRO.

(Nota: Los reproductores de CD o MP3 son menos adecuados, ya que pueden mostrar fluctuaciones en la frecuencia de muestreo o cambiar la señal de prueba por compresión, lo que a su vez tiene un efecto negativo en el resultado de la medición)

  1. Acústicamente a través de un altavoz (parlante) ecualizado (por ejemplo, NTi Audio TalkBox), que reproduce la señal de prueba con un nivel de sonido calibrado de 60 dB - es decir, el nivel típico de un hablante humano - a una distancia de 1 m. Esta solución puede utilizarse en todos los lugares en que se introducen anuncios a través de un micrófono cuando es necesario, o en lugares donde la señal del habla no se amplifica electroacústicamente, como en las aulas.

A continuación, si hay un sistema de alarma de voz, se debe ajustar su volumen de sonido en el área de la audiencia. Esto debería ser al menos 6 dB, pero preferiblemente 10-18 dB por encima del nivel de ruido de fondo habitual. Cabe señalar que a un nivel de paginación de más de 80 dB, la inteligibilidad del habla vuelve a disminuir debido a los efectos de enmascaramiento.

Por último, las mediciones de las STI tienen lugar en varios lugares, a saber, dondequiera que la gente esté normalmente presente. Además, los puntos de medición deben estar a una distancia pertinente entre sí para obtener un resultado representativo. Las mediciones individuales de STI duran 15 segundos por posición y finalmente se promedian a un solo resultado para toda la habitación.

Comprobando los resultados de las mediciones

Comprobando los resultados de las mediciones Los resultados individuales que se obtengan deben ser comprobados para ver si son verosímiles. Esto sirve para detectar mediciones inválidas, por ejemplo, debido a un ruido ambiental impulsivo. Concretamente, pueden producirse los siguientes errores:

  • Relaciones de modulación inválidas en las bandas de octava individuales (mr1 o mr2 > 1,3)
  • Relaciones de nivel fluctuantes o condiciones impulsivas durante la medición (detección mediante la comparación de la primera mitad del período de medición con la segunda)

Nota: los analizadores acústicos avanzados como el XL2 realizan este análisis de forma independiente y muestran el resultado automáticamente.

Revaluación de los resultados de las mediciones

El siguiente paso es compensar los resultados de las mediciones de STI con el espectro del ruido de fondo habitual. Hay tres procedimientos disponibles para este procedimiento:

  1. La medición directa de la inteligibilidad del habla STI en funcionamiento normal, es decir, en presencia de un público (véase la nota de la sección "Medición de STI" mencionada anteriormente).
  2. La medición por separado del ruido ambiental típico y la inteligibilidad del habla en una habitación vacía, y su combinación matemática para determinar el valor de STI apropiado.
  3. La compensación del valor de STI medido en ausencia de la audiencia contra un conjunto adecuado de datos de ruido ambiental predefinidos (por ejemplo, de acuerdo con las normas) de la Asociación de la Brigada Federal de Bomberos de Austria, TRVB S 1458).

Nota: los analizadores acústicos avanzados, como el XL2, admiten cada uno de estos tres métodos y calculan o muestran el resultado automáticamente.

Promedio

La norma IEC 60268-16 recomienda que se promedien un mínimo de tres lecturas en cada punto de medición en presencia de ruido de fondo, con una desviación entre estos tres resultados no superior a 0,03 STI. Por otro lado, la norma alemana VDE 0833-4 requiere promediar al menos tres valores medidos si el primer valor de STI es < 0,63.

Aspectos específicos

En las emergencias, la gente tiende a levantar la voz y a hablar más alto. Este comportamiento se llama el efecto Lombard. Para cubrir esta situación, la señal de prueba de STI también puede ser reproducida a un nivel 10 dB más alto cuando se alimenta acústicamente. El TalkBox es compatible con esta aplicación especial de forma predeterminada.

Informe de conformidad con la norma

El último paso de un análisis completo de la inteligibilidad del habla se refiere a la preparación de un informe de conformidad con las normas. Esta actividad debe tener en cuenta la norma aplicable, como

  • AS 1670.4
  • CEN/TS 54-32:2015
  • DIN EN 50849:2017
  • IEC 60268-16
  • ISO 7240-19:2007
  • VDE V 0833-4-32:2016
  • VDE 0828-1:2017-11

Nota: STI Reporting Tool von NTi Audio (La herramienta gratuita de reporte STI de NTi Audio) combina los requisitos anteriores y entrega un reporte de conformidad con los estándares establecidos después de importar los datos de medición del XL2.

STIPA Reporting Tool

Medidas para mejorar la insuficiente inteligibilidad del habla

Sistema de alarma por voz

Las posibles razones que conducen a una mala inteligibilidad del habla son las deficiencias del sistema de alarma por voz, como la distorsión, los componentes defectuosos o los tiempos de propagación mal ajustados de los altavoces (parlantes). Para detectarlas, hay que comprobar las características del sistema e identificar los fallos. Para ello se necesita un generador de señales adecuado y un dispositivo de medición para las pruebas eléctricas y acústicas necesarias. El MR-PRO y el XL2 son ideales para este propósito, permitiendo que todas las pruebas relevantes se lleven a cabo de forma rápida y con un propósito.

Por otro lado, un diseño desfavorable del sistema de alarma por voz también puede contribuir a los bajos/malos valores de STI. Un ejemplo es la instalación de muy pocos altavoces (parlantes) en la habitación. En tal caso, los altavoces (parlantes) deben funcionar con el correspondiente volumen, lo que puede dar lugar a un campo sonoro no homogéneo con "agujeros" en un lado y zonas "demasiado altas" en el otro. Por lo tanto, en general, es aconsejable instalar varios altavoces (parlantes) distribuidos uniformemente en la habitación.

Acústica de la sala

Otra influencia importante en la inteligibilidad del habla es la acústica de la sala. Aquí, es principalmente decisivo si el sonido directo al oyente es dominante sobre cualquier reflejo de sonido. Mientras esto sea así, no es (probablemente) necesario tomar más medidas. De lo contrario, es decir, especialmente cuando se produce una reverberación muy fuerte, la inteligibilidad del habla puede verse afectada. Como contramedida, se recomienda entonces instalar objetos que absorban el sonido como cortinas, alfombras, muebles tapizados o paneles especiales.

Ruido ambiental

Si hay un fuerte ruido ambiental del exterior, la inteligibilidad del habla en el interior puede verse afectada. Esto siempre puede suceder si el lugar está insuficientemente protegido de las fuentes de ruido cercanas.

En esos casos, suele ser útil instalar mejores ventanas, barreras contra el ruido o medidas similares que desacoplen el área de la audiencia de la fuente de ruido externa.