Introducción al audio

septiembre, 2024

Introducción

La calidad de audio que podemos experimentar en una determinada habitación está condicionada por una serie de factores, como el procesamiento de la señal realizado sobre el audio, la calidad del altavoz y sus componentes, y la posición del altavoz. Las propiedades de la propia sala, como la reflexión, la absorción y la difusión, también son fundamentales. Si ha tenido la ocasión de visitar una sala de conciertos, se habrá fijado en que el techo y las paredes están adaptados para optimizar la experiencia acústica.

En este documento se ofrece información general de la terminología básica de audio y de las propiedades que afectan a la calidad del audio en una sala. También se ofrece una descripción de los distintos tipos de altavoces y se explica su ubicación óptima para una instalación de audio.

Frecuencia de audio

Frecuencias audibles

El oído humano es capaz, en teoría, de percibir frecuencias de 20 Hz a 20 kHz. El límite superior de 20 kHz se reduce con la edad, pero las frecuencias altas pueden seguir añadiendo “carácter“ al audio por medio de sobretonos con frecuencias más bajas. La voz humana, que es compleja y contiene muchos armónicos, se dispersa en frecuencias desde alrededor de 85 Hz (las mínimas para hombres) hasta alrededor de 8 kHz (sobretonos para mujeres). En telefonía, habitualmente solo se usa el rango entre 300 Hz y 3,4 kHz que, si bien permite que la voz sea audible, no produce un audio tan claro como la voz grabada en un rango de frecuencias completo.

Frecuencia de muestreo

La frecuencia de muestreo es el número de “instantáneas“ de audio tomadas por segundo a partir del audio de entrada analógica para su reconstrucción digital. En los archivos de audio y CD, una frecuencia de muestreo de uso frecuente es 44,1 kHz, que utiliza 44.100 muestras por segundo. La frecuencia de muestreo debe ser al menos dos veces superior a la frecuencia de audio de entrada más alta que deba reconstruirse.

Frecuencia y longitud de onda

Existe una sencilla relación inversa entre la frecuencia (f, en Hz) y la longitud de onda (λ, letra griega lambda, en m):

λ=v/f

La longitud de onda es igual a la velocidad del sonido (v=340 m/s en el aire) dividida entre la frecuencia. Para realizar una conversión rápida entre la longitud de onda y la frecuencia, también pueden utilizarse herramientas disponibles en línea. Por proporcionar algunos ejemplos de longitudes de onda de audio: una frecuencia de 20 Hz corresponde a una longitud de onda de unos 17 m (56 ft), mientras que una frecuencia más alta de 20 kHz corresponde a una longitud de onda más corta de unos 1,7 cm (0,7 in). Obviamente, las longitudes de onda de audio que se pueden percibir son muy variadas.

Acústica y dimensiones de la sala

Ecos

En una sala que esté completamente vacía, se producirá una reverberación o un retraso en el sonido. Esto se debe, como es lógico, a que todas las superficies planas son perfectas para reflejar las ondas de audio. Si se añaden tejidos y superficies desiguales, como sofás, cortinas y alfombras, se producirá menos reverberación, pero el sonido también se percibirá algo menos fuerte a causa de la absorción.

Las ondas sonoras suelen reflejarse varias veces antes de llegar a nuestros oídos. Sabiendo que la velocidad del sonido en el aire es de alrededor de 340 m/s, podemos calcular la distancia que ha recorrido un eco. Si escuchamos el eco 0,25 s después del sonido inicial, por ejemplo, significa que el sonido ha recorrido alrededor de 85 m (0,25 s x 340 m/s). Con cada reflexión, el audio se va desvaneciendo hasta dejar de ser audible.

El impacto de las dimensiones de la sala

El tamaño del espacio tiene una repercusión muy importante en la experiencia acústica. Con longitudes de onda de hasta 17 m para los graves más bajos, las ondas de sonido perceptibles en un espacio pequeño se reflejarán en las paredes antes de que puedan desarrollarse del todo. La consecuencia son resonancias y ondas estacionarias asociadas, lo que provoca la amplificación de algunas frecuencias (volumen alto) y la atenuación de otras (volumen bajo). Se necesita una sala bastante grande para oír graves sin distorsión.

El impacto de las resonancias en la calidad de audio percibida aumenta con el volumen del sonido. Con un volumen más alto, la reflexión interferirá de forma más acusada en el sonido de la fuente.

En espacios pequeños y a frecuencias bajas, podemos decir que el espacio domina el sonido, mientras que con frecuencias más altas, lo domina el altavoz. En salas pequeñas, la frecuencia de transición suele rondar los 300 Hz. Es la frecuencia en la que se puede afirmar que el audio pasa de comportarse como una onda a hacerlo como un rayo.

Soluciones profesionales para una acústica de salas neutra

Para reducir los molestos ecos en espacios grandes o vacíos, se pueden instalar paneles acústicos en el techo, en las paredes o en ambos. Los paneles se fabrican a partir de materiales que absorben el sonido y crean acústicas más neutras en espacios como centros comerciales, auditorios, oficinas y salas de conferencias. En todo caso, se puede conseguir un efecto similar mediante cortinas u otros tejidos de interior.

Los paneles acústicos suelen ser bastante eficaces para frecuencias superiores a 300 Hz, mientras que las prestaciones de absorción disminuyen de forma progresiva con las frecuencias más bajas.

Las cortinas y otros elementos de tela pueden mejorar significativamente la acústica de una sala.

Medidas del sonido

En esta sección se aborda la percepción humana del sonido, las diferentes medidas del sonido y cómo se relacionan entre sí.

Percepción humana del sonido y fon

Si bien el oído humano es sensible a todas las frecuencias que van de 20 Hz a 20 kHz, la sensibilidad varía según la frecuencia. Por lo tanto, los sonidos de una potencia específica se percibirán con diferentes sonoridades a diferentes frecuencias. La unidad de sonoridad, el “fon“, tiene en cuenta esta sensibilidad y, por ejemplo, un tono sinusoidal de 50 fon se percibe con la misma sonoridad en todas las frecuencias.

En la Figura 2 se muestran las curvas de igual sonoridad. Una línea representa el nivel de sonido que debe utilizarse para que dicho sonido se perciba en el mismo volumen para todas las frecuencias. Las distintas líneas representan valores de fon diferentes.

Niveles de presión del sonido necesarios en diferentes frecuencias para que un sonido se perciba con la misma sonoridad en todas las frecuencias. Las curvas proceden originalmente de la norma ISO 226:2003.

En las curvas resulta evidente que el nivel sonoro debe ser considerablemente superior en las frecuencias más bajas para que se perciba de la misma forma que en las frecuencias más altas. Esto se debe a que el oído humano es menos sensible a las frecuencias más bajas. El mínimo de las curvas se sitúa en torno a 2 kHz - 5 kHz, lo que significa que se trata del rango de frecuencia al que un oído humano es más sensible y en el que el oído puede descifrar mejor una conversación. Es también el intervalo de frecuencias de la voz humana.

Vatios

La unidad de potencia, vatio (W), resulta familiar por estar asociada a diferentes componentes eléctricos, como bombillas, cargadores de portátil y altavoces. Sin embargo, esta unidad se puede utilizar de diferentes formas y, en la terminología de audio, encontramos variedades como potencia instantánea, potencia promedio, potencia RMS (media cuadrática) y pico de potencia.

Se puede crear un amplificador que ofrezca 300 W durante un periodo de tiempo muy corto, por ejemplo, cuando se escucha un tambor, una explosión o cualquier otro tipo de audio con un transitorio corto y fuerte. De este modo, la potencia instantánea se incrementará muy rápido desde un nivel muy bajo a uno muy alto. Sin embargo, el mismo amplificador podría tener un valor nominal de 50 W para uso continuo, dado que el uso continuo genera mucho más calor, lo que afecta tanto a los componentes eléctricos como al rendimiento del amplificador.

El oído humano no percibe que un sonido de 10 W tenga el doble de sonoridad que uno de 5 W. De hecho, la potencia sonora tiene que ser 10 veces superior (50 W) para que el oído la perciba como el doble de intensa. Aquí es donde entra en juego el decibelio.

Decibelios

Dado que el sonido se percibe de forma no lineal, la mejor forma de medirlo y describirlo es mediante la unidad no lineal decibelio (dB). La duplicación (medida en W) de la potencia de sonido equivale a un aumento de 3 dB, y una duplicación de la sonoridad equivale a un aumento de 10 dB. En la Figura 3 se muestran fuentes sonoras conocidas y sus niveles de potencia en dB.

Niveles sonoros aproximados, en decibelios, procedentes de fuentes de audio familiares.

Un nivel de presión sonora expresado en la escala ponderada de dBA se ha compensado para tener en cuenta la percepción del sonido dependiente de la frecuencia del oído humano, como se explica en la sección 4.1. En la escala no ponderada de dB, un nivel de 100 dB a 100 Hz se percibirá, por ejemplo, con una sonoridad igual a apenas 80 dB a 1 kHz, mientras que 100 dBA se percibirá con la misma sonoridad en todas las frecuencias.

La unidad decibelio suele hacer referencia a un cambio relativo en la sonoridad. Para expresar un valor absoluto, se debe utilizar dB SPL. Un valor de 0 dB SPL es el sonido más suave que puede percibir el oído humano.

Nivel de presión acústica

El nivel de presión del sonido (SPL, por sus siglas en inglés) es el valor de media cuadrática (RMS) de las presiones sonoras instantáneas medidas, en dB, durante un periodo de tiempo determinado. El SPL no es un valor medio constante de sonoridad, sino una media de los valores de pico cortos.

Dado un valor de SPL para un altavoz, se asume que se mide para un tono de 1 kHz a una distancia de 1 m, si no hay otras indicaciones.

El nivel de presión acústica de una fuente de audio se reduce con la distancia de la fuente. El SPL, definido para que comience en 0 dB a 1 m de la fuente, disminuye en 6 dB cada vez que se duplica la distancia a la fuente, como se ilustra en la Figura 4. Sin embargo, para obtener información más detallada sobre los niveles sonoros de un determinado altavoz, debemos observar su respuesta polar, como se describe en la sección 6.1.

El nivel de presión del sonido de una fuente de audio se reduce en 6 dB cada vez que se duplica la distancia con respecto a la fuente.

Rango dinámico, compresión y sonoridad

La grabación tiene un amplio rango dinámico, lo que significa que hay grandes diferencias entre la parte más silenciosa y la más ruidosa.

Visualización de una grabación con un amplio rango dinámico, sin compresión.

Las partes más silenciosas se vuelven más ruidosas, mientras que las más ruidosas se mantienen igual o se vuelven menos ruidosas. Las diferencias entre picos y caídas son menores, lo que hace que percibamos esta grabación con una mayor sonoridad. Como puede verse en la Figura 6, el rango dinámico disminuye.

Visualización de la misma grabación anterior, ahora después de aplicar compresión.

La compresión de rango dinámico se suele aplicar en sistemas de audio para restaurantes, comercios y espacios públicos similares que reproducen música de fondo en un volumen relativamente bajo. Además de hacer que el volumen sea más constante, la compresión también hace que las partes más silenciosas del audio sean más audibles que el ruido ambiental.

Altavoces

Un altavoz puede tener diferentes formas físicas en función de su propósito. El componente que distribuye el audio, el controlador del altavoz, suele tener forma cónica, pero puede tener otros factores de forma si tiene que reconstruir frecuencias altas. Algunos altavoces tienen una dirección de sonido muy estrecha para lograr una presión sonora elevada en una sola dirección. Otros están diseñados para que el sonido sea lo más amplio posible. La capacidad de un altavoz para reconstruir la señal de audio depende de la frecuencia de la señal de audio.

Respuesta polar

El diagrama polar de la Figura 8 muestra cómo las distintas frecuencias se propagan de forma diferente a partir de un altavoz de ejemplo genérico, situado en el centro del diagrama. Revela que las frecuencias más bajas tienen una gran amplitud (incluso detrás del altavoz, a 180 grados), mientras que las frecuencias más altas son más direccionales.

Diagrama polar que muestra la distribución de un altavoz de ejemplo genérico (situado en el centro del diagrama). Las frecuencias más bajas tienen mayor amplitud (incluso detrás del altavoz, a 180 grados), mientras que las frecuencias más altas son más direccionales.

Sensibilidad del altavoz

La sensibilidad del altavoz es su capacidad de reproducir el sonido cuando se le suministra cierta potencia. La determinación de la sensibilidad se realiza normalmente introduciendo una señal de audio de 1 W (normalmente a 1 kHz) y, a continuación, midiendo el nivel de presión sonora en dBSPL a una distancia de 1 m. Los valores habituales para los altavoces se sitúan en torno a 85 y 92 dBSPL. A mayor sensibilidad, más fuerte será el sonido del altavoz cuando se le suministre una determinada potencia.

En el caso de los altavoces analógicos, la sensibilidad del altavoz suele ser un indicador de su calidad. Una sensibilidad más baja indica un imán menos potente o una bobina más pequeña y barata. Por lo tanto, en lo que respecta a la calidad de audio, un altavoz de 10 pulgadas no es necesariamente mejor que un altavoz de 8 pulgadas.

Sin embargo, en el caso de los altavoces digitales, el amplificador está incorporado en el altavoz. La medición de la sensibilidad del altavoz no es fundamental para determinar su calidad.

Procesador digital de señales integrado

Todos los altavoces Axis cuentan con un amplificador integrado y un procesador de señal digital (DSP) con los que consiguen una calidad de sonido preconfigurada. De este modo, cualquier persona puede utilizar los altavoces sin necesidad de ser un experto en audio para producir un buen sonido. El DSP analiza y procesa las señales de audio para mejorar la inteligibilidad de la voz.

Con un DSP integrado, los altavoces de Axis filtran el ruido de fondo y equilibran la frecuencia de audio para mejorar la calidad tonal. También comprime el rango dinámico de una señal de audio. A menudo, una señal de audio presentará picos y valles en el volumen, y el control de rango dinámico puede equilibrarlos para garantizar que el sonido se retransmita a un volumen idóneo para los oyentes.

El DSP compensa los sonidos silenciosos que son menos perceptibles para el oído humano a bajo volumen. Aumenta la frecuencia de esos sonidos para que el oyente no se pierda nada. Además, procesa, almacena y transmite audio digitalmente desde la fuente hasta el altavoz. De esta forma se mejora la calidad del sonido y se mantiene la intensidad de la señal, garantizando que el sonido esté bien optimizado para los altavoces. Los perfiles de sonido para la música de fondo y la voz están predefinidos para que no sea necesario controlar la calidad del audio manualmente.

Tipos de altavoces

Los factores de forma, las presiones de sonido y las posibilidades de montaje varían: algunos tipos de altavoces son idóneos para transmitir anuncios claros y audibles en zonas exteriores ruidosas, mientras que otros funcionan mejor en espacios reducidos.

Altavoces Axis

El altavoz de alta fidelidad

En los equipos de alta fidelidad, son habituales los altavoces denominados “de 2 vías“ o “de 3 vías“. Estos altavoces utilizan varios controladores diferentes para reproducir con precisión el mayor número posible de frecuencias entre 20 Hz y 20 kHz. Un controlador puede encargarse de reproducir el sonido hasta 500 Hz, un segundo altavoz puede ocuparse de las frecuencias de 500 Hz a 9 kHz y un tercero, de las frecuencias superiores a 9 kHz. Estas frecuencias límite se denominan “frecuencias de cruce“. Un altavoz de alta fidelidad está diseñado para reproducir audio con gran precisión a gran volumen.

Altavoces de alta fidelidad. Controlador de agudos (1), controlador de medios (2) y controlador de graves (3).

El altavoz exponencial

El altavoz exponencial tiene un uso completamente distinto al de un altavoz de alta fidelidad, y no debe cubrir un rango de frecuencias grande. Su propósito es maximizar el volumen de las frecuencias a las que el oído humano es más sensible, para que el altavoz pueda transmitir un mensaje (una voz humana o una sirena, por ejemplo) con la mayor claridad posible. Los altavoces exponenciales orientan todo el sonido en una misma dirección, lo que refuerza todavía más su presión acústica.

Altavoz exponencial en red

Altavoz multiusos

Los altavoces multiusos son fáciles de integrar y disponen de soluciones todo en uno que puede utilizar para mensajes de voz en directo o pregrabados con el fin de dar instrucciones de seguridad o avisar a los intrusos. También puede utilizar un altavoz multiusos para reproducir música de fondo. El catálogo de productos de Axis incluye varios altavoces multiusos:

El altavoz de caja

Un altavoz de caja de red Axis proporciona un nivel de presión del sonido medio. Puede utilizarse en la mayoría de los espacios interiores, pero no resulta tan adecuado en entornos muy ruidosos. También puede utilizarse en semiexterior, lo que significa que puede montarse debajo de un techo que lo proteja de la lluvia intensa. El altavoz de caja puede montarse horizontal o verticalmente, en una pared, en un techo o en un kit colgante.

Un altavoz de caja
El altavoz de techo

Un altavoz de techo de red Axis ofrece un nivel medio de presión acústica y debe utilizarse en zonas de interior o exterior menos ruidosas, como hospitales, comercios o edificios de oficinas. Puede montarse en un falso techo, donde resultará muy discreto y estará físicamente integrado.

Un altavoz de techo
El altavoz suspendido

Un altavoz suspendido de red Axis posee un nivel de presión acústica medio y es adecuado para zonas interiores menos ruidosas con techos altos. Está disponible en dos tamaños y es posible ajustar la longitud del cable para su adaptación a cualquier techo alto.

Un altavoz suspendido.
El minialtavoz

Un minialtavoz de red Axis proporciona un nivel bajo de presión sonora y debe utilizarse en zonas interiores más silenciosas. Es pequeño y discreto y cabe en espacios reducidos o pasillos, donde puede montarse en superficie en una pared o en el techo. Cuenta con una amplia cobertura de audio, lo que significa que se necesitan menos altavoces. El minialtavoz cuenta con un sensor PIR integrado para la detección de movimiento, que puede configurarse para que el altavoz emita automáticamente un mensaje de audio cuando alguien se acerque.

Un minialtavoz.
El proyector de sonido

Un proyector de sonido en red Axis tiene un alto nivel de presión sonora y un sonido rico y natural. Esto significa que un mensaje puede transmitirse con la mayor claridad posible, pero que la música de fondo también sonará bien. Un proyector de sonido puede utilizarse en instalaciones al aire libre o en interiores ruidosos y puede montarse en un poste, en una pared o en el techo. Puede instalarse en lugares de fácil acceso donde el riesgo de vandalismo es mayor: el proyector de sonido está fabricado a prueba de agresiones y además presenta un diseño elegante y minimalista que se integra fácilmente en el entorno.

Un proyector de sonido.

Colocación de los altavoces

Existen muchas opciones a la hora de colocar los altavoces. La regla general es maximizar el recorrido del sonido por el espacio siempre que sea posible. En otras palabras, si tiene un espacio rectangular, trate de colocar los altavoces en las paredes cortas apuntando a las paredes más largas. De este modo, el sonido realizará el máximo recorrido posible antes de reflejarse en las paredes. En cambio, no se recomienda colocar un altavoz en una esquina porque los sonidos graves se amplificarán de manera no uniforme.

Instalación en grupos

Si da prioridad a una instalación sencilla y económica, puede instalar los altavoces agrupados. Así se minimiza el cableado, pero es posible que no sea el mejor modo de conseguir una buena propagación del sonido.

La colocación en pared

Si las dimensiones de la sala lo permiten y el cableado adicional no supone un problema, es probable que la solución de colocación en pared permita una mejor difusión del sonido. Con el mismo número de altavoces que en el ejemplo de colocación con unidades agrupadas, la instalación puede tener un aspecto similar a la figura siguiente. Sin embargo, si la sala es grande, el alcance de los altavoces podría ser demasiado corto.

La colocación en el techo

Si la sala dispone de un falso techo o si es posible instalar altavoces de techo integrados, la ubicación en el techo puede ser una solución discreta. En este caso, hay que tener especialmente en cuenta la altura del techo. Cuanto más bajo sea, más altavoces se necesitan para cubrir un área determinada.

Colocación de altavoces agrupados, en paredes y techos.

AXIS Site Designer

AXIS Site Designer (https://sitedesigner.axis.com) es una útil herramienta en línea para planificar y diseñar una instalación de audio (así como una instalación de vídeo), incluidos qué tipo de altavoces utilizar, cuántos altavoces se necesitan, su ubicación óptima, etc., teniendo en cuenta las condiciones del lugar.