Aislación sonora

Es muy común que escuchen la palabra aislar. Ya sea para evitar que el sonido de una habitación se propage a otras habitaciones. O para no escuchar al vecino, etc.

Pero, ¿qué es?, ¿de qué se trata?. Trataré de explicar en este post con un poco de teoría y gráficos qué es la aislación.

El próposito de la aislación es atenuar el sonido que pasa de una habitación a otra. Por regla general, mientras mas pesada la pared mejor el aislamiento. La habilidad de una pared para atenuar el sonido se especifica con el término de Pérdida de Transmisión (TL por las siglas en inglés) que se define como la diferencia en dB del SPL que hay en la sala emisora (e) y el SPL de la sala receptora (r).

Hay tres regiones que se diferencian con el comportamiento de la pared o panel.

  1. Región I controlada por la rigidez
  2. Región II controlada por la masa
  3. Región III controlada por el efecto coincidente

Al final de este documento hay una tabla con los coeficientes de los materiales mas comunes que nos encontraremos a la hora de construir o calcular lo que en este post se detalla

Región I – Controlada por la rigidez

A bajas frecuencias, la pared se comporta como un todo, y la transmisión del sonido a través de la pared depende principalmente por la rigidez.

Región I

Para conocer el TL en la Región I utilizamos la siguiente ecuación

\[
TL = 20 \ log_{10}(\frac{1}{K_s}) – 10 \ log_{10}(0,23026 \ TL_n)
\]

Donde TLn

\[ TL_n = 10 \ log_{10}(1 + K_S^{-2})\]

Donde Ks

\[ K_s = 4 \pi \ f \rho_o \ c \ C_s \]

Donde Cs

\[ C_s = \frac{768(1 – \sigma ^{2})}{\pi ^{8} Eh^{3}(1/a^{2} + 1/b^{2})^{2}}\]

Donde a y b es el ancho y alto del panel, h es el espesor, E es la elasticidad de Young y σ es el ratio de Poisson.

Frecuencia de Resonancia

A medida que la frecuencia de incidencia aumenta, la pared empezará a resonar a una serie de frecuencias, llamadas frecuencias de resonancias. La frecuencia mas baja marca la transición entre la Región I y la Región II.

La frecuencia de resonancia mas baja es la que marca la transición entre la Región I y la Región II

\[ f_{mn} = \bigg(\frac{\pi}{4 \sqrt{3}}\bigg) c_L h \bigg[ \bigg(\frac{m}{a}\bigg)^{2} + \bigg(\frac{n}{b}\bigg)^{2}\bigg] \]

Los factores m y n son enteros (1, 2, 3…) y la cantidad cL es la velocidad longitudinal de la onda y se calcula

\[ c_L = \bigg[ \frac{E}{\rho_w(1-\sigma^{2})} \bigg]^{1/2} \]

ρw es la densidad volumétrica del material, E es la elasticidad de Young y σ es el ratio de Poisson. Como se explicaba arriba, la frecuencia de resonancia que marca la transición entre las Regiones es la frecuencia de resonancia mas baja y se denomina frecuencia fundamental y corresponde cuando m,n = 1. Si reemplazamos estos valores en la fórmula de frecuencia de resonancia nos queda

\[ f_{1,1} = \bigg(\frac{\pi}{4 \sqrt{3}}\bigg) c_L h \bigg[ \bigg(\frac{1}{a}\bigg)^{2} + \bigg(\frac{1}{b}\bigg)^{2}\bigg] \]

Región II – Controlada por la masa

Para frecuencias mas altas que la primera frecuencia de resonancia, la pérdida de transmisión es controlada por la masa del panel y es independiente de la rigidez del mismo.

El coeficiente de transmisión de la potencia sonora para una incidencia normal esta dado por la siguiente ecuación

\[ \frac{1}{a_{tn}} = 1 + \bigg(\frac{\pi f M_s}{\rho_0 c_0}\bigg)^{2} \]

Ms es la densidad superficial y se calcula multiplicando ρw (densidad volumétrica) y h (espesor de la pared) => Ms = ρw h.

ρ0 y c0 es la densidad y la velocidad del aire, respectivamente.

Entonces el TL para una incidencia normal está relacionada con el coeficiente de transmisión de la potencia sonora y está dado por

\[ TL_n = 10 \ log_{10} (1/a_{tn}) \]

Para una incidencia difusa se encontro experimentalmente que el TL en esta región esta relacionada con el TLn y se calcula con la siguiente expresión

\[ TL = TL_n – 5 \]

En el gráfico anterior se muestra la pendiente característica de esta región. Aumenta 6dB al duplicar la frecuencia. Lo que lleva a la definición de la Ley de Masa

Ley de Masa

Básicamente lo que dice esta ley, es que cuando se duplica la masa la aislación aumenta 6dB. Si la masa disminuye el doble, la aislación disminuye 6dB. Para una misma masa, cuando se aumenta la frecuencia, la aislación aumenta 6dB, y lo mismo ocurre cuando decrece la frecuencia.

Masa: En física, la densidad de área , o densidad por unidad de superficie , se representa por σ, se refiere a la cantidad de masa que posee un material por unidad de área.

\[ \sigma = \frac{m}{A} \]

Por ejemplo, un ladrillo maciso tiene un densidad superficial de 270 Kg/m2.

Frecuencia crítica

A medida que la frecuencia aumenta dentro de esta región, la longitud de onda del material se mueve al «ritmo» de la frecuencia incidente y ocurre un efecto que se llama efecto de coincidencia (longitud de ondas iguales). Primero ocurre a un ángulo de 90°. Cuando esta condición se cumple, la onda incidente y la onda vibratoria del panel se suman, resultando en una caída abrupta de la aislación. Este punto es la transición de la Región II a la Región III.

La frecuencia crítica es la transición entre la Región II y la Región III

Esto es lo que se llama frecuencia crítica y se calcula

\[ f_c = \frac{\sqrt{3}c^{2}}{\pi c_L h} \]

Si combinamos la densidad superficial y la expresión anterior encontramos que el producto Msfc es una función la propiedad física del panel y de la velocidad del sonido (c)

\[ M_Sf_c = \frac{\sqrt{3} c^{2} \rho_w}{\pi c_L} \]

Región III – Controlada por la frecuencia (damping)

Para todas las frecuencia que esten por arriba de la frecuencia crítica, el TL depende fuertemente de la frecuencia de la onda de incidencia y de las pérdidas internas del material de la pared.

Para las ondas sonoras que golpean a la pared en todas las direcciones (incidencia difusa) y que son mayores a la frecuencia crítica, la siguiente formulación empirica se aplica para el cálculo del TL

\[ TL = TL_n(f_c) + 10log_{10}(\eta) + 33,22log_{10}(f/f_c)-5,7 \]

Donde TLn(fc) es el TL calculado con una incidencia normal a la frecuencia crítica

\[ TL_n(f_c) = 10log_{10} \bigg[ 1 + \bigg( \frac{\pi M_s f_c}{\rho_0 c_0} \bigg)^{2} \bigg] \]

El término η es el coeficiente de damping del material de la pared.

El TL en esta región es proporcional a 33,22log10(f). Si la frecuencia de duplica vemos que el TL se incrementa en 33,22log10(2) = 10dB/octava

Ejemplo

Una puerta de madera tiene dimensiones de 0,9 m de anho, 1.8 m de alto y 35 mm de espesor. Se desea calcula el TL para las siguientes frecuencias: (a) 63 Hz, (b) 250 Hz y (c) 2000 Hz

Se tienen las siguientes propiedades de acuerdo a la tabla del apéndice

c (velocidad del sonido) = 344 m/s

ρ (densidad del aire) = 1.196 Kg/m3

cL (velocidad de onda longitudinal) = 3.860 m/s

ρw (densidad) = 770 Kg/m3

MSfc (frecuencia crítica del material) = (11.900 Hz-Kg/m2) * (344/346,1)2 = 11.756 Hz-Kg/m2 (para los fines prácticos del ejemplo decido bajar a 11.700 Hz-Kg/m2)

η (factor pérdida internal del material) = 0,008

E (elasticidad Young) = 11,2 GPa

σ (ratio de Poisson) = 0,15

Primero calculamos la primera frecuencia de resonancia

\[ f_{1,1} = \bigg(\frac{\pi}{4 \sqrt{3}}\bigg) (3860)(0,035) \bigg[ \bigg(\frac{1}{0,90}\bigg)^{2} + \bigg(\frac{1}{1,80}\bigg)^{2}\bigg] = 94,5 Hz \]

La masa específica es:

\[ M_S = \rho_w h = (770)(0,035) = 26,95 Kg/m^2 \]

La frecuencia crítica o frecuencia de coincidencia se puede encontrar con el ratio:

\[ F_c = \frac{M_S f_c}{M_S} = \frac{11700}{26,95} = 434,1 Hz \]

(a) Para f = 63 Hz

La frecuencia 63 Hz < 94,5 Hz (f1,1) por lo tanto corresponde a la Región I. Para calcular el TL correspondiente primero calculamos Cs

\[ C_s = \frac{(768)(1-0,15^2)}{(\pi^2)(11,2)(10^9)(0,0035)^3[(1/0,90)^2 + (1/1,80)^2]^2} = (70,81)(10^{-9}) \ m^3/N \]

El valor del parámetro Ks se calcula a continuación

\[ K_s = 4 \pi f \rho_0 c_0 C_s = (4\pi) (63) (344) (1196) (70,81)(10^{-9}) = 0,02317 \]

El coeficiente de la transmisión sonora puede ser calculada de la siguiente forma

\[ a_t = K_S^2 \ ln (1+ K_S^{-2} = (0,02317)^2 \ ln[1 + (0,02317)^{-2}] = 0,004042 \]

El TL para la frecuencia 64 Hz se calcula entonces

\[ TL = 10 \ log_{10}(1/0,004042) = 23,9 dB \]

(b) para 250 Hz

Para este caso f1,1 = 94,5 Hz < 250 Hz < 434,1 Hz (fc) por lo tanto esta frecuencia está en la Región II. Primero calculamos el coeficiente de transmisión para una incidencia normal.

\[ \frac{1}{a_{tn}} = 1 + \bigg(\frac{\pi f M_S}{\rho_0 c_0} \bigg)^2 = 1 + \bigg[ \frac{(\pi)(250)(26,95)}{(1196)(344)} \bigg] = 2623,8 \]

El TLn se puede calcular de la siguiente manera

\[ TL_n = 10 \ log_{10}(1/a_{tn}) = 10 \ log_{10}(2623,8) = 34,2 dB \]

Ya con este dato del TL para una incidencia normal calculamos

\[ TL = 34,2 – 5 = 29,2 dB \]

(c) para la frecuencia 2000 Hz

Al ser esta frecuencia mayor a la frecuencia crítica f = 2000 Hz > 434,1 Hz, en este caso recae en la Región III y el TL se calcula de la siguiente forma. Primero calculamos para la incidencia normal

\[ TL_n(f_c) = 10 \ log{10} \left( 1 + \left[ \frac{(\pi)(11700)}{411,4} \right]^2 \right) = 39 dB \]

Entonces el TL para la frecuencia de 2000 Hz se calcula

\[ TL = 39 + 10 \ log_{10}(0,008) + 33,22 \ log_{10}(2000/434,1) – 5,7 = 34,3 dB \]

Método aproximado para estimar el TL

En diseños preliminares, es necesario realizar una estimación de la pérdida. Veremos un método rápido para realizar la curva de TL para las Regiones II y III. Si las dimensiones a y b son por lo menos 20 veces mas grandes que el espesor h, la primera resonancia del panel usualmente es menor a los 125 Hz, por lo que la mayor porción de ésta pérdida estará dada en las Regiones II y III.

En la Región II, controladad por la masa, el TL para una incidencia aleatoria está dada por

\[ TL = TL_n -5 = 10 \ log_{10} \bigg[ 1 + \bigg( \frac{\pi M_S f}{\rho_0 c_0} \bigg) ^2 \bigg] – 5 \]

Para frecuencia por encima de los 60 Hz, el término (πMSf/ρ0c0) es usualmente mayor a 1, por lo tanto la ecuación puede reescribirse de la siguiente manera

\[ TL = 10 \ log_{10} \bigg[ \frac{\pi M_S f}{\rho_0 c_0} \bigg] ^2 -5 \]

Igualmente la anterior ecuación y para fines mas simplisticos, se puede reescribir de la siguiente manera

\[ TL = 20 \ log_{10}(M_S) + 20 \ log_{10}(f) – 20 \ log _{10}(\rho_0c_0/\pi) – 5 \]

Tanto c0 como ρ0 se pueden escribir como valores constantes de 344 m/s y 1196 Kg/m3 respectivamente, por lo que se puede reemplazar la anterior fórmula como constantes, quedando como ecuación final

\[ 20 \ log_{10}(1196*344/\pi) = 42,3 dB \]

Entonces para frecuencias por debajo de la Región II, el TL se puede calcular aproximadamente mediante la siguiente ecuación

\[ TL = 20 \ log_{10}(M_S) + 20 \ log_{10}(f) -47,3 \]

Este método aproximado reemplaza la transición con «pico y valles» entre la Región II y la Región III, por una línea recta o «meseta» como se muesta en la siguiente imagen

El alto de la meseta (TLp) y el ancho (▲fP) dependen del material. Algunos valores se muestran a continuación

MaterialTLp, dB▲fp = f2 - f1, octavasf2/f1
Aluminio293,511
Ladrillo372,24,5
Concreto382,24,5
Vidrio273,310
Lidrillo hueco cerámico302,76,5
Ladrillo hueco3238
Acero403,511

En la Región III la curva de TL es a razón de 10db/octava. Aunque es mejor, siendo conservadores, que para las dos primeras octavas se dibuje la línea a razón de 10dB/octava. El resto de la curva se debería dibujar a razón de 6dB/octava.

Apéndice

Valores de materiales comunes

MaterialCL (m/s)pw (Kg/m3)MsFc (Hz-kh/m2)nE (GPa)o
Aluminio5.4202.80034.0900,00173,10,33
Ladrillo3.8001.80031.2500,015250,20
Concreto2.9602.40050.2000,02020,70,13
Vidrio5.4502.50030.3000,0013710,21
Yeso6.7906506.3200,01829,50,13
Ladrillo hueco3.1201.10023.3000,00710,60,10
Madera (roble)3.86077011.9000,00811,20,15
Madera (pino)4.6806408.1600,02013,70,15

Técnica de ecualización (Yin-Yang)

Un poco de historia

¿De donde viene la palabra ecualización?

En los primeros años de la telefonía, en los Laboratorios Bells, se encontraron con un problema: las frecuencias altas disminuían a medida que el cable de teléfono se hacía cada vez mas largo. Haciendo que la voz se hiciera inentendible. Idearon un dispositivo eléctronica capaz de aumentar las frecuencias altas en el receptor. Haciendo esto, en ambas partes el sonido era igual. El nombre que le dieron a este circuito fue: ecualizador.

El post no es para hablar de los controles que existen en el ecualizador. Cosa que en un futuro si lo haré, pero si me interesa poder hablar de una técnica que me gusta usar en mis mezclas.

Ecualización y fase

La operación de un ecualizador envuelve un mecanismo de delay. El delay es bastante corto, al rededor de 1ms. Group Delay es el término que generalmente de usa para describir las frecuencias que están siendo afectadas por este delay, si bien no es muy prociso, es bien conocido que algunas frecuencias son mas afectadas que otras. A pesar de esto, este mecanismo de delay da como resultado una interacción no deseada en la fase.

¿Porque hay un cambio de fase o una interacción no deseada?

El circuito de un ecualizador utiliza capacitores y bobinas para aplicar los filtros del ecualizador (el ecualizador es un filtro). Estos componentes hacen que el voltage AC que pasa por ellos sufra un cambio de fase. Si se combina la señal con una versión de sí misma desfasada (después de pasar por el capacitor o bobina), la respuesta de frecuencia de altera. El plugin entonces simula este comportamiento. Es más, sin ese delay, no habría ecualización.

Veamos como ejemplo esta onda de 100Hz.

Gráfico
En el gráfico, el desface es de 1/3π radianes (un poco más de 18°). Si bien este desfazaje es mucho mas que 1ms, se quiere ejemplificar lo que ocurre en el ecualizador.

Nos fijemos en la onda de color azul que es la señal original cuando entra al EQ. Al pasar por los filtros, la copia desfazada (onda de color roja) que se suma a la onda original, va a producir una onda resultante con cancelaciones.

¿Qué pasa entonces con todo esto? Este cambio de fase ocurre tanto al aumentar como al disminuir la ganancia del filtro de la frecuencia. Es un mito que los ecualizadores causan mayor desfazaje al aumentar. Sin embargo es correcto decir que se nota más cuando aumentamos la ganancia, por la simple razón que estamos aumentado el nivel de la frecuencia, y con eso se hace mas audible. Por esto es preferible disminuir que aumentar. Y para dar otra razón, al aumentar la ganancia, aumentamos el riesgo de hacer clip.

Todo lo anterior sirve para dar introducción a lo que siempre utilizo en mis mezclas, que es una técnica a la que se llama La frecuencia Yin-Yang

Veamos el siguiente gráfico

Eq yin-yang
Ecualización yin-yang

¿Se bajó 20 dB los graves o se subió 20 dB los agudos?

Sin importar en cual de las dos frecuencias se utiliza la ecualización yin-yang, nos enseña un importante concepto en nuestra percepción de la frecuencia: vamos a tener el mismo efecto tanto si aumentamos los agudos o si disminuimos los graves.

Por ejemplo, para tener mas brillo, o aumentamos los agudos, o disminuimos los graves. Seguro se nos va a presentar un trabajo en el que vamos a tener que tratar frecuencias específicas, pero vale la pena recordar que siempre hay mas de una ruta para llegar al mismo destino.

Por último, veamos unos ejemplos

Voz con reverb y compresores. ¿Subo agudos o bajo graves?
Voz con reverb y compresores. ¿Subo agudos o bajo graves?
Voz sin reverb y compresores. ¿Subo agudos o bajo graves?
Voz sin reverb y compresores. ¿Subo agudos o bajo graves?

Leo los comentarios para ver si pueden distinguir.

Si es que todavía no lo habían hecho, los invito a que en su próxima mezcla traten esta técnica.

Nos vemos en el próximo post.

Timbre

¿Qué es lo que escuchamos cuando oímos un sonido, por ejemplo, la nota en una guitarra acústica?

Parte Teórica

Los sonidos que escuchamos son ondas complejas, es decir que está formada por ondas simultáneas. No importa que tan compleja sea, o que tan largo sea su período, siempre se puede reducir en ondas simples.

En esta descomposición se pueden encontrar las siguientes frecuencias.

Frecuencia fundamental:  la frecuencia fundamental es el componente más bajo de la onda periódica.

Armónicos:  Un armónico es un componente de una onda periódica que es un múltiple entero de la frecuencia fundamental. Por ejemplo, la frecuencia que es dos veces la frecuencia fundamental se llama segundo armónico. Para el cálculo de la frecuencia de los armónicos se utiliza la siguiente fórmula.

\[ F_{armónico} = F_{fundamental} * n \] siendo n un número entero.

La relación entre las diferentes frecuencias, diferentes amplitudes y diferentes fases hace que la onda resultante sea propia de lo que estemos escuchando.

En otra palabra, el timbre: calidad de un sonido relacionado con su estructura armónica.

Gracias a la transformada de Fourier podemos descomponer esta onda compleja en onda puras.

Josehp Fourier

Jean-Baptiste Joseph Fourier (francés: /ʒozɛf fuʁje/; Auxerre, Francia, 21 de marzo de 1768-París, 16 de mayo de 1830) fue un matemático y físico francés conocido por sus trabajos sobre la descomposición de funciones periódicas en series trigonométricas convergentes llamadas Series de Fourier, método con el cual consiguió resolver la ecuación del calor. La transformada de Fourier recibe su nombre en su honor. Fue el primero en dar una explicación científica al efecto invernadero en un tratado.

¿Qué es entonces la transformada de Fourier? Según Wikipedia: es una transformación matemática empleada para transformar señales entre el dominio del tiempo (o espacial) y el dominio de la frecuencia, que tiene muchas aplicaciones en la física y la ingeniería. Es reversible, siendo capaz de transformarse en cualquiera de los dominios al otro. El propio término se refiere tanto a la operación de transformación como a la función que produce.

En el caso de una función periódica en el tiempo (por ejemplo, un sonido musical continuo, pero no necesariamente sinusoidal), la transformada de Fourier se puede simplificar para el cálculo de un conjunto discreto de amplitudes complejas, llamado coeficientes de las series de Fourier. Ellos representan el espectro de frecuencia de la señal del dominio-tiempo original.

De la misma forma en que la transformada de Fourier nos descompone la señal entre el dominio del tiempo y el dominio de la frecuencia, la transformada de Fourier inversa hace la operación inversa (del dominio de frecuencia al dominio del tiempo)

Entonces la relación entre la frecuencia fundamental y sus armónicos nos da el timbre característico del instrumento.

Para quien le guste las matemáticas, estas serían las formulas:

Transformada de Fourier

\[F(\omega) = \int_{-\infty}^{\infty} f(t) e^{-it\omega} dt \]

Transformada de Fourier inversa

\[F(t) = \int_{-\infty}^{\infty} f(\omega) e^{it\omega} {d\omega} \]

Parte práctica

Con la ayuda de mi hermano Mariano (www.instagram.com/wettsma) le pedí que grabara la quinta cuerda al aire de una guitarra criolla y una eléctrica. Con esto se podrán ver las diferencias en la composición de una misma nota, pero en diferentes instrumentos.

La quinta cuerda al aire es la nota LA (110Hz) –como dije arriba no es que ponen un oscilador a 110Hz y va a sonar ese LA, depende del instrumento y de los armónicos como vamos a ver.

También le pedí que grabar dos armónicos naturales (en el traste 12 y en el 5).

La idea es pasarlo por la transformada de Fourier y ver el espectro de esa nota.

Como siempre, utilicé Python y Jupyter Notebook para el código y generar los gráficos que incluyo en el post.

Para generar los gráficos utilicé el código que detallo abajo. Las librerías que use fueron: matplotlib.pyplot, scipy.wavefile y scipy.fftpack

import matplotlib.pyplot as plt
from scipy.io import wavfile
from scipy.fftpack import fft,fftfreq

direccion = "dirección del archivo de audio"

samplerate, data = wavfile.read(direccion)

datafft = fft(data)

fftabs = abs(datafft)

samples = data.shape[0]
freqs = fftfreq(samples,1/samplerate)

fig, ax = plt.subplots(figsize=(15,7))
plt.xlim( [10, samplerate/2] )
plt.xscale( 'log' )
plt.xticks([10, 100, 1000, 10000],["10", "100", "1kHz", "10kHz"])
plt.yticks([])
plt.grid( True )
plt.xlabel( 'Frecuencia (Hz)' )
plt.plot(freqs[:int(freqs.size/2)],fftabs[:int(freqs.size/2)], color="r")

Para generar la onda compleja a partir de la suma de ondas simple, utilicé el siguiente código.

import numpy as np
from scipy.io import wavfile

sampleRate = 44100
frequency = 110
length = 5

t = np.linspace(0, length, sampleRate * length)
f = np.sin(frequency * 2 * np.pi * t)
a1 = np.sin((frequency*2) * 2 * np.pi * t1)
a2 = np.sin((frequency*3) * 2 * np.pi * t)
a3 = np.sin((frequency*4) * 2 * np.pi * t)
a4 = np.sin((frequency*5) * 2 * np.pi * t)
a5 = np.sin((frequency*6) * 2 * np.pi * t)
a6 = np.sin((frequency*7) * 2 * np.pi * t)
y = f + a1 + a2 + a3 + a4 + a5 + a6

wavfile.write('La Artificial.wav', sampleRate, y)

Empecemos: el primer audio que se van a escuchar es del LA de la guitarra criolla.

LA (110Hz) guitarra criolla

Al pasar el audio por la transformada de Fourier:

LA (110Hz) guitarra criolla.
Nota: El primer pico de 50Hz no es parte de la nota. Se trata de un ruido en la línea eléctrica y quedo grabado. Por lo que para los ejemplos mostrados en este post hay que omitirlo. Únicamente aparecen en las grabaciones de la guitarra criolla

El primer pico (lean la leyenda del gráfico anterior) corresponde a la frecuencia fundamente. Los demás picos son los armónicos (interesante el tercer armónico)

Seguimos: la nota LA en la guitarra eléctrica

LA (110Hz) guitarra eléctrica
FFT de LA (110Hz) de la guitarra eléctrica

Claramente se ve la diferencia. Si comparamos ambas guitarras el cuerpo de la guitarra eléctrica no «genera» tanto armónicos a diferencia de la caja de resonancia de la guitarra criolla.

Para comparar con otro instrumento, este es el LA en un piano de cola

LA (110Hz) piano de cola
FFT del LA (110Hz) de un piano de cola

Muchos armónicos se pueden relacionar con un sonido mas «lindo».

Como contrapartida generé un sonido complejo utilizando el segundo código que al principio del post copié. Es lo que se llama transformada de Fourier inversa.

El audio generado:

LA (110Hz) «artificial»

Y al pasarlo por la FFT se generó este gráfico:

LA (110Hz) artificial

Todas las onda con el mismo nivel. Por eso suena como suena, tiene su propio timbre.

Armónicos natural (mas gráficos)

Nuevamente con la ayuda de Mariano le pedi que grabara los armónicos naturales tanto de la guitarra criolla, como la de la eléctrica. Fueron los del traste 12 y 5. Se generaron estos audios y gráficos:

Armónico natural traste 12 guitarra criolla
Armónico natural traste 12 guitarra criolla
Armónico natural traste 12 guitarra eléctrica
Armónico natural traste 12 guitarra eléctrica

¿Que pasó aca? Al tocar de esta forma, escondemos la frecuencia natural y solo se escuchan los armónicos n° 2, 3 y 4 (guitarra criolla) y los armónicos n° 2 y 3 (guitarra eléctrica).

Veamos que ocurre con el armónico natural tocado en el traste 5:

Armónico natural traste 5 guitarra criolla
Armónico natural traste 5 guitarra criolla
Armónico natural traste 5 guitarra eléctrica
Armónico natural traste 5 guitarra eléctrica

Lo mismo que en el anterior armónico natural, pero en este caso tiene el tercer armónico es el que sobresale auditivamente.

Espero que con estos gráficos se haya podido entender lo que es el timbre y porque cada instrumento suena como suena.

Hasta el próximo post!!

Modos de resonancia

¿Qué son los modos de resonancia? ¿Cómo los puedo identificar en mi sala?

Es mejor siempre empezar por la definición. Según Wikipedia: “Dentro del campo de la Acústica ondulatoria, recibe el nombre de modo propio aquella onda estacionaria generada en el interior de un determinado espacio, por ejemplo, una sala o habitación. Este tipo de interferencias, ya sean constructivas (suma) o destructivas (cancelación), vienen dadas por la interacción entre las ondas incidentes y reflejadas dentro del recinto.”

En otras palabras, cuando en un recinto cerrado la distancia entre paredes es igual a media longitud de onda de una frecuencia, se produce una onda estacionaria. Esto se traduce en una pérdida de la calidad acústica de la habitación.

Me imagino que alguna vez deben haber estado dentro de una habitación escuchando música y en ciertas notas se escucha más fuerte, como retumbando y al moverse esa nota se acentúa o disminuye según se mueven dentro de la habitación en los diferentes ejes.

Arriba: modo de resonancia fundamental (dimensión de la sala corresponde a 1/2 longitud de onda). Abajo: modo de resonancia n° 2.

En el gráfico anterior se aprecia que cuando media longitud de onda coincide con alguna dimensión de la sala (largo, ancho, alto) se produce una onda estacionaria. Si nuestra sala fuera el primer gráfico y el modo se produce a lo largo, al posicionarnos en el medio estaríamos en la presencia de un nodo (cancelación)

Presión vs desplazamiento de partículas

¿Qué es lo que pasa dentro de la habitación entonces?  Supongamos que medidos la presión sonora dentro de la habitación. Veremos que la onda sonora viaje hacia su derecha y es reflejada por la superficie hacia la izquierda retornando fuera de fase (polaridad invertida en ½ período) La onda sonora que va hacia la izquierda interactúa con la onda que viaja hacia la derecha. De ésta interacción se producen sumas (antinodos) y cancelaciones (nodos).

Es interesante saber qué es lo que pasa con la presión sonora y el desplazamiento de las partículas del aire. Por cada nodo en la presión sonora, hay un antinodo en el desplazamiento de las partículas y viceversa (en los puntos de la onda en que la presión sonora es máxima el desplazamiento es mínimo). Particularmente el desplazamiento de las partículas de aire esta fuera de fase a la presión sonora en 90° y varía sinusoidalmente en la misma frecuencia que la fuente.

Presión de la onda estacionaria y el desplazamiento de las partículas del aire

Tomemos como punto el inicio del gráfico (línea azul) que sería el extremo de nuestra sala. Observemos los puntos de color naranja en el gráfico, vemos que en donde la presión es mínima, el desplazamiento es máximo, esto corresponde a un cuarto de longitud de onda para éste modo (si la frecuencia es 100Hz, un cuarto es 0,86 mts) Si bien esta medida difiere de acuerdo al modo, es por esto que los absorbentes de porosidad son efectivos a la distancia de un cuarto de longitud de onda desde la pared para la frecuencia específica.

Tipo de modos

Existen tres tipos de ondas estacionarias.

  • Axial: resonancia que está asociada con dos paredes paralelas
  • Tangencial: resonancia que involucra 4 paredes paralelas
  • Oblicuo: resonancia que involucra las 6 paredes

En la siguiente imagen se pueden ver cómo interactúan estos modos con las superficies

Diferentes tipos de modos

Existe una fórmula que sirve para calcular estos modos (Rayleigh). Cabe destacar que esta fórmula sirve para habitaciones paralelepípedas.

\[ F_k,m,n = \frac{c}{2} \sqrt{\biggl(\frac{k}{L_x}\biggr)^2 + \biggl(\frac{m}{L_y}\biggr)^2 + \biggl(\frac{n}{L_z}\biggr)^2 } \]

Donde

  • Lx, Ly, Lz = medidas de la sala
  • k, m, n = modos de la sala. Son números enteros (0, 1, 2, 3…)

Con la combinación de k, m, n nos da una frecuencia que está asociada con el modo propio de la sala. Si elegimos k=1, m=0, n=0, reemplazamos en la fórmula con las medidas de nuestra sala y el resultado es una frecuencia que pertenece al modo 1,0,0.

Tomemos por ejemplo una habitación con las siguientes medidas.

LargoAnchoAlto
8,5 mts4,8 mts3 mts

Al reemplazar estos valores en la fórmula nos da una serie de frecuencias que son los modos para estas medidas. Siguiendo con las medidas de la tabla anterior se calculó los modos axiales.

El siguiente gráfico muestra la distribución de éstos modos.

Distribución de los modos axiales para las medidas de ejemplo

Se puede observar que la densidad de los modos es mayor a medida que la frecuencia aumenta. En cierto punto es tan denso la cantidad de modos (la separación entre los modos es muy pequeña) que prácticamente la respuesta de frecuencia de la sala se suaviza.  

La siguiente ecuación se usa para determinar el número aproximado de modos para un ancho de banda determinado.

\[ \Delta N = \biggl[\frac{4 \pi Vf^2}{c^3} + \frac{\pi Sf}{2c^2} + \frac{L}{8c} \biggr] \Delta f \]

Aplicando la fórmula nos da el siguiente gráfico

La densidad modal aumenta con la frecuencia

Se puede observar en el gráfico como crece exponencialmente la cantidad de modos a medida que la frecuencia aumenta.

Algunos de los resultados: para 39Hz nos da una densidad de N=0,16. Para 1000Hz N=39,81 y, para 16000Hz N=9671,15.

Los modos son más importantes en habitaciones más pequeñas donde la densidad modal es baja. En habitaciones grandes, la densidad modal es relativamente alto, excepto a frecuencias extremadamente bajas, y los modos juegan un papel menos importante.

Nos vemos en el siguiente post!!

Respuesta al impulso

Personalmente siempre me pregunte como se veía lo que escuchamos. En el audio digital si grabamos por ejemplo una batería, vemos al bombo como golpes de corta duración, entonces asociamos lo que vemos a lo que escuchamos. Si por ejemplo grabamos una guitarra con unos acordes para dar sustain a la canción, vemos como la forma de onda es mas larga si la comparamos con la del bombo.

¿Pero que pasa en un recinto? ¿Cómo se ve?

Navegando por internet se encuentran grabaciones de respuesta al impulso. En este caso se van a usar unas que se hicieron en un recinto en Manchester, Inglaterra. El lugar se llama The Bridgewater Hall. Estas grabaciones son la respuesta al impulso (fue de una pistola que se usa para dar largada a una carrera de caballos, tipo una pistola a cebitas).

El primer audio es con el receptor (micrófono en este caso) cerca de la fuente, y el segundo audio es uno mas alejado.

Respuesta cerca (cerca para el resto del post)
Respuesta lejos (lejos para el resto del post)

Se cargaron los sonidos al software de medición. Se llama ARTA (http://www.artalabs.hr/) Es una programa shareware, se puede medir, importar, analizar, etc, pero pueden guardar ni cargar proyectos.

Veamos entonces como se ve el primer impulso.

El sonido directo con las primeras reflexiones.

Se puede ver en la imagen que a la primera reflexión le toma un poco más de 40ms en llegar al oído del receptor. Con una velocidad del sonido de 344 m/s recorre 1360 cm hasta llegar al oyente. Las otras reflexiones que llegan después están a un nivel bastante alto. Recordemos que el nivel con que llegan estas reflexiones (también del tiempo) nos da una «idea» (que tan grande o chico es) del recinto y que tan cerca (o lejos) estemos del sonido directo.

Abro paréntesis

Abro un paréntesis para hablar sobre las reflexiones y como reconocerlas. Volviendo a la primera reflexión que recorre 1360 cm, si en el caso que estemos haciendo un análisis de las reflexiones para tratarlas, hay que tener en cuenta que la distancia que recorre es la suma del recorrido desde la fuente hasta la superficie mas el recorrido desde la superficie hasta el receptor. Una vez que calculemos la distancia de recorrido (regla de tres simples: si la velocidad del sonido es 344 m/s, cuanto recorre en 40 ms?) nos resultará fácil saber que superficie está reflejando el sonido. Solo debemos mirar y observar en nuestro recinto o habitación que superficie está a determinada distancia para que en la suma de los recorridos de como resultado los 1360cm. Si en el caso que sea necesario, podremos aplicar el tratamiento acústico. Para el estudio de estas reflexiones se usa el gráfico ETC (Energy Time Curves).

El paint en su máxima expresión

En la imagen se grafica el recorrido del sonido directo y el sonido reflejado llegando 40ms después. A continuación podemos ver el gráfco ETC

Gráfico ETC del sonido cerca. Cada pico es una reflexión.

El gráfico ETC sirve para estudiar las reflexiones. En el eje Y se detalla el nivel de la reflexión y en el eje X el tiempo transcurrido. Según diferentes papers el nivel de las reflexiones deberían estar entre 10dB-15dB por debajo del sonido directo. Los picos, mientras mas altos sean, mas alto en nivel es la reflexión.

El gráfico ETC no muestra información con respecto a la frecuencia. Para ello se usa otro tipo de gráfico que se llama Waterfall

Cierro paréntesis

Volvamos entonces con la comparación de los sonidos. Ahora vamos con la respuesta al impuso del segundo sonido (lejos)

El sonido directo y las primeras reflexiones. Segundo sonido

Lo primero que vemos es que la primera reflexión llega antes de los 40ms. Esto es correcto ya que a medida que estemos más lejos de la fuente la diferencia de llegada entre ambos sonidos (directo y reflexión) es más chica.

Podemos observar también que las siguientes reflexiones que llegan, lo hacen a un menor nivel (nuevamente comparado con el gráfico anterior)

El siguiente gráfico que se muestra es el tiempo de reverberación (RT60 ó T60). Wikipedia dice al respecto: Se define como el tiempo que transcurre — hasta que decae a una determinada intensidad — las reflexiones de un sonido directo. Esa intensidad es de 60dB. Si el entorno es muy ruidoso, se puede usar el T30 o T20. En estos casos, lo cambia es la intensidad, 30dB y 20dB respectivamente.

Decaimiento de la energía de la respuesta al impulso cerca
Decaimiento de la energía de la respuesta al impulso lejos

Podemos observar que en la respuesta desde la posición mas alejada, el sonido el ser más débil, se vuelve imperceptible más rápido. El cálculo del tiempo de reverberación es de 2,2 segundos. Para el punto mas cercano el tiempo de reverberación que se calcula es de 2,3 segundos. Resultados que están bien, ya que el tiempo de reverberación se calcula en base a los metros cuadrados del recinto. Dato que no varia por más que estemos en cualquier punto del lugar.

Tabla T60 calculado para el sonido cerca. Se observa también que están incluídos el T20 y T30:

F (Hz)T30 (s)T20 (s)T60user(s) 
Wide2.3432.3442.339

Tabla T60 calculado para el sonido lejano. Se observa también que están incluídos el T20 y T30:

F (Hz)T30 (s)T20 (s)T60user(s)
Wide2.2982.3262.269

Anexo

Como gráfico de color, el siguiente gráfico ETC muestra el sonido lejos comparado con un gráfico ETC de un comedor, donde sus dimensiones son de aproximadamente 4 metros x 5 metros.

La curva de color verde (o algo parecido) pertenece al sonido cerca. La de negro al comedor.

El en gráfico se ve claramente como el sonido decae mas rápido al ser una sala más chica (si se compara con la otra curva)

Espero que sea claro el posteo.

Nos vemos en el próximo.!!

Fuente

Reflexiones

¿Cómo se ve una reflexión? ¿cómo afecta a la respuesta en frencuencia? ¿cómo se tratan?

Siempre son interesantes las preguntas. Te permiten ver el problema y poder buscar una solución, creo yo, de una manera mas directa.

Realice una simple prueba (digo, simple porque las mediciones de las reflexiones se realizan de otra forma, con planificación, con tiempo y se toman mediciones de todos los «angulos» posibles, etc) lo que busqué es ejemplificar de una manera brusca las preguntas que me hice.

Me puse en marcha entonces a realizar varias mediciones en mi estudio y a guardar las fotos que generaban estas mediciones. Respuesta al impulso, gráfico ETC y la respuesta en frecuencia del punto de escucha (donde me siento para mezclar). Utilice:

  • Micrófono de medición Behringer ECM-8000
  • Placa de audio M-Audio Delta 1010LT
  • Monitores Behringer Truth 2030P
  • ARTA Software (versión shareware)
  • Pie, cables, café, galletitas

Un tratamiento acústico trata de reducir las reflexiones en el punto de escucha y que solo llegue el sonido directo de los parlantes, sin ninguna interferencia, ni reflexión para que no se sume al sonido directo. En este ejemplo coloqué la consola de una manera para que me exagere las reflexiones y se pueda ver bien lo que genera. Sumado las reflexiones que me provoca la pared detrás mío (lamentablemente no tengo fotos para que se pueda ver bien, y al momento de escribir esto ya tengo todo acomodado y ordenado).

Aclaración: solo muestro los efectos que tiene en las frecuencias agudas. Por lo tanto sugiero que a los gráficos les presten atención desde los 4 Khz para arriba.

Con esto aclarado, veamos que sucede con la medición. Usé un barrido de frecuencia. Al micrófono lo coloqué en el punto de escucha.

Primera medición

El primer pico es el sonido directo. El que esta en rojo es de la consola y los azules de las paredes.
Gráfico ETC de la medición (lo ideal es que esten por debajo de los -15 dB). El primer pico es de la consola, los demás de la pared.
Respuesta en frecuencia

Es interesante ver como afectan estas reflexiones a la respuesta en frecuencia en el punto de escucha (como va a colorear lo que se emite de los parlantes) Vemos que hay varios picos en la respuesta y varias cancelaciones. ¿Cuál es el inconveniente? y que lo que vas a estar escuchando no va a ser realmente lo que es. Va a estar coloreado

Segunda medición

La siguiente medición la hice con material absorvente sobre la consola. Lo que busqué acá, es mostrar de una forma brusca, como eliminar esas reflexiones y ver como cambia la respuesta en frecuencia.

Respuesta al impulso. Claramente se ve como eliminamos esa reflexión
En el gráfico ETC también se ve la mejoría
La respuesta de frecuencia se ve algo mas plana

Tercera medición

Ya con el absorvente en la consola, coloqué mas absorventes en la pared que hay detrás del punto de escucha. Veamos que sucedió:

Respuesta al impulso. Ya se eliminaron las reflexiones problemáticas
Los tres picos del principio ya están bastantes reducidos. Los picos que estan marcados en azul: el del medio corresponde a la tercera reflexión que veíamos en la respuesta al impulso. El primero y el último corresponden a reflexiones de otras paredes que, como están por debajo de los -15 dB no «molestan»
La respuesta final

Por último muestro la respuesta en frecuencia de la primera medición y la última con la fase para ver claramente un filtro peine.

Si bien, como vengo aclarando desde el principio, es una manera brusca de mostrar como afectan las reflexiones, me pareció interesante mostrar gráficamente como se ven.

Nos vemos en la próxima!!