Teorema de Nyquist

¿Qué dice el teorema? ¿Qué pasa si no se cumple?

Este teorema dice: Según el teorema de muestreo de Nyquist-Shannon, para poder digitalizar una señal analógica y transmitirla por un medio eléctrico a grandes distancias y poder recuperarla en el extremo distante con la máxima fidelidad posible, se requiere que la señal analógica sea muestreada al menos dos veces su frecuencia máxima. [Wikipedia]

De este teorema surge la frecuencia de muestreo de 44.1kHz. El rango de escucha del oído humano va desde los 20Hz hasta los 20.000Hz. La frecuencia de muestreo de 44.100Hz cumple con el teorema.

Para poder graficar una onda pura vamos a usar Python y vamos a cambiar la frecuencia de muestreo para ejemplificar ambos casos.

import numpy as np
import matplotlib.pyplot as plt

f = 50  #Frecuencia en Hertz
f_s = 44100  #Sampleo, o cantidad de muestras por segundos

f_s_b = 10 #Sampleo, o cantidad de muestras por segundos donde no se cumple el teorema de Nyquist

t = np.linspace(0, 1, 2 * f_s) #Función para crear un array equidistante
x = np.sin(f * 2 * np.pi * t)

fig, ax = plt.subplots(figsize=(15,7))
ax.plot(t, x)
ax.set_ylim(1.5,-1.5)
ax.set_xlabel('Tiempo [s]')
ax.set_ylabel('Amplitud Señal')
ax.set_title('50Hz con Frecuencia de Muestreo de 44100Hz')
plt.show()

El gráfico que se genera es el siguiente

1 segundo de una onda de 50Hz

Al código de arriba lo modifico para que la resolución sea de 10Hz. Veamos que onda se genera:

import numpy as np
import matplotlib.pyplot as plt

f = 50  #Frecuencia en Hertz
f_s = 44100  #Sampleo, o cantidad de muestras por segundos

f_s_b = 10 #Sampleo, o cantidad de muestras por segundos donde no se cumple el teorema de Nyquist

t = np.linspace(0, 1, 2 * f_s) #Función para crear un array equidistante
x = np.sin(f * 2 * np.pi * t)

fig, ax = plt.subplots(figsize=(15,7))
ax.plot(t, x)
ax.set_ylim(1.5,-1.5)
ax.set_xlabel('Tiempo [s]')
ax.set_ylabel('Amplitud Señal')
ax.set_title('50Hz con Frecuencia de Muestreo de 10Hz')
plt.show()
1 segundo de una onda de 50Hz

Claramente se ve la diferencia entre una onda y la otra. A este error se le denomina aliasing. Trae en los resultados falsos picos, datos erróneos. Justamente el término aliasing viene de alias. Según la RAE:

1. m. Apodo o sobrenombre.
2. adv. Por otro nombre. Alfonso Tostado, alias el Abulense.
3. adv. desus. De otro modo.

El propio nombre lo dice, no es una copia exacta, es un alias. Hoy no es una configuración que sea necesario tener pendiente, ya que practicamente cualquier DAW trae como predeterminado el valor de 44.100 Hz. Pero es importante conocer todos los aspectos del sonido digital.

El código de Python para generar la onda

Hasta el próximo post!!!

Respuesta al impulso

Personalmente siempre me pregunte como se veía lo que escuchamos. En el audio digital si grabamos por ejemplo una batería, vemos al bombo como golpes de corta duración, entonces asociamos lo que vemos a lo que escuchamos. Si por ejemplo grabamos una guitarra con unos acordes para dar sustain a la canción, vemos como la forma de onda es mas larga si la comparamos con la del bombo.

¿Pero que pasa en un recinto? ¿Cómo se ve?

Navegando por internet se encuentran grabaciones de respuesta al impulso. En este caso se van a usar unas que se hicieron en un recinto en Manchester, Inglaterra. El lugar se llama The Bridgewater Hall. Estas grabaciones son la respuesta al impulso (fue de una pistola que se usa para dar largada a una carrera de caballos, tipo una pistola a cebitas).

El primer audio es con el receptor (micrófono en este caso) cerca de la fuente, y el segundo audio es uno mas alejado.

Respuesta cerca (cerca para el resto del post)
Respuesta lejos (lejos para el resto del post)

Se cargaron los sonidos al software de medición. Se llama ARTA (http://www.artalabs.hr/) Es una programa shareware, se puede medir, importar, analizar, etc, pero pueden guardar ni cargar proyectos.

Veamos entonces como se ve el primer impulso.

El sonido directo con las primeras reflexiones.

Se puede ver en la imagen que a la primera reflexión le toma un poco más de 40ms en llegar al oído del receptor. Con una velocidad del sonido de 344 m/s recorre 1360 cm hasta llegar al oyente. Las otras reflexiones que llegan después están a un nivel bastante alto. Recordemos que el nivel con que llegan estas reflexiones (también del tiempo) nos da una «idea» (que tan grande o chico es) del recinto y que tan cerca (o lejos) estemos del sonido directo.

Abro paréntesis

Abro un paréntesis para hablar sobre las reflexiones y como reconocerlas. Volviendo a la primera reflexión que recorre 1360 cm, si en el caso que estemos haciendo un análisis de las reflexiones para tratarlas, hay que tener en cuenta que la distancia que recorre es la suma del recorrido desde la fuente hasta la superficie mas el recorrido desde la superficie hasta el receptor. Una vez que calculemos la distancia de recorrido (regla de tres simples: si la velocidad del sonido es 344 m/s, cuanto recorre en 40 ms?) nos resultará fácil saber que superficie está reflejando el sonido. Solo debemos mirar y observar en nuestro recinto o habitación que superficie está a determinada distancia para que en la suma de los recorridos de como resultado los 1360cm. Si en el caso que sea necesario, podremos aplicar el tratamiento acústico. Para el estudio de estas reflexiones se usa el gráfico ETC (Energy Time Curves).

El paint en su máxima expresión

En la imagen se grafica el recorrido del sonido directo y el sonido reflejado llegando 40ms después. A continuación podemos ver el gráfco ETC

Gráfico ETC del sonido cerca. Cada pico es una reflexión.

El gráfico ETC sirve para estudiar las reflexiones. En el eje Y se detalla el nivel de la reflexión y en el eje X el tiempo transcurrido. Según diferentes papers el nivel de las reflexiones deberían estar entre 10dB-15dB por debajo del sonido directo. Los picos, mientras mas altos sean, mas alto en nivel es la reflexión.

El gráfico ETC no muestra información con respecto a la frecuencia. Para ello se usa otro tipo de gráfico que se llama Waterfall

Cierro paréntesis

Volvamos entonces con la comparación de los sonidos. Ahora vamos con la respuesta al impuso del segundo sonido (lejos)

El sonido directo y las primeras reflexiones. Segundo sonido

Lo primero que vemos es que la primera reflexión llega antes de los 40ms. Esto es correcto ya que a medida que estemos más lejos de la fuente la diferencia de llegada entre ambos sonidos (directo y reflexión) es más chica.

Podemos observar también que las siguientes reflexiones que llegan, lo hacen a un menor nivel (nuevamente comparado con el gráfico anterior)

El siguiente gráfico que se muestra es el tiempo de reverberación (RT60 ó T60). Wikipedia dice al respecto: Se define como el tiempo que transcurre — hasta que decae a una determinada intensidad — las reflexiones de un sonido directo. Esa intensidad es de 60dB. Si el entorno es muy ruidoso, se puede usar el T30 o T20. En estos casos, lo cambia es la intensidad, 30dB y 20dB respectivamente.

Decaimiento de la energía de la respuesta al impulso cerca
Decaimiento de la energía de la respuesta al impulso lejos

Podemos observar que en la respuesta desde la posición mas alejada, el sonido el ser más débil, se vuelve imperceptible más rápido. El cálculo del tiempo de reverberación es de 2,2 segundos. Para el punto mas cercano el tiempo de reverberación que se calcula es de 2,3 segundos. Resultados que están bien, ya que el tiempo de reverberación se calcula en base a los metros cuadrados del recinto. Dato que no varia por más que estemos en cualquier punto del lugar.

Tabla T60 calculado para el sonido cerca. Se observa también que están incluídos el T20 y T30:

F (Hz)T30 (s)T20 (s)T60user(s) 
Wide2.3432.3442.339

Tabla T60 calculado para el sonido lejano. Se observa también que están incluídos el T20 y T30:

F (Hz)T30 (s)T20 (s)T60user(s)
Wide2.2982.3262.269

Anexo

Como gráfico de color, el siguiente gráfico ETC muestra el sonido lejos comparado con un gráfico ETC de un comedor, donde sus dimensiones son de aproximadamente 4 metros x 5 metros.

La curva de color verde (o algo parecido) pertenece al sonido cerca. La de negro al comedor.

El en gráfico se ve claramente como el sonido decae mas rápido al ser una sala más chica (si se compara con la otra curva)

Espero que sea claro el posteo.

Nos vemos en el próximo.!!

Fuente

Reverb – plug ins

En esta entrada voy a hablar sobre los parámetros básicos que podemos encontrar en cualquier reverb (plug-ins). Utilice la reverb IR1 Convolution Reverb de Waves para los ejemplos que subo a este post.

Nuestros oídos están acostumbrados a escuchar y a estar en ambientes reverberantes. Habitación, cocina, comedor, baño, etc. Utilizamos la reverb en nuestra mezcla, no solo para dar la dimensión, si no también para “posicionar” en un espacio el instrumento.

Los parámetros encontrados en la mayoría de los plug-ins están estrechamente relacionados con las propiedades de los espacios acústicos.

Los plug-ins varían en el diseño interno, y algunos están diseñados para ciertas aplicaciones. Es importante aclarar que por más que dos controles sean iguales en diferentes plug-ins pueden que estén diseñados de distintas formas y pueden tener diferentes resultados. Como regla principal (y es aplicable a todo) leer siempre los manuales. Para eso se escriben. Hay mucha información ahí dentro y está bueno que sean leídos.

Direct sound

El sonido directo no es parte de la reverb. Es el sonido que viaja por la distancia mas corta entre la fuente y el receptor. Es la primera instancia del sonido que llega a los oídos y por lo tanto nos provee cierta información psicoacústica. Tanto el nivel como el contenido en las frecuencias altas contribuyen a la percepción de la profundidad.

El sonido directo es la señal “seca” que alimenta al plug-ins para que simule la reverb. Algunos plug-ins proveen este control que determina la “cantidad” de señal que se mezcla con la señal procesada (dry/wet mix). Si el plug-ins se conecta via auxiliar, la señal original (la propia del canal) se mezcla de todas formas, y la copia que se envía al plug.ins (direct sound) se vuelve redundante una vez que se mezcla con la reverb. Este no es el caso si se conecta como insert. Como regla general, si la reverb se conecta via auxiliar, hay que apagar el control de direct sound. Si esta conectada en el insert hay que dejarlo prendido.

Con el sonido directo activado
Sin el sonido directo activado

Pre-delay

Es la diferencia entre el tiempo de llegada del sonido directo y el tiempo de llegada de la primera reflexión. Esta diferencia nos da una pista sobre el “tamaño” del recinto, donde en recintos grandes el pre-delay es grande (toma mas tiempo en la primera reflexión en llegar a nuestros oídos). También nos provee de la distancia entre la fuente y el receptor.

Es importante aclarar que la mientras mas cerca estemos de la fuente mas largo es el pre-delay. Se puede ver bien en la imagen que se añade.

Distancia del sonido directo y pre-delay

El pre-delay se expresa generalmente en milisegundos, y para resultados más naturales nuestro cerebro requiere que este tiempo este por debajo de los 50ms. Igualmente, tiempos grandes se puede usar, por ejemplo, para tratar de hacer que el instrumento este mas al frente en la mezcla.

Pre-delay a 0 ms
Pre-delay a 35 ms

Early Reflections (ER)

Poco después del sonido directo, empiezan a llegar al receptor las reflexiones de las superficies de la habitación. La mayoría de estas reflexiones solo “rebotan” una o dos veces en las superficies y llegan a un tiempo mayor a del sonido directo (en realidad a los pocos milisegundos después). Nuestro cerebro los identifica como un sonido discreto que esta correlacionado a la señal original. Proveen a nuestro cerebro información a las características del espacio y también la distancia de la señal al receptor.

Dependiendo de las propiedades del recinto, las ER pueden llegar dentro de los primeros 100 ms luego del sonido directo. Cabe destacar que las ER dentro de los primeros 35 ms entran en la zona Haas y por lo tanto nuestro cerebro las distinguen de una de una manera un poco diferente (una diferencia muy pequeña digamos)

El nivel de las ER sugiere que tan grande es el recinto. Una habitación grande tendrá sus superficies más alejadas del receptor, por lo tanto, estas reflexiones deberán viajar largas distancias y serán más bajas.

Con relación a la profundidad, el nivel de reflexiones tempranas podría tener nuevamente un efecto opuesto a lo que inicialmente parece. Cuanto más lejos esté el oyente de la fuente de sonido, mayor será la distancia que recorre el sonido reflejado, es la diferencia en la distancia de viaje entre los sonidos directos y reflejados lo que importa aquí: una fuente de sonido cercana tendrá una ruta directa muy corta pero una ruta reflejada larga. Cuanto más lejos está la fuente del oyente, menor será la diferencia de distancia entre los dos caminos. En la práctica, cuanto más lejos estén la fuente y el oyente, el sonido directo y el reflejado estarán más cerca en nivel (ER más fuertes denotan una mayor distancia entre la fuente y el receptor)

Reverberación (reflexiones tardías)

La reverberación consiste en las reflexiones que rebotan en varias superficies. Como el sonido es absorbido para vez que golpea una superficie, estas reflexiones a medida que rebotan con mas superficies, mas se absorben, dando como resultado una reverberación que decae en amplitud. El nivel de la reverberación es un factor importante en nuestra percepción de profundidad.

Ratios de reverberación y dimensión

La reverberación es la herramienta principal que se emplea para añadir profundidad a la mezcla. Para entender como se hace, primero es importante entender que pasa en la naturaleza.

La ley de la inversa del cuadrado define como un sonido decae en amplitud en relación a la distancia que recorre. Por ejemplo, si el sonido a un metro de distancia provoca 60dB SPL, el sonido 5 metros mas lejos decaerá 14 dB (a unos 46 dB SPL). Se debe tener en claro que mientras mas lejos se encuentre el oyente de la fuente, el nivel del sonido directo se escuchara con menos nivel. Como la reverberación es una colección densa de todas las reflexiones del recinto, y si bien esas reflexiones caen en nivel, sumando todas resulta en un sonido relativamente alto.

Si el receptor se encuentra a 1 metro de la fuente, supongamos que escucha el sonido directo a 60 dB SPL y la reverberación a 43 dB SPL. Si el oyente se va alejando de la fuente, el sonido directo se escuchará mas bajo, pero la reverberación seguirá estando en el mismo nivel. A cierta distancia tanto el nivel del sonido directo como el de la reverberación estarán al mismo nivel, a esa distancia se la llama distancia crítica.

El ratio directo-reverb es comúnmente usado en la mezcla en orden para colocar un instrumento más lejano dentro del plano. Como muchos plug ins no tienen un control separado para controlar la reverberación, generalmente conseguimos este efecto con el control de dry/wet.

Decay Time

¿Cuánto tiempo tarda en la reverb para desaparecer? En acústica, se usa una medición que se llama RT60, que es cuando el sonido decae 60dB. En términos prácticos, 60dB es la diferencia entre un sonido muy alto y un sonido apenas se puede percibir. En términos reales podemos hablar que en una habitación chica un tiempo de decaimiento puede ser unos 20ms, mientras que en una iglesia puede llegar a tomar unos 4 segundos aproximadamente.

Nuevamente el tiempo de decaimiento nos da una pista sobre lo grande que es una habitación. Nos da también una pista sobre que tan reflectiva son los materiales que esa habitación tiene.

En los plug ins podemos encontrar que el control “size” controla (valga la redundancia) el tiempo de decaimiento.

Tiempo de decaimiento a 0,2 s
Tiempo de decaimiento a 3,6 s

Size

Este parametro determina la dimensión del recinto simulado, y en la mayoría de los casos está linkeado con el tiempo de decaimiento y las primeras reflexiones (ER). Cambiando este control trae como consecuencia los cambios en las dimensiones del recinto, un «size» chico simula una habitación pequeña, por ejemplo, un baño. Por el contrario, un «size» grande simula un recinto grande, por ejemplo, una iglesia, un estadio, etc. Esto combinado con el control del tiempo de decaimiento podemos hacer mas pronunciado esta simulación.

Size de 0,25
Size de 4

Density

El parámetro de la densidad en un plug ins puede venir para las ER, para la reverberación o unificada para ambas.

La densidad nos da una idea del tamaño de la habitación, donde unas reflexiones densas sugieren una habitación pequeña (el sonido rápidamente refleja y se re-refleja en las superficies cercanas)

Seteos altos nos ayudan a suavizar los transientes en los elementos percusivos. Por el contrario, seteos bajos causan un efecto metálico similar al “flutter echo”. ¡¡¡Pero!!!, este tipo de seteos puede retener cierta claridad cuando se aplican a sonidos con un gran sustain, como los pads o voces.

Ratio densidad de 0,25
Ratio densidad de 4

Difussion

El término difusión se usa para describir la dispersión del sonido. Un sonido en un campo correctamente difuso, trae como beneficio una respuesta mas uniforme en las frecuencias. Diferentes plug ins tratan de imitar el comportamiento de lo que pasa en la naturaleza de muchas maneras. En la mayoría de los casos esta implementación es muy básica a lo que realmente ocurre. Densidad y difusión muchas veces se confunden porque su efecto es muy similar. Debido a esta variedad de formas, es esencial leer el manual del plug ins que estemos usando para ver como es su implementación y luego probar diferentes seteos para ver cual se adapta mejor a nuestra mezcla.

Frecuencia y damping

El tratamiento para las frecuencias en las reverb puede ocurrir en tres puntos a lo largo de su camino:

  • Pre-reverb
  • Damping
  • Post-reverb

Algunos emuladores traen estos tres controles por separados. Otros ofrecen solo el control de damping. De todas maneras, si nuestro plug ins no trae el control de Pre-reverb ni el de Post-reverb, manualmente podemos insertar un EQ en nuestra señal.

Usar EQ Pre-reverb: las frecuencias graves pueden producir una reverb larga, bien “boomy”. Un filtro pasa alto antes de la reverb puede prevenir esto, filtrando el contenido de las frecuencias graves (bombos, bajos, etc) Mucha información de frecuencias agudas pueden producir una luminosa y una poco deseada cola en la reverb.

Damping se refiere al comportamiento de las frecuencias a lo largo del tiempo. Frecuencias agudas son fácilmente absorbidas: toma solo 76mm de lana de vidrio para absorber frecuencias mayores a 940Hz. Mientras que tomaría 1 metro de lana de vidrio poder absorber frecuencia de 94Hz. Las frecuencias altas también son absorbidas por el aire, especialmente cuando el sonido viaja grandes distancias. La reverb natural de un espacio absorbente hace que las frecuencias agudas decaigan mas rápido que las graves, dando como resultado un contenido pobre en frecuencias agudas a lo largo del tiempo.

Este parámetro usualmente representa el ratio entre el decaimiento de la reverb y el decaimiento de la frecuencia. Por ejemplo: un tiempo de decaimiento de 4 segundos y un damping HF de 0.5 significa que las frecuencias agudas decaerán dentro de los 2 segundos. Si el plug ins solo tiene un control de “damping” es probable que solo ajustaran el damping en las frecuencias agudas (HF)

HF damping: ratio 0,25 en 2500 Hz
HF damping: ratio 1 en 2500 Hz

Usar EQ Post-reverb: ayuda a mezclar la reverb en nuestra mezcla. Atenuando las frecuencias agudas nos ayuda a incrementar la lejanía del instrumento. Frecuencias graves pueden hacer que nuestra reverb sea mas grande, mas impactante y cálida.

Teniendo un buen manejo de estos controles nos ayudan a posicionar los elementos en el plano Z (hablando en un plano de 3D). O dicho de otra manera, nos ayuda a darle profundidad a nuestra mezcla.

Bongo Cerca
Bongo Lejos

Compresores

¿Qué hace un compresor? ¿Cuáles son sus controles básicos? ¿Qué pasa cuando comprimo demasiado un instrumento?

Creo que el compresor es la herramienta más usada y también la herramienta «más mal usada» (¿hay una mejor manera de escribirlo?). No es un secreto que los compresores puedan hacer el sonido más fuerte, más grande, más potente. Tampoco es un secreto, desde que los compresores se han añadido en cada canal en las consolas analógicas, que la cantidad de compresión en las mezclas ha crecido constantemente, desde compresiones transparentes, a evidentes, pasando a compresiones “heavy”, a hiper-comprimidas, y también a ultra-comprimidas.

Si el compresor es usado incorrectamente suprime la dinámica. La dinámica es un aspecto crucial de una pieza musical y un gran “mensaje” de la expresión musical.

Se puede hacer una analogía con la vida cotidiana para entender el concepto del mal uso del compresor y que aburrida que puede hacerse una pieza musical. Pensemos que imposible serían nuestras vidas si no pudiésemos alterar la potencia de nuestras voces. ¿Qué aburrido sería nuestra forma de cantar? Es por eso que un compresor mal usado y que hiper comprime a la música pierde el sentido y se escucha siempre igual.

Hay un ejercicio que es interesante hacer, que es escuchar un disco de los años ’90 y compararlo con un disco de pop de esta época. Con el mismo volumen van a notar que el disco pop de esta época va a sonar mucho mas fuerte que el disco de los ’90. Esto es porque hay una “guerra del volumen” (no voy a profundizar en el tema, pueden buscar en Google donde hay varios resultados interesantes) Me refiero a que hoy el que se escucha mas fuerte gana presencia. ¿Porqué hablo de esto? Por que me parece interesante saber a como el compresor se puede usar de una forma para lograr un objetivo de hacer el sonido mas fuerte.

Mas adelante en el post voy a subir un archivo de un piano donde va a estar sin compresión, otro comprimido de la forma en la cual fue mezclado, y por último un audio comprimido de una forma excesiva para que se vea claramente en como la dinámica se pierde y suena todo igual.

Controles Principales

Umbral

Define el nivel en donde la reducción (compresión) empieza. Cualquier señal que exceda ese nivel es considerada una señal comprimida (será reducida en nivel) La señal que esté por encima del umbral no será comprimida. Generalmente se calibra en dB.

Umbral

Hay dos tipos de umbral. Un umbral variable o umbral fijo. Un compresor con el umbral variable ofrece un control especialmente para establecer el umbral. En cambio, uno fijo, que no tiene un control específico para establecer el umbral, ofrece un control de ganancia de entrada. Mientras más aumentemos el nivel de entrada más alto será el umbral.

Por ejemplo, si el umbral está establecido en 2 dB y el nivel de señal es de 6 dB, la cantidad que sobrepasa es de 4dB. Si el nivel de la señal está por debajo del umbral la cantidad que sobrepasa es 0 dB.

Ratio

El ratio se puede comparar con la gravedad. La gravedad afecta a los objetos forzándolos a quedarse en el suelo. El ratio determina el grado por el cual la señales que sobrepasan el umbral son forzadas hacia abajo. Mientras mas chico es el ratio, mas fácil es para la señal saltar más alto arriba del umbral.

Ratio

Una vez que la señal sobrepasa el umbral, este control determina el ratio entre los cambios del nivel de entrada y los cambios de la señal de salida (la notación usada es entrada:salida) Por ejemplo, con un ratio 2:1, un incremento de 2 dB en la señal de entrada por encima del umbral, resultara en un incremento de 1 dB en la señal de salida por encima del umbral. Pongo esta imagen donde hay más ejemplos.

Ratio

En las imágenes el umbral esta seteado en -12 dB y el nivel de entrada es de -6 dB (6 dB por encima del umbral). Con un ratio de 2:1 la señal deja al compresor a -9 dB (3 dB por encima del umbral). Con un ratio de 6:1 la señal lo deja a -11 dB (1 dB por encima del umbral), y con un ratio de inf:1 la señal deja al compresor a la misma señal que el umbral.

Tiempo de ataque y de liberación

Los compresores modernos pueden responder instantáneamente a los cambios de nivel. En orden para retener algo del ataque natural del instrumento, o que el nivel inicial del sonido del instrumento se vea poco afectado o directamente que el compresor no afecte su sonido. Para hacerlos necesitaremos bajar los tiempos de respuesta del compresor.

El ataque y la liberación también se conocen como constantes de tiempo o tiempos de respuesta. El ataque determina qué tan rápido puede aumentar la reducción de ganancia, mientras que la liberación determina qué tan rápido la reducción de ganancia puede caer. Esencialmente, un ajuste más largo en cualquiera de ellos simplemente ralentizará la velocidad a la que la reducción de ganancia aumenta (ataque) o disminuye (liberación).

Generalmente los tiempos de ataque y liberación se establecen en milisegundos. El ataque usualmente varía entre 0,010 ms y 250 ms. El tiempo de liberación se sitúa dentro del rango de 5 a 3000 ms. Es importante entender que ambos tiempos determinan la rapidez en que la reducción de la ganancia puede cambiar y no el tiempo que toma en cambiar. En la práctica, ambos definen que tanto tiempo tardan en cambiar la reducción de la ganancia establecido por la cantidad de dB. Por ejemplo, 1 segundo en el tiempo de liberación denota que la reducción de la ganancia toma un segundo en caer 10 dB.

La siguiente figura muestra el efecto en la forma de onda con diferentes tiempos de ataque y liberación. En todos los gráficos tienen un ratio de 2:1 y el umbral es de 6 dB. La señal de entrada (a) aumenta instantáneamente desde los 6 dB a los 12 dB, después nuevamente cae instantáneamente a 6 dB. En todos los casos la cantidad que sobre pasa es de 6 dB, así que con el rato de 2:1 la cantidad de ganancia que reduce es de 3 dB. Podemos ver en (b) que si no hay tiempo de ataque y relajación la señal que sobre pasa el umbral es constantemente reducida en 3 dB. Cuando hay algo de tiempo de ataque y de relajación (c-e) toma un cierto tiempo antes de que se complete la reducción en la ganancia, y también cierto tiempo hasta que la reducción de la ganancia decaiga.

Ataque y Liberación

Ejemplo

A continuación dejo dos audios de una grabación que realice de unas teclas para una canción. La idea acá es mostrar el sonido al «natural», sin compresión. A continuación, el mismo segmento pero con una compresión brutal para que se pueda entender como el sonido queda flaco, sin dinámica y, desde mi punto de vista, feo.

Tecla sin compresión
Tecla con compresión (agresiva)

Se podrá escuchar que la tecla pierde su naturalidad. Sobre todo su ataque en la nota y suena sin sentido. Sin dinámica. Personalmente prefiero usar el compresor como un control sobre el toque (hay casos en el cual salteo esta regla para hacer sobresalir un instrumento).

Eso es todo por ahora. Nos vemos en el próximo post!!!

¿Qué es mezclar?

Se podría sintetizar en una respuesta como la siguiente: Es un proceso técnico-artístico. Técnico porque los sonidos son balanceados, tratados y combinados. Artístico porque como todo arte, es una representación de emociones, ideas creativas.

Siempre buscamos en la música que nos despierte diferentes emociones. Por eso, nosotros como ingenieros de mezcla debemos saber captar lo que la música quiere representar emocionalmente.

Hay un ejercicio que podemos hacer para comparar diferentes mezclas y que nos va a ayudar a diferenciar las mezclas que estamos escuchando. Para hacerlo debemos crear una sesión en cualquier DAW e importar unos 20 segundos de las canciones que nos gustan o que nos despierten diferentes emociones. Recomiendo hacer un cross over entre canción y canción. Darle play y prestar atención a las diferentes mezclas y anotar que emociones nos despiertan. Después estas canciones nos pueden servir para referencias.

¿A qué nivel?

En 1993 2 investigadores de Bell Labs, Harvey Fletcher y W.A. Munson llevaron a cabo uno de los experimentos más significativos en la psicoacústica. Los experimentos estuvieron basados en una serie de test sobre un grupo de personas. Cada test implicaba la ejecución de una frecuencia en particular seguida de un tono de referencia de 1KHz. El receptor tenía que escoger cuál de los 2 sonidos era el más fuerte. Sucesivas pruebas incluían diferentes frecuencias a diferentes niveles. Esencialmente lo que Fletcher y Munson trataban de concluir era que tan alto o bajo tenían que estar las frecuencias ejecutadas para percibirse como la de la referencia (1KHz). Los resultados fueron explayados en un gráfico que se conoce como CURVAS FLETCHER-MUNSON.

Curvas Fletcher-Munson

Cada curva del gráfico es conocida como curva fon y está basado en el nivel de referencia de 1KHz. Para dar un ejemplo de cómo se lee, podemos ver la curva de 20-fon donde se aprecia que un tono de 1KHz se ejecuta a 20dBSPL. Para que un tono de 100Hz se perciba igual de fuerte, este tono tiene que ser ejecutado a 50dBSPL.

El gráfico también nos muestra que nuestra percepción de frecuencia tiene un alza en 3,5KHz (que es la frecuencia de resonancia del canal auditivo). No es por coincidencia que esa también es la frecuencia del llanto del bebé.

Es evidente que a niveles más altos nuestra percepción de frecuencia se vuelve más pareja. La curva de 0-fon es la más despareja, y la curva de 100-fon es la más pareja.

Otra manera de ver el grafico es que a medida que subimos el nivel de la música se perciben más altos y bajos. Es natural que niveles altos hagan a la música más atractiva.

Mientras más alta se ejecute la música percibimos más altos y bajos en comparación con los medios. El hecho que nuestra percepción de frecuencia se altera en relación al nivel, es una cuestión fundamental en la mezcla.

Es importante entonces verificar nuestra mezcla a diferentes niveles y tratar de hacerla perfecta en todos los niveles.

¿Por dónde empiezo?

Lo primero y principal, es escuchar el tema con los audios en bruto. Nos da una idea general de lo que la canción quiere transmitir. Es importante ir anotando las emociones, o ideas que se nos van ocurriendo. Sirven de mucho a la hora de mezclar. Ideas de paneo, ideas de automatización, ideas de niveles. Si participaste de la grabación, este punto debería estar cubierto. Me refiero a que ya las has escuchado a la canción.

Segundo, es fundamental eliminar todos los sonidos que no sean propios del tema: el buzz de los amplificadores de las guitarras, conteo, charla entre los músicos, tos antes de cantar, etc.

Por último: nombrar las pistas, ordenarlas por instrumentos, etc. Creo yo que teniendo esto listo es más fácil concentrarse en la propia mezcla. Llegar a un nivel de concentración puede llevar tiempo y durante este proceso hay fluidez de creatividad. Si nos olvidamos de eliminar una tos, el golpe de las baquetas, de limpiar el buzz del amplificador, o nos salteamos algunos de los puntos anteriores fácilmente perderemos esa fluidez.

Por último, pongo un gráfico que me pareció interesante en cómo se grafica el proceso de creación y las preguntas que nos tenemos que hacer para conseguir la mezcla «perfecta».

Hasta el próximo post

Reflexiones

¿Cómo se ve una reflexión? ¿cómo afecta a la respuesta en frencuencia? ¿cómo se tratan?

Siempre son interesantes las preguntas. Te permiten ver el problema y poder buscar una solución, creo yo, de una manera mas directa.

Realice una simple prueba (digo, simple porque las mediciones de las reflexiones se realizan de otra forma, con planificación, con tiempo y se toman mediciones de todos los «angulos» posibles, etc) lo que busqué es ejemplificar de una manera brusca las preguntas que me hice.

Me puse en marcha entonces a realizar varias mediciones en mi estudio y a guardar las fotos que generaban estas mediciones. Respuesta al impulso, gráfico ETC y la respuesta en frecuencia del punto de escucha (donde me siento para mezclar). Utilice:

  • Micrófono de medición Behringer ECM-8000
  • Placa de audio M-Audio Delta 1010LT
  • Monitores Behringer Truth 2030P
  • ARTA Software (versión shareware)
  • Pie, cables, café, galletitas

Un tratamiento acústico trata de reducir las reflexiones en el punto de escucha y que solo llegue el sonido directo de los parlantes, sin ninguna interferencia, ni reflexión para que no se sume al sonido directo. En este ejemplo coloqué la consola de una manera para que me exagere las reflexiones y se pueda ver bien lo que genera. Sumado las reflexiones que me provoca la pared detrás mío (lamentablemente no tengo fotos para que se pueda ver bien, y al momento de escribir esto ya tengo todo acomodado y ordenado).

Aclaración: solo muestro los efectos que tiene en las frecuencias agudas. Por lo tanto sugiero que a los gráficos les presten atención desde los 4 Khz para arriba.

Con esto aclarado, veamos que sucede con la medición. Usé un barrido de frecuencia. Al micrófono lo coloqué en el punto de escucha.

Primera medición

El primer pico es el sonido directo. El que esta en rojo es de la consola y los azules de las paredes.
Gráfico ETC de la medición (lo ideal es que esten por debajo de los -15 dB). El primer pico es de la consola, los demás de la pared.
Respuesta en frecuencia

Es interesante ver como afectan estas reflexiones a la respuesta en frecuencia en el punto de escucha (como va a colorear lo que se emite de los parlantes) Vemos que hay varios picos en la respuesta y varias cancelaciones. ¿Cuál es el inconveniente? y que lo que vas a estar escuchando no va a ser realmente lo que es. Va a estar coloreado

Segunda medición

La siguiente medición la hice con material absorvente sobre la consola. Lo que busqué acá, es mostrar de una forma brusca, como eliminar esas reflexiones y ver como cambia la respuesta en frecuencia.

Respuesta al impulso. Claramente se ve como eliminamos esa reflexión
En el gráfico ETC también se ve la mejoría
La respuesta de frecuencia se ve algo mas plana

Tercera medición

Ya con el absorvente en la consola, coloqué mas absorventes en la pared que hay detrás del punto de escucha. Veamos que sucedió:

Respuesta al impulso. Ya se eliminaron las reflexiones problemáticas
Los tres picos del principio ya están bastantes reducidos. Los picos que estan marcados en azul: el del medio corresponde a la tercera reflexión que veíamos en la respuesta al impulso. El primero y el último corresponden a reflexiones de otras paredes que, como están por debajo de los -15 dB no «molestan»
La respuesta final

Por último muestro la respuesta en frecuencia de la primera medición y la última con la fase para ver claramente un filtro peine.

Si bien, como vengo aclarando desde el principio, es una manera brusca de mostrar como afectan las reflexiones, me pareció interesante mostrar gráficamente como se ven.

Nos vemos en la próxima!!

Mezcla – Everlong (cover por Lusaka Trio)

Buenas a todos!. En este entrada trataré de explicar los procesos que use para mezclar el tema Everlong de FooFighters. Cover realizado por Lusaka Trio

La grabación del tema se realizo en vivo junto con otros dos temas más (que explicaré en otras entradas). El técnico de grabación de ese día fue Mariano (https://www.instagram.com/wettsma/)

El trio se compone por batería, bajo y guitarra. Pueden entrar al instagram para ver y conocer mas sobre ellos y próximas fechas. Dejo el link: https://www.instagram.com/lusaka.trio

BOMBO

Lo primero que mezclo siempre es la batería ya que me da los cimientos para empezar a «contruir» la canción. Hay algunas veces que empiezo desde el estribillo, otras veces sigo la canción. Particularmente acá seguí de acuerdo a como se me presentaba la canción.

Una vez que saco los ruidos propios del toque empiezo por el bombo. Usé plug-ins Waves, los que elegí fueron: API-2500, EQ-1 Band y PuigTec EQP1A.

Plug-ins usados para el bombo
Plug-ins usados para el bombo

Con el compresor controlé los golpes, mas alla que el baterista grabó cada golpe con un nivel parejo, preferí un nivel de compresión moderado. Al umbral, ataque y ratio lo configure para que solo comprima unos 3 dB.

Seguido al compresor puse el Waves PuigTec. Últimamente lo estoy usando en todos los bombos que estoy mezclando. Le da un carácter y un «soplido» en los agudos que me gustan mucho. Baje los 100Hz para que se acople con el bajo y le subi a los 3000Hz para darle fuerza al «kick». El otro EQ lo usé para sacar el «moody» propios de los cuerpos de la bateria.

REDOBLANTE

En la caja, usé por primera vez el Addictive Trigger (versión de prueba por 30 días que al momento de escribir se vencieron los días). Me pareció super fácil de usar. Pueden entrar a la página oficial para verlo y usuarlo por 30 días (https://www.xlnaudio.com/products/addictive_trigger). Decidí cambiarlo porque el redoblante que se usó para grabar no se acoplaba bien en la canción, no me gustaba. Mas allá que el propio redoblante tenía problema con resonancias (generalmente se arregla en la grabación con diferentes técnicas, pero se decidió arreglarlo en la edición por tema de presupuesto), por lo tanto preferí «samplearlo». Para darle ambiente lo único que hice fue enviarlo a la reverb general.

TOMS

Grabó con 2 toms. Bajé varios dB en el rango de los 500Hz con un Q bajo para sacar el «moody» en los cuerpos (al igual que en el bombo). Al tom agudo lo paneo a la izquiera, al tom 2 a la derecha. Siempre mezclo la bateria con la «vista» del baterista. En este caso al ser derecho al tom agudo fue para la izquierda y el toma mas grave al centro-derecha. Si fuera izquierdo, al paneo lo haría al revés (tom 1 a la derecha, tom 2 al centro-izquierda)

Use en ambos casos una puerta de ruido para esconder los golpes de los otros cuerpos y el sonido que venía de los amplificadores del bajo y la guitarra (recuerden que se grabó en vivo). Después use un compresor ya que al medio de la canción hace varios pasajes por los toms y me interesaba contener algunos golpes. El promedio serán unos 3dB que comprimo.

OVERHEAD

Lo primero que hago es agruparlos y panear al 100% izquierda y derecha. Usé un filtro pasa altos aproximademente en los 1000Hz y un DeEsser para sacarles un poco de brillo y que encaje mejor en el sonido general.

Cabe destacar que los overhead le dan el brillo general a la mezcla. En mi mezcla preferí sacarles el brillo y darle un sonido mas melancólico Desde el primer momento que escuche la grabación quería dirigir la mezcla para ese sonido. La otra razón por la cual baje el brillo en los OH es que quería darle un protagonismo sonoro al redoblante. Finalmente al grupo lo enviaba a la reverb general que coloqué.

Plug-ins usado en Overhead

BAJO

El bajo funciona como «pad». Usé un compresor que comprime en promedio unos 3dB y un ecualizador para atenuar los 60Hz y realzar los 5KHz. Al bajo lo envie también al reverb general. Mas para hacer no había ya que el propio bajista tenia sus propios efectos con su compresor.

Plug-ins usados en el bajo

GUITARRA

Al ser la voz principal, la puse al centro. Al igual que el bajista, trajo sus efectos por lo que me dedique de ecualizar para que encaje en la mezcla. Agregue compresor para controlar algunos pasajes que tienen mucho ataque por lo que configure el compresor para controlar esos golpes

Plug-ins usados en guitarra

AUDIO .MP3

Audio mezcla final

Gate – puerta de ruido

¿Qué son las puertas de ruido? ¿Cuáles son los controles que se utilizan?

Después de los compresores, las puertas de ruido son los procesadores dinámicos mas populares. Particularmente el uso que le da es para eliminar el ruido o sonidos indeseados. Por ej., si tomamos el micrófono de un toms, todo ruido «ajeno» al sonido del toms se podrían considerar ruidos o sonidos indeseados.

Controles mas comunes

Umbral: Las puerta de ruido afectan a la señal que está por debajo del umbral. Las señales que estan por encima del umbral pasan directamente sin ser afectadas. Generalmente se usa la palabra abierta o cerrada para indicar cuando la señal está por encima del umbral o por debajo. Seteamos el umbral justo por debajo de la señal que queremos que pase y encima de la señal que no queremos que pase.

Ataque y relajamiento: El ataque es el control que ajusta que tan rápido la puerta se abre. Por la otra parte, el relajamiento ajusta que tan rápido la puerta se cierra. Los tiempos de respuesta generalmente están en milisegundos. Los tiempos de ataque usualmente varían en el rango de los 0,010 ms a los 100 ms. Los tiempos de relajación varían en un rango de entre los 5 a los 3000 ms.

Mantener: Una vez que la señal paso el umbral (que está por encima) este tiempo (hold en inglés) determina que tanto la señal es retenida sin ser alterada. Por ejemplo, si se aplica 2 segundos en este control, significa que la señal será retenida durante 2 segundos. Luego que se cumpla ese tiempo, comienza la fase de relajación. Es común encontrarse con valores que varian de 0 a 5 segundos.

En muchas ocaciones reemplaza al release en la tarea de retener el decaimiento natural del instrumento. Hay dos razones para esto. Primero, es que un seteo largo en el release no es siempre práctico ya que se puede dar el caso en que no termina de «relajarse» y una nueva señal sobrepasa el umbral. Segundo, teniendo el tiempo de relajación configurado correctamente a medida que la señal cae por debajo del umbral, causa un decaimiento escalonado. Usando el control hold permite mantener el decaimiento natural del sonido del instrumento.

El control hold mantiene el caracter natural del decaimiento

Como ejemplo voy a subir dos archivos que es el audio de el tom agudo de la grabación de una batería. Coloqué la puerta de ruido para eliminar todos los ruidos (me refiero a los sonidos que no son propios del tom -por ejemplo: la batería, los platillos, la caja). El primer archivo es el sonido sin la puerta y el segundo archivo es con la puerta.

Tom sin gate
Tom con gate

Hola!!

Germán Wettstein es mi nombre. Soy Técnico en Sonido egresado de La Metro, en el año 2007.

Desde ese entonces estoy en mi estudio de grabación (www.adipalestudio.com.ar) encargado de las grabaciones y las mezclas que se realizan en el estudio.

La idea de este blog es contar experiencias, comentar sobre equipamientos y todo lo relacionado.

Nos vemos en el próximo post.