Dither - "Error de cuantización"
Cuando el audio es digitalizado mediante un conversor analógico a digital (ADC) –por ejemplo, cuando grabas desde tu placa de audio, y lo envías a tu DAW, entonces la señal de audio analógica de tu micrófono o se transforma en una serie de unos y ceros. Eso es lo que obtienes, una representación digital de tu audio. Para lograr eso, el ADC captura instantáneas (también conocidas como "muestras" o samples) de tu audio a una velocidad y tamaño específicos, a los que hacemos referencia como la velocidad o frecuencia de muestreo y la profundidad de bit (también conocida como resolución).
La frecuencia de muestreo determina la cantidad de muestras que el convertidor captura por unidad de tiempo (en un segundo) para digitalizar el audio, y es fundamental en términos de la respuesta en frecuencia que se obtiene. La regla general, basada en el Teorema de Nyquist, es que debes tener una frecuencia de muestreo mayor o igual a dos veces la frecuencia más alta presente en el audio que te dispones a digitalizar. De lo contrario, un cierto tipo de distorsión llamado "aliasing" puede estropear el sonido resultante tras el muestreo.
Y así las cosas, para capturar frecuencias de hasta 20kHz, que es el rango alto de audición del oído humano, la frecuencia de muestreo más baja que se usa comúnmente es de 44.1kHz (la tasa en la especificación CD-Audio Red Book). Pero en estos días, las tasas de 48kHz o superiores también son muy comunes. Aquí la clave a recordar es que cuanto mayor sea la velocidad o frecuencia de muestreo, mayor será la precisión que se consigue para reproducir el rango de frecuencias.
La profundidad de bit o resolución (también conocida como «longitud de palabra») se refiere al tamaño de cada muestra, en términos del número de unos y ceros que puede contener. Cuantifica la precisión con la que se representa la amplitud de la señal en cada momento y, por lo tanto, el rango dinámico, que en este caso se puede describir como la diferencia entre los sonidos más altos que es posible capturar y el nivel mínimo de ruido.
Cuanto mayor sea la profundidad de bit, más precisa será la descripción de la amplitud. Y cuando comparas audio de 16 y 24bit, la diferencia en la resolución resulta ser bastante sorprendente. El audio de 16bit puede representar hasta 65.536 niveles discretos de amplitud, mientras que 24bit tiene la capacidad de 16.777.216 niveles. En términos de rango dinámico, cada bit es equivalente a unos 6dB. Y de ese modo, con 16bit obtenemos 96dB (16×6), y con 24bit alcanzamos 144dB (24×6).
Cuando convertimos un archivo desde una resolución de 24 a 16bit, el software de audio digital elimina (o "trunca") los últimos 8 bits y redondea los datos para ajustarlos al menor número de dígitos disponibles. Este proceso se conoce como "cuantización". Aunque es un proceso diferente al de cuantizar notas MIDI en un secuenciador, es similar en concepto. En una secuencia MIDI, cuando tomas una frase de semicorcheas y la cuantizas a corcheas, tu DAW tiene que reasignar las semicorcheas que aún no caen sobre una subdivisión de 1/8 de nota a la corchea más cercana. Así que la resolución musical se ve reducida.
Una solución ante el problema que hemos descrito consiste en aplicar DITHERING siempre que guardes el archivo a una frecuencia de muestreo más baja. Cuando se agrega dithering al audio con distorsión de cuantización, se enmascara el problema (es un proceso conocido como "descorrelación"), haciendo que sea más aleatorio y, por tanto, más difícil de discernir para el oído. Así que en lugar de sonar áspera y enrejada, la distorsión de cuantización se convierte en un silbido analógico constante, de bajo nivel.
Otro término que verás en software y plugins que ofrecen utilidades de dithering es el "modelado de ruido" (o noise shaping). Se refiere a lo que es en esencia una ecualización para el dithering, que está diseñada para cambiar las características en frecuencia del ruido de interpolación de modo que suene en un rango menos audible para el oído.
Cuando tu DAW o editor cuantiza la resolución al convertir el audio de 24 a 16bit (o desde 32 a 24bit, o cualquier otra reducción similar), hay muchos menos pasos disponibles para asignar los niveles de amplitud. Y como resultado, el redondeo puede causar un fenómeno llamado error de cuantización (también conocido como «distorsión de cuantización» o «distorsión de truncamiento»), y éste se manifiesta como ruido o distorsión de bajo nivel.
Cuando vamos a realizar una grabación en un DAW, tenemos que elegir una frecuencia de muestreo y una profundidad de bits. Esto va a ser clave en la calidad de los audios que creemos, ya que, con estos parámetros estamos eligiendo la resolución de la grabación (es extremadamente importante que configuremos esto a conciencia).
Como es lógico pensar, cuanto mayor sea la frecuencia de muestreo y cuanto mayor sea la profundidad de bits, mayor será la resolución que consigamos en nuestra grabación, pero a su vez, obtendremos unos archivos de mayor tamaño con los problemas que esto ocasiona.
Cuando redujimos la resolución, tuvimos que desechar mucha de la información del archivo que nos permitía ver los detalles. Cómo se desecha esa información es la razón por la que el dithering es importante. Mantener los errores al mínimo tiene un impacto grande. Imagina que tenemos que cambiar archivos de 24-bits a 16-bits. Para hacerlos caber, toda la información de los 24 bits originales tiene que entrar en el espacio de 16-bits.
Esto significa que algo tiene que quedarse fuera. Pero ¿cómo puedes hacer el menor daño posible?
La primera opción es simplemente recortar los números para hacerlos caber. Esto se llama truncamiento y es la forma menos precisa de solucionar el problema. En vez de simplemente cortar los números, podemos tratar de redondearlos hacia arriba o abajo para que se acerquen más a la representación de los 24-bits en 16-bits.
Pero ¿Qué pasa cuando el número que necesitas redondear está justo en el medio?
Puedes intentar una regla general— digamos que decides redondear hacia arriba cada vez que encuentras un número justo en el medio. De esta forma estarás en lo correcto al menos algunas veces. El problema es que el resultado será incorrecto con la misma frecuencia. Esto se llama error de redondeo.
El ruido (o variación aleatoria) que añade el dithering básicamente vuelve aleatoria la decisión de redondear hacia arriba o hacia abajo. Después de aplicar dithering, la distorsión que sea habría creado con el truncamiento o el redondeo tiene un efecto mucho menos perceptible.
Consideraciones:
Comentarios
Publicar un comentario