Dither - "Error de cuantización"

El dithering es un tipo de ruido de baja amplitud (ruido blanco) que añadimos de forma intencionada a nuestro archivo de audio en el momento en el que vamos a reducir la profundidad de bits, como, por ejemplo, cuando reducimos un archivo de audio de 24bits a 16bits.

Es una forma de ruido de bajo nivel que se agrega intencionalmente a un archivo de audio digital cuando se procesa a una menor profundidad de bit. El concepto de dithering puede parecer contrario a la intuición, pero es un proceso efectivo. El ruido interpolado en realidad enmascara lo que se denomina "distorsión de cuantización", que origina ruido y artefactos en el audio digital.

Cuando el audio es digitalizado mediante un conversor analógico a digital (ADC) –por ejemplo, cuando grabas desde tu placa de audio, y lo envías a tu DAW, entonces la señal de audio analógica de tu micrófono o se transforma en una serie de unos y ceros. Eso es lo que obtienes, una representación digital de tu audio. Para lograr eso, el ADC captura instantáneas (también conocidas como "muestras" o samples) de tu audio a una velocidad y tamaño específicos, a los que hacemos referencia como la velocidad o frecuencia de muestreo y la profundidad de bit (también conocida como resolución).

La frecuencia de muestreo determina la cantidad de muestras que el convertidor captura por unidad de tiempo (en un segundo) para digitalizar el audio, y es fundamental en términos de la respuesta en frecuencia que se obtiene. La regla general, basada en el Teorema de Nyquist, es que debes tener una frecuencia de muestreo mayor o igual a dos veces la frecuencia más alta presente en el audio que te dispones a digitalizar. De lo contrario, un cierto tipo de distorsión llamado "aliasing" puede estropear el sonido resultante tras el muestreo.

Y así las cosas, para capturar frecuencias de hasta 20kHz, que es el rango alto de audición del oído humano, la frecuencia de muestreo más baja que se usa comúnmente es de 44.1kHz (la tasa en la especificación CD-Audio Red Book). Pero en estos días, las tasas de 48kHz o superiores también son muy comunes. Aquí la clave a recordar es que cuanto mayor sea la velocidad o frecuencia de muestreo, mayor será la precisión que se consigue para reproducir el rango de frecuencias.

La profundidad de bit o resolución (también conocida como «longitud de palabra») se refiere al tamaño de cada muestra, en términos del número de unos y ceros que puede contener. Cuantifica la precisión con la que se representa la amplitud de la señal en cada momento y, por lo tanto, el rango dinámico, que en este caso se puede describir como la diferencia entre los sonidos más altos que es posible capturar y el nivel mínimo de ruido.

Cuanto mayor sea la profundidad de bit, más precisa será la descripción de la amplitud. Y cuando comparas audio de 16 y 24bit, la diferencia en la resolución resulta ser bastante sorprendente. El audio de 16bit puede representar hasta 65.536 niveles discretos de amplitud, mientras que 24bit tiene la capacidad de 16.777.216 niveles. En términos de rango dinámico, cada bit es equivalente a unos 6dB. Y de ese modo, con 16bit obtenemos 96dB (16×6), y con 24bit alcanzamos 144dB (24×6).

Cuando convertimos un archivo desde una resolución de 24 a 16bit, el software de audio digital elimina (o "trunca") los últimos 8 bits y redondea los datos para ajustarlos al menor número de dígitos disponibles. Este proceso se conoce como "cuantización". Aunque es un proceso diferente al de cuantizar notas MIDI en un secuenciador, es similar en concepto. En una secuencia MIDI, cuando tomas una frase de semicorcheas y la cuantizas a corcheas, tu DAW tiene que reasignar las semicorcheas que aún no caen sobre una subdivisión de 1/8 de nota a la corchea más cercana. Así que la resolución musical se ve reducida.

Una solución ante el problema que hemos descrito consiste en aplicar DITHERING siempre que guardes el archivo a una frecuencia de muestreo más baja. Cuando se agrega dithering al audio con distorsión de cuantización, se enmascara el problema (es un proceso conocido como "descorrelación"), haciendo que sea más aleatorio y, por tanto, más difícil de discernir para el oído. Así que en lugar de sonar áspera y enrejada, la distorsión de cuantización se convierte en un silbido analógico constante, de bajo nivel.

Otro término que verás en software y plugins que ofrecen utilidades de dithering es el "modelado de ruido" (o noise shaping). Se refiere a lo que es en esencia una ecualización para el dithering, que está diseñada para cambiar las características en frecuencia del ruido de interpolación de modo que suene en un rango menos audible para el oído.

Cuando tu DAW o editor cuantiza la resolución al convertir el audio de 24 a 16bit (o desde 32 a 24bit, o cualquier otra reducción similar), hay muchos menos pasos disponibles para asignar los niveles de amplitud. Y como resultado, el redondeo puede causar un fenómeno llamado error de cuantización (también conocido como «distorsión de cuantización» o «distorsión de truncamiento»), y éste se manifiesta como ruido o distorsión de bajo nivel.

Tu música generalmente enmascara este resultado, pero a veces con audio a 16bit puedes escuchar errores de cuantización en pasajes tranquilos, o cuando la música hace fundidos de entrada o salida. La realidad es que es una forma de distorsión indeseable que casi nadie desea para su música. Algunos técnicos aseguran que aunque no llegues a oír realmente la distorsión de cuantización, hará que la música suene más áspera en general.

El objetivo del dithering, es mejorar la calidad de sonido del audio digital cuando reducimos su resolución. Esta ganancia de calidad se produce al enmascarar la distorsión que se genera al hacer esta reducción llamada “distorsión de cuantización”. Esta distorsión, puede originar ruidos y artefactos muy molestos e indeseados en el audio digital, por lo tanto, usar esta herramienta es una solución realmente efectiva para mitigar este problema.

“Dither” no es sólo un término de audio— y el ruido que añade es más como variación aleatoria.

De hecho, la palabra dither significa “vacilación”. Esta definición viene de cómo se descubrió.
Algunos ingenieros descubrieron que los computadores de las aeronaves tenían mejor rendimiento en vuelo que en tierra.
La vibración del motor del avión ayudaba a aumentar la precisión de las partes móviles de las máquinas.
El ruido que el dithering le añade a tus tracks funciona de la misma forma. Ayuda a aumentar la precisión de tus archivos de audio digitales.

Cuando vamos a realizar una grabación en un DAW, tenemos que elegir una frecuencia de muestreo y una profundidad de bits. Esto va a ser clave en la calidad de los audios que creemos, ya que, con estos parámetros estamos eligiendo la resolución de la grabación (es extremadamente importante que configuremos esto a conciencia).

Como es lógico pensar, cuanto mayor sea la frecuencia de muestreo y cuanto mayor sea la profundidad de bits, mayor será la resolución que consigamos en nuestra grabación, pero a su vez, obtendremos unos archivos de mayor tamaño con los problemas que esto ocasiona.

Cuando redujimos la resolución, tuvimos que desechar mucha de la información del archivo que nos permitía ver los detalles. Cómo se desecha esa información es la razón por la que el dithering es importante. Mantener los errores al mínimo tiene un impacto grande. Imagina que tenemos que cambiar archivos de 24-bits a 16-bits. Para hacerlos caber, toda la información de los 24 bits originales tiene que entrar en el espacio de 16-bits.

Esto significa que algo tiene que quedarse fuera. Pero ¿cómo puedes hacer el menor daño posible?

La primera opción es simplemente recortar los números para hacerlos caber. Esto se llama truncamiento y es la forma menos precisa de solucionar el problema. En vez de simplemente cortar los números, podemos tratar de redondearlos hacia arriba o abajo para que se acerquen más a la representación de los 24-bits en 16-bits.

Pero ¿Qué pasa cuando el número que necesitas redondear está justo en el medio?

Puedes intentar una regla general— digamos que decides redondear hacia arriba cada vez que encuentras un número justo en el medio. De esta forma estarás en lo correcto al menos algunas veces. El problema es que el resultado será incorrecto con la misma frecuencia. Esto se llama error de redondeo.

El ruido (o variación aleatoria) que añade el dithering básicamente vuelve aleatoria la decisión de redondear hacia arriba o hacia abajo. Después de aplicar dithering, la distorsión que sea habría creado con el truncamiento o el redondeo tiene un efecto mucho menos perceptible.

Consideraciones:

Mantén el formato de tus archivos durante todo el proceso de la producción. Es decir, si grabaste a 24bits/44.1KHz, mantén esa calidad durante todo el proceso (producción, mezcla y mastering) y no rebajes la calidad hasta el momento de renderización final.

Aplica dithering siempre que estés creando un archivo de audio CD (16bits/44.1KHz) a partir de archivos a 24 o 32 bits.

No uses dithering hasta que vayas a exportar definitivamente tus archivos. Aplica el dithering solo una vez durante todo el proceso, recomendablemente en la etapa del mastering y como último proceso.

Si envías tus archivos a un técnico de mastering (o lo estás exportando para masterizarlo tú mismo en un proyecto distinto) no apliques dithering y expórtalos a la misma calidad de la creación de los archivos. El ingeniero de masteirng o nosotros mismo en el proyecto de masterización, aplicaremos el dithering en el proceso final.

Aplica dithering solo cuando exportes tu audio a una profundidad de bits menor a la original, como por ejemplo cuando vas a pasar de 32 o 24 bits a 16bits para el bounce final de tu canción.

El dithering debe de ser el último paso en la cadena de mastering. No pongas ningún procesador detrás del dithering.

No hagas dithering varias veces en un mismo archivo de audio. Lo más recomendable es hacerlo al final de la etapa de masteing.

No apliques dithering si vamos a exportar en un formato de audio comprimido como puede ser MP3 o ACC, estos archivos ya tienen su propia compresión y perdida de datos “optimizada”.

Si tu DAW o tu plugin tiene distintos tipos de dithering y no sabes muy bien cual elegir, elige el modo por defecto.

Cuando la adición de dithering sea un asunto de cierta confusión o incluso genere controversia, la mejor pauta de aplicación te la dará el hecho de reducir la profundidad de bit o resolución. Por tanto, si vas a pasar de 24 a 16bit, deberías echar mano del dithering. Y si pasas de 32bit en aritmética sencilla (sin coma flotante) a 24 ó 16bit, por ejemplo, también debes recurrir al dither.

Sin embargo, si te dispones a volcar tu mezcla con un CÓDEC que emplea compresión de datos, como es el caso de las codificaciones en MP3 o AAC, no será necesario para nada el dithering. Y es que ambos son formatos que introducen artefactos en la señal que no se verán remediados por el dithering.

Lo mejor que puedes hacer en esos casos, cuando codifiques audio usando CÓDECs que ocasionan pérdidas de información como los mencionados MP3 y AAC, es recurrir a la tasa de bit (bitrate) más alta que puedas y encontrar un compromiso con el tamaño de archivo requerido para tu plataforma de streaming. Aquí nos parece importante señalar que no hay que confundir el bitrate con la profundidad de bit o resolución. El primero, la tasa de bit, mide la velocidad de transmisión en streaming, y suele ser expresado en kbps (kilobit por segundo), o mbps (megabit por segundo). Cuanto mayor sea la tasa de bit, mejor será la calidad obtenida, aunque por contra, más pesado será el archivo de audio resultante.

Haz dithering sólo cuando renderices tu audio a una profundidad de bit más baja –aunque con salvedades como las que comentamos un poco más abajo.

No hagas dithering en el proceso de volcar audio a los formatos MP3, AAC, o CÓDECs similares con pérdida de datos.

Haz siempre dither si estás creando archivos de 16bit para un CD-Audio a partir de una mezcla de 24 ó 32bit.

No es necesario interpolar con dithering cuando pasas de 32bit en coma flotante a 24bit, porque esa aritmética de 32bit no tiene una mayor resolución. Pero sí debes recurrir al dither si partes de audio a 32bit en aritmética sencilla hacia cualquier resolución más baja.

Si estás preparando archivos de 24 ó 32bit para un servicio de mástering, huye del dithering. Y mejor deja que sea el ingeniero quien se ocupe de ello desde su experiencia.

Asegúrate de que el dithering sea el último paso en tu cadena de procesamiento. Y jamás insertes un procesador después de dicho proceso en tu DAW o editor de audio.

Intenta evitar dos pasadas de interpolación, porque su efecto será acabar con más ruido en tu audio. Dicho esto, si reduces la resolución en bit dos veces durante tu proyecto (lo cual es improbable a menos que comiences con audio de 32bit en aritmética sencilla), debes hacer dithering en cada una de esas conversiones.

Si te confunden las diversas opciones de dither que tu software te presenta, recurre a los valores por defecto. Y si por el contrario te sientes más ambicioso, compara los resultados eligiendo diferentes opciones de dithering y noise shaping para ver cuáles funcionan mejor sobre un determinado proyecto.