Sample Rate (frecuencia de muestreo)/Bit Depth (profundidad de bits)
La frecuencia de muestreo se especifica en kHz y puede ajustarse en la DAW. Si conectas varias interfaces u otros dispositivos de audio digital, tendrás que ajustar todos los dispositivos a la misma frecuencia de muestreo, pero la mayoría de las interfaces de audio USB y Thunderbolt ajustan automáticamente su frecuencia de muestreo para que coincida con la de la DAW.
Por regla general, se dispone de las siguientes frecuencias de muestreo: 44,1 kHz, 48 kHz, 96 kHz, 192 kHz. Estos números no se eligen al azar, sino que tienen una razón de ser.
44,1 kHz
Esta frecuencia de muestreo se eligió para el formato de disco compacto (CD) a finales de la década de 1970. La razón de esta elección es algo complicada. Está relacionada con la frecuencia más alta que se puede reproducir con precisión (la frecuencia de Nyquist, que es la mitad de la frecuencia de muestreo).
La frecuencia más alta que puede oír la mayoría de la gente ronda los 20 kHz, por lo que una frecuencia de muestreo de 40 kHz sería teóricamente suficiente. Sin embargo, se utiliza un filtro para evitar el aliasing, y este filtro no es perfecto: necesita un ancho de banda de transición. Por eso se ha optado por 44,1 kHz en lugar de 40 kHz, para dejar algo de margen al filtro.
La tecnología de vídeo de la época (utilizada en el proceso de masterización de los CD) tenía un estándar de 13,5 MHz, y 44,1 kHz es 1/294 de esa frecuencia, lo que la convertía en una opción práctica que cumplía los requisitos técnicos.
48 kHz
Esta frecuencia de muestreo se ha convertido en el estándar de audio en las producciones profesionales de vídeo, incluida la televisión digital, el vídeo digital, los DVD y el sonido de películas digitales. La razón exacta para elegir 48 kHz no está del todo clara, pero es probable que se trate de una frecuencia más alta que sigue permitiendo una cantidad razonable de almacenamiento de datos y potencia de procesamiento, y proporciona algo más de espacio para los filtros antialiasing que 44,1 kHz.
96 kHz y 192 kHz
Son simplemente múltiplos de 48 kHz y se utilizan en formatos de audio de alta resolución. La idea es que las frecuencias de muestreo más altas pueden reproducir frecuencias más altas y proporcionar una representación más exacta de la señal analógica original. Sin embargo, es discutible que estas frecuencias más altas sean realmente audibles para el ser humano.
Usemos un ejemplo relacionado para aclarar eso: la frecuencia de muestreo es para el audio lo que la velocidad de fotogramas es para el video. Por ejemplo, la mayoría de los programas de televisión tienen de 24 a 30 cuadros (imágenes fijas individuales) que componen 1 segundo de video. Para transmisiones deportivas, 60 cuadros por segundo es común. Debido a que estos cuadros se reproducen rápidamente, nuestros cerebros interpretan el fenómeno como un movimiento continuo en lugar de instancias individuales.
Sigamos con el ejemplo de la imagen un poco más para ilustrar el siguiente punto sobre la frecuencia de muestreo. ¿Cuántos fotogramas por segundo (FPS) ve el ojo humano? Parece que hay dos respuestas a esta pregunta: A) 60 FPS es nuestro límite superior, o B) algunas personas podrían procesar más de 60 FPS. Entonces, para simplificar, digamos que el ojo humano no puede distinguir 60 FPS de 300 FPS como puede distinguir 60 FPS de 10 FPS, y la mayoría de la comunidad científica probablemente estaría de acuerdo.
Si 60 fotogramas por segundo es el umbral superior de nuestra visión, ¿cuántas muestras por segundo sirven como umbral superior para nuestros oídos? La respuesta a eso sería 40.000 muestras por segundo (40 kHz) o, para mantener las cosas en términos de formatos de archivo existentes, 44,1 kHz. Recuerde esto, volveré a ello en un momento, pero primero, repasemos brevemente el Teorema de Nyquist.
Teorema de Nyquist
En la práctica, las profundidades de bits más habituales en la grabación de audio digital son 16 y 24 bits.
- 16 bits (65.536 valores): Esta es la profundidad de bits estándar para CD y muchos formatos de audio digital. Una profundidad de bits de 16 bits permite un rango dinámico teórico de unos 96 decibelios (dB). Esto significa que la señal más fuerte que se puede grabar es unos 96 dB más fuerte que la señal audible con menos volumen.
- 24 bits (16.777.216 valores): Es la profundidad de bits estándar para grabaciones de audio profesionales y algunos formatos de audio de alta resolución. Una profundidad de bits de 24 bits permite un rango dinámico teórico de unos 144 dB, que está muy por encima del rango dinámico que el oído humano puede percibir en la práctica. Esto significa que se pueden conservar más detalles en las partes silenciosas de la grabación que quizá no se oigan directamente, pero sí al subir el volumen. Esto te da más margen a la hora de editar y mezclar la grabación: no tienes que grabar "alto" como antes porque el ruido de fondo es muy bajo.
Como era de esperar, el audio de 24 bits tiene un mayor rango dinámico: el volumen se escala de 0 a 144 dB.
Volvamos a un paralelo visual para entender mejor esto. Si la frecuencia de muestreo es como fotogramas por segundo, ¿cuál es la profundidad de bits? Quizás podamos pensar en ello como una resolución: 720p, 1080p, 4k, etc. En videos y fotos, 1080p denota que 1080 píxeles componen la dimensión vertical de una foto. La resolución de 1080p se verá más nítida y realista que una resolución de 720p, ya que se utilizan más píxeles para representar un objeto, lo que da como resultado una representación más fina de los gradientes de color y cosas de esa naturaleza.
Ahora, en lugar de gradientes de color, piense en gradientes de volumen para imaginar la profundidad de bits. El audio con una profundidad de 16 bits contiene 65 536 pasos, mientras que el audio con una profundidad de 24 bits tiene 16 777 215 pasos (no se preocupe por qué son exactamente los pasos, solo piense en ellos como una subunidad de un bit). Esto le da al audio de 24 bits una precisión mucho más fina cuando se trata de representar con precisión relaciones de volumen delicadas (rango dinámico) entre, por ejemplo, el sonido de una púa golpeando una cuerda de guitarra y la nota C resultante que suena, o el rango dinámico entre esa misma nota C fundamental y sus armónicos superiores.
Señalé anteriormente que las limitaciones psicoacústicas humanas nos impiden escuchar realmente una diferencia entre una frecuencia de muestreo de 44,1 kHz y una frecuencia de muestreo de 96 kHz. Puede que no haya algo tan conciso como el Teorema de Nyquist cuando se trata de cuán perceptibles son las diferencias en la resolución de profundidad de bits, pero es un dilema que ciertamente vale la pena considerar.
Comentarios
Publicar un comentario