¿Cómo puede el MP3 comprimir tanto nuestro audio?
Así que los algoritmos de codificación MP3 desechan información no esencial basándose en esa incapacidad humana para discernir pequeñas diferencias en el contenido espectral de las señales de audio.
El proyecto de investigación que dio lugar al formato recurría a principios descubiertos en los 70 en el campo de la psicoacústica (estudio de la percepción sonora). En especial, se estudió la forma en que la presencia de un sonido enmascara a otro coincidente o incluso levemente alejado, imposibilitando su percepción. La eliminación selectiva de dichos elementos que resultan enmascarados posibilita la reducción del tamaño en el formato de archivos MP3. Mediante diversos algoritmos, se logra retener la información auditiva o musical más relevante para el sonido concreto.
El estándar MP3 vio la luz y fue patentado a escala mundial a principios de los 90 por la Sociedad Fraunhofer, un instituto de investigación alemán que había financiado buena parte de su desarrollo. Esta sociedad todavía posee las patentes, lo cual le genera al año decenas de millones de euros en ingresos por licencias. MP3 adquirió la categoría de estándar en 1993 dentro de las normas ISO (Organización Internacional para los Estándares).
El proceso de codificación MP3 funciona considerando una tasa de flujo de información como medida del grado de compresión aplicado. Se define en kilobits por segundo (kbit/s, kbps, o kb/s). En transferencias de datos, un kilobit (no confundir con kiloByte) se suele tomar como 1.000bit, aunque lo correcto sería interpretarlo como 1.024bit. Una tasa de 128kbit/s, si tenemos en cuenta esa laxitud, equivaldrá a 15,625kB (kiloBytes) por cada segundo de audio.
Así que un minuto de audio MP3 comprimido a una tasa de 160kbps ocupará 4,6875MB en el disco duro o en cualquier otro soporte digital. Con tasas menores, el algoritmo de codificación va desechando cada vez más información, y se notarán mucho más esos “efectos colaterales” a los que aludíamos, aunque el archivo en sí quede reducido de una forma impresionante. Una propiedad curiosa es que un archivo mono ocupa lo mismo que otro estéreo si se comprime en MP3 usando la misma tasa de kbps, pero la calidad percibida será mayor al no repartirse dicha tasa entre los dos canales de audio.
De todos modos, muchas aplicaciones que codifican o descodifican los archivos MP3, también soportan tasas variables, que consideran la evolución temporal de una señal de audio –si el espectro del audio varía con el tiempo, que será lo más usual, eso puede aprovecharse para minimizar las pérdidas de manera óptima en cada instante. Los archivos MP3 codificados con la técnica VBR (Variable Bit Rate) resultan aún más compactos.
Con independencia de estas consideraciones, el algoritmo debe ir examinando la señal original, y es posible elegir una u otra frecuencia para este proceso, sin considerar la tasa de compresión aplicada posteriormente. Aquí, el teorema de Nyquist dicta los requerimientos –al igual que en un WAV sin comprimir, el muestreo previo debe ejercerse como mínimo al doble de la frecuencia máxima a capturar, o se perderá información valiosa (aún así, debe considerarse el aliasing o interferencia debida a los armónicos superiores). La mayoría de archivos MP3 es producto de un muestreo a 44.1kHz, que parece suficiente para capturar con fidelidad señales de hasta 22.05kHz, que cubren el rango auditivo promedio de un adulto.
¿Cuál es el problema con MP3?
MP3 conlleva inconvenientes, por supuesto. Su triunfo se ha visto acelerado por una exigencia universal de reducción de tamaño, más que nada de cara a la transmisión por vía telemática (Internet), la distribución, o el alojamiento de los archivos en medios cada vez más portátiles, y hasta integrados con la vestimenta.
Al satisfacer dichas “necesidades” –analizaremos su carácter espurio o mercantilista en otra ocasión–, MP3 se aseguró un inmenso hueco como estándar de facto en la compresión de audio. Para un músico, no obstante, la minimización raramente es el requisito primordial. A todos nos gusta que nuestra música se escuche en su pureza original, que esos detalles y sutilezas que nos costaron llevaron desarrollar, completen su camino hasta el oído y el corazón del oyente. Pero a la vez uno se pregunta: ¿por qué grabo y creo con calidad prístina, si al final todo se oye en un “loro” con MP3 o en un iPod?
¿Por qué el MP3 no ha evolucionado más?
A pesar de las deficiencias de MP3, admitimos que es el formato dominante para distribución de audio digital. Los consumidores reusan el cambio en sus costumbres musicales a cambio de lo que considerarían una mejora mínima en la fidelidad. Este balance se manifestó en el fallido formato DVD-Audio. Musicalmente, superaba al formato CD de 44.1kHz y 16bit (DVD-A optaba por 192kHz y 24bit). Pero, al final, el 99 por ciento de soportes DVD contiene copias de seguridad de datos brutos, o películas con el audio en calidad CD, incluso para títulos de conciertos. El uno por ciento restante lo constituyen las decepcionantes “remasterizaciones”, que aunque maximizan la capacidad del audio de un DVD, se reducen a un puñado de compilaciones de jazz para entendidos… consumidores que, claro está, hubiesen invertido también en un reproductor DVD-A.
Como creadores musicales, no podemos pues deshacernos de esa tendencia por la que incluso grupos serios te pedirán algún día que les entregues el máster en MP3… Exageraciones a un lado, de momento seguirán siendo enviados archivos MP3 codificados a 160kbps para que los grupos evalúen una pre-mezcla, intercambien ideas, o promocionen su obra final en un portal o red social on-line.
Con todo, una vez en el estudio, haz los deberes y no te conformes con una calidad que suene aceptable, pero que “al microscopio” tenga un peor aspecto. Tus plug-ins profesionales, los buses de mezcla de tu secuenciador, e incluso tus mezcladores e instrumentos hardware, deben recibir y transmitir señales tan impolutas como te sea posible (otra cosa son los experimentos adrede en plan lo-fi).
Cuando no haya más remedio que distribuir tu audio en MP3, experimenta con distintos plug-ins o aplicaciones de codificación. El codificador LAME (lee en el cuadro lateral, más arriba) te sale gratis y es un buen punto de partida, con un rendimiento excelente a tasas relativamente altas.
MP3: Campeón de los formatos de audio
Un extra de los archivos MP3 es que albergan etiquetas ID3: son metadatos que viajan cómodamente integrados en el formato. Aprovéchalos e identifica tus codificaciones con el título del tema, nombre del artista, y datos de contacto. Así, la persona que se tope con ellas sabrá de dónde proceden.
Es posible decodificar los MP3 sobre formatos WAV o AIFF, pero como te advertimos al comienzo, no recuperarás exactamente la señal original del audio. La compresión debería ser el último recurso cuando no sea posible conseguir una versión equivalente, pero en alta calidad. Si importas una muestra en MP3, ya estás en el dominio de la baja calidad relativa –ningún procesador te devolverá los detalles presentes en la señal de partida.
Por consiguiente, a la vez que disfrutes de la portabilidad, la conveniencia y la inmediatez del formato, ten siempre presente sus limitaciones, sus inconvenientes, y –¿por qué no?– sus implicaciones comerciales, sociológicas o culturales a medio y largo plazo.