Sin la compresión de archivos Internet sería mucho más lento. Por eso tenemos los códecs, como el MP3 para audio. Un auténtico formato inmortal pese a que se inventó hace más de 30 años. Pese al avance de alternativas como AAC, el MP3 sigue muy vivo. Pero por fin se presenta una alternativa que tiene muchos números para revolucionar el sector de los códecs de audio.
Meta, a través de su equipo de investigación en IA fundamental, ha creado un códec de hipercompresión de audio. Un códec que permite escuchar audios con una calidad equivalente al MP3, pero un tamaño diminuto. Ideal para poder enviar audios aunque la conexión sea mínima.
La IA también va a cambiar de arriba a abajo el mundo del audio

Para conseguir esta compresión se han utilizado redes neuronales para que "entiendan" cómo se construye el audio y luego sean capaces de recrearlo, utilizando mucho menos espacio del original. Al fin y al cabo los códecs de audio siempre han sido algoritmos. Ahora con la IA se ha dado un salto enorme con ellos y esto se traduce en un códec como el que hoy presenta Meta.
Según explican los responsables, con la IA han logrado una tasa de compresión 10 veces mejor que el MP3 en 64 kbps, sin pérdida de calidad. Anteriormente se habían empleado estos algoritmos para voces concretas, pero ahora se ha aplicado sobre un archivo de audio estéreo de 48 kHz, la calidad del CD. Es decir, el estándar más utilizado del mundo de la música.
Entre las ventajas de este códec de audio, Meta explica que podría derivar en llamadas más rápidas y de mejor calidad, sobre todo cuando la conexión es deficiente. También hay hueco para el metaverso, donde la compañía apunta que se podrán añadir archivos de sonido de forma más habitual sin que ello implique un ancho de banda mucho más alto.
Por el momento Meta no trabaja con códecs de vídeo, pero apunta que es lo siguiente. También informan que intentarán un códec de audio nuevo para el audio espacial, aunque explican que trabajan con varios canales es complejo.
Solemos pensar en la IA como una herramienta de creación, desde imágenes hasta canciones. Sin embargo también está siendo utilizada para optimizar lo que ya existe. Los resultados apuntan que la mejora es enorme.
Imagen | Dalibor Bosnjakovic
Ver 27 comentarios
27 comentarios
drkwzrd
Un formato de audio basado en IA y redes neuronales?
Lo que faltaba, un formato de audio que haga interpretaciones convolucionales sobre el input que le estas metiendo y el resultado sea algo que no puedes asegurar que sea idéntico a la fuente original.
Básicamente una comprensión con pérdida de toda la vida. Pero ahora con más siglas molonas. Y de forma "no determinista" (con matices).
El siglo XXI, la música se merece ya hacer una transición a cualquier formato que tenga compresión sin pérdida. Hombre ya.
p2dzca
Las muestras que han ofrecido no me parecen espectaculares.
Se puede descargar para hacer pruebas en:
https://github.com/facebookresearch/encodec
Actualmente el mejor códec de audio, según bastantes estudios, es Opus (https://opus-codec.org/), y es gratuito. Es mejor que el códec comercial AAC.
Demux_11
El MP3 no es el mejor formato que hay, pero es el mas popular porque ahora mismo casi todo dispositivo que existe es compatible con el, ademas que es muy facíl y accesible para grabar/convertir a ese formato.
Facebook está buscando una batalla perdida si trata de meter una IA en la formula de su nuevo formato porque podria limitar su uso. Ni hablar de su trastocada reputacion de su negocio actual...
sicara
El Flautista!
r_penrose
La verdad es que un MP3 a 64 kbps tiene muy poca calidad que perder.
g.dragmire
bueno a ver si podemos oir cosas de calidad . flac en el tamaño de .mp3
t_r_a
jajajajaja, como lo hagan igual que con los avatares !!!
amfortas
A ver, señor articulista, que el estándar para CD NO es 48 khz sino 44,1 khz.
Los 48 khz (o el doble, o más...) lo usan sistemas más modernos de grabación/reproducción.
Aparte, yo ya hace años comprobé que en altas frecuencias el MP3 se quedaba cortito (a menos que comprimamos a 320 kbps) y me pasé al AAC.
Además, el MP3 no soporta multicanal.
Aún recuerdo hace muchos años cuando apareció el MP3 que el equivalente de calidad CD a MP3 era comprimir a 128 kbps, cuando era totalmente falso.
Una aproximación REAL del MP3 a CD sería una compresión de 265 kbps para arriba.
victorlm
Meta… mfetamina, es lo que se mete Zuckerberg, porque tantos miles de millones en la nada.
Veremos que sale de eso, pero problemas tiene y el bw del audio no es precisamente el mas importante.
jartovega
Acc se lo come vico en todo semtido si lo siguien usando es por pura ignorancia y eso si no hay quiem la.mate 🤣🤣