Este bombazo legislativo llega cuando la cifra de canciones que cada día se incorporan a Spotify es de 120.000 (sin visos de decrecer), lo cual empieza a poner en jaque la capacidad de almacenamiento y procesamiento de datos de la plataforma. Por otro lado, en esta avalancha de pistas de audio hay un porcentaje significativo de grabaciones de sonidos relajantes (de lluvia, ballenas o lavadoras) y composiciones generadas mediante Inteligencia Artificial. Son millones de archivos sonoros que no solo distorsionan el reparto de ingresos sino que han forzado a las plataformas de streaming a plantearse hasta cuándo podrán seguir engullendo archivos a su catálogo sin poner filtros más estrictos.
La capacidad de generación de canciones parece infinita. Pero la capacidad de almacenamiento y procesamiento de toda esa información sonora no lo es tanto porque para que las canciones puedan ser escuchadas en todo el planeta son necesarias distribuidoras digitales y plataformas de streaming que deben multiplicar esa canción las veces que sea necesario. Cada año hay más usuarios de plataformas, pero el ritmo de canciones que se incorporan a través de las distribuidoras crece a un ritmo superior. Spotify tiene 574 millones de usuarios y supera los 100 millones de canciones. Según un estudio de la consultora Luminate Data realizado en 2022, el 42% de las canciones contenidas en todas las plataformas de streaming del mundo no habían recibido más de 10 escuchas y el 24%, ni una sola. El problema ya no es almacenar y procesar tantísima música, sino constatar que mucha de esa música nunca la escuchará nadie.
Una canción famosísima y una jamás escuchada pueden ocupar lo mismo en un centro de almacenamiento de datos. Ese es el destino de todas y cada una de las canciones compuestas y grabadas en el planeta. De la inmensa mayoría de ellas no se almacena una única copia, sino varias. Por lo tanto, acaba ocupando bastante más de esos cinco megas en un solo ordenador. Desde que se graba en el estudio hasta que la podemos escuchar en nuestro dispositivo, cada canción se multiplica cientos de veces y se almacena en docenas de data centers.
El productor Guille Mostaza es un obseso de la calidad de audio. En su estudio Alamo Shock no solo graba a gran calidad (48000Hz/24Bit), sino que guarda tres copias de todo el material que se genera durante el proceso de grabación. “Del disco de Niña Polaca grabé a todo el grupo a la vez, analizamos, comentamos y luego empezamos la grabación desde cero. A la hora de mezclar el disco, rescaté algunas de esas tomas del ensayo”, desvela para justificar que el archivo final del disco Que adoren tus huesos sume 114,83 gigabytes. “Yo hago dos backups, uno en otro disco duro aparte y otro en Dropbox, con lo que lo utilizado en total es el triple de esta cifra”. El disco ya suma 344,49 GB. Si lo dividimos por las 14 canciones que integran el disco, cada canción ha generado 24,6 GB.
En Alamo Shock no se borra nada. También se almacenan las pistas de cada instrumento por si el grupo las quiere para hacer remezclas o para lanzarlas en directo. “Todo el proyecto del disco ocupa cerca de 250 gigabytes, sin contar los backups, que en mi caso triplicaría la cifra por tener dos copias extra”, calcula Mostaza. Esos 750 gigabytes son 53,6 gigabytes por canción. En el estudio de grabación, el peso de la música ya hay que calcularlo en gigabytes (miles de megabytes). Mostaza aún doblará la resolución de los archivos para masterizarlo y entregará un archivo final con el disco en tres resoluciones: MP3, CD y HD. “La primera es para que lo puedan escuchar sin chuparse todos los datos del móvil. La segunda para tener una buena calidad reproducible en cualquier sistema y la tercera es exactamente la versión a alta definición tal y como sale del estudio”.
La carpeta con el disco de Niña Polaca pesa 5,21 GB. Y, por supuesto, en Alamo Shock crearán otra copia de seguridad. Cada una de sus 14 canciones supera ya los 25 gigabytes, aunque nadie en la calle ha podido escucharlas todavía. El destinatario de ese archivo será cada uno de los integrantes de la banda, así como la discográfica que lo edite, su agencia de management, la editorial que gestione sus derechos o la empresa de comunicación que promocione la banda. Todos podrán descargarse el archivo en las calidades de audio que estimen necesarias, guardar una copia en sus servidores de almacenamiento y generar nuevas copias para amigos y empleados. Pero el destinatario más relevante en el proceso que conducirá las canciones hasta el público es la distribuidora digital.
Montse de las Heras es directora de Análisis y Reportes en Altafonte, distribuidora digital que solo acepta archivos en formato wav o FLAC. (Una canción de cuatro minutos puede suponer 50 megabytes en FLAC y 70 en wav). En Altafonte se guardarán ese archivo y harán una copia de seguridad. También lo comprimirán en una versión mp3 de uso interno de unos 4 megabytes del que también harán otra copia de seguridad. Aquel archivo de 50/70 megabytes ya ocupa 110/150 megabytes. Sin embargo, aclara De Las Heras, “nuestro sistema no detecta si una misma canción está en un single, en un epé y en un álbum. Ahí tenemos redundancia”. Es decir, que esa misma canción incluida en un grandes éxitos del artista, un recopilatorio de verano o una banda sonora puede acabar almacenándose tres o seis veces. Y todas, con su respectiva copia de seguridad. Podemos hablar ya de 700 megabytes.
Aun así, la multiplicación más importante se produce cuando ese archivo sonoro sale de la distribuidora digital para incorporarse al catálogo de las plataformas de streaming. “En Altafonte, entre agregadores y subagregadores, trabajamos con ciento y poco empresas”, estima De Las Heras. Y, ¿qué pasa entonces? Sergio López Montolio es ingeniero informático con un máster en Arquitectura de Computadoras, Redes y Sistemas y una década de experiencia en almacenamiento y análisis de datos en el entorno de la industria musical. “Cuando la canción llega a la plataforma de streaming, se duplica un mínimo de tres veces, aunque a veces son más. Y luego el archivo a máxima calidad se comprimirá en muchas resoluciones”, explica. Plataformas como Spotify ofrecen hasta cinco calidades de audio, lo cual obliga a crear y almacenar versiones de la canción en todas esas modalidades. “No es lo mismo el algoritmo de compresión estándar que deja los temas a tres megabytes que el de máxima resolución de Tidal que reproduce con calidad original y pesa más de 150 megabytes”, matiza Guille Mostaza.
Días atrás, Tidal comunicaba a las distribuidoras digitales que ya no quería recibir la versión MQA (master quality audio) de las canciones. Eso no significa que no ofrezcan versiones de altísima calidad para los suscriptores de Tidal Hi-Fi Plus, sino que esta versión MQA no ofrecía un salto cualitativo en la escucha que justificase almacenar otra copia de cada canción. Tras esa decisión ya hay una preocupación por el volumen de datos acumulados y un deseo de reducir costes de almacenamiento. Ni Spotify ni Tidal ni la inmensa mayoría de plataformas de streaming tienen data centers en propiedad y deben alquilar servicios de almacenamiento en la nube a las grandes empresas del sector. Amazon, Azure (de Microsoft) y Google son las tres más importantes.
Aunque cada plataforma de streaming tendrá su política, las más serias “hacen tres o más copias de seguridad que se almacenan y distribuyen en lugares muy alejados entre sí para evitar desastres como que se incendie un data center y se pierda el material”, explica López Montolio. Pero luego hay que tener copias de distribución ubicadas cerca de las regiones que más interés pueden tener por escuchar ciertas canciones. “Las probabilidades de que una canción muy popular esté reproduciéndose a la vez en distintas partes del mundo hacen que sea interesante tener copias cerca de los usuarios. Una canción muy popular solo en España no necesita estar cerca de un usuario en Japón, pero hay canciones que sí”, argumenta. El último single de Taylor Swift, por ejemplo, requerirá más copias de distribución que la cara b de un single del grupo finlandés Nummisuutarit.
Esas copias de distribución se generan de forma automática mediante algoritmos y se destruyen cuando la canción pierde popularidad para dejar paso a otra canción que está siendo demandada por más oyentes. “La copia por distribución es dinámica, no es una copia estática que una vez hecha se almacena, sino que aparece y desaparece en función de los flujos de uso”, aclara Montolio. Pero las canciones contienen y generan información que hay que procesar: saber a qué estilo pertenece y si ha sido creada de forma legal, localizar al autor para pagarle su dinero, detectar las ciudades donde suena más la canción y conocer los hábitos de escucha de los usuarios… La información que se deriva de la interacción de millones de usuarios con millones de canciones no supone tanto volumen de datos ni requiere tanta capacidad de almacenamiento, pero cuantos más usuarios y canciones haya más trabajo y datos habrá que procesar.
Ninguna plataforma de streaming calcula el volumen de datos almacenados en gigabytes, sino en petabytes. Miles de ellos. Y si un terabyte son 1.024 gigabytes, un petabyte son 1.024 terabytes. Tanto las copias de seguridad, como las de distribución, como los datos almacenados por Deezer, Spotify, Tidal y Pandora se suman a las copias de esas mismas canciones almacenadas por el resto plataformas de streaming del mercado mundial. Para calcular el volumen que ocupan todas las canciones almacenadas en todas las plataformas de streaming del planeta habría que echar mano de exabytes; o sea, miles de petabytes.
Para López Montolio “no hay un horizonte de colapso porque los sistemas de almacenamiento son cada vez más eficientes y si eres capaz de combinar distintos sistemas de almacenaje, la capacidad de expansión es muy grande”. No todos los data centers ofrecen las mismas prestaciones ni todas las canciones tienen la misma actividad. Por ello, “canciones que solo se han escuchado una vez hace ocho años no tiene sentido almacenarlas en almacenes extremadamente rápidos. En una cuestión de optimización. Lo que más se usa se guarda en un almacenamiento rápido y lo que menos, en uno más lento”, explica. Los data centers más rápidos son más caros. Las canciones menos populares se almacenan en data centers más lentos y baratos. “Hay que ser capaz de optimizar esto para que el usuario tenga disponibles todas las canciones, pero que el coste sea manejable. Sobre todo, cuando se suben 120.000 canciones al día”, resalta.
Si en algo coinciden López Montolio y De Las Heras es en que el volumen que ocupa la música actualmente no es nada comparado con el que ocupa el vídeo. “YouTube supera esas cantidades de petabytes y crece a un ritmo incluso más rápido que la música”, afirma el primero. En YouTube se suben cada minuto 500 horas de vídeos; el doble de la música que se sube a la red. Además, el volumen que ocupan los vídeos es mucho mayor y la capacidad de comprimirlo, más limitada. YouTube supera ya los 2.000 millones de usuarios pero, a diferencia del mundo de la música, no hay decenas de plataformas de vídeo con el catálogo de YouTube. Su hegemonía es casi absoluta. YouTube solo hay uno.
Hay otra gran diferencia entre YouTube y las plataformas de streaming de audio. YouTube pertenece a Google y aunque tenga que pagar por almacenar sus datos precisamente a Google, Google no vive exclusivamente de YouTube ni de comerciar con vídeos. Spotify solo vive de comerciar con canciones y paga un dineral, también a Google, por almacenar su catálogo. “Dudo que cuando empezaron se dieran cuenta del monstruo en el que se iban a convertir. Por eso no tienen un cloud propio”, intuye De Las Heras. “En el mundo de la música digitalizada hay dos modelos de negocio: el que hace dinero si el artista hace dinero y el que hace dinero independientemente de cómo le vaya al artista. A estos últimos, lanzar contenido vacío ahí fuera les da igual. Son las plataformas las que se dan cuenta ahora de que a lo mejor no pueden aguantar ese volumen. Llegará un día en que los artistas que tienen música en Spotify tendrán que ser rentables”, profetiza. Dejar de pagar por las canciones que no suman a mil reproducciones ya parece una medida para deshacerse de los que no lo son.
“Spotify tendrá que soltar lastre en algún momento”, insiste De Las Heras, “porque el problema ya no es solo el coste de almacenamiento. Es también el servicio que has de dar a tus clientes”, añade, refiriéndose a artistas, distribuidoras y demás proveedores de contenido. “Gestionar las incidencias que se pueden producir en la ubicación de 120.000 canciones diarias implica cada vez más personal y los recursos humanos que hay que destinar es lo que acaba pesando”, advierte. Y esto afecta a Spotify y a cualquier plataforma que reciba decenas de miles de canciones cada día. Solo hay dos vías para que las plataformas sean rentables: que cada vez más usuarios paguen por ese servicio o que algunos artistas (los que menos dinero generan) empiecen a pagar por subir su música.
La tercera solución sería que el público escuche más música para generar más ingresos. Sin embargo, los últimos estudios de Luminate Data detectan que, a pesar del aumento de oferta musical, el consumo de novedades se ha estancado. Cada año disponemos de más canciones nuevas, pero eso no significa escuchemos más canciones nuevas que el año anterior. Solo acumulamos más.