¿Cómo afectó el confinamiento por coronavirus en 2020 en el tipo de música que escuchamos en Spotify?

He tardado un poco más de lo normal en publicar este artículo y es que las circunstancias en estos tiempos convulsos aparecen por todos lados como mosquitos en una noche de verano. Pero ya está aquí. Hace más de un año, poco después de que España entrara en estado de alarma por la pandemia del coronavirus, publiqué un artículo que planteaba una cuestión antes todo curiosa y que algo dentro de mi me empujaba a buscar la forma de contestarla: ¿Fue Resistiré de Dúo Dinámico una de las canción más escuchadas durante la cuarentena? A través de los datos de Spotify, pude descubrirlo y la verdad es que me lo pasé bien.

Y a raíz de esta pequeña investigación nació otra pregunta más grande: ¿afectó el confinamiento por el coronavirus (del 13 de Marzo al 1 de mayo de 2020) al tipo de música que escuchamos?, ¿podríamos decir que se escuchó música más triste o negativa?, ¿o, como pasó con Resistiré, escuchamos más clásicos como de costumbre?, ¿empezamos a escuchar otro tipo de géneros de música? En resumen, ¿nos cambió el coronavirus y el confinamiento el  tipo de música que escuchamos? Me lancé a investigar con datos de Spotify, aunque no es representativo (la gente escucha música por otro muchos canales) puede darnos una idea general, y en este artículo explicaré algunos de los resultados.

Antes de empezar: Breve explicación de la extracción de datos y cómo hemos hecho el análisis

Los datos para realizar este análisis se han extraído de la plataforma de Spotify, concretamente del ranking de las 200 canciones más escuchadas cada día (Top200) y su número de reproducciones en ese día (que llamaremos a veces «Streams») durante los años 2017-2020 y luego la API de Spotify nos permite extraer toda la información básica que queramos de cada canción (autor, año de lanzamiento, género…) y también unos cálculos especiales de Spotify, que llamaremos “Features”, y que en un valor del 0 al 1 nos dicen cuánto de bailable, enérgica, ruidosa, positiva, etc. es una canción.

Como resumen, se ha recogido datos de 285.740 canciones en el Top200 de los años 2017, 2018, 2019 y 2020 en España, de las cuales hay 3300 canciones y 880 artistas diferentes. El total de reproducciones de estas canciones en dichos años ha sido de 20.204 millones y la canciones más escuchadas en estos cuatro años ha sido Tusa y China con 107 millones y 101 millones de reproducciones respectivamente (Primer pelotazo!…y si me ponen la canción, me da una depresión tooooonta…)

Para llegar a los gráficos que muestro a continuación he pasado por muchos otros análisis, los cuales he tenido que descartar o repensar muchas veces, hasta encontrar la mejor forma de extraer una información válida y lo menos sesgada posible. También he intentado simplificar al máximo. Para no aburrir con este tema, en la pestaña de abajo dejo una explicación de este proceso así como enlaces hacia los análisis. Bienaventurados los que se atrevan a hacer click en el botón, 🙂

Análisis 1: Extraje la información de todas estas canciones, para el periodo del confinamiento (desde el 13 de Marzo al 1 de mayo) y comparando con el mismo periodo en años anteriores (2017,2018, 2019 y 2020) podemos saber si ha habido un cambio en la media de los valores de las Features. Luego hice lo mismo pero para otro periodo que no sea el coronavirus (1 Enero al 1 de Marzo del 2020) para comprobar que ese posible cambio no viene de una tendencia anterior, y entonces puede que el cambio no tuviera que ver con el confinamiento. En total hay una extracción de 1581 canciones únicas y 468 artistas únicos de las cuáles he ponderado por sus escuchas y he hecho medias por periodos. Las diferencias en ningún momento parecen ser significativas y claras, además de estar trabajando con una cantidad de datos no excesivamente grande. Así que dejé a un lado este análisis.

Análisis 2: Como alternativa al análisis anterior, hice el mismo ejercicio pero usando las playlists: busqué todas las playlists que se habían creado con el coronavirus, por ejemplo, que se llamaban «Música para el confinamiento»; extraje sus canciones y comparé las medias de los valores de las Fetures del periodo de confinamiento del 2020 con el 2019. Los resultados nos dan algunos datos interesantes, pero algo similar al análisis anterior, no podemos concluir con claridad un posible cambio en el tipo de música que se ha escuchado. Así que descarté este análisis.

Análisis final: Decidí cambiar de perspectiva y me descargué el ranking del top200 de todo el año en 2017, 2017, 2019 y 2020 para tener un histórico más grande. Usando el algoritmo Prophets hice una predicción del año 2020, con los datos del 2017-2019. Esta predicción la comparé con los datos reales del 2020 y así poder ver la diferencia entre lo que debería haber sido y lo que fue y sacar algunas conclusiones. Creo que es un análisis más preciso que los anteriores y más claro de entender gráficamente, pero igualmente hay que tener cuidado, porque no ofrecen datos totalmente claros. Los gráficos muestra la información de este análisis.

Algunas puntualizaciones: Para las comparaciones siempre se ha usado las medias ponderadas por el número de reproducciones (Streams) y esto es importante porque en muchas casos se ha escuchado la misma canción muchísimas veces. Si estás interesado en este proceso, puedes ver todo el código que está en abierto subido a Github, así como los CSV y cuaderno de Jupyter de análisis. Este trabajo aunque no lo parezca lleva muchas horas e intentos de prueba y error y lineas y líneas de código. Todo esta en Github. Este artículo sólo es un brevísimo resumen de los resultados.

¿Ha provocado un cambio en el tipo de música que se escucha (más bailable, más instrumental, más enérgica…)?

En las siguientes gráficas el eje Y representa el valor de la Feature y en eje X la línea temporal del 2017 al 2020. En gris he sombreado el periodo del confinamiento (14 Marzo- 1 Mayo 2020) que es donde deberíamos fijarnos para ver si hay diferencias entre datos predichos por el algoritmo y los datos reales. Aquí muestro sólo los datos para la feature Danceability, las demás están escondidas en las pestañas contiguas.

Feature Danceability: ¿Cuánto de bailable es la canción? Es un cálculo que ha hecho Spotify teniendo en cuenta: tempo, rhythm stability, beat strength, and overall regularity. Valores cercanos a 0 es menos bailable y cercanos a 1 muy bailables.

Feature Energy: Nos dice cuánto de enérgica es una canción y se relaciona con la velocidad, sonoridad y ruido. Ejemplo: Death metal tendrá un valor alto mientras que una canción de Bach tendrá un valor bajo.

Feature Valence: Mide del 0 al 1 la positividad de la canción, siendo canciones muy positivas, felices, alegres, eufóricas las que están más cerca de 1 y canciones más tristes, negativas…, están más cerca de 0.

Feature Acoustiness: ¿Cuánto de acústica es una canción? Del 0 al 1, siendo cercano a 1 que hay una alta probabilidad de que sea acústica.

Feature Liveness: Detecta si hay presencia de audiencia en la canción. Valores altos es que es más probable que sea una canción grabada en directo y por encima de 0.8 es una probabilidad alta de que sea en directo.

Feature Popularity: Mide la popularidad de la canción, según unos cálculos propios de Spotify. El valor estarña entre 0 y 1, siendo 1 lo más popular. Esta feature está normalizada previamente. Spotify no aporta distribución de la popularidad.

Resumiendo, durante el confinamiento hemos escuchado MÁS MÚSICA…

  • Más enérgica, es decir, con más velocidad, sonoridad y ruido respecto de la predicción.
  • Más en directo o con público detrás respecto de la predicción.
  • Más acústica, es decir con menos acumulación de sonidos e instrumentos y una predominancia importante de la voz.
  • Más popular y de éxitos que se escuchan muchísimas veces, es decir, menor variedad musical.
  • Menos bailable, es decir, con menor tempo, ritmo y fuerza de los «beats».
  • Menos positiva, de felicidad, eufórica, música con la que dan ganas de saltar de alegría.

Y ahora me pregunto, ¿hemos escuchado más música menos positiva y bailable porque no podíamos salir de casa y porque en momentos de cambios bruscos que afectan en nuestro día a día negativamente, nos regocijamos en canciones meláncolicas o poco motivadoras? Sin embargo, sí que hemos escuchado música más enérgica, acústica y de directos, ¿acaso echábamos tanto de menos escuchar música en directo que la poníamos en casa? Puede ser que tiempos de incertidumbre provoquen cambios en el tipo de música que escuchamos, algo que tiene todo el sentido del mundo, porque la música está muy unida a las emociones y durante el confinamiento se removieron bastante.

IMPORTANTE: Hay que interpretar estos datos con precaución porque estamos hablando de cambios muy sutiles, en algunos de ellos los datos reales no salen del intervalo de incertidumbre, y por lo tanto puede ser arriesgado determinar que realmente ha habido un cambio, pero algunos indicios se pueden recoger. Se necesitaría un estudio más exhaustivo, más datos y contraste de hipótesis para confirmar todas esta información al 100%.

¿Ha provocado un cambio en el género de música que se escucha (pop, reggaeton…)?

Según los datos, de primeras se puede decir que durante la pandemia lo más escuchado fue el reggaeton, el pop y el hiphop, pero comparándolo con otros años y haciendo un análisis más minucioso, existe una correlación directa entre los lanzamientos de determinados álbunes ( y su género) y lo más escuchado. Es decir, durante la pandemia o poco antes hubo lanzamientos de dichos géneros y por eso es lo más escuchado. En resumen, no se puede decir que la pandemia haya provocado un cambio relevante en el tipo de género de música que se escuchaba, está ligado a otros factores.

¿Ha provocado un cambio en si se escuchan más éxitos antiguos?

Si comparamos el mismo periodo de confinamiento, se ve una gran diferencia en el 2020 con el volumen de escuchas de canciones antiguas (considerando antiguas canciones anteriores a 2014), prácticamente el triple que años anteriores. Concluimos que sí, en el confinamiento se escuchó más música antigua.

Ahora pensemos, ¿acaso en momentos de crisis escuchamos canciones que nos lleven a rememorar buenos momentos?, ¿en momentos de incertidumbre queremos evadirnos?, ¿en momentos así se nos dispara el síndrome de la edad de oro? O tal vez simplemente son canciones conocidas de toda la vida y que nos gusta cantar, concretamente cantar cantar a las 20h para animar a los sanitarios.

Como anécdota, dejo este gráfico las canciones antiguas más escuchadas en 2020. Entre las que destaco 20 de Abril de Celtas cortos. Y diréis, bueno, es que eso seguro que pasa todos los años, pero no, en años anteriores la canción 20 de abril no es de las más escuchadas dicho día. Claramente el confinamiento impulsó la escucha de esta canción y sí, me arriesgo a decir que la melancolía que transmite "20 de abril" nos llegó dentro en el tiempo de encierro, encaja. Sólo que tal vez cambiaría un poco la letra a algo así:

20 de abril del 20
Hola Chata, ¿cómo estás?
¿Te sorprende que te escriba?
Es que me aburro en casa, es normal...

Para terminar...

Esta exploración de datos es un ejercicio que he hecho como aprendizaje de DataScience tras realizar un Master, por lo que es probable que haya errores, consideraciones que se me hayan escapado, me he tomado algunas licencias… os agradezco comentarios, mejoras y desaprobaciones. Ojalá se vieran aquí reflejadas todas las horas y horas que he echado hasta llegar a este escueto artículo, unos resultados que me esperaba mas fructíferos, pero supongo que a veces es así e intentar sacar donde no hay no tiene sentido. Aún así, el aprendizaje ha sido muy enriquecedor y divertido. Todo el trabajo está reflejado en siete Notebooks en Python y el código está libre en mi Github, que he intentado explicar lo mejor posible. Agradezco a mi compañero de Data For Good Madrid, Alberto Barrios, su ayuda en el análisis final.

Y para terminar, recordad, somos lo que escuchamos, pero, ¿hasta cuando?, tal vez en unos años empecemos a escuchar no lo que somos, sino lo que nos dice un algoritmo que somos. Este es otro "temazo" de los buenos.

Bonus Track: ¿Qué fue lo más escuchado en el confinamiento?

El reggaeton lo está petando año tras año y el confinamiento no ha sido capaz de frenarlo, hay que hacer algo antes de que sea demasiado tarde y lleguemos a un punto de no retorno. Con esto nos preguntamos: ¿significa que nuestros cerebros se están comprimiendo hasta sólo entender palabras absurdas como perreo, trátrá o amos pa' la cama?, ¿estamos ante una devolución de la diversidad musical? Otra apreciación preocupante analizando los datos es que cada vez escuchamos menos variedad de música y  más la misma música. Esto es serio. Parece que el conejo malo, el papito y la ardilla Balvin están consiguiendo hacernos seres humanos más iguales y "monotipomusicales". Sí, estamos jodidos.

Bonus Track 2: ¿Qué fue lo más escuchado durante el 2020, el "año pandemia"?

He hecho la extracción de datos y estoy con el análisis y la verdad es que hay datos muy curiosos y también muy turbios e inquietantes. De momento sólo os dejo con un gustoso aperitivo: Las canciones más escuchadas en España en el 2020, del top200 de Spotify.

De Tusa ya hemos hablado, pero fijaros en el segundo puesto, sí, La Jeepeta Remix está ahí. Los que desconocéis este mundo artístico tal vez no os diga nada este título, pero si queréis sentir terror, dadle una oportunidad (total, una escucha más...). Siendo directos pongo aquí su elaborado estribillo:

Arrebata'o dando vuelta' en la Jeepeta (Vuelta' en la jeepeta)
En los míos tengo una rubia que tiene grande' las tetas (Grande' las tetas)
Quiere que yo se lo meta (Yah-yah)

Ahora sí, ¡Yah, yah!, ¿sientes el pánico fluir por tus venas? Yo entro en estado hipotérmicomusical cada vez que la escucho. WTF. Pues esta canción que se lanzó en Abril de 2020 ha tenido en España un total de 57 millones de escuchas (¿cada español podría haberla escuchado una vez? 😵), en todo el mundo un total de 362 millones y esto es solo en Spotify y teniendo en cuenta que son datos del Top200. En Youtube el videoclip de la canción tiene alrededor de 424 millones de reproducciones (millón arriba, millón abajo, más o menos...). Vámonos a beber cerveza.

2 Comments

  • Avatar

    ¡Genial artículo Víctor! Muy interesante el estudio.
    La verdad es que es difícil detectar cambios notables en los gustos musicales de la gente teniendo en cuenta que el confinamiento duró apenas dos meses. Lo que está claro, es que el reggaeton es imparable, por mucho COVID que haya. ¡Jajajaja!
    Para concluir, gracias por la cautela y la honestidad al presentar los resultados de tu análisis. A menudo uno se encuentra, en artículos similares, conclusiones absolutas y datos sesgado En absoluto ese es tu caso, y es algo de agradecer y que te honra como científico de datos. ¡Olé tú!

    Alberto Barrios 21.04.2021
  • Víctor G.

    Gracias por tu comentario Alberto, me alegra que te gustara y también por tu ayuda en la parte final del análisis que necesitaba una voz más experta como la tuya! Thanks!

    Víctor G. 22.04.2021

Leave a comment

Your email address will not be published.