¿Cómo afectó el confinamiento por coronavirus en 2020 en el tipo de música que escuchamos en Spotify?

He tardado un poco más de lo normal en publicar este artículo y es que las circunstancias en estos tiempos convulsos aparecen por todos lados como mosquitos en una noche de verano. Pero ya está aquí. Hace casi un año, poco después de que España entrara en estado de alarma por la pandemia del coronavirus, publiqué un artículo que planteaba una cuestión antes todo curiosa y que algo dentro de mi me empujaba a buscar la forma de contestarla: ¿Fue Resistiré de Dúo Dinámico una de las canción más escuchadas durante la cuarentena? A través de los datos de Spotify, pude descubrirlo (si queréis saberlo, ahí está el artículo) y la verdad es que me lo pasé bien.

Y a raíz de esta pequeña investigación nació otra pregunta más grande: ¿afectó el confinamiento por el coronavirus (del 13 de Marzo al 1 de mayo) al tipo de música que escuchamos ?, ¿podríamos decir que se escuchó música más triste o negativa?, ¿o, como con Resistiré, escuchamos más clásicos como de costumbre?, ¿empezamos a escuchar otro tipo de géneros de música? En resumen, ¿nos cambió el coronavirus y el confinamiento el  tipo de música que escuchamos? Me lancé a investigar con datos de Spotify, aunque no es representativo pero puede dar ideas, y en este artículo explicaré algunos de los resultados.

Antes de empezar: Breve explicación de la extracción de datos y cómo hemos hecho el análisis

Los datos para realizar este análisis se han extraído de la plataforma de Spotify, concretamente del ranking de las 200 canciones más escuchadas cada día (Top200) y su número de reproducciones (que llamaremos a veces «Streams») durante los años 2017-2020 y luego la API de Spotify nos permite extraer toda la información básica que queramos de cada canción (autor, año de lanzamiento, género…) y también unos cálculos especiales de Spotify, que llamaremos “Features”, y que en un valor del 0 al 1 nos dicen cuánto de bailable, enérgica, ruidosa, positiva es una canción.

Se ha recogido datos de 285.740 canciones en el Top200 de los años 2017, 2018, 2019 y 2020 en España, de las cuales hay 3300 canciones y 880 artistas diferentes. El total de reproducciones de estas canciones en dichos años ha sido de 20.204 millones y la canciones más escuchadas ha sido Tusa y China con 107 millones y 101 millones de reproducciones respectivamente.

Para llegar a los gráficos que muestro a continuación he pasado por muchos otros análisis, los cuales he tenido que descartar o repensar muchas veces. He intentado simplificar al máximo. En la pestaña de abajo dejo una explicación de este proceso así como enlaces hacia los análisis. Bienaventurados los que se atrevan a hacer click en el botón, 🙂

Análisis 1: Extraje la información de todas estas canciones, para el periodo del confinamiento (desde el 13 de Marzo al 1 de mayo) y comparando con el mismo periodo en años anteriores (2017,2018, 2019 y 2020) podemos saber si ha habido un cambio en la media de los valores de las Features. Igualmente haremos lo mismo pero para otro periodo que no sea el coronavirus en el mismo (1 Enero al 1 de Marzo del 2020) para comprobar que ese posible cambio no viene de una tendencia anterior, y entonces puede que el cambio no tuviera que ver con el confinamiento. En total hay una extracción de 1581 canciones únicas y 468 artistas únicos de las cuáles he ponderado por sus escuchas y he hecho medias por periodos. Las diferencias en ningún momento parecen ser significativas y claras, además de estar trabajando con una cantidad de datos no excesivamente grande. Así que descarté este análisis.

Análisis 2: Como alternativa al análisis anterior, hice el mismo ejercicio pero usando las playlists: busqué todas las playlists que se habían creado con el coronavirus, por ejemplo que se llamen «Música para el confinamiento»; extraje sus canciones y comparé las medias de los valores de las feature del periodo de confinamiento del 2020 con el 2019. Los resultados nos dan algunos datos, pero paso algo similar al análisis anterior, no podemos concluir con claridad un posible cambio en el tipo de música que se ha escuchado. Así que descarté este análisis.

Análisis final: Decidí cambiar de perspectiva en el análisis de los datos y me descargué el ranking del top200 de todo el año en 2016-2019 (no sólo del periodo del confinamiento) para tener un histórico más grande. Usando el algoritmo Prophets hice una predicción del año 2020, con los datos del 2017-2019. Esta predicción la comparé con los datos reales y así podemos ver la diferencia entre lo que debería haber sido lo que fue y sacar algunas conclusiones. Creo que e Sun análisis más preciso que los anteriores, pero igualmente hay que tener cuidado, porque no ofrecen datos totalmente claros.

Algunas puntualizaciones: Para las comparaciones siempre se ha usado las medias ponderadas por el número de Streams y esto es importante porque en muchas casos se han escuchado la misma canción muchísimas veces. Si estás interesado en este proceso, puedes ver todo el código que está en abierto subido a Github, así como los CSV y cuaderno de Jupyter de análisis. Este trabajo aunque no lo parezca lleva muchas horas e intentos de prueba y error y todo esta en el Github. Este artículo sólo es un brevísimo resumen del mismo.

¿Ha provocado un cambio en el tipo de música que se escucha (más bailable, más instrumental, más enérgica…)?

En las siguientes gráficas el eje Y representa el valor de la Feature y en eje X la línea temporal del 2017 al 2020. En gris he sombreado el periodo del confinamiento (14 Marzo- 1 Mayo 2020) que es donde deberíamos fijarnos para ver si hay diferencias entre datos predichos por el algoritmo y los datos reales. Aquí muestro sólo los datos para la feature Danceability, las demás están escondidos en las pestañas contiguas.

Feature Danceability: ¿Cuánto de bailable es la canción? Es un cálculo que ha hecho Spotify teniendo en cuenta: tempo, rhythm stability, beat strength, and overall regularity. Valores cercanos a 0 es menos bailable y cercanos a 1 muy bailables.

Feature Energy: Nos dice cuánto de enérgica es una canción y se relaciona con la velocidad, sonoridad y ruido. Ejemplo: Death metal tendrá un valor alto mientras que una canción de Bach tendrá un valor bajo.

Feature Valence: Mide del 0 al 1 la positividad de la canción, siendo canciones muy positivas, felices, alegres, eufóricas las que están más cerca de 1 y canciones más tristes, negativas…, están más cerca de 0.

Feature Acoustiness: ¿Cuánto de acústica es una canción? Del 0 al 1, siendo cercano a 1 que hay una alta probabilidad de que sea acústica.

Feature Liveness: Detecta si hay presencia de audiencia en la canción. Valores altos es que es más probable que sea una canción grabada en directo y por encima de 0.8 es una probabilidad alta de que sea en directo.

Feature Popularity: Mide la popularidad de la canción, según unos cálculos propios de Spotify. El valor estarña entre 0 y 1, siendo 1 lo más popular. Esta feature está normalizada previamente. Spotify no aporta distribución de la popularidad.

Resumiendo, durante el confinamiento hemos escuchado más música…

[icon name=»li_star»] Más enérgica, es decir, con más velocidad, sonoridad y ruido respecto de la predicción.

[icon name=»li_star»] Más en directo o con público detrás respecto de la predicción.

[icon name=»li_star»] Más acústica, es decir con menos acumulación de sonidos e instrumentos y una predominancia importante de la voz.

[icon name=»li_star»] Más popular y de éxitos que se escuchan muchísimas veces, es decir, menor variedad musical.

[icon name=»li_star»] Menos bailable, es decir, con menor tempo, ritmo y fuerza de los «beats».

[icon name=»li_star»] Menos positiva, de felicidad, eufórica, música con la que dan ganas de saltar de alegría.

Y ahora me pregunto, ¿hemos escuchado más música menos positiva y bailable porque no podíamos salir de casa y porque en momentos de cambios bruscos que afectan en nuestro día a día negativamente, nos regocijamos en canciones meláncolicas o poco motivadoras? Sin embargo, sí que hemos escuchado música más enérgica, acústica y de directos, ¿ acaso echábamos tanto de menos escuchar música en directo que la poníamos en casa? Puede ser que tiempos de incertidumbre provoquen cambios en el tipo de música que escuchamos, algo que tiene todo el sentido del mundo, porque la música está muy unida a las emociones y durante el confinamiento se removieron muchas.

IMPORTANTE: Hay que interpretar estos datos con precaución porque estamos hablando de cambios muy sutiles, en algunos de ellos los datos reales no salen del intervalo de incertidumbre, y por lo tanto puede ser arriesgado determinar que realmente ha habido un cambio, pero algunos indicios se pueden recoger. Se necesitaría un estudio más exhaustivo, más datos y contraste de hipótesis para confirmar todas esta información al 100%.

¿Ha provocado un cambio en el género de música que se escucha (pop, reggaeton…)?

Según los datos, de primeras se puede decir que durante la pandemia lo más escuchado fue el reggaeton, el pop y el hiphop, pero comparándolo con otros años y haciendo un análisis más minucioso, existe una correlación directa entre los lanzamientos de determinados álbunes ( y su género) y lo más escuchado. Es decir, durante la pandemia hubo lanzamientos de dichos géneros y por eso es lo más escuchado. En resumen, no se puede decir que la pandemia haya provocado un cambio relevante en el tipo de género de música que se escuchaba, está ligado a otros factores.

¿Ha provocado un cambio en si se escuchan más éxitos antiguos?

Si comparamos el mismo periodo de confinamiento, se ve una gran diferencia en el 2020 con el volumen de escuchas de canciones antiguas (considerando antiguas canciones anteriores a 2014), prácticamente el triple que años anteriores. Concluimos que sí, en el confinamiento se escuchó más música antigua.

Ahora pensemos, ¿acaso en momentos de crisis escuchamos canciones que nos lleven a rememorar buenos momentos?, ¿en momentos de incertidumbre queremos evadirnos?, ¿en momentos así se nos dispara el síndrome de la edad de oro? O tal vez simplemente son canciones conocidas de toda la vida y que nos gusta cantar, concretamente cantar cantar a las 20h para animar a los sanitarios.

Como anécdota, dejo este gráfico las canciones antiguas más escuchadas en 2020. Entre las que destaco 20 de Abril de Celtas cortos. Y diréis, bueno, es que eso seguro que pasa todos los años, pero no, en años anterior 20 de abril no es de las más escuchadas. Claramente el confinamiento impulsó la escucha de esta canción y sí, me arriesgo a decir que la melancolía que nos dice la canción del 20 de abril, nos llegó dentro en el tiempo de encierro. Sólo que tal vez cambiaría un poco la letra a algo así:

20 de abril del 20
Hola Chata, ¿cómo estás?
¿Te sorprende que te escriba?
Es que me aburro en casa, es normal...

Bonus Track: ¿Qué fue lo más escuchado en el confinamiento?

El reggaeton lo está petando año tras año y el confinamiento no ha sido capaz de frenarlo, hay que hacer algo antes de que sea demasiado tarde. Con esto nos preguntamos: ¿significa que nuestros cerebros se están comprimiendo hasta sólo entender palabras absurdas como perreo, trátrá o amos pa' la cama?, ¿estamos ante una devolución de la diversidad musical? Otra apreciación preocupante analizando los datos es que cada vez escuchamos menos variedad de música y  más la misma música. Esto es serio. Parece que el conejo malo, el papito y la ardilla Balvin están consiguiendo hacernos seres humanos más iguales y "monotipomusicales".

Para terminar...

Esta exploración de datos es un ejercicio que he hecho como aprendizaje de DataScience, por lo que es probable que haya errores, consideraciones que se me hayan escapado, me he tomado algunas licencias… os agradezco comentarios, mejoras y desaprobaciones. Ojalá se vieran aquí reflejadas todas las horas que he echado hasta llegar a este escueto artículo, unos resultados que me esperaba mas fructíferos. Aún así, el aprendizaje ha sido muy enriquecedor. Todo el trabajo está reflejado en siete Notebooks en Python y el código está libre en mi Github, que he intentado explicar lo mejor posible.

No comments yet.

Leave a comment

Your email address will not be published.