Seleccione Edição
Login

A música mais alegre e a mais triste do mundo, segundo o Spotify

A experiência de escolher duas listas com as mais alegres e as mais tristes do mundo

Os serviços de streaming de músicas como Spotify, Google Music ou Apple Music armazenam em seus servidores cerca de 30 milhões de canções, e dentre elas é possível encontrar música excelente, muito boa, boa, regular, ruim, terrível e insuportável. A essa imensa quantidade de informação, deve-se somar aquela que é gerada pelos seus usuários ao interagirem com o catálogo –por exemplo, etiquetando as suas canções favoritas ou ouvindo de forma obsessiva essa canção—, que possibilita personalizar, entre outras, as indicações musicais. É o mesmo sistema que permite à Netflix prognosticar que uma pessoa que deu cinco estrelas para Daredevil não deveria deixar de ver Jessica Jones. O usuário assinala no Spotify as músicas de que mais gosta, e toda segunda-feira lhe chega uma seleção individualizada com músicas muito semelhantes. Não se trata de mágica, mas de matemática.

Spotify
Usuário marca no Spotify as músicas que mais gosta.

Da mesma forma com que essas empresas buscam permanentemente detectar padrões que lhes permitam melhorar os seus serviços, qualquer pessoa com conhecimento de programação também pode usar esses dados para responder, em menor escala, às suas próprias perguntas. Talvez, em nossa Alta Fidelidade particular, queiramos ter a nossa própria lista das canções mais tristes do mundo para poder escutar no congestionamento das manhãs de segunda-feira.

O melhor de tudo é que o trabalho de seleção já foi feito para nós pelos usuários do Spotify ao criarem as suas listas públicas de músicas. Ao acessar esses dados, podemos ver quais canções aparecem mais nas listas alegres e quais aparecem nas tristes. Dessa forma, desenvolvemos alguns pequenos programas em Python –para baixar os dados—e em R –para analisar posteriormente. Escolhemos o Spotify por ser relativamente simples acessar a sua base de dados. Os leitores mais ligados a questões técnicas podem obter aqui o código utilizado.

Para fazer essas compilações que acabamos de mencionar, baixamos os nomes das canções que integram todas as listas publicadas no Spotify que contenham no título a palavra sad (ou algum de seus sinônimos), por um lado, e happy (e, da mesma forma, seus sinônimos), por outro. Fizemos as buscas em inglês porque a quantidade de listas etiquetadas nesse idioma é muito maior do que em espanhol (sim, testamos isso). No total, foram baixadas 11.330 listas tristes, com mais de 33.000 canções diferentes, e 8.931 listas alegres, com mais de 350.000 obras.

Com esses dados em mãos, é forte a tentação a se limitar a ver quais músicas aparecem mais em cada caso. No entanto, isso daria como resultado que Sorry, de Justin Bieber, aparece ao mesmo tempo entre as cinco canções mais tristes e as cinco mais alegres. Há um detalhe importante: o fato de uma música aparecer em 10% das seleções tristes não significa nada se ela aparece também em 15% das listas etiquetadas com termos emocionalmente neutros (música, favoritos etc). Esperamos que a música relacionada a uma determinada emoção apareça em uma porcentagem maior de suas respectivas listas. Para corrigir isso, baixamos também um conjunto de dados neutro, que nos permite atestar esse nível básico de cada tema: pouco mais de 50000 listas com mais de 1.600.000 canções, no total.

Bem, qual é o resultado final? Depois de analisar os dados segundo os critérios que mencionamos acima, compusemos um ranking e selecionamos cerca de 50 canções de cada tipo, a partir das quais formamos listas que publicamos: as mais tristes [Spotify, YouTube] e as mais alegres [Spotify, YouTube]. Elas estão em ordem decrescente de de relevância, mas, desde já, se você quer saber quem é são as vencedoras, ei-las: Build you up, de Kim Taylor, e Celeste, de Ezra Vine. Justin Bieber também está próximo. Nada é perfeito.

Baixamos um total de 11.330 listas tristes, com quase 330.000 canções diferentes, e 8.931 listas alegres, com mais de 350.000 músicas

Os resultados reúnem os tipos de música já esperados: muito piano lento para as tristes e ritmos agitados para as alegres. No entanto, é preciso levar em conta as limitações inerentes ao método escolhido: na verdade, analisamos somente uma pequena porcentagem de todas as canções disponíveis, e apenas uma proporção minúscula de usuários deu seu voto ao publicar as suas seleções. Mesmo com essa pequena fração dos dados do Spotify, porém, obtivemos resultados que fazem todo sentido.

Para realizar esse projeto, não foram necessários equipamentos muito modernos nem um uso expressivo de cartões de crédito: os cálculos foram feitos com um celular com quase nove anos de vida que passou duas noites baixando as listas das canções; todo o software utilizado é livre e não foi preciso pagar um único centavo em licenças. A análise dos dados não só permite o acesso a quem tenha um conhecimento básico de programação e uma base de dados à sua disposição, como também, em muitos casos, não é nem necessário saber programar: basta ter vontade, saber a pergunta que se quer fazer, os dados que poderiam fazê-lo, uma planilha de cálculo e muita paciência. Veja, por exemplo, o que faz @NacionRotonda nas suas horas livres.

José María Mateos (@rinze) é analista de dados em uma empresa de conteúdos digitais.

MAIS INFORMAÇÕES