Machine Learning bei Spotify: Wie personalisierte Playlists entstehen

Der bekannte Musik-Streaming-Dienst Spotify setzt stark auf maschinelles Lernen, um den Wünschen seiner Kundinnen und Kunden gerecht zu werden. Im Artikel „Spotify’s Discover Weekly: How machine learning finds your new music“geht die Software-Entwicklern Sophia Ciocca auf die zugrundeliegende Technik bei Spotifys Empfehlungen ein, die für die Kundinnen und Kunden wie Magie wirken.

Seit der auf Machine Learning beruhende Service „Discover Weekly“ 2015 ins Leben gerufen wurde, hat sich eine riesige Fan-Gemeinde darum gebildet, die vielfach ihre Begeisterung über die Qualität des Dienstes in die Welt hinausruft: „At this point @Spotify’s discover weekly knows me so well that if it proposed I’d say yes“, schreibt @amandawhitbred auf Twitter. „It’s scary how well @Spotify Discover Weekly playlists know me. Like former-lover-who-lived-through-a-near-death experience-with-me well“, äußert sich @Dave_Horwitz auf Twitter. Was steckt dahinter? Worauf beruht dieser automatische Dienst, der jede Woche 30 Songs empfiehlt und damit derlei Begeisterungsstürme bei seinen Kundinnen und Kunden auslöst?

Musikempfehlungen: Ein Rückblick

Musikempfehlungen im Internet haben eine lange Tradition. Die ersten Empfehlungen wurden Anfang des Jahrtausends von Musik-Expertinnen und Experten kuratiert. Später zog man zusätzlich von Hörerinnen und Hörern oder Experten vergebene Attribute („Tags“) an Liedern hinzu, um bessere Ergebnisse erzielen zu können. Außerdem kamen Algorithmen dazu, die die Tonalität und auch die Texte der Lieder untersuchten.

Spotify setzt nicht eine einzelne, sondern eine Kombination von verschiedenen Techniken ein, um zu diesem beeindruckenden Ergebnis zu kommen: Spotify untersucht das Hör-und Bewertungsverhalten der einzelnen Kundin/des einzelnen Kunden, legt mithilfe von „Natural Language Processing“ (NLP) die Liedtexte auf den Seziertisch und zieht auch die Tonalität der Lieder mithilfe von künstlichen neuronalen Netzen hinzu.

Hör-und Bewertungsverhalten durch gemeinschaftliches Filtern („Collaborative Filtering“)

Im Gegensatz zu Plattformen wie Apples iTunes oder Netflix hat Spotify kein ausgeklügeltes Bewertungssystem, sondern erstellt die Bewertungen implizit, indem einfach gezählt wird, welche Kundinnen und Kunden welche Lieder wie oft gehört haben. Zusätzlich lassen sich Faktoren einrechnen, ob ein Lied einer Wiedergabeliste hinzugefügt wurde oder ob die zum jeweiligen Lied zugehörige Informationsseite besucht wurde.

Hat man nun eine hohe Übereinstimmung bei diesen Daten zwischen zwei Kunden, liegt es nahe, dass diese beiden einen ähnlichen Musikgeschmack haben. Das hierbei vorhandene Delta ergibt, genau die Lieder, die für eine Empfehlung in Frage kommen. Konkret heißt das: Kunde 1 hört die Lieder A, B, C und D sehr gerne und Kunde 2 hört B, C, D und E sehr gerne haben wir eine Gemeinsamkeit von 75 %, nämlich die Lieder B, C und D. Außerdem haben wir mit den Liedern A und E zwei Songs, die dem jeweils anderen Kunden auf Basis der festgestellten hohen Gemeinsamkeit empfohlen werden können.

Texte auswerten („Natural Language Processing“)

Machine Learning bei der Auswertung von Texten ist recht fortgeschritten und Spotify beschränkt sich beim Einsatz von „Natural Language Processing“ nicht nur auf die Liedtexte, sondern zieht auch Blog-Einträge, Nachrichten und andere Textquellen aus dem Internet hinzu.

Hierbei werden die im Zusammenhang mit einem Lied verwendeten häufig wiederkehrenden Adjektive und stimmungsbeschreibende Substantive gesammelt. Außerdem sammelt Spotify mithilfe dieser Technik auch andere Lieder, die im Zusammenhang mit dem im Fokus stehenden Lied häufig genannt werden. Nachdem diese Attribute gewichtet wurden, lassen sich einzelne Lieder über die gesammelten Eigenschaften miteinander in Relation setzen.

Audio-Analyse

Als drittes Standbein für den „Discover Weekly“-Dienst setzt Spotify auf die Analyse des Audiomaterials. Während die Empfehlungsmaschine dank der ersten beiden Auswertungen bereits gute Dienste leistet, schafft es Spotify mit der dritten Untersuchung auch neue Lieder einzuordnen. Die dritte Auswertungsmethode beruht auf künstlichen neuronalen Netzen („Convolutional neural networks“). Diese Netze werden vor allem in der Bilderkennung angewandt; Spotify nutzt sie bei der Audio-Analyse.

Nach der Bearbeitung durch ein solches Netz mit vier Ebenen, wird ein Lied anhand von Taktart, Tonart, Modus, Tempo und Lautheit charakterisiert, so dass einzelne Lieder miteinander vergleichbar werden.

Fazit

Erst das Zusammenspiel von drei unterschiedlichen Ansätzen erschafft beim Musikdienst Spotify die außerordentliche Qualität bei der wöchentlichen Empfehlung von Liedern im Rahmen des „Discover Weekly“-Diensts.