Wie die Spotify-Algorithmen funktionieren

Was du im Beitrag erfährst:
  • Wie detailliert Spotify jeden einzelnen Song analysiert
  • Wie Spotify Verbindungen zwischen Songs erkennt
  • Wie das Hörverhalten der User durchleuchtet wird
  • Wie die Empfehlungen funktionieren

Wie Spotify kürzlich über ihre „Made to be Found“ Page preisgab, geschieht ein Drittel aller Künstlerentdeckungen auf algorithmischem Weg. Zu verstehen wie die Algorithmen von Spotify funktionieren, ist somit wichtig, um seine Reichweite sowie seine Streams zu steigern. Auch wenn Spotify natürlich geheim hält, wie ihre Algorithmen funktionieren, ist doch einiges bekannt und vieles kann zumindest erahnt werden. Wir fassen zusammen.

Die Algorithmen verfolgen das einfache Ziel, den User länger auf der Plattform zu halten, indem sie als Vermittler zwischen User und Künstler*in fungieren – und dies natürlich im Idealfall mit den Artists, die der User hören will. Wenn Spotify einen Song analysiert, geschieht dies auf zwei Weisen:

  • Content: Hier wird der Track und dessen Inhalt analysiert
  • Connection: Hier wird eine Verbindung des Tracks zu anderen Songs hergestellt, basierend auf dem Verhalten der User.

Nur mit diesen beiden Komponenten ist es Spotify möglich den Song direkt nach dem Upload richtig einzuordnen und entsprechend zu platzieren.

Content

Einen Großteil der Informationen steuern die Künstler*innen gleich selbst bei, indem sie den Song pitchen und die dazugehörigen Infos erfassen. Um so wichtiger ist es also sich beim Pitchen Zeit zu nehmen und alles so genau wie möglich auszufüllen. Dies sind die u.a. die Basisinformationen zum Song (Titel, Genre etc.), wie auch Mood, Style, Sprache oder die benutzten Instrumente. Doch natürlich sind dies bei weitem nicht die einzigen Daten, die Spotify über einen Song sammelt.

Sobald ein neuer Song hochgeladen wird, erfolgt die Audioanalyse. Wie diese genau funktioniert, ist womöglich eines der bestgehüteten Geheimnisse von Spotify. Die Audioanalyse erkennt etwa, ob ein Song Vocals hat oder nicht, wie tanzbar er ist, wie hoch das Energielevel ist und auch ob der Track eher optimistisch klingt oder einen eher traurigen Vibe hat. Doch dies ist einzig die Grundlage der Analyse, diese geht viel tiefer und analysiert etwa die komplette Songstruktur. Am Schluss weiß der Algorithmus alles was er benötigt über die Charakteristik eines Tracks.

Doch nicht nur die gesamte Produktion wird detailliert analysiert, auch die Inhalte werden seziert. Zum einen werden die Songtexte durchleuchtet, um die Thematik und die Stimmung des Songs einordnen zu können. Ebenso wird das Web durchkämmt, um auf Blogs und Medien nach Artikeln über den Song zu suchen, um zu sehen, wie Journalisten diesen beschreiben. Schließlich machen sie sich auch noch die Millionen User-Generated-Playlists zu nutzen. Ist ein Song in vielen Playlisten, die „Sad“ im Titel haben, ist davon auszugehen, dass es ein eher nachdenklicher Track ist.

Spotify weiß nun also, wie der Song klingt, um was er sich inhaltlich dreht und auch, wie er von außen wahrgenommen wird. Das sind schon sehr viele Infos und doch ist es erst die eine Hälfte der Trackanalyse.

Connection

Neben dem Content werden auch die Verbindungen berücksichtigt. Denn nur weil Spotify sehr genau weiß, wie ein Track klingt und wovon er handelt, kann er doch nicht vollständig ahnen, wie die User damit agieren. Deshalb ist dieser zweite Schritt entscheidend für die Empfehlungen.

Die landläufige Meinung, wie die Empfehlungen bei Spotify funktionieren, lautet in etwa so: wenn User A die Songs X, Y und Z gehört hat und User B die Songs X und Y mag, dann wird er auch Song Z hören wollen. Dies ist jedoch eine überaus fehleranfällige Methode und Experten gehen daher davon aus, dass Spotify diese nicht mehr oder nur noch sehr bedingt anwendet. Viel eher achten sich auf „organisatorische Faktoren“, also z.B. dass zwei Songs sich ähneln, wenn ein User sie in dieselbe Playlist lädt.

Vereinfacht gesagt, ist es sehr wahrscheinlich, dass ein User sowohl einen harten Trap-Song, wie auch eine zarte Soul-Ballade hört. Dass er diese in dieselbe Playlist knallt schon weniger. Da die User ihren Playlisten meist Namen geben, die etwas über deren Inhalt verraten, hilft Spotify zusätzlich. Spotify soll 700 Millionen User-Generated-Playlists analysieren, also nur ein Bruchteil aller von den Konsument*innen erstellten Playlisten. Sie fokussieren sich dabei auf solche bei denen sie erkennen, dass die User Zeit und Leidenschaft investieren.

Durch die Analyse des Contents und der Verbindungen, weiß Spotify nun also welche Tracks sich ähnlich sind und somit haben sie eine Seite der Vermittlung. Die andere Seite sind natürlich die Hörer*innen der Plattform.

Analyse des Hörverhaltens

Die Analyse des Hörverhaltens der User ist etwas weniger komplex als bei den Songs und doch etwas ausgeklügelter als man es vielleicht vermuten würde. Klar ist, dass Spotify das Hörverhalten seiner User genau trackt: welche Songs werden gehört, welche geliked, welche geskipt und so weiter.

Jedoch wird auch immer der Kontext berücksichtigt, denn nicht jede Hörsession ist gleich zu bewerten. Wenn ein Hörer zum Beispiel seinen Release Radar mit den Neuerscheinungen durchhört, hat er womöglich 100-200 Tracks vor sich. Wenn er da mal einen Track weniger als 30 Sekunden hört, muss dies noch keine definitive Absage an den Track bedeuten. Vielleicht will er diesen einfach später in Ruhe hören. Hört er hingegen eine Playlist, die zum Lernen gedacht ist und skipt dort einen Song, ist viel eher davon auszugehen, dass er diesen nicht mag und nicht mehr hören will.

Grundsätzlich lässt sich das Feedback der User in zwei Kategorien aufteilen.

  • Aktives Feedback: Saves, Playlist Adds, Shares, Skips, Klick auf das Künstlerprofil, dem Artist folgen
  • Passives Feedback: Länge der Hörsession, ob der Track durchgehört wurde, wenn Songs mehrfach gehört werden

Wichtiger sind ganz klar die aktiven Feedbacks. Musik wird oft im Hintergrund konsumiert und so bedeutet ein vollständig durchgehörter Song nicht immer, dass man diesen extrem mag. Womöglich war man einfach kurz auf der Toilette.

Dank dieser Feedbacks hat Spotify zu jedem User ein detailliertes Profil. Sie wissen, welches die Lieblingssongs und -künstler sind, welche Genres, Moods und welche Ära man bevorzugt und natürlich fließen auch demographische und geographische Informationen mit ein. Dieses Profil wird ständig upgedated, wobei das jüngste Hörverhalten stärker bewertet wird. Hat man eben erst ein neues Genre für sich entdeckt, wird dieses stärker bewertet als andere Genres, die man über Jahre hinweg öfter gehört hat.

Verschiedene Algorithmen am Werk

Nun hat Spotify also alle Infos über die Songs und auch die Hörer*innen und sollte somit die richtigen Songs im richtigen Moment vorschlagen können. Dies geschieht auf verschiedensten Wegen, sei es über „Dein Mix der Woche“, „Dein Mixtape“, personalisierte Playlisten oder personalisierte Editorial Playlisten, die Empfehlungen auf der Startseite, personalisierte Suchergebnisse, Playlist-Vorschläge wie natürlich die Artist Radios und die Autoplay Funktion. Für jeden dieser verschiedenen Wege sind eigene Algorithmen am Werk.

Die Algorithmen sind somit im Stande, dem User sowohl Songs vorzuschlagen, die er schon länger nicht mehr gehört hat, aber auch Tracks, die er noch gar nicht kennt, die er aber aufgrund seines Hörverhaltens mögen könnte. Damit will Spotify seinen Usern einen Service bieten, das oberste Ziel ist natürlich die Kundenbindung sowie die Verweildauer auf der Plattform. Als Künstler*in hat man auf die Algorithmen zwar nur bedingt Einfluss, mit sauberen Metadaten und einem gepflegten Profil kann man aber zumindest die Basis legen.