Śladami algorytmu

Codziennie zadajemy sobie wiele pytań. Są wśród nich takie o sens istnienia, nasze obiadowe preferencje, społeczną odpowiedzialność jednostki czy istotę porannego wstawania z łóżka. Jednak może być tak, że ktoś po dłuższym posiedzeniu na YouTubie oderwał na chwilę wzrok od komputera i pomyślał: Kim do licha są Clairo, Boy Pablo i Rex Orange County i dlaczego „wujek Google” każe mi ich słuchać akurat po mojej dwugodzinnej składance japońskiego no wave?

Autor: Jacek Wnorowski

We współczesnej rzeczywistości streamingowej algorytmy odgrywają niebagatelną, jeśli wręcz nie najważniejszą, rolę. Chociaż najwięcej słyszy się o tych opracowywanych przez Spotify, równie wiele wspólnego z tą dziedziną mają choćby Netflix czy YouTube. Jednak o ile Spotify w miarę na bieżąco dzieli się informacjami o swoich samouczących się zabawkach, YouTube podchodzi do sprawy znacznie bardziej enigmatycznie, rzucając zainteresowanym jedynie szczątki informacji i, na ich podstawie, każąc wpasowywać się twórcom treści w obowiązujące trendy.
Na muzycznym podwórku sprawa również jest skomplikowana. Chyba nawet bardziej, bo w domyśle żaden artysta nie szykuje muzyki „pod YouTube” – tak jak mogą robić to „letsplayerzy” albo vlogerzy, którzy budują treść specjalnie pod wyświetlenia. Dla muzyka platforma jest jedynie sposobem na dotarcie do słuchacza, utwór musi tam wylądować, ale zarówno jego źródło, jak i dalsza droga są już sprawami innego rodzaju. Skąd więc biorą się YouTube’owe „polecajki” i wyrosły dookoła nich mikrokosmos?

Rozległa sieć powiązań

Sam Google, mimo niechęci do podawania szczegółów działania swojego tajnego algorytmu zdradza, że jego podstawą są kolektywne działania widzów. Głównym czynnikiem decydującym o obecności na liście polecanych jest parametr, który można nazwać „kooglądalnością” (ang. co–views), a więc relacjami między filmikami. Jeśli dużo osób ogląda film X od razu po filmie Y, to wedle algorytmu są one ze sobą ściśle powiązane. Mimowolnie, największą rolę odgrywają więc kreatorzy treści. Nie chodzi tu o samych artystów, a o twórców publicznych playlist, użytkowników prowadzących kanały z muzyką czy wytwórnie albo agencje koncertowe zarządzające działaniami promocyjnymi – wszyscy oni mają wpływ na wzorce oglądania u widzów. Znacznie mniejszą rolę odgrywają tagi, tytuły czy kategorie – one mają jedynie zmniejszać liczbę błędów głównego składnika algorytmu. Między innymi z tej siatki powiązań biorą się „pewniaki”, czyli utwory, na które można natknąć się statystycznie znacznie częściej niż na inne. Wsiąkły w tkankę YouTube’a i są powiązane z tyloma innymi klipami, że prędzej czy później muszą się gdzieś pojawić.

W pogoni za nieznanym

Skoro nie wiemy dużo więcej o samej mechanice, trzeba dać się jej poprowadzić. Tak właśnie zrobili autorzy artykułu Follow the algorithm: An exploratory investigation of music on YouTube. Puścili algorytm „w ruch” i podążyli za nim, „czołgając” się po liście proponowanych oraz zbierając po drodze najciekawsze informacje. Zbudowali bazę ponad 20 tys. unikatowych filmików, których parametry i tytuły poddali odpowiedniej analizie statystycznej, uzyskując przy tym interesujące efekty i zauważając istotne tendencje.
Badanie dostarcza ciekawych wniosków związanych z relacjami pomiędzy filmikami. Do skutecznego prześledzenia ścieżek użytkowników i skupisk powiązanych utworów naukowcy użyli narzędzi analizy sieciowej. To badanie stosunków między elementami sieci (którymi w tym przypadku były filmiki) oparte na teorii sieci wywodzącej się z nauk społecznych. W ten sposób można skupić się m. in. na gęstości i sile powiązań, a także przyjrzeć się zależnościom między względnie jednorodnymi grupami filmików. Tych badacze wyróżnili pięćdziesiąt, za kryteria podziału przyjmując słowa występujące w tytułach – nazwy artystów, nastrój (słowa jak sen, relaks, spokój), otoczenie (geograficzne, kulturalne i społeczne aspekty, określenia jak muzyka sudańska czy irlandzki folklor), gatunek (rock, pop), terminy związane z muzyką (live, remix) czy z muzycznym środowiskiem (nazwy stacji radiowych, wytwórni).

Przecieranie ścieżki

Najliczniejszą grupą okazały się filmiki ochrzczone przez naukowców jako teen pop – w tym worku wylądowali zarówno popularni artyści pop, jak i akustyczne covery zalewające platformę. Licznymi grupami okazały się też: ta zawierająca soundtracki i muzykę epicką oraz ta z muzyką relaksacyjną. W obu przypadkach filmikiem będącym centrum grupy, czyli mającym najwięcej powiązań z innymi, była kompilacja o tytule w stylu background music instrumentals. Jeśli zaś chodzi o najwyższą średnią odtworzeń, bezkonkurencyjne były popowe przeboje, latin pop i rockowe hity z lat 80. i 90. Co ciekawe, w czołówce jest też kategoria teen pop fandom, w której skład wchodzą m.in. kompilacje śmiesznych zachowań członków zespołu One Direction. Tutaj też warto zaznaczyć, że badanie było prowadzone w okolicach roku 2016, kiedy to muzyczny krajobraz mógł być nieco inny niż teraz. A jednak, jedna rzecz pozostała z pewnością niezmienna – wysoka średnia odtworzeń i liczba filmików w grupie disco polo. Ponownie jednak jej centrum stanowi typowa losowa kompilacja.

Odkrywanie śladów

W kwestii interakcji między klastrami nie ma zaskoczeń – soundtrack łączy się z muzyką relaksacyjną, a indie z popem, podobnie jak country czy rock. Można się jedynie pokusić o obserwację, że pewne gatunki muzyczne mają bardzo silne powiązanie z ich rolą funkcjonalną – lounge czy muzyka klasyczna mają relaksować, a muzyka liturgiczna czy chóralna wprawiać w uniesienie. Wykorzystanie psychologicznej wiedzy o słuchaniu funkcjonalnym i sytuacyjnym jest konikiem Spotify, które układa użytkownikom specjalne playlisty do pracy, do biegania albo do nauki.

Raport z badań

Wyniki badania europejskich uczonych dają kilka istotnych odpowiedzi. Tłumaczą częste przewijanie się tych samych filmików w polecanych, rolę oglądających i udostępniających w budowaniu sieci powiązań między filmami oraz rozkład wyświetleń w wydzielonych grupach. Nie dają jednak odpowiedzi na jedno, wręcz filozoficzne pytanie: czy podczas wycieczki ścieżkami YouTube’a to legendarne algorytmy kierują naszą podróżą, czy tak naprawdę stąpamy ciągle po śladach innych użytkowników?

źródło: M. Airoldi, D. Beraldo i A. Gandini, Follow the algorithm: An exploratory investigation of music on YouTube, “Poetics”, nr 57, 2016