Sztuczna inteligencja nie zastąpi ludzi w ocenianiu, czy dany utwór muzyczny jest plagiatem – uważają naukowcy z Auckland. Analizie poddano 40 historycznych spraw o plagiat. Sztuczna inteligencja wykazała o 8 pkt proc. niższą skuteczność niż ludzie. Do podstawowych ograniczeń zastosowania algorytmów w takich sprawach zalicza się zbyt małą i obarczoną błędem selekcji bazę wiedzy. Sztuczna inteligencja opiera się bowiem na sprawach, w których zapadły wyroki, nierzadko kontrowersyjne. Większość sporów z oczywistym wynikiem było natomiast rozstrzyganych poza wokandą.
– Zasady rozstrzygania o plagiacie różnią się nieco w zależności od kraju, jednak głównym modelem, jaki ma zastosowanie, jest ten stosowany w USA. Decyzje podejmuje zespół sędziów na podstawie odsłuchu utworu. Nie jest to więc podstawa naukowa oparta o kryteria ilościowe. Decyzja opiera się na opinii grupy osób, które po przesłuchaniu danych utworów stwierdzają, czy są one do siebie zbyt podobne. Jeśli tak, kwestionowany utwór zostaje uznany za plagiat, a jeśli osoby nie stwierdzą, że utwory są do siebie nadmiernie podobne, wtedy nie ma plagiatu. Jest to uproszczony opis tego procesu. Problem polega na tym, że oceny ludzi, w jakim stopniu dane rzeczy brzmią podobnie, mogą być dość subiektywne – mówi w wywiadzie dla agencji Newseria Innowacje dr Patrick Savage z Uniwersytetu w Auckland.
Naukowiec wspólnie z prof. Quentinem Atkinsonem stworzył algorytm Percent Melodic Identity, a dr Dominik Schnitzer z Austriackiego Instytutu Badawczego Sztucznej Inteligencji opracował algorytm Musly. Oba te narzędzia są uznawane za najlepsze w wykrywaniu plagiatów muzycznych. W ramach pracy badawczej zespół naukowców próbował odpowiedzieć na pytanie, czy zautomatyzowane algorytmy mogą zapewnić nowy obiektywizm w decyzjach o naruszeniu praw autorskich do muzyki, ograniczając tym samym liczbę, skalę i koszt spraw sądowych.
– Chcieliśmy się przekonać, czy można przewidzieć historyczne przypadki naruszenia prawa autorskiego na podstawie obiektywnych kryteriów, takich jak podobieństwo stwierdzone na podstawie algorytmu i spostrzeżeń, oceny ludzi. Staraliśmy się zgromadzić jak największą próbę historycznych spraw. Zebraliśmy około 40 spraw z całego świata, w większości ze Stanów Zjednoczonych, ale także z krajów takich jak Japonia, Chiny, Nowa Zelandia i Tajwan – wyjaśnia dr Patrick Savage.
Algorytmy nie zastąpią ludzi!
W badaniu analizowanych spraw naukowcy zastosowali algorytmy podobieństwa, z których jeden opierał się na melodii, a drugi na całej ścieżce dźwiękowej, z uwzględnieniem takich elementów jak rytm i barwa dźwięku oraz brzmienie wokalu i instrumentów. Prowadzili również eksperymenty z udziałem ponad 50 osób, które słuchały wersji oryginalnych pełnych nagrań dźwiękowych oraz wersji zmodyfikowanych z samą melodią, a także wersji midi na pianinie. Uczestnicy mieli za zadanie ocenić podobieństwo tekstu.
– Wyniki nieco nas zaskoczyły. Myśleliśmy, że melodia będzie najlepszym czynnikiem predykcyjnym, ponieważ w przeszłości była uważana za najlepszy miernik oryginalności, jednak nasze przewidywania nie spełniły się w całości. Najlepszą wartość predykcyjną miały pełne wersje audio słuchane przez ludzi. Ocena melodii na podstawie algorytmów również była dość dokładna i sprawdzała się w około 75 proc. przypadków, jednak nie była tak dobra jak ludzka ocena po wysłuchaniu pełnego materiału dźwiękowego, w przypadku której poprawność oceny historycznych przypadków wynosiła 83 proc. – wskazuje badacz z Uniwersytetu w Auckland.
W ocenie naukowców algorytmy nie zastąpią oceny ludzkiej w sprawach o plagiat, ale mogą być istotnym wsparciem w ich pracy. Jednym z podstawowych ograniczeń sztucznej inteligencji w takich zastosowaniach jest fakt, iż jest ona szkolona na ograniczonej bazie utworów. Odnosi się to zarówno do ich liczby, jak i miejsca, gdzie powstawały.
– Jeżeli zaprojektujemy algorytmy w oparciu o muzykę zachodnią i przypadki naruszenia praw autorskich z USA, będą one działały lepiej w tych przypadkach, ale mogą nie sprawdzać się tak dobrze w innych systemach czy kulturach. Jest to uniwersalny problem związany z algorytmami. Jeśli chodzi konkretnie o prawa autorskie i plagiat, niektórych rzeczy nie można usłyszeć na ścieżce dźwiękowej, na przykład tego, czy dana strona miała dostęp do utworu drugiej strony, czy go słyszała. Jest to element oceny, którego nie można wywnioskować z samego utworu. Należy również wziąć pod uwagę, na ile oryginalny jest dany materiał. Może on być dość podobny, jednak jeśli określony motyw występuje w wielu różnych materiałach, to podobieństwo nie powinno znacząco wpływać na ocenę. Można spróbować uwzględnić ten element w algorytmach, ale trudno tutaj osiągnąć stuprocentową niezawodność – ocenia dr Patrick Savage.
Najważniejsze są orzeczenia sądu
Poza tym baza opiera się wyłącznie na analizie spraw, co do których w przeszłości zapadły wyroki, a to dodatkowo zawęża objętość danych wsadowych. Co więcej, wyroki niekiedy były kontrowersyjne. Tak było chociażby w przypadku piosenki „Blurred Lines” Robina Thicke’a, który powstał we współpracy z Pharellem Williamsem i raperem T.I. Rodzina amerykańskiego piosenkarza soulowego, Marvina Gaye'a, pozwała twórców, twierdząc, że ich dzieło jest plagiatem jego utworu „Got to Give It Up”. Sąd przyznał rację powodom, z czym wiele osób do dziś się nie zgadza. Decyzją sądu muzycy musieli zapłacić rodzinie artysty 7,4 mln dol. z zarobionych na utworze niemal 17 mln dol.
– Musimy polegać na orzeczeniach sądu, nawet jeśli się z nimi nie zgadzamy. Być może poważniejszym problemem jest w tym przypadku błąd selekcji próby. Ze wszystkich roszczeń w sprawach o naruszenie praw autorskich na świecie wiele jest dość przejrzystych. Utwory są w oczywisty sposób identyczne, czyli prawa autorskie zostały ewidentnie naruszone. Zazwyczaj te najbardziej oczywiste sprawy nie trafiają do sądu, ponieważ jeśli podobieństwo jest zbyt oczywiste, nie warto poświęcać czasu i pieniędzy na postępowanie sądowe. Strony zawierają ugodę lub rezygnują. W ten sposób uzyskujemy próbę obciążoną błędem selekcji, która zawiera wyłącznie sprawy najbardziej skomplikowane, interesujące i toczące się o największą stawkę – tłumaczy naukowiec z Auckland.
Jak podkreśla, algorytmy mogą pomóc członkom zespołów oceniających w zdecydowaniu, czy mają do czynienia z plagiatem
– W naszym opracowaniu mamy do czynienia z 40 sprawami przedstawionymi w dwóch wymiarach – podobieństwo na podstawie oceny i podobieństwo melodii. Jeśli by przedstawić nowe przypadki w sądzie i umieścić na mapie podobieństwa melodii i innych cech, byłby to lepszy kontekst do podjęcia decyzji. Mimo mniejszego podobieństwa utworów, ale przy wystąpieniu określonych kontekstów być może dany przypadek powinien zostać uznany za naruszenie praw autorskich, chociaż w poprzedniej sprawie tak się nie stało. Dysponując kontekstem i ilościowym przedstawieniem podobieństw oraz możliwością porównania ich z historycznymi sprawami, będzie można wyeliminować w pewnym stopniu subiektywny element oceny i stworzyć bardziej niezawodne podstawy dla przyszłych spraw sądowych – ocenia dr Patrick Savage.
Jakie piosenki są plagiatowane?
Mimo ograniczeń znacznie obniżających skuteczność zautomatyzowanych narzędzi wykrywających plagiat firmy z branży muzycznej zaczynają eksperymentować z ich wdrażaniem. Tak jest m.in. w przypadku Spotify. Operator platformy udostępnił w 2020 roku narzędzie Plagiarism Risk Detector and Interface, przeznaczone dla autorów muzyki. Działa na zasadzie analizy partytur zawierających podstawowe elementy utworu, w tym jego melodię, tekst i harmonię. Dzięki temu muzycy mogą zgłaszać własne utwory do analizy pod kątem ryzyka plagiatu, a detektor krzyżuje dane ze wszystkimi utworami, które znajdują się w bazie danych. Po analizie użytkownik widzi okno, w którym zaznaczone są fragmenty utworu pojawiające się w dziełach innych twórców.
Oprócz wspomnianego wyżej sporu z udziałem Robina Thicke’a do najsłynniejszych spraw o plagiat zalicza się m.in. tę, która wiąże się z utworem „Frozen” Madonny. Belgijski sąd uznał w 2005 roku roszczenia kompozytora Salvatore’a Acquavivy, który stwierdził liczne podobieństwa ze swoją skomponowaną wcześniej piosenką „Ma Vie Fout L’camp”.
Również w Polsce nie brakuje podobnych sporów. Kilka głośnych spraw toczyło się z udziałem Sławomira Świerzyńskiego, lidera zespołu Bayer Full, tworzącego muzykę z nurtu disco polo. W 2021 roku sąd orzekł, że twórca przywłaszczył piosenkę „Tawerna »Pod Pijaną Zgrają«” autorstwa Grzegorza Bukały. Zespół został pozwany także przez Mariusza Gabrycha, który uznaje się za autora piosenki „Wszyscy Polacy to jedna rodzina”. Jeszcze wcześniej, w 2012 roku, Sąd Apelacyjny w Łodzi uznał, że zespół, nagrywając piosenkę „Taka muzyka”, dopuścił się częściowego plagiatu „Takiej piosenki” Karola Płudowskiego.