Od jakiegoś czasu obserwuję żywą w środowisku praktyków i teoretyków prawa własności intelektualnej wymianę myśli dotyczącą wpływu oprogramowania sztucznej inteligencji na prawa autorskie i prawa zależne. Chodzi o model sztucznej inteligencji bazującej na algorytmach pozwalających na wypracowywanie wniosków na podstawie analizy ogromnej ilości danych, w szczególności zasobów internetu (w tym utworów w rozumieniu prawa autorskiego), w ramach tzw. deep learning. Ogólnie rzecz biorąc od strony prawnej problematyka sztucznej inteligencji jest ogromna, jednak w artykule zajmę się tylko jej wycinkiem.
Otóż jedną z kwestii praktycznych, już czekających na rozstrzygnięcie jest ustalenie, czy oprogramowanie sztucznej inteligencji takie jak Chat GPT czy DALLE E może bez zgody twórców i innych uprawnionych korzystać z utworów chronionych prawami autorskimi w celu „uczenia się”, tak by na podstawie analizy dostępnych utworów tworzyć nowe treści. Jest to o tyle kwestia praktyczna, że Chat GPT i inne narzędzia AI są już praktycznie wykorzystywane w obrocie komercyjnym (zastępują lub wspomagają np. grafików czy copywriter’ów), a według doniesień medialnych operator Chat GPT został pozwany przez literatów przed amerykańskim sądem z powodu „uczenia się” przez Chat GPT z utworów tych twórców. Zresztą tytułowe pytanie padło też ze strony jednego z moich Klientów.
Oczywiście w zderzeniu z tak innowacyjną technologią nasza leciwa ustawa o prawie autorskim i prawach pokrewnych z 1994 roku nie daje nam wprost odpowiedzi na wskazane wyżej pytanie, co nie jest żadną ujmą biorąc pod uwagę, że kwestię wpływu sztucznej inteligencji na rzeczywistość, w wielu wymiarach, muszą uregulować ustawodawcy na całym świecie.
Odpowiedzi na zadane pytanie należy szukać w art. 4 i motywie 18 Dyrektywy Parlamentu Europejskiego i Rady (UE) 2019/790 z dnia 17 kwietnia 2019 r. w sprawie prawa autorskiego i praw pokrewnych na jednolitym rynku cyfrowym oraz zmiany dyrektyw 96/9/WE i 2001/29/WE, wciąż oczekującej w Polsce na implementację. Analiza wskazanego przepisu i motywu wskazuje, że prawo implementujące wyżej wskazaną dyrektywę zagwarantuje wyjątki od monopolu prawnoautorskiego i monopolu producentów baz danych w zakresie zwielokrotnień i pobrań treści na potrzeby eksploracji tekstów i danych, a więc automatycznej analizy treści cyfrowych w celu wygenerowania informacji, obejmujących między innymi wzorce, tendencje i korelacje. Oznacza to, że narzędzia AI będą mogły analizować w procesie uczenia utwory objęte ochroną prawoautorską bez zgody twórców i innych uprawnionych, pod następującymi warunkami przewidzianymi w dyrektywie:
- utwory które narzędzie AI będzie analizować będą dostępne zgodnie z prawem (w praktyce chodzi o legalnie upublicznione utwory w internecie albo utwory legalnie zagregowane w bazach danych współpracujących z narzędziem IT),
- zwielokrotnianie i pobranie będzie trwać nie dłużej, niż konieczne jest to do celów eksploracji tekstów i danych, (przy czym to zastrzeżenie nie dotyczy organizacji badawczych i instytucji dziedzictwa kulturowego, gdzie utwory mogą być przechowywane do celów badań naukowych, w tym do celów weryfikacji wyników badań),
- uprawnieni do mających podlegać analizie AI utworów nie zastrzegą wyraźnie, np. w sposób cyfrowy, że odmawiają dostępu do utworów w celu eksploracji (przy czym to zastrzeżenie nie dotyczy organizacji badawczych i instytucji dziedzictwa kulturowego w zakresie badań naukowych).
Powyższe oznacza w praktyce, że będzie można korzystać legalnie z narzędzi AI generujących treści na podstawie analizy cudzych utworów dopiero po spełnieniu dwóch wymagań. Pierwszym jest oczywiście zaimplementowanie w Polsce wspomnianej dyrektywy. Drugim jest zapewnienie zgodności z prawem działania narzędzia AI, które powinno zapewniać:
- funkcjonalność weryfikacji treści internetu pod kątem potencjalnie nielegalnie opublikowanych treści i eliminowanie ich z analizy,
- funkcjonalność weryfikacji treści internetu pod kątem utworów zastrzeżonych jako niepodlegających eksploracji i eliminowanie ich z analizy,
- czasowe ograniczanie do zwielokrotniania i pobrania utworów, tak by te operacje miały jedynie miejsce przez czas niezbędny do uczenia się narzędzia IT (w praktyce ta ostatnia przesłanka nie wydaje się problematyczna).
Oczywiście trzeba mieć przy tym świadomość, że użytkownicy narzędzi AI nie będą zapewne mogli wpływać na jakość prawną zasobów, z którego narzędzia AI korzystają, jednak rynek zapewne z czasem będzie premiował tych usługodawców, którzy zapewnią zgodność z prawem swojego produktu.
Co jednak w przypadku praktyk, których celem będzie ewidentne kopiowanie konkretnych utworów, inicjowanie działań mających na celu imitowanie stylu danego artysty (np. zadaniowanie narzędzi AI aby tworzyły np. grafiki lub utwory literackie w stylu konkretnego artysty) albo opracowanie konkretnego utworu.
W mojej opinii takich działań nie będzie można utożsamić z „eksploracją tekstów i danych” o której mowa we wspomnianej dyrektywie. Zgodnie z definicją legalną eksploracja tekstów i danych jest:
„zautomatyzowaną technikę analityczną służącą do analizowania tekstów i danych w postaci cyfrowej w celu wygenerowania informacji, obejmujących między innymi wzorce, tendencje i korelacje”.
Zatem takie działania jak kopiowanie, skracanie (tworzenie streszczeń), modyfikowanie (np. przekształcanie zdjęć z użyciem technik graficznych) nie zmieszczą się w pojęciu analizy i raczej nie znajdą się po ochroną prawa, a zatem będą sankcjonowane zgodnie z ustawą o prawie autorskim i prawach pokrewnych. Najbardziej kontrowersyjne wydaje się imitowanie stylu danego artysty, co zapewne będzie wymagało kazuistycznych rozstrzygnięć sądowych. Nie będzie też podstaw do korzystania z zarejestrowanych znaków towarowych, wygenerowanych przez narzędzie IT.
W aktualnym stanie prawnym w Polsce, póki nie doszło do implementacji wspomnianej dyrektywy brak jest jednoznacznej odpowiedzi na tytułowe pytanie o legalność działania narzędzi IT opartych o analizę danych internetowych. Wydaje się, że można w potencjalnym sporze próbować dowodzić legalności uczenia się narzędzia IT na podstawie analogii do instytucji dozwolonego inspirowania się cudzym utworem. Trzeba mieć tu jednak na uwadze, że konstrukcja prawna dozwolonej inspiracji jest obca w stosunku do problematyki sztucznej inteligencji i generuje pytania, czy utwór sporządzony przez narzędzie IT jest w ogóle utworem zależnym skoro nie został stworzony przez człowieka oraz czy program komputerowy może inspirować się cudzym utworem, czy inspirowanie się jest raczej domeną człowieka. Z drugiej strony trzeba też kalkulować, że twórcom często może być trudno wykazać, że narzędzie IT poddało analizie (a więc pobranie, zwielokrotnienie) właśnie ich utwór, w szczególności gdy zadaniując narzędzie IT zażądaliśmy rezultatu abstrakcyjnego.