Deepfake – zagrożenia i szanse sztucznej inteligencji w fotografii i w filmie

2

Od początku istnienia fotografii traktowano ją jako bardziej obiektywną niż ludzkie spojrzenie. Przez to wielokrotnie była brana za dowód – naukowy, w sądzie czy w prasie. Wciąż przykłada się do niej taką wagę i jej zdolność do dokumentowania świata potrafi go zmieniać. Jednakże obecnie fotografia i film stoją przed ogromnym wyzwaniem, które niosą tzw. deepfake i sztuczna inteligencja. Czym one są? I czy w ogóle fotografia kiedykolwiek mówiła obiektywną prawdę?

Historia fotografii i filmu – wszyscy uwierzyli w ich prawdziwość

Gdy w XIX wieku świat poznał wynalazek fotografii, zachwycił się przede wszystkim jej obiektywnością i tym, że jest zdolna pokazywać świat dokładnie takim, jakim jest. Było to myślenie, które wynikało z ograniczeń malarstwa, postrzeganego przez pryzmat subiektywności spojrzenia malarza czy niedoskonałości warsztatu malarskiego. W porównaniu z malarstwem obiektywy i szklane płyty rejestrowały świat bez ludzkiej interpretacji. 

Jeden z najstarszych znanych portretów wykonany w 1839 lub w 1840 roku przez Johna Williama Drapera. Takie obrazy zachwycały wiernością odwzorowania.

Już jedna z pierwszych książek o fotografii The Pencil of Nature (Ołówek natury) autorstwa jednego z pionierów fotografii Wiliama Foxa Talbota zdradzała i ugruntowywała to myślenie. Książkę otwierał taki oto komentarz:

„Na kliszach obecnej pracy odciska się działanie samego Światła, bez jakiejkolwiek pomocy ołówka artysty. Są to same obrazy słońca, a nie, jak niektórzy wyobrażają sobie, imitacje rycin.” / William Fox Talbot

Według ówczesnych nie tylko sama natura stanowiła „pędzel”, który tworzył obrazy, ale również udawało się uzyskać jej wierną kopię. Jednocześnie powszechnie nie dostrzegano – lub nie chciano dostrzegać – że fotografia od samego początku stanowiła tak naprawdę interpretację. Chociażby pierwszy dagerotyp powstały w 1838 roku, będący jednocześnie jedną z pierwszych fotografii na świecie. Przedstawiał widok na Boulevard du Temple w Paryżu, a przez swój długi czas naświetlania nie zarejestrował wyraźnie ludzi, co już samo w sobie stanowiło wyłom w dokumentalnym, wiernym charakterze fotografii.

Fotografia spirytystyczna – wypróbuj tajemniczą technikę z XIX wieku

Pierwszy na świecie dagerotyp i jedna z pierwszych fotografii – Boulevard du Temple w Paryżu. Jej czas naświetlania wynosił 10 minut, przez co nie zarejestrowali się ludzie przemieszczający się po ulicy. Jedynie pucybut i jego klient przebywali na tyle długo w jednym miejscu, aby na obrazie utrwaliły się ich sylwetki.

Z kinem zresztą było podobnie. Kinematografia jako córka fotografii dziedziczyła te same nadzieje z nią związane. Ciekawym przykładem jest jeden z pierwszych seansów kinowych zorganizowanych przez braci Lumiere, gdzie pokazywali szerszej publiczności swój wynalazek. Jak głosi legenda podczas prezentacji dzieła Wjazd pociągu na stację w La Ciotat w 1886 roku publiczność w panice uciekała przed jadącą na nią lokomotywą. Choć najprawdopodobniej jest to mit, to jednak jego siła oddziaływania ukazuje podświadome nadzieje, że chociaż fotografia i film może dostarczyć nam obiektywnej prawdy. 

Czy fotografia i film są obiektywne? 

Chociaż legenda o publiczności uciekającej przed pociągiem z filmu wydaje się dziś zabawną anegdotą, to jednak wciąż poddajemy się pewnemu mitowi, że fotografia i film mogą mówić prawdę i są obiektywne. Mam tu na myśli fotografię i film dokumentalny czy reportaż, gdzie autorzy nie korzystają z pomocy oprogramowania czy innych zabiegów wizualnych do budowania nierzeczywistych światów, czyli w  których celowo buduje się alternatywne wersje świata do opowiadani historii.

„Matka tułaczka” autorstwa Dorothea Lange to jedno z ikonicznych zdjęć fotografii dokumentalnej, które miało ogromny wpływ na opinię publiczną, przedstawiając oblicze czasu Wielkiego kryzysu w USA.

Aby uprościć sprawę odnoszę się tutaj do samego faktu fotografowania świata, w który nie ingerował autor zdjęcia czy filmu i sytuacji, gdy materiał nie był opracowywany żadnym oprogramowaniem. Takim przykładem zdaje się być powyższe zdjęcie Lange. Czy w takiej sytuacji można mówić o obiektywnej prawdzie czy subiektywnym postrzeganiu świata? Moim zdanie wciąż to drugie. Nawet historia „Matki tułaczki” była związana z błędnym – a jak wielu sądzi celowo mylnym – opisem, przeinaczającym fakty.

Fotografia i film od samego początku – czy to historycznie rzecz ujmując, czy jako proces tworzenia obrazu – są skazane na bycie iluzją. Iluzją optyczną, w której maleńkie punkty (czy to na materiale światłoczułym  i papierze czy na matrycy i na ekranie) układają się w złudzenie obrazu świata. Począwszy od wszystkich elementów warsztatu fotografa czy filmowca po interpretację publiczności bierzemy udział w opowieści o alternatywnej wersji świata – wizualnej. 

Quiz – sprawdź swoją wiedzę o fotografii analogowej!

Co to jest deepfake?

Pisząc o subiektywności fotografii i filmu sięgających ich zarania, chciałem podkreślić, że problem deepfake’ów nie jest moim zdaniem czymś zupełnie nowym, lecz spotęgowaniem narastających komplikacji w postrzeganiu fotografii i filmu. Jednakże czym w ogóle jest deepfake?

W dużym uproszczeniu deepfake to obrazy wygenerowane przy pomocy sztucznej inteligencji i algorytmów głębokiego uczenia, które umożliwiają na podstawie istniejących obrazów tworzenie łudzących, nowych materiałów. Przykładowo można generować portrety nieistniejących ludzi czy łączyć zdjęcia znanych osób tak, aby generować realistycznie wyglądające, lecz sztuczne nowe filmy i zdjęcia. Te zabiegi mogą służyć do dezinformacji, głównie wykorzystywanej w polityce, czego zintensyfikowanie nastąpiło podczas ataku Rosji na Ukrainę. Poniżej możesz zobaczyć przykładowe materiały deepfake.

Ciekawym przykładem jest historia fake’owego profilu w mediach społecznościowych aktora Toma Cruise’a, gdzie połączenie jego sobowtóra i sztucznej inteligencji  umożliwiło wprowadzenie w błąd wielu obserwujących to konto:

Oglądając je w kontekście tego artykułu można dosyć łatwo wyłapać ich sztuczność. Jednakże przy codziennym oglądaniu setki materiałów w mediach społecznościowych czy na portalach nasza percepcja może zawieść. W szczególności jeśli sytuacja dotyczy osób nie interesujących się tak bardzo fotografią czy filmem. Co więcej rozwiązania sztucznej inteligencji cały czas się rozwijają i jeśli już teraz uzyskują takie efekty, to co będzie za 5, 10 i więcej lat? 

Deepfake a fotografia i film

Widząc powyższe filmy z łatwością można wyobrazić sobie zagrożenia płynące z deepfake. Ale moim zdaniem z tymi problemami spotykaliśmy się już od dłuższego czasu. Przykładem jest oprogramowanie graficzne pozwalające na kreowanie nierealnych wzorów urody. Ale nawet pozostając w obrębie samej rejestracji obrazów bez dodatkowej ingerencji, interpretacja samych rejestrujących czy publiki lub wprowadzające w błąd podpisy pozwalały na sianie dezinformacji. Spójrzmy na poniższy przykład.

Nie potrzeba oprogramowania graficznego, sztucznej inteligencji i innych technologii, aby stworzyć dezinformujące zdjęcie. Wystarczą wszystkie te elementy, które są obecne w fotografii (i w filmie) od samego początku – punkt widzenia, kompozycja, kadr it. Do tego może dojść np. spłaszczenie perspektywy przez teleobiektyw.

Teleobiektywy takie jak np. Canon RF 400MM F2.8L IS USM pozwalają na „spłaszczenie perspektywy”, tworząc złudzenie, że 2 obiekty znajdowały się bliżej siebie niż w rzeczywistości. Dzięki temu pomimo że w rzeczywistości nie było między nimi bezpośredniej relacji przestrzennej, na fotografii może wydawać się, że stały tuż obok siebie. Innym przykładem prostych sztuczek, które umożliwiają tworzenie iluzji za pomocą fotografii są popularne zabawy z perspektywą, takie jak zdjęcia krzywej wieży w Pizie, gdzie turyści dzięki perspektywie udają, że podpierają słynną budowlę.

Deep fake i sztuczna inteligencja – nie tylko zagrożenie

Warto więc nauczyć się większej rezerwy na co dzień, obcując z każdym obrazem – nie tylko na wypadek spotkania deepfake. Ale deepfake i sztuczna inteligencja to nie tylko zagrożenia. W fotografii i filmie dają także wiele dobrego – i to w odniesieniu zarówno do obrazów, jak i technologii. Deepfake pozwalają na tworzenie zabawnych materiałów czy swobodną zabawę z obrazami. Ułatwiają tworzenie gier komputerowych i prowadzenie badań, mogą przydać się w medycynie itp.

Zobacz kolejny przykład, który dowodzi, że sztuczna inteligencja i głębokie uczenie to nie tylko czyste zło. Wróć także do filmu braci Lumiere, gdzie sztuczna inteligencja umożliwiła pokolorowanie obrazu i przeskalowanie do 4K. NVIDIA opracowała technologię Instant NeRF, która umożliwia natychmiastowe (w czasie milisekund) tworzenie obrazów 3D na podstawie kilku zdjęć 2D. Zobacz poniższe wideo, które bardzo dobrze objaśnia tę technologię:

Fascynujący jest wątek Polaroida i fotografii natychmiastowej zawarty w tym filmie. Otóż NVIDIA nawiązuje do kultowego zdjęcia Andy’ego Warhola. Swoim filmem NVIDIA oddaje hołd technologii fotografii natychmiastowej, która umożliwia uzyskanie w kilka sekund wydruku 2D na podstawie rejestracji świata 2D, a teraz za pomocą Instant NeRF możliwe jest odwrócenie (i przyspieszenie) tego procesu. W kilka milisekund opracowywany jest świat 3D z 2D. 

Sztuczna inteligencja, głębokie uczenie i pokrewne technologie są także wykorzystywane w sprzęcie do fotografowania i filmowania, tak aby pomagać nam robić lepsze zdjęcia i wideo, a także by po prostu robić je łatwiej i szybciej. Oto kilka przykładów: 

Kamera sportowa Insta360 ONE RS Twin Edition wykorzystuje sztuczną inteligencję w oprogramowaniu do edycji materiałów, tak aby szybko i łatwo tworzyć filmy złożone z kilku ujęć.

Dron PowerVision PowerEgg X Wizard wykorzystuje sztuczną inteligencję i głębokie uczenie do rozpoznawania twarzy w trybie AF.

Podsumowanie 

Sztuczne inteligencja i deepfake stanowią zarówno szansę, jak i zagrożenie. Tworzenie deepfake’ów i sianie dezinformacji jest jednak łatwiejsze dzięki temu, że tak bardzo zaufaliśmy fotografii i filmowi. Warto pamiętać o pewnej dozie sceptycyzmu zawczasu, tak aby uodpornić się na działanie deepfake’ów. A ludzkości i naukowcom – choć z pewnością naiwnie – warto życzyć więcej (lub wyłącznie) światłego wykorzystania tych fascynujących technologii. 

A Ty co myślisz o prawdzie w fotografii i w filmie? Czy przydarzyło Ci się zostać oszukanym przez deepfake? Dołącz do dyskusji w komentarzach.

Chcesz więcej? Zapisz się newsletter!

Dzięki temu nie przegapisz nowych artykułów, jako pierwszy dowiesz się o darmowych warsztatach foto-video i zgarniesz najlepsze rabaty na zakupy w Cyfrowe.pl! Nie martw się, nie wysyłamy spamu, ani nie piszemy codziennie :) Tylko wartościowe treści!

Zapisz się >

 

Podziel się.

O Autorze

Redaktor w sklepie Cyfrowe.pl. Absolwent fotografii na Uniwersytecie Artystycznym w Poznaniu. W swoich pracach łączy dokument i science-fiction. Z tego zestawienia tworzy własny opis świata.

2 komentarze

  1. Ogólnie krótki i pobieżny artykuł.
    Niemniej jednak autor nie za bardzo ma pojęcie o robieniu zdjęć typu „podpieranie krzywej wieży”, bo wspomnianym obiektywem w żaden sposób by mu to się nie udało. Tu potrzeba szerokiego kąta i dużej głębi ostrości.
    No i dobrze by było nie powielać bajek o „spłaszczenie perspektywy” – nic takiego nie istnieje. To tylko większy lub mniejszy fragment obrazu, który obiektyw wycina. Jak do tej pory ludzkość nie wymyśliła obiektywu, który potrafiłby spłaszczyć perspektywę.

    • Mikołaj Konkiewicz w

      Fragment o obiektywie, rzeczywiście mógł wprowadzać w błąd w kontekście wykorzystywanego obiektywu do fotografowania np. krzywej wieży w Pizie. Bardziej miałem tu na myśli samo zjawisko niż opis techniczny. Co do drugiej części Twojego komentarza — przed przystąpieniem do dyskusji czy mógłbym poznać, w jakim znaczeniu użyłeś słowa perspektywa w tym komentarzu? :) O relacji wycinku obrazu, perspektywie itd. pisałem w jednym z poprzednich artykułów -> O jak ogniskowa i jej wpływ na perspektywę.

Zostaw komentarz

izmir escort