Wykorzystanie obrazów tworzonych przez sztuczną inteligencję w kreacjach marketingowych
źródło: opracowanie własne
Ostatnio bardzo popularny staje się temat modeli sztucznej inteligencji, które tworzą obrazy na podstawie wprowadzonych słów kluczowych (Text-to-image AI models). Na rynku pojawia się coraz więcej wykorzystujących je programów i aplikacji, a generowane komputerowo grafiki znajdują wiele zastosowań. Ale jak wszystko, co związane z tematem AI nowa funkcjonalność maszyn wywołuje liczne kontrowersje. Bo czy to możliwe, że komputery już nie tylko za nas liczą, ale też tworzą dzieła sztuki?
Jason Allen, który zawodowo projektuje gry wideo, poświęcił około 80 godzin na stworzenie obrazu „Theatre D’opera Spatial” (na zdjęciu poniżej), który wygrał konkurs artystyczny Colorado State Fair w kategorii „sztuki cyfrowe/fotografia cyfrowo zmanipulowana”. Nie byłoby w tym nic dziwnego, gdyby nie to, że po wygranej autor zwycięskiej pracy ujawnił, że grafika została stworzona przy pomocy programu Midjourney, który wykorzystuje właśnie sztuczną inteligencję Text-to-image. Oznacza to, że obraz powstał dzięki algorytmowi, który na podstawie zgromadzonej w nim bazy danych oraz odpowiednich słów kluczowych wybranych przez Pana Allena zaprojektował dzieło. Nie tylko zresztą „Theatre D’opera Spatial”, bo zwróconych w wyniku zapytania obrazów było ponad 100. Spośród nich laureat konkursu wybrał trzy, w tym ten zwycięski. Oczywiście nie chodziło wyłącznie o wzięcie udziału w konkursie (nagrodą była podobno zawrotna kwota 300 dolarów), ale o nagłośnienie projektu „Space Opera Theatre” (Kosmiczny Teatr Operowy), którego te grafiki będą częścią. Choć organizatorzy konkursu nie mieli żadnych zastrzeżeń, a regulamin dopuszczał wszystkie możliwe „praktyki artystyczne wykorzystujące technologię cyfrową jako część procesu twórczego lub prezentacji dzieła” w internecie rozpoczęła się gorąca dyskusja. Bo kto właściwie jest autorem obrazu? Programiści, którzy stworzyli algorytm na którym opiera się Midjourney, artyści, których prace stanowią bazę danych na jakiej program się opiera czy może sam Pan Allen, który był autorem pomysłu i poświęcił swój czas na dobranie odpowiednich parametrów, w tym konkretnych słów kluczowych? Temat jest zbyt świeży by był uregulowany prawnie, na wszelki wypadek jednak prace podpisane zostały „Jason M. Allen via Midjourney” (Jason M. Allen przez Midjourney).
Obraz 1. Jason M. Allen via Midjourney - Theatre D’opera Spatial
Podobne modele już są wykorzystywane w marketingu – w czerwcu tego roku magazyn Cosmopolitan zaprezentował pierwszą okładkę magazynu stworzoną przez sztuczną inteligencję wykorzystywaną w programie DALL-E 2 (widoczna poniżej). Co ciekawe program ten dostępny jest w ramach OpenAI, a jego nazwa jest kombinacją nazwiska surrealistycznego malarza Salvadora Dali i postaci przyjaznego robota WALL-E firmy Pixar. Na okładce poza samą grafiką znalazły się też hasła „Poznaj pierwszą okładkę magazynu stworzoną przez sztuczną inteligencję” oraz „I zrobienie jej zajęło tylko 20 sekund”.
Obraz 2. Okładka magazynu Cosmopolitan z czerwca 2022 roku
Czy jednak podobne modele rzeczywiście są przydatne przy tworzeniu kreacji marketingowych? Sprawdził to James O’Claire, który próbował tworzyć konkretne kreacje marketingowe przy wykorzystaniu Stable Diffusion (Stable Diffusion, a więc Stabilna Dyfuzja to wydany w tym roku model głębokiego uczenia służący głównie do generowania szczegółowych obrazów opartych na opisach tekstowych) a wyniki swojego ekpserymentu opisał w tekście „Can You Use AI to Generate Marketing Creatives?” („Czy możesz używać sztucznej inteligencji do generowania kreacji marketingowych?”) opublikowanym na jego stronie - jamesoclaire.com/. Jego zdaniem zastosowanie modeli uczenia maszynowego generujących obrazy na podstawie wprowadzonego tekstu w marketingu ma swoje plusy i minusy.
Wielką zaletą tego rozwiązania jest czas – AI może zwrócić nam wiele obrazów na dany temat w ciągu zaledwie kilku sekund prawie bez użycia czynnika ludzkiego. Koszty pracy są więc naprawdę niewielkie. Profesjonalne programy pozwalają nam określić pewne parametry tworzonych grafik, dzięki czemu możemy stworzyć gotową kreacje w bardzo krótkim czasie. W efekcie coś co grafik (lub cały zespół grafików) robił tygodniami modele sztucznej inteligencji zrobią praktycznie od ręki. Musimy jednak wziąć pod uwagę to, że maszyna myśli zupełnie inaczej i jej praca wcale nie musi być zbieżna z naszą wizją. Choć działanie programów generujących obrazy na podstawie tekstu opiera się o stworzony przez ludzi algorytm brak im jednak typowych dla człowieka cech jak choćby wpływy kulturowe czy społeczne, poznawanie świata dzięki zmysłom smaku, węchu czy dotyku, odczuwanie emocji itp. Zatem wyniki uzyskane z zapytań mogą być dla nas całkowicie abstrakcyjne i dzięki temu niezwykle interesujące. Będzie to doświadczenie bezcenne podczas burzy mózgów jaka zazwyczaj towarzyszy tworzeniu kampanii – pod warunkiem, że zespół marketingowy jest otwarty na nowe pomysły. W innym przypadku jednak wygenerowane obrazy mogą znacznie odbiegać od tego, co chcieliśmy osiągnąć, a odpowiednie ukierunkowanie modelu AI nie będzie proste, a w zasadzie nie wiadomo czy w ogóle będzie możliwe. Jak pisze sam James O’Claire „Moje odczucie było takie, że im mniej precyzyjna była kontrola, którą próbowałem wywierać, tym lepsze wyniki otrzymywałem”.
Weźmy też pod uwagę, że wizualizacje tworzone przy pomocy algorytmów text-to-image są losowe – nie poprawiamy obecnego wyszukiwania, ale tworzymy zupełnie nowe. Nie możemy więc liczyć na powtarzalność. Dodatkowo programy tego typu działają w oparciu o pewne bazy danych - kolorystyka i detale grafik nie będą więc idealnie odpowiadały tym używanym przez daną markę (chyba, że baza zostanie bardzo dokładnie dobrana przy użyciu tylko konkretnych, wyselekcjonowanych danych). W końcu otrzymane wyniki nie będą elastyczne – raz otrzymane są oczywiście kompletną grafiką, ale nie dadzą się łatwo przełożyć na inne wymiary, rozdzielczości czy orientacje, a materiały używane w kreacjach marketingowych powinny być bardzo podatne na wszelkie modyfikacje.
Podsumowując, modele sztucznej inteligencji mogą więc nie być najlepszym rozwiązaniem, jeśli chcemy osiągnąć konkretny efekt, będą jednak niezastąpionym źródłem inspiracji. Jak napisał James O’Claire - „Postrzegam Stabilną Dyfuzję jako dobrodziejstwo, clip-art naszego pokolenia przybliżające sztukę wszystkim i narzędzie dla marketerów do tworzenia reklam o lepszych wrażeniach”.
Choć wszystkie dzieła tworzone przez sztuczną inteligencję są wyjątkowe i niepowtarzalne, nie wszystkie zwracają rezultaty na takim samym poziomie. Różne programy z nimi związane wykorzystują odmienne algorytmy - nic więc dziwnego, że jeden model działa w dany sposób, a inny podąża w zupełnie odmiennym kierunku. Szczególny wpływ na styl danego modelu AI ma również materiał zgromadzony w jego bazie danych - bo to właśnie na nim bazuje maszyna. Zdaniem Tomasza Rożka założyciela fundacji „Nauka. To Lubię” - „Można powiedzieć, że obecnie toczy się wyścig pomiędzy twórcami i trenerami takich algorytmów. Wyścig o to, który algorytm będzie lepszy, bardziej kreatywny, czy który będzie tworzył bardziej oryginalne grafiki czy animacje”. Marketing jako jedna z najbardziej dynamicznych branż z pewnością będzie czerpał z tego nowego źródła jakim są grafiki tworzone przez maszyny. Naszym zdaniem można więc śmiało założyć, że w niezbyt odległej przyszłości powstaną programy wykorzystujące modele AI text-to-image dedykowane stricte marketerom, a kto wie może nawet zespoły marketingowe powiększą się o specjalistów, profesjonalnie obsługujących modele AI.