3 O trudach dialogu – sztuka komunikacji z AI w projektowaniu
Swobodny dostęp do generatywnej AI zmienił znacząco postrzeganie pracy twórcy. Jednak procesy, które miały być nieskomplikowane i automatyczne, wciąż wymagają asysty użytkownika w zakresie kreatywności. Jak mówić do sztucznej inteligencji, aby faktycznie nas słuchała?
Ostatnie lata charakteryzuje gwałtowne upowszechnienie modeli sztucznej inteligencji, opierającej się na generowaniu nowej treści. Generatywna AI szybko wzbudziła zainteresowanie jako prosta w obsłudze technologia oferująca produkcję tekstu i obrazu na żądanie. Popularność tego typu modeli zapoczątkowało udostępnienie do powszechnego użytku ChatGPT pod koniec listopada 2022 roku. Kluczową innowacją, bezpośrednio warunkującą szerokie rozpowszechnienie aplikacji, było zastosowanie architektury modelu konwersacyjnego, posługującego się językiem naturalnym. Znajomość języka programowania przestała być niezbędna do posługiwania się modelami opartymi na AI. 1
Równolegle z zachwytem nad możliwościami generatywnej AI wezbrała fala krytyki i społecznej niepewności związanej z dalszym rozwojem technologii. Palącym tematem stały się kwestie etyczne, szczególnie te związane z wykorzystaniem i przetwarzaniem danych. Dynamiczny rozwój technologii wraz z zapewnieniem swobodnego dostępu użytkowników do aplikacji poskutkowały wybuchem popularności na pod wieloma względami nieprzygotowanym gruncie. Jednym z niebywale istotnych zagadnień jest prawo, które powinno identyfikować ryzyko i chronić użytkowników przed nieodpowiednimi praktykami wykorzystującymi sztuczną inteligencję. Modele AI trenowane są na internetowych zbiorach danych, jakkolwiek big techy rozwijające technologię generatywną nie podają w oficjalnych raportach, skąd dokładnie pozyskiwane są te zasoby. Obecnie nie jesteśmy w stanie również dowiedzieć się, na podstawie jakich źródeł został wygenerowany wynik zapytania stworzony przez AI. Brak poszanowania dla własności intelektualnej i korzystanie z prac artystów publikujących w internecie doprowadziły do masowej ucieczki twórców z popularnych mediów społecznościowych. W poszukiwaniu bezpiecznego miejsca autorzy trafiają na portale takie jak Cara 2. Platforma jest skierowana bezpośrednio do artystów i zapewnia użytkowników, że prace na niej publikowane są chronione przed wykorzystaniem do trenowania modeli AI. 3
Sztuczna inteligencja, jak każda rewolucyjna innowacja, zyskała grono przeciwników wieszczących katastroficzne dla ludzkości skutki użytkowania technologii generatywnej. Wśród nich jest Geoffrey Hinton, jeden z pionierów dziedziny. W 2023 roku opuścił szeregi Google, od tego czasu poświęcając się edukowaniu o zagrożeniach, jakie niesie za sobą dalszy rozwój AI. Hinton zwraca uwagę na niebezpieczeństwo spowodowane brakiem kontroli nad rozwojem technologii generatywnej. Niemniej jednak, spekulując wbrew katastroficznym wizjom i zakładając odpowiedzialny rozwój technologii, w pewnej mierze wymuszony społecznie na decydentach, należy przyznać, że AI otwiera wiele nowych możliwości. Odpowiednio wykorzystana, może przysłużyć się budowaniu jasnej strony rzeczywistości. Sam Altman, dyrektor generalny OpenAI, w swoim wystąpieniu w Davos definiował modele AI, jako narzędzia wspomagające człowieka 4. Społeczny wymiar AI, zależy od tego, do czego oraz w jaki sposób będziemy używać tej technologii. Podążając za myślą Johna Maedy, obecnie niezwykle ważna jest umiejętność posługiwania się językiem maszyn, przy jednoczesnym pielęgnowaniu pierwiastka humanistycznego 5. Zachowując odpowiednią równowagę pomiędzy tymi dwoma obszarami, jesteśmy w stanie osiągnąć nową jakość kreacji i zwyczajnie usprawnić proces tworzenia. 6
Nowe narzędzie – nowe możliwości
Dość optymistyczne wydaje się spojrzenie na generatywną AI jako na nowe narzędzie, które zasadniczo w nie do końca sprecyzowany sposób może usprawnić pracę. Podstawową kwestią, którą należy uwzględnić, rozważając zastosowanie sztucznej inteligencji we wzornictwie, jest fakt, że AI nie stworzy projektu ani automatycznie, ani autonomicznie. Aplikację bazującą na wykorzystaniu możliwości technologii generatywnej należy traktować jako formę oprogramowania usprawniającego pracę nad projektem poprzez udostępnienie nowych możliwości weryfikacji elementów procesu projektowego czy też – jako szansę na rozwinięcie etapu kreatywnego. Skuteczne działanie z wykorzystaniem narzędzia zakłada podejście kolaboratywne. Human-AI interaction (HAI) to obszar badawczy związany z analizą i udoskonalaniem oddziaływania pomiędzy człowiekiem i technologią AI. Odpowiednia synergia tego układu objawia się w określonym nadaniu ról. Model AI powinien przyjąć funkcję wspomagającą użytkownika. Poprzez uproszczenie lub automatyzację wskazanych czynności sztuczna inteligencja stanowi realne wsparcie procesu projektowego, natomiast nie zastępuje człowieka.
Wprowadzając praktyczne uproszczenie, możemy ze względu na jej zastosowanie wydzielić dwa rodzaje sztucznej inteligencji. Są to AI analityczna oraz generatywna. Obszarem analitycznej AI są działania w zakresie obliczeń, szacowania i podejmowania decyzji na podstawie pogłębionej analizy dużych zbiorów danych. Początkowo rozwój sztucznej inteligencji skupiał się właśnie na tym polu. Systemy opierające się na wykorzystaniu analitycznej AI weszły do powszechnego użytku już lata temu i są obecne w wielu codziennych procesach, pozostając często niezauważalne dla użytkownika. Dynamiczny rozwój generatywnej AI przypada na ostatnią dekadę. Natomiast jej zastosowanie wiąże się szczególnie z poszerzeniem pola kreatywności użytkownika.
Technologia generatywna ma potencjał efektywnego zastosowania w dziedzinie wzornictwa. Narzędzia wykorzystujące generatywną AI mogą posłużyć do wsparcia procesu projektowego, na różnych jego etapach. Odnosząc się do metodologii double diamond, modele są szczególnie przydatne w fazach dywergencji (odkrywania oraz określania), czyli poszerzania spektrum dostępnych rozwiązań. Cenną zdolnością generatywnej AI jest możliwość produkowania dużej ilości rozwiązań na podstawie wydawanych przez użytkownika poleceń.
Wykorzystanie technologii generatywnej operującej obrazem ma szerokie zastosowanie w procesie ideacji. Poza oferującymi tworzenie obrazu na podstawie zadanego polecenia istnieją modele umożliwiające zaawansowaną pracę z obrazem, czego przykładem jest aplikacja Vizcom. W przypadku pracy z formą produktu AI umożliwia usprawnienie przygotowania wizualizacji konceptu. Ma to znaczenie zarówno dla symulacji finalnej wersji obiektu, jak również dla etapu poszukiwania rozwiązań. Sposobność szybkiej produkcji szczegółowych przedstawień wyrobu daje możliwość efektywnego różnicowania jego wersji. 7
Narzędzia generatywne oparte na large language model (LLM) mogą zostać wykorzystane w procesie projektowym na etapie odkrywania, czyli zbierania informacji o problemie projektowym. Zakładając potrzebę szerokiej eksploracji tematu, konwersacyjne modele generatywnej AI mogą stanowić jedno ze źródeł informacji. Ponadto możliwe jest ich użytkowanie jako narzędzi do śledzenia określonych trendów oraz identyfikowania charakterystyki, potrzeb i preferencji użytkownika 8. Rozbudowane modele LLM zapewniają dostęp do szerokiego zakresu danych dostępnych w sieci. Praca w tym środowisku umożliwia także wykorzystanie big data 9. Wielkie zbiory danych mogą być pomocne szczególnie przy wieloaspektowej analizie postaci użytkownika produktu. Należy zaznaczyć, że praca z zastosowaniem big data oraz tradycyjne metody researchu i projektowania w kontekście wzornictwa nie są ze sobą sprzeczne, ale się uzupełniają. Łącząc obie taktyki, możemy lepiej uchwycić preferencje i oczekiwania użytkownika 10. 11
Zanim jednak ochoczo przystąpimy do pracy z technologią generatywną, warto zdać sobie sprawę z jednej naprawdę kluczowej, uniwersalnej zasady. Nim weźmiesz do ręki potężne, potencjalnie niebezpieczne narzędzie, naucz się, czym ono jest i jak go używać. Dobrym zobrazowaniem tej reguły są słowa Larsa Erika Holmquista, badacza zajmującego się zagadnieniem interakcji na linii człowiek – komputer (human-computer interaction): „Dla każdego, kto opracowuje produkty, które stosują sztuczną inteligencję (w tym projektantów, ale nie tylko), konieczne będzie jasne zrozumienie, co ona może, a czego nie może zrobić. […] oznacza to, że jeśli ktoś spróbuje zaprojektować produkt bez solidnego zrozumienia ograniczeń sztucznej inteligencji, rezultatem z pewnością będzie porażka”. Wykorzystanie AI w procesie projektowym opiera się na podobnych zasadach. Dla projektanta ważne są świadomość wad i niedoskonałości wykorzystywanego modelu oraz aktywna weryfikacja otrzymywanych wyników. 12
Wyzwania
Potencjalną trudnością przy zderzeniu z modelem generatywnym może być brak jednolitej instrukcji obsługi. Generatywna AI to dynamiczny, wciąż rozwijający i zmieniający się twór. Nie istnieje jeden właściwy system działania skuteczny w pracy z nim. Jest to zarazem wartość, ponieważ plastyczna struktura modelu pozwala na opracowanie autorskich strategii kooperacji, jak i wada, szczególnie dla użytkownika poszukującego błyskawicznego efektu przy ograniczonym zaangażowaniu własnym. Niejasności w działaniu aplikacji generatywnych oraz złożoność ich struktury doprowadziły do powszechnej wśród użytkowników trudności ze zrozumieniem mechanizmów działania określonego modelu. W związku z tym ukształtował się obszar badawczy o nazwie explainable artificial intelligence (XAI), obejmujący zagadnienia skutecznego objaśniania szczegółów działania modeli sztucznej inteligencji. XAI obejmuje zbiór metod zapewniających otrzymanie bardziej akuratnych wyników w ramach współpracy z AI, przy jednoczesnym pogłębionym zrozumieniu ich genezy 13. XAI umożliwia rozpoznanie błędnych wyników, także tych typu bias 14, jak również identyfikację defektów oraz wad stosowanego modelu 15. Do nieprawidłowych wyników zalicza się halucynacje, którym może ulec generatywna AI. Ten typ błędu charakteryzuje się jako odpowiedzi kreatywne, pojawiające się tam, gdzie nie oczekuje się od modelu twórczości. Modele z reguły nie przyznają się do własnej niewiedzy, którą próbują zamaskować, produkując fałszywe dane. 16
Tak jak brak jest ustandaryzowanych wytycznych do obsługi modeli generatywnych, tak nie ma wskazanych granic wykorzystania AI. Projektant samodzielnie musi odpowiedzieć na pytania, co oraz czy można zrealizować we współpracy z AI lub bezpośrednio implementując do projektu komponent generatywny. Zagadnienie jest widoczne zwłaszcza w projektowaniu z zakresu UX i UI. Reprezentatywne dla obszaru działania można zdefiniować jako wspomniane wcześniej projektowanie systemów typu HCI. Działania skupiają się na projektowaniu interfejsów, w którym priorytetem jest intuicyjność użytkowania. HCI jest obszarem badawczym dotyczącym analizowania dynamiki relacji użytkownika z technologią komputerową. Głównym celem działań z zakresu HCI jest tworzenie oprogramowania przyjaznego użytkownikowi, co bezpośrednio przekłada się na zwiększenie produktywności oraz inkluzywności technologii. 17
Aplikacje wykorzystujące generatywną AI powinny znajdować się w wachlarzu narzędzi stosowanych w procesie projektowym. Zbyt mocne poleganie wyłącznie na technologii generatywnej może spowodować twórcze ograniczenie. Badania dowodzą, że szeroko zakrojona popularność modeli generatywnych AI może wpłynąć na zmniejszoną różnorodność wyników dla ogólnie pojętych działań kreatywnych. Charakterystyczną cechą technologii generatywnej jest jej niepełna przewidywalność. Otrzymywane wyniki odznaczają się pewną przypadkowością 18. Praktycznie niemożliwe jest idealne powtórzenie wyniku przy zachowaniu jednakowych zapytań lub poleceń, określanych jako prompty. Czynnik losowy warunkuje kreację nieco innych odpowiedzi na to samo pytanie, co określa się jako efekt homogenizacji. Homogenizacja spowodowana wykorzystaniem narzędzi generatywnych, ze szczególnym uwzględnieniem LLM, wyraźnie widoczna jest na poziomie grupowym, natomiast słabo na poziomie indywidualnym 19. Oznacza to, że wyniki generowane przez różnych użytkowników posługujących się tym samym modelem AI charakteryzują się wysoką skalą podobieństwa. Na poziomie grupowym konsekwencją jest niski poziom dywersyfikacji rezultatów. Ponadto otrzymywane wyniki są często nieprawidłowo interpretowane przez użytkownika jako skończone rozwiązanie, przez co nie są wystarczająco opracowane, aby miały charakter innowacyjny 20. 21
Kluczową zmienną warunkującą jakość uzyskanego od AI wyniku jest prompt, a dokładnie jego struktura i szczegółowość. Uwzględniając kompleksowość zapytania, użytkownik musi zmierzyć się z ryzykiem wpadnięcia w dwie pułapki. Pierwsza to mała liczba i nieprecyzyjność danych wejściowych charakteryzująca zadanego prompta. Efektem takiego zapytania są przypadkowe wyniki, nieprzystające do realnych ograniczeń wynikających z podejmowanego problemu projektowego. Generowana treść jest niekompletna. W przypadku tekstu przekaz jest zasadniczo uniwersalny i ogólny, natomiast dla obrazu uzyskuje się wyniki podobne w charakterze wizualnym do innych rezultatów danego modelu. Ponadto przedstawione na obrazie motywy będą najpewniej zaskakująco losowe. W rezultacie łatwo rozpoznać, że dana treść była generowana przez AI. Druga pułapka to zbyt silne nastawienie użytkownika na określony skutek, co w szczególności odnosi się do generowania obrazu. Często jest to skutkiem woli otrzymania gotowej wizualizacji już zaprojektowanego w głowie konceptu. Jedyny pewny efekt, jaki w tej sytuacji może otrzymać użytkownik, to zdenerwowanie na „nieposłuszne” narzędzie, które „złośliwie” nie współpracuje. Mimo szerokiego zakresu możliwości współdziałania z technologią generatywną, modele AI (jeszcze) nie są w stanie literalnie czytać w myślach użytkownika. Jedynym sposobem wyjścia z tej sytuacji jest nauka skutecznego przekazywania informacji.
Efektywna komunikacja
Rozwój large language models umożliwił zaawansowaną pracę AI z tekstem. Specyfika modeli LLM pozwala na generowanie i interpretowanie języka ludzkiej komunikacji. W efekcie trenowania na ogromnych zbiorach danych tekstowych model jest w stanie odczytywać pewne subtelności językowe, między innymi związane z użyciem metafory. Należy jednak mieć na uwadze, że język komunikacji międzyludzkiej jest wielopłaszczyznowy i pełen niejednoznaczności, które nadal stanowią dla AI barierę. Praca z generatywną AI uwzględnia działania w zakresie kreacji tekstu, jak również obrazu, dźwięku oraz filmu. Niezależnie od rodzaju otrzymywanej treści kluczowe znaczenie w procesie generowania ma wydane przez użytkownika polecenie. Forma i jakość treści prompta determinują interakcję z modelem oraz charakter osiąganego wyniku. Ważna jest także sfera semantyczna konstruowanego zapytania. W modelach generujących obraz zasadniczo jest możliwość dostarczenia zdjęcia lub ilustracji jako danych wejściowych, które AI wykorzysta do stworzenia pewnej ich interpretacji. Niemniej jednak polecenia wydawane programowi zawsze są sformatowane jako prompty w języku naturalnym. 22
Kompetencja, która zdecydowanie jest pomocna przy współpracy z technologią generatywną, to zdolność adekwatnego zadawania pytań. W omawianym kontekście „pytania” są rozumiane nie tylko jako postać prompta, która w swej formie nie musi być, a nawet częściej nie jest klasycznym zapytaniem, ale również jako ogół procesu poszukiwania informacji. Podczas niego użytkownik wielokrotnie stawia sobie wieloaspektowe zapytania, na drodze do opracowania optymalnej formy prompta. Podstawą efektywnej komunikacji z narzędziem jest umiejętność operowania formą języka, jaką posługuje się AI. Przede wszystkim dotykamy w tym miejscu zagadnienia konstrukcji semantycznej warunkującej poprawność interpretacji zadanego prompta. Wprowadzenie języka naturalnego jako głównego medium interakcji z aplikacją poszerzyło możliwości wykorzystania technologii, jednak równocześnie uwidoczniło deficyt kompetencji komunikacyjnych jako realny problem społeczny. Trudność opiera się na optymalnym zaprojektowaniu zapytania, w którym w pewnym stopniu przewidujemy, jaki wynik chcemy osiągnąć, jednocześnie nie znając konkretnych danych wyjściowych. Dlaczego więc efektywna komunikacja, a w szczególności zadawanie pytań, jest tak problematyczna?
Edukacja powszechna, jakiej doświadczamy w obecnym kształcie, jest zupełnie nieprzygotowana na AI. I nie mówimy tu o generowaniu wypracowań przez uczniów. Potrzeba kształtowania nowych kompetencji przyszłości stała się nagląca przy zderzeniu z koniecznością przygotowania młodego pokolenia do współpracy z nową technologią. Edukacja skupiona na myśleniu przyczynowo-skutkowym oraz nauczaniu podstaw retoryki wydaje się dawać szansę na zdobycie przydatnych, praktycznych umiejętności. Myślenie analityczne i kreatywne charakteryzuje się jako jedne z najbardziej cenionych kompetencji przyszłości. Mają one odzwierciedlenie w charakterystyce współpracy z AI, zapewniając użytkownikowi swobodę działania przy zachowaniu adekwatnej wnikliwości, jak również zdolność weryfikacji otrzymanej treści. Kompetencje komunikacyjne odnoszą się nie tylko do relacji międzyludzkich, lecz również do zdolności interakcji z AI. 23
Nie jesteśmy w stanie przewidzieć dalszego kierunku rozwoju AI. Warto zaznaczyć, że w tym momencie interakcja z modelami generatywnej AI opiera się na języku naturalnym, jednak w przyszłości medium komunikacji może się zmienić. Język i tekst wymagają od użytkownika określonych umiejętności zarządzania treścią. Jeżeli dążymy w kierunku upraszczania i unikania nieporozumień, a co za tym idzie wynikających z niepoprawnych interpretacji błędów w generowanych treściach, to prawdopodobne jest zaangażowanie innego lub symultanicznie wielu środków przekazu w celu porozumienia się z modelami AI.
Warto pamiętać, że jest coś, co wyróżnia człowieka w relacji ze sztuczną inteligencją, a mianowicie ciekawość. Poprzez pielęgnowanie humanistycznego pierwiastka dociekliwości i chęci zrozumienia jesteśmy w stanie adekwatnie i przede wszystkim efektywnie wykorzystać możliwości, jakie oferuje technologia generatywna. Bez operatora wydającego określone instrukcje, a więc dążenia zrodzonego z pierwotnej ciekawości, generatywna AI jest tylko biernym narzędziem. Narzędziem, które nie odbierze nam kontroli nad projektem, za to odpowiednio zarządzane, poszerzy nasze możliwości. Cała sztuka w odpowiednim współdziałaniu i umiejętnej komunikacji.