5 Nawigowanie wśród złożoności sztucznej inteligencji. Kluczowe kompetencje techniczne projektantów UX niezbędne w tworzeniu produktów cyfrowych opartych na sztucznej inteligencji (AI)
Rosnąca liczba produktów cyfrowych opartych na technologiach AI stawia przed projektantami user experience nowe wyzwania. Zmieniająca się technologiczna rzeczywistość będzie wymagała od dizajnerów rozszerzenia kompetencji i nawiązania współpracy z inżynierami od AI.
Technologie sztucznej inteligencji są potężnym narzędziem, pomocnym w rozwiązywaniu problemów, których do tej pory nie byliśmy w stanie pokonać, wykorzystując tradycyjne rozwiązania informacyjne. Ich zastosowanie w obszarach takich jak medycyna, farmacja czy kontrola jakości daje imponujące rezultaty, często trudne do osiągnięcia przez człowieka. 1
Jednak jak każda nowa technologia wdrażana na masową skalę rodzi wiele wyzwań. Udostępnienie na rynku modelu generatywnej sztucznej inteligencji w postaci aplikacji ChatGPT w listopadzie 2022 roku zmieniło także podstawowy paradygmat tego, jak wchodzimy w interakcje z nowym typem aplikacji. Zamiast podawać instrukcje kolejnych kroków do systemu, użytkownicy mogą opisywać pożądane dane wyjściowe 2. Jednak za zmianą paradygmatu nie nadążyło projektowanie interfejsów. Ujawniło to wiele problemów użytkowników z obsługą tego typu systemów. Badacze w swoim raporcie jako główne wnioski umieścili: niezrozumienie przez użytkowników technicznego sposobu ich funkcjonowania, ich zastosowań i celów oraz możliwości interakcji 3. Sytuacja ta jest w pewnym sensie powtórzeniem historii z lat 90., kiedy szybki rozwój wielu produktów cyfrowych tworzonych od początku do końca przez inżynierów oprogramowania pomijał czynnik ludzki w całym procesie i skutkował niedostosowaniem produktów do nietechnicznych użytkowników końcowych. 4
W historii internetu projektanci user experience doświadczyli wielu przełomowych momentów, kiedy byli zmuszeni na nowo przemyśleć procesy i wzorce projektowe, aby dostosować interfejs użytkownika do zmieniającej się rzeczywistości technologicznej. Przykładem takich znaczących zmian może być rozwój World Wide Web, kiedy to stanęli przed wyzwaniem projektowania rozwiązań software’owych na masową skalę, przejście z desktopu do korzystania z aplikacji na urządzeniach mobilnych (rozwój aplikacji natywnych, responsive design) czy wzrost rozwiązań chmurowych (real-time collaboration). Niewątpliwie, postępujący rozwój technologii AI na rynku masowym jest kolejnym znaczącym krokiem w rozwoju produktów cyfrowych oraz nowym obszarem wyzwań dla projektantów interfejsów. Obecnie obszar ten jest zarówno tematem badań naukowych w dziedzinie human-computer interaction 5, jak i przedmiotem prezentacji ze strony liderów opinii (uznanych projektantów) na wielu konferencjach naukowych i branżowych 6. Ze względu na dynamiczność rozwiązań AI w interakcji zmiana ta wymaga nie tylko przemyślenia na nowo dizajnu samego interfejsu, ale jest znacznie głębsza, związana również z fundamentalnymi pytaniami dotyczącymi procesu projektowego, a w szczególności ram, metod i zasad współpracy z nowymi interesariuszami w procesie UX: specjalistami technicznymi od AI. Proces projektowania UX, tak dobrze ugruntowany w kontekście tradycyjnych technologii informacyjnych, będzie wymagał od dizajnerów rozszerzenia kompetencji, aby z sukcesem mogli oni projektować również produkty i funkcje powstające na bazie sztucznej inteligencji 7. 8
Chociaż szczyt oczekiwań według koncepcji hype cycle Gartnera dla generatywnej sztucznej inteligencji jest już za nami, specjaliści są zgodni co do tego, że udział w rynku produktów bazujących na AI nadal będzie rósł. Jest to związane z typowym przebiegiem recepcji pojawiających się na rynku innowacyjnych technologii, od fazy ekscytacji i zachwytu przechodzimy do fazy bardziej realistycznego spojrzenia na na nie i ich możliwości. Eksperci zwracają jednak uwagę na to, że aplikowanie rozwiązań AI w konkretnych obszarach będzie wymagało łączenia wielu technik sztucznej inteligencji ze sobą i bardziej złożonego podejścia do rozwiązywania problemów, a co za tym idzie –również więcej wiedzy o AI od specjalistów nietechnicznych pracujących przy tego typu rozwiązaniach 9. Kluczowe pytanie, po co budujemy dany produkt cyfrowy, wydawało się w początkowej fazie AI hype cycle zdominowane przez podejście technology-oriented oraz AI-first 10. Jak szacuje firma Gartner nawet do 85% porażek projektów AI jest związane z niejasno określonymi celami, jakie dane rozwiązanie ma osiągnąć 11. Oprócz parametrów technicznych wymaga to odpowiedzi na kluczowe pytania: dlaczego, jak, co, i pogłębienia ich w badaniach z potencjalnymi użytkownikami, które są sercem procesu w projektowaniu user experience. 12
Nowi interesariusze w procesie UX. Data scientists
„Data scientists come up with things people don’t want. Designers come up with things that can’t be built” – profesor John Zimmerman, Carnegie Mellon University
Do tej pory projektanci UX od strony technicznej współpracowali głównie z inżynierami oprogramowania odpowiadającymi za frontend i backend. W kontekście produktów opartych na AI w zespołach pojawia się nowa grupa inżynierów, odpowiedzialna za budowanie algorytmu (modelu): data scientists, algorithm engineers, ML/AI engineers, data engineers, AI researchers. Projektanci stają więc przed wyzwaniem współpracy w tym samym czasie z różnymi zespołami technicznymi odpowiedzialnymi za różne aspekty produktu. W przypadku produktów opartych na technologiach AI, końcowe doświadczenie jest składową kilku warstw: danych, modelu AI i interfejsu. Zwiększa to złożoność procesu projektowego, w tym formułowania poszczególnych zadań UX, przeprowadzania badań z użytkownikami, analizowania wniosków właściwych dla danej warstwy i ich komunikowania odpowiednim zespołom technicznym.
Pierwsza, najniższa warstwa, reprezentująca dane, jest związana z zagadnieniami takimi jak ich jakość i możliwy wynikający z nich bias, etykietowanie danych, struktury danych itd. Druga warstwa, czyli model AI, to koncepcja samego algorytmu, zestaw reguł wyznaczonych przez model na podstawie danych z warstwy pierwszej, dodatkowe parametry modelu itd. Ostatnia, trzecia warstwa to interfejs użytkownika, który wchodzi w interakcje z modelem AI za pomocą dostępnych funkcji i zaprojektowanego wyglądu aplikacji. W tradycyjnym rozumieniu technologii informacyjnych projektanci operują jedynie na warstwie trzeciej, badając doświadczenie użytkownika z danym produktem i proponując jego przeprojektowanie, gdy pojawią się trudności w obsłudze interfejsu. W przypadku produktów bazujących na AI dodatkowo występują jeszcze warstwa pierwsza i druga, za które odpowiedzialni są wspomniani nowi interesariusze w procesie UX. Podczas badań z użytkownikami może się okazać, że sam interfejs nie ma znaczących błędów w funkcjonalności, ale całościowy user experience produktu jest niski ze względu na niewłaściwie wybrane dane lub błędnie określone założenia koncepcyjne i dobrane parametry w samym modelu AI. Ryzyko takich błędów rośnie, gdy zespoły UX i data science nie współpracują całościowo nad produktem, ale realizują fragmentarycznie charakteryzowane cele. W związku z tym rozumienie złożoności produktu, a także rozróżnianie warstw jego projektowania przez dizajnerów jest kluczowe dla poprawy całościowego doświadczenia użytkownika 13. Specjaliści są zgodni, że zwiększenie udziału projektantów UX w całym procesie decyzyjnym dla dostarczanych rozwiązań AI jest czynnikiem, który często waży o powodzeniu aplikacji 14, a ugruntowanie procesu projektowego w metodologii UX pozwala stworzyć znane ramy dla projektu 15. Holistyczne podejście do budowania produktów AI z udziałem projektantów user experience zostało wielokrotnie zweryfikowane przez naukowców, a korzyści z niego płynące zaprezentowane w wielu studiach przypadków 16. Obecna sytuacja, w której rosnąca ilość rozwiązań na rynku jest tworzona w duchu technology-oriented, a projektanci UX nie są (jeszcze) widoczni w bezpośredniej współpracy ze specjalistami data science, została określona przez prof. Johna Zimmermana jako AI innovation gap 17. 18
Jak zmniejszyć AI innovation gap?
Aby odpowiedzieć na to pytanie, przede wszystkim najpierw trzeba wskazać, co jest źródłem i przyczyną tej luki. Specjaliści z dziedziny human-computer interaction zbadali ten problem i rozpoznali trzy główne przyczyny luki: 19
- brak podstawowej wiedzy technicznej projektantów UX o technologiach AI;
- formułowanie wczesnych założeń rozwiązania przez każdą ze stron zamiast wypracowania holistycznej, całościowej, wspólnej koncepcji; 20
- ograniczenia w komunikacji wynikające z używania innej terminologii w stosunku do opisywanych problemów.
Brak podstawowych kompetencji technicznych projektantów UX prowadzi do sytuacji, w której są oni zaangażowani tylko w ostatniej warstwie projektowania produktu (interfejs), podczas gdy problemy związane z doświadczeniem użytkownika mogą wynikać z decyzji podjętych w obszarze danych i samego modelu. Rozwiązaniem może być tylko ściślejsza współpraca z zespołem data science w tych obszarach i szersze rozumienie konsekwencji stosowanych technologii dla użytkowników. Brak współpracy z zespołami data science prowadzi do dalszych negatywnych konsekwencji dla rozwoju produktu, takich jak:
- brak przełożenia możliwości i ograniczeń produktu na interfejs w komunikacji z użytkownikiem;
- brak fazy wspólnego, wczesnego prototypowania we współpracy z zespołem data science; 21
- ograniczenie do badań użytkowników w kontekście samego doświadczenia interfejsu, bez głębszej walidacji doświadczenia algorytmicznego;
- brak umiejętności prowadzenia ogólnej dyskusji o koncepcji algorytmu z zespołami data science i formułowania istotnych pytań;
- brak umiejętności formułowania wniosków z badań z użytkownikami w sposób zrozumiały dla specjalistów data science;
- brak umiejętności projektowania elementów interfejsu, które mogłyby zapewnić wyższą jakość danych dostarczanych do modelu.
Aby podnieść kompetencje projektantów UX w obszarze projektowania produktów opartych na AI, wydaje się wystarczające: rozumienie spektrum typów sztucznej inteligencji (na przykład supervised machine learning, unsupervised machine learning, computer vision, deep learning, natural language processing), umiejętność opisania, jakie zachowanie dany typ modelu determinuje, jakie ma możliwości i ograniczenia technologiczne, jakie konsekwencje może to rodzić w doświadczeniu użytkownika, oraz opanowanie podstawowej terminologii z dziedziny data science (na przykład uncertainty, labelling, algorithm, test and training data, bias). 22
Jako przykład może posłużyć aplikacja do monitorowania aktywności fizycznej stosowana w wielu rozwiązaniach typu smart watch. Celem użytkownika jest kontrolowanie codziennych aktywności i monitorowanie statystyk związanych ze zdrowiem i aktywnością fizyczną podczas codziennego noszenia smartwatcha. Użytkownik jednak w ciągu dnia wykonuje wiele czynności innych niż sport, podczas gdy jego dłonie pozostają w ruchu. Od „inteligentych” aplikacji wymaga się więc rozróżniania aktywności fizycznych od innych, takich jak jedzenie czy picie, aby prezentowane wyniki faktycznie odnosiły się do dziennego wysiłku fizycznego. Badania pokazują, że aplikacje bazujące na machine learningu robią to już z bardzo wysoką dokładnością. Na bazie dużych zbiorów danych są w stanie wychwycić wiele charakterystyk parametrów (na przykład wartość pulsu, położenie GPS) i z wysokim prawdopodobieństwem stwierdzić, że użytkownik właśnie wykonuje w tej chwili daną czynność, na przykład jedzie na rowerze lub biegnie. Ponieważ w aplikacjach tego typu mierzy się ilość spalonych kalorii, która uzależniona jest od czasu i sposobu uprawiania sportu, bardzo ważne jest właściwe zaklasyfikowanie aktywności fizycznej: joga, spacer, jazda na rowerze, bieganie. Aplikacje napisane z wykorzystaniem machine learning są w stanie osiągnąć wysokie prawdopodobieństwo klasyfikacji, ale równie kluczowa w dalszym trenowaniu modelu jest wiadomość zwrotna od użytkownika do systemu zwanego feedback loop. Tylko w ten sposób systemy te mogą korygować błędne klasyfikacje i jeszcze skuteczniej adaptować się do nawyków danego użytkownika. 23
Aby zaprojektować dobry user experience aplikacji, projektant powinien rozważyć wiele scenariuszy, na przykład:
- użytkownik ma zamiar rozpocząć aktywność fizyczną, kliknął więc w aplikacji rozpoczęcie uprawiania danego sportu, na
- przykład jazdy na rowerze, a po zakończeniu kliknął zakończenie czynności w aplikacji;
- użytkownik rozpoczął uprawianie sportu, ale zapomniał kliknąć rozpoczęcie w aplikacji;
- użytkownik kliknął rozpoczęcie uprawiania danego sportu, ale po jego ukończeniu zapomniał zaznaczyć w aplikacji ukończenie.
W przypadku systemów opartych na machine learning problem zapominania możemy rozwiązać poprzez dynamiczne predykcje aplikacji z konkretnymi sugestiami dla uprawiającego sport. Dzięki temu możemy zapewnić satysfakcjonujące doświadczenie użytkownika. W tym przypadku projektant UX powinien wiedzieć, że ewaluacja skuteczności modelu klasyfikacji odbywa się za pomocą czterech scenariuszy:
- true positive – aplikacja prawidłowo rozpoznała, że użytkownik rozpoczął bieganie i sugeruje włączenie pomiaru tej czynności sportowej;
- true negative – aplikacja prawidłowo rozpoznała, że użytkownik nie wykonuje żadnej aktywności sportowej, więc nie sugeruje uruchomienia pomiaru;
- false positive – aplikacja sugeruje, że użytkownik rozpoczął bieganie, podczas gdy w rzeczywistości on tylko spaceruje;
- false negative – użytkownik rozpoczął bieganie, ale aplikacja nie rozpoznała czynności i nie zasugerowała włączenia monitorowania biegania.
Na podstawie wiedzy o zachowaniach użytkowników, a także tego, jak działa technologia UX, dizajner może teraz zaprojektować właściwe ścieżki użytkownika, tak aby uwzględnić różne scenariusze, a także zapewnić najlepszy możliwy feedback loop pomiędzy systemem uczącym się a użytkownikiem. Przykład został uproszczony na potrzeby opisania ogólnej koncepcji i pomija takie kwestie jak probability czy feature weight.
Pogłębianie wiedzy o sposobie działania machine learningu jest sytuacją analogiczną do wdrażania tradycyjnych technologii informacyjnych, kiedy oczekiwano od projektantów podstawowej znajomości HTML i CSS. Bynajmniej nie po to, aby zastąpili oni programistów, ale aby lepiej rozumieli wyzwania techniczne i projektowali rozwiązania możliwe do wdrożenia. W kontekście AI ważniejsze jest zrozumienie podstaw i operowanie na pewnych abstrakcyjnych koncepcjach niż rozumienie uzasadnień matematycznych i statystycznych dla konkretnych modeli. Tak więc jako zakres pożądanych kompetencji technicznych dla projektantów UX w kontekście projektowania rozwiązań AI można wymienić:
- znajomość podstawowych typów sztucznej inteligencji;
- rozumienie zasad działania podstawowych typów sztucznej inteligencji i umiejętność opisania, jakie jej aspekty mogą mieć wpływ na doświadczenie użytkownika w produkcie;
- znajomość podstawowej terminologii AI i z dziedziny data science;
- rozumienie procesu data science i umiejętne włączanie specjalistów od AI w proces UX w celu budowania holistycznych produktów opartych na AI;
- umiejętność prowadzenia badań z zakresu algorithmic experience z użytkownikami i formułowania wniosków dla zespołów data science;
- umiejętność projektowania interfejsów, które biorą również pod uwagę potrzeby modelu w cyklu ciągłego uczenia się.
Potrzeba innowacji w obszarze UX i AI
Odmienna logika leżąca u podstaw projektowania produktów na bazie AI wymaga przemyślenia sposobu prowadzenia procesu UX, dostępnych metod badań użytkowników czy wzorców projektowych 24. Wiele aktualnych metod badań użytkowników nie pozwala na głębsze zbadanie doświadczenia algorytmicznego użytkowników. Przykładem mogą być przeprowadzone przez badaczy wywiady pogłębione z użytkownikami platform społecznościowych, takich jak Facebook, Instagram czy YouTube. Naukowcy pominęli kwestie interfejsu i skupili się na algorytmach, które rekomendują treści dla użytkowników. Badanie odbiorców „nietechnicznych” ujawniło podstawowy problem: zbyt wysoka abstrakcyjność tematu algorytmów sprawiła, że nie byli oni w stanie nazwać ani opisać swoich doświadczeń algorytmicznych z przywoływanymi aplikacjami 25. Z tego względu trudno było określić, czy faktycznym problemem jest brak wyraźnego doświadczenia algorytmicznego, czy może jednak ograniczony zasób słownictwa specjalistycznego w omawianiu pewnych, abstrakcyjnych zjawisk sprawia, że badani nie są w stanie opisać swoich doświadczeń. Odpowiedź na to pytanie była przedmiotem moich badań w The Basel School of Design 26. Postawiłam hipotezę, że język wizualny może przełamać tę barierę i sprawić, że użytkownicy będą w stanie opowiedzieć w wywiadach pogłębionych więcej na temat swoich doświadczeń algorytmicznych z aplikacją Instagram. Na potrzeby eksperymentu przygotowałam serię ilustracji prezentujących założenia koncepcji AI produktu na podstawie machine learning. Następnie przeprowadziłam serię wywiadów. Pierwsza część polegała na zadaniu pytań o doświadczenie algorytmiczne Instagrama wyłącznie na podstawie rozmowy. W drugiej części każdy z uczestników przestudiował przygotowane wizualizacje oraz odpowiedział raz jeszcze na te same pytania. Wyniki badań były zaskakujące: czas odpowiedzi wydłużył się ze średnio 15–20 min nawet do 1,5 godziny!Użytkownicy stwierdzili, że w wielu przypadkach pominęli wiele doświadczeń, ponieważ nie łączyli ich wprost z algorytmem. Co więcej, byli oni w stanie wskazać, jak zdefiniowane punkty danych, które mają determinować rekomendowany kontent, w ich przypadku działają (lub nie działają) i dlaczego. Dodatkowo byli oni w stanie odnieść zachowania modelu AI Instagrama do innych aplikacji i opisać swoje doświadczenia algorytmiczne z nimi związane, nawet je porównać pod kątem jakości. Zebrany materiał mógłby służyć jako punkt w dyskusji na temat nowego ujęcia pewnych elementów warstwy pierwszej i drugiej procesu projektowego (dane i model). 27
Badanie to wykazało, że nie brak doświadczeń algorytmicznych był przeszkodą w zgromadzeniu pełniejszych i bardziej wartościowych odpowiedzi podczas wywiadu pogłębionego, ale sama forma jego prowadzenia. Liczne eksperymenty na innych uniwersytetach zmierzają do poszerzenia przedmiotu i zakresu obecnych badań użytkowników w kontekście produktów opartych na AI. Jednym z nich może być przykład porównywania person wynikających ze zbioru danych zdefiniowanych przez model z personami opisanymi na podstawie badań UX. W ten sposób można określić, w jaki sposób model „widzi” rzeczywistość, a co wynika z badań UX. 28
Moment, w którym jesteśmy obecnie, w kontekście gwałtownego wzrostu na rynku liczby produktów wykorzystujących AI stawia przed projektantami wiele nowych wyzwań. Wydaje się, że nabycie podstawowej wiedzy w zakresie tych technologii, zrozumienie mechanizmów, które za nimi stoją, oraz zbudowanie zasad współpracy i komunikacji ze specjalistami data science to tylko część z nich. Jeszcze większym i koniecznym wyzwaniem staje się projektowanie nowych metod badawczych i wzorców projektowych. Holistyczne podejście do projektowanych produktów cyfrowych jest kluczowe w utrzymaniu podejścia human-oriented i budowaniu aplikacji, które w znacząco pozytywny sposób wpływają na komfort życia i satysfakcję użytkowników.