Bez wątpienia rozwój internetu dokonał się przy dużym udziale czatów i forów. Następnie media społecznościowe stały się nową przestrzenią do rozmowy lub przynajmniej wyrażania opinii. Dziś większość dużych szanujących się platform social media ma wbudowaną opcję wewnętrznego czatu, ewentualnie – jak YouTube – pozwala w trakcie transmisji live porozumiewać się odbiorcom. Do tego osobną kategorię aplikacji stanowią typowe komunikatory, jak WhatsApp czy Telegram. Jednak rozwiązanie, na którym się dziś skupię, znacząco różni się od pozostałych. Czym? Rozmówcą, który jest po drugiej stronie. A właściwie jego brakiem.
Rekordowe wyniki
ChatGPT to usługa, dzięki której możesz w formie czatu porozmawiać ze sztuczną inteligencją. W styczniu 2023 r. aplikacja miała 13 mln unikalnych użytkowników, a pierwszy million uzyskała już po 5 dniach od premiery. Dla porównania Instagramowi osiągnięcie tego wyniku zajęło ponad 2 miesiące. Skąd taka popularność ChatuGPT? Powodów jest kilka. Pierwszy, to właśnie aspekt wspomnianej sztucznej inteligencji, która jest coraz bardziej popularnym trendem. Drugi powód, to poziom rozmowy, jaką oferuje czat. Do tej pory podobne rozwiązania odbiegały od jakości, jakiej oczekiwałby przeciętny „zjadacz” internetu. Po trzecie, ChatGPT sprawia, że użytkownicy mają wrażenie, że można z nim rozmawiać praktycznie na każdy temat, otrzymując szybkie odpowiedzi na zadane kwestie.
Made by OpenAI
Wiemy już, dlaczego warto się zainteresować tym rozwiązaniem, wyjaśnijmy więc, skąd się ono wzięło. Jak zwykle w takich przypadkach sukces ma wielu ojców. ChatGPT to dzieło firmy OpenAI, tej samej, która stworzyła aplikację DALL-E, umożliwiającą tworzenie grafik na bazie samych opisów. W finansowaniu przedsięwzięcia pomaga Microsoft, a jeśli chodzi o skład personalny, to nie mogło tam zabraknąć Elona Muska. Natomiast miłym polskim akcentem jest osoba Wojciecha Zaręby, pełniącego w tym projekcie funkcję Co-Foundera.
Źródło: www.twitter.com/woj_zaremba
Trzy filary uczenia
Na początku były dane… dużo danych. Ile dokładnie? Pobrano 300 mld słów z Wikipedii, stron internetowych, dokumentów Google i wielu innych źródeł, które stanowiły swego rodzaju paliwo dla modelu uczenia maszynowego, który w przypadku ChatGPT należy do klasy Large Language Model. Proces stworzenia rozwiązania, które imituje rozmowę z człowiekiem oparty był na jeszcze dwóch innych elementach, prócz ogromnego zbioru danych. Zadaniem modelu było skupienie się na ludzkich interakcjach i analiza ich przebiegu. Dodatkowo naprowadzano model na właściwy tok formułowania odpowiedzi. W ten proces zaangażowano ludzi, którzy oceniali jakość otrzymanych od maszyny odpowiedzi w skali liczbowej. Jeśli na zadane pytanie maszyna odpowiadała w sposób pozostawiający wiele do życzenia, tester wystawiał jej niższą notę. To skutkowało dalszym poszukiwaniem odpowiedzi i formułowaniem lepszego rozwiązania – takiego, które pozwoli uzyskać wyższą ocenę. Ponadto model sam wyciąga wnioski z tego, jak przebiega proces takiego korygowania, starając się unikać błędów. Warto tu też wspomnieć, że jego doskonalenie nie zostało zakończone i odbywa się nieustannie przy okazji każdej interakcji, w jaką ChatGPT wchodzi obecnie z ludźmi.
Jestem tylko botem, ale nadrabiam dobrym wrażeniem
ChatGPT w żaden sposób nie rozumie i nie interpretuje znaczenia słów. Jedynie wyszukuje odpowiednią ich reprezentację, która statystycznie da największą szansę na wygenerowanie właściwej odpowiedzi. Model de facto uczy się, iż te konkretne słowa, ułożone w odpowiedniej strukturze dają rozwiązanie. Dobrze obrazuje to metafora użyta przez Bartłomieja Sieję na youtube’owym kanale Komputer Świat, porównująca działania czatu do próby odnalezienia się w chińskim alfabecie, bez jakiejkolwiek znajomości języka chińskiego. Gdyby ktoś zadał nam pytanie w formie chińskiego słowa, to próbując udzielić odpowiedzi, należałoby wyselekcjonować z treści, do których mamy dostęp, te fragmenty, w których się on znajduje. Następnie porównać je ze sobą, szukając mających tendencję do powtarzania się innych znaków i odwzorowywać układy, w jakich występują względem siebie. W taki sposób model w ciemno formułuje odpowiedzi, sprawdza, jak reaguje na nie pytający, i wprowadza korekty, przez cały czas się ucząc. Podobnie działa autowyszukiwanie w Google. Algorytm nie rozumie znaczenia danego słowa ani nie wie, czego szukający potrzebuje. Po prostu na podstawie danych statystycznych określa, jakie litery i słowa najczęściej łączą się ze sobą. ChatGPT w uśredniony sposób odtwarza strukturę naszego języka. Wie, co z czym i w jakiej kolejności statystycznie najczęściej się pojawia i w tym ujęciu do siebie pasuje.
Jeśli poprosisz ChatGPT np. o napisanie życzeń dla feministki, to tekst nasycony będzie słowami charakterystycznymi dla tego nurtu ideowego. Problem w tym, że nie zawsze będą one właściwie użyte. Słowo „zaszczuta” z pewnością pasuje do tej tematyki, jednak zastosowane w zdaniu „Jestem zaszczuta, że mogę poznać taką inspirującą feministkę jak ty”, pokazuje ogrom pracy, jaka czeka jeszcze twórców i sam czat.
Źródło: www.chat.openai.com
Nie taki omnipotentny, jak go opisują
Inną jego zaletą jest ciągłość wymiany zdań, jaką z nim prowadzimy. Można więc prosić go o doprecyzowanie odpowiedzi, jakiej udzielił, starając się kierować rozmową tak, by jego wypowiedzi stawały się coraz precyzyjniejsze i adekwatne do naszych oczekiwań. Bywa jednak, że jeśli nie wchodzimy z nim w interakcję w sposób nieprzerwany – i mija dłuższa chwila między jego odpowiedzią a naszym kolejnym pytaniem – to czat się zawiesza. Nie jest to bardzo uciążliwe, chociaż aplikacja ma kilka innych istotniejszych wad.
1. Ograniczenia tematyczne
Lista tematów, o których może rozmawiać, jest ograniczona. Chodzi np. o rasizm, seksizm, treści niebezpieczne lub nielegalne. W ramach działań określanych jako Jailbreak AI, niektórym osobom, udaje się obejść te obostrzenia. Użytkownicy prowadzą z botem rozmowę w ten sposób, by uzyskać odpowiedź w zaproponowanych ramach hipotetycznej rozmowy, stanowiącej pewnego rodzaju alibi. Można mu spróbować zaproponować, by wymyślił dialogi na potrzeby scenariusza filmowego, uzasadniając, że odpowiedź zostanie użyta jedynie do celów działań artystycznych.
2. Nieograniczona „kreatywność”
Bot potrafi też zmyślać, co zresztą nie powinno dziwić, zważywszy na fakt odwzorowywania ludzkich interakcji. Zdarza się, że przytacza dokumenty i opracowania, które faktycznie istnieją, jednak po zapoznaniu się z ich treścią, okazuje się, że nie mają nic wspólnego z tezą, jaka została postawiona w zaprezentowanej odpowiedzi.
3. Ograniczona baza wiedzy
Jego zaplecze stanowi baza danych, które pozyskiwał do września 2021 r. Zatem w dziedzinach, w których tempo zmian jest błyskawiczne, jego wiedza jest w dużym stopniu ograniczona. Co ciekawe, w ramach procesu uczenia się na bazie interakcji z aktualnymi użytkownikami, stale wzbogaca on swoją wiedzę. Udało się np. uzyskać odpowiedź na pytanie o to, kto jest aktualnie szefem Twittera. W odpowiedzi bot wskazał na Elona Muska, który przejął Twittera w 2022 r.
4. Nie ma dostępu do internetu
Powyższe ograniczenie wynika z faktu, iż ChatGPT nie ma bieżącego połączenia z zasobami internetu, zatem nie może formułować odpowiedzi na szczegółowe pytania dotyczące teraźniejszości i niedawnej przeszłości. Oznacza to, że jest bezużyteczny, kiedy chcemy sprawdzić tak banalną kwestię, jak np. wynik wczorajszego meczu.
CzadGPT!
Tu dochodzimy do najważniejszej rewolucji dotyczącej tego narzędzia, jaka dopiero ma się dokonać. Wyobraźmy sobie, jak wyglądałoby korzystanie z tego czatu, gdyby był wpięty w globalną sieć, mogąc poszukiwać w czasie rzeczywistym konkretne informacje, a następnie przedstawić je w formie, o jaką prosimy. Wyobraź sobie te wszystkie pytania, jakie mógłbyś mu zadać. Jakie są trzy największe hashtagi na Instagramie dotyczące branży jubilerskiej? Podaj najtańsze oferty smartfona Huawei Mate Xs w sklepie realizującym wysyłkę w ciągu 24 godzin. Jakie jest aktualne CPC dla frazy „ładowarka bezprzewodowa”, a jakie dla „ładowanie indukcyjne”? Genialna perspektywa, chociaż nie dla wszystkich. ChatGPT w takiej formie jest zagrożeniem dla Sam-Wiesz-Kogo. W sytuacji, w której będziemy dostawać od razu najlepszą odpowiedź na zadane pytanie, obecna koncepcja pierwszej i kolejnych stron z wynikami wyszukiwania Google, stanie się, delikatnie rzecz ujmując, anachroniczna. Dlatego też wspomniany na początku tego artykułu Microsoft wspiera rozwój tej technologii. Docelowo ma być ona zintegrowana z microsoftową przeglądarką Bing. Wprawdzie w odpowiedzi na premierę CzatuGPT Google odpowiedział podobnym rozwiązaniem o nazwie Bard, jednak obecnie stanowi on bez porównania gorszą alternatywę.
Wirtualny asystent social media managera
Zanim jednak ChatGPT całkowicie wejdzie do mainstreamu, możemy go już teraz wykorzystać w swojej pracy. Chociażby w obszarze copywritingu, marketingu i social mediów. Oto kilka pomysłów, jak dzięki niemu usprawnić swoją pracę.
1. Research
Przygotowując się do pracy nad danym zagadnieniem, można go użyć w celu przyspieszenia poszukiwania szczegółowych źródeł informacji.
2. Pisanie tekstów
Czat może generować różnego typu teksty, takie jak tytuły, hasła reklamowe, posty, maile, konspekty, artykuły, quizy itp.
3. Przeredagowywanie istniejących tekstów
Bot przepisze tekst tak, by miał inny charakter, zgodny z zadanymi parametrami. Na przykład, kiedy chcemy, aby nasz artykuł lepiej trafił do młodszych odbiorców, można poprosić o dodanie określeń charakterystycznych dla pokolenia Alfa.
4. Tłumaczenie na inne języki
ChatGPT, dokonując translacji spośród słów mających kilka znaczeń, stara się dobierać te adekwatnie pasujące do tematu całej wypowiedzi, przez co tłumaczenie sprawia wrażenie dopasowanego do kontekstu.
5. Generowanie pomysłów
Nie musisz przeglądać całej sieci w poszukiwaniu kreatywnych pomysłów. Możesz zapytać bota o ciekawe rozwiązania, które już zostały zastosowane i opisane, np. w formie case study.
6. Wyszukiwanie konkretnych słów
Wzbogacaj swój język bez konieczności sięgania po wiele narzędzi i źródeł informacji, np. o synonimy, regionalizmy, mowę potoczną, archaizmy czy rymy. Czat poproszony o wyszukanie rymów do słowa chatbot zaproponował mi m.in.: kompot, kredenskot, szrot, zdechły kot, niepoprawny flirtownik-internaut. Jak widzisz na tym przykładzie, bot ma jeszcze jedną ważną funkcję – potrafi rozbawić rozmówcę.
Źródło: www.chat.openai.com
bezRobocie i inne niekorzystne zjawiska
Wyobraźmy sobie, że prosimy model o stworzenie konspektu artykułu na dany temat, który aktualnie jest gorącym trendem. Oczywiście nie jesteśmy jedynymi, którzy go o to proszą. Następnie otrzymujemy konspekt artykułu, który wymaga jedynie delikatnej korekty. Prosimy też czat, by wygenerował opisy akapitów i korygujemy w nich ewentualne błędy. Gdzieniegdzie wprowadzamy dygresje i własne przykłady, starając się mu nadać indywidualny charakter. W takiej sytuacji nie powinniśmy być zdziwieni, gdy na różnych portalach zaczną się pojawiać bliźniaczo podobne teksty.
Ten i wiele mu podobnych przykładów może stanowić odpowiedź na obawy o zastępowalność człowieka w pracy przez sztuczną inteligencję. To, co wymagających odbiorców przyciąga do autorów treści, to m.in. indywidualny styl, który odpowiada naszej wrażliwości. Zresztą podobnie jest ze wzrostem popularności wyrobów rzemieślniczych czy trendem handmade, którego centralnym punktem jest człowiek, jako czynnik bezpośrednio zaangażowany w proces wytwarzania. Taki produkt w rezultacie powstaje dłużej, jest droższy, ma niedoskonałości wynikające z ludzkich uwarunkowań, a mimo to, nadal jest dla klientów atrakcyjny. Prawdopodobnie w przyszłości będziemy informować o wyrażonym procentowo stopniu, w jakim do tworzenia treści została zaprzęgnięta AI. Podobnie jak kupując ubrania, oceniamy ich jakość, sprawdzając proporcje bawełny do poliestru. Pozostaje mieć nadzieję, że to właśnie ludzka twórczość będzie synonimem lepszej jakości.
To naturalne, że immanentną częścią namysłu nad rozwojem sztucznej inteligencji, są obawy o jej wpływ na rynek pracy, zwłaszcza w kontekście zastępowania czynnika ludzkiego autonomicznymi technologiami. Ku pokrzepieniu serc pesymistów, ktoś kiedyś przewrotnie stwierdził, że na każde miejsce pracy człowieka zastąpionego przez maszynę przypadną trzy nowe związane z projektowaniem, nadzorem i konserwacją sprzętu. Rzecz jasna, znamy zawody, które wskutek rewolucji technologicznej zupełnie zniknęły. Po tym jak nastała era komputerów, maszyny biurowe stały się relatywnie prymitywne, znikając wraz z funkcją mechanika maszyn biurowych. Jednak nie wszystkie scenariusze zmian technologicznych muszą oznaczać wyparcie z rynku danego zawodu. Potrafię sobie wyobrazić sytuację, w której praca copywritera opierającego swoje usługi na sztucznej inteligencji, będzie wydajniejsza, przez co będzie mógł on stworzyć więcej tekstów. To oczywiście pociągnie za sobą zmniejszenie ceny za daną ilość tekstu. Z drugiej strony, może dzięki temu usługi staną się bardziej dostępne dla ludzi, dla których były one wcześniej nieosiągalne. Po prostu w ramach przyjętej normy czasu, będzie można wykonać większą liczbę zadań.
Źródło: www.openai.com/product/dall-e-2
Dodatkowo zapowiadane jest powstanie nowych zawodów, takich jak redaktor AI. Będzie to osoba, która narzędzia oparte na sztucznej inteligencji wykorzystuje do projektowania treści, dokładnie tak samo jak dziś przy użyciu Photoshopa – skądinąd także wyposażonego w rozwiązania AI – tworzone są grafiki, nawet przez osoby nieposiadające zdolności rysunkowych.
Historia AI pisze się na naszych oczach
Premiera czwartej już wersji CzatuGPT ma obejmować możliwość interpretacji zarówno tekstu, jak i obrazu. Nie powinno to dziwić ze względu na znaczenie obrazów i materiałów wideo w naszej codziennej komunikacji. Firma OpenAI stworzyła też wspomnianą już aplikację DALL-E, umożliwiającą tworzenie grafik na bazie opisu. Na podstawie szczegółów dotyczących kolorystyki, kompozycji, tematu, stylu i wszystkich innych parametrów, jakimi można opisać projekt graficzny, możliwa jest zamiana tekstu na grafikę. Możemy tylko próbować sobie wyobrazić, jakie będą możliwości modelu łączącego tekst, dźwięk i obraz, jako informacji wejściowych i wyjściowych. Wyobrażam sobie, że tworzenie grafik będzie się mogło odbywać w czasie rzeczywistym, za pomocą głosu i bez użycia narzędzi typu tablet graficzny. Programowi graficznemu będziemy opisywać, jaki efekt chcemy uzyskać, a widząc wynik na ekranie, będziemy dokonywać modyfikacji kolejnymi komendami typu: powiększ, wymarz, zmień kolor, dodaj strukturę itd.
Pomyśl, jak przyjemna lub przynajmniej normalna stanie się wreszcie rozmowa z chatbotami na stronach internetowych i profilach społecznościowych marek w porównaniu z automatem, który zazwyczaj bezskutecznie próbuje Cię przeprowadzić przez ścieżkę wyboru właściwego problemu, gdy łączysz się z bankiem. I nawet z Bartłomiejem Słowikiem o fotowoltaice przyjemniej będzie rozmawiać. W końcu automatycznie będzie można obsłużyć te dziesiątki życzeń, które wpadają Ci na Facebooku od znajomych z okazji urodzin. Tak by się chciało każdemu szybko, a jednocześnie indywidualnie podziękować. Czemu i w tym bot nie miałby nas wyręczyć?
POLECAMY