ChatGPT 4o: Zaawansowana analiza danych

szudejkomichal
18 maj 2024
4 minut(y) czytania

Zaktualizowano: 15 cze 2024

W tym poście, przedstawię przykładowe wykorzystanie najnowszego produktu OpenAI, modelu językowego ChatGPT 4o. Ocenię też oraz opiszę zaobserwowane plusy i minusy tego narzędzia.

Źródło: obraz wygenerowany przez autora w DALL-e

Czym jest ChatGPT 4o?

ChatGPT 4o, zgodnie z deklaracjami OpenAI, pod względem "inteligencji" dorównuje modelowi GPT-4. Ma jednak działać szybciej i lepiej w zakresie analizy tekstu, głosu i obrazu. Zgodnie z deklaracjami OpenAI, nowy model w przyszłości umożliwi bardziej naturalne rozmowy głosowe i wideo w czasie rzeczywistym.

W chwili obecnej jest on udostępniony dla użytkowników wersji płatnych ChatGPT, Plus oraz Team. W przyszłości zostanie udostępniony dla użytkowników Enterprise i , w ograniczonym stopniu, użytkownikom darmowej wersji ChatGPT*.

Co umożliwia ChatGPT 4o?

ChatGPT 4o umożliwia m.in.:

Zaawansowaną analizę obrazów: Na przykład, można zrobić zdjęcie menu w obcym języku i porozmawiać z ChatGPT 4o o tłumaczeniu, historii i znaczeniu potraw oraz otrzymać rekomendacje.
Szybsze i bardziej zaawansowane przetwarzanie języka: Model oferuje inteligencję na poziomie GPT-4, ale działa znacznie szybciej i dokładniej.
Obsługę wielu języków: ChatGPT w wersji 4o obsługuje ponad 50 języków w różnych funkcjach, takich jak rejestracja, logowanie i ustawienia użytkownika.
Dostępność zaawansowanych narzędzi, takich jak analiza danych, używanie GPT użytkowników oraz korzystanie GPT obrazów, generowanie odpowiedzi na podstawie wyników wyszukiwania w Internecie.

W przeciągu kilku tygodni, ChatGPT 4o zostanie też wzbogacony o nowy, udoskonalony model obsługi głosowej.

Wykorzystanie ChatGPT 4o do analizy danych - przykład

Jak widać, nowe narzędzie oferuje szerokie spektrum możliwości. W tym poście przedstawię Wam jak prosta jest analiza danych z wykorzystaniem ChatGPT 4o. Na potrzeby tego przykładu pobrałem zupełnie przypadkowe dane witryny Kaggle.com. Dane te składały się z dwu plików i zostały udostępnione na licencji CC-BY SA 4.0.

Zestaw danych. Źródło: print screen wykonany przez autora.

Zgodnie z opisem dostarczonym przez autora zestawu danych, jeden zbiór danych zawiera brakujące wartości (NaN), a drugi nie. Te zbiory danych zawierają informacje na temat sprzedaży i zadowolenia klientów przed i po interwencji, a także dane dotyczące zakupów dla grup kontrolnych i terapeutycznych. Zbiór danych ma charakter syntetyczny i został stworzony do wykorzystania w analizie statystycznej.

Aby dodatkowo utrudnić zadanie, skompresowałem obydwa pliki do pojedynczego archiwum (w formacie *.zip).

Przejdźmy zatem do analizy.

Załadowanie danych i wprowadzenie instrukcji.

Pierwszym krokiem analizy jest wybór modelu językowego. Widok jak niżej jest dostępny dla subskrybentów wersji płatnej ChatGPT Plus. Wybieramy model GPT-4o.

Wybór modelu GPT. Źródło: print screen wykonany przez autora.

Następnie należy załadować dane do ChatGPT. Robimy to klikając na znak "spinacza", a następnie wybierając nasz plik, w tym przypadku archiwum *.zip.

Załadowanie pliku do ChatGPT. Źródło: print screen wykonany przez autora.

Aby nieco ukierunkować analizę, postanowiłem dać modelowi trochę więcej instrukcji. Aby ich jednak nie przepisywać, zrobiłem tzw. zrzut ekranu i wkleiłem wynik do pola wprowadzania instrukcji (przy pomocy kombinacji klawiszy ctrl+v).

Zrzut ekranu z instrukcjami. Źródło: print screen wykonany przez autora.

Na koniec wpisałem faktyczne polecenie dla modelu językowego.

Finalna postać prompta. Źródło: print screen wykonany przez autora.

Zobaczmy jakie uzyskamy wyniki.

Wyniki analizy: część pierwsza

ChatGPT szybko "zabrał się" do pracy, opisując kolejno wykonywane kroki. Rozpoczął od rozpakowania archiwum i analizy opisowej zmiennych, co przedstawiono na poniższym zrzucie ekranu. Pewnym zaskoczeniem dla mnie było to, że wyniki analizy przedstawił w języku angielskim. Jak zobaczycie niżej, nie stanowi jednak dla niego problemu praca w języku polskim. Sugeruje to konieczność wyraźnego wskazania języka, w jakim mają być przedstawiane wyniki w treści zapytania. Tu jednak zdecydowałem się pozostawić oryginalny "produkt" ChatGPT.

Pierwsze kroki analizy. Źródło: print screen wykonany przez autora.

Po wstępnych "pracach", ChatGPT "przystąpił" do faktycznej analizy. Tak jak wcześniej, opisał szczegółowo kroki, jakie miałby następnie wykonać. Były to odpowiednio: analiza opisowa danych, analiza porównawcza, analiza korelacji, oraz wizualizacje. W tym momencie sugerowałbym przewinąć ten post odrobinę w górę i rzut oka na pierwotne zapytanie. O żadną z tych analiz nie prosiłem bezpośrednio ChatGPT. Model sam "zaproponował" konkretne prace jakie wykona, a następnie je wykonał. Nie potrzebował do tego żadnych doatkowych sugestii czy promptów. Ech, gdyby wszyscy analitycy pracowali w ten sposób... :) Nadmienię, że GPT-4 dość często "dopytywał" w trakcie pracy.

Wyniki analizy opisowej. Źródło: print screen wykonany przez autora.

Następnie ChatGPT przeprowadził analizę porównawczą danych i zinterpretował wyniki. Obie grupy kontrolne wykazały się wzrostem sprzedaży po przeprowadzonej interwencji.

Wyniki analizy porównawczej. Źródło: print screen wykonany przez autora.

Uff. Przechodzimy do dalszych kroków, którymi będą analiza korelacji oraz przygotowanie zaawansowanych wizualizacji.

Wyniki analizy korelacji. Źródło: zrzut ekranu wykonany przez autora.

Z przeprowadzonej analizy korelacji wynika silna korelacja pomiędzy poziomami sprzedaży przed i po interwencji. Podobnie zachowuje się poziom satysfakcji klientów. Wykryto umiarkowany poziom korelacji pomiędzy poziomem sprzedaży a poziomem satysfakcji klientów.

Następnie ChatGPT podsumował wyniki korelacji i zapowiedział kolejne kroki, tj. przygotowanie zaawansowanych wizualizacji oraz przeprowadzenie testów statystycznych.

Kolejne kroki. Źródło: zrzut ekranu wykonany przez autora.

ChatGPT przygotował kilka dodatkowych wizualizacji. Na pierwszej z nich wykazał pozytywny wpływ na sprzedaż podjętego działania. Przygotował też kilka wykresów pudełkowych opisujących obydwa zestawy danych.

Zaawansowane wizualizacje. Źródło: zrzut ekranu wykonany przez autora.

Na koniec tego etapu analizy, ChatGPT przeprowadził testy t-studenta weryfikujące kilka hipotez, m.in. odnośnie statystycznej istotności różnicy w poziomie sprzedaży przed i po dokonanej interwencji.

Wyniki testów statystycznych. Źródło: zrzut ekranu wykonany przez autora.

Wyniki analizy: część druga

Na zakończenie etapu pierwszego, ChatGPT zapytał, czy chcemy przeprowadzić dalsze analizy. Odpowiedziałem: "Tak". Rozpoczął się niniejszym kolejny etap. Co ciekawe, od tego momentu, ChatGPT przeszedł na język polski. Czyli jednak można :).

Propozycja kolejnych analiz. Źródło: zrzut ekranu wykonany przez autora.

Pierwszą z analiz było zbadanie obu zestawów danych w rozbiciu na segmenty klientów.

Wyniki analizy segmentów. Źródło: zrzut ekranu wykonany przez autora.

Następnie weryfikowano zachowania klientów przed i po dokonaniu zakupu.

Analiza decyzji zakupowych. Źródło: zrzut ekranu wykonany przez autora.

Na koniec ChatGPT przygotował kilka wizualizacji.

Więcej zaawansowanych wizualizacji. Źródło: zrzut ekranu wykonany przez autora.

Nie pozostawił nas przy tym samych z tymi wizualizacjami i dostarczył kilka interpretacji uzyskanych wyników.

Interpretacja uzyskanych wyników. Źródło: zrzut ekranu wykonany przez autora.

Niestety, ChatGPT nie dał rady wygenerować wyników analizy klasteryzacji - dwukrotnie zwrócił błąd, za trzecim razem rozpoczął analizę od początku i nie zwrócił żadnych rezultatów.

Jak się pracuje z ChatGPT 4o? - ocena

Jak dotąd pracowałem zarówno z wersją 3.5 jak i 4.0 ChatGPT. Testowałem wtyczki oraz GPTs (w tym przygotowane przeze mnie). Na tym tle chciałem ocenić również najnowszą wersję tego rozwiązania.

Sama obsługa jest podobna jak ChatGPT w wersji 4.0, który umożliwia zarówno pracę z plikami jak i obrazami. Moje subiektywne wrażenie było takie, że ChatGPT 4o działa nieco szybciej i stabilniej, a uzyskiwane rezultaty są niemal od razu bliskie oczekiwaniom. Na uwagę zasługuje fakt, że wygenerowana odpowiedź była dość obszerna. W mojej ocenie świadczy to na korzyść nowego modelu. Trochę zamieszania spowodowała kwestia językowa, jest to jednak do wyprostowania na etapie pisania prompta. Rozczarowaniem było to, że ChatGPT nie był w stanie dokończyć analizy. Niemniej udał się i tak sporo wypracować. Pracując z ChatGPT 4.0 tego typu sytuacje zdarzały mi się dość często.

Podsumowanie

Mam nadzieję, że tym krótkim postem udało mi się udowodnić choćby częściowo moc nowego narzędzia od OpenAI. Łączy on w sobie wszechstronność ChatGPT 4.0, oferując przy tym subiektywnie większą stabilność i szybkość. Zaletą jest dość dobra praca w języku polskim, pod warunkiem wskazania konieczności pracy w tym języku w zapytaniu.

*Użytkownicy darmowej wersji będą mogli, w zależności od skali globalnego wykorzystania, wykonać do kilku zapytań w wersji ChatGPT 4o.