Analiza danych z pomocą AI: testujemy ChatGPT, Claude’a i inne modele językowe

Jeśli używasz ChatGPT do edycji tekstu i rozwiązywania codziennych problemów, dlaczego nie miałbyś zlecić mu analizy danych z bazy czy arkusza kalkulacyjnego? Zobacz, jak duże modele językowe (LLM) radzą sobie z przetwarzaniem tabel i jak możesz je wykorzystać w swoich projektach.

Karol PiekarskiWarsztaty

Czasem do obliczeń bardziej przyda ci się zwykły arkusz niż wyrafinowane sieci neuronowe.
Przeanalizuj ten plik CSV i powiedz mi:
(1) ile ma wierszy i kolumn,
(2) co reprezentuje każda kolumna,
(3) jakie typy danych są w każdej kolumnie oraz
(4) czy są jakieś brakujące wartości lub oczywiste problemy z jakością danych.
Mam zbiór danych dotyczący [temat badania]. 
Chcę zbadać [cel analizy], ale nie mam doświadczenia w analizie danych. 
Czy możesz zaproponować mi plan analizy krok po kroku? Opisz, jakie metody powinienem zastosować, w jakiej kolejności i dlaczego.
Przeprowadź eksploracyjną analizę danych (EDA) tego zbioru.
 
Chcę poznać:
1) Podstawowe statystyki dla każdej zmiennej
2) Rozkłady wartości i potencjalne wartości odstające
3) Korelacje między zmiennymi
4) Brakujące dane i ich wzorce
5) Nietypowe obserwacje, które mogą wymagać uwagi

Przedstaw wyniki w przystępny sposób z wizualizacjami.
Zarówno te plany, jak i finalne wyniki analiz warto wrzucić do innego modelu językowego pełniącego funkcję code review. Brzmi jak przesada? Niekoniecznie.
Sprawdź poniższą analizę danych pod kątem:

1. Błędów metodologicznych – czy zastosowane metody są właściwe?
2. Jakości kodu – czy nie ma oczywistych błędów w obliczeniach?
3. Obsługi brakujących danych – czy zostały poprawnie potraktowane?
4. Wartości odstających – czy zostały zidentyfikowane i odpowiednio obsłużone?
5. Poprawności interpretacji wyników

Na co powinienem szczególnie zwrócić uwagę? Czy widzisz jakieś potencjalne problemy, które mogły być przeoczone?