Masz pytanie o kulturę w regionie? Nie musisz już grzebać w arkuszach z tysiącami wierszy i setkami kolumn. Po prostu zapytaj wprost. Nasze rozwiązanie pozwala czatować po polsku z bazą danych o tym, jak mieszkańcy metropolii korzystają z kultury.
Karol PiekarskiProdukt
W ostatnich latach twórcy i organizatorzy wydarzeń kulturalnych mieli dostęp do badań uczestników wydarzeń kulturalnych w regionie. Brakowało jednak szerszego spojrzenia na potrzeby i zachowania większości mieszkańców – również tych, którzy rzadko lub nigdy nie pojawiali się na wydarzeniach lub korzystali z kultury, nie wychodząc z domu. Teraz sytuacja się zmieniła.
Dzięki staraniom Górnośląsko-Zagłębiowskiej Metropolii i instytucji Katowice Miasto Ogrodów dysponujemy pokaźnym zbiorem danych z diagnozy sektora kultury na terenie gmin tworzących metropolię.
To unikatowe badanie na reprezentatywnej próbie sześciu tysięcy mieszkańców regionu – odpowiedzi na kilkadziesiąt pytań trafiły do tabeli z kilkuset kolumnami. Co więcej, wszystkie dane są powszechnie dostępne.
Jak sprawić, by dane zaczęły mówić?
Problem w tym, że surowe dane to jeszcze nie praktyczna wiedza. Jak sprawić, by każdy mógł z nich skorzystać? W Medialabie Katowice postanowiliśmy wykorzystać sztuczną inteligencję, a konkretnie duży model językowy (LLM). Stworzyliśmy narzędzie, które pozwala wysyłać zapytania do bazy danych w języku naturalnym.
Niezależnie od tego, czy tworzysz, organizujesz czy badasz kulturę, możesz zadać swoje pytania po polsku. Nasz model nie tylko znajdzie odpowiedź, ale też doradzi, jak najlepiej sformułować pytanie.
Przykłady zapytań
Oto kilka przykładów pytań dla osób testujących możliwości naszej aplikacji.
Trzy rodzaje odpowiedzi
Nasz agent radzi sobie z różnymi typami pytań:
To podejście odpowiada na rzeczywiste potrzeby użytkowników. Nie musisz wiedzieć, jakie dokładnie dane są w bazie – wystarczy, że masz konkretne pytanie lub problem do rozwiązania. Oczywiście narzędzie może zaproponować tylko rozwiązania oparte na dostępnych danych.
Pamiętaj o ograniczeniach. Pomimo dużej próby, dla mniejszych gmin liczba odpowiedzi może być niewystarczająca do reprezentatywnych wniosków. Zapytanie o teatromanów seniorów z Pilchowic prawdopodobnie nie da wiarygodnych wyników.
Dlatego zawsze możesz sprawdzić, na czym opiera się odpowiedź. Zapytaj: „Jak to policzyłeś?” lub „Jak duża jest próba?”. Możesz też poprosić o szczegóły techniczne: „Pokaż zapytanie SQL” (SQL to język używany do wyciągania z bazy danych interesujących nas informacji).
.
Przykład konwersacji
Użytkownik: kto chętniej chodzi na koncerty, mieszkańcy Sosnowca czy Dąbrowy Górniczej?
Model: Z przedstawionych danych wynika, że mieszkańcy Sosnowca częściej uczestniczą w koncertach niż mieszkańcy Dąbrowy Górniczej. Dokładnie 41,68% mieszkańców Sosnowca uczestniczyło w koncertach przynajmniej raz w ciągu ostatnich 12 miesięcy, w porównaniu do 21,63% mieszkańców Dąbrowy Górniczej.
Użytkownik: Jak to policzyłeś?
Model: Aby obliczyć te wartości, wykorzystałem następujące zapytanie SQL:
SELECT miasto_powiat, ROUND(SUM(CASE WHEN czestotliwosc_koncert = ‚Przynajmniej raz w ciągu ostatnich 12 miesięcy’ THEN waga_proby ELSE 0 END) * 100.0 / SUM(waga_proby), 2) AS procent_koncerty
FROM participation_survey
WHERE miasto_powiat IN (‚Sosnowiec’, ‚Dąbrowa Górnicza’)
GROUP BY miasto_powiat;
To zapytanie:
Uczenie się na błędach
Modele językowe nie są nieomylne. Dlatego nasze narzędzie nie jest czarną skrzynką – możesz sprawdzić każdy krok. Czasem model może mieć problem ze skomplikowanymi zapytaniami, ale to kwestia doświadczenia, a nie „inteligencji”.
Możesz nam pomóc w rozwoju narzędzia. Pod każdą odpowiedzią znajdziesz przyciski oceny (👍/👎) z możliwością komentarza. To pomaga nam identyfikować słabe punkty i ulepszać system.
Jeśli model ma problemy z twoim pytaniem, możesz mu podpowiedzieć. Znajdź przykładowe zapytanie SQL (choćby w ChatGPT) i wklej je do czatu jako wskazówkę. Traktuj narzędzie jak współpracownika, nie jak automat.
Co dalej?
W kolejnych postach opiszemy, jak powstało nasze rozwiązanie – proces uczenia agenta i wykorzystane źródła danych. Tymczasem zapraszamy do testów.
Aby skorzystać z narzędzia, wejdź na stronę i załóż konto – zweryfikujemy zgłoszenie najszybciej, jak to możliwe. Pytania? Napisz na karol.piekarski@medialabkatowice.eu – chętnie odpowiemy!