Karol Piekarski: Na ostateczne wyniki musimy poczekać nawet dłużej niż do grudnia, choćby z tego względu, że wciąż gromadzimy i przetwarzamy dane, by przeprowadzić zaplanowane analizy. Jednak już dziś wiemy bardzo dużo o kilkunastu przebadanych wcześniej wydarzeniach kulturalnych w Katowicach.
Stworzyliśmy prototyp raportu z tej części projektu, w którym opisujemy między innymi specyfikę dużych katowickich festiwali, takich jak OFF czy Nowa Muzyka. Widać wyraźnie, że są one wartościowe dla miasta: przyciągają gości spoza Katowic, którzy chętnie zwiedzają śródmieście i wydają tu zdecydowanie więcej pieniędzy niż publiczność innych wydarzeń. Mamy też gotowe narzędzie do analizy i prezentacji danych z Facebookowych stron instytucji kultury, poza tym przygotowaliśmy kilka innych działających prototypów, np. narzędzie badające dostępność geograficzną instytucji, które wkrótce przetestujemy na większych zbiorach danych.
Takie jest założenie. Ale tak naprawdę jest to eksperyment, chcemy zobaczyć, na ile w ogóle taka forma jest przydatna w badaniach kultury. Mimo wszystko nie jest to zbyt popularne rozwiązanie w badaniach naukowych, więc już samo to doświadczenie, nie wspominając o pozyskanych danych, jest dla nas bardzo wartościowe. Dlatego serdecznie zachęcam do skorzystania z aplikacji pod adresem www.badamykulture.eu.
Szacuję, że co najmniej 40% czasu zabierają nam właśnie czynności związane z zarządzaniem projektem, ważne jest więc, żeby dobrze przygotować workflow: sposób komunikacji, zasady dokumentacji działań, przepływ danych etc.
Szczególnym wyzwaniem jest zarządzanie danymi oraz przepływ informacji pomiędzy członkami zespołu o różnych profesjach i kompetencjach. W naszym badaniu programiści i projektanci zawsze zaangażowani są w podejmowanie merytorycznych decyzji, natomiast badacze starają się poznać i zrozumieć narzędzia pracy analityków, programistów i projektantów.
Takie wspólne działanie przynosi najlepsze rezultaty. Przy czym nie trzeba angażować wszystkich w pełnym wymiarze czasowym, zazwyczaj wystarczy kilka wspólnych spotkań lub prowadzenie dobrej dokumentacji, która pozwoli innym członkom teamu kontrolować rozwój sytuacji. Nieocenione w tym momencie są narzędzia do pracy online, począwszy od Dokumentów Google, przez systemy zarządzania projektem, aż po GitHuba, gdzie zawsze można znaleźć aktualną wersję skryptu lub danych.
Gdy jest już zdefiniowany problem badawczy – na przykład geograficzna dostępność kultury w Katowicach – zazwyczaj w grupie 3–4 osób rzucamy pomysłami, spekulujemy i opracowujemy szczegółowe założenia. Równolegle wraz z analitykami i programistami próbujemy dotrzeć do interesujących treści, w przypadku badania dostępności np. za pomocą API Map Google. Po drodze dużo czasu zajmuje czyszczenie danych, głównie konwertowanie do określonych formatów, by można było z nich swobodnie korzystać w innych środowiskach i programach.
Następnie wykonujemy wiele analiz, stosując często eksploracyjną wizualizację danych – generujemy dziesiątki statystyk i roboczych wykresów, by sprawdzić, co wynika ze zgromadzonych treści (badając dostępność, za każdym razem dane wrzucaliśmy szybko na mapę, by łatwiej wychwycić prawidłowości i ew. błędy). Istotne jest, by dostęp do tych wizualizacji mieli wszyscy członkowie zespołu, niezależnie od tego, czy akurat brali udział w eksploracji. W tym celu tworzymy proste prototypy raportów, używając zazwyczaj biblioteki R Markdown, które można w łatwy sposób opublikować online, a następnie szybko aktualizować, gdy pojawią się uwagi lub nowe pomysły.
Tak przygotowane treści, uzupełnione o dane źródłowe w odpowiednich formatach (zazwyczaj w plikach tekstowych csv lub json), trafiają do projektantów graficznych przygotowujących wizualizacje i layout prezentacji. Ostatecznie projekt przejmują deweloperzy, którzy wykonują stronę internetową z wynikami badań. Oczywiście na wszystkich tych etapach odbywają się dyskusje i konsultacje, zawsze jest to praca zespołowa.
Wszystkie te spotkania były dla nas bardzo ważne: czasem zyskaliśmy istotne kompetencje programistyczne, czasem przeprowadziliśmy analizę, która doprowadziła do jakichś wniosków, w jeszcze innych przypadkach po prostu przedyskutowaliśmy z zaproszonymi ekspertami nasze założenia badawcze. Dla przykładu, warsztaty z zakresu analizy danych sondażowych w R rozwiały wiele wątpliwości związanych z badaniem ankietowym, z kolei po wspólnej pracy z Piotrem Migdałem i stworzeniu prototypowych narzędzi do badania treści z Facebooka postanowiliśmy kontynuować współpracę – w tym momencie wspólnie z Piotrem prowadzimy analizę sieciową, dzięki której badamy zależności pomiędzy wydarzeniami na podstawie podobnych zainteresowań użytkowników Facebooka.
Udało nam się wykonać samodzielnie około 90% zadań, m.in. dzięki szerokim kompetencjom członków zespołu i cyklowi szkoleń, które poszerzały nasze umiejętności. Jednak kilkakrotnie korzystaliśmy z bardzo specjalistycznej wiedzy zewnętrznych ekspertów, trudno bowiem zdobyć pewne kompetencje w kilka tygodni. Zresztą taka współpraca z osobami z zewnątrz jest w pewnych momentach długiego procesu badawczego bardzo odświeżająca i inspirująca, również pod względem towarzyskim.
Koordynację tych działań wzięli na siebie stali członkowie naszego teamu: Matylda Badera, Magdalena Chmiel i Oskar Adamus. Wbrew pozorom zarządzanie pracą wolontariuszy to duże wyzwanie wymagające elastyczności i miękkich kompetencji (wielu sytuacji nie da się przewidzieć – ile osób pojawi się danego dnia, jak będą pracować etc.). Okazało się np. że nie warto kompletować zespołu do przeprowadzenia ankiety na wiele tygodni przed wydarzeniem, ponieważ w międzyczasie część chętnych po prostu się wykruszyła. Świetnie sprawdziło się natomiast prowadzenie stale powiększanej bazy kontaktowej do osób chcących zostać wolontariuszami i kierowanie zapytań do tej grupy.
Bardzo liczyliśmy na feedback ze strony instytucji, spotkanie cieszyło się dużym zainteresowaniem, odbyła się dyskusja. Ale widać też, że przedstawicielom instytucji trudno zadawać bardzo dociekliwe pytania, w momencie w którym tylko powierzchownie znają wyniki researchu. Być może tego rodzaju działania powinny odbywać się dwuetapowo: prezentujemy wyniki, zespoły mają czas na dyskusje, przemyślenie własnych pytań, a potem następuje dalsza część badania, już w odniesieniu do konkretnych obserwacji.
Pracujemy obecnie nad raportem i wystawą, zainteresowanych pojedynczymi wątkami – np. wizualizacją i analizą danych oraz metodologiami badawczymi – zapraszam do lektury notek na blogu, który jest najlepszym źródłem informacji na temat naszych działań. Zapraszam także na grudniowe wydarzenie Kultura (w) danych, podczas którego nie tylko pokażemy wizualizacje, mapy itd, ale też przedyskutujemy z zaproszonymi gośćmi wiele ważnych obserwacji z badań. Na naszej wystawie przypadkowy odbiorca będzie mógł zapoznać się w kilka minut z animacją podsumowującą wyniki badania, z kolei pracownik kultury lub badacz zdobędzie pogłębioną wiedzę na temat projektu – wszystko w, mamy nadzieję, interesującej formie.