Geografia katowickich wydarzeń kulturalnych to jeden z tematów podejmowanych podczas warsztatów Co Facebook wie o kulturze: analiza mediów społecznościowych. Bazując na danych pozyskanych z serwisu, próbowaliśmy zlokalizować w Katowicach centra wydarzeń kulturalnych i sprawdzić czy pokrywają się one z miejscami, które w narracji medialnej funkcjonują jako strefy i centra kultury. Poza tym chcieliśmy dowiedzieć się, czy rozlokowanie wydarzeń w mieście zależy od sezonu i czy popularność poszczególnych miejsc zmieniała się w ostatnich latach. Interesowało nas wreszcie, kim są organizatorzy wydarzeń – czy centrum kultury tworzą podmioty publiczne, czy prywatne i pozarządowe. Oczywiście na początkowym etapie pracy pytań i tematów do zbadania pojawiło się znacznie więcej. Wstępna analiza danych i dyskusja nad priorytetami pozwoliły wybrać najciekawsze i warte zgłębienia zagadnienia.
Aby znaleźć odpowiedzi na nasze pytania i zweryfikować intuicje badawcze musieliśmy zmierzyć się z danymi. Bazowaliśmy na postach dotyczących wydarzeń kulturalnych w Katowicach pozyskanych wcześniej za pomocą publicznego API Facebooka.
Za cel postawiliśmy sobie początkowo stworzenie i przetestowanie prostego narzędzia. Chcąc prześledzić proces jego przygotowania i sprawdzić skuteczność działania, ograniczyliśmy liczbę analizowanych wydarzeń do tych, które miały miejsce w ciągu jednego roku – 2016. Taka selekcja pozwoliła na przyspieszenie pracy, a jednocześnie wybrana próba była wystarczająca, by ustalić możliwe problemy, braki i schemat procesu pracy.
Zaczęliśmy od czyszczenia danych potrzebnych do eksploracji. Z istniejącej bazy, obejmującej szereg informacji na temat wydarzeń założonych przez ich organizatorów na Facebooku, wybraliśmy te dane, które dla naszego problemu były najistotniejsze. Kluczowe okazały się informacje o nazwie organizatora oraz lokalizacji zdarzeń, a także daty wydarzeń.
Chcąc sprawdzić czy centra kultury tworzone są przez instytucje czy podmioty pozainstytucjonalne, do istniejącej bazy danych wprowadziliśmy dodatkową typologię. Organizatorów wydarzeń podzieliliśmy na (1) publicznych oraz (2) prywatnych i pozarządowych. W tym punkcie konieczne było ręczne wprowadzanie atrybutów. Bazowanie na kategoriach stron, jakie pozwala wybrać użytkownikom Facebook, nie było wystarczające. Po pierwsze nie istnieje np. kategoria instytucji kultury, po drugie – administratorzy stron, aby zobrazować specyfikę działalności, często wybierają kategorie, które nie do końca odpowiadają rzeczywistej sytuacji prawnej. Przykładowo, wybór kategorii „miejsce” pozwala użytkownikom Facebooka w łatwy sposób „zameldować się” w danej lokalizacji, a wybór kategorii „społeczność” może być formą pokazywania zasięgu działania danego podmiotu.
Wystarczyła wstępna analiza danych pozyskanych z Facebooka, by stwierdzić, że nie wszystkie z wybranych wydarzeń mają przypisaną lokalizację. Część organizatorów celowo bądź przez nieuwagę pomijała pole z adresem danego działania. Bez względu na motywację organizatorów niepełne dane musieliśmy albo odrzucić, albo poprawnie uzupełnić (w przypadku gdy miejsce zdarzenia było możliwe do określenia). Konieczne było nie tylko uzupełnienie braków, ale też sprawdzenie czy określone w bazie miejsca łączą się z konkretnymi współrzędnymi geograficznymi.
Analiza danych geograficznych zdeterminowała wykorzystywane podczas eksploracji narzędzia i technologie. Interesujące nas dane miały dotyczyć wydarzeń odbywających się w Katowicach. Najpierw analizowanym wydarzeniom chcieliśmy przypisać georeferencje. W przypadku wielu wydarzeń były ukryte w ich opisie, dlatego musieliśmy je wyciąć z ciągu znaków za pomocą napisanego specjalnie w tym celu skryptu. W ten sposób powstała prosta baza danych, zawierająca opis wydarzenia, informacje o organizatorze oraz współrzędne.
W kolejnej fazie działań z bazy danych dotyczących wydarzeń kulturalnych próbowaliśmy wyselekcjonować te, które odbywały się na terenie Katowic. W tym celu posłużyliśmy się ogólnodostępnym zbiorem danych z Państwowego Rejestru Granic oraz oprogramowaniem QGIS, które umożliwia m.in. gromadzenie, przetwarzanie i analizowanie danych przestrzennych, a także tworzenie map. Na podstawie pliku CSV stworzyliśmy warstwę wektorową z punktami reprezentującymi miejsca wydarzeń. Następnie „wycięliśmy” z niej te, które odbywają się na terenie Katowic, czyli położone są w obrębie poligonu przedstawiającego granice miasta. Uzyskane w ten sposób dane zapisaliśmy w pliku GeoJSON.
Mając już kompletne, oczyszczone dane na temat wydarzeń w Katowicach – odpowiednio skategoryzowane, z dokładnymi lokalizacjami wyrażonymi w długości i szerokości geograficznej – mogliśmy przejść do zobrazowania rozmieszczenia wydarzeń na mapie. W tym celu wykorzystaliśmy bibliotekę JavaScript Leaflet. Umożliwia ona agregowanie punktów w grupy (z zadanym zagęszczeniem), dodawanie etykiet do punktów (np. nazwę wydarzenia), nadawanie stylu w zależności od wybranego parametru (w naszym przypadku kolor punktu odpowiadający typowi organizatora).
Wykorzystanie Leaflet pozwoliło nam odpowiednio przygotowaną bazę danych umieścić na mapie i poddać ją stylizacji. Dane dotyczące liczby wydarzeń i ich organizatorów zostały zwizualizowane w prosty, czytelny sposób. Na podstawie uzyskanej mapy mogliśmy analizować rozmieszczenie „miejsc kultury” i poszukiwać obszaru, na którym agreguje się największa liczba wydarzeń kulturalnych. Stylizując odpowiednio mapę, łatwo było także zobaczyć podział wydarzeń na te organizowane przez podmioty publiczne i te organizowane przez organizacje pozarządowe i podmioty prywatne.
Dodając do wyjściowych danych kolejne artybuty, można na różne sposoby analizować specyfikę wydarzeń np. zmienność lokalizacji w zależności od sezonu / miesiąca w ciągu roku. Wypracowany model działania stanowi prototyp, który będzie rozwijany w kolejnych miesiącach. Finalny produkt pozwoli zobrazować np. zmienność „centrów kultury” na przełomie lat.