Mostanában lett divat az úgynevezett "bar chart racing" típusú adatvizualizáció, ami könnyen befogadhatóvá tesz hosszú időintervallumokat felölelő nagy adatsorokat, ezáltal látványosan képes bemutatni különféle trendek és tendenciák változását. Talán már te is láttál ilyet az utóbbi néhány hónapban, ha esetleg még nem, akkor itt van pár:
- A Top15 legértékesebb világcégről,
- A világ leggazdagabb embereinek vagyonáról,
- A legnépszerűbb grafikus kártyákról,
- A legmenőbb internetes mémekről,
- A Trónok Harca szereplőinek képernyőn töltött idejéről (ezt mi meló/idő lehetett összegyűjteni...)
- És (ami egyedi kivitelezése miatt személyes kedvencem a műfajban) a legnézettebb zenei videókról a YouTube-on.
Hasonlót magyar vonatkozásban egyelőre csak az átlátszó.hu-n találtam, nekem meg továbbra is az egyik kedvenc hobbim az újszerű mozgóképes technikákkal való kísérletezgetés, úgyhogy beleástam magam a témába, hogyan lehetne ilyet csinálni.
Az Ariosz WikiTop oldalról tudom, hogy a Wikipediához tartozik egy API, amin keresztül a Wikipedián nyilvánosan meg nem jelenő adatokat (például az egyes oldalak nézettsége) lehet lekérdezni, Ariosz is épített erre egy felületet, ahol napi szinten lehet nézegetni, mi is foglalkoztatja épp a magyar társadalmat. Úgy gondoltam, hogy ez hosszabb távon még érdekesebb lehet, úgyhogy gyorsan össze is dobtam egy Python scriptet, ami akár több éves intervallumban is be tudja gyűjteni CSV fájlba többezer szócikk napi adatait, amiből aztán a Flourish segítségével elkészíthető a vizualizáció. Ez sikerült is:
(Érdemes a videó YouTube linkjét megnyitni és teljes képernyőn nézni. Mobilon/tableten talán jobban látható a Flourish saját reszponzív webes felületén levő verzió)
Frissítés: próbaképp megcsináltam az elmúlt 4 évet úgy, hogy folyamatosan 30 nap átlagát figyeli a rendszer, így egy kicsit elsimítódnak a kiugró értékek, és nem ragadnak be az egy időben nagy érdeklődést generáló, de később lecsengő témák, mint a 2018-as foci VB, vagy az O1G őrület 2018 utolsó - 2019 első hetei között, egyúttal összehasonlítható, hogy mennyivel jobban mozgatta meg egy időben az egyik téma a közvéleményt, mint egy másik. Egy külön posztot is megér majd majd az elemzés a 2000-4000, a 4000-6000 illetve a 6000 feletti sávba jutó szócikkekről (főleg a 2:40 után megjelenő O1G, és a videó utolsó 5 másodpercében felbukkanó és azonnal csúcsra törő csernobili atomerőmű-baleset érdekes és tanulságos - ez a kettő egy olyan koncepció létjogosultságát támasztja alá, amiről kb 3 éve ugatok ezen a blogon)
Az eredmény szerintem egész jó lett első próbálkozáshoz képest, és sok érdekesség kiderül belőle. Például az, hogy Orbán Viktornak egyvalamiben tökéletesen igaza van, Magyarország tényleg focibuzi ország, tavaly nyár óta egyedül Freddie Mercury mozgatta meg jobban az országot, mint a VB. Érdekes viszont a 2018 október-november-decemberében tetőző palindronszám-hype (ha erre valakinek van magyarázata, kommentben írja már meg légyszi frissítés: részben meglett a rejtély megoldása) és szintén látványos 2018 decemberében az O1G jelenség, 2019 januárjában Andy Vajna vagy épp tavasszal (valószínűleg a HBO kiváló sorozatának köszönhetően) a csernobili katasztrófa iránti érdeklődés felfutása, valamint a különféle nemzeti ünnepek és az EP-választás hatása. Számomra kicsit fura, hogy milyen sokan érdeklődnek olyan dolgok iránt, amikkel én ebben a videóban találkoztam először: a Drága Örökösök és A mi kis falunk nevére úgy kellett rágugliznom, hogy mik is ezek, és továbbra se értem, hogy vajon miért is ilyen népszerűek szemben mondjuk a Trónok Harcával, ami meg sokkal pocsékabbul teljesített, mint amire számítottam.
Szintén érdekes, bár számomra nem meglepő, hogy a politika mennyire nem érdekli az embereket: Orbán Viktoron kívül az O1G volt az egyetlen meghatározó politikai témájú szócikk a Wikipedián az elmúlt 12 hónapban, a legtöbben még az EP-választásra is csak a választást megelőző utolsó 1-2 napban kerestek rá. Lehet, hogy tényleg erre lehet felépíteni egy új, alulról szerveződő ellenállási mozgalmat?
Ez most az írás közben jött hirtelen ötlet: a következő videóban összegyűjtöm a pártok, politikusok Wikipedia-szócikkeinek nézettségének alakulását az elmúlt 4 évből (azóta van API). Ha érdekel az ilyesmi, iratkozz fel a YouTube-on, kövess Facebookon, segítsd a motivációm fenntartását azzal, hogy megosztod és lájkolod a tartalmaimat ;) (Frissítés: a csíra Facebook valamiért tiltólistára tette a tomanovicsgergely.blog.hu-t, úgyhogy csak külön a YouTube videót tudod megosztani, ott linkelve van a poszt a leírásban)