2015. május 6., szerda

Bőgel György: A Big Data ökoszisztémája

Majdnem minden, amit nem szakemberként Big Data témában jelenleg tudni érdemes - nagyjából így lehet egy mondatban összefoglalni Bőgel György A Big Data ökoszisztémája címmel megjelent könyvét. Fontos, hogy ismeretterjesztő mű és nem kimondottan a témában jártasakat célozza, de ez korántsem jelent minőségi kompromisszumot, a stílus és az információátadás is magas színvonalú. 

A sok fiction mellé időnként kell egy kis science is, ez most a CEU professzora, Bőgel György új könyvének képében érkezik a blogra. Az informatika egyre meghatározóbb az életünkben és a sci-fi irodalomban is érdekes szerepet játszik. A cyberpunk televízióképernyő-szürke égbolt alatt vibráló neonfényes, hackerekkel, implantokkal és virtuális terekkel teli jövőképe - szerencsére - nem vált valóra, a kortárs informatikai trendek viszont legalább olyan izgalmasak - és adott esetben legalább olyan nyugtalanítóak. 

A Typotex fantasztikus irodalmi körökben leginkább a poszterre kívánkozó borítókat felvonultató Science in Fiction sorozatáról ismert, de érdemes megnézni a tudományos-ismeretterjesztő kínálatukat is. Jared Diamondtól Schrödingeren át Esko Valtaojáig rengeteg jó szerzőtől még több érdekes könyv jelent meg náluk. Ebbe a körbe tartozik A Big Data ökoszisztémája is, mely elsősorban azokhoz szól, akik adatokkal dolgoznak, vagy a munkájuk során hasznos lehet számukra az adatelemzés (egyre inkább úgy tűnik, hogy azok vannak kevesebben, akiknek nem jön jól az ilyesmi), viszont egy átlagos sci-fi olvasónak sem árt, ha tisztában van a fontosabb tudományos, társadalmi és technológiai trendekkel (hommage à Babits Bihály).

Röviden: Big Data alatt általában olyan adathalmazt szokás érteni, ami az aktuális kor technológiai fejlettsége mellett hagyományos adatfeldolgozási módszerekkel nehezen kezelhető. A könyv egyik példája alapján ilyen volt a bécsi közkórház tizenkilencedik századi dokumentációs rendszere, napjainkban pedig mindannyian, gyakorlatilag folyamatosan hozzájárulunk Big Data-típusú adatbázisok építéséhez.

(Fred Gambino borítóterve az Előjáték az Alapítványhoz, Az Alapítvány pereme és az Alapítvány és Föld c. regényekhez)
Ha már sci-fi, a témát Asimov is pedzegette, csak ő pszichohistóriának hívta: az Alapítvány-sorozat központi szerepet játszó fiktív tudománya, mely a matematika, szociológia és történettudomány eszközeivel igyekszik modellezni és előrejelezni nagy embertömegek viselkedését a múltban összegyűjtött adatok alapján, kísértetiesen emlékeztet arra, amit napjaink adatbányászai, elemzői csinálnak. A különbség nagyjából annyi, hogy nem a Galaktikus Birodalom jövőjének formálása a cél, hanem a mezőgazdaság, a marketing, a sport és más területek hatékonyságának növelése, de ha így haladunk tovább (és nem csap végzetesen pofán a globális felmelegedés miatti instabilitás nyomán egyre szélsőségesebbé váló természeti jelenségek sorozata), előbb-utóbb tényleg a kezünkben lesz Hari Seldon eszköze, már csak új csillagrendszereket kellene meghódítani hozzá (hajrá Elon Musk!).

Amiben viszont a Big Data máris jobb a pszichohistóriánál, az az egyének viselkedésének elemzése és előrejelzése. Érzésem szerint Seldon és csapata simán képesek lettek volna erre is kidolgozni valamit, egyszerűen Asimov nem látta előre annak idején, az 1940-es években, hogy milyen elképesztő mennyiségű személyes adatot fogunk generálni. Okostelefon, számítógép, térfigyelő kamerák, beléptetőrendszerek, elektronikus tömegközlekedési jegyrendszer, törzsvásárlói kártyák, bankkártyás vásárlás, egészségügy, oktatás, autóvezetés, közműhasználat stb. - hacsak nem választunk teljes mértékben off-grid életmódot, egyszerűen elkerülhetetlen, hogy ne hagyjunk rögzített nyomot magunk után. Itt persze bejönnek mindenféle adatvédelmi témák is a képbe, de ezt hagyjuk meg mondjuk a téma egyik legnagyobb alakjának, Cory Doctorownak, ez a könyv nem személyes adataink védelméről és tudatos kezeléséről szól, hanem arról, hogy mi mindent lehet kezdeni vele.

Mert jól megválogatva és biztonságosan használva elég hasznos és gyakran valóban szinte sci-fibe illő dolgokat lehet kihozni belőle. A kulcsszó persze itt is a biztonság, minden éremnek két oldala van és rossz kézbe kerülő adatbázisokkal, pláne, ha nincsenek anonimizálva, elég csúnya dolgokat lehet művelni. Egyelőre viszont úgy tűnik, hogy a haszon jócskán felülmúlja a hátrányokat, alig van olyan gazdasági, társadalmi és tudományos terület, ahol nem lehetnek hasznosak az adatbányászat eredményei, legalábbis akkor persze, ha már létezik elegendő mennyiségű adat a témában.

(a kép forrása: Free Courses)
Na de térjünk vissza a konkrét könyvre. A Big Data ökoszisztémája jól összerakott, olvasmányos stílusú és rövidebb részletekben olvasva is gördülékeny mű, rengeteg érdekes példával. Nem a teljesen laikusokat és nem is a szakmai közönséget célozza, hanem nagyjából mindenkit a két véglet között, érzésem szerint különös tekintettel azokra, akiknek elméleti lehetőségük lenne ugyan rá, mégsem használnak Big Data eszközöket, esetleg érdeklődnek a téma iránt, de valami miatt még nem kezdtek el foglalkozni vele. Rajtuk kívül én elsősorban az érdeklődő majdnem-laikusoknak ajánlom (ha nem értetted, hogy a bejegyzés miről szól, ez nem a te könyved), akik szeretnének képben lenni a kortárs technológiai-tudományos témákkal, esetleg sci-fi rajongók és kíváncsiak, hogy mi van egy-egy történet hátterében. És ha tudtok Big Data témájú (vagy legalább azt hangsúlyosan szerepeltető) sci-fiket, ne fogjátok vissza magatokat, írjátok meg kommentben!


--
Kiadó: Typotex
Kiadási év: 2015
Borító: Bíró Petra, Mózer Ágnes
ISBN: 9789632798301
Oldalszám: 214
Ár: 3500,- (borítóár) / 2625,- (Typotex webbolt)
--

Szeretnéd azonnal olvasni a legújabb bejegyzéseket? Iratkozz fel a blog feedjére, lájkold az oldalt a Facebookonkövess a Twitteren vagy a Google+-on, és ha kíváncsi vagy, hogy mit olvasok éppen, a Molyon is figyelhetsz! 

Ha tetszett a bejegyzés, oszd meg ismerőseiddel is! :) 

0 hozzászólás:

Megjegyzés küldése