Majdnem minden, amit nem szakemberként Big Data témában jelenleg tudni érdemes - nagyjából így lehet egy mondatban összefoglalni Bőgel György A Big Data ökoszisztémája címmel megjelent könyvét. Fontos, hogy ismeretterjesztő mű és nem kimondottan a témában jártasakat célozza, de ez korántsem jelent minőségi kompromisszumot, a stílus és az információátadás is magas színvonalú.
A sok fiction mellé időnként kell egy kis science is, ez most a CEU professzora, Bőgel György új könyvének képében érkezik a blogra. Az informatika egyre meghatározóbb az életünkben és a sci-fi irodalomban is érdekes szerepet játszik. A cyberpunk televízióképernyő-szürke égbolt alatt vibráló neonfényes, hackerekkel, implantokkal és virtuális terekkel teli jövőképe - szerencsére - nem vált valóra, a kortárs informatikai trendek viszont legalább olyan izgalmasak - és adott esetben legalább olyan nyugtalanítóak.
A Typotex fantasztikus irodalmi körökben leginkább a poszterre kívánkozó borítókat felvonultató Science in Fiction sorozatáról ismert, de érdemes megnézni a tudományos-ismeretterjesztő kínálatukat is. Jared Diamondtól Schrödingeren át Esko Valtaojáig rengeteg jó szerzőtől még több érdekes könyv jelent meg náluk. Ebbe a körbe tartozik A Big Data ökoszisztémája is, mely elsősorban azokhoz szól, akik adatokkal dolgoznak, vagy a munkájuk során hasznos lehet számukra az adatelemzés (egyre inkább úgy tűnik, hogy azok vannak kevesebben, akiknek nem jön jól az ilyesmi), viszont egy átlagos sci-fi olvasónak sem árt, ha tisztában van a fontosabb tudományos, társadalmi és technológiai trendekkel (hommage à Babits Bihály).
Röviden: Big Data alatt általában olyan adathalmazt szokás érteni, ami az aktuális kor technológiai fejlettsége mellett hagyományos adatfeldolgozási módszerekkel nehezen kezelhető. A könyv egyik példája alapján ilyen volt a bécsi közkórház tizenkilencedik századi dokumentációs rendszere, napjainkban pedig mindannyian, gyakorlatilag folyamatosan hozzájárulunk Big Data-típusú adatbázisok építéséhez.
Ha már sci-fi, a témát Asimov is pedzegette, csak ő pszichohistóriának hívta: az Alapítvány-sorozat központi szerepet játszó fiktív tudománya, mely a matematika, szociológia és történettudomány eszközeivel igyekszik modellezni és előrejelezni nagy embertömegek viselkedését a múltban összegyűjtött adatok alapján, kísértetiesen emlékeztet arra, amit napjaink adatbányászai, elemzői csinálnak. A különbség nagyjából annyi, hogy nem a Galaktikus Birodalom jövőjének formálása a cél, hanem a mezőgazdaság, a marketing, a sport és más területek hatékonyságának növelése, de ha így haladunk tovább (és nem csap végzetesen pofán a globális felmelegedés miatti instabilitás nyomán egyre szélsőségesebbé váló természeti jelenségek sorozata), előbb-utóbb tényleg a kezünkben lesz Hari Seldon eszköze, már csak új csillagrendszereket kellene meghódítani hozzá (hajrá Elon Musk!).
Amiben viszont a Big Data máris jobb a pszichohistóriánál, az az egyének viselkedésének elemzése és előrejelzése. Érzésem szerint Seldon és csapata simán képesek lettek volna erre is kidolgozni valamit, egyszerűen Asimov nem látta előre annak idején, az 1940-es években, hogy milyen elképesztő mennyiségű személyes adatot fogunk generálni. Okostelefon, számítógép, térfigyelő kamerák, beléptetőrendszerek, elektronikus tömegközlekedési jegyrendszer, törzsvásárlói kártyák, bankkártyás vásárlás, egészségügy, oktatás, autóvezetés, közműhasználat stb. - hacsak nem választunk teljes mértékben off-grid életmódot, egyszerűen elkerülhetetlen, hogy ne hagyjunk rögzített nyomot magunk után. Itt persze bejönnek mindenféle adatvédelmi témák is a képbe, de ezt hagyjuk meg mondjuk a téma egyik legnagyobb alakjának, Cory Doctorownak, ez a könyv nem személyes adataink védelméről és tudatos kezeléséről szól, hanem arról, hogy mi mindent lehet kezdeni vele.
Mert jól megválogatva és biztonságosan használva elég hasznos és gyakran valóban szinte sci-fibe illő dolgokat lehet kihozni belőle. A kulcsszó persze itt is a biztonság, minden éremnek két oldala van és rossz kézbe kerülő adatbázisokkal, pláne, ha nincsenek anonimizálva, elég csúnya dolgokat lehet művelni. Egyelőre viszont úgy tűnik, hogy a haszon jócskán felülmúlja a hátrányokat, alig van olyan gazdasági, társadalmi és tudományos terület, ahol nem lehetnek hasznosak az adatbányászat eredményei, legalábbis akkor persze, ha már létezik elegendő mennyiségű adat a témában.
Röviden: Big Data alatt általában olyan adathalmazt szokás érteni, ami az aktuális kor technológiai fejlettsége mellett hagyományos adatfeldolgozási módszerekkel nehezen kezelhető. A könyv egyik példája alapján ilyen volt a bécsi közkórház tizenkilencedik századi dokumentációs rendszere, napjainkban pedig mindannyian, gyakorlatilag folyamatosan hozzájárulunk Big Data-típusú adatbázisok építéséhez.
(Fred Gambino borítóterve az Előjáték az Alapítványhoz, Az Alapítvány pereme és az Alapítvány és Föld c. regényekhez) |
Amiben viszont a Big Data máris jobb a pszichohistóriánál, az az egyének viselkedésének elemzése és előrejelzése. Érzésem szerint Seldon és csapata simán képesek lettek volna erre is kidolgozni valamit, egyszerűen Asimov nem látta előre annak idején, az 1940-es években, hogy milyen elképesztő mennyiségű személyes adatot fogunk generálni. Okostelefon, számítógép, térfigyelő kamerák, beléptetőrendszerek, elektronikus tömegközlekedési jegyrendszer, törzsvásárlói kártyák, bankkártyás vásárlás, egészségügy, oktatás, autóvezetés, közműhasználat stb. - hacsak nem választunk teljes mértékben off-grid életmódot, egyszerűen elkerülhetetlen, hogy ne hagyjunk rögzített nyomot magunk után. Itt persze bejönnek mindenféle adatvédelmi témák is a képbe, de ezt hagyjuk meg mondjuk a téma egyik legnagyobb alakjának, Cory Doctorownak, ez a könyv nem személyes adataink védelméről és tudatos kezeléséről szól, hanem arról, hogy mi mindent lehet kezdeni vele.
Mert jól megválogatva és biztonságosan használva elég hasznos és gyakran valóban szinte sci-fibe illő dolgokat lehet kihozni belőle. A kulcsszó persze itt is a biztonság, minden éremnek két oldala van és rossz kézbe kerülő adatbázisokkal, pláne, ha nincsenek anonimizálva, elég csúnya dolgokat lehet művelni. Egyelőre viszont úgy tűnik, hogy a haszon jócskán felülmúlja a hátrányokat, alig van olyan gazdasági, társadalmi és tudományos terület, ahol nem lehetnek hasznosak az adatbányászat eredményei, legalábbis akkor persze, ha már létezik elegendő mennyiségű adat a témában.
(a kép forrása: Free Courses) |
--
Kiadó: Typotex
Kiadási év: 2015
Borító: Bíró Petra, Mózer Ágnes
ISBN: 9789632798301
Oldalszám: 214
Ár: 3500,- (borítóár) / 2625,- (Typotex webbolt)
--
Szeretnéd azonnal olvasni a legújabb bejegyzéseket? Iratkozz fel a blog feedjére, lájkold az oldalt a Facebookon, kövess a Twitteren vagy a Google+-on, és ha kíváncsi vagy, hogy mit olvasok éppen, a Molyon is figyelhetsz!
Ha tetszett a bejegyzés, oszd meg ismerőseiddel is! :)
0 hozzászólás:
Megjegyzés küldése