Az adat lesz a gazdasági szféra új nyersanyaga

A Big Data jelenség alatt különböző információs rendszerekben nagy menynyiségben felhalmozódó adatokat és ezeknek az adatoknak a rendszerezését, strukturálást értjük. A Big Data alapvetően az információfeldolgozás automatizálásával egyidős: bár a vállalatok korábban is számviteli adatok, analitikák, felmérések alapján hozták meg stratégiai döntéseiket, ma már nemcsak statisztikák és projekciók állnak a rendelkezésünkre, hanem percre pontos, minden egyéni felhasználóra lebontható strukturált és strukturálatlan adatcsomagok. (Például internetes keresések adatai, hitelkártya használata során keletkező adatok, vagy akár közösségi portálokon megosztott információ például arról, hogy valaki beült a kedvenc kávézójába). Korunk nagy kihívása és kiaknázandó lehetősége, hogyan használjuk fel ezeket az adatokat. 

Korunk Gutenberg-forradalma

A történelem során (a barlangrajzoktól kezdve az ékíráson át a könyvnyomtatásig) újból és újból felmerült a kérdés, hogy egy társadalom hogyan kezelje a felhalmozott információkat. A maga idejében Big Data strukturálásnak számított a törvények lejegyzése (Hammurabi) vagy az automatizált könyvnyomtatás is (Gutenberg-jelenség). Ezek a forradalmi újítások új iparágazatokat hoztak létre, miközben katalizálták a meglévőket: az oktatást, a tudományt, a gazdaságot és a politikát is. Azonban a 21. századra a lépték, a minőség és a felhasználási lehetőségek megsokszorozódtak, így a tudományos nyilvánosság még nagyobb katalizáló hatást vár a Big Datától. Azonban a Big Data nem jelent azonnali és feltétlen áttörést, az adatokat be kell szerezni, tárolni kell, fel kell dolgozni, amihez technológiára és szakemberekre van szükség. A Big Data rendszerek is csak annyira jók, mint az alkotóik, ezért a megfelelő szakértőknek és szoftvereknek óriási versenyben egyre telítettebb piaca alakul ki. 

Survey teleszkóp pedig minden ötödik nap ekkora mennyiségű adatot szolgáltat! Az amerikai Walmart több mint egymillió vásárlói tranzakciót bonyolít le minden órában, ezzel hihetetlen, több mint 2,5 petabytenyi információt termel, amely egyenlő az amerikai Kongresszusi Könyvtár teljes könyvállományának 167-szeresével. Az emberi test teljes génállományának a feltérképezése annak idején 10 évet vett igénybe, 2003-ban már egy hét alatt lehetséges volt. Mindezek a példák azt mutatják, hogy a digitális környezetben a világból nyerhető mérhetetlen sok információt egyre könnyebben kezeljük. Ennek köszönhetően sok olyan dolgot tehetünk meg, amely korábban elképzelhetetlen volt: betegséget vagy éppen bűncselekményeket tudunk megelőzni, üzleti trendeket tudunk azonosítani stb. Ha jól kezeljük az adatokat, akkor a segítségükkel gazdasági értékek új forrásait tárhatjuk fel, tudományos áttöréseket érhetünk el. 

Az adatból sosem elég?

„Ha nem járunk el kellő óvatossággal, akkor többet fogunk tudni a 20. század kezdetéről, mint amennyit a 21. század hasonló éveiről” − nyilatkozta a The Economistnak Adam Farquhar, a British Library digitális megőrzésért felelős munkatársa. A gyors technológiai fejlődés ellenére a begyűjtött adatok menynyisége már meghaladja a rendelkezésre álló tárhelyek kapacitását. Hasonló probléma, hogy „...az általunk megalkotott digitális objektumok közül sokat csak az a szoftver képes értelmezni, amelyik létrehozta őket” – háborgo Vint Cerf, az internet egyik úttörője, jelenleg a Google munkatársa. Tehát nemcsak a nyers információt, hanem az információt feldolgozó programokat is archiválni kell. A technikai problémák mellett még komolyabb jogi korlátok akadályozzák az adatgyűjtést. A könyvtárak számára jogszabályok engedélyhez kötik bizonyos tartalmak tárolását, és egyszerűen nincs kapacitás ezeket az engedélyeket bekérni. Másik oldalról a felhasználók nagyon könnyen lemondanak a személyes adataik védelméről egyetlen szolgáltatásért cserébe, amivel a jogalkotókat két tűz közé szorítják.

A Big Data jövője

Joe Hellerstein, a berkeley-i University of California számítástechnika tudósa szerint ma „az adatok ipari forradalmát éljük”. Ez a hatás mindenhol érezhető, az üzleti élettől a tudományos életig, az államigazgatástól a művészetekig. A tudósok és a mérnökinformatikusok e jelenség elnevezésére alkották meg közösen a Big Data elnevezést. Az adatkezelés területe – amely segíti a különböző szervezeteket, hogy kihámozzák és kezeljék saját növekvő adatbázisukat – gyors ütemben növekszik. Az elmúlt évek során az Oracle, az IBM a Microsoft és az SAP összesen több mint 15 milliárd dollárt költött olyan szoftvercégek megvásárlására, amelyek adatmenedzsmenttel és adatelemzéssel foglalkoznak. Becslések szerint 2025-re 4,4 millió, kizárólag adatkezeléssel foglalkozó informatikusra lesz szükség világszerte, és ebből 1,9 millió informatikusi állás Amerikában lesz. Az iparág a becslések szerint több, mint 100 milliárd dollárt ér, és évi 10%-os növekedést mutat; nagyjából kétszer olyan gyorsan fejlődik, mint a szoftverágazat egésze.