https://frosthead.com

Nagy adat vagy túl sok információ?

Mindannyian tudjuk, hogy sokkal több információ van a világunkban, mint régen. Ami azt illeti, hogy mennyivel több, nos, többségünk elég tudatlan.

kapcsolodo tartalom

  • Infographics az idők folyamán emelje ki a tudomány vizuális szépségét
  • Miért nem tudja a Google influenza trendjeit követni az influenza (mégis)

Íme egy felbecsülhetetlen rögtön az összes információval kapcsolatban, Dave Turek, az IBM szuperszámítógép fejlesztéséért felelős srác bókjai: A 2003-tól kezdve és az emberiség története kezdetéig az IBM számításai szerint öt exabitát generáltunk - azaz öt milliárd gigabájt információ. Tavaly már két napig nagy mennyiségű adatot használtunk ki. Jövőre, előrejelzi Turek, 10 percenként csináljuk .

De hogyan lehetséges ez? Hogyan váltak az adatok ilyen digitális kudzuksá? Egyszerűen fogalmazva: minden alkalommal, amikor a mobiltelefonja elküldi a GPS-helyét, minden alkalommal, amikor online vásárol valamit, minden alkalommal, amikor a Facebook tetszik gombjára kattint, újabb digitális üzenetet helyez egy üvegbe. És most az óceánok nagyjából le vannak borítva velük.

És ez csak a történet része. Szöveges üzenetek, vásárlói nyilvántartások, ATM-tranzakciók, biztonsági kamerák képei… a lista folytatódik. A szó leírása „Big Data” szó, bár ez aligha igazolja az általunk létrehozott szörny méretét.

Ez a technológia legújabb példája, amely felmutatja felhasználási képességünket. Ebben az esetben még nem kezdtük el felzárkózni az információgyűjtési képességünkkel, ezért manapság a vezetés egyik legkedveltebb csapata az, hogy a jövő olyan vállalatok és kormányok tulajdonában van, amelyek értelmezni tudják az általuk használt összes adatot gyűjtés, lehetőleg valós időben.

Azoknak a vállalkozásoknak, amelyek értelmezik minden digitális zsákmányt, amelyet ügyfeleik hátrahagynak, előnyt élveznek a gondolkodásmód - nem csak az, aki az utóbbi órában mit vásárolt, hanem az is, hogy tweeteltek-e róla vagy fényképet tettek közzé valahol a közösségi hálózatok örvényében. Ugyanez vonatkozik a városokra, amelyek adatokat gyűjthetnek az érzékelők ezreitől, amelyek most a városi tájakat pontozzák, és tudományos feladattá változtatják a városi élet zavargásait, például a forgalom áramlását.

Nem meglepő, hogy a politikai kampányok már belevetették magukat dühösen az adatok bányászatába, a „nanocélzó” szavazók középpontjában állva, hogy pontosan tudják, hogyan kell őket szavazatuk és pénzük alapján rangsorolni. A következtetések között az elemzők arra a következtetésre jutottak, hogy a New York Times kollégája, Thomas Edsall szerint az, hogy a republikánusok inkább a „The Office” és a Cracker Barrel éttermeket részesítik előnyben, míg a demokraták nagyobb valószínűséggel nézik a „Late Night With David Letterman” -t és ennek Chuck E-nál. Sajt.

A digitális flotsam értelmezésének rohama magyarázza, hogy a Google múlt héten bejelentette, hogy elkezdi eladni egy olyan termékét, amelyet BigQuery-nek hív, és olyan szoftver, amely másodpercek alatt képes beolvasni a terabyte információt. És miért egy olyan Splunk nevű induló vállalkozás, amely olyan technológiával rendelkezik, amely hatalmas mennyiségű ügyfél- és tranzakciós adatot képes elemezni, részvényeinek értéke majdnem 90 százalékig emelkedett a múlt hónapban nyilvánosságra hozatal napján. Ez egy olyan társaság számára, amely tavaly 11 millió dollárt veszített el.

Az adattudós felemelkedése

De még a legjobb adatmegfejlesztő eszközökhöz való hozzáférés sem garantálja a nagy bölcsességét. Nagyon kevés cég rendelkezik olyan alkalmazottakkal, akik képzettségükben nemcsak az adatok hegységének kiértékelésére vonatkoznak - beleértve a több millió Facebook oldalból és okostelefonokból származó strukturálatlan apróságok adatait -, hanem az is, hogy valójában tegyenek valamit vele.

Tavaly a McKinsey Global Insitute jelentést adott ki, amelyben a „Big Data” -ot „az innováció következő határának” írja le, ugyanakkor azt jósolja, hogy 2018-ig az Egyesült Államokban a vállalkozások komoly tehetséghiányt mutatnak a szükséges elemzői készségekkel kapcsolatban - annyi 190 000 ember. Azt állítja, hogy további 1, 5 millió vezetőt kell felkészíteni stratégiai döntések meghozatalára az adatok özönlenek.

De nem mindenki hisz a Big Data varázslatában. Peter Fader, a Penn Wharton Business School marketing professzora, nem biztos abban, hogy több adat jobb. Nem azt gondolja, hogy egy vállalatnak nem szabad megpróbálnia minél többet megtudni ügyfeleiről. Csak annyira nagy hangsúlyt fektetnek az egyes adatok összesítésére, hogy szerinte a kötet valódi elemzés helyett értékelendő.

Itt áll Fader a MIT Technology Review egyik nemrégiben készített interjújából : „Még a múltbeli viselkedés végtelen ismerete mellett sem lesz elég információnk ahhoz, hogy értelmes előrejelzéseket készítsünk a jövőről. Valójában, minél több adat van, annál nagyobb hamis bizalommal bírunk ... A lényeg az, hogy megértsük, mi a határaink, és a lehető legjobb tudományt használjuk a hiányosságok kitöltésére. A világ összes adata soha nem fogja elérni ezt a célt számunkra. ”

Ki az Ön adata?

Itt található egy mintavétel arról, hogy a nagy adatok hogyan használják a nagy problémák megoldását:

  • Tudják, mikor voltak rossz vagy jók: Noha a legtöbb vállalat az ügyfelek elemzésére összpontosít, addig az Amazon pontokat gyűjt a Big Data segítségével az övékkel.
  • A csapok vizsgálata: Szeretné tudni, hogy melyik bika szül a legtermékenyebb tejelő teheneknek? A tejipar kidolgozott egy módszert a számok összetörésére.
  • Adatok szerinti diagnosztizálás: A SUNY Buffalo kutatói tömeges adatkészletet elemeznek annak érdekében, hogy meghatározzák, van-e kapcsolat a sclerosis multiplex és a környezeti tényezők között, például hogy nincs-e elegendő napfény.
  • Problémákat keres: A Recorded Future nevű vállalat bányászik a közösségi hálózatoktól, valamint a kormányoktól és a pénzügyi helyzetektől, hogy előrejelzéseket készítsen arról, hogy a népesség növekedése, vízhiány és szélsőséges időjárási viszonyok vezethetnek a jövőbeli politikai nyugtalanságokhoz és terrorizmushoz.

Videó bónusz: Az adatok rögzítése egy dolog. A vonzónak és érthetőnek tűnés egy másik kihívás. David McCandless emellett az „információs térképek” erejéről szól a TED beszélgetésében.

Nagy adat vagy túl sok információ?