https://frosthead.com

Hogyan lehet egy számítógépes program mindent megtudni róla, csak a Facebook kedvéért

Az esélyek az, hogy amikor úgy döntött, hogy „kedvel” egy TV-műsornak, zenekarnak, a helyi vállalkozásnak vagy a terméknek a Facebook oldalán, akkor nem gondolta, hogy ennek a kattintásnak nagy következményei lesznek. Előfordulhat, hogy egy kicsit megmutatja a barátainak az érdeklődésedet, és időnként az oldal állapotfrissítéseit jeleníti meg a hírcsatornában.

A „kedvelések” nyilvánosan elérhető bárki számára a Facebookon, még azoknak az embereknek is, akiket még nem engedélyeztek barátként. És egy , a Nemzeti Tudományos Akadémia folyóiratában ma megjelent új tanulmányhoz egy kutatói csoport létrehozott egy számítógépes programot, amely képes felvenni a felhasználó „kedveli” tulajdonságait, és pontosan óriási információs információt vonhat le róla - ideértve az életkort, az etnikumot, IQ, politikai hajlandóság, a kábítószer-fogyasztás szintje és még a szexuális orientáció.

A tanulmányhoz a kutatócsoport - a Cambridge-i Egyetem Psychometrics Lab és a Microsoft Research Cambridge közötti partnerség - 58 000 amerikai Facebook-felhasználó adatait elemezte, akik úgy döntöttek, hogy profiljukat és „kedvelik” elemzésüket a Facebook myPersonality alkalmazásán keresztül szolgáltatják elemzésre. A kutatók ezeket a „kedveket” egy algoritmusba támasztották alá, amelyet kifejezetten erre a projektre építettek, majd összehasonlították a modell előrejelzéseit a jellemzők széles skálájáról azokkal a felhasználókkal kapcsolatban, amelyeket bizonyos tudtak azokról a felhasználókról, akik Facebook-profiljaik tartalmát benyújtották elemzésre is.

A vizsgált tulajdonságpárok mindegyikéhez - mondjuk kaukázusi, afro-amerikai, demokratákhoz vagy republikánusokhoz - a kutatók pár felhasználót választottak ki, az egyes kategóriákhoz tartozva, és az algoritmusnak vakon kellett választania, hogy melyik felhasználó illeszkedik melyik kategóriába, pusztán az alapján „tetszik”. Nem volt száz százalékban tökéletes a következtetések levonására egyik kategóriából sem, ám elégtelen volt pontosan megjósolni sokat, beleértve néhány olyan tulajdonságot, amelyek valószínűleg nem feltételezik, hogy kitalálhatók az „kedvelései” alapján.

Helyesen következtetett például arra, hogy melyik felhasználó kaukázusi és afroamerikai az idő 95 százaléka, a demokraták és a republikánus idő 88 százaléka, a keresztény és a muzulmán az idő 82 százaléka. A pontosság bontása a figyelembe vett tulajdonságok sokaságának előrejelzésekor (emlékeztetőként, az 1-es érték azt jelentené, hogy a modell 100 százalékos pontossággal bír).

A modell a felhasználói tulajdonságok egy sorát jósolta pontosan pontosan. A modell a felhasználói tulajdonságok egy sorát jósolta pontosan pontosan. (Kép a PNAS / Kosinski et al. Útján)

A legtöbb felhasználó számára ez a pontossági szint nem függött olyan nyilvánvaló „kedvektől”, amelyek összekapcsolhatók a figyelembe vett tulajdonsággal. Például a homoszexuálisként azonosított felhasználók kevesebb mint 5% -a „szerette” a meleg házasságot vagy más kapcsolódó oldalakat.

Az algoritmus ehelyett rengeteg látszólag független „kedvelést” aggregált, hogy a felhasználókat osztályokba csoportosítsa, amelyek kiszámítható hasonlóságokkal rendelkeznek. A „kedveli” és a személyiségteszt eredményeivel (a myPersonality alkalmazás részét képezve is) összehasonlítva a kutatók azt találták, hogy mind a „zivatarok”, „a Colbert-jelentés, ” „Tudomány” vagy „Göndör krumpli” „kedvelő” felhasználók mind valamivel nagyobb valószínűséggel magas IQ, mint azoknak, akik nem. Hasonlóképpen azok a férfi felhasználók, akiknek „tetszett” a „Mac Cosmetics” vagy a „Wicked The Musical”, kissé nagyobb valószínűséggel voltak melegek, míg azok, akik szerettekék a „Wu-Tang klánt” vagy a „Shaq”, kissé kevésbé voltak valószínűek.

A felhasználó összes „kedvelésének” elemzése lehetővé tette az algoritmus számára, hogy általános képet alkosson róluk, de pontosságát nagymértékben befolyásolja az egyes felhasználók „kedveltségeinek” száma. Az alacsony szintű, 1–10 kedvelésűeknél a jóslatok nem voltak jobbok, mint a véletlen, de azok számára, akiknél 150–300 „kedveltek”, az algoritmus még jobb mértékben képes volt javítani a felhasználói tulajdonságok kitalálására. .

A kutatók elsősorban azt a vizsgálatot végezték, hogy megmutassák, hogy a nyilvánosan elérhető információink mennyire tudnak rólunk szólni. Lehet, hogy nem jelenteti nyilvánosan a szexuális irányultságát, politikai nézeteit, vagy hogy drogot szed, de egy ilyen program képes elemezni az „kedveltségeidet” és elég pontos kitalálásokat készíteni, függetlenül attól.

Noha a felhasználók benyújtották az „kedvelésüket” és a profiljukat elemzésre egy harmadik fél alkalmazásán keresztül, a Facebook alapértelmezett adatvédelmi beállításai azt jelentik, hogy az „kedveltségeid” bárki számára nyilvánosak. A Facebook saját algoritmusai már ezeket használják, hogy diktálják, milyen történetek végül a felhasználók hírcsatornáiban, és a hirdetők hozzáférhetnek hozzájuk, hogy meghatározzák, melyik a leghatékonyabb hirdetés a böngészés közben.

Hogyan lehet egy számítógépes program mindent megtudni róla, csak a Facebook kedvéért