Tweetek a világ minden tájáról, hely szerint ábrázolva egy új tanulmány részeként. Kattints a kinagyításhoz. Kép az első hétfőn keresztül / Leetaru et. al.
Nehéz felmérni, hogy a Twitter milyen gyorsan és alaposan átvette a világot. Alig hét évvel ezelőtt, 2006-ban, ez egy ötlet volt, amelyet egy papírlapra vázoltak fel. A szolgáltatást jelenleg körülbelül 554 millió felhasználó használja - ez a szám a bolygó összes emberének közel 8% -át teszi ki -, és becslések szerint 170 milliárd tweetet küldtek, ez a szám napi 58 millióval növekszik. .
Ezek a tweet felbecsülhetetlen hírforrást, szórakozást, beszélgetést és kapcsolatot teremtenek az emberek között. De a tudósok számára ők is értékesek, mint valami meglehetősen különféle: nyers adatok.
Mivel a Twitter tartalmaz egy nyitott API-t (amely lehetővé teszi a tweetek nyers, elemezhető adatokként történő letöltését), és sok tweetet földrajzi címkével látnak el, a kutatók ezeknek a tweetteknek milliárdjait felhasználhatják, és helyük szerint elemezhetik, hogy többet megtudhassanak az emberek földrajzi földrajzáról. Tavaly ősszel a globális Twitter Heartbeat részeként egy illinoisi egyetemi csapat elemezte az USA-ból származó több mint egymilliárd tweet nyelvét és helyét, hogy kifinomult térképeket készítsen olyan dolgokról, mint például a Sandy hurrikán alatt kifejezett pozitív és negatív érzelmek, vagy Barack támogatása. Obama vagy Mitt Romney az elnökválasztás során.
Amint Joshua Keating megjegyezte a Külpolitika Ötletek Háborúja blogban, ugyanazon csoport tagjai, Kalev Leetaru vezetésével, a közelmúltban egy lépéssel tovább mentek. Amint azt a héten korábban egy új tanulmányban közzétették az Első Hétfő online folyóiratban, elemezték a 46 672 798 tweet helyét és nyelveit, amelyeket a tavaly október 23. és november 30. között küldtek el, hogy elképesztő képet készítsenek az emberi tevékenységről a bolygó körül, a az üzenet tetején. Kihasználták a Twitter decahose-t, egy olyan adatfolyamot, amely az adott időben az egész világon megjelenő tweetek véletlenszerű 10% -át rögzíti (amely egy adott időszakban összesen 1 535 929 521 típust tett ki), és egyszerűen a kapcsolódó földrajzi adatokkal rendelkező tweetre összpontosítottak.
Mint a kutatók megjegyzik, a tweet földrajzi sűrűsége sok régióban - különösen a nyugati világban, ahol a számítógépeket, a mobil eszközöket és a Twitter-t mind csúcsidőn használják - szorosan megegyezik az elektrifikáció és a világítás használatának mértékével. Ennek eredményeként a tweetek térképei (például az Egyesült Államok kontinentális részletnézete, alább) sokkal hasonlítanak az éjszakai művilágítás műholdas képeire.
Kattints a kinagyításhoz. Kép az első hétfőn keresztül / Leetaru et. al.
Kísérletként annak megállapítására, hogy a tweet mennyiben felel meg a mesterséges fény használatának, elkészítették az alábbiakban látható összetett térképet, amelyben a tweet vörös pontokkal, az éjszakai megvilágítás pedig kék színű. Azokat a területeket, ahol a frekvencia megegyezik (és ténylegesen eltörlik egymást), fehérekkel jelöljük, és azok a területek, ahol az egyik nagyobb, mint a másik, piros vagy kék színben maradnak. Számos terület végül elég fehéresnek tűnik, néhány kulcsfontosságú kivételtől eltekintve: Irán és Kína, ahol a Twitter használatát tiltják, észrevehetően kék színű, míg sok országban, ahol viszonylag alacsony a villamosítási ráta (de ahol a Twitter még mindig népszerű), piros színűnek tűnik.
Kattints a kinagyításhoz. Kép az első hétfőn keresztül / Leetaru et. al.
A projekt még érdekesebbé vált, amikor a kutatók automatizált rendszert használtak a tweet nyelvek szerinti bontására. A Twitter leggyakoribb nyelve az angol, amely az összes tweet 38, 25 százalékában van jelen. Ezt követően a japán (11, 84%), a spanyol (11, 37%), az indonéz (8, 84%), a norvég (7, 74%) és a portugál (5, 58%).
A csoport az alábbiak szerint elkészítette a 26 legnépszerűbb nyelvű tweet térképét, mindegyik különböző színű volt:
Kattints a kinagyításhoz. Kép az első hétfőn keresztül / Leetaru et. al.
Noha a legtöbb ország tweetjeiben a hivatalos nyelvek dominálnak, sokan kiderül, hogy tweetteket tartalmaznak más más nyelveken is. Figyelj elég alaposan, és látni fogja, hogy finoman felbukkan a szivárvány a szürke pontokból (angol tweet), amelyek takarják az Egyesült Államokat:
Kattints a kinagyításhoz. Kép az első hétfőn keresztül / Leetaru et. al.
A többi elemzés mellett a kutatócsoport még az retweettelés és a referenciák földrajzát is megvizsgálta - egy átlagos távolságot a felhasználó és valaki között, akit retweettel, valamint az átlagos távolságot a felhasználó és valaki között, akit egyszerűen egy tweetben utal. Egy retweet távolsága átlagosan 1115 mérföld és referenciaként 1, 118 volt. Ellenkezőleg: pozitív kapcsolat mutatkozott egy adott felhasználó retweetelésének vagy egy másik felhasználóra való hivatkozásának hányada és távolsága között: Összességében csak néhány maroknyi interakcióval rendelkező felhasználók párja valószínűleg közelebb áll egymáshoz (500- 600 mérföld távolságra egymástól), mint azok, amelyek tucatnyi retweettel és hivatkozással vannak közöttük.
Ez azt jelzi, hogy a távol egymástól élő felhasználók nagyobb valószínűséggel használják a Twitter rendszeres kapcsolattartást. Ennek egyik magyarázata lehet, hogy a legtöbb követővel - tehát a legtöbb hivatkozással és retweetelő elemmel - gyakran hírességek, szervezetek vagy vállalatok vannak, olyan felhasználók, akiket az emberek ismernek, de akikkel valójában nincs személyes kapcsolatuk. Az alábbiakban látható a felhasználók közötti retweet globális térképe:
Kattints a kinagyításhoz. Kép az első hétfőn keresztül / Leetaru et. al.
A cikk még részletesebben áttekintette a tweetekkel kapcsolatos egyéb adatokat: a mainstream hírközlés és az ország tweetjeinek száma aránya (Európában és az USA-ban aránytalanul nagy a médiában való megjelenés, míg Latin-Amerikában és Indonéziában figyelmen kívül hagyják), a Twitter helyeken hozzáadta a közelmúltban a legtöbb felhasználót (Közel-Kelet és Spanyolország), valamint azokat a helyeket, ahol a felhasználók átlagosan a legközelebb vannak (Dél-Amerika és a Nyugati part).
Néhány figyelmeztetés van ezen adatokra vonatkozóan. Egyrészt, bár a tweetek elemzett száma tízmillióban van, az összes küldött tweetnek mindössze 0, 3% -a, tehát nem feltétlenül képviselik megfelelően az összes Twitter-mintázatot, különösen, ha a földrajzi címkézést lehetővé tevő felhasználók másként viselkednek, mint mások. Ezenkívül a Twitter gyorsan változó világában egyes tendenciák már jelentősen megváltozhatnak a múlt ősz óta. Ahogy a Twitter tovább növekszik, és minél több adat válik elérhetővé, indokolt, hogy az ilyen elemzések csak a demográfusok, számítógépes tudósok és más kutatók körében válnak népszerűbbé.