A legtöbb főiskolai szintű irodalmi kurzuson olyan hallgatók találhatók, akik az irodalmi klasszikusok kis részeit boncolják: Shakespeare-monológok, Joyce-tudat-áramlás és Hemingway staccato-mondatai. Nem kétséges, hogy ennyi mindent meg lehet tanulni az íróról, kézműveiről és a történet jelentéséről az ilyen típusú közeli olvasás során.
Ben Blatt azonban erőteljes érvelést ad egy másik megközelítéshez. Bizonyos mondatokra és bekezdésekre összpontosítva új könyvében, Nabokov kedvenc szava, a mályva szerepel, az olvasók elhanyagolják az összes többi szót, amelyek egy átlagos hosszúságú regényben több tízezer adatpontot jelentenek.
Az újságíró és a statisztikus a 20. századi klasszikusok és bestsellerek összetételéből létrehozta a szöveg adatbázisát, hogy mennyiségileg megválaszolja számos érdekes kérdést. Elemzése feltárta néhány furcsa mintát, amelyek egyébként észrevétlenül maradhatnak:
A számok szerint a regényekhez legjobban nyitó mondatok általában rövidek. James Patterson ígéretes szerzője átlagosan 160 klisé fordul elő 100 000 szónál (ez 115-szer több, mint a tisztelt Jane Austennél), és Vladimir Nabokov 44-szer gyakrabban használta a mályva szót, mint az elmúlt két évszázad átlaga.
A Smithsonian.com Blatt-nal beszélt a módszeréről, néhány legfontosabb megállapításáról és arról, hogy miért fontosak a nagy adatok az irodalom tanulmányozásához.
Statisztikai megközelítést alkalmazott minden tanulmányozásához, a hol a Waldo- tól a Seinfeld-ig, a gyorsétterem egyesületektől a pop dalokig. Meg tudja magyarázni módszerét, és miért csinálja, amit csinál?
Adat újságíró vagyok, és a popkultúrában és a művészetben vizsgálom a dolgokat. Nagyon szeretek olyan mennyiségi és elfogulatlan szempontokat nézni, amelyek rengeteg információt tartalmaznak, amelyeket az emberek még nem mentek át. Hasznos lenne, ha meg szeretné tudni, hogy mi az az Egyesült Államokbeli tipikus ember, de nem csak beszélne egy emberrel, mindent tudjon róluk, majd feltételezze, hogy az Egyesült Államokban minden az azonos. Úgy gondolom, hogy az ilyen jellegű eltévedés írásával egy dolog az, hogy a szerző egyetlen mondatára összpontosíthat, különösen a kreatív írás osztályokban, vagy egy szakaszra, és elveszíti a nagyobb képet, hogy megnézze ezeket az általános mintákat és trendeket, amelyeket az írók használnak újra és újra, több száz, talán több ezer alkalommal a saját írásukban.
Nabokov kedvenc szava szürkés: A számok mit mutatnak a klasszikusokról, a bestsellerekről és a saját írásunkról
megveszTehát mi késztette az irodalomhoz fordulni?
A matematika és a számítógépes ismeretek háttere van, de mindig is szerettem az olvasást és az írást. Ahogy egyre inkább írtam, nagyon érdeklődtem, hogy a különböző írók és emberek hogyan adnak tanácsot írásra. Nagyon soknak van értelme, de úgy tűnt, hogy nem támasztja alá információ, és sok olyan, amely ellentmondásban áll egymással. Arra gondoltam, hogy módot kell találni ezeknek a témáknak az írásbeli átvételére, hogy az emberek már tudatában voltak és beszéltek róla, és teszteljék őket nagyszerû és népszerû írókra, hogy megnézzék, valóban ez a tanács, vagy ha előíró jellegû tanácsok - Valójában semmit sem jelent a valós könyvekben és a valódi oldalakon.
Mi volt az első kérdés, amelyet az irodalmi klasszikusokkal és a bestsellerekkel kapcsolatban akart feltenni?
A könyv első fejezete arról szól, hogy kell-e használni vagyon határozószókat használni. Ez az első fejezet, amelyet időrendben írtam. Ez elsősorban Stephen King tanácsát szolgálja, hogy ne használjon –ne csak határozószókat az Írás című könyvében, amely sok író számára az írás az írás. De sok más író - Toni Morrison, Chuck Palahniuk - és minden kreatív írásosztály azt tanácsolja, hogy ne használjunk egy –az határozószót, mert felesleges szó és jele annak, hogy nem tömör. Ahelyett, hogy mondana: „Gyorsan futott”, mondhatja: „Sprinted”.
Szóval tudni akartam, valóban ez igaz? Ha ez ilyen jó tanács, akkor számíthat arra, hogy a nagy szerzők valójában kevesebbet használnak fel. Arra számíthat, hogy az amatőr írók többet használnak, mint a közzétett szerzők. Csak stilisztikailag szerettem volna tudni, először, hogy Stephen King saját tanácsát követte-e, majd pedig az összes többi nagyszerű és tisztelt szerzőre vonatkozik-e.
Szóval, mit találtál?
Valójában van egy tendencia, hogy a szerzők, mint például Hemingway, Morrison és Steinbeck, a legjobb könyveik - azok, amelyeket feltartanak, és amelyekre most a legnagyobb figyelmet fordítják - azok a könyvek, amelyekben a legkevesebb az –az határozószó. Ha összehasonlítjuk az amatőr fantasztikus és az online írást, amely nem volt szerkesztve a bestsellerekkel és a Pulitzer-díjjal a legutóbbi időkben, akkor ellentmondás van, ahol a közzétett szerzők kevésbé adverb szavakat használnak. Nem vagyok annyira egyoldalú, hogy azt hiszem, ki tudja venni a rendben lévő könyvből a –ver szavakat és ez egy nagyszerű könyv lesz. Nyilvánvalóan nem így működik. De van valami az a tény, hogy az írók, akik nagyon közvetlen módon írnak, olyan könyveket készítenek, amelyek összességében a leghosszabb ideig élnek.
Hogyan kezdte az irodalmi művek adatbázisának létrehozását?
Sok kérdésnél ugyanazt az 50 szerzőt használtam, amelyeket kissé önkényesen választottam. Alapvetően a bestsellerek listájának tetején álló szerzőkre, a minden idők legnagyobb listáján szereplő szerzőkre, valamint a különböző műfajok és idők széles skáláját képviselő szerzőkre, valamint az olvasókra támaszkodtak. Így a könyv egészében összehasonlíthatja ezeket a szerzőket, és megismerheti őket.
Nagyon fontos volt számomra, hogy ha valami olyat mondok: „Toni Morrison ezt a szót használja ilyen gyakorisággal”, minden egyes regényről beszélek, amelyet valaha írt, és nem csak a háromról, amiket már történt. A könyvemben 50–100 szerző van, akikre az egész hivatkozik. Megtaláltam bibliográfiáikat, majd az összes regényüket, amelyeket addig írtak, teljes nyilvántartásukként. Bizonyos értelemben kicsit olyan, mint a sportstatisztikák vezetése, ahol minden könyv olyan, mint egy évszak, majd az összes ilyen évszak vagy könyv karrierként összejön. Láthatja, hogyan változnak a szerzők az idő múlásával, és hogyan csinálják a dolgokat. Ha az összes könyvet elkészítette, akkor ezekre a kérdésekre, amelyek bizonyos szempontból nagyon félelmesek, válaszolni nagyon egyszerű.
És hogyan dolgozta fel az egész szöveget?
Van egy programozási nyelv, amelynek neve Python, és ezen belül egy eszközkészlet, a természetes nyelv eszközkészletének neve, gyakran NLTK rövidítve. Az abban részt vevő eszközök bárki számára szabadon elérhetők. Töltse le a csomagot online, és Python vagy más nyelveken is felhasználhatja. Különösen nem kaphat sok írásbeli kérdést, de elmondhatja, hányszor jelenik meg ez a szó a szövegben? Megvizsgálhatja, hogy a mondatok hol érnek véget, hol kezdődnek a mondatok, és a beszéd része - melléknév vs melléknév vs ige. Tehát miután rendelkezett ezekkel az eszközökkel, megkaphatja az adatokat.
Milyen statisztikákat állított össze manuálisan? Mi volt a leg unalmasabb?
Van egy szakasz, ahol a mondatokat nyitom. Elmore Leonard, aki egy nagyon sikeres regényíró volt, azt mondta: „Soha ne nyisson meg egy könyvet az időjárással.” Ez a tanács a sok írási útmutatóban található. Tehát több száz szerzőn átmentem, hogy megnézzem, milyen gyakran nyitják meg könyveiket az időjárási viszonyokról. Például Danielle Steel, azt hiszem, hogy a könyvekben szereplő első mondatok 45 százaléka az időjárásra vonatkozik. Sokszor csak „Csodálatos nap volt” vagy „Világos és napos volt” dolgok. Ezért nem volt mód arra, hogy automatikusan megtegyük valamilyen hiba nélkül, ezért átnéztem az összes könyvfájlt, és megjelöltem, van-e időjárás. Azt mondhatja, hogy unalmas, mert rengeteg adat gyűjtött, de nagyon szórakoztató volt áttekinteni és több száz nyitó mondatot elolvasni egyszerre. Vannak más minták is, amelyek egyértelműen megjelennek a szerzők által az idő múlásával.
Mint mondod, unalmas az egyesek számára, mások számára szórakoztató. Néhányan azt gondolhatják, hogy ez az analitikus megközelítés unalmas, de azt állítják, hogy „mulatságos” és „gyakran egyenesen vicces” lehet. Mi volt a legviccesebb megállapítás?
A könyv címe, Nabokov kedvenc szava, mályva, arról szól, hogy a számok szerint mi a legjobban használt szó az angolhoz képest. Ennek sok értelme van, ha megnézzük a hátterét, mert ő szintetizált. Az önéletrajzában arról beszélt, hogy mikor különféle betűket és hangokat hallott, az agya automatikusan megidézte a színeket.
Megismételtem ezt a kísérletet 100 másik szerzőn, hogy megnézzem, mi a kedvenc szó. Ennek eredményeként három olyan szót kapsz, amelyek az általuk legjobban használt szavakkal reprezentálják írásukat. Ötletség, képzelet és meggondolatlanság. Ez Jane Austen. Azt hiszem, ha látta ezeket a szavakat, Jane Austen lehet az egyik első találgatásod. És akkor van egy olyan szerző, mint John Updike, aki egy kicsit szemcsés és valóságos, és más időből áll. Kedvenc szavai a keretek, szúrók és szar. Szerintem nagyon érdekes látni a személyiséget ezen egyszerű matematikai kérdések alapján. Ha van kedvenc szerzője, akkor annak áttekintése valami olyat derít fel személyiségükről, amelyet korábban nem észrevett.
Ray Bradbury azt írta, hogy kedvenc szava a fahéj. A számok alapján sokat használ. Annak magyarázata, hogy miért szereti a fahéjat, az volt, hogy ez emlékeztette őt a nagyanyja kamrájára. Szóval átmentem és találtam más fűszeres szavakat és szagos szavakat, amelyek összekapcsolhatók a nagymama kamrájával, és Ray Bradbury ezeknek a szavaknak a nagy részét nagyon magas arányban használja. Bizonyos értelemben megismerheti ezt a furcsa, freudiai képet a szerzők gyermekkortól. Ha Ray Bradbury nem mondta volna, talán még mindig kitalálhatja.
Összehasonlította az amerikai és a brit írókat, megerősítve egy sztereotípiát, miszerint az amerikaiak hangosak. Meg tudja magyarázni ezt?
Ez valójában eredetileg egy Stanfordi végzős hallgató tanulmányán alapult. Ő azonosította azokat a szavakat, amelyeket a párbeszéd leírására használnak a könyvekben, és hangos, semleges vagy csendes szavakat írta le. A suttogva és a suttogás csendes lenne. Semleges lenne: "azt mondta" vagy "asszony mondta", és hangos lenne: "felkiáltott" vagy "kiabált". Átmentem az 50 megtekintett szerzőn, valamint a rajongói fantasztikák nagy mintáin, és úgy találtam, hogy nem egy őrült margóval, de értelmes margóval, hogy az amerikaiaknak magasabb a hangos szavak és a csendes szavak aránya. Van néhány magyarázat. Lehet, hogy így beszélnek az amerikaiak egész életük alatt, így írók írják le őket, hogy gyakran beszélnek. Láthatta azt is, hogy az amerikai írók inkább cselekvésen alapuló, thriller, magas tempójú történeteket részesítenek előnyben a finomabbhoz képest. Az amerikaiak valóban hangosabbak a számok szerint.
Ben Blatt, Nabokov kedvenc szójának írója Máva (Sierra Katow)Miért gondolod, miért jó módszer az irodalom tanulmányozására a matematika alkalmazása az írásban?
Határozottan nem támogatom, hogy ez legyen az első módszer az irodalom tanulmányozására, ha az írás javítása érdekében próbálkozik. De még egy közepes hosszúságú regény valószínűleg 50 000 szó, és ez 50 000 adatpont. Csak nem lesz képes egyszerre áztatni, és olyan kérdések merülnek fel, amelyekre önmagában nem tud válaszolni. Jó látni a nagyobb képet. Ha leülsz és tanulmányozsz egy bekezdést, akkor a kreatív írás osztályában beszélsz a professzorral, ha erre van mód, akkor ezt csak látni fogod mindent. De az adatokkal ez megszabadítja Öntől, és ezekre torzítások nélkül válaszolhat néhány kérdésre, és valóban új információt szerezhet.
Megemlítette, hogy gondolkodott tovább Roald Dahl „A nagy grammatőr” című művével.
Van egy nagyszerű Roald Dahl-történet, ahol alapvetően egy mérnök dolgozik egy történet írásának módszerével. Ebben a végső nap forgatókönyvében valaki csak adhat egy cselekményt a gépnek, és ez szétcsúsztat egy utolsó regényt. Az a megfontolás, hogy olyan formulákat és alapvető regényeket készítenek. A történet főszereplője úgy dönt, hogy nem csatlakozik a gép üzemeltetéséhez, és saját írásának és művészetének megteremtésével harcol vele szemben.
Minden bizonnyal azt hiszem, hogy ez a könyv, ha írunk, sok kérdésre megválaszolja az ön kérdését, és határozottan megváltoztatja az egyes dolgokra gondolkodásmódját, ám végül valójában nem helyettesítik az ötleteket, amelyek az embereket gondolkodásra késztetik, és az a jelenet, amely az embereket félelmetes vagy csatlakozni a karakterekhez. Ez a könyv az írás kézművesét szemlélteti, és nem feltétlenül azt, hogyan lehet egy emlékezetes történetet létrehozni. Ez a könyv nem próbál tökéletes regényt megtervezni, és nem hiszem, hogy olyan közel állunk ehhez, mint néhány ember félhet.