Книги онлайн и без регистрации » Домашняя » Неизведанная территория. Как "большие данные" помогают раскрывать тайны прошлого и предсказывать будущее нашей культуры - Жан-Батист Мишель

Неизведанная территория. Как "большие данные" помогают раскрывать тайны прошлого и предсказывать будущее нашей культуры - Жан-Батист Мишель

Шрифт:

-
+

Интервал:

-
+

Закладка:

Сделать
1 ... 31 32 33 34 35 36 37 38 39 ... 65
Перейти на страницу:

1914 Дилан Томас

1915 Ролан Барт

1916 Чарльз Райт Миллс

1917 Индира Ганди

1918 Билли Грэм

1919 Дэниел Белл

1920 Ирвинг Хау

1921 Реймонд Уильямс

1922 Джордж Макговерн

1923 Генри Киссинджер

1924 Джимми Картер

1925 Роберт Кеннеди

1926 Фидель Кастро

1927 Габриэль Гарсия Маркес

1928 Че Гевара

1929 Мартин Лютер Кинг-мл.

1930 Жак Деррида

1931 Михаил Горбачев

1932 Сильвия Платт

1933 Сьюзан Зоннтаг

1934 Ральф Нейдер

1935 Элвис Пресли

1936 Кэрол Гиллиган

1937 Саддам Хусейн

1938 Энтони Гидденс

1939 Ли Харви Освальд

1940 Джон Леннон

1941 Боб Дилан

1942 Барбра Стрейзанд

1943 Терри Иглтон

1944 Раджив Ганди

1945 Даниэль Ортега

1946 Билл Клинтон

1947 Салман Рушди

1948 Кларенс Томас

1949 Наваз Шариф

Нам стало интересно, насколько хорошо сумеют узнать этих самых знаменитых людей прошлого, поэтому мы провели совершенно ненаучный опрос. Мы спросили об этом преподавателя истории в Гарварде, и он узнал 116 из 150. Знакомый нам студент-старшекурсник узнал 123; журналист – 103; недавний выпускник колледжа – 73; русский физик-теоретик – 58; студент-сингапурец младшего курса – 35.

И хотя люди сильно отличались по тому, чьи имена они узнавали, некоторые чемпионы, такие как чемпион 1868 года Уильям Аллен Уайт, влиятельный газетный редактор и важный деятель прогрессивного движения, или чемпион 1886 года Ван Вик Брукс (историк, лауреат Пулитцеровской премии и один из первых биографов Марка Твена), оказались не знакомыми никому. Вы еще помните, кто такой Корделл Халл? К сожалению, это имя вспомнил лишь преподаватель истории.

Тот факт, что мы узнаем не все из перечисленных имен, по-своему весьма примечателен[131]. Изучая историю в школе, мы узнаем о тысячах личностей. Однако их список отражает выбор, мнение составителя учебника о том, кто важнее. К примеру, Дикинсон пошло на пользу принятое уже после ее смерти мнение литературных критиков о том, что ее труд заслуживает признания (несмотря на то, что в годы ее жизни так почти никто не считал). Мы наделяем людей, принимающих подобные решения, огромными полномочиями – правом формировать наше видение истории. И порой мы не до конца понимаем, как велика их власть.

С другой стороны, даже беглого взгляда на этот список достаточно, чтобы понять, что он вряд ли может быть основой для рассказов нашим детям о массе исторических событий. Из 150 чемпионов лишь 12 – это женщины; подавляющее большинство – это белые мужчины. У списка есть свои собственные глубокие искажения.

Кто в этом виноват? Вовсе не создатели списка. У него есть свои недостатки, но личная предвзятость точно к ним не относится. Мы всего лишь обработали цифры. Скорее, искажение, которое мы наблюдаем, связано с коллективной ответственностью подлинных авторов списка – всех, кто когда-либо написал книгу. Это – искажение исторического плана. И на каком-то уровне оно должно отражаться не только в нашем списке, но и во всех исторических исследованиях. Историки читают книги десятками, а мы – миллионами, но мы все делаем выборки из одной и той же огромной коллекции. Никто не обладает иммунитетом против ошибки выборки. У статистики, в отличие от истории, нет своих любимчиков.

Разумеется, в утверждении, что исторические данные сильно искажены, нет ничего нового. Но вот что помогают сделать данные n-грамов, так это проводить измерения этого искажения и понемногу показывать нам, в чем мы ошибались. А если мы будем знать о том, какие искажения были у нас прежде, то, возможно, не допустим тех же ошибок вновь.

Единая теория величия

В будущем каждый получит свои пятнадцать минут славы.

– Как-там-его-звали —

Энди Уорхол как-то раз сделал остроумное наблюдение об ускользающей природе славы. Однако мы полагаем, что он ошибся с цифрами.

Давайте воспользуемся для выявления его ошибки нашим Залом славы. При ближайшем рассмотрении каждая из этих знаменитостей выглядит совершенно непохожей на остальных. Некоторые из них росли вундеркиндами. Взлет других пришелся на поздние годы. У кого-то было несколько талантов, а кто-то делал то, что удавалось ему лучше остального. У одних карьера была долгой и полной достижений, а другим удавалось создать всего один «хит». Однако в перспективе все эти различия стираются и четче проступают общие черты. В этом и состоит великая сила метода когорт Андворда.

Глядя на усредненное поведение пятидесяти самых знаменитых людей, родившихся в 1871 году (класс Корделла Халла), мы видим общие черты, позволяющие лучше нарисовать типизированный портрет класса 1871 года. То же самое можно сделать для класса 1872 года. Мы вновь видим общую форму. Примечательно, что, хотя класс 1872 года состоит из 50 совершенно разных людей, форма средней кривой славы выглядит почти одинаковой. Фактически кривая выглядит почти одинаково для каждого из 150 изученных нами классов. Она типична для стиля жизни знаменитых людей. Если бы слава была физикой, это можно было бы назвать Единой теорией величия (или другим выражением со словом «теория»).

Неизведанная территория. Как "большие данные" помогают раскрывать тайны прошлого и предсказывать будущее нашей культуры

Давайте посмотрим на это внимательно.

Сначала ничто не указывает на будущее положение дел: в течение длительного периода времени члены класса почти никогда не упоминаются в книгах. В этом нет ничего удивительного. Когда 12-летний Орвилл Райт катался на велосипеде, никто не писал книг о его фантазиях на тему того, что когда-нибудь он полетит.

Потом, через несколько десятилетий после своего рождения, члены класса дебютируют на социальной сцене. Под дебютом мы имеем в виду то, что средняя частота их упоминания начинает превышать 1 на миллиард слов, – в предыдущей главе мы уже говорили, что, начиная с такой частоты употребления, слово может претендовать на включение в словарь. С нашей точки зрения, если кто-то знаменит, то он вполне заслуживает включения своего имени в словарь.

1 ... 31 32 33 34 35 36 37 38 39 ... 65
Перейти на страницу:

Комментарии
Минимальная длина комментария - 20 знаков. В коментария нецензурная лексика и оскорбления ЗАПРЕЩЕНЫ! Уважайте себя и других!
Комментариев еще нет. Хотите быть первым?