Неизведанная территория. Как "большие данные" помогают раскрывать тайны прошлого и предсказывать будущее нашей культуры - Жан-Батист Мишель
Шрифт:
Интервал:
Закладка:
1914 Дилан Томас
1915 Ролан Барт
1916 Чарльз Райт Миллс
1917 Индира Ганди
1918 Билли Грэм
1919 Дэниел Белл
1920 Ирвинг Хау
1921 Реймонд Уильямс
1922 Джордж Макговерн
1923 Генри Киссинджер
1924 Джимми Картер
1925 Роберт Кеннеди
1926 Фидель Кастро
1927 Габриэль Гарсия Маркес
1928 Че Гевара
1929 Мартин Лютер Кинг-мл.
1930 Жак Деррида
1931 Михаил Горбачев
1932 Сильвия Платт
1933 Сьюзан Зоннтаг
1934 Ральф Нейдер
1935 Элвис Пресли
1936 Кэрол Гиллиган
1937 Саддам Хусейн
1938 Энтони Гидденс
1939 Ли Харви Освальд
1940 Джон Леннон
1941 Боб Дилан
1942 Барбра Стрейзанд
1943 Терри Иглтон
1944 Раджив Ганди
1945 Даниэль Ортега
1946 Билл Клинтон
1947 Салман Рушди
1948 Кларенс Томас
1949 Наваз Шариф
Нам стало интересно, насколько хорошо сумеют узнать этих самых знаменитых людей прошлого, поэтому мы провели совершенно ненаучный опрос. Мы спросили об этом преподавателя истории в Гарварде, и он узнал 116 из 150. Знакомый нам студент-старшекурсник узнал 123; журналист – 103; недавний выпускник колледжа – 73; русский физик-теоретик – 58; студент-сингапурец младшего курса – 35.
И хотя люди сильно отличались по тому, чьи имена они узнавали, некоторые чемпионы, такие как чемпион 1868 года Уильям Аллен Уайт, влиятельный газетный редактор и важный деятель прогрессивного движения, или чемпион 1886 года Ван Вик Брукс (историк, лауреат Пулитцеровской премии и один из первых биографов Марка Твена), оказались не знакомыми никому. Вы еще помните, кто такой Корделл Халл? К сожалению, это имя вспомнил лишь преподаватель истории.
Тот факт, что мы узнаем не все из перечисленных имен, по-своему весьма примечателен[131]. Изучая историю в школе, мы узнаем о тысячах личностей. Однако их список отражает выбор, мнение составителя учебника о том, кто важнее. К примеру, Дикинсон пошло на пользу принятое уже после ее смерти мнение литературных критиков о том, что ее труд заслуживает признания (несмотря на то, что в годы ее жизни так почти никто не считал). Мы наделяем людей, принимающих подобные решения, огромными полномочиями – правом формировать наше видение истории. И порой мы не до конца понимаем, как велика их власть.
С другой стороны, даже беглого взгляда на этот список достаточно, чтобы понять, что он вряд ли может быть основой для рассказов нашим детям о массе исторических событий. Из 150 чемпионов лишь 12 – это женщины; подавляющее большинство – это белые мужчины. У списка есть свои собственные глубокие искажения.
Кто в этом виноват? Вовсе не создатели списка. У него есть свои недостатки, но личная предвзятость точно к ним не относится. Мы всего лишь обработали цифры. Скорее, искажение, которое мы наблюдаем, связано с коллективной ответственностью подлинных авторов списка – всех, кто когда-либо написал книгу. Это – искажение исторического плана. И на каком-то уровне оно должно отражаться не только в нашем списке, но и во всех исторических исследованиях. Историки читают книги десятками, а мы – миллионами, но мы все делаем выборки из одной и той же огромной коллекции. Никто не обладает иммунитетом против ошибки выборки. У статистики, в отличие от истории, нет своих любимчиков.
Разумеется, в утверждении, что исторические данные сильно искажены, нет ничего нового. Но вот что помогают сделать данные n-грамов, так это проводить измерения этого искажения и понемногу показывать нам, в чем мы ошибались. А если мы будем знать о том, какие искажения были у нас прежде, то, возможно, не допустим тех же ошибок вновь.
В будущем каждый получит свои пятнадцать минут славы.
Энди Уорхол как-то раз сделал остроумное наблюдение об ускользающей природе славы. Однако мы полагаем, что он ошибся с цифрами.
Давайте воспользуемся для выявления его ошибки нашим Залом славы. При ближайшем рассмотрении каждая из этих знаменитостей выглядит совершенно непохожей на остальных. Некоторые из них росли вундеркиндами. Взлет других пришелся на поздние годы. У кого-то было несколько талантов, а кто-то делал то, что удавалось ему лучше остального. У одних карьера была долгой и полной достижений, а другим удавалось создать всего один «хит». Однако в перспективе все эти различия стираются и четче проступают общие черты. В этом и состоит великая сила метода когорт Андворда.
Глядя на усредненное поведение пятидесяти самых знаменитых людей, родившихся в 1871 году (класс Корделла Халла), мы видим общие черты, позволяющие лучше нарисовать типизированный портрет класса 1871 года. То же самое можно сделать для класса 1872 года. Мы вновь видим общую форму. Примечательно, что, хотя класс 1872 года состоит из 50 совершенно разных людей, форма средней кривой славы выглядит почти одинаковой. Фактически кривая выглядит почти одинаково для каждого из 150 изученных нами классов. Она типична для стиля жизни знаменитых людей. Если бы слава была физикой, это можно было бы назвать Единой теорией величия (или другим выражением со словом «теория»).
Давайте посмотрим на это внимательно.
Сначала ничто не указывает на будущее положение дел: в течение длительного периода времени члены класса почти никогда не упоминаются в книгах. В этом нет ничего удивительного. Когда 12-летний Орвилл Райт катался на велосипеде, никто не писал книг о его фантазиях на тему того, что когда-нибудь он полетит.
Потом, через несколько десятилетий после своего рождения, члены класса дебютируют на социальной сцене. Под дебютом мы имеем в виду то, что средняя частота их упоминания начинает превышать 1 на миллиард слов, – в предыдущей главе мы уже говорили, что, начиная с такой частоты употребления, слово может претендовать на включение в словарь. С нашей точки зрения, если кто-то знаменит, то он вполне заслуживает включения своего имени в словарь.