Неизведанная территория. Как "большие данные" помогают раскрывать тайны прошлого и предсказывать будущее нашей культуры - Жан-Батист Мишель
Шрифт:
Интервал:
Закладка:
Эмоциональный заряд идей Лоуэлла произвел впечатление не только в научных кругах. Эти идеи, популярно изложенные в трех книгах, захватили весь мир. Тут же появились и другие новости. Один наблюдатель даже обнаружил в переплетенной сетке каналов, описанной Лоуэллом, трехбуквенное имя Бога на иврите (йгщ). К 1898 году Герберт Уэллс уже написал «Войну миров» [191]. Задолго до того, как на открытиях Лоуэлла осела пыль, марсиане захватили Землю – или, по крайней мере, наше воображение.
Научный энтузиазм по отношению к идеям Лоуэлла стих к 1910-м годам, когда для наблюдений стали использоваться более качественные телескопы. Тем не менее период полураспада идеи (особенно столь увлекательной) достаточно долог, и утверждения Лоуэлла, а также его карты ирригационной системы долго сохраняли свое влияние. Когда НАСА отправило первые непилотируемые аппараты для того, чтобы сделать изображения Красной планеты, глобус Марса, использовавшийся для планирования миссии, сопровождался детальными аннотациями и отметками, взятыми из работ Лоуэлла[192]. В 1964 году, когда аппараты «Маринер» пробились через глубины космоса к конечной точке своего путешествия, энтузиазм относительно жизни на Марсе достиг новых высот[193].
Изображения, присланные аппаратом «Маринер-4» при первом облете планеты, принесли немало разочарований. На планете не было каналов. Не было там и имени Бога. Никаких очевидных признаков разумной жизни. Ни одной из указанных Лоуэллом линий. Все, что было видно на фотографиях, – это масса обезвоженной красной почвы, на которой возвышались редкие кратеры.
Великая сила нового «скопа» состоит в том, что он может отправить нас в неизведанные миры. Однако его великая опасность состоит в том, что, увлекшись, мы склонны быстро переходить от того, что видим, к тому, что хотим увидеть. Даже самые серьезные данные уступают под натиском интерпретатора. Марсиане не прибыли к нам с Марса – они возникли благодаря воображению человека по имени Персиваль Лоуэлл.
Через всевозможные «скопы» мы смотрим на самих себя. Каждая новая линза представляет собой и новое зеркало.
В книге пророка Самуила рассказывается, как царь Давид задался вопросом: сколько людей находится под его властью? Он распорядился провести перепись. Через девять месяцев он узнал результат – 1,3 миллиона боеспособных воинов[194]. Однако подсчеты Давида разгневали Господа, и тот наслал на его землю чуму.
На протяжении тысяч лет люди, так или иначе напоминавшие Давида, пытались дать количественную оценку различным аспектам жизни общества. И это время от времени оказывалось крайне рискованным предприятием.
В этой книге мы показали, как цифровые исторические записи позволяют совершенно по-новому оценить наш коллективный опыт. В наши дни мы не просто считаем овец или головы. Мы способны произвести тщательные замеры важнейших аспектов нашей истории, языка и культуры. Простые графики, продемонстрированные нами, представляют собой верхушку огромного айсберга. В грядущие десятилетия личные, цифровые и исторические данные полностью изменят наше представление о себе и об окружающем нас мире. И перед тем как попрощаться с вами, мы бы хотели поделиться своими соображениями относительно того, что происходит или что будет происходить в будущем с точки зрения науки, обучения и нового зарождающегося общества.
А затем мы зададимся, хотя и ненадолго, последним вопросом: хорошо ли все это? Окажутся ли большие данные очередной землей обетованной? Не приведут ли наши сегодняшние решения к бедствиям в будущем?
Данные n-грамов, о которых мы вам рассказывали, взяты из миллионов книг. По современным стандартам это действительно большие данные. Но пройдет много лет, и мы станем иначе оценивать происходящее сейчас. В конце концов, пара миллионов книг – это всего лишь крошечный кусочек нашего обширнейшего культурного наследия.
Вспомним хотя бы Эдгара Аллана По[195]. В отличие от многих писателей прежних эпох, По стремился обеспечивать себя исключительно писательским трудом. Однако при отсутствии международного закона об авторских правах это была не самая простая задача для писателя XIX века. Из финансовых соображений По публиковал свои произведения везде, где только мог, и во множестве жанров. Он писал стихи, рассказы, книги, пьесы, новеллы, обзоры, газетные статьи, эссе и письма. Он даже сфабриковал историю о путешествии на воздушном шаре через Атлантику и смог опубликовать ее на первой полосе нью-йоркской газеты Sun.
Когда мы думаем о будущем исторических записей и о том, что с ними станет, если их оцифровать, произведения По заставляют нас сразу же задаться массой вопросов. Какие части его наследия были оцифрованы в первую очередь? Как они оказались в цифровом мире? И что делать со всем остальным? Эти вопросы будут направлять наш короткий, но извилистый путь по историческим записям, имеющимся в настоящее время.
Книги. Поначалу наш Ngram Viewer черпал информацию из 4% всех когда-либо опубликованных книг, или примерно одной из каждых двадцати пяти. В 2012 году мы помогли Юрию Лину, Славу Петрову и другим работникам Google обновить версию Ngram Viewer[196] и включить в базу около 6% всех книг, или одну из каждых семнадцати. Разумеется, мы использовали лишь книги, предоставленные Google. Если же включить все тридцать миллионов оцифрованных на данный момент книг, то мы получим немногим более 20% от общего количества[197]. Что же ждет остальные 80%? Когда они смогут попасть в цифровые архивы?