Искусство большего. Как математика создала цивилизацию - Майкл Брукс
Шрифт:
Интервал:
Закладка:
В 2019 году население США получило более 1 триллиона аудио- и видеофайлов в формате потокового вещания с серверов, раскиданных по всему миру. Учитывая пропускную способность каналов передачи данных, формирующих интернет, это было бы невозможно, если бы передаваемые файлы не были “сжатыми”, то есть содержащими гораздо меньший объем данных, чем оригинал. А сжатие не выполнить без выборочной статистики.
Записывая музыкальную композицию, мы хотим, чтобы запись содержала всю информацию, которая необходима для воспроизведения того, что мы слышали в оригинале. Эта информация может быть записана на дорожки виниловой пластинки, в микроскопические углубления на пластике компакт-диска или закодирована нулями и единицами в цифровом файле, но она так или иначе сообщает проигрывающему музыку устройству, звуки какой частоты воспроизводить в конкретный момент и как согласовывать их уровень громкости. Даже для трехминутной поп-песни это огромный объем данных. Но оказывается, что без значительной их части можно обойтись.
В начале XIX века французский математик Жозеф Фурье показал, что непрерывный сигнал любой сложности можно воспроизвести как сумму синусоидальных колебаний различной частоты и амплитуды. Для идеального воспроизведения понадобится бесконечный набор таких колебаний, но Фурье продемонстрировал, что достаточно и конечного их числа. Результат, в котором задействуются (относительно) простая формула и комплексные числа, называется преобразованием Фурье.
Нововведение Фурье предоставило ученым совершенно новый инструмент. Чтобы представить сигнал, меняющийся со временем, теперь можно было просто пройтись по частотам его компонентов. Переход в так называемый диапазон частот позволил ученым по-новому анализировать и обрабатывать меняющиеся со временем сигналы. Эта техника заняла главенствующее положение в целом ряде областей науки, включая термодинамику, геологию и – гораздо позже – квантовую механику.
Когда мир приступил к работе с цифровой информацией, появился немного другой инструмент. Преобразование Фурье в применении к дискретным нулям и единицам, а не к непрерывной аналоговой волне, стало “дискретным преобразованием Фурье”. Эта идея легла в основу формата JPEG, предложенного Объединенной группой экспертов по фотографии (Joint Photographic Experts Group), которая в 1992 году одобрила официальный стандарт сжатия файлов цифровых изображений. Впрочем, как в 1965 году показал Джон Тьюки, дискретным преобразованием Фурье дело не ограничилось.
Тьюки родился в 1915 году и быстро проявил способности к математике[198]. Рано заметив его талант, родители в 1920-х годах обеспечили ему обучение на дому. Уже к 35 годам он стал полным профессором в Принстоне, а в 1965 году основал в университете кафедру статистики. В тот же год появилось быстрое преобразование Фурье (БПФ) – Тьюки, входивший в Научно-консультационный совет при президенте Кеннеди, предложил этот алгоритм, поняв, что нужно быстро обрабатывать сейсмологические сигналы, которые могут сообщить о советских ядерных испытаниях.
К тому времени Тьюки, которого сравнивали с “огромным медведем”, уже ввел в употребление понятие “бит”, которым обозначил бинарную единицу теории информации (о которой мы поговорим в следующей главе). Это было в 1947 году. В 1958 году он изобрел понятие “программное обеспечение”. Пожалуй, “быстрое преобразование Фурье” было все же менее запоминающимся. Но в ходе цифровой революции эта техника оказалась ничуть не менее важной.
БПФ, по сути, представляет собой ускоренный способ осуществлять дискретное преобразование Фурье для сжатия цифровых данных. Формат JPEG не нуждался в скорости БПФ. Но формату MPEG, одобренному Экспертной группой по движущимся изображениям (Moving Pictures Expert Group) в 1993 году, она была, несомненно, нужна. Аудиодорожка к движущимся изображениям содержится в MP3-файле – вы каждый день воспроизводите такие файлы при беспроводном подключении, а также подключении по Bluetooth, медному или оптоволоконному кабелю. MP4 – это совокупность аудио и видео. В этом формате оригинальный сигнал обрабатывается с помощью статистического анализа БПФ Тьюки, в результате чего размер файла с данными уменьшается, но к заметному ухудшению качества изображения или звука это не приводит. Третья итерация, MPEG-3, обеспечивает работу телевидения высокой четкости. На всякий случай эксперты MPEG уже разработали стандарт сжатия и передачи информации, содержащейся в вашем геноме (MPEG-G), и полностью иммерсивного 360-градусного видео виртуальной реальности (MPEG-I). Да, вклад статистики не всегда очевиден, но она делает жизнь в XXI веке необычайной, успешно доставляя развлекательные материалы, образовательные ресурсы, важнейшие для бизнеса данные и даже персонализированные услуги здравоохранения в любую точку земного шара – ровно туда, где в них возникает потребность.
Нам осталось упомянуть лишь об одном человеке, и этот человек – образец скромности. Жозеф Фурье остался сиротой в нежном возрасте девяти лет и впоследствии открыл парниковый эффект, оказался за решеткой во время Великой французской революции и посетил не один континент как научный советник Наполеона Бонапарта. Джон Тьюки, как мы видели, был вундеркиндом, который успел послужить президенту Кеннеди и сыграл решающую роль в холодной войне. Я не могу сказать вам ничего из ряда вон выходящего об Ингрид Добеши (если не считать того, что в 1994 году она стала первой женщиной – полным профессором математики в Принстоне, но это, пожалуй, больше говорит о Принстоне, чем о ней самой). Добеши родилась в Бельгии и работает в Университете Дьюка в Дареме (штат Северная Каролина). Имея огромный талант к математике, она подарила нам статистический инструмент, который лег в основу базы данных отпечатков пальцев ФБР, множества медицинских технологий, спасающих жизни, и аппаратов, регулярно выявляющих столкновения черных дыр примерно в миллиарде световых лет от нас. Впрочем, она бы, пожалуй, не оценила, если бы это наделало шуму.
Рассказывая о Добеши, акцент обычно делают на том, как ей нравится работать в саду. Возможно, это объясняется тем, что большинству из нас просто не под силу оценить сложную математику ее изобретения. Тем не менее мы можем хотя бы взглянуть на колебания, называемые вейвлетами (от англ. wavelet – небольшая волна).
Вейвлеты позволяют нам математически представить всплеск – очень короткий изолированный сигнал, напоминающий пик на кардиомониторе. Это гораздо сложнее, чем кажется. Когда мы воссоздаем сигналы в качестве суммы синусоидальных колебаний, у них почти всегда оказывается “длинный хвост”, потому что резкая остановка сигнала возможна только при использовании чрезвычайно высокочастотных синусоидальных волн. Это сильно нас ограничивает, поскольку к сигналу добавляется огромный объем данных – часто даже больше, чем содержится в оригинале.
Вейвлеты Добеши – альтернатива системе преобразований Фурье. Они занимают пространство с бесконечным числом измерений (это не так сложно, как кажется; для их применения нужно просто обратиться к силе бесконечных рядов, с которыми мы встречались в главе о математическом анализе). Добеши нашла способ создавать начальный, или материнский, сигнал, у которого вообще нет хвоста: такой сигнал сводится к нулю на очень малом расстоянии от