Что за рыбка в вашем ухе? - Дэвид Беллос
Шрифт:
Интервал:
Закладка:
Я неоднократно пытался указать на иллюзорный характер идеального FAHQT даже в отношении механического определения синтаксической структуры заданного предложения на языке оригинала… В английском — как, думаю, и в любом другом естественном языке — есть совсем простые предложения, которые в определенном лингвистическом контексте были бы… однозначно переведены на другой язык любым, кто в достаточной степени владеет этими двумя языками, но я не знаю такой программы, которая позволила бы машине найти этот однозначный перевод, если не включить в нее совершенно произвольную, зависящую от ситуации процедуру…{143}
Это заявление практически положило конец щедрому притоку грантов от различных фондов. Однако создание в 1957 году Европейского союза дало новый политический стимул — и новый источник финансирования — для разработки инструментов, создание которых Бар-Хиллел считал невозможным. Планка была несколько снижена: речь шла уже не о FAHQT, а о более реальных задачах. По мере увеличения мощности и уменьшения размеров компьютеров все проще становилось переложить на них обременительные для людей задания — например, проверку того, одинаково ли переведены термины на всем протяжении длинного документа. Компьютеры можно было использовать для составления и хранения не просто терминологических словарей, но и собраний переводов целых фраз и выражений. Началась эра не полностью автоматизированного перевода, а перевода с помощью компьютерных программ — так называемого CAT-инструментария (computer-aided translation[144]). Частные компании занялись разработкой собственных систем, потому что, хотя самый большой спрос был со стороны международных организаций, таких как ЕС, CAT-инструментарий требовался и крупным производителям самолетов, автомобилей и других товаров, продающихся в разных странах.
С помощью CAT легче достичь хороших результатов, если на вход подаются тексты, написанные не на естественном живом языке, а на его ограниченном подмножестве. В руководстве по эксплуатации самолетов встречается лишь скромная часть всех английских выражений. Чтобы с помощью программы автоматического перевода изготовить версии этого руководства на сотне разных языках, эта программа не должна уметь переводить еще и ресторанные меню, тексты песен или светскую болтовню — достаточно ограничиться языком инструкций по эксплуатации самолетов. Один из способов достижения хороших результатов — предварительно отредактировать входной текст, сведя его к некоторым стандартным шаблонам, которые может обрабатывать компьютерная программа, а затем отредактировать перевод силами квалифицированных переводчиков, чтобы обеспечить осмысленность текста (с сохранением исходного смысла) на языке перевода. Другой вариант: обучить составителей руководств специальному ограниченному языку — так сказать, боинглишу — специально рассчитанному на устранение неоднозначности и подводных камней в инструкциях по эксплуатации самолетов. Именно эта практика получила всемирное распространение. В большинстве компаний, вышедших на международные рынки, выработан собственный стиль, призванный облегчить машинный перевод их материалов. От компьютеров, помогающих людям переводить, мы перешли на следующую ступень — к людям, помогающим переводить компьютерам. Это одна из особенностей переводов, которая показывает, что язык — вовсе не конструктор. Языки всегда можно ограничить и настроить так, чтобы они удовлетворяли потребности людей, даже если это означает втиснуть их в рамки текстов, пригодных для компьютерной обработки.
Человеческий перевод с помощью компьютеров и компьютерный перевод с помощью людей — это существенные достижения, без которых международные потоки товаров и информации последних десятилетий были бы далеко не так хорошо организованы. До недавнего времени они входили в арсенал лишь ограниченного круга профессиональных переводчиков. Одновременно, конечно, формировалось огромное количество переводных продуктов (переводов, сопоставленных своим оригиналам) в электронной форме. Изобретение и взрывной рост интернета с начала 1990-х сделал весь этот корпус текстов бесплатно доступным для каждого, у кого есть подключенный к интернету компьютер. И тут на арену вышел Гугл.
Используя программное обеспечение на базе математических моделей, исходно разработанных в 1980-х сотрудниками IBM, Гугл создал инструмент машинного перевода, отличный от всех остальных. В его основе не лежат интеллектуальные посылки Уивера, он не имеет отношения к интерлингве или инвариантным ядрам. Он вообще не работает со значениями. Google Translate (GT) не рассматривает высказывание как нечто подлежащее расшифровке, он просто предполагает, что такое уже говорилось ранее. С помощью огромных вычислительных мощностей он в мгновение ока перетряхивает интернет в поисках аналогичного выражения в корпусе параллельных текстов. Ему доступны все публикации ЕС с 1957 года на двух дюжинах языков, все, что ООН и ее подразделения когда-либо издавали на своих шести официальных языках, и несметное количество других материалов, включая протоколы международных трибуналов и отчеты компаний, а также статьи и книги в виде параллельных текстов, которые размещались в интернете библиотеками, продавцами книг, авторами, научными организациями и частными лицами. Опираясь на уже установленные в рамках миллионов параллельных текстов соответствия, GT с помощью статистических методов выбирает наиболее правдоподобные версии переводов из числа имеющихся. Чаще всего это срабатывает. Это совершенно удивительно. И именно достижения GT породили новую волну оптимизма в отношении FAHQT — голубой мечты Уивера.
GT не мог бы работать без очень большого корпуса уже существующих переводов. В его основе лежат миллионы часов труда переводчиков, создавших тексты, которые GT теперь просматривает. В рекламном ролике Гугла об этом ни слова. В настоящее время Гугл предлагает двусторонний перевод между пятьюдесятью восемью языками, то есть 3306 отдельных сервисов перевода — больше, чем когда-либо существовало за всю историю человечества. Бо́льшая часть этих языковых направлений — с исландского на фарси, с идиша на вьетнамский и десятки других — новшества, порожденные GT. Между этими языками переводов раньше не было, поэтому ни в интернете, ни еще где-либо нет соответствующих параллельных текстов. В презентации переводческих услуг Гугла отмечено, что, поскольку количество доступных для просмотра переводов с одного языка на другой существенно различается для разных пар, качество переводов в разных парах тоже разное{144}. А вот то, что GT в такой же степени узник международных потоков переводов, как и все мы, там не упоминается. Его восхитительно искусная вероятностная компьютерная система может предложить 3306 направлений перевода только за счет привлечения средства, которое всегда применялось в международных коммуникациях: языка-посредника или промежуточного языка. И английский служит основным языком-посредником вовсе не потому, что штаб-квартира корпорации Google расположена в Калифорнии. Если вы используете статистические методы для установления наиболее вероятного соответствия между языками, перевод между которыми никогда не делался, вам нужен язык-посредник, у которого есть соответствия и с языком оригинала, и с языком перевода.