Ru
Переводчики в кабинке во время выступления Председателя КНР Ху Цзиньтао на саммите Азиатско-Тихоокеанского экономического сотрудничества в Сингапуре в 2009 году.
Технологии
9 0 158

Наступила ли эра искусственного перевода речи?

Когда-то предмет научной фантастики, сейчас технологии, позволяющие общаться на разных языках, уже с нами. Но насколько они эффективны? Когда машинный перевод станет повсеместно распространенным, владение языком все равно будет огромным преимуществом.

Окружающий шум, рассказывает мне Алекс Вайбель, – одна из основных проблем, с которой приходится сталкиваться при синхронном переводе речи. Устройство может распознавать речь в лаборатории или комнате для совещаний, но ему будет трудно это делать при фоновом шуме, который, как я слышу, окружает профессора Вайбеля, общающегося со мной из Киото. Я изо всех сил пытаюсь понять его английский в прерывающейся связи, которая напоминает мне, что мы на расстоянии около 10,000 км друг от друга, и это расстояние все еще является препятствием для общения, даже если вы говорите на одном языке. Мы еще не достигли будущего.

Если бы мы уже достигли его, то Вайбель мог бы говорить на родном немецком, а я мог слышать его слова на английском. Он также смог бы легко общаться с окружающими его японцами.

В Технологическом институте Карлсруэ, где он работает профессором компьютерных наук, Вайбель с коллегами уже дают лекции на немецком языке, а студенты могут читать их на английском при помощи электронного переводчика. Система генерирует текст, который студенты видят на экранах своих ноутбуков или телефонов. Помогает процессу то, что лекторы говорят четко, нет фоновых разговоров, и каждый год повторяется один и тот же материал.

Идея искусственного перевода речи существует уже давно. Вайбель, который работает на аналогичной должности в Университете Карнеги-Меллона Питтсбурга, "лично придумал ее. Я предложил эту идею Массачусетскому технологическому институту (MIT) в 1978 году. Дуглас Адамс тоже ее придумал примерно в то же время. В серии романов The Hitchhiker’s Guide to the Galaxy ("Автостопом по галактике") упоминалась форма жизни, называемая вавилонской рыбкой, которую помещали в ухо, и она позволяла слушателю понять любой язык во вселенной. Это стало одним из тех устройств, о которых мечтали интересующиеся технологиями задолго до того, как они появились в нашей жизни, будь то портативные речевые коммуникаторы или плоские телевизоры, которые можно повесить на стене. Вещь, которая должна существовать, однажды, несомненно, будет существовать.

Первая система речевого перевода Вайбеля, собранная в 1991 году, имела словарный запас в 500 слов, запускалась на больших компьютерах и ей требовалось несколько минут, чтобы обработать то, что она услышала. "Она не была готова к работе в prime-time", – признает он. Сейчас начали появляться устройства, которые выглядят как прототип вавилонской рыбки. Google встроил функцию перевода в свои наушники Pixel, используя Google Translate, который также способен делать голосовой перевод через приложение для смартфона. В Skype есть функция "Переводчик", работающая на 10 языках. Ряд небольших компаний, таких как Waverly Labs, бруклинский стартап, разработали переводчик для наушников. Из обзора новостей из мира технологий можно сделать вывод, что дела обстоят неплохо.

Системы перевода, доступные в настоящее время, служат подтверждением этому утверждению, но на данном этапе они кажутся лишь интересными новинками, а не шагом к тому, что Вайбель называет "созданием прозрачной языковой среды в обществе".

"Мы находимся на ранней стадии развития устройств с поддержкой голосовой связи, – говорит Барак Туровский, директор по продукции Google Translate, – но сегмент растет очень быстро".

В прошлом месяце Google представил режим интерпретатора для своих домашних устройств. Фраза "Ok, Google, будь моим переводчиком на французский" активирует устный перевод и перевод текста на умных дисплеях. Google предлагает регистрацию в отеле как практическую возможность применения – что, возможно, является очевидным примером альтернативы говорению на английском языке для путешественников.

Вы можете воспользоваться этой возможностью уже сейчас, если у вас есть приложение "Translate" на телефоне. Очень популярное применение этих возможностей – в романтических делах. Журналы данных показывают популярность таких фраз, как "Я люблю тебя" и "У тебя красивые глаза".

Waverly Labs использовала функцию chat-up как приманку в поиске финансирования на Indiegogo. На видео, в котором основатель и генеральный директор компании Эндрю Очоа рассказывает, как он придумал идею этого переводчика, когда встретил француженку во время отпуска, но не смог с ней нормально общаться. Попытка использовать приложение для перевода была провальной. Видео показывает, как могло бы все быть: он дарит француженке наушники, и они идут выпить кофе и осмотреть достопримечательности. Инвестиционная презентация было впечатляюще успешной, в ее результате компания привлекла $4,4 миллиона (£ 3,4 миллиона) – в 30 раз больше запрашиваемой суммы.

По отзыву одного из клиентов, наушники компании Pilot позволили ему впервые поговорить с матерью своей девушки. Некоторые даже рассказывают, что это позволило им говорить со своими супругами. "Время от времени нам приходят письма на почту, и кто-то рассказывает, что использует наш продукт, чтобы поговорить со своей испаноязычной женой", – говорит Очоа. "Это озадачивает меня, ведь как они вообще познакомились!" Можно предположить, что это было через Интернет и агентство. Очоа признает, что "технологию требуется еще немного доработать, чтобы можно было бы действительность найти свою любовь благодаря наушникам, но это уже не за горами".

Многие используют наушники Pilot в совершенно не романтических целях, приобретая их для использования в офисе. Waverly сейчас готовит новую модель для профессиональных приложений, с повышенной эффективностью распознавания речи, точности перевода и его быстроты. "Профессионалы менее склонны к терпению в разговоре", – отмечает Очоа.

Новая версия наушников также будут улучшены с точки зрения гигиеничности дизайна, чтобы преодолеть наименее привлекательную особенность Pilot. Для разговора наушники должны быть у обоих. "Мы обнаружили, что есть проблема в совместном использовании одних наушников с незнакомцем", – говорит Очоа. Проблема была бы решена, если бы они стали достаточно распространенными. То, насколько быстро это произойдет, вероятно, будет зависеть от распространенности голосовых устройств и искусственного перевода в целом.

"Если вы посмотрите на регионы, где наблюдается интенсивный рост использования интернета, например азиатские страны, большинство людей там вообще не знают английского", – говорит Туровский. "Поэтому в этом отношении преодоление языковых барьеров является важной задачей для всех – и, очевидно, для Google. Вот почему Google вкладывает так много ресурсов в системы перевода".

Вайбель также подчеркивает значение Азии, отмечая, что синхронный перевод получил большое распространение в Японии и Китае. Впрочем, предстоит еще долгий путь. Перевод должен быть синхронным, как голос переводчика, общающегося по телевизору с иностранным политиком, а не как речевые блоки, которые заставляют говорящих делать паузы после каждых нескольких предложений и ждать окончания перевода. Он должен работать автономно, в ситуациях, когда доступа в Интернет не имеется, а также для решения проблем, связанных с объемом личных речевых данных, которые накапливаются в облаке и отправляются на серверы для обработки.

Вайбель полагает, что системы должны не только справляться с такими физическими помехами, как шум, но и должны быть социально развиты – знать манеры и правильно обращаться с людьми. Когда я впервые написал ему по электронной почте, то допустил ошибку в формальном обращении и назвал его "Дорогой профессор Вайбель", при этом зная, что он является немецким профессором и что континентальные европейские традиции требуют особого уважения к его академическому статусу, я. Как я и ожидал, он ответил в на международном английском: "Привет, Марек".

"Обученные" этикету устройства синхронного перевода могут избавить людей от необходимости знать различные культурные нормы. Они будут способствовать взаимодействию, уменьшая понимание контекста. В то же время они могут помочь сохранить местные традиции и обычаи, препятствуя распространение привычек, связанных с использованием международного английского, таких как его фамильярность.

Однако профессора и другие специалисты области не планируют передавать знания о языке программному обеспечению. Если технология превращается в непрерывный, вездесущий синхронный перевод речи – короче говоря, вавилонскую рыбку – это фактически повысит ценность языковых навыков. Автоматический перевод будет использоваться для передачи информации, которая помогает людям покупать вещи или находить дорогу. Поможет ли он людям вести полноценную семейную жизнь или романтические отношения, остается под вопросом – хотя одна примечательная особенность состоит в том, что он может помочь преодолеть языковые барьеры, которые часто возникают между поколениями после миграции – дети не понимают своих дедушек и бабушек.

Тем не менее, где бы он ни применялся, он никогда не станет таким же хорошим, как живая речь. Даже если технология преобразования голоса смогут имитировать голос говорящего, движения его губ не будут совпадать с переводом, и это будет выглядеть как дублирование в фильме.

Этот контраст подчеркивает ценность владения общим языком и ценность их изучения. Усилия по изучению языка какого-либо человека являются признаком ответственности и, следовательно, того, что этому человеку можно доверять. Общение на одном языке также способствует развитию чувства принадлежности и общности, как это можно наблюдать среди международных ученых, которые используют английский как язык общения, а их предшественники использовали латынь. Иммигранты-владельцы магазинов, которые изучают язык своих клиентов, не просто облегчают процесс продаж; они демонстрируют, что они хотят стать ближе к обществу своих клиентов, и адекватно отстаивают свое место в нем.

Когда машинный перевод становится повсеместно распространенным продуктом, владение языком будет являться огромным преимуществом. Человек, у которого в голове язык, всегда будет иметь преимущество в сравнении с тем, кто полагается на устройство, точно так же, как человек, хорошо считающий в уме, имеет преимущество перед тем, который должен достать для этого калькулятор. Хотя практическая потребность в lingua franca уменьшится, социальная ценность общения на одном языке будет сохраняться. И программное обеспечение никогда не заменит тонкого, но жизненно важного понимания, которое приходит со знанием языка. Это знание всегда будет необходимо, чтобы уловить нюансы в шуме.