Машинный перевод (компьютеры и интернет)

Машинный перевод — способность компьютерных систем переводить письменно и устно тексты с одного естественного языка на другой. Идея использовать компьютер для перевода появилась в 1946 году, сразу после появления первых электронно-вычислительных машин. Первая публичная демонстрация машинного перевода (так называемый Джорджтаунский эксперимент) состоялась в 1954 году в Джорджтаунском университете (США), когда текст, который состоял из нескольких фраз на русском языке, был переведен на английский с помощью ЭВМ. Несмотря на примитивность (словарь в 150 слов, грамматика из 6 правил), Джорджтаунский эксперимент получил широкий резонанс: начались исследования в Великобритании, Болгарии, ГДР, Италии, Китае, Франции, ФРГ, Японии, СССР.
К середине 1960-х годов в США для практического использования были разработаны две системы русско-английского перевода: MARK (разработка специалистов ВВС США) и GAT (разработка Джорджтаунского университета). Однако созданная для их оценки комиссия пришла к выводу, что в силу низкого качества переведенных текстов использовать системы не имеет смысла. Хотя комиссия рекомендовала продолжать разработки, ее выводы сбили волну энтузиазма и привели к снижению финансирования, а часто и полному прекращению работ по этой тематике.
Тем не менее, в ряде стран исследования продолжались, чему способствовал прогресс вычислительной техники, появление мини- и персональных компьютеров, более сложных поисковых систем, ориентированных на работу с данными на естественных языках, электронных словарей. Росла и необходимость в переводе как таковом ввиду роста международных связей. С середины 1970-х годов возродился интерес к идее машинного перевода, а уже в 1980-х годах наступило время практического использования переводческих систем, сложился рынок коммерческих разработок по этой теме. Хотя проблему высококачественного перевода текстов широкой тематики не удалось решить, использование систем машинного перевода существенно певысило производительность труда переводчиков.
Качество перевода зависит от тематики и стиля исходного текста. Машинный перевод произвольных художественных текстов практически всегда оказывается неудовлетворительного качества. Для технических документов при наличии специализированных машинных словарей и незначительной настройке системы на особенности типа текстов возможно получение перевода приемлемого качества. Результат машинного перевода в этом случае нуждается лишь в редакторской правке. Чем более формализован стиль исходного документа, тем качественнее перевод.
Различают несколько форм организации взаимодействия ЭВМ и человека при машинном переводе: постредактирование (исходный текст перерабатывается машиной, а человек-редактор исправляет результат), предредактирование (человек приспосабливает текст к обработке машиной — устраняет неоднозначные прочтения, упрощает и размечает текст), интерредактирование (человек вмешивается в работу системы перевода в трудных случаях), смешанные формы, частично автоматизированный перевод (использование электронных словарей), системы с разделением труда (компьютер переводит только фразы жестко заданной структуры, а все не уложившееся в схему оставляет человеку). В английском языке различают термины machine translation (MT, автоматический перевод) и machine-aided или machine-assisted translation (MAT, автоматизированный перевод); если надо обозначить и то, и другое, пишут M(A)T.
Статья находится в рубриках
Яндекс.Метрика