Курсовая с практикой Иностранные языки Переводоведение

Курсовая с практикой на тему Машинный перевод : функциональные особенности и перспективы

  • Оформление работы
  • Список литературы по ГОСТу
  • Соответствие методическим рекомендациям
  • И еще 16 требований ГОСТа,
    которые мы проверили
Нажимая на кнопку, я даю согласие
на обработку персональных данных
Фрагмент работы для ознакомления
 

Содержание:

 

СОДЕРЖАНИЕ
ВВЕДЕНИЕ. 3
Глава 1. Машинный перевод. 6
1.1 История, основные
проблемы и задачи машинного перевода. 6
1.2 Особенности
машинного перевода. 11
1.3 Системы машинного
перевода как один из переводческих ресурсов. 14
1.4 Области
применения машинного перевода. 19
Глава 2. Анализ специфики англо-русского машинного перевода
текстов различной направленности. 22
2.1 Специфика
англо-русского перевода научно-технических текстов, специальных и
общественно-политических текстов. 22
2.2 Сравнительный
анализ англо-русских машинных переводов научно-технических, специальных и
общественно-политических текстов с использованием систем PROMT, SYSTRAN, Yandex-переводчик, Google-Translate. 29
ЗАКЛЮЧЕНИЕ. 38
СПИСОК ИСПОЛЬЗОВАННЫХ ИСТОЧНИКОВ. 41

  

Введение:

 

Сегодня, в период глобализации и
стремительного развития науки и техники, наблюдается острая потребность в
оперативном переводе больших объемов научно-технической и
общественно-политической информации. Следовательно, приобретают актуальность
исследования приемов перевода указанного типа информации с учетом возможностей
машинного перевода, который призван экономить время, требуемое для
осуществления перевода. При этом увеличение скорости осуществления перевода не
должно снижать его качество. Так, например, в случае технического текста должны
выполняться все критерии, применяемые к переводу научно-технической литературы,
включая сохранение смысла, структуры и стиля переводимого документа, строгое
соблюдение терминологии, ясное и логичное изложение информации, однозначность и
конкретность трактовки фактов, и т.д.

В связи с высказанным переводчикам
необходимы современные инструменты, способные ускорить и облегчить работу с
текстом.

Современное состояние проблемы. Изучению
принципов осуществления машинного перевода посвящено множество исследований.
Среди них можно отметить диссертацию П. Н. Хроменкова «Анализ и оценка
эффективности современных систем машинного перевода» [24], А.А. Хорошилова
«Теоретические основы и методы построения систем
фразеологического машинного перевода» [23], Кан Д. А. Применение теории
компьютерной семантики русского языка и статистических методов к построению
системы машинного перевода [10] и др.

Однако, как показывает обзор работ по этой
теме, в поле исследовательского интереса не попадало комплексное исследование
англо-русских машинных переводов научно-технических, специальных и
общественно-политических текстов с использованием систем PROMT, SYSTRAN, Yandex-переводчик, Google-Translate.

Цель исследования заключается в том, чтобы
на примере наиболее популярных систем машинного перевода (вывод о популярности
той или иной системы сделан на основе упоминаемости в профессиональных
форумах), а именно, PROMT,
SYSTRAN,
Google Translate, Yandex-переводчик определить основные
особенности англо-русского машинного перевода и сравнительную эффективность
указанных систем при переводе научно-технических, специальных и
общественно-политических текстов

Для достижения указанной цели исследования
были поставлены и решены следующие задачи:

1. Рассмотреть историю возникновения,
теоретические основы функционирования и классификацию.

2. Выделить основные особенности машинного
перевода.

3. Провести сравнительно-сопоставительный
анализ машинных переводов текстов различной направленности (а именно,
научно-технических, специальных и общественно-политических текстов) с
английского на русский язык, осуществленных с использованием четырех выбранных
систем машинного перевода.

4. Сделать выводы о специфике
англо-русского машинного перевода научно-технических, специальных и
общественно-политических текстов.

5. 
Сделать выводы об эффективности каждой из указанных систем для перевода
рассматриваемых типов текстов.

Объектом исследования являются системы
машинного перевода.

Предметом исследования являются
особенности и эффективность систем англо-русского машинного перевода
применительно к текстам научно-технической и общественно-политический
направленности.

В исследовании был применена комплексная
методика, включающая переводческий анализ; морфологически-синтаксический анализ
позволил подобрать адекватные соответствия английским грамматическим явлениям в
русском языке с учетом особенностей технического текста; качественный и
количественный анализ переводческих ошибок автоматизированных систем.

Материалом для анализа и выборки примеров
в данной работе послужил насыщенный техническими терминами оригинальный текст о
развитии космонавтики «USA SPATIAL: LAUNCHES INTO FUTURE» из американского
журнала «Space-X», а также ежегодный доклад Банко Сантандер. Теоретической базой для настоящего
исследования послужили научные работы таких авторов, как Е. Н. Базалина, Л. С.
Бархударов, А. Б. Бушев, Н. В. Владимов, Н. Н. Гавриленко, Е. Ю. Горбунов, Д.
Ю. Груздев, А. В. Жидков, Д. А. Кан, У. А. Крылова, Е. А. Лайков, Т. Р.
Левицкая, И. А. Малышева, Е. В. Мезина, А. А. Стрельцов и др.

Практическая значимость данной работы
определяется тем, что материалы, представленные в ней, могут быть использованы
в профессиональной деятельности переводчиков, а частности указание на самые
распространённые ошибки систем машинного перевода поможет переводчикам
сократить время на редактирование текста, переведенного при помощи
программ-переводчиков. Структура работы. Настоящая работа состоит
из введения, двух глав, заключения и списка использованных источников.

Не хочешь рисковать и сдавать то, что уже сдавалось?!
Закажи оригинальную работу - это недорого!

Заключение:

 

В период глобализации общества в
информационной практике сформировалась очевидная проблема увеличения спроса на
перевод технической информации. Ответом на социальный запрос преодоления
языкового барьера было образование в промышленно развитых странах индустрии
машинного перевода.

В основе подхода к решению проблематики
машинного перевода должна лежать определенная классификация систем МП. На
участие в процессе перевода и объема работы системы МП делятся на
автоматизированные и автоматические. В автоматизированных системах МП человек
является обязательным участником процесса перевода, в то время как в
автоматических системах машина осуществляет анализ текста оригинала и синтез
текста перевода, и сама делает перевод, который может быть использован в виде
информационного документа, который в некоторой мере может заменить оригинал. В
соответствии с количеством языков, которые «понимает» система, различают
двуязычные и многоязычные системы. В зависимости от подхода, на основе которого
выполняется машинный перевод, СМП делятся на статистические (statistic) и
традиционные системы, основанные на использовании лингвистических правил
(rule-based). В соответствии с лингвистического критерия СМП делятся на
системы, реализующие прямой перевод (direct translation); системы, которые
базируются на трансфере (transfer approach); системы с языком-посредником
(interlingua approach).

Системы прямого перевода строятся на
использовании больших словарей и сравнительно простых алгоритмов
морфологического и синтаксического анализа текста оригинала и синтеза
текста-перевода. Идея трансфера — внедрение в систему блока преобразования
структуры исходного текста в соответствии с правилами и нормами языка перевода.
Главная идея систем с языком-посредником — анализ содержания текста и его
представления на специальном языке, который не зависит от каких-либо
естественных языков.

Коммуникативный подход к анализу
адекватности машинного перевода позволил прийти к следующим выводам.
Функционально-прагматическая адекватность машинного перевода является
переменной категорией и может быть представлена тремя типами:

— жанрово-тематическая адекватность, когда
от перевода требуется просто получение знаний о жанре текста-оригинала и его
тематику;

— адекватность информативности, где
доминантой перевода является общий смысл сообщения, представленного в
тексте-оригинале;

— семантико-синтаксическая адекватность,
когда от перевода требуется полная и точная передача смыслового содержания.

Качество перевода PROMT, SYSTRAN, Yandex-переводчика и Google-Translate примерно одинаково, все
СМП не смогли выполнять переводы со стопроцентным уровнем жанрово-тематической
адекватности технической литературы. По адекватности информативности, наш
анализ ошибок показал, что при переводе программы-переводчики искажают смысл
оригинала на 65 процентов и полученный перевод не удовлетворяет в полной мере
требования реципиента в получении релевантной информации.

Проведенный анализ ошибок на уровнях языка
сделать вывод, что СМП не в состоянии достичь семантико-синтаксической
адекватности технических текстов и переводчику для редактирования перевода в
обязательном порядке нужно обращаться к оригинальному тексту.

Конечно, качество перевода улучшалась
последние 30-40 лет в основном за счет увеличения скорости обработки информации
и увеличения объемов памяти, как оперативной, так и для хранения данных, что
позволило создавать объемные словари и быстрее выполнять разработанные
алгоритмы. Но многие из лингвистов вообще сомневается в возможности создания
идеальной СМП, а математики, которые не соприкасаются со всей сложностью
процесса перевода, полны оптимизма, и продолжают пытаться создавать все более
сложные модели или улучшить существующие СМП.

СМП удовлетворяют какую-то часть
потребности пользователей в переводе иностранных технических текстов. Поэтому
рекомендуется автоматизированная или полуавтоматизированная предварительная
диагностика области технических знаний для снижения риска неэквивалентного
перевода.

 

Фрагмент текста работы:

 

Глава
1. Машинный перевод

1.1
История, основные проблемы и задачи машинного перевода

Начиная анализ машинного перевода, представляется
целесообразным осветить историю его возникновения и предпосылки его создания.
Первая идея машинного перевода, как известно, возникла в 1933 году у советского
инженера Петра Смирнова-Троянского. Но основателем машинного перевода считается
Уоррен Уивер. Первая демонстрация системы машинного перевода состоялась в 1954
году в Джорджтаунском университете, США, в ходе которой компьютер стал
переводить слова с русского языка на английский язык [18, с. 67].

Создание системы машинного перевода,
основанной на анализе и обобщении операций, потребовало много лет напряженной
работы. В связи с этим, в 1960-е
годы произошла «рецессия» машинного перевода. Тем
не менее, с появлением в 1970-х годах компьютерных системам третьего поколения
снова появляется и интерес к машинному переводу. А
сегодня письменные переводчики не могут представить свою
работу без автоматизированных систем перевода [23, c. 85].

Первые эксперименты по машинному переводу,
подтвердившие принципиальную возможность его реализации, были проведены в 1954
году в Джорджтаунском университете (Вашингтон, США). Вскоре после этого в
промышленно развитых странах мира были начаты исследования и разработки,
направленные на создание систем машинного перевода. И хотя с тех пор прошло
более половины столетия, проблема машинного перевода всё еще не решена на
должном уровне. Поэтому, оценивая сегодняшнюю реальность, приходится говорить,
как о достижениях, так и о разочарованиях [18, c. 67]. Проблема оказалась значительно
сложнее, чем это представляли себе пионеры и энтузиасты машинного перевода в
конце пятидесятых – начале шестидесятых годов.

Это было также время, когда лингвисты,
работавшие в области машинного перевода, пытались описать естественный язык с
помощью математических символов. В отличие от Я. И, Рецкера и А. В.
Федорова, стремившихся установить имеющиеся закономерности на основе
практических наблюдений, они ставили своей целью создание дедуктивной теории.
Речь шла о разработке свода правил, применение которых к определенному набору
языковых единиц могло бы привести к порождению осмысленного текста. Языковые
единицы выступали в виде математических символов, которые в результате
применения к ним названных правил, также выраженных математически, можно было
расположить определенным образом. После декодирования комбинация символов
превращалась в текст.

Ученые создали специальный язык, состоящий
из математических символов, который мог быть использован машиной в качестве
посредника при переходе от исходного текста к тексту перевода. Язык посредник –
это «метаязык» переводческой теории. В лингвистике под метаязыком обычно
понимается «язык второго порядка», то есть язык на котором строятся рассуждения
о естественном языке или каких-либо других явлениях. Так, говоря о грамматике,
мы пользуемся специальными словами, или терминами, а при обсуждении вопросов в
области медицины, применяем другой терминологический аппарат. Иными словами, по
убеждению Д. Ю. Груздева, метаязык, или «язык-посредник», перевода
представляет собой комплекс структурно-лингвистических характеристик,
позволяющих с достаточной полнотой описать процесс перевода [8, c. 85].

По замыслу авторов теории машинного
перевода в основе языка-посредника лежал концептуальный аппарат «порождающей
семантики» и модели «смысл ↔ текст». Был подготовлен набор правил для
преобразования поверхностных структур английского языка в ядерные предложения.
Ученые далее ожидали, что с помощью языка-посредника машина легко преобразует
глубинные структуры исходного языка в глубинные структуры переводящего языка, а
затем и в его поверхностные структуры, об этом говорит С. В. Савельев
[20, с. 205]. Но полученные результаты
не были удовлетворительными. Качество машинного перевода оказалось очень
низким, и последующие попытки улучшить его к успеху не привели. Ученые в то время, то есть в начале
пятидесятых и середине шестидесятых годов прошлого века, ориентировались на
лингвистическую теорию структурализма, основанную на описании и интерпретации
языковых явлений строго в рамках внутриязыковых отношений и не допускающую
выхода за пределы языковой структуры при анализе этих явлений. Они, конечно,
знали то, что хорошо известно каждому переводчику-практику. А именно, важность
учета конкретной обстановки, в которой протекает данный акт межъязыкового
общения, а также ситуации, описываемой в переводимом сообщении. По убеждению
Н. Н. Гавриленко, эта информация с точки зрения качества переводного
текста играет не меньшую роль, чем собственно языковые явления [5, c. 63].

Для того чтобы примирить это
обстоятельство с требованием не выходить за рамки внутрилингвистических
отношений, переводческую деятельность предлагалось разделить на два компонента
— собственно перевод, осуществляемый по заданным правилам без обращения к внеязыковой
действительности, отраженной в опыте или восприятии переводчика, и
интерпретацию, включающую привлечение внелингвистических данных.

Но это явно идет в разрез с тем, что нам
известно о реальных процессах обычного, то есть немашинного перевода. Как
отмечает Л. С. Бархударов, для перевода, осуществляемого человеком
характерно органично и неразрывное единство собственно языковых и внеязыковых
факторов [2]. Дело в том, что в любом речевом
произведении далеко не все выражено явно, или, как говорят лингвисты,
эксплицитно. Многое обычно остается невыраженным, подразумеваемым. Всякое
высказывание адресуется определенному лицу или определенной аудитории. Автор
высказывания при этом исходит из того, что его слушатели или читатели обладают
достаточными знаниями однозначной интерпретации того или иного сообщения без
уточняющих подробностей.

Таким образом, А. В. Жидков приходит к
заключению, что машинный перевод, основанный только на анализе
формально-структурных закономерностей исходного текста, не позволяет вскрыть
взаимодействие лингвистических и внелингвистических факторов и, тем самым,
оставляет без внимания важнейшую составляющую межъязыкового общения [9]. В этом и заключалась основная
причина его неудовлетворительного качества.

В настоящее время на пути машинного
перевода стоят большие трудности, решение которых зависит не только от уровня
развития технологии. В то же время, как профессиональным переводчикам, так и
специалистам в различных сферах, которым в силу своей профессиональной
деятельности необходимо знакомиться с материалами на иностранных языках,
приходится в том или ином объеме прибегать к помощи программ для перевода.
Поэтому мы считаем целесообразным в данной работе уделить внимание некоторым
наиболее общим проблемам автоматизированного перевода, а также системному
анализу программных средств, которые в настоящее время внедряются на рынки с
вертикальной интеграцией (в большей степени в области радиологического
оборудования).

Человеческий мозг по своей сложности и
мощности во много раз превышает современные компьютерные технологии. В ходе
эволюции у определенных отделов мозга выработалась специализация –
распознавание образов и речи. Что касается деятельности мозга, связанной с
осуществлением перевода с одного языка на другой – это сложнейшая
интеллектуальная работа, весьма слабо реализованная в существующих программах.
Для обеспечения адекватности перевода мозг человека учитывает весь свой
предыдущий жизненный опыт, поэтому проблемы автоматического перевода, прежде
всего, связаны с проблемой семантического поиска. Как отмечает D. D. Sleator, целенаправленно
сопоставляя две лексические системы языка оригинала и языка перевода,
переводчик предлагает адекватную репрезентацию заданной ситуации (фрейма) на
языке перевода [32, c. 85]. Думается, что моделирование
данного процесса в системах машинного перевода представляет собой вполне
осуществимую задачу. Рассматривая человеческий мозг как сложную
саморазвивающуюся программу, можно сделать вывод о том, что ее сложность была достигнута
в результате саморазвития. Данный принцип был положен в основу новейших
разработок программ-переводчиков, которые строятся на так называемых
развивающихся алгоритмах.

По мнению О.В. Кулагина, под
развивающимися алгоритмами следует понимать алгоритмы, созданные человеком, но
со временем все более теряющие с ним связь в силу собственного саморазвития;
эволюционирующие с течением времени (в лучшую или, при неудачных установках, в
худшую сторону) Разработчики программ-переводчиков с элементами искусственного
интеллекта определяют также необходимые факторы развития: способность программы
к самоанализу; генерирование новых связей и альтернатив; объединение
альтернатив в смысловые блоки; наличие механизма удаления элементов памяти,
т.е. «забывание» не представляющей ценности информации [12, c. 85].

Развитие технологии автоматизированного
перевода в данном направлении позволит в значительной степени повысить качество
перевода. Современные же программы перевода основаны на более примитивных
принципах. В основу работы программы-переводчика положен словарь и
лингвомодуль, который, в зависимости от "знакомых" ему сочетаний
выстраивает падежные и временные формы. В результате, по мнению
С. В. Фролова, осуществляется пословный перевод, и текст перевода
оказывается практически нечитаемым [22, c. 63].

Поэтому основной задачей разработчиков
является развитие «интеллекта» программы, т.е. увеличение знакомых ей фраз и
возможности добавления пользователем новых сочетаний и форм. Чем больше их
будет занесено в базу данных программы, тем выше окажется качество
переведённого текста. В первую очередь, это относится к программам, призванным
повысить качество перевода путем использования предыдущих переводов и
сохраняемых в специальной базе данных. Эта технология – translation memory (ТМ)
или переводческая память, получила широкое развитие в странах Европы.

Таким образом, начиная с момента
изобретения первых систем машинного перевода и до настоящего времени ведутся
изыскания, направленные на улучшение его качества. Для того, чтобы понимать
механизмы оптимизации машинного перевода, необходимо рассмотреть его
особенности.

Важно! Это только фрагмент работы для ознакомления
Скачайте архив со всеми файлами работы с помощью формы в начале страницы

Похожие работы