Дипломная работа (ВКР) — бакалавр, специалист на тему Системы машинного перевода: анализ и сравнение качества перевода (на примере перевода юридической документации)
-
Оформление работы
-
Список литературы по ГОСТу
-
Соответствие методическим рекомендациям
-
И еще 16 требований ГОСТа,которые мы проверили
Скачать эту работу всего за 1490 рублей
Ссылку для скачивания пришлем
на указанный адрес электронной почты
на обработку персональных данных
Содержание:
ВВЕДЕНИЕ 3
ГЛАВА 1. ТЕОРЕТИЧЕСКИЕ АСПЕКТЫ ОЦЕНКИ КАЧЕСТВА МАШИННОГО ПЕРЕВОДА ТЕКСТОВ ЮРИДИЧЕСКОГО ДИСКУРСА 6
1.1 Место машинного перевода в современной лингвистике 6
1.2 Принципы работы систем машинного перевода и их классификация 9
1.3 Характеристика текстов юридического дискурса 18
1.4 Описание подходов к оцениванию качества перевода 21
Выводы по главе 1 25
ГЛАВА 2. ОЦЕНКА КАЧЕСТВА МАШИННОГО ПЕРЕВОДА ТЕКСТОВ ЮРИДИЧЕСКОГО ДИСКУРСА 27
2.1 Сопоставительный анализ переводов и оценка качества перевода на лексическом уровне языка 27
2.1.1 Анализ корректности перевода терминов 27
2.1.2 Анализ корректности перевода устойчивых выражений и клише 35
2.2. Сопоставительный анализ переводов и оценка качества перевода на грамматическом уровне 44
2.3 Сопоставительный анализ переводов и оценка качества перевода с точки зрения стилистики 54
Выводы по главе 2 68
ЗАКЛЮЧЕНИЕ 71
СПИСОК ИСПОЛЬЗОВАННОЙ ЛИТЕРАТУРЫ 74
Введение:
Современный мир пронизан компьютерными и информационными технологиями. Применение автоматизированных технологий распространилось практически на все области профессиональной деятельности и коммуникации. Не являются исключением и лингвистика, и переводоведение. Стоит отметить, что в контексте глобализации, формирования принципов международной коммуникации на первый план выходит скорость перевода, что способствует ускорению коммуникации. Кроме того, следует учитывать и роль английского языка как языка международного общения, международной кооперации. Все это подразумевает важность использования современных технологий в переводческой деятельности при работе с текстами юридического дискурса.
В контексте повышения масштаба объемов коммуникации в современном мире увеличивается и объем текстов, которые нуждаются в переводе. Новая информация, которая должна быть переведена, появляется непрерывно – заключаются сделки, продаются и покупаются товары, все это подразумевает значительный интерес к применению современных переводческих технологий к юридическим текстам. По сути, классический подход к переводу уже не эффективен, более рациональным является использование компьютерных технологий, ввиду скорости получения результата переводческой деятельности.
Тем не менее, ключевая сложность при использовании систем машинного перевода заключается в том, что специалисту необходимо контролировать качество получаемого перевода. Обеспечение качества перевода является краеугольным камнем переводческой деятельности в целом и при работе с юридическими текстами, в частности.
Актуальность темы настоящего исследования обуславливается тем, что в современном мире поток информации, требующий перевода, настолько велик, что без использования компьютерных информационных технологий он уже не может быть обработан. В этом контексте на первый план выходит именно машинный перевод. Вне всякого сомнения, алгоритмы систем машинного перевода работают иначе, чем человек-переводчик. Следовательно, изучение различий принципов работы автоматизированной переводческой системы и человека, а также оценка качества перевода текстов юридического дискурса является важной исследовательской проблемой в контексте теории и практики перевода.
Объектом исследования является машинный перевод текстов юридического дискурса.
Предметом исследования является оценка качества машинного перевода текстов юридического дискурса при переводе с английского языка на русский язык.
Цель настоящего исследования состоит в том, чтобы произвести оценку качества машинного перевода текстов юридического дискурса при переводе с английского языка на русский язык.
Поставленная цель подразумевает решение следующих задач:
1. Определить место машинного перевода в современной лингвистике;
2. Рассмотреть принципы работы систем машинного перевода и их классификацию;
3. Охарактеризовать юридический дискурс;
4. Описать существующие в теории перевода подходы к оценке качества перевода;
5. Произвести сопоставительный анализ оригинального текста юридического дискурса, его официального перевода и машинных переводов на лексическом уровне;
6. Произвести сопоставительный анализ оригинального текста юридического дискурса, его официального перевода и машинных переводов на грамматическом уровне;
7. Произвести сопоставительный анализ оригинального текста юридического дискурса, его официального перевода и машинных переводов на стилистическом уровне.
Источником исследования является United Nations Framework Convention on Climate Change (Рамочная конвенция Организации Объединенных Наций об изменении климата).
Методология исследования включает в себя анализ и синтез при работе с исследовательской литературой, переводческий анализ и сопоставительный анализ при работе с практическим материалом исследования.
Теоретическая база исследования включает в себя работы следующих ученых: А.В. Банарцева [8], Л.Н. Беляева [11; 12], Н.В. Ким [17], Н.С. Кочеткова [23], М.Т. Мамедова [24], Ю.Н. Марчук [25], А.Л. Семенов [38] и др.
Практическая значимость работы состоит в том, что его результаты могут быть полезны в контексте изучения особенностей и оценки качества машинного перевода, а также при изучении проблематики теории и практики перевода текстов юридического дискурса с применением современных технологий. Кроме того, полученные результаты позволяют оценить сильные и слабые стороны машинного перевода и направить усилия на корректировку недостатков этих систем.
Структура настоящего исследования обусловлена поставленными целью и задачами. Работа состоит из введения, двух глав, заключения и списка использованной литературы.
Заключение:
Подводя итог проведенному исследованию, стоит отметить, что технология машинного перевода обусловлена компьютеризацией и цифровизацией всей жизни, в любых профессиональных сферах. В основе этой технологии лежат алгоритмы, которые позволяют быстро и без существенных денежных затрат получать текст перевода. Среди недостатков машинного перевода выделяется отсутствие понимания контекста и лексических особенностей слов из текста, что существенно понижает качество перевода. Тем не менее, технология машинного перевода непрерывно развивается, и программисты в рамках работы с лингвистами и переводчиками стремятся исправить недостатки программ этого типа.
Специфика системы машинного перевода подразумевает применение множества программных инструментов, направленных на установление соответствия лексических единиц и синтаксических структур языка оригинала и перевода. Для этой цели используются программы, рассматривающие текст на всех уровнях языка – морфологическом, лексическом, синтаксическом. Важным компонентом осуществления перевода с применением технологий машинного перевода является постредактирование полученного текста. Специалист в области постредактирования оценивает качество перевода, вносит правки, делая текст приемлемым для восприятия носителем языка перевода для достижения поставленных целей.
Юридический дискурс следует рассматривать как профессиональную устную и письменную коммуникацию в юридической сфере, включая правовые тексты, официальные документы и т.д. Юридический перевод весьма сложен с технической точки зрения, так как требует точности, полного сохранения смысла исходного текста и не допускает двусмысленности.
Проблема оценки качества перевода существует в переводоведении уже на протяжении многих лет и создание объективных критериев для оценивания перевода является одной из главных задач, стоящих перед лингвистами. Многие переводческие компании и международные организации также заинтересованы в решении данной проблемы. Важно учитывать, что качество перевода оценивается на основе субъективного ощущения, и необходимо разработать такую систему оценивания, где можно было бы избежать субъективного мнения о переводе. По мнению переводоведов, перевод может быть оценен с точки зрения переводческих норм, полноты и точности перевода, типа текста перевода, достижения эквивалентности, цели автора текста оригинала, классификации ошибок, допущенных в переводе.
В ходе практического исследования было оценено качество перевода терминологических единиц в юридическом тексте с использованием технологии машинного перевода. В ходе анализа было установлено, что в большинстве случаев терминологические единицы передаются корректно, сохраняется и значение, и структурные особенности терминов. Более того, сопоставительный анализ показывает соответствие вариантов перевода, сформированных машинным переводом, официальному переводу с английского на русский язык. При этом, нельзя выявить одну из технологий машинного перевода как предоставляющую перевод терминов максимального качества, у каждой из рассмотренных переводческих систем были выявлены определенные недостатки и искажения при работе с юридической терминологией.
Кроме того, было установлено, что при переводе устойчивых оборотов и клише наиболее продуктивной стратегией, которая применяется как в официальном, так и в машинных переводах, является стратегия калькирования. Использование этой стратегии обусловлено структурным и семантическим сходством конструкций такого рода в русскоязычном и англоязычном юридическом дискурсе. При этом, в ряде случаев были выявлены опущения отдельных вводных конструкций, что снижает качество перевода, так как искажает полноту передаваемой информации. Сопоставительный анализ трех систем машинного перевода показывает, что перевод, выполненный Яндекс.Переводчиком, в наибольшей степени соответствует официальному переводу с точки зрения передачи структуры и значения.
При анализе использования машинного перевода для достижения соответствия грамматическим нормам русского языка было установлено, что у рассмотренных систем есть значительный потенциал для корректной передачи структуры оригинального текста, с соответствием нормам русского языка. Тем не менее, в ряде случаев наблюдаются значительные искажения грамматических норм русского языка, что приводит к затрудненному восприятию текста. Подобные искажения грамматической нормы проявляются как в формировании некорректных по своей структуре конструкций, так и при формировании тавтологичных структур, что не соответствует нормам русского языка.
Также были рассмотрены сформированные машинные переводы с точки зрения их качества на стилистическом уровне. Проведенный анализ показал, что в ряде случаев нарушается лексическая сочетаемость слов, либо же используются лексические единицы, которые не соответствуют нормам юридического дискурса в русском языке, что позволяет проследить искажение стилистики употребляемых лексических единиц. Кроме того, были выявлены и случаи использования разных вариантов перевода, синонимов, которые имеют сходную семантику и коннотации и по этой причине взаимозаменяемы. Тем не менее, ввиду наличия ошибок в переводах, ни одна из систем машинного перевода не может быть признана полностью обеспечивающей качественный перевод на уровне стилистики.
В целом, ни одна из рассмотренных систем машинного перевода – Google Translate, Яндекс Переводчик, Promt.One – не позволяет создать полноценный качественный перевод юридического текста. Искажения наблюдаются в лексике, грамматике, стилистике, что указывает на необходимость проверки и постредактирования такого текста профессиональным переводчиком.
Фрагмент текста работы:
ГЛАВА 1. ТЕОРЕТИЧЕСКИЕ АСПЕКТЫ ОЦЕНКИ КАЧЕСТВА МАШИННОГО ПЕРЕВОДА ТЕКСТОВ ЮРИДИЧЕСКОГО ДИСКУРСА
1.1 Место машинного перевода в современной лингвистике
В современной компьютерной лингвистике понятие машинного перевода в узком смысле понимается как процесс перевода некоторого текста с одного естественного языка на другой, который выполняется компьютером полностью или почти полностью. Этот процесс подразумевает загрузку текста в компьютер и получение на выходе текста перевода на языке перевода. Особенность такого перевода состоит в том, что человек фактически не принимает участия в переводе, работая с текстом на стадии постредактирования [43; 34].
В широком смысле машинный перевод воспринимается как область научного знания, расположенная на стыке лингвистики, математики, информатики. Ее цель состоит в формировании систем, которые позволяют осуществлять машинный перевод в узком смысле [23].
Необходимо кратко осветить историю становления направления машинного перевода в современной лингвистике. В середине XX века Уорреном Уивером была сформулирована концепция машинного перевода, и впоследствии на базе Массачусетского технологического университета была проведена первая конференция, направленная на рассмотрение этой проблематики. IBM Mark II, разработанная компанией IBM совместно с Джоржтаунским университетом, стала первым случаем разработки системы машинного перевода [46; 41].
К.А. Дроздова отмечает, что в начале 1950-х годов в США и Европе началось активное развитие технологий машинного перевода. Тем не менее, на первых этапах реализации этой технологии они не показывали достаточной продуктивности [16]. О.В. Митренина подчеркивает, что среди причин низкого качества результата машинного перевода был низкий технический уровень самих компьютерных технологий [26]. Однако, впоследствии, в рамках развития компьютеров начался постепенный рост качества и распространенности технологии машинного перевода.
Как подчеркивает К.А. Дроздова, с взрывным ростом количества персональных компьютеров и распространением Интернета возник запрос и на доступ к технологиям машинного перевода [16].
В зарубежной исследовательской литературе подчеркиваются стимулы, которые вели к развитию технологий машинного перевода в современной лингвистике. Первый из них затрагивает собственно научный аспект этого явления и определяется комплексным подходом к компьютерному моделированию перевода [46].
Стоит отметить также, что как вид языковой деятельности, любой перевод неизбежно трансформирует все уровни языка – от распознавания графем (и фонем при переводе устной речи) до передачи смысла высказывания и текста. При этом, машинный перевод характеризуется и наличием обратной связи, то есть, он предоставляет техническую возможность проверки результата перевода и корректности машинных алгоритмов перевода [42; 45]. Эта характеристическая черта перевода вообще и машинного перевода в частности привлекает внимание теоретиков, в результате чего продолжают возникать все новые теории автоматизации перевода и формализации языковых данных и процессов [50].
Вторым стимулом, который оказывает непосредственное влияние на становление и развитие машинного перевода сегодня, является социальный фактор. Речь идет о росте популярности применения технологий машинного перевода в контексте необходимости обеспечения межъязыковой коммуникации, объем которой растет год от года [49].
В этой связи следует указать на тот факт, что в современном мире в рамках обеспечения глобальной коммуникации в самых разных профессиональных областях – торговле, международной политике – именно перевод наиболее продуктивен и при этом незаменим [6; 11].
Говоря о самой технологии машинного перевода, стоит отметить и его сильные стороны.
Так, в первую очередь, машинный перевод обеспечивает высокую скорость получения текста перевода [10].
Кроме того, применение технологии машинного перевода характеризуется низкими денежными затратами, особенно в сравнении с услугами профессионального переводчика, либо в сопоставлении с программными комплексами автоматизированного перевода. Стоит отметить, что в некоторых случаях нет необходимости в получении перевода высокого качества – но именно это требование предъявляется, например, к работе переводчика, что и влияет на стоимость работы [17].
Еще одним существенным преимуществом использования технологии машинного перевода является конфиденциальность – пользователь технологии машинного перевода сам вводит текст в программу и сам интерпретирует результат. В использовании машинного перевода специалист-переводчик как посредник не обязателен [28].
Универсальность технологии машинного перевода также относится к преимуществам этого подхода к переводу. В отличие от человека, который является специалистом по переводу текстов определенной тематики, программа машинного перевода отличается универсальностью, она работает с любым загруженным в нее текстом [10; 2].
Как и любой феномен, технология машинного перевода отличается и определенными недостатками.
Основной недостаток этой технологии — относительно низкое качество текста перевода. Применение машинного перевода позволяет передать общую суть текста, однако, допускают лексические, грамматические и стилистические ошибки. Достаточно часто встречаются серьезные искажения смысла текста оригинала, особенно в случае сложной структуры предложения, либо полисемии слов.
Из этого недостатка следует еще один – технологии машинного перевода не учитывают контекст, жанр и стиль текста. По сути, при применении машинного перевода повышается вероятность неуместного употребления тех или иных лексических единиц в тексте перевода [17].
Тем не менее, стоит отметить, что развивающаяся сегодня технология машинного перевода на основе нейросетей позволяет исправить многие ошибки, которые программы машинного перевода допускали на предыдущих этапах своего развития [8].
Таким образом, стоит отметить, что технология машинного перевода обусловлена компьютеризацией и цифровизацией всей жизни, в любых профессиональных сферах. В основе этой технологии лежат алгоритмы, которые позволяют быстро и без существенных денежных затрат получать текст перевода. Среди недостатков машинного перевода выделяется отсутствие понимания контекста и лексических особенностей слов из текста, что существенно понижает качество перевода. Тем не менее, технология машинного перевода непрерывно развивается, и программисты в рамках работы с лингвистами и переводчиками стремятся исправить недостатки программ этого типа.