История и методология науки Курсовая с практикой Иностранные языки

Курсовая с практикой на тему Машинный перевод как часть компьютерной лингвистики

  • Оформление работы
  • Список литературы по ГОСТу
  • Соответствие методическим рекомендациям
  • И еще 16 требований ГОСТа,
    которые мы проверили
Нажимая на кнопку, я даю согласие
на обработку персональных данных
Фрагмент работы для ознакомления
 

Содержание:

 

Введение 3
Глава I Теоретические аспекты исследования машинного перевода 5
1.1. Компьютерная лингвистика и машинный перевод 5
1.2. История развития машинного перевода 8
1.3.Виды САТ-программ 11
Глава II. Особенности практического применения САТ-программ 13
2.1. Сложности машинного перевода 13
2.2.Практическая работа по анализу текстов машинного перевода 16
2.3. Анализ результатов перевода второй статьи 23
Заключение 28
Список использованных источников 31
Приложение 33

 

  

Введение:

 

В настоящее время все больше возрастает потребность в переводе документов международных организаций, которые в обязатель¬ном порядке должны переводиться на языки стран-участников ЕС. Только Евро¬пейский союз в настоящее время объединяет 27 государств, в кото¬рых используется официально 23 языка. В этой сфере сейчас заняты несколько тысяч профессиональных перевод¬чиков, которые переводят в год миллионы страниц. Услуги таких переводчиков обходятся в миллиарды долларов.
Современные системы машинного перевода осуществляют перевод текста, его морфологических, синтаксических и семантических данных, но качество перевода не всегда высоко из-за грамматических и лексических ошибок. Конечно, при этом встает вопрос как именно классифицировать ошибки и определить насколько корректным является перевод. Но и здесь ученые сталкиваются с проблемой, поскольку перевод расценивают согласно его адекватности и эквивалентности, а трактовки этих терминов достаточно размыты. Все вышесказанное говорит об актуальности исследования истории машинного перевода, его качество и особенности.
Итак, актуальность данной работы обуславливается повышением значимости машинного перевода, как способа распространения и обмена информации во всем мире.
Понятию «машинный перевод» посвятили свои работы такие известные лингвисты как А.Л. Семенов, Е.А. Шовгенина, Л.Ю. Щипицина, А.А. Новожилова, А.А. Винокуров, В.О. Чуканов.
Цель данной работы рассмотреть историю и особенности машинного перевода на современном этапе. Данная цель предполагает решение следующих задач:
-Дать определение понятию «машинный перевод»;
-Изучить историю развития машинного перевода;
-Рассмотреть виды CAT- программ;
-Определить трудности машинного перевода.
Объектом исследования данной работы является особенности машинного перевода.
Предметом исследования – тексты переводов и сложности, связанные с машинным переводом, которые возникают в результате компьютерной обработки текста.
В ходе решения поставленных задач данного исследования были использованы такие методы лингвистического исследования, как контекстуальный анализ, сравнительно-сопоставительный и описательный методы.
Методологической и теоретической основой написания работы послужили труды отечественных и зарубежных исследователей, таких как Т.А. Матисон, Л.Р. Деева, А.А. Новожилова, R. Sennrich, B. Haddow и др.
Практическая значимость обусловлена тем, что результаты работы могут быть использованы при дальнейшем изучении особенностей и приемов машинного перевода на уроках, семинарах и спецкурсах по переводоведению и лексикологии.
Научная новизна работы состоит в комплексном изучении истории и принципов выполнения машинного перевода, а также в выявлении лексических и грамматических особенностей ошибок в ходе машинного перевода.
Данная работа состоит из введения, двух глав, заключения и списка использованных источников.
Во введении обосновывается актуальность рассматриваемой темы, определяются цель и задачи исследования, а также выделяются предмет и объект исследования.
Первая глава работы посвящена вопросам понятий машинного перевода и истории развития машинного перевода, а также видам CAT – программ.
Во второй главе проводится практический анализ машинного перевода текстов различного стиля. В заключении подводятся итоги исследования.

Не хочешь рисковать и сдавать то, что уже сдавалось?!
Закажи оригинальную работу - это недорого!

Заключение:

 

Термин «машинный перевод» (МТ) относится к компьютеризированным системам, ответственным за производство переводов с помощью или без помощи человека. Он включает компьютерные программы как инструменты перевода, которые поддерживают переводчиков, предоставляя доступ к онлайн-словарям, удаленные терминологические банки данных передачи и перевода текстов и т.д.
Историю машинного перевода можно разделить на 5 периодов, каждый из которых был результативным. Первый период охватывает 1948-1960:годы, которые были началом создания систем машинного перевода.
В 1949 году были предложены первые идеи по использованию компьютерного перевода Уоррен Уивером.
В 1952 году состоялся первый симпозиум по машинному переводу в Массачусетском технологическом институте под руководством Иешуа Бар-Хиллелом.
В 1954 был разработан первый автоматический переводчик (очень простой) группой исследователей из Джорджтаунского университета в сотрудничестве с IBM, который переводит более шестидесяти (60) русских предложений на английский язык. Авторы утверждали, что в течение трех-пяти лет проблема машинного перевода будет решена.
Второй период охватывает 1960-1966 годы, который отмечен разочарованием многих исследователей в этой области.
В феврале 1961 года появилась отрасль компьютерной лингвистики благодаря Дэвида Г. Хейса в Лос-Анджелесе была проведена первая Международная конференция по машинному переводу с участием Сидни М. Лэмб, Кеннет Э. Харпер, Чарльз Хокетт,Мартин Кей и Бернар Вокуа, которые занимались вопросом машинного перевода..
В 1964 году был создан комитет ALPAC (автоматическая обработка языков Консультативный комитет) для изучения перспектив машинного перевода. И в 1966 Альпак отметил, что его работы по машинному переводу — это просто трата времени и денег; это оказало негативное влияние на их поиск (МТ) на многие годы
Третий период (1966-1980) отмечен значительным событием: разработка SYSTRAN 1 (русско-английский язык) Питером Тома.
В 1976году создана система машинного переводчика прогнозов погоды для широкой публики в Монреальском университете.
В 1978 — система ATLAS 2 японской фирмой FUJITSU, переводчик с корейского на русский и японский языки и наоборот.
Четвертый период (1980-1990) ознаменован созданием HICATS (автоматизированной системы перевода японско-английского).
Пятый период (с 1990 года): интернет и новая система переводчиков. Сегодня все еще нет системы, которая обеспечивает «полностью автоматический перевод высокого качества». Тем не менее, в настоящее время доступно множество программ, способных обеспечить полезный результат в рамках строгих ограничений; некоторые из них доступны в интернете, такие как Google Translate и система SYSTRAN, TRADOS и др.
На мой взгляд, главным преимуществом MT является скорость, но следует отметить, что MT часто преобразует сам смысл некоторых текстов. Подводя итог, я бы сказал, что MT отлично подходит для коротких фраз и быстрых ответов, но на нынешнем этапе эволюции систем MT человеческий перевод-это лучший способ избежать недоразумений.
В нашем исследовании я использовала переводные системы Systran и Google. Наиболее распространенной категорией ошибок. Были ошибки касательно грамматики и синтаксиса. Cледует отметить, что Google — система достигла лучшего качества по синтаксическому строю, чем Systran, хотя данная система постоянно совершенствуется. Качество лексического состава одинаковое у обеих систем. Что касается адекватности перевода, то в переводе второго текста наблюдалось множество несоответствии.
Таким образом, в переводах обнаружены 5 различных типов:
1. лексические ошибки;
2. морфологические ошибки;
3. синтаксическая ошибка;
4. семантическая ошибка;
5. ошибки без четкого объяснения.
Машинный перевод не может передать точное значение многих терминов, представленных в тексте. С текстами, где присутствуют технические термины, системы машинного перевода справляются хуже. В переводе второго текста обе системы не смогли передать точное значение многих терминов. Также были допущены много грамматических ошибок в ходе перевода.

 

Фрагмент текста работы:

 

Глава I Теоретические аспекты исследования машинного перевода
1.1. Компьютерная лингвистика и машинный перевод
Появление компьютерной лингвистики как нового направления в науке – явление не случайное. Это было вызвано как внешними факторами (внеязыковые, внелингвистические), так и внутренними (сугубо языковые, чисто лингвистические), объективными и субъективными.
Итак, компьютерная лингвистика (КЛ) – явление, причины возникновения которого следует искать в развитии, как современного общества, так и самого языка и науки, ее изучающей, лингвистики. Термин «компьютерная лингвистика» предполагает использование компьютеров для решения разнообразных научных и практических задач, связанных с языком, никак не ограничивая способы решения этих задач» [6. C.85-88].
Аспект, в котором КЛ изучает язык, и применяемый им инструмент такого изучения, компьютер и выделяют его среди других лингвистических дисциплин, формируют особый взгляд на язык как объект исследования. По содержанию и объему прорабатываемых задач компьютерная лингвистика становится аналогом лингвистики традиционной или некомпьютерной, поскольку объект исследования КЛ составляет речь во всех трех способах своего существование:[1, с.13]
— языковая система – совокупность определенных единиц с присущими им формальными, содержательными и функциональными свойствами;
-речь – различные продукты реализации языковой системы в определенных условиях и ситуациях коммуникации;
-речевая деятельность – процесс использования языковой системы и создание продуктов такого применения языка в тех или иных условиях коммуникации.
Компьютерная лингвистика предопределяет необходимость разработки методов и приемов анализа и синтеза языковых фактов, отличных от традиционных. Недаром в определении КЛ, по определению А.М. Баранова появилось слово «моделирование» [1, с.13].
Предметом исследования КЛ является особенности строения, содержания и функционирования единиц языковой системы, продуктов речи и речевой деятельности – звуковых или письменных текстов, которые могли бы служить для их моделирования и использования в процессах компьютерной обработки речевой информации.
Использование компьютера в роли исследователя языка невозможно без создания соответствующей, «понятной» ему модели реального мира, модели
реальных объектов и процессов, пригодных для обработки теми средствами, которые есть в арсенале компьютера. Этим и обусловлен отдельный, самостоятельный предмет исследования КЛ.
Компьютерная лингвистика является одновременно дисциплиной теоретической, фундаментальной, практической и прикладной. Применение нового исследовательского инструмента, компьютера, позволяет качественно провести анализ и синтез языковых фактов, решать теоретические задачи современного языкознания, получать сведения о строении и функционирование языковых объектов, которые позволяют изменения в самой парадигме знания о языке, поскольку позволяют не только решать старые, но и ставить новые лингвистические задачи.
Итак, компьютерная лингвистика – самостоятельная лингвистическая дисциплина, которая решает теоретические и прикладные задачи языкознания с помощью компьютера
Соответственно, к направлениям компьютерной линг¬вистики относятся:
-автоматический анализ текстов;
-автоматический синтез текстов;
-создание и поддержка автоматических словарей;
-создание автоматизированных информационно-поисковых си¬стем;
-машинный перевод;
-создание автоматических систем обучения языку и др.
Вопросы машинного перевода составляют одну из центральных областей использования информационных технологий в лингвисти¬ке.
Машинный (автоматиче¬ский) перевод (МП) — выполняемое компьютером действие по пре¬образованию текста на одном естественном языке в эквивалентный по содержанию текст на другом языке, а также результат такого дей¬ствия [8, с.74-85].
С точки зрения роли человека в процессе выполнения МП раз¬личают следующие его виды: [4, с.155-163].
— МАНТ (Machine-assisted human translation) — перевод, осущест¬вляемый человеком с использованием компьютера;
— НАМТ (Human-assisted machine translation) — машинный пере¬вод с участием человека;
— FAMT (Fully-automated machine translation) — полностью автоматизированный машинный перевод.
И.И. Убин считает, что использование автоматических переводных словарей может уско¬рить процесс перевода на 40 % [7].
По мере усложнения систем МП и включения в них новых эта¬пов автоматического анализа и синтеза текста выделяют три поко¬ления таких систем: [9].
1) П-системы — системы прямого перевода (direct systems),
2) Т-системы — системы с синтаксическим преобразованием ис¬ходного текста
(от англ. transfer — преобразование);
3) И-системы — системы с семантическим и прагматическим ана¬лизом (interlingua — язык-посредник).
Первый тип систем МП (П-системы) представляет своего рода подстрочный перевод. Второй тип систем МП (Т-системах) предполагает использование методов синтаксическо¬го анализа и синтеза, в зависимости от их уровня (поверх¬ностный, глубинный или синтактико-семантический).

Важно! Это только фрагмент работы для ознакомления
Скачайте архив со всеми файлами работы с помощью формы в начале страницы

Похожие работы