Реферат на тему Cравнительный анализ систем машинного перевода и онлайн-переводчиков Google и Prompt
-
Оформление работы
-
Список литературы по ГОСТу
-
Соответствие методическим рекомендациям
-
И еще 16 требований ГОСТа,которые мы проверили
Введи почту и скачай архив со всеми файлами
Ссылку для скачивания пришлем
на указанный адрес электронной почты
Содержание:
Введение. 3
Часть 1 Обоснование выбора темы.. 4
Часть 2 Непосредственный сравнительный анализ. 5
Часть 3 Сравнение перевода, полученного в исследуемых
онлайн переводчиках. 7
Заключение. 11
Список литературы 12
Введение:
В
машинном переводе используется специальная компьютерная программа для перевода
текста (письменного и, в идеале, устного) с одного естественного языка на
другой.
Система
машинного перевода на основе примеров основана на принципе параллельного
двуязычного текстового корпуса, который содержит пары предложений в качестве
примеров. Каждое предложение повторяется на другом языке. Статистический
машинный перевод имеет атрибут «обучения». Чем больше текста (примеров)
доступно, тем лучше будет результат машинного перевода.
Машинный
перевод — важная и постоянно развивающаяся область в области искусственного
интеллекта. Это выполняемое на компьютере действие по преобразованию текста на
одном естественном языке в эквивалентный по содержанию текст на другом языке, а
также результат такого действия. Современный машинный, или автоматический
перевод осуществляется с помощью человека: пред-редактора, который тем или иным
образом предварительно обрабатывает подлежащий переводу текст, интер-редактора,
который участвует в процессе перевода, или пост-редактора, который исправляет
ошибки и недочеты в переведенном машиной тексте.
Для
осуществления машинного перевода в компьютер вводится специальная программа,
реализующая алгоритм перевода, под которым понимается последовательность
однозначно и строго определенных действий над текстом для нахождения переводных
соответствий в данной паре языков L1 – L2 при заданном направлении перевода (с
одного конкретного языка на другой).
Система машинного перевода включает в себя
двуязычные словари, снабженные необходимой грамматической информацией
(морфологической, синтаксической и семантической) для обеспечения передачи
эквивалентных, вариантных и трансформационных переводных соответствий, а также
алгоритмические средства грамматического анализа, реализующие какую-либо из принятых
для автоматической переработки текста формальных грамматик. Имеются также
отдельные системы машинного перевода, рассчитанные на перевод в рамках трех и
более языков, но они в настоящее время являются экспериментальными.
Заключение:
Машинный перевод можно
локализовать, что также очень важно для стран с разнородными языками. Машинный
перевод позволяет общаться с пользователями на их родном языке, а значит,
языковой барьер между людьми разрушен.
В будущем Интернет может стать
основным средством коммуникации. В нашем обществе возрастает потребность в этом
механизме: технологии могут удовлетворить растущие потребности людей и помочь
им выполнять повседневные действия в сети. Люди, которые не могут получить
доступ к Интернету или не знают, как пользоваться Интернетом, находятся в
невыгодном положении и в конечном итоге вообще не смогут работать во все более
компьютеризованном обществе. Если для перевода шуток или анекдотов с
английского на русский воспользуется он-лайн транслейтором человек с низким
уровнем знания английского, то ему будет очень тяжело понять что к чему.
Например, если он возьмет для этой цели PROMT, то там предлагается самому выбрать
вариант перевода отдельного слова или словосочетания. Но, человек, не знающий
английский язык, вряд ли сам сможет понять сходу и без углубленного перевода
каждого слова в других словарях, какой из вариантов он должен выбрать.
Собственно, гигантский сбор текстов
на разных языках и их последующее сопоставление между собой и является методом
перевода, который заложен в "гугловский" машинный перевод (вместо
привычного способа заполнения базы компьютеров-переводчиков словарными
запасами, правилами грамматики, её примерами и исключениями, что и является
проблемным местом для неживых переводчиков).
По ходу ознакомления с
переводчиком, нашлись в нём и минусы (как понимается временные): на примере
перевода с русского на английский в Google.Translate отмечается не всегда
верное спряжение глаголов, а также неуместное по контексту употребление
прилагательных.
А вот "5+" в
Google.Translate бесспорно можно отдать такой функции: при наведении на любое
слово или цельную фразу в уже переведённом тексте, переводчик подсвечивает его
соответствие в тексте языка, с которого был осуществлён перевод. Также эта
функция получает дополнительные баллы за то, что кликнув на любое переведённое
слово, можно узнать альтернативный вариант перевода в виде выпадающего списка. Тем
не менее, как мы можем в этом сами убедиться, Google Translate предлагает самый
связный и адекватный перевод в большинстве случаев.
PROMT немного уступает в этом
Google, а на третьем месте мы расположим Microsoft Translator, чья основная
проблема в неправильном зачастую подборе слов, но несмотря на это, он может
использоваться как вспомогательное средство при переводе.
Фрагмент текста работы:
ЧАСТЬ 2 НЕПОСРЕДСТВЕННЫЙ СРАВНИТЕЛЬНЫЙ АНАЛИЗ
1.
Описание PROMT
Удобство доступа и работы: Для незарегистрированных
пользователей предлагается только общелексическая тематика перевода, зато набор
языковых пар не урезается. После регистрации становятся доступны все
тематические базы. Может переводить также web, e-mail и даже wap-странички.
Интерфейс русский. Имеет КПК и WAP версию.
Количество языков: ПРОМТ переводит с английского,
немецкого, французского, испанского языков на русский язык и обратно, а также с
итальянского языка на русский. Доступны также переводы с английского на
немецкий, французский, португальский, испанский языки и обратно, перевод с
французского на немецкий и испанский и с испанского на французский.
Тематические базы: В режиме зарегистрированного
пользователя их 10 – общая лексика, автомобили, банковское дело, деловая
корреспонденция, компьютерные игры, интернет, логистика, программное обеспечение,
спорт, путешествия.
Корректность перевода: Для перевода больших объемов или
«на понимание» переводчика вполне достаточно. Чтобы получить «чистовой» текст,
придется потратить время и усилия. Наличие тематических баз существенно
повышает качество перевода.
Частота обновления базы слов и
словосочетаний:
Фиксированная частота обновления не установлена, но все же базы время от
времени обновляются. В марте этого года вышла новая версия.
2. Описание Google Translate
Google Translate — это бесплатная
служба перевода, обеспечивающая мгновенный перевод на 57 языков. Он может
переводить слова, фразы и веб-страницы с любого поддерживаемого языка на любой
из них.
При переводе Google Translate ищет
шаблоны в сотнях миллионов документов для достижения наилучшего эффекта
перевода. Когда Google Translate обнаруживает закономерности в уже переведенных
людьми документах, он может сделать мудрые предположения, чтобы выбрать
подходящий перевод. Поиск закономерностей в больших объемах текста называется
«статистическим машинным переводом». Поскольку перевод выполняется компьютером,
не все переводы идеальны. Чем больше документов, которые переводит человек,
переводчик Google может проанализировать на данном языке, тем выше качество
перевода. Поэтому иногда точность перевода на разные языки будет отличаться.
Удобство доступа и работы: Простой дизайн. Регистрация не
требуется. Система может переводить текст и web-страницы. Есть возможность
загрузки страницы. Интерфейс русский.
Количество языков: Google переводит с/на Арабский, Английский,
Болгарский, Китайский (упрощенный), Китайский (традиционный), Хорватский,
Чешский, Датский, Голландский, Финский, Французский, Немецкий, Греческий,
Хинди, Итальянский, Корейский, Японский, Норвежский, Польский, Румынский,
Русский, Испанский, Шведский, Португальский.
Тематические базы: Подразделений не существует.
Корректность перевода: Разработан определенный подход к
качеству перевода. В систему загружаются тексты очень большого объема
(миллиарды слов). Затем для построения модели перевода применяются методы
самообучения на основе статистического анализа. При экспериментальной оценке
система показала очень хорошие результаты.
Частота обновления базы слов и
словосочетаний:
Так как сервис относительно новый, сейчас ведутся его постоянные доработки, в
том числе и в области качества перевода.
Основное различие между услугами
веб-перевода заключается в качестве перевода и реализации пользовательского
интерфейса. Будет ли он переведен на все языки, поддерживающие перевод?
Поскольку количество вводимого текста ограничено, насколько удобно его
использовать? Могу ли я сохранить свои личные настройки перевода, количество
посещений при открытии страницы, а также количество моих собственных описаний и
тем? В связи с этим большая часть этих ресурсов лицензировала переводческие
технологии крупных компаний на рынке и предоставляла дополнительные услуги.
В русскоязычной части сети Интернет translate.ru
(«ПРОМТ») является ведущим сервисом. Он подключается ко многим веб-сайтам и
порталам (например, Mail.ru) и работает на движке проприетарного настольного
переводчика PROMT. Сервис предоставляет переводы с английского, немецкого,
французского, испанского на русский язык и наоборот, а также перевод с
итальянского на русский язык. Также предоставляются переводы с английского на
немецкий, французский, португальский, испанский (и наоборот), с французского на
немецкий и испанский и с испанского на французский. Есть автоматическое
распознавание речи. Есть разные темы — общение, исследования, экономика,
компьютеры, автомобили