Реферат на тему Сравнительный анализ систем машинного перевода и онлайн переводчиков Google и Socrat.
-
Оформление работы
-
Список литературы по ГОСТу
-
Соответствие методическим рекомендациям
-
И еще 16 требований ГОСТа,которые мы проверили
Введи почту и скачай архив со всеми файлами
Ссылку для скачивания пришлем
на указанный адрес электронной почты
Содержание:
Введение. 2
Глава 1. Основные понятия машинного
перевода. 3
1.1 Что такое машинный
перевод?. 3
1.2
Системы машинного перевода, их преимущества и недостатки. 4
Глава 2. Исследования эволюции и оценка эффективности
систем машинного перевода. 6
1.1Сравнительное
исследование СМП Google
и СМП Socrat 6
Заключение: 12
Список использованной литературы: 14
Приложения: 16
Введение:
Машинный перевод развивается все больше, так что
возможность замены человеческого перевода не кажется маловероятной. Тем не
менее, это довольно спорный вопрос, в какой степени машина может заменить людей
в определенных областях, включая перевод. Поиск правильного инструмента или
программы перевода является жизненно важной задачей для различных целей,
например, бизнеса. Существует множество систем машинного перевода, включая
онлайн-сервисы и программные переводчики. Часто машинный перевод определяется,
как «автоматический перевод текста или речи с одного языка на другой. В
качестве области исследований и разработок машинного перевода является самым
старым среди различных субдисциплин и приложений компьютерной науки для
изучения естественного языка. Онлайн-переводчик был впервые опробован в марте-апреле
2011 года на английском, русском, украинском, французском и немецком языках.
Работа над обзором была продолжена и завершена в октябре-декабре 2011 года,
когда туда был добавлен польский, и все языковые пары были пересмотрены в тех
же контекстах. Выбор наилучшей программы для перевода является актуальной
проблемой. В нашей работе мы рассмотрим и сравним две системы машинного
перевода — Google Translate и систему Сократ.
Актуальность работы заключается в
постоянном использовании и разработке данных программ.
Цель работы –
проанализировать выбранные нами системы машинного перевода, выделить их
основные характеристики и функции.
Объект
исследования – системы машинного перевода Google
Translate и Сократ.
Предмет
исследований – анализ выбранных систем перевода.
Данная тема выбрана для лучшего понимания машинного
перевода и для сравнения онлайн переводчиков Google и Socrat.
Заключение:
Основное внимание в статье было уделено сравнению
качества Google Translate и Socrat
Translate
с учетом направления перевода и предоставление достаточного понимания ошибок,
допущенными данными переводчиками. Подводя итоги, можно сказать, что разница между частотами разных типов
английского на русский и ошибки перевода с не достигли статистической значимости;
поэтому направление сильно влияет на качество перевода машинных переводов.
Самый важный фактор в качестве Google Translate и Socrat translate должен был помочь
пользователям решить, будет ли СМП наилучшим образом соответствовать их
потребностям и могут ли они доверять его переведенным результатам.
Из исследования, проведенного на основе модели анализа
ошибок, их частота была определена для
выполнения автоматической оценки показателей с целью улучшения системы.
Машинные переводы, как вспомогательные средства для человеческого перевода,
помимо огромного развития технологий в использовании компьютеров, учли оценку
машинного перевода. Качественное расследование
переводчиков как системы машинного перевода, и анализ его слабых мест
позволил выявить ряд идей для улучшения программного обеспечения будущего. А
также помощь пользователям корректировать свои ожидания и лучше понимать
практическое значение.
Кроме того, машинный перевод — неизвестная область
исследований в Англии, и для ее изучения необходимо приложить немало усилий.
Это исследование, помимо других исследований, проведенных в Англии, может
помочь экспертам в написании более качественных компьютерных программ.
Раскрытие ошибок в этом исследовании могут сообщить разработчикам и менеджерам
проектов, чтобы понять сильные и слабые стороны СМП. Данная работа позволяет
сделать вывод о том, что на практике пока нельзя всерьез говорить о способности
машинного перевода конкурировать с человеком — на сегодняшний день ни одна
компания не может удовлетвориться качеством машинного перевода текста.
Зачастую, переводы не поддаются ни редактированию, ни пониманию. Следует
признать, что расходов на письменные переводы научно-технической литературы в
уважающей себя компании, работающей с иностранными партнерами, не избежать,
пока только человек может верно, передать смысл, стилистические оттенки и
нюансы иностранного научно-технического текста.
Фрагмент текста работы:
Глава 1. Основные понятия
машинного перевода
1.1 Что
такое машинный перевод?
Машинный перевод (МП) — это автоматический перевод
или «перевод, выполняемый компьютером», как определено в Оксфордском словаре
английского языка. Это процесс, иногда называемый естественным языком. Обработка, которая использует двуязычный набор
данных и другие языковые ресурсы для построения языка и фразы модели,
используемые для перевода текста. Поскольку вычислительная деятельность
становится все более популярной, и Интернет открывает более широкое
многоязычное и глобальное сообщество, исследования и разработки в области машин,
переводы продолжают расти быстрыми темпами.
Сегодня на рынке
доступно несколько различных типов машинного перевода, из которых наиболее
широко используются Статистический машинный перевод (СМП), машинный перевод на
основе правил и гибридный, системы, сочетающие машинный перевод на основе
правил и СМП. В
любом переводе, будь то человеческий или автоматический, значение текста на
исходном языке должно быть полностью передано его эквивалентному значению в
переводе на целевой язык. Хотя на первый взгляд это кажется простым, часто это
намного сложнее. Перевод никогда не бывает простой дословной заменой.
Переводчик-человек
должен интерпретировать и анализировать все элементы в тексте и понимать, как
каждое слово может повлиять на контекст текста. Статистический машинный перевод
использует статистические модели перевода, созданные на основе анализа
одноязычных и двуязычных данных обучения.
По сути, этот подход использует
вычислительную мощность для создания сложной модели данных для перевода одного
исходного языка на другой. Перевод выбран из обучающих данных с помощью
алгоритмов выбора наиболее часто встречающихся слов или фраз. Построение
моделей СМП — это относительно быстрый и простой процесс, который включает в
себя загрузку файлов для обучения для конкретной языковой пары и домена. Для
обучения требуется минимум два миллиона слов.
Технология СМП основана
на двуязычных корпусах, таких как память переводов и глоссарии для обучения его
изучать языковые шаблоны, и он использует одноязычные данные для повышения
беглости. СМП двигатели будут иметь более высокое качество вывода при обучении
с использованием данных обучения, специфичных для предметной области, таких
как; медицинские, финансовые или технические области. Технология СМП требует
интенсивного использования ЦП и требует обширной конфигурации оборудования для
выполнения перевода.