Методы лингвистического анализа Курсовая с практикой Иностранные языки

Курсовая с практикой на тему Технология исследования языковых феноменов и технология описания результатов исследования

  • Оформление работы
  • Список литературы по ГОСТу
  • Соответствие методическим рекомендациям
  • И еще 16 требований ГОСТа,
    которые мы проверили
Нажимая на кнопку, я даю согласие
на обработку персональных данных
Фрагмент работы для ознакомления
 

Содержание:

 

Введение 2
Глава 1. Язык и технологии его исследования 4
1.1 Феномен языка 4
1.2. Лингвистика и языковые технологии 6
1.3. Ограничения современных языковых систем обработки. 9
Глава 2. Технология описания результатов исследования 15
2.1 Статистика описания результатов исследования 15
2.2.Новый подход: ориентированный на данные синтаксический анализ. 16
2.3. Теоретические последствия поставленного подхода. 21
Заключение 27
Список литературы: 30

  

Введение:

 

Актуальность выбранной темы является то, что сегодня повышается уровень аккультурации языков. При изучении того или иного языка возникает вопрос об определенных выражениях, которые пришли из других культур и стран. В период глобализация данная концепция представляет собой яркий характер, так как даже на формах по русскому языку, иногда используются слова, которые были заимствованы «калькой» из того же английского
какое значение языковая технология может иметь для теории языка? Обычный ответ на этот вопрос заключается в том, что применение методов и идей теоретической лингвистики в рабочих компьютерных программах является хорошим способом проверить и уточнить эти теоретические идеи. Я согласен с этим ответом и повторю его здесь. Но большая часть этой статьи посвящена несколько более умозрительному ходу мысли, который показывает, что языковые и технологические соображения могут иметь важные теоретические последствия.
Мои соображения сосредоточены на фундаментальной проблеме, с которой сталкиваются современные системы языковой обработки: проблема неоднозначности. Чтобы решить проблему неоднозначности, необходимо объединить лингвистическую информацию о структуре и значении языковых высказываний под общим знаменателем со статистическими данными о фактическом использовании языка. Я обрисую методику, которая могла бы сделать это: анализ, ориентированный на данные, путем сопоставления с аннотированным корпусом. Эта техника синтаксического анализа может представлять не только технологический интерес: она предлагает новый и привлекательный взгляд на язык и языковой факультет.
Цель данной работы заключается в теоретическом изучении феномена языка и технологии его изучения, а так же теоретические последствия синтетического анализа, который сейчас пользуется особой популярностью.
Для достижения цели ставятся такие задачи:
— изучить понятие «феномен языка»
— технологии изучения языка с точки зрения лингвистики;
— оценка представленных способов;
— теоретические последствия технологий изучения феномена языка.
Структурно работа состоит из введения, двух глав и заключения

Не хочешь рисковать и сдавать то, что уже сдавалось?!
Закажи оригинальную работу - это недорого!

Заключение:

 

Выше мы показали, что идеи, возникающие из проблем языковой технологии, могут быть интересны для лингвистической теории. Однако мы еще не показали, что эти идеи действительно верны. Много исследований все еще необходимо, чтобы решить их и проверить их. Сейчас я кратко расскажу о некоторых исследовательских вопросах, которые поднимаются здесь.
1. Прежде всего, алгоритм соответствия, который был импрессионистический нарисован выше, должен быть подробно указан, а его свойства должны быть проверены на практике. Будет особенно интересно увидеть, как такой алгоритм может иметь дело со сложными синтаксическими явлениями, такими как «движение на большие расстояния». Можно очень хорошо представить, что алгоритм оптимального сопоставления не работает исключительно с конструкциями, которые явно присутствуют в структуре поверхности предложения; «преобразования» (в классическом смысле Хомскиана) вполне могут сыграть роль в процессе синтаксического анализа.
Чтобы продемонстрировать технологическую полезность алгоритма сопоставления, его возможности устранения неоднозначности необходимо сравнить с возможностями существующих методов: обычные грамматики в сочетании с Марковскими вероятностями н-ого порядка; и вероятностные контекстно-свободные грамматики, которые уже дали обнадеживающие результаты.
2. Некоторые вопросы о статусе этих механизмов в контексте теории формальных языков заслуживают явного изучения. Прежде всего, не является априори очевидным, будут ли алгоритмы сопоставления, основанные на изложенных выше идеях, определять формальные языки, которые (кроме порядка правдоподобия между различными структурами) могут в принципе также определяться существующими грамматическими формализмами и, если это так, который. Можно также задаться вопросом о более сильных отношениях эквивалентности: возможно ли доказано, что применение алгоритма сопоставления к корпусу, который был сгенерирован определенной грамматикой, назначает те же анализы для входных предложений, что и грамматика?
Поскольку алгоритмы сопоставления определяют (частично) упорядоченные наборы предложений (возможно, недетерминированным образом), можно подумать о расширении Теории Формальных Языков, чтобы включить эти аспекты, которые до сих пор считались выпадающими из области, математической лингвистики.
3. Идеи, изложенные здесь, имеют первостепенное значение для психолингвистики. Хотя Хомский всегда подчеркивал абстрактный характер своей теории языка, психологи часто интерпретировали системы лингвистических правил как «психологически реальные». Анализ, ориентированный на данные, психологически гораздо более правдоподобен, поскольку он работает не с абстрактными правилами, а с конкретными языковыми опытами. Это имеет интересные последствия, например, для овладения языком. Поскольку мы не предполагаем абстрактную грамматику, существует полная преемственность между ранним и поздним этапами использования языка. Мы не постулируем отдельный процесс освоения языка. Это поднимает важный вопрос, конечно, о природе раннего использования языка: как работает алгоритм сопоставления, когда еще нет корпуса? Этот вопрос приносит нелингвистический компонент языковой обработки в картину: проекция семантического / прагматического контекста на лингвистический вклад. На ранних этапах использования языка этот компонент является доминирующим, а затем лингвистический компонент становится все более заметным. (Вот почему взрослые пользователи языка могут иметь «суждения о грамматичности» относительно не контекстных «примеров предложений». Начинающие пользователи языка не смогут этого сделать.)
Наша перспектива создает возможность для правдоподобной модели овладения языком: постепенное развитие лингвистического компонента языковой обработки в результате постепенного роста репертуара лингвистического опыта и возрастающей сложности этого опыта. Но будет непросто подробно описать, как происходит языковая обработка на ранних, прагматически и семантически ориентированных этапах и как более поздние, более ориентированные на структуру стратегии извлекаются из этого.
4. Методы языковой обработки, предложенные здесь, вероятно, намного более «устойчивы», чем методы, которые используются в настоящее время. Они могут лучше справляться с ошибками, т. Е. Могут делать предположения о правильном анализе ошибочного ввода.
Надежность практически важна, потому что незначительные опечатки и неграмотность часто встречаются в интерактивном буквенно-цифровом вводе с компьютера, и потому что характеристика системы ожидаемого ввода (будь то грамматика или корпус) всегда будет иметь нежелательные ограничения. При обработке разговорного языка эти проблемы еще хуже.
5. Этот подход в идеале даст алгоритмы, которые обеспечивают доказуемо оптимальный анализ их входных данных. Но мы не получаем этот результат бесплатно. Это требует объема вычислений, которые вряд ли могут быть реализованы на современном оборудовании. Поэтому реализация аннотированных корпусов и алгоритмов сопоставления является серьезной проблемой. Во-первых, мы должны быть заинтересованы в эффективной реализации на существующем оборудовании. Для действительно широкомасштабного применения этих методов может потребоваться разработка специального оборудования.
Учитывая все вышеизложенное, мы считаем выполненными поставленные цели и задачи. В заключении так же хотелось бы добавить об необходимости развития технологий исследования языка и его дальнейшего продвижения, как важной и особой дисциплины. Лингвистика является неотъемлемой частью жизни человека и способом познания его.

 

Фрагмент текста работы:

 

Язык – одна из мировых загадок. Происхождение языка (а также непосредственно связанного с ним сознания) включено англо-американским «Science» (Наука»), одним из самых авторитетных научных журналов мира, в список 125 неразрешенных научных проблем.
Язык – сложнейшая, многоэлементная система с огромным количеством правил их употребления. Может быть, только мозг с его миллиардами нейронов и сотнями тысяч миллиардов синоптических связей между ними можно уподобить языку. Профессор Сузан Гринфилд риторически спрашивает: «…Как масса ткани с консистенцией сырого яйца способна отвечать за наш «разум», наши мысли, личность, память, чувства и даже за самосознание?» Загадок мозга и языка очень много .
Например, непонятно, как люди обучаются родному языку. Овладевая языком, человек вынужден запоминать сотни тысяч правил и языковых параметров. Тем не менее, любой нормальный ребенок к трем-пяти годам становится носителем родного языка. Данное обстоятельство называют лингвистическим взрывом и чудом, а ребенка – лингвистическим гением. Ни один профессор лингвистики или чрезвычайно одаренный полиглот не способны повторить то, чего непринужденно достигают дети всех народов.
Язык – самоорганизующаяся система, в некотором смысле автономная от своего носителя. Он является инструментом, самонастраивающимся на реальность. Он сам выбирает стратегии своего использования, о чем человек чаще всего даже не отдает себе отчет. Язык сам, без участия сознания, просчитывает допустимые формальные компоненты. Особенно хорошо это видно на фонетическом уровне. В праславянском действовал закон открытого слога, которому подчинялись все слова. В немецком языке при теоретически возможных 179 словах с началом «согласный + гласный» существует лишь 57 таких слов (31,8 %). В японском языке в начале слова недопустимо стечение согласных, а в конце слова, кроме гласного, встречается только носовой согласный. В салишских языках (индейские языки на Тихоокеанском побережье США и Канады) невозможно гласное начало корня. Американский лингвист Ч. Хоккет с удивлением отмечает: «В целом же они (языковые обобщения – С.П.) указывают на нечто загадочное. Несмотря на большое разнообразие, фонологические системы мира имеют больше общего, чем это строго «необходимо». Иначе говоря, степень существующего между ними сходства оказывается более высокой, чем это требуется лишь определяющими признаками языка и известными культурными и биологическим особенностями человеческого рода».
Самое неожиданное то, что помимо регуляции своей формальной стороны, язык имеет и собственную логику, иногда понятную, иногда очень трудноуловимую. Например, в норме жидкости пьют, а еду едят: пить воду, молоко, чай; есть хлеб, овощи, сыр. Кефир – пить, простоквашу – есть, и пить, сметану – есть. Вещества с более густой, чем у простокваши, консистенцией, едят. Почему же тогда говорят, есть суп? Потому что суп осмысляется как еда, а не напиток. Он наливается в тарелку, а не в стакан. Ср. Выпить бульон, если он в стакане, съесть бульон – если он в тарелке.
Язык скрыт от непосредственного наблюдения. Воспринимаем мы его внешнюю сторону – речь. Сам язык – это определенное количество особым образом организованных элементов и правил их построения в связное высказывание. Задача лингвиста – по готовому продукту (речи) восстановить рецепт (язык).
Язык – фундаментальный уровень культуры и специфичный признак человеческой природы. Список отличий человека и животных неуклонно сокращается. Сейчас едва ли не единственным признаком, отличающим человека от остального животного мира, признается язык. Таким образом, лингвистика занимается самым важным атрибутом человеческой цивилизации, изучение которого способно пролить свет на загадку человека и Вселенной.

Важно! Это только фрагмент работы для ознакомления
Скачайте архив со всеми файлами работы с помощью формы в начале страницы

Похожие работы