Курсовая с практикой на тему Корпусная лингвистика: специфика современных метаописаний языка
-
Оформление работы
-
Список литературы по ГОСТу
-
Соответствие методическим рекомендациям
-
И еще 16 требований ГОСТа,которые мы проверили
Скачать эту работу всего за 690 рублей
Ссылку для скачивания пришлем
на указанный адрес электронной почты
на обработку персональных данных
Содержание:
Введение 3
Глава 1. Корпусная лингвистика как современная наука о языке 5
1.1 Место и роль корпусной лингвистики в современном языкознании 5
1.2 Понятие «метаописаний языка» 10
Глава 2. Метаописание текстов лингвистического корпуса 15
2.1 Метаданные текстов «Национального корпуса русского языка» (НКРЯ) 15
2.2 Модель создания лингвистического корпуса текстов по подготовке к ЕГЭ по русскому языку 18
Заключение 23
Список использованной литературы 25
Введение:
Проблема автоматической обработки информации естественного языка становится все более актуальной в современных условиях растущего информационного потока. Компьютерные технологии вошли в область лингвистики, предоставив технические возможности для обработки, сохранения и отбора лингвистического материала. Это дало толчок к возникновению и развитию новой отрасли лингвистических исследований корпусной лингвистики.
Основанный на использовании большого количества эмпирического материала и привлечении компьютерных технологий для получения объективных выводов о функционировании языковых единиц, корпус быстро превращается в ценный лингвистический ресурс. Данные, полученные с помощью корпусного анализа, помогают сформулировать новые качественные выводы о языке и очерчивают области языковых исследований, которые до появления корпусов не привлекали внимания исследователей.
Актуальность работы. Опираясь на реальный «живой» языковой материал, а не на лингвистическую интуицию и самоанализ, корпусные исследования позволяют абстрагироваться от субъективности исследователя и являются более приближёнными к объективному изучению языка. Таким образом, обработка современных метаописаний языка представляет собой актуальную область исследования ввиду большого объёма данных и постоянного их пополнения.
Теоретическая база работы. Среди исследователей, которые внесли весомый вклад в развитие корпусной лингвистики, стоит назвать имена Х. Кучеры (Kucera, 1979), Д. Байбера (Biber, 1992), Дж. Синклера (Sinclair, 1994), Г. Кеннеди (Kennedy, 1998), Н. Иде (2000), М. Банко (Васко, 1996; 2003), T. Еравца (Erjavec 2001), Т. Макенери и А. Уилсона (2001), А. Баранова (2001), С. Шарова (2002), В. Рыкова (2001, 2001), Л. Рычковой (2003) и других.
Цель работы заключается в систематизации информации о современном состоянии корпусной лингвистики и создании модели лингвистического корпуса текстов по подготовке к ЕГЭ по русскому языку. Соответственно цели, были поставлены следующие задачи работы:
1. Определить место и роль корпусной лингвистики в современном языкознании;
2. Охарактеризовать понятие «метаописание языка»;
3. Исследовать метаданные текстов «Национального корпуса русского языка» (НКРЯ);
4. Разработать модель создания лингвистического корпуса текстов по подготовке к ЕГЭ по русскому языку.
Объектом данной работы является корпусная лингвистика. Предметом – метаданные текстов корпусов русского языка.
Методами данной работы являлись структурный, который позволил проанализировать структуру терминов корпусной лингвистики; сравнительный для установления различия и общих элементов с другими лингвистическими науками; обобщение определение общего понятия, в котором находит отражение главное, основное; анализ для понимания сущности корпусной лингвистики, были проанализированы ее основные составляющие и характеристики; классификация разделение корпусов текстов по определенным признакам; моделирование – создание собственной модели лингвистического корпуса текстов.
Структура данной работы состоит из введения, двух глав, заключения и библиографии.
Заключение:
Появление электронных корпусов кардинально изменило способы изучения языковых явлений. Репрезентативные, сбалансированные и важные большие языковые данные дают информацию о динамике процессов, изменяющих состав словарного запаса языка, функционирование грамматических и синтаксических единиц, позволяют анализировать использование языковых единиц разных стилей, жанров, разных авторов и т.д.
Корпусы позволяют непосредственно наблюдать данные о реализации языковых систем, которые отражены в словарях, грамматиках и учебных материалах. Если ранние корпусные исследования фокусировались на применимости лингвистических единиц (например, частоте употребления определенных существительных, глаголов и прилагательных), то с появлением мощной компьютерной техники исследователи получили возможность выявлять и разделять.
На данном этапе своего существования корпусы широко используются как лингвистическими, так и нелингвистическими отраслями. Поэтому лингвисты-теоретики используют корпорации в качестве экспериментальной базы для проверки гипотез и доказательства своих теорий.
Прикладные лингвисты (преподаватели, переводчики и т.д.) используют корпусы текстов для обучения языкам и решения своих профессиональных задач. Компьютерные лингвисты используют статистические и лингвистические закономерности, найденные в корпусе материалов, для создания компьютерных моделей
Фрагмент текста работы:
Глава 1. Корпусная лингвистика как современная наука о языке
1.1 Место и роль корпусной лингвистики в современном языкознании
Корпусная лингвистика одно из самых перспективных направлений современной теоретической и прикладной лингвистики. Эта относительно новая отрасль науки начала активно формироваться в 1960-х годах в результате интенсивного развития компьютерных технологий. Сам термин «корпусная лингвистика» вошел в научный обиход только в последние десятилетия двадцатого века, с публикацией в 1983 году научного труда «Corpus Linguisitcs: Recent Developments in The Use Of Computer Corpora in English Language». Использование компьютеров и специального программного обеспечения, логично, кардинально изменило способы изучения языков и значительно облегчило сбор лингвистических данных.
Без особых усилий и за считанные секунды можно провести поиск в миллионах текстовых массивов (языковых корпусах), установить соответствие для любого слова, получить данные о частоте словоформ, лексических единиц, грамматических категорий, синтаксических структур, проследить изменения в частоте и контексте языковых единиц во времени, получить данные о лексической (colocation) и грамматической (coligation) совместимости и т.д. Построение базы эмпирических исследований таким образом гарантирует, что усилия и время, затраченные на сбор данных, будут минимальными, а их количество значительно увеличится.
Сегодня корпусные данные широко используются в лексикографии, стилистике, судебной лингвистике, вариантологии, переводоведении, социолингвистике, методике преподавания иностранных языков и многих других лингвистических исследованиях [Baker, 2006, с. 2-3]. Под «корпусом текстов» понимается большой, представленный