Информационные технологии в лингвистике Курсовая теория Информатика

Курсовая теория на тему Описание Национального корпуса русского языка

  • Оформление работы
  • Список литературы по ГОСТу
  • Соответствие методическим рекомендациям
  • И еще 16 требований ГОСТа,
    которые мы проверили
Нажимая на кнопку, я даю согласие
на обработку персональных данных
Фрагмент работы для ознакомления
 

Содержание:

 

Введение 3
1. Особенности информационных технологий в лингвистике 4
1.1. Прикладная лингвистика 4
1.2. Информационные технологии в лингвистике 7
2. Особенности Национального корпуса русского языка 10
2.1. Характеристика информационной системы 10
2.2. Роль в образовании 11
3. Оценка применения Национального корпуса русского языка 16
3.1. Направления использования 16
3.2. Национальный корпус русского языка как источник знаний 18
Заключение 20
Список использованной литературы 22

 

  

Введение:

 

Формирование современного информационного общества ведет к кардинальным изменениям во всех сферах жизни и деятельности человека. Идея о том, что будущий стратегический потенциал общества будет состоять не из материи и энергии, а из информации и научных знаний, все больше утверждается в умах людей. В ближайшее время реально социально защищенными могут стать только социально образованные люди, способные гибко перестраивать направление и содержание своей деятельности в связи с изменениями технологических или рыночных требований.
В настоящее время знание информационных технологий ставится наравне с такими качествами, как умение читать и писать. Сегодня специалист с высшим образованием должен свободно ориентироваться в глобальном информационном пространстве, обладать необходимыми знаниями и навыками для поиска, обработки и хранения информации с использованием современных информационных технологий, компьютерных систем и сетей.
Объект исследования: Национальный корпус русского языка
Предмет исследования: информационные технологии в лингвистике
Цель исследования: описать Национальный корпус русского языка
Основные задачи исследования:
— определить особенности применения информационных технологий в лингвистике;
— описать специфику Национального корпуса русского языка;
— оценить применение Национального корпуса русского языка.
Методологическая основа исследования основывается на таких методах как синтез, анализ, индукция и дедукция.
Структура работы включает в себя введение, 3 главы с параграфами, заключение и список литературы.

Не хочешь рисковать и сдавать то, что уже сдавалось?!
Закажи оригинальную работу - это недорого!

Заключение:

 

Корпус представляет собой информационно-справочную систему, основанную на наборе текстов на определенном языке в электронном виде. Национальный корпус представляет данный язык на определенном этапе (или этапах) его существования и во всем многообразии жанров, стилей, территориальных и социальных вариантов и т. д.
Национальный корпус создается лингвистами (специалистами в области так называемой корпусной лингвистике, быстро развивающейся современной области языкознания) для научных исследований и обучения языку. Большинство крупных языков мира уже имеют свои национальные трупы (разные по полноте и уровню научной обработки текстов). В частности, признанной моделью является британский Национальный корпус (БНК): на него ориентированы многие другие современные здания. Среди зданий выделяется славянский язык чешского Национального корпуса, составленного при Карловом университете в Праге.
Национальный корпус имеет две важные особенности. Во-первых, он характеризуется представительным или сбалансированным составом текстов. Это означает, что корпус содержит, по возможности, все виды письменных и устных текстов, представленные в данном языке (художественные разных жанров, публицистические, учебные, научные, деловые, разговорные, диалектные и т. д.).), и что все эти тексты входят в корпус, насколько это возможно, пропорционально их доле в языке соответствующего периода. Следует иметь в виду, что хорошая представительность достигается только при значительном объеме корпуса (десятки и сотни миллионов слов).
Во-вторых, корпус содержит особую дополнительную информацию о свойствах текстов (так называемую разметку, или аннотацию). Маркировка-это главная характеристика корпуса; она отличает корпус от простых коллекций (или «библиотек») текстов, широко представленных в современном интернете, в том числе на русском языке (как, видимо, самая известная «библиотека Максима Мошкова» или, например, «русская виртуальная библиотека».
Однако такие необработанные библиотеки очень ограничены для изучения языка. Мы также не должны забывать, что библиотеки создаются теми, кого больше интересует содержание текстов, чем их языковые возможности. Для составителей Национального корпуса важны такие факторы, как привлекательность или полезность книги, ее высокая художественная или научная ценность, но не первостепенные. Национальный корпус, в отличие от электронной библиотеки, — это не собрание «интересных» или «полезных» текстов; это сборник текстов, интересных или полезных для изучения языка: Роман маленького писателя, запись обычного телефонного разговора, типичный договор аренды и, конечно же, классические произведения искусства.
Чем богаче и разнообразнее разметка, тем выше научная и образовательная ценность оболочки. В настоящее время в Национальном корпусе русского языка используется пять видов разметки: метатекстовая, морфологическая (флективная), синтаксическая, ударная и семантическая. В ближайшее время планируется внедрение словообразовательной разметки, а также упрощенной синтаксической разметки в основной части (которая отличается от глубоко аннотированный синтаксических пакет). Система маркировки постоянно совершенствуется.
Национальный корпус предназначен в первую очередь для исследований в области лексики и грамматики языка, а также тонких, но непрерывных процессов языковых изменений, происходящих в языке на протяжении сравнительно короткого периода — от одного до двух столетий. Еще одна задача корпуса-предоставить все возможные ссылки, связанные с этими областями (лексика, грамматика, акцентуация, история языка).

 

Фрагмент текста работы:

 

1. Особенности информационных технологий в лингвистике
1.1. Прикладная лингвистика

Прикладная лингвистика — это раздел лингвистики, который разрабатывает методы решения практических задач, связанных с оптимизацией использования языка как важнейшего средства человеческого общения. Комплекс задач, решаемых прикладной лингвистикой, основан на тех функциях языка, которые оптимизированы для задач прикладной лингвистики.
В частности, он обеспечивает следующие четыре функции:
1) оптимизация методов записи и хранения речевой информации;
2) оптимизация методов передачи информации
3) оптимизация интеллектуальных способностей человека, связанных с использованием языка;
4) оптимизация использования языка как средства массовой коммуникации. .
В каждом из этих разделов автор определяет конкретные задачи. Их также можно разделить на «вечные» и «новые». Задачи первого типа включают создание алфавитов и сценариев, создание систем транскрипции и транслитерации, проблемы обучения глухих и использования языка в медицине, языкового планирования, языкового дизайна, нормализации языка и т. д. Новые задачи — это такие задачи, которые можно решить с помощью современных информационных технологий .
До недавнего времени могущество любого государства определялось уровнем промышленного развития, новизной и эффективностью его технической базы. Это основано на новейшем техническом оборудовании, что технология производства материалов была улучшена. Семидесятые годы двадцатого века были периодом создания персональных компьютеров и началом развития информационного общества. Основное отличие этого общества от индустриального состоит в том, что наряду с высокоэффективными технологиями производства материалов информационные технологии начинают играть все более важную роль в объединении законов, методов и средств получения, хранения, передачи, распространения Преобразование информации. использовать компьютер .

Важно! Это только фрагмент работы для ознакомления
Скачайте архив со всеми файлами работы с помощью формы в начале страницы