Часть дипломной работы на тему Выявление ключевых терминов научного текста на базе использования корпусных менеджеров
-
Оформление работы
-
Список литературы по ГОСТу
-
Соответствие методическим рекомендациям
-
И еще 16 требований ГОСТа,которые мы проверили
Введи почту и скачай архив со всеми файлами
Ссылку для скачивания пришлем
на указанный адрес электронной почты
Содержание:
Введение. 3
Глава 1. Научный стиль и
ключевые слова. 7
1.1. Особенности научного
стиля на современном этапе. 7
1.2. Определение ключевых слов
научного текста. 13
1.3. Использование ключевых
слов научного текста. 20
Глава 2. Корпусные менеджеры
как средство оптимизации работы с текстом (научным текстом) 24
2.1. Опциональность корпусных
менеджеров. 24
2.2. Применение программы,
оптимизирующей работу с текстом. 37
Заключение. 47
Список литературы 50
Введение:
Лингвистика – важная область познания, связанная
с глобально-определяющим человеческую культуру явлением – языком[1]. На современном этапе, когда
язык – на фоне «упрощающей» массовой культуры приходит в упадок – возникает глобальная
проблема дегуманизации культуры[2], а значит, деградации человечества…
Тем более важно уделить особое внимание лингвистике, ее золотому фонду – наряду
с новейшими разработками.
Очень важны на современном этапе лингвистические
аспекты, связывающие язык как чисто человеческое, сугубо гуманитарное явление (несмотря
на «математическую» стройность естественных языков разных народов…) с новейшими
техническими достижениями, на которые склонны так активно реагировать наши современники.
Компьютерные технологии, в частности корпусные менеджеры, помогают четче, гораздо
быстрее работать с текстами. Конечно, при этом нужен правильный контроль со стороны
человека – иначе прекрасное явление языка, испытывающее такие трудности выживания
в наше время, окажется, быть может, в еще более худшем положении, подчинившись масштабной
«механизации» с помощью компьютерных программ… Чтобы не допустить такой ситуации,
и необходимы работы, подобные нашей – они вникают глубже в особенности языка, современного
языка – в его различных стилях, жанрах, при этом пытаются глубоко осмыслить «соединение»
феномена языка с достижениями новейших технологий – для серьезной оптимизации, эффектизации
работы с текстами. В этом и заключается актуальность нашей работы. Кроме того –
мы намереваемся дополнительно осмысливать закономерности научного стиля, что также
актуально, ибо информационное общество во многом должно быть именно обществом науки[3] – в хорошем смысле этого слова.
Целью нашей работы является дополнительное,
более глубокое осмысление возможностей выявления ключевых терминов научного текста
на основе применения корпусных менеджеров. Исходя из этого мы поставили следующие
задачи:
1) рассмотрение
особенностей научного стиля на современном этапе;
2) рассмотрение
явления ключевых слов научного текста, их использования для различных целей, в рамках
различных процессов;
3) анализ
различных корпусных менеджеров на предмет разнообразной опциональности;
4) практическое
применение выбранной программы для демонстрации возможностей повышения эффективности
использования корпусных менеджеров для выявления ключевых слов научного текста.
Таким образом, объектом нашего исследования
являются корпусные менеджеры, а предметом – возможность их использования для выявления
ключевых слов текста научного стиля.
Несмотря на определенную новизну, определенную
неисследованность проблемы, при том что актуальность склоняет ученых разрабатывать
различные аспекты темы, появляются работы, на которые следует обратить внимание.
Какие-то из них прямо связаны с ключевыми словами научного текста (в том числе в
связи с корпусными менеджерами): Абрамов Е. Г. Подбор ключевых слов для научной
статьи // Научная периодика: проблемы и решения. 2011, № 2 (2). С. 35–40; Москвитина
Т. Н. Ключевые слова и их функции в научном тексте // Вестник Южно-Уральского государственного
гуманитарно-педагогического университета. 2009, № 11. С. 277–283; Ковязина М. А.
Извлечение ключевых терминов на базе корпуса текстов о разработке нефтяных и газовых
месторождений // Вестник Тюменского государственного университета. Гуманитарные
исследования. 2016, т. 2, № 3. С. 61–69. Какие-то – с дополнительным осмысление
закономерностей научного стиля: Черненко Н. М. Специфика научного текста // Ярославский
педагогический вестник. 2002, № 4 (33). С. 1–11; Питимирова Н. Е. Особенности текста
научного стиля // Молодой ученый. 2015, № 7 (87). С. 987–989; Владимирова Т. Л.
Язык и стиль научного текста. Томск: Изд-во Томского политехнического университета,
2010, 4 (33). С. 1–11. Определенные исследования связаны, конечно, и непосредственно
с корпусными менеджерами: Амиева А. М. и др. Инструменты корпусной лингвистки //
https://elar.urfu.ru/bitstream/10995/36257/1/ittsm-2016-34.pdf; Волоснова Ю. А.
Корпусная лингвистика: проблемы и перспективы // Лесной вестник / Forestry bulletin.
2006, № 7. С. 43–49; Ганиева И. Ф. Об использовании корпусов в лингвистических исследованиях
// Вестник Башкирского университета. 2007, № 4. С. 104–106; Жевнерович Е. Э. Корпус текстов в научном
исследовании // https://elib.bsu.by/bitstream/123456789/194051/1/25-32.pdf; Зубов А. В. Корпусная лингвистика: возможности
и перспективы // Русский язык: система и функционирование (к 80-летию профессора
П. П. Шубы): материалы III Междунар. науч. конф., Минск, 6–7 апр. 2006 г., в 2 ч.
/ редкол. И. С. Ровдо (отв. ред.) [и др.]. Минск: РИВШ, 2006. Ч. 1. С. 22–27; Иргизова
К. В. Корпусная лингвистика в отечественном и зарубежном языкознании на современном
этапе // Огарев-online.
2019, № 6 (127). С. 9; 13. Райскина В.
А., Дуткина О. А. Современные методы корпусной лингвистики при анализе текста (на
примере корпуса BFM) // Актуальные вопросы современной науки. 2015, № 40. С. 146–154 [1] Федоров М. А. Язык как феномен
культуры // Вестник Иркутского государственного технического университета. 2013,
№ 6 (77). С. 291–295; Малько Е. С. Язык
как социокультурным феномен: постановка проблемы // Теория и практика общественного развития. 2012,
вып. 6. С. 18–22 [2] Соколова А. А., Дык А. Г., Каленчук
Т. В. Дегуманизация современного общества и духовная безопасность // Вестник
Полесского государственного университета. Серия общественных и гуманитарных
наук. 2019, № 1. С. 48–53 [3] Никифоров А. Л. Роль науки в
современном обществе // Философия науки и техники. 2014, т. 19, № 1. С. 38–63;
Касавина Н. А. Наука в современном российском обществе. Аналитический обзор // Epistemology
& Philosophy of Science. 2014, т. 42, № 4. С. 77–91
Заключение:
Обсуждение положений, предпринятое в
данной работе, было направлено на то, чтобы продемонстрировать, как корпусная
лингвистика может быть полезной основой для изучения значения в дискурсе. Хотя
корпусная лингвистика может многое предложить для синхронного исследования
значения с точки зрения частотной информации для слов, фраз или конструкций,
используемых в дискурсе, особое внимание в этой статье было уделено обсуждению
того, как она также может быть важной основой для изучения нестабильной и
спорной природы значения.
Методы анализа текста могут повысить
эффективность работы благодаря автоматизированной системе выбора, обработки и
публикации результатов. "Корпус" означает "объединенный,
организованный и размеченный набор языковых данных (речевых данных) в электронной
форме". Традиционные методы грамматического анализа позволяют выполнять
все вышеперечисленные задачи, но их низкая эффективность приводит к более
широкому использованию методов компьютерного анализа текста. Таким образом,
сочетание традиционных методов с языковыми методами улучшает качество анализа
текста и всего исследования. Преимущество грамматических подходов corpus
заключается в способности вычислять и компилировать объективную и достоверную
статистику и, следовательно, основывать исследование не на гипотезах и
гипотезах, а на точных эмпирических данных. Функция текстового анализа текста —
это разнообразный поиск, контекстное и согласное резюме, расчет частоты
использования и сводка статистики, а также анализ текстовых меток и резюме
собственного подтекста текста.
Научные исследования в рамках разных
языках, то, возможно, задумана как цель текста или набора текстов, а
предполагает сначала выбор темы, затем анализ и обработка большого объема
текста с целью выявления определенных моделей языка. Обычные грамматические
методы анализа текста позволяют выполнять все вышеперечисленные задачи, но их
низкая эффективность приводит к все большему использованию методов
компьютерного анализа текста, что снижает рабочую нагрузку. Лингвист, но в то
же время увеличивая объем обработанных данных, а также избежать неточностей и
просчетов. Таким образом, компьютерный анализ текста позволяет установить
грамматические модели, основанные не на теоретических данных, а на эмпирических
данных.
В этом контексте Лингвистика корпуса
или вычислительная Лингвистика ("лингвистический корпус" или
"текстовый корпус"), которая является отраслью аналитической
лингвистики, которая разрабатывает общие принципы построения и использования
грамматического корпуса в компьютерных технологиях. современная прикладная
лингвистика. В рамках лингвистики "корпус" означает
"объединенный, организованный и обозначенный набор лингвистических данных
(речевых данных) в электронном виде, предназначенных для определенных
философских и в целом гуманитарных исследований".
Основа чтения и интерпретации текстов и
текстовых сегментов в их интердискурсивных условиях возникновения, созданная на
основе работ Фуко и Пече, позволяет аналитику изучать значения лексических
единиц через их парафразы в различных дискурсах. Для того чтобы иметь
возможность анализировать дискурс в смысле Фуко с лингвистической точки зрения,
нам необходимо обратиться к текстам, произведенным внутри сообщества говорящих,
разграниченных в соответствии с нашими исследовательскими целями. В этой работе
обсуждали, как корпусы, составленные в соответствии с набором заранее
определенных критериев (таких как, например, содержательные связи между
текстами и хронологическое расположение текстов), предлагают средства для
изучения возникновения значений лексических единиц в рамках рассматриваемых
дискурсивных сообществ. Именно таким образом, принципиальный сбор и детальное
документирование текстов в корпусной лингвистике позволяет получить
эмпирические доказательства утверждений, сделанных в контексте CDA, и дополняет
его качественный анализ, укрепляя интерпретативную основу.
Методы анализа текста могут значительно
повысить эффективность исследовательской деятельности благодаря автоматическому
отбору, обработке и публикации результатов. Преимущество использования методов
анализа тела также заключается в способности вычислять и компилировать
статистику, которая подтверждает или опровергает гипотезы исследования. Таким
образом, проведя физический анализ текста, можно будет обосновать исследование
не гипотезами и предположениями, а точными эмпирическими данными.
Фрагмент текста работы:
Глава 1. Научный стиль и ключевые слова 1.1. Особенности научного стиля на современном этапе Известно, что научный стиль литературного
языка используется в области техники, науки, производства. Особенности данного стиля
во многом изучены, однако и сейчас уделяется внимание особенностям научной стилистики,
ее изменениям на современном этапе[1]. Текстам, высказываниям в указанном
стиле свойственны заметная нормированность, строгий отбор языковых средств с учетом
предварительного обдумывания, в основном монологический характер речи. Важно, что
тексты научного стиля отражают этапы мыслительной деятельности автора, выдвигающего,
с опорой на факты, гипотезу, потом находит методы ее проверки, доказательства, осмысливает
с этих позиций общую систему научных знаний. Научный текст должен рационально представить
информацию некоему обобщенному адресату, способному на рациональное же восприятие.
Несмотря на современную тенденцию демократизации, «оживления» языка, которую отчасти
можно приветствовать, научный стиль должен оставаться доказательным, рациональным.
Только в случае удачного соединения рационального начала и «оживления» – что требует
большой тонкости – допустимо определенное изменение научного стиля на современном
этапе. При этом заметим, что тенденция «освобождения» языка неизбежна, и связана
она не только с примитивизацией, но и – именно – с большей легкостью и тонкостью
владения языковыми средствами, что будет проявляться и в научном стиле (который
в любом случае должен оставаться стилем живого человеческого языка! Исследователи,
по крайней мере, говорят о «скрытой эмоциональности» научного текста[2], как о реализации неизбежной
эмотивной функции языка).
Если говорить о признаках научной коммуникации,
то можно сказать о –
§ научной
тематике;
§ логичности,
доказательности;
§ объективном
характере изложения;
§ строгом
определении понятий;
§ стремлении
к обобщению, абстракции;
§ насыщенности
фактической информацией при сжатости изложения.
Здесь важна однозначность высказываний при
насыщенном содержании.
Если говорить о функциях такого изложения,
то следует отметить:
§ передачу
логической информации,
§ доказательство
ее истинности, новизны, ценности;
§ кроме
того – активизацию логического мышления читателя или слушателя.
Вот эта последняя функция на современном
этапе требует особой оговорки. Поскольку (если сминусовать негативное воздействие
массовой культуры, с которым следует бороться) мы живем в социуме, обладающем огромными
возможностями информации, коммуникации, передвижения и т. д., то уровень творческой
активности, активности мышления должен увеличиваться! Это накладывает дополнительную
ответственность на функцию активизации логического мышления в рамках научного текста.
Здесь именно и необходимы более «свободные элементы» языка, не выводящие, однако,
научный стиль за его пределы, а лишь усложняющие, эффектизирующие язык науки. Вторая
из перечисленных функций также связана с современными тенденциями: доказательство
новизны, ценности знания (особенно гуманитарного) на современном этапе – не такая
простая задача, как ранее (здесь могут быть разные оценки, от которых не стоит уходить!).
Поэтому также необходимо активизировать различные способы выразительности научного
текста. Указанные моменты важны в аспекте контакта с машиной (компьютером) в рамках
тематики нашей работы.
Известно, что научный стиль делится на три
основные разновидности: собственно научный, научно-учебный, научно-популярный и
множество разновидностей, обслуживающих сферу науки[3]. Естественно: чем далее разновидность
от собственно научной, тем более могут и должны языковые средства конкретного текста
быть свободнее в хорошем смысле этого. Оценивая роль научного стиля какого-либо
языка, следует учитывать международные языки, их роль в развитии науки. Особенности
функциональных стилей и языка в целом (с учетом характера культуры, порождающей
данную лингвистическую систему) определенным образом влияют на международное употребление
языка, что становится особенно важно на современном этапе. Здесь надо учитывать
и особенности отдельных стилей, закономерностей их изменения.
Научная коммуникация закономерно чаще осуществляется
в письменной форме. Порядка 20 жанров научного стиля – письменные: например, реферат,
конспект, тезисы, аннотация, статья, отзыв. Письменные научные документы: например,
отчет о научно-исследовательских работе, опытно-конструкторской разработке, диссертация,
научный перевод, депонированная рукопись, обзорно-аналитические
материалы. При этом следует сказать, что с увеличением роли науки в современном
социуме, с развитием средств массовой коммуникации, с ростом объема научных контактов
(конференции, семинары, симпозиумы) возрастает роль устных форм научного стиля.
Устная форма в данном случае выглядит вторичной, поскольку нередко основана на заранее
подготовленном письменном тексте. Здесь следует заметить неизбежную, на наш взгляд
тенденцию того, что можно назвать научным экспромтом – по крайней мере, в плане
порождения высказывания. Для основных жанров устной научной речи – выступления в
дискуссии, доклада, др.[4] – подобная тенденция должна
быть довольно заметна с учетом «освобождения личности» современного человека в хорошем
смысле этого слова.
К источникам научной информации следует
отнести первичные документы с исходной информацией, непосредственные результаты
научных исследований (сборники научных трудов, монографии, авторефераты диссертаций
и т. д.). Кроме того, к ним относят и вторичные документы как результат логической,
аналитической переработки документов первичного характера (речь идет об информационных,
справочных, библиографических, др. изданиях). Вторичные документы дают больше почвы
для демократизации языка науки.
Заметной стилевой приметой научного текста
является повторение одних и тех же слов, что способствует точности, однозначности
высказываний, позволяет поддерживать на должном уровне четкость логического мышления.
Разумеется, нередки здесь случаи употребления слов абстрактного характера.
Если говорить о лексике, то, конечно, часто
употребляются:
общенаучные слова (иметься, предполагать,
существовать, идея, число, гипотеза, точка, система, функция, уравнение, значение,
случай, элемент, множество, процесс, часть, величина, вещество, плоскость, различный,
получить, определить, равный, др.);
термины (сила, синтез, ускорение);
общелитературная лексика, выражающая в основном
абстрактные понятия (особенность, стремление характер,);
заметны интернационализмы (агитировать (agitate),
ретроспективно (retrospect), спидометр (speed), пуризм (pure), препарировать (prepare),
феномен (phenomenon), пролонгировать (prolong), экспрессия (expression), контейнер
(container), конструкция (construction)).
С точки зрения морфологии, заметны более
сложные формы, например деепричастия, причастия (проявляя, проявляющийся, наблюдая,
наблюдаемый, проделанный, сложившийся, отмеченный). Разумеется, синтаксический уровень
широко представляет соответствующие деепричастные и причастные обороты. Синтаксический
аспект также закономерно демонстрирует боʹльшую сложность, проявляющуюся, например,
в заметном присутствии сложных синтаксических конструкций. Вводные слова, выражения
здесь реже носят эмоциональный характер, чаще они обозначают порядок мысли, источник
информации, уровень достоверности сведений (по мнению, по данным; действительно,
вероятно, возможно; во-первых, во-вторых, затем, наконец, следовательно). Для формирования
объективного характера научной речи в ее рамках нередки предложения обобщенно-личного,
безличного типа (возможно предположить, что…; всем известно, что…; допустим, что…;
в качестве примера рассмотрим…). В научном стиле изложение, как правило, ведется
от третьего лица (автор полагает…) Конечно, на современном этапе, повторим, тексты,
сформированные по подобным сложившимся строгим правилам «разбавляются» более короткими,
менее безличными высказываниям, вводными выражениями, словами иного характера и
т. д., особенно в устных жанрах, но на данный момент следует говорить о консервативных
началах, с помощью которых наука себя «держит» – сохраняя, во-первых свою сущность,
выражающуюся в языке (еще не доверяя, видимо, новым тенденциям, которые способны
обогащать речь ученых), о во-вторых – противостоя вездесущей массовой культуре,
которая действует в том числе на сознание ученых.
Если продолжать описывать заметные черты
языка науки, то следует отметить и речевые клише (следовать примеру, следовать правилам,
играть роль, иметь значение, выполнять функции, оказывать влияние)[5]. Группа слов и словосочетаний
употребляются в научных текстах преимущественно в «служебном» значении, они характеризуются
тем, что можно назвать «смысловым опустошением»: имеется в виду…, данные примеры,
в форме, в количестве, путем, заключается, является, имеется,
выступает и др.
Мы уже сказали об абстрактном характере
лексики научного стиля. Следует отметить, что нередко это – существительные, часто
отглагольные (подобные формы, можно сказать, представляют высший уровень лексико-морфологической
абстракции в языке: движение, фактор, развитие, осмысление, творчество, самосознание,
выражение, длительность, интенсивность, время, течение, условие, количество, отношение,
явление, действие, образование, свойство, изменение, распределение, влияние направление,
состояние, др.) Обратим внимание на то, что среди таких слов может быть немало иностранных
по происхождению (напрямую или в качестве словообразовательной базы), но немало
и, так сказать, собственных слов языка – что показывает пути проникновения научного
мышления в данный социум, развитие научного мышления внутри него; отметим здесь
закономерное влияние латыни. Если говорить о глагольной лекстке, то наиболее употребительными
глаголами выступают: быть, найти, иметь, получать, определять, обозначать, следует,
рассматривать, называться, требуется, являться представлять собой, др.
Нередко в рамках научного стиля для обозначения
новых явлений, понятий, предметов используются слова, словосочетания, заимствованные
из других стилей: усталость металла, солнечная батарея,
солнечный ветер, режим ожидания, материнская плата и т. д. Фразеологию стиля науки
в целом можно закономерно охарактеризовать наличием составных терминов (солнечное
сплетение, точка пересечения, прямой угол, точка кипения, точка замерзания, звонкие
согласные, сложноподчиненное предложение, причастный оборот, т. д.). Ясно, что,
имея дело со сложными явлениями действительности – как в гуманитарной, так и в естественнонаучной
сферах, – сложно осмысливая их, наука не может избежать подобной фразеологии – что
необходимо правильно учитывать при переводе (важном в эпоху глобализации), при обработке
научных текстов с помощью машин.
Текстовая стратегия научного текста – «консервативная»,
она, как правило, демонстрирует решение некоторого проблемного вопроса, касающегося
выбранного объекта, данного ранее; хотя в отдельных случаях в речь может идти о
новом объекте[6].
Подобный «эффект неожиданности», хоть и показывает современные тенденции, но отличается,
конечно, от такового в публицистике или в художественной речи. Как правило, общая
схема научного текста включает: обоснование выбора темы
с доказательством ее актуальности; описание опыта предшественников; определение
объекта, предмета научной работы; выявление целей и задач, а также методов; тезисы,
аргументов, иллюстрации, выводы. Последовательность может меняться, но и здесь наблюдается
определенный, довольно жесткий консерватизм, который оправдывает себя по сей день
и который, вероятно, будет нужен еще в течение столетий; при этом заметим, что варьирование
данной схемы, с определенных позиций, кажется наименее болезненным с точки зрения
сохранения базовых функций научного стиля методом демократизации языка науки. [1] Владимирова Т. Л. Язык и стиль
научного текста. Томск: Изд-во Томского политехнического университета, 2010, 4
(33). С. 1–11; Питимирова Н. Е.
Особенности текста научного стиля // Молодой ученый. 2015, № 7 (87). С. 987–989; Черненко Н. М. Специфика
научного текста // Ярославский педагогический вестник. 2002, № 4 (33). С.
1–11 [2] Питимирова Н. Е. Особенности
текста научного стиля // Молодой ученый. 2015, № 7 (87). С. 987–989 [3] Дубинина Г. А., Савченко Н. В.
Обучение письму научной направленности в магистратуре // Наука в современном
мире: теория и практика. Материалы II Междунар. науч.-практич. конф. Уфа, 2014.
С. 23 [4] Гордеева О. И., Пономарева. Е.
Н. Научный стиль русского языка. Томск: Изд-во Томского политехнического
университета, 2010. С. 18 [5] Гордеева О. И., Пономарева. Е.
Н. Научный стиль русского языка. Томск: Изд-во Томского политехнического
университета, 2010. С. 19 [6] Гордеева О. И., Пономарева Е.
Н. Научный стиль русского языка. Томск: Изд-во Томского политехнического
университета, 2010. С. 42