Аттестационная работа (ВАР/ВКР) на тему Технологии поиска информации в Интернете
-
Оформление работы
-
Список литературы по ГОСТу
-
Соответствие методическим рекомендациям
-
И еще 16 требований ГОСТа,которые мы проверили
Введи почту и скачай архив со всеми файлами
Ссылку для скачивания пришлем
на указанный адрес электронной почты
Содержание:
ВВЕДЕНИЕ 3
ГЛАВА 1. ИНФОРМАЦИОННЫЙ ПОИСК 4
1.1. Основные понятия информационного поиска в Интернете 4
1.2. История создания и развития поисковых систем 6
1.2.1. Поисковая система Archie 6
1.2.2. Поисковая система W3Catalog 7
1.2.3. Поисковая система Aliweb 8
1.2.4. Поисковая система JumpStation 8
1.2.5. Поисковая система WebCrawler 9
1.2.6. Поисковая система Yahoo 9
1.2.7. Поисковая система Google 10
1.2.8. Поисковая система MSN Search 10
1.3. Классификация поисковых систем 11
ГЛАВА 2. ТЕОРЕТИЧЕСКИЕ ОСНОВЫ ИНФОРМАЦИОННОГО ПОИСКА 13
2.1. Методы и технологии поиска 13
ГЛАВА 3. ПРАКТИЧЕСКИЕ РЕКОМЕНДАЦИИ ПО ИНФОРМАЦИОННОМУ ПОИСКУ В ИНТЕРНЕТЕ 19
3.1. Поиск документа 19
3.2. Поиск видеофрагмента 19
3.3. Поиск изображения 21
3.4. Поиск изображения по ключевым словам 22
ЗАКЛЮЧЕНИЕ 24
СПИСОК ИСПОЛЬЗОВАННЫХ ИСТОЧНИКОВ 25
Введение:
Характерной чертой информационного общества является обеспечение доступа пользователей к глобальным информационным ресурсам. Это подразумевает различные средства, с помощью которых любой пользователь может получить любую необходимую ему информацию в любое время. В последние десятилетия в связи с появлением и развитием интернета, а также с расширением и совершенствованием интернет-технологий существенно изменилась информационная среда, в которой осуществляется информационно-поисковая деятельность.
Постоянно растущие объёмы информации создают необходимость в поисковых средствах. В полной мере это относится и к Интернету, если рассматривать его как неструктурированное хранилище информации огромного размера. К примеру, в рамках форума Google Performance Summit корпорация представила официальную статистику поисковых запросов (рис.1) [1].
Рисунок 1 – Статистика запросов Google
Необходимым условием успешного планирования и проведения поисковых работ является знание всех основных существующих на сегодняшний день типов ресурсов сети, понимание технической и тематической специфики их информационного наполнения и особенностей доступа. Таким образом, несмотря на простоту интерфейса современных поисковых систем и сложность их внутренней реализации, поиск в Интернете пока ещё продолжает быть искусством. На сегодня к числу основных поисковых систем относят: Google, Яндекс, Yahoo, mail.ru.
Следовательно, актуальность работы подтверждается следующими факторами: в связи с растущим объёмом информации требуются поисковые средства; современные поисковые средства выполняют первичную фильтрацию информации; для точного поиска требуются знания функций расширенного поиска в Интернете.
Цель работы – рассмотреть технологии поиска информации в Интернете.
В соответствии с поставленной целью в работе решаются следующие задачи:
рассмотреть значение информационного поиска;
изучить теоретические основы информационного поиска;
разработать практические рекомендации по информационному поиску в интернете.
Текст работы:
Сегодня поисковые машины стали популярным и важным источником информации. Технологический мир очень быстро движется к автоматизации и искусственному интеллекту. Крупные технологические компании, такие как Google и Microsoft, владеющие популярными поисковыми системами, ведут это изменение и получают от него выгоду.
Информационный поиск представляет собой один из основных информационных процессов, которым человечество занимается с древних времен. Цель, возможности и характер поиска всегда полагались на наличие, важность и доступность информации, а также на средства организации поиска.
Поиск – это процесс, в котором в той или иной последовательности соотносится каждый искомый объект с объектом, хранящимся в массиве. Интернет поиск является процессом интерактивного поиска и получения требуемой информации с помощью компьютера из баз данных, которые расположены в Интернете. Начиная с 2019 года, к числу активно используемых поисковых систем относят Google, Sogou, Baidu, Bing, Gigablast, Mojeek, DuckDuckGo и Yandex.
Для повышения качества поиска можно использовать логические операторы и операторы, позволяющие ограничить область поиска, а также выделение определенной категории документов из списка. Каждый из операторов обладает своим сокращенным обозначением. Также можно конкретизировать поисковый запрос с помощью операторов, которые уточняют наличие запрашиваемых слов в документе.
Были разработаны практические рекомендации по поиску в Интернете: поиск документа, поиск видеофрагмента , поиск изображения, поиск изображения по ключевым словам .
Таким образом, цель, поставленная в работе, достигнута, все задачи выполнены.
Заключение:
Характерной чертой информационного общества является обеспечение доступа пользователей к глобальным информационным ресурсам. Это подразумевает различные средства, с помощью которых любой пользователь может получить любую необходимую ему информацию в любое время. В последние десятилетия в связи с появлением и развитием интернета, а также с расширением и совершенствованием интернет-технологий существенно изменилась информационная среда, в которой осуществляется информационно-поисковая деятельность.
Постоянно растущие объёмы информации создают необходимость в поисковых средствах. В полной мере это относится и к Интернету, если рассматривать его как неструктурированное хранилище информации огромного размера. К примеру, в рамках форума Google Performance Summit корпорация представила официальную статистику поисковых запросов (рис.1) [1].
Рисунок 1 – Статистика запросов Google
Необходимым условием успешного планирования и проведения поисковых работ является знание всех основных существующих на сегодняшний день типов ресурсов сети, понимание технической и тематической специфики их информационного наполнения и особенностей доступа. Таким образом, несмотря на простоту интерфейса современных поисковых систем и сложность их внутренней реализации, поиск в Интернете пока ещё продолжает быть искусством. На сегодня к числу основных поисковых систем относят: Google, Яндекс, Yahoo, mail.ru.
Следовательно, актуальность работы подтверждается следующими факторами: в связи с растущим объёмом информации требуются поисковые средства; современные поисковые средства выполняют первичную фильтрацию информации; для точного поиска требуются знания функций расширенного поиска в Интернете.
Цель работы – рассмотреть технологии поиска информации в Интернете.
В соответствии с поставленной целью в работе решаются следующие задачи:
рассмотреть значение информационного поиска;
изучить теоретические основы информационного поиска;
разработать практические рекомендации по информационному поиску в интернете.
Список литературы:
ГЛАВА 1. ИНФОРМАЦИОННЫЙ ПОИСК
1.1. Основные понятия информационного поиска в Интернете
К.К. Колин объясняет наличие разных определений термина «информация» тем, что феномен информации представляет собой многоплановое явление, которое по-разному проявляет свои свойства в различных ситуациях, а, следовательно, представители различных научных дисциплин при проведении своих исследований, как правило, используют собственные определения понятия информации, характерные лишь для данной конкретной дисциплины [11].
Информационный поиск представляет собой один из основных информационных процессов, которым человечество занимается с древних времен. Цель, возможности и характер поиска всегда полагались на наличие, важность и доступность информации, а также на средства организации поиска.
В конце 20 века стали появляться огромные массивы постоянно растущего разнообразия информации, доступной для самых широких слоев общества. Вместе с тем, появление Интернета и программно-технического обеспечения, также доступного для большинства людей, позволяет осуществлять процесс поиска информации в любое время, фактически в любом месте по любому запросу.
Поиск – это процесс, в котором в той или иной последовательности соотносится каждый искомый объект с объектом, хранящимся в массиве [2]. Интернет поиск является процессом интерактивного поиска и получения требуемой информации с помощью компьютера из баз данных, которые расположены в Интернете. Целью всякого поиска является потребность, необходимость или желание найти разные типы информации, которые нужны пользователю с целью повышения своего профессионального, культурного и любого другого уровня.
В соответствии с ГОСТ 7.73.96 информационная потребность – необходимость найти сведения по определенному запросу [9]. Ключевые слова – набор понятий и терминов, характеризующих информационную потребность, и определение отношений между ними [4].
Существуют разные толкования понятия «информационный поиск». Понятие «информационный поиск» определил американский математик К. Муэрс. Он отметил, что мотивом такого поиска является информационная потребность, выраженная в форме информационного запроса. К объектам информационного поиска К. Муэрс относил документы, сведения об их присутствии и (или) местонахождении, фактические сведения [6].
С позиции применения компьютерного оборудования и на основании определения по ГОСТ 7.73.96 «информационный поиск» – это комплекс логических и технических операций с конечной целью поиска документов, сведений о них, фактов, данных, имеющих отношение к запросу пользователя [9]. А релевантность поиска – это соответствие, определяемое в процессе информационного поиска, содержания документа и информационного запроса [9].
Начиная с 1960-х годов, появились автоматизированные поисковые системы, работающие с информацией. Как отмечают авторы, поисковая система – это системное программное обеспечение, которое предназначено для проведения веб-поиска (поиск в Интернете), что означает поиск на систематической основе конкретной информации, указанной в текстовом поисковом запросе [8].
Поисковый запрос – это конкретная последовательность символов, вводимая пользователем в поисковой строке поисковой системы с целью определения интересующей его информации [10].
Поиск информации предполагает применение конкретных стратегий, методов, механизмов и инструментов [13, 19]. Поведение пользователя, управляющего процессом поиска, определено не только информационной потребностью, но и инструментальным многообразием системы – технологиями и инструментами, предоставляемыми системой.
Стратегия поиска – это общий план (концепция, предпочтение, установка) поведения системы либо пользователя для выражения и удовлетворения информационной потребности пользователя, обусловленной как характером цели и видом поиска, так и системными «стратегическими» решениями [7].
Метод поиска, на основании трудов Анненкова И.С. и Пименова Е.Н представляет собой комплекс моделей и алгоритмов для реализации отдельных технологических этапов: построение поискового запроса, расширение и переформулировка запроса, локализация и оценка выдачи [3, 16].
В соответствии с мнением Постникова А.Н. поисковые механизмы – это комплекс моделей и алгоритмов, реализуемых в системе процесса формирования выдачи документов в ответ на поисковый запрос [20].
На основании работ Симанкова В.С. и Федотова А.М. поисковые технологии – это унифицированные последовательности эффективного использования отдельных поисковых инструментов в процессе взаимодействия пользователя с системой для получения устойчивых конечных и промежуточных результатов [23, 27].
Таким образом, можно отметить, что поиск информации в Интернете сегодня – это последовательность действий, от определения предмета поиска, до получения ответа на имеющиеся вопросы с применением поисковых методов, механизмов и технологий, которые предоставляет Интернет.
1.2. История создания и развития поисковых систем
Сами по себе поисковые системы в Интернете предшествовали дебюту Интернета в декабре 1990 года. Поиск пользователей «Whois» начался в 1982 году, а многосетевой поиск пользователей информационной службы Knowbot был впервые реализован в 1989 году [17].
1.2.1. Поисковая система Archie
Первым хорошо документированным поисковым механизмом, который искал файлы контента, а именно файлы FTP, был Archie (рис.2), который дебютировал 10 сентября 1990 года [18].