Контрольная работа на тему Архивы машиночитаемых данных мира: история, состав, специфика хранящихся документов.
-
Оформление работы
-
Список литературы по ГОСТу
-
Соответствие методическим рекомендациям
-
И еще 16 требований ГОСТа,которые мы проверили
Введи почту и скачай архив со всеми файлами
Ссылку для скачивания пришлем
на указанный адрес электронной почты
Содержание:
ВВЕДЕНИЕ. 3
1 Архивы машиночитаемых данных мира. 6
1.1 Основные понятия. 6
ЗАКЛЮЧЕНИЕ. 9
СПИСОК ИСПОЛЬЗОВАННЫХ ИСТОЧНИКОВ. 10
Введение:
Феномен открытых данных сегодня широко распространен и
рассматривается не только как один из аспектов развития прозрачности
правительства — именно поэтому этот термин используется чаще всего — но и как
один из драйверов развития в целом.
Открытые данные, как и многие другие концепции открытости —
открытый исходный код, открытый доступ, свободные лицензии — имеют множество
практических применений, как в общественной жизни, так и в коммерческих
продуктах.
Открытые данные – это общедоступная информация, размещенная в
Интернете в виде машиночитаемых, систематизированных данных в формате,
допускающем автоматизированную обработку, для многократного, бесплатного и
открытого использования.
Пока еще далеко говорить о полностью развитой культуре
публикации и использования открытых данных, но Россия, как и весь мир, движется
к этому.
Несмотря на негативное влияние пандемии COVID-19 на
возможности разработчиков статистики, в 2020 году был достигнут значительный
прогресс в области открытых данных. Организация Open Data Watch выпустила
отчет, в котором оценивается текущая открытость и эффективность статистических
систем стран.
В 2020 году средний показатель открытых данных в мире
увеличится на 6,4 процентных пункта и составит 48,8%. Это самый большой скачок
за всю историю существования ODIN. Также наблюдалась сильная тенденция к росту
индексов охвата и открытости.
Россия заняла 58-е место из 187 стран, набрав 59 баллов.
Самые высокие оценки были получены в области финансовой статистики и
государственных финансов. Самые низкие показатели – в здравоохранении,
образовании, гендерной сфере и международной торговле. Эксперты ссылаются на
данные в системе ЕМИСС и статистические сборники и публикации на сайте
Росстата.
Кроме того, в России выделяются следующие проблемы.
Во-первых, в стране нет государственной стратегии в области данных и
статистики, которая бы отражала приоритеты управления статистикой на ближайшие
5-10 лет.
Во-вторых, Россия не подписала международную "Хартию
открытых данных".
В-третьих, Россия не является членом Партнерства
"Открытое правительство", целью которого является достижение
конкретных обязательств национальных и субнациональных правительств по
продвижению открытого правительства, расширению возможностей граждан, борьбе с
коррупцией и использованию новых технологий для укрепления управления.
Повышение показателей открытости способствовало прогрессу
большинства стран. Однако обеспечение открытости данных остается сложной
задачей для многих стран с низким уровнем дохода.
Самая большая разница между странами с высоким и низким
уровнем дохода заключается в способности предоставлять данные в машиночитаемых
форматах. Многие страны с низким уровнем дохода публикуют данные только в
формате PDF, который не является машиночитаемым.
Когда данные предоставляются в форматах, не читаемых
компьютером, пользователи не могут легко получить доступ к данным и работать с
ними, что существенно ограничивает сферу использования данных.
Условия использования – еще один элемент открытости, по
которому существует значительный разрыв между странами с высоким и низким
уровнем дохода. Эта проблема, в отличие от машиночитаемости, не имеет ничего
общего с необходимостью финансовой поддержки, а скорее с наращиванием потенциала.
В ходе работы Open Data Watch со странами стало ясно, что
основной причиной отсутствия открытых условий использования в большинстве стран
является недостаток знаний об открытых данных и отсутствие технического и
правового потенциала.
Растущий
интерес к теме открытых данных подстегивает развитие технологий искусственного
интеллекта: для использования технологий машинного обучения необходимы наборы
данных – так называемые "обучающие выборки", которые в идеале должны
быть общедоступными, чтобы добиться сопоставимости и проверяемости результатов различных решений.
Открытые
данные — концепция, отражающая идею о том, что определенные данные должны быть
свободно доступны для машиночитаемого использования и переиздания, без
ограничений авторского права, патентов и других механизмов контроля.
Машиночитаемые
форматы данных – это форматы для представления и публикации данных, которые
предназначены для обработки машинами. К ним относятся такие форматы, как: CSV
(TSV), JSON, XML, XLSX, XLS и другие.
Открытые
данные могут поступать из различных источников. Однако самые большие наборы
данных публикуются (или готовятся к публикации) правительственными агентствами
и научным сообществом.
Заключение:
Фрагмент текста работы:
1
Архивы машиночитаемых данных мира 1.1
Основные понятия Любой государственный орган, орган местного самоуправления,
подведомственные организации обладают информацией общественной значимости,
разрабатывают и издают документы.
Такая информация и документы должны быть опубликованы в
Интернете. Для того чтобы социально значимые материалы могли быть легко
использованы для создания на их основе информационных услуг, полезных для
граждан и бизнеса, они должны быть опубликованы в специальном, так называемом
машиночитаемом, формате. Этот формат должен обеспечивать возможность
автоматической обработки опубликованных данных.
Материалы, опубликованные в этом формате, считаются открытыми
данными: будь то простая запись, официальный документ или информационная база
данных, данные могут быть использованы любым человеком действительно свободно в
любых законных целях.
Основными принципами открытых данных являются: Отсутствие
нарушений прав, полнота, актуальность, возможность редактирования, отсутствие
дискриминации в доступе, отсутствие проприетарных форматов, чистота лицензии
[1].
Инициатива открытых данных является основой Открытого
правительства во многих странах мира. С помощью открытых данных обеспечивается
прозрачность работы правительства, создается основа для гражданского контроля,
появляются новые услуги для граждан и бизнеса.
Раскрытие информации о деятельности органов государственной
власти и местного самоуправления в форме открытых данных является одной из
основных задач при формировании системы Открытого правительства.
В последние годы открытые данные стали одним из ключевых
направлений обеспечения открытости государства, прозрачности предприятий и
доступности результатов научных исследований для их воспроизводимости.
Открытые данные необходимы для развития систем искусственного
интеллекта, для которых они являются "бесплатным топливом", без
которого невозможно обучение алгоритмов на действительно больших данных и
реальных задачах [3].
Открытость и прозрачность органов государственной власти
сокращают дистанцию между ними и обычными гражданами.
Открытые данные играют ключевую роль в этом процессе, не
только обеспечивая прозрачность в принятии решений и формировании
государственной политики, но и позволяя вовлекать НПО и активные группы граждан
в создание собственных проектов для поддержки этой работы, а также предоставляя
основу для прикладных исследований академических организаций и аналитических
центров.
Открытые данные развивают идею свободного доступа к
информации, производимой государством, общественными организациями, гражданами
и даже компаниями. Эта информация может быть использована в различных целях, в
том числе коммерческих, на основе свободных лицензий, снимающих возможные
юридические ограничения.
Революционный характер концепции открытых данных заключается
в том, что она декларирует доступ к информации не только в визуальных, но и в
машиночитаемых форматах.