Aspects of documents metadata management methodology design
- 作者: Ivanovsky N.I.1
-
隶属关系:
- All-Russian Scientific and Research Institute for Records and Archives Management (VNIIDAD)
- 期: 编号 3 (2024)
- 页面: 43-49
- 栏目: Archival science and document science
- URL: https://journal-vniispk.ru/2619-1601/article/view/276966
- ID: 276966
如何引用文章
全文:
详细
The main aspects of standardization and regulation during the documents metadata management methodology design are considered.
全文:
Метаданные являются неотъемлемой частью информационной инфраструктуры организации. Они появляются в момент начала эксплуатации любой информационной системы. Однако, определяемые как данные о данных, функционально они существовали в любой организации и архивном учреждении задолго до внедрения информационных технологий и были представлены учетными и отчетными сведениями, в элементах оформления и содержании документации, картотеках и журналах регистрации, в структуре организации и ее рабочих процессах, законодательстве и локальных нормативных актах. В общем смысле метаданные, являющиеся контекстом деятельности организации, – это любая информация, которая используется для описания существенных характеристик любого объекта, совокупности объектов, функций и операций, информационных или материальных ресурсов и сохраняется организацией в целях учета, классификации, управления и использования этих объектов и сведений о них. Ключевой характеристикой метаданных в общем контексте деятельности выступает именно их описательная функция. Так, требования к составу, связям, формату, форме представления, формирования и хранения метаданных, будучи заложенными в систему управления организацией, реализуются при проектировании информационных систем, предназначенных для работы с документированной информацией.
Допустим, организация или архив только начинает внедрение информационных систем для электронного документооборота или организации хранения дел и документов, включая электронные. Это может быть система электронного документооборота (СЭД), система хранения электронных документов (СХЭД), бухгалтерская или кадровая учетная система, промышленное программное обеспечение, если оно включает функции по формированию, передаче или сохранению каких-либо электронных документов. В ходе формирования технических требований к составу данных, входящих в подлежащие автоматизации бизнес-процессы, закладывается базовая классификационная схема для данных, порядок фиксации их значений в полях и спецификация данных для этих полей. Перечень полей, выполняющих функцию описания для формируемых информационной системой объектов, будь то работники, структурные подразделения, функции или документы, и станет первым перечислением метаданных. Часть метаданных будет играть роль служебной информации для обеспечения функций системы, а часть станет составными элементами для информационных объектов.
С течением времени информационная инфраструктура организации расширяется – обрастает все большим количеством информационных систем. В рамках различных направлений деятельности организации появляются функции, охватываемые одной или несколькими информационными системами. Часть баз данных, использовавшихся для обеспечения утраченных или измененных со временем функций организации, становится основой для актуализации информационных систем и подлежит конвертации, часть остается прикреплена к действующим информационным системам, но не наполняется новыми данными, часть информационных систем заменяется новыми, но они остаются на серверах организации как справочные. В этот момент наступает время для унификации метаданных.
Унификация метаданных как на уровне отдельной организации, так и на уровне отдельного сектора промышленности или области знаний включает несколько ключевых этапов. Отличается только масштаб и правовой статус предлагаемой модели. Во-первых, это унификация имен полей данных буквально таким образом, чтобы одни и те же характеристики подобных объектов имели схожее название по смыслу или вплоть до символа. Во-вторых, это унификация формата данных, то есть значений, привязанных к наименованиям полей. От простого распределения на текстовые и числовые поля, поля дат [1] и поля наименований географических объектов [2] до более сложных полей с заложенными в них условием или структурой, например, регистрационный номер документа или поле, в которое вложено несколько значений, таких как согласования документа или автор документа.
Следующим этапом унификации метаданных является конструирование моделей данных для определенной сферы деятельности или области знаний. Результатом этой работы становятся схемы метаданных, описывающие какой-либо стандартизируемый объект или группу объектов, которые могут как носить методический характер и быть расширяемыми, так и являться завершенным списком полей, представляя подробную спецификацию файла метаданных. Именно на этом уровне находится бóльшая часть стандартов и нормативных документов, регламентирующих схемы метаданных, – от общих, например, Дублинского ядра – словаря понятий английского языка для унификации элементов метаданных, до более узких, посвященных отдельной области знаний, например, для управления документами – ГОСТ Р 7.0.109-2024 «Система стандартов по информации, библиотечному и издательскому делу (СИБИД). Информация и документация. Управление документами. Логическая структура, состав метаданных документов и требования к их содержанию» [3], а также ряд зарубежных стандартов, например, стандарт «Сохранение метаданных: стратегии внедрения» – PREMIS (PREservation Metadata: Implementation Strategies) [4], ISO 14721:2012 «Космические системы передачи данных и информации. Открытая архивная информационная система. Эталонная модель» (Space data and information transfer systems – Open archival information system (OAIS) – Reference model) и EAD (Encoded Archival Description – Кодированное архивное описание)[1], применяемые при комплектовании и обеспечении сохранности электронных архивных документов и для формирования архивных описаний для цифровых архивных коллекций. Подробный обзор зарубежного опыта стандартизации метаданных документов содержится в статье А.Г. Бороздиной [5]. Более частными примерами унификации состава элементов метаданных являются стандарты на отдельные системы документации, например, для киноархивов – DIN EN 15907:2010 «Идентификация фильмов. Повышение совместимости метаданных. Наборы и структуры элементов» (Film identification – Enhancing interoperability of metadata – Element sets and structures) [6], и большое количество нормативных документов, устанавливающих схемы метаданных для осуществления конкретной функции или для конкретного объекта. Например, «Требования к организационно-техническому взаимодействию государственных органов и государственных организаций», утвержденные приказом Министерства цифрового развития, связи и массовых коммуникаций Российской Федерации и Федеральной службы охраны Российской Федерации от 4 декабря 2020 года № 667/233, закрепляют состав обязательных полей и спецификации значений для электронных сообщений, передающихся в рамках межведомственного электронного документооборота. А приказ Федеральной налоговой службы от 16 февраля 2023 года № ЕД-7-26/115@ «Об утверждении XML формата представления договорного документа в электронной форме» устанавливает перечень типовых наименований элементов содержания сделки и предназначен для использования при составлении любого договорного документа (договора, соглашения, дополнительного соглашения, приложений к ним и т.п.) в электронной форме. Таким образом, модели метаданных могут быть как рекомендательными, открытыми и общими, так и нормативно закрепленными и частными. Их общей особенностью является именно способ фиксации требований к элементам метаданных, где каждое поле данных получает статус обязательного или рекомендованного, указываются количество упоминаний конкретного элемента для стандартизируемого объекта и формат данных для каждого элемента, а основным отличием является масштаб регулирования – от информационных технологий в целом, целых областей знаний и систем документации до конкретных функций и форм документов. Заметное сходство в способе регулирования состава полей данных и схем метаданных независимо от их масштаба вызвано, в первую очередь, техническими особенностями этого процесса. Выходные формы файлов метаданных для каждого из приведенных форматов реализуются в формате XML – открытом расширяемом языке разметки документов, форматов, поддерживающих XML, например, семейством форматов PFD/A – нормативно предпочтительным во многих странах, включая Россию, для создания электронных документов. Помимо формата реализации метаданных файлов, важное значение имеет широкое распространение языка UML – унифицированного языка моделирования, принципы которого используются в том числе для моделирования общих и частных схем метаданных, словарей понятий и оказывают значительное влияние на базовые подходы к унификации элементов метаданных, что особенно заметно на примере стандартов Международной организации по стандартизации – ISO (International Organization for Standardization).
Следующий уровень унификации метаданных – это стандарты управления метаданными и в целом информационной инфраструктурой организаций. Ключевым стандартом в области документоведения и архивного дела является ГОСТ Р ИСО 15489-1-2019 «Информация и документация. Управление документами. Часть 1. Понятия и принципы» [7], устанавливающий как цели и задачи организации в управлении метаданными на всех этапах жизненного цикла документации, так и перечень средств управления документами, включая схемы метаданных документов. Общие положения о роли метаданных в управлении документами и принципы, закладываемые в процессы управления метаданными, уточнены в стандарте ГОСТ Р ИСО 23081-1-2008 «Процессы управления документами. Метаданные для документов. Часть 1. Принципы» [8]. Указанные стандарты однозначно определяют управление метаданными как неотъемлемый элемент управления документами, включая организацию оперативной работы и меры по обеспечению их долговременной сохранности.
Однако в унификации и управлении метаданными документов все еще есть непроработанная тема. Российские и зарубежные стандарты и нормативные документы классифицируют рабочие операции и информационные объекты, устанавливают требования к содержанию элементов метаданных и их формат, но не дают организациям подробной инструкции по практическому внедрению в информационные системы организаций. Источники знаний о методике внедрения стандартов о метаданных и нормативных требований к метаданным занимают отдельную нишу в области управления метаданными. Наиболее применимым и близким к практике источником информации о методике сквозного внедрения схем метаданных, унификации элементов и значений метаданных на данный момент является серия стандартов ГОСТ Р ИСО/МЭК 11179-1-2010 «Информационная технология (ИТ). Регистры метаданных (РМД)» из пяти частей. Эти стандарты описывают функциональную модель управления метаданными конечным пользователем информационных систем – источников метаданных при помощи специального программного обеспечения для регистрации значений, формата и места в общей схеме классификации данных, в том числе документов для каждого элемента метаданных, а также порядок организации выполнения работ по управлению метаданными и принципы, которыми следует руководствоваться при управлении метаданными в масштабах организации и независимо от количества внедренных информационных систем. Стоит отметить, что серия носит специальный характер и подразумевает труд работников, обладающих квалификацией в составлении словарей, лингвистике, семантике.
Упомянутый выше ГОСТ Р 7.0.109-2024 стал первым стандартом в России для унификации элементов метаданных и спецификации их значений в области документоведения и архивного дела, установив состав метаданных для управления документами на всех стадиях их жизненного цикла. Утверждение этого стандарта поставило вопрос о том, каким образом, какие работники, с помощью какого рода технологий займутся внедрением изложенных требований. Ответы на эти вопросы на долгое время зададут вектор развития электронного документооборота в России таким образом, чтобы состав и схемы метаданных любых электронных документов организаций были открытыми, унифицированными и отвечали требованиям к обеспечению сохранности электронных документов на протяжении установленных им сроков хранения, включая постоянное хранение. Это позволит сохранять и передавать во времени не только сами электронные документы, но и контекст деятельности, в котором они создавались. Для решения этих задач Всероссийским научно-исследовательским институтом документоведения и архивного дела (ВНИИДАД) ведется разработка Методических рекомендаций по применению национального стандарта «Система стандартов по информации, библиотечному и издательскому делу. Информация и документация. Управление документами. Логическая структура, состав метаданных документов и требования к их содержанию» в соответствии с Планом научно-исследовательских и опытно-конструкторских работ, выполняемых на основе государственного задания Федерального архивного агентства на 2024 год[2]. Издание этого документа станет важной вехой в адаптации сфер документоведения и архивного дела к современной практике управления документами в цифровой среде, что, в свою очередь, поспособствует актуализации и совершенствованию требований, предъявляемых этими областями к организациям.
[1] См. URL: https://www.loc.gov/ead/ (дата обращения: 25.05.2024).
[2] Приказ Федерального архивного агентства от 20.12.2023 № 166 «Об утверждении плана научно-исследовательских и опытно-конструкторских работ, выполняемых на основе государственного задания Федерального архивного агентства на 2024 год». URL: https://vniidad.ru/wp-content/uploads/2023/12/plan-niokr-2024.pdf (дата обращения: 25.05.2024).
作者简介
Nikita Ivanovsky
All-Russian Scientific and Research Institute for Records and Archives Management (VNIIDAD)
编辑信件的主要联系方式.
Email: ivanovsky@vniidad.ru
SPIN 代码: 9492-0700
senior researcher of the Department of Document Science
俄罗斯联邦, Moscow参考
- GOST R 7.0.64-2018 (ISO 8601:2004). Sistema standartov po informacii, bibliotechnomu i izdatel`skomu delu. Predstavlenie dat i vremeni. Obshhie trebovaniya [ISO 8601:2004, Data Elements and Interchange Formats – Information Interchange – Representation of Dates and Times, MOD]. Federal Agency on Technical Regulating and Metrology. Moscow; 2018. 32 p. (In Russian).
- DIN EN ISO 3166-1-2020. Codes for the representation of names of countries and their subdivisions – Part 1: Country code (ISO 3166-1:2020); English version EN ISO 3166-1:2020. Russian Standardization Institute. URL: https://www.gostinfo.ru/catalog/Details/?id=6823705 (accessed: 25.05.2024).
- GOST R 7.0.109-2024. Sistema standartov po informacii, bibliotechnomu i izdatel`skomu delu. Informaciya i dokumentaciya. Upravlenie dokumentami. Logicheskaya struktura, sostav metadanny`x dokumentov i trebovaniya k ix soderzhaniyu [System of standards on information, librarianship and publishing. Information and documentation. Records management. The logical structure, the composition of metadata for records and the requirements for their content]. Russian Standardization Institute. Moscow; 2024. 106 p. (In Russian).
- The PREMIS Data Dictionary for Preservation Metadata. PREMIS. URL: https://www.loc.gov/standards/premis/ (accessed: 25.05.2024).
- Borozdina A.G. Analiz zarubezhnogo opy`ta po vnedreniyu standartizirovanny`x sxem metadanny`x dokumentov [Analyzing the foreign experience in implementing standardized document metadata schemes]. Vestnik VNIIDAD = Herald of VNIIDAD. 2024;1:96–107. (In Russian).
- DIN EN 15907-2010. Film identification – Enhancing interoperability of metadata – Element sets and structures. filmstandards.org. URL: https://filmstandards.org/fsc/index.php/EN_15907 (accessed: 25.05.2024).
- GOST R ISO 15489-1-2019. Sistema standartov po informacii, bibliotechnomu i izdatel`skomu delu. Informaciya i dokumentaciya. Upravlenie dokumentami. Chast` 1. Ponyatiya i principy` [System of standards on information, librarianship and publishing. Information and documentation. Records management. Part 1. Concepts and principles]. Federal Agency on Technical Regulating and Metrology. Moscow; 2019. 25 p. (In Russian).
- GOST R ISO 23081-1-2008. Sistema standartov po informacii, bibliotechnomu i izdatel`skomu delu. Processy` upravleniya dokumentami. Metadanny`e dlya dokumentov. Chast` 1. Principy` [System of standards on information, librarianship and publishing. Records management processes. Metadata for records. Part 1. Principles]. Federal Agency on Technical Regulating and Metrology. Moscow; 2020. 24 p. (In Russian).
补充文件
