Особенности оцифровки документов в современных архивах

В настоящее время все больше внимания уделяется вопросам сохранности культурных ценностей. В этой связи утверждаются государственные программы, в рамках которых, по замыслу их создателей, применение новых технологий, инновационных подходов, а также мирового опыта позволит обеспечить сохранность культурного наследия, исторически значимых документов. Поэтому сегодня архивы России осуществляют перевод бумажных документов в электронный вид. О том, что послужило началом этой масштабной работы, с какими трудностями сталкиваются архивисты и как решают вопросы сохранности оцифрованных документов, заместитель руководителя Федерального архивного агентства (Росархива) Олег Наумов рассказал корреспонденту PC Week/RE Ольге Звонаревой.

PC Week: Расскажите, пожалуйста, как начинался процесс оцифровки архивных документов, каковы особенности этой работы?

Олег Наумов: Задача массового перевода архивных документов в электронный вид была поставлена в программе “Информационное общество (2011—2020)”. Это совсем непростая задача. К тому же одно дело — оцифровка документов, а другое — оцифровка научно-справочного аппарата (НСА), без которого не найти нужного документа. Поэтому, когда года два назад появилась возможность нормального финансирования работ в рамках федеральной целевой программы “Культура России 2012—2018”, в первую очередь стали создавать в электронном виде НСА, позволяющий эффективно искать документы.

PC Week: Какое программное обеспечение используется при этом?

О. Н.: Задолго до принятия программы “Информационное общество” Росархив начал разработку общероссийского стандартизированного ПО организации учета документов — программный комплекс “Архивный фонд”. Система, являющаяся собственностью Российской Федерации, внедрена на уровне федеральных, региональных и муниципальных архивов. С ее использованием создан центральный фондовый каталог, размещенный на портале “Архивы России”. Изначально “Архивный фонд” создавался как учетный аппарат, но потом его стали использовать как поисковый. Сейчас в ряде архивов используются специализированные поисковые системы.

PC Week: Опыт какого архива был основополагающим в деле оцифровки описей?

О. Н.: Первым, кто у нас оцифровал все описи, исключительно в силу сложившихся обстоятельств, стал Российский государственный Исторический архив в Санкт-Петербурге. Когда встал вопрос о его переезде, описи были отсканированы, и их электронные образы использовались на всех этапах перемещения, т. е. отслеживалась каждая коробка, каждое дело.

Это был хороший опыт, но с точки зрения развития информационных технологий он был не очень удачным. Хотя появилась возможность ознакомиться с ними в читальном зале и в онлайн-режиме, коллекция графических образов не позволяет проводить автоматизированный поиск. Куда большие удобства предоставляют пользователям описи, переведенные в формат базы данных, с возможностью простого и расширенного поиска. Росархив начал активно финансировать эти работы. К настоящему времени сделано порядка 20—30% описей федеральных архивов.

PC Week: С какими трудностями сталкиваются архивы при оцифровке документов?

О. Н. Первая проблема — огромный объем. Общий объем Архивного фонда РФ составляет 494 млн. дел, из них 9% приходится на федеральные архивы.

Но самое сложное — это определить, какие именно документы следует оцифровывать. Самый простой ответ — наиболее востребованные. А как определить эту востребованность? Сегодня востребовано одно, завтра — другое. И в советское время было введено понятие особо ценных архивных фондов и документов. На них создавался страховой фонд на микропленке, а также фонд пользования. Однако сегодня эти документы практически не востребованы. То есть критерии ценности и востребованности документов советской эпохи совершенно не работают сейчас. Спрос меняется постоянно. Определить наверняка, какие документы будут наиболее востребованными, практически невозможно.

Немаловажной является и техническая сторона вопроса. Например, возник огромный спрос на составление собственных родословных. Дело хорошее и нужное. Стали активно заказывать эти дела: метрические книги, ревизские сказки. Но они абсолютно не приспособлены для такого массового использования. Сканировать их как наиболее востребованные — нонсенс. Из книги толщиной в 80 см человеку нужна только одна страница. А чтобы удовлетворить этот спрос, нужно сканировать всю тысячу страниц. Да еще и с оборотом. Но, с другой стороны, если отсканировать эти документы, то подлинники выводятся из оборота и гарантируется их физическая сохранность. Они все уникальные. И самое главное, несчастные хранители (среди которых немало женщин) не будут таскать на руках все эти тонны бумаг.

Однако тут мы упираемся в форму предоставления информации. Ведь пользователю куда интереснее было получить не образ, а расшифровку и БД. А массив этих документов огромен. Только в РГАДА в фонде 350 “Ландратские книги и ревизские книги” — пять с лишним тысяч дел, около 3 млн. стр. Сколько людей нужно привлечь? В Перми нашли хороший выход: привлекли финансы, которые выделялись для обеспечения рабочих мест. Работа выполнялась людьми на дому. Успешно решили проблему безработицы. И в итоге у них получилось сделать то, что больше никому в России, на моей памяти, сделать не удалось.

Имеющийся опыт сканирования в федеральных архивах позволяет сделать два вывода. Во-первых, создавать электронный фонд пользования без создания НСА — занятие малопродуктивное. Получается огромная куча сканов, где невозможно найти нужный. Во-вторых, сканированию, особенно массовому, целесообразно подвергать законченные комплексы — фонды или описи. При этом дела должны сканироваться целиком, дабы избежать конфликтов в случае ошибок в нумерации. В отдельных случаях, в силу уникальности и значимости документов, вне зависимости от того, есть на оборотной стороне листа какой-либо текст или нет, нужно оцифровывать лист, включая оборот. Тогда и вопрос о том, что мы, возможно, что-то утаили, отпадает.

Есть проблема с выбором оборудования. Где-то нужен простой сканер, где-то он должен быть сложнее. К примеру, для оцифровки ландратских книг специально заказывали “глубокую колыбель”. Иначе не скопировать, потому что толщина корешка некоторых книг достигает 80 см.

PC Week: Какова основная цель оцифровки в настоящее время?

О. Н. Их три. Первая — расширение и облегчение доступа к документам Архивного фонда. Вторая — обеспечение сохранности подлинников путем вывода их из оборота и предоставление доступа к электронному фонду пользования. Третья — упрощение предоставления государственных услуг. Сейчас появляется много индивидуальных запросов граждан на документы по личному составу. Архивы начинают их также оцифровывать и использовать электронные копии для подготовки ответов, что значительно ускоряет работу.

PC Week: А как архивы оцифровывают документы?

О. Н. Процесс идет по-разному: где-то делают сами, используя подручные средства или приобретая разнообразную технику. Второй путь — это привлечение сторонних организаций. Но все-таки на самый главный вопрос однозначного ответа пока нет: к чему мы стремимся, оцифровывая документы?

PC Week: И никто им не задается?

О. Н. Почему, все задаются. Но как найти единственно верный ответ? Конечно, преимущество использования оцифрованных документов, очевидно. Это и, обеспечение сохранности, и удаленный доступ, и простота предоставления информации, и простота изготовления копий — полный спектр плюсов. Другое дело, как этого достичь? Вот вы пользователь, вы зашли на сайт и определили, что нужные вам документы находятся на хранении. Допустим, в Перми. Зашли на сайт по ссылке, нашли описи дел. Интересующее дело есть. И как его получить? Хорошо, если оно уже оцифровано. А если нет? Ехать самому в архив и заказывать подлинники? Или же архив должен оцифровывать все дела? Но это невозможно. Значит, по сути, остается только один вариант. Создание в каждом архиве возможности оперативного изготовления электронных копий по требованию пользователя. Причем это не обязательно может быть собственное подразделение. Это может быть и аутсорсинг. Но такая услуга должна быть оперативно предоставлена. Но изготавливать эти копии, как показывает опыт, имеет смыл только тогда, когда уже есть электронная система, которая позволит качественно и структурировано разместить эти материалы. Вот тогда это заработает. Когда мы это сделаем, и сможем ли мы это сделать, скажу честно, не знаю.

PC Week: Наверное и до утверждения программы “Информационное общество” в 2010 г. работы по оцифровке уже проводились?

О. Н. Да. Были отдельные проекты. Например, Электронный архив Коминтерна или коллекция документов СВАГ. Как правило, они реализовывались совместно с зарубежными партнерами. Собственных средств для их осуществления не хватало. Дело шло не просто. Были и технические, и методические, и организационные, и технологические сложности. Но опыт накапливался. И сейчас он очень пригодился.

PC Week: То есть уже после утверждения программы стали определять, какими должны быть основные критерии при оцифровке документов?

О. Н. Эта программа, скажем так, позволила архивистам привлечь внимание властей к тому, что проблема есть и надо ее решать. Готовить и утверждать программы по оцифровке. И привлекать под это финансы. Но на сегодняшний день нет ни одного универсального критерия. Сложно определить единый подход для всех, потому что архивы хранят совершенно разную документацию.

PC Week: То есть каждый архив фактически определял критерии сам?

О. Н. Фактически да. В принципе, это четыре критерия, они общепринятые, но не скажу, что они самые правильные. Это востребованность документов, обеспечение сохранности, облегчение работы сотрудников архива, улучшение условий обслуживания пользователей. Плюс еще ускорение работ. Если у меня на сайте есть электронный НСА, то пользователь приходит в архив подготовленным, просмотрев описи в Интернете. Если искомые документы уже оцифрованы, он имеет возможность посмотреть их у себя на компьютере, не заходя в архив, или без задержки получить в читальном зале.

PC Week: Получается, каждый архив должен сам определить, что ему оцифровывать в первую очередь?

О. Н. Совершенно верно. Это должна быть исключительно индивидуальная программа каждого архива. Нельзя сделать единую. Это зависит от многих факторов: от финансовых возможностей, от степени развития и внедрения ИТ-технологий, от конкретного спроса. Так, у кого-то очень востребованы документы по личному составу, и необходимо удовлетворять потребностям граждан. Хотя с архивной точки зрения это документы не постоянного, а временного срока хранения — 75 лет. Но это облегчает работу и помогает людям, потому что человек ждет ответа на запрос не месяц, а получает искомую информацию через два дня. Значит, надо в это вкладывать силы и средства.

PC Week: Определяя приоритеты документов, которые подлежат оцифровке, архивы согласовывают их с Росархивом?

О. Н. Если говорить о региональных архивах, то нет. Это дело каждого архива. Они присылают нам свои программы по информатизации, по оцифровке. Мы с ними знакомимся и даем свои советы. В меру своих сил им помогаем, выделяем средства ФЦП. Другое дело — федеральные архивы. Здесь позиция Росархива имеет определяющее значение. Но и тут нет универсального критерия. Для удовлетворения все возрастающего спроса на генеалогическую информацию Росархив выделил более 40 млн. руб. на перевод в электронный вид ландратских книг, хранящихся в РГАДА. Отвечая на устойчивый интерес общества к истории нашего отечества в недавнем прошлом, в июне этого года был запущен сайт “Документы советской эпохи”, где размещены образы документов личного фонда И. В. Сталина и Политбюро ЦК. Были подготовлены интернет-проекты, посвященные 1150-летию российской государственности, 400-летию окончания Смуты, 200-летию Отечественной войны 1812 года. Естественно, там были размещены образы наиболее важных и востребованных документов.

PC Week: Значит теперь в читальном зале архива будут выдавать только электронные копии, а не подлинные документы?

О. Н. В идеале нужно, чтобы человек нашел искомый документ на сайте, заказал дело и ему выдали отсканированные документы. И подлинник остается нетронутым. Однако возникают случаи, когда необходимо посмотреть подлинник. К примеру, какой бы хорошей ни была техника, водяных знаков она не передаст. А по ним можно установить дату документа. Но таких случаев один на тысячу.

PC Week: Получается, архив предоставил пользователю государственную услугу, но после оцифрованную копию документа необходимо сохранить?

О. Н. Конечно, в этом и заключается преимущество сканирования. Раньше были микрофильмы, ксерокс, машинопись. И архивист, сделав копии, отдавал их пользователю. То есть копии документа у него не оставалось. В случае с оцифровкой копия остается. Но для нее должно быть четко определено место хранения. И если впоследствии будет второй запрос, не будет надобности поднимать дело. Нужно накопить опыт такой работы.

PC Week: Каким образом определяются сроки оцифровки массивов документов?

О. Н. Сроки зависят от трех причин: от технических и финансовых возможностей и от состояния документов. Есть документы, которые сброшюрованы так, что даже самой современной техникой получить текст полностью не удается. То есть придется их расшивать, чего очень не любят ни документы, ни архивисты. Сканировать. Потом обратно сшивать. Это требует времени. Также сроки зависят от объема дел, от количества листов в них. Не так сложно отсканировать стопку бумаг стандартного формата, а вот карту размером 3х8 м — уже сложнее. По учетным документам это один лист. Но сканируется он только частями. А после в ПО надо это все “сшивать”, подгонять и смотреть, как этот документ будет выглядеть.

PC Week: Как идет работа по реализации 89-го пункта федеральной целевой программы “Культура России (2012—2018): формирование архивных электронных ресурсов и их предоставление в сети Интернет”?

О. Н. В рамках реализации этого пункта происходит оцифровка описей. Также осуществляется оцифровка документов, в том числе ландратских книг. Причем стараемся и регионам помогать: приблизительно пять-шесть регионов в год мы включаем в эту программу и выделяем от 10 до 15 млн. руб. Создаем интернет-выставки и т. д. Всего на реализацию работ по этой программе в год выделяется 67 млн.

PC Week: Распределение средств зависит от степени важности и значимости документов?

О. Н. Да. Архивами подаются заявки в определенной форме на участие, мы эти заявки рассматриваем. Также и фирмы, которые считают, что предлагают интересные вещи, подают заявки. Мы их рассматриваем, выбираем интересные перспективные решения, составляем общий план и осуществляем закупку на конкурсной основе. В прошлом году по этому мероприятию было 52 госконтракта. То есть каждую неделю мы заключали контракт.

PC Week: Вы затронули тему уже хранящихся в архиве документов, начиная с XI века, но ведь в архивы поступают и новые бумажные документы и это огромный массив. Как проводится работа с ними? Как решается вопрос по их оцифровке?

О. Н. Для нас важно только одно: относятся ли эти документы к составу архивного фонда или не относятся. То есть подлежат они постоянному сроку хранения или нет. А дальше с точки зрения использования абсолютно не важно, документы ли это XI или XXI века. В этом плане они равны. Другое дело, что на документы XI века у нас, естественно, есть страховой фонд и фонд пользования. И эти уникальные документы крайне редко выдаются на руки. Имеется специальный Государственный реестр уникальных документов РФ, который размещен на сайте Росархива и содержит их описания и электронные образы.

PC Week: В этой связи наверняка проще принять на хранение документы, переведенные в электронный формат? К примеру, вступили в силу изменения в законодательстве относительно кадровой документации, и архивы, наверное, могут принимать ее в электронном виде?

О. Н. В принципе да. Но особого смысла государственному архиву принимать современные документы по личному составу сейчас нет. Зачем? Рассчитывать пенсию? Есть Пенсионный фонд, у которого налажен специализированный учет граждан, начиная с 2000 г.

PC Week: То есть архивы не принимают документацию, хранящуюся 75 лет?

О. Н. Нет, она у нас хранится с давних времен. И сейчас мы активно ведем переговоры с тем же Пенсионным фондом, чтобы нам этот срок для бумажных документов сократили с 75 до 15 лет. Но Пенсионный фонд боится, что их электронная система может рухнуть.

А те документы, которые со временем будут поступать к нам в электронном виде — проблема очень большая и совершенно отдельная. Это вопросы, касающиеся электронного документооборота, электронных документов. Как их принимать, как хранить, это отдельная тема.

PC Week: Пока еще такие документы не поступают?

О. Н. Нет, поступают. Материалы переписи населения и сельскохозяйственной переписи ГАРФ принял в электронном виде. Другое дело, что эти переписи только в электронном виде и существуют. Но массового приема делопроизводственной документации пока нет. Тут довольно много нерешенных вопросов.

PC Week: А как быть с документами ликвидированных организаций? Их принимают на хранение?

О. Н. Принимаем. Правда, конкурсные управляющие обязаны в случае банкротства и ликвидации компании найти деньги на описание документов ликвидированных организаций, но не всегда находят.

PC Week: Под руководством Росархива находятся 15 федеральных архивов. Региональные архивы в настоящий момент выведены из-под контроля вашего ведомства?

О. Н. Да, прямого контроля над ними нет. Они подчиняются исполнительным органам субъектов федерации. Где-то это самостоятельные архивные службы. Где-то они, как и мы, входят в министерства культуры. Где-то — в министерства юстиции или непосредственно в аппарат губернатора. Но той вертикали власти, которая была в Советском Союзе и просуществовала до 2004 г., к сожалению, уже не существует. Пока мы сохраняем методическое единство. Чем можем, помогаем региональным архивам. Представители Росархива принимают участие в ежегодно проводимых в каждом федеральном округе научно-методических советах. Раз в год проводится Совет по архивному делу, где собираются архивисты со всей страны. То есть связи остаются. Мы шутим, что архивист — это такая профессия, при которой в любом городе можно оказаться без денег и вещей, прийти к коллегам архивистам, и они тебя примут, накормят и отправят домой. Есть такое братство, которое, на самом деле, не свойственно ни одной другой профессии.

PC Week: Спасибо за беседу.

Источник: http://www.pcweek.ru/ecm/article/detail.php?ID=154329
Дата: 09.09.2013
Семейные сайты на заказ
НОВОСТИ