«Ленинка» займется сохранением данных о спецоперации из Telegram
Российская государственная библиотека (РГБ или «Ленинка») инициировала пилотный проект по сохранению архивов наиболее значимой информации о спецоперации, распространяемой в интернете. Об этом РБК рассказал глава РГБ Вадим Дуда.
Историческую и социальную значимость проекта Дуда аргументирует необходимостью сохранить для ученых будущего точные и достоверные сведения о текущих геополитических событиях. «Когда к нам приходят исследователи, которые пишут о Великой Отечественной войне, им доступен некий документальный фонд, посвященный этому периоду: есть огромное количество газет, как отечественных, так и зарубежных, — объясняет глава РГБ. — Пожелтевшая газетная полоса может быть очень точно атрибутирована, и работающий с ней ученый знает, что никто на этой полосе не изменил ни одну запятую». Однако сейчас «99% информации распространяется в интернете» и не попадает на печатные носители, отмечает Дуда. В этом случае у ученых нет гарантий того, что даже архивные версии web-страниц СМИ и постов в телеграм-каналах не будут подвержены изменениям.
На текущем этапе специалисты «Ленинки» разрабатывают методику отбора источников информации, а также систему фильтров публикуемых материалов, отмечает Дуда. Сохранению будут подлежать статьи из интернет-СМИ и влияющих на массовую аудиторию телеграм-каналов. «Я против идеи выкачивания всего, что есть в интернете, — объясняет глава РГБ. — Нужен очень осмысленный подход к тому, что было на самом деле значимым и оказало влияние на людей. Мы понимаем, что количество информационных источников за последние лет 20 увеличилось по экспоненте. В этом диком информационном потоке есть очень небольшое количество квантов информации, которые оставили какой-то след и изменили мнение сообщества. Именно их и надо научиться искать, фильтровать и сохранять в неизменном виде».
Комплектование базы данных, по замыслу авторов пилота, должно идти по гибридной модели. То есть часть информации, которая будет подлежать сохранению, отберут с помощью нейросетей, еще часть — в ручном режиме. Сведением полученных архивов займутся библиографы.
Презентация проекта запланирована на лето 2024 года. Сейчас РГБ занимается решением организационных вопросов по пилоту: созданием проектного офиса, утверждением дорожной карты проекта и формированием экспертного совета, который будет определять критерии и механику отбора сохраняемой информации.
Полноценная реализация проекта может потребовать изменения действующего законодательства, признает Дуда. Это в первую очередь касается сохранения материалов телеграм-каналов и последующего предоставления к ним публичного доступа. «За это нас могут попросту засудить, — объясняет глава РГБ. — Поэтому надо создавать определенную технологическую и нормативную базу, чтобы это все можно было законно сохранять».
Оценивать пилот, как уточняет глава «Ленинки», будет профильное Министерство культуры. Однако в поддержке со стороны министерства Дуда не сомневается: «Дело не в политике, на самом деле, а в очень спокойном, холодном, нейтральном подходе к тому, что мы не можем допустить искажения истории. Если мы этого не сделаем, кто-то ее перепишет за нас, и сделает это в электронном виде».