Сбербанк предложил создать медицинскую и образовательную базы данных

Для этого придется менять законодательство о персональной информации

Сбор медицинской и образовательной информации о гражданах позволит увеличить продолжительность жизни и улучшить результаты обучения, рассчитывают авторы идеи. Но работа с подобными данными несет риски их утечки, опасаются эксперты

Фото: Антон Новодережкин / ТАСС

Эксперты «Цифровой экономики» предложили создать национальный банк образовательных и медицинских данных с открытым доступом к содержащейся в них обезличенной информации. Инициатива содержится в «дорожной карте» по развитию нейротехнологии и искусственного интеллекта, за создание которой отвечал Сбербанк (копия документа и презентация к нему есть у РБК, их подлинность подтвердили три источника, близкие к разработке документов). В пятницу, 24 мая, эту и другие «дорожные карты» должен рассмотреть набсовет АНО «Цифровая экономика».

Какую информацию будут содержать базы данных о гражданах и для чего их будут использовать, разбирался РБК.

Участники проекта

Сбербанк выиграл конкурс на разработку «дорожной карты» по искусственному интеллекту 1 апреля 2019 года. Помимо банка в работе над планом участвовали «Яндекс», Mail.Ru Group, «Росатом», МТС, Центр речевых технологий, РВК и др.

Национальный банк медицинских данных будет создан на базе Минздрава при поддержке государственных и частных лечебно-профилактических учреждений. Банк образовательных данных — с помощью государственных и частных дошкольных учреждений, школ и вузов. Информация, полученная в этих организациях, будет обезличиваться, и только после этого к ней можно будет получить доступ, говорится в «дорожной карте».

Представители Сбербанка, «Росатома» и «Ростеха» (отвечают за реализацию федерального проекта «Цифровые технологии»), АНО «Цифровая экономика» отказались от комментариев.

Суть проекта

Председатель технического комитета по искусственному интеллекту на базе Российской венчурной компании (РВК) Сергей Гарбук отметил, что создать медицинские базы данных предлагали многие участники медицинской отрасли. Для работы интеллектуальных технологий требуется большое количество данных, только в этом случае они будут эффективны. Информация, накапливаемая в базах, будет доступна всем разработчикам систем искусственного интеллекта. По словам Гарбука, искусственный интеллект в медицине может использоваться для выявления признаков заболеваний (скрининг), помощи в принятии решений специалистами (советующие системы), а также в интеллектуальных системах контроля ручных манипуляций, которые, например, могут делать хирургу подсказки во время сложных операций. В «дорожной карте» также говорится, что использование искусственного интеллекта в медицине позволит делать прогнозы, управлять производительностью медицинских учреждений, осуществлять контроль качества, лучше диагностировать заболевания на ранних стадиях, разрабатывать фармацевтические препараты, а также повысить безопасность операций, в том числе за счет применения медицинских роботов.

Сбор образовательных данных и разработка на их базе специальных программ позволят улучшить ситуацию с обучением: ученик сможет получать задание в соответствии со своими способностями, а учителю не придется тратить время на выполнение рутинных операций, отмечают авторы «карты». Использовать искусственный интеллект в образовании также можно будет для раннего выявления потенциально одаренных детей, автоматического тестирования способностей, а также повышения качества оценки уровня знаний учеников, квалификации преподавателей.

Перспективы

В документах не указано, сколько планируется потратить конкретно на перечисленные мероприятия, однако общий объем финансирования разработок технологии искусственного интеллекта до 2030 года должен составить 180 млрд руб. Из них 20 млрд руб. придется на гранты от государства для проведения фундаментальных исследований, 120 млрд руб. из бюджета пойдет на поддержку коммерциализации решений. Еще порядка 40 млрд руб. потребуется на разработку прототипов и коммерческих решений, их должны предоставить частные инвесторы, предполагают авторы «дорожной карты».

Развитие искусственного интеллекта должно повысить качество медицинских услуг и точность диагностирования, а в результате — увеличить ожидаемую продолжительность жизни россиян, рассчитывают авторы документа. Ожидается, что «за счет использования продвинутого анализа данных определение последовательности человеческого ДНК обеспечит искоренение многих неизлечимых болезней, в том числе рака».

В сфере образования искусственный интеллект поможет оперативно оценивать работы студентов и учеников, а также давать индивидуальные корректировки. Программы, разрабатываемые с помощью искусственного интеллекта, способны составлять персонализированные планы обучения и улучшить качество обратной связи учителю.

Риски

Для создания баз данных сначала потребуется разработать и внедрить стандарты сбора и использования данных, особенно это актуально для медицинской информации, отметил Сергей Гарбук. «Для использования медицинских данных необходимо не просто стереть имя и фамилию, а преобразовать их так, чтобы нужная информациях об организме сохранилась, но в конфликт с законом использование таких данных не вступало», — указал он. По его словам, основные подходы к защите конфиденциальной медицинской информации мало чем отличаются от защиты сведений о банковских вкладах, объектах недвижимости или, например, маршрутах перемещения людей.

«Прежде чем предоставлять доступ к базам данных для обучения искусственного интеллекта, важно создать систему безопасности и защиты такой информации. Потребуются и законодательные изменения в части создания особого режима для работы с такими персональными данными — возможно, сначала в формате законодательной песочницы», — говорит директор по взаимодействию с госорганами ABBYY Россия Ольга Минаева.

Председатель Ассоциации участников рынков данных Иван Бегтин отметил, что почти все ценные данные в образовании так или иначе персонифицированы, а разработчиков решений на базе искусственного интеллекта интересуют данные о конкретных людях — например, для создания индивидуальной траектории обучения. Многие образовательные проекты сейчас не реализуются именно из-за того, что при работе с образовательными данными необходимо собирать массу согласий на обработку персональной информации — как с родителей, так и со взрослых учащихся, студентов. Для того чтобы создание и использование такой базы стало легальным, необходимо будет вносить изменения в существующее законодательство «О персональных данных» либо принимать новый федеральный закон.

В то же время Бегтин видит риски в создании подобной базы, связанные с возможным определением личности по неполным данным. «Такой риск присутствует в любой ситуации, когда речь идет об информации о людях, — данные, доступные в интернете, могут быть не персональными, но становятся таковыми, если дополнить их через другие открытые источники», — указал он.