Слежка на миллион: как заработать на распознавании лиц клиентов
Ханин увлекся технологиями компьютерного зрения на третьем курсе, делая курсовую работу на кафедре робототехники Бауманки. Он создал робота, который должен был сам выбирать траекторию движения, распознавая объекты на своем пути. Окончив университет, Ханин стал работать в одном из столичных НИИ, где занимался обработкой изображений. Посещая различные конференции и выставки, он обнаружил, что многие компании заинтересованы в использовании подобных технологий в целях безопасности. Чтобы хобби превратить в коммерческий проект, Ханин нашел единомышленников в научной (Иван Лаптев, профессор парижского Национального института исследований в информатике и автоматике), финансовой (Алексей Корничев, эксперт по кредитным рискам; работал в Росбанке, «Русском стандарте» и «Восточный экспресс банке») и IT-сферах (Алексей Нехаев, директор по работе с ключевыми заказчиками компании КРОК) и с их помощью подал заявку на статус резидента в инноцентр «Сколково». В марте 2012 года ее одобрили. А в апреле была учреждена компания «Вижнлабс» (бренд VisionLabs), главой и основным акционером которой стал Ханин (доля 60,5%).
Легкое решение
Инвестиции на старт проекта Ханин оценивает в $100 тыс. (около 3 млн руб. по среднему курсу 2012 года, личные средства учредителей). В 2013 году компания получила инвестиции от Фонда развития интернет-инициатив (980 тыс. руб., у ФРИИ теперь 2,2% капитала), а по итогам года показала первую прибыль. Статус резидента «Сколково» позволил основателям «Вижнлабс» познакомиться с представителями Intel и пройти трехмесячную акселерацию в компании. «Преподаватели Университета Беркли, которые читали курс, основательно промыли нам мозги — в самом хорошем смысле, — вспоминает Ханин в интервью РБК. — Окончив курс, мы четко понимали, что должны ориентировать свой продукт на один клиентский сегмент». Команда VisionLabs провела больше сотни интервью с потенциальными клиентами и определилась с нишей: распознавание лиц банковских клиентов. Спрос на технологию есть: по данным аудиторско-консалтинговой группы «Деловой профиль», ущерб банков от кредитного мошенничества в 2015 году составил порядка 25 млрд руб. Один из распространенных способов обмануть банк — взять несколько займов на одно лицо, используя поддельные документы. Предотвратить это могла бы система распознавания лиц: она сверяла фото клиента, сделанное камерой в банке, с изображением в паспорте и в базе банковских должников.
Ключевым преимуществом VisionLabs перед другими компаниями, предлагающими технологии по распознаванию лиц, является возможность интеграции системы в существующую IT-инфраструктуру компании без необходимости покупки новых камер и другого оборудования. Всю работу обеспечивает программа, которая анализирует изображения из видеопотока и сравнивает их с оцифрованной базой фотографий клиентов банка. «Мы ориентируемся на массовый сегмент — хотим дать возможность установить систему как можно большему количеству банков, — говорит Ханин. — Некоторые наши конкуренты вместе с софтом предлагают клиенту устанавливать дорогостоящие камеры и новые серверы. Дополнительные затраты на IT-инфраструктуру в разы увеличивают стоимость внедрения. Такой продукт окупается значительно дольше».
В отличие от некоторых компаний-разработчиков VisionLabs не стала использовать 3D-модель для распознавания лиц. По словам Ханина, практика показала, что в реалиях работы в коммерческом сегменте такая технологии сегодня не оправдана: все базы снимков, с которыми можно было бы сверить кадр с камер наблюдения, состоят из традиционных двухмерных изображений. «Чтобы накопить базу 3D-фотографий, потребуются годы. А нам нужен экономический эффект уже сегодня, поэтому мы приняли решение двигаться в 2D-направлении», — поясняет Ханин. Тимур Векилов, гендиректор компании «Вокорд», специализирующейся на технологиях распознавания лиц и системах безопасности, считает технологию трехмерного распознавания более перспективной, чем 2D. «Постулат о неприживаемости 3D-распознавания сродни утверждению в эпоху черно-белой фотографии, что цветная фотография никогда не приживется, а в эпоху немого кино — что звуковое кино никому не нужно, — заявил он РБК.
Идентификация пользователей банков через обработку цифрового изображения перспективна для банковского сектора, считает директор департамента управленческого консалтинга АКГ «Деловой профиль» Олег Пахомов. Но те банки, которые при распознавании используют фотографии в паспортах клиентов, столкнутся с существенным ограничением из-за низкого качества этих снимков и их скан-копий. «Получить с фотографии в паспорте релевантные антропометрические данные — так называемый биометрический ключ, который включает в себя параметры носогубного треугольника, межзрачкового расстояния и других показателей, — удается лишь в 30% случаев, — говорит Пахомов. — А для банковских систем необходима надежность срабатывания не менее 90%». Таким образом, чтобы получать качественный результат при распознавании клиентов, банкам следует расширять антропометрическую базу данных кредиторов и должников, считает эксперт.
Как работает VisionLabs
Программа VisionLabs LUNA анализирует изображение, поступающее с камер, на наличие лиц в кадре. Когда лицо обнаружено, запускается алгоритм его отслеживания в видеопотоке — программа определяет, какой из 25 кадров за секунду запечатлел лицо в лучшем качестве и ракурсе. Портрет, очищенный от фона и «довернутый» до нужного положения, отправляется на сервис распознавания. Из стандартного формата JPEG он преобразуется в дескриптор — набор неизменяемых параметров лица (в системе задействовано около 200 млн параметров), который и используется для последующего сравнения снимка с другим изображением. При этом отсеиваются такие факторы, как уровень освещенности помещения, возрастные изменения человека, прическа и макияж, наличие или отсутствие бороды и усов. Трансформация стандартной картинки в такой набор признаков и есть основное ноу-хау VisionLabs, поясняет Ханин (алгоритмы компании были признаны одними из лучших в исследовании Массачусетского университета). Дальше программа сравнивает два дескриптора и выдает ответ, занесен ли в базу попавший в кадр человек. Окончательно решение принимает человек, но собранная VisionLabs статистика говорит о том, что при идентификации лица клиента пользователь ошибается в среднем в десять раз чаще машины.
Схожесть определяется в процентах: дескрипторы могут совпадать, например, на 65 или 99% (процент совпадения устанавливает клиент). Система может допускать ошибки, которые делятся на два типа. При ошибках первого рода система поднимает ложную тревогу — ошибочно принимает человека, попавшего в кадр, за того, кто уже занесен в базу. Во втором случае она, наоборот, не узнает в посетителе занесенного в архив человека. По словам Ханина, говоря об эффективности системы по распознаванию лиц, необходимо указывать значения обоих этих показателей. «Любая компания может заявить, что ее технология идентифицирует 99% лиц с занесенными в базу снимками, не указав при этом, что каждый второй случай распознавания — ложная тревога», — объясняет он. Сама VisionLabs распознает 98% лиц при показателе 0,001 ошибки второго рода.
Большой Брат для банков
Первым крупным клиентом «Вижнлабс» должен был стать банк «Открытие» — компания выиграла тендер на установку системы, но из-за реорганизации банка реализовать проект не удалось. В сентябре 2014 года к системе подключился Лето Банк (входит в группу ВТБ24). Технология работает во всех 338 отделениях, 290 точках продаж Лето Банка и охватывает 32 тыс. точек выдач POS-кредитов в торговых точках, сообщили РБК в Лето Банке. Данные по количеству пресеченных случаев мошенничества и стоимости установки системы банк раскрыть отказался, сославшись на конфиденциальность данных. Но в сентябрьском пресс-релизе банка о запуске системы председатель правления Лето Банка Дмитрий Руденко говорит: «За полгода технология помогла банку сохранить миллионы рублей, так что наши вложения в нее мы считаем оправданными». Ханин утверждает, что система окупает себя за шесть месяцев.
В январе 2015 года VisionLabs выиграла тендер, организованный бюро кредитных историй Equifax по запуску системы распознавания лиц клиентов на межбанковском уровне. Подключившись к программе, банк может сверять фото клиентов не только с собственной базой неплательщиков, но и с базами других банков. Если человек на плохом счету в одной организации, это может послужить поводом не выдавать ему кредит в другом банке. Как сообщили РБК в Equifax, на данный момент технологией VisionLabs пользуются 14 розничных банков России и СНГ. Лето Банк и Kaspi Bank (Казахстан) интегрировали систему VisionLabs LUNA в кредитный конвейер. Другие банки пользуются межбанковским сервисом предотвращения мошенничества.
За неделю работы система распознавания лиц предотвращает три—пять случаев мошенничества и 100–200 нарушений регламента фотографирования или других ошибок персонала банка среднего размера, утверждает Ханин. Такая безопасность стоит банкам $0,1–1 млн (покупка лицензии, стоимость определяется в зависимости от числа клиентов и точек обслуживания). Еще 10–25% от суммы лицензионного платежа VisionLabs берет в качестве годовой платы за обслуживание. По оценке Ханина, выручка и прибыль компании в 2015 году вырастут на 50%, до 33 млн и 15 млн руб. соответственно.
Цифры VisionLabs
14 розничных банков России и СНГ используют систему VisionLabs LUNA
$0,1–1 млн — стоимость лицензии на установку системы
2 секунды обычно требуется на распознавание лица
3–5 случаев мошенничества в неделю пресекается благодаря VisionLabs LUNA
1–3% составил рост конверсии в продуктовом магазине, подключенном к системе
98% — точность узнавания системы VisionLabs при показателе ложного срабатывания 0,001
200 млн параметров лица учитывается в процессе идентификации
33 млн руб. — предварительная выручка «Вижнлабс» за 2015 год
15 млн руб. — предварительная чистая прибыль компании за 2015 год
Источник: данные компании
Не только банки
Ханин рассказывает, что интерес к системе VisionLabs LUNA проявляют не только банки, но и компании в сфере ретейла и HoReCa: магазины быстро поняли, что распознавание лиц клиентов может заменить традиционные программы лояльности. В некоторых банках, по словам главы «Вижнлабс», подобный подход уже используют. «Не все сотрудники обладают феноменальной памятью: постоянных клиентов часто не узнают в лицо, им приходится брать талончик и стоять в очереди к окну», — объясняет Ханин. Чтобы этого не случалось, из фотографий VIP-посетителей формируется отдельная база. Если снимок с камеры на входе в банк совпадает с изображением в такой базе, система передает сигнал управляющему отделения, который оказывает клиенту теплый прием.
Для компаний в сфере торговли команда «Вижнлабс» разработала облачный сервис Face iS, который помогает узнать клиента на входе в магазин и дает время сформировать для постоянного покупателя специальное предложение или начать обслуживать его как VIP-клиента еще в торговом зале. Ее стоимость на порядок ниже, чем VisionLabs LUNA ($0,1–100 тыс., цена зависит от проходимости магазина). Пилотный проект запущен во флагманской точке продуктовой сети «Оливье» совместно с IT-компанией Saprun. Ханин утверждает, что по результатам первых двух недель работы конверсия в магазине выросла на 1–3%. Кроме того, система предотвратила несколько случаев краж, сверяя фото посетителей с базой уже пойманных на воровстве людей. В торговой сети «Оливье» РБК не смогли прокомментировать использование продукта Face iS.
Конкурентов на российском рынке, использующих технологии собственной разработки, Ханин не видит. По его словам, большинство компаний, устанавливающих системы распознавания в банках, использует немецкие технологии. «За последний год многие российские компании-разработчики или ушли с рынка банковских решений, или стали нашими партнерами», — говорит предприниматель. Так, с компанией «Технософт» (входит в группу компаний «Техносерв»), с которой VisionLabs пересекалась в некоторых проектах, в октябре 2015 года было подписано партнерское соглашение. «Мы протестировали платформу VisionLabs и видим ее потенциал, позволяющий работать не только с биометрией лица, но и с объектами, — комментирует вице-президент по системной интеграции и программной инженерии ГК «Техносерв» Виктор Стрелков. — Они станут дополнением к уже существующим биометрическим решениям в портфеле «Технософта». Совместные проекты могут быть востребованы финансовыми и страховыми организациями, промышленными компаниями для обеспечения безопасности, проектами для безопасного города, говорят в «Техносерве». «Мы внимательно следим за развитием VisionLabs, но пока о серьезной конкуренции с ними говорить не приходится, поскольку в крупных проектах мы не пересекаемся», — отмечает Векилов из «Вокорда».
Распознавание лиц как научная задача будет полностью решена максимум через два года, уверен Александр Ханин. «Скоро эта функция станет такой же привычной, как и чайник с автоматическим отключением: создать технологию по распознаванию лиц сможет даже небольшой стартап, — продолжает он. — В лидеры выйдет не тот, кто преуспеет в разработках, а тот, чья бизнес-модель будет наиболее успешной». В 2015 году VisionLabs начала выход на зарубежные рынки. У компании есть совместный проект с Facebook (подразделение Artificial Intelligence Research) и Google (подразделение DeepMind) по интеграции инструментов для глубокого обучения нейронных сетей Torch и открытой библиотеки компьютерного зрения OpenCV. Кроме того, «Вижнлабс» запустила пилотные проекты в банках и аэропортах в США и странах Юго-Восточной Азии. Пока это незначительный сегмент в структуре доходов компании, но в 2016 году Ханин ожидает кратный рост выручки благодаря зарубежным контрактам.
Перспективы развития сервиса Ханин видит в том, чтобы научить машину отвечать на визуальные вопросы пользователя: глядя на картинку, она должна будет рассказать о ней все то, что мог бы сказать человек. Благодаря этой способности машина будет ориентироваться в пространстве и беспрепятственно коммуницировать с человеком. «Эта задача еще не решена, — говорит основатель VisionLabs, — но ученые со всего мира, в том числе и сотрудники нашей компании, уже работают в этом направлении».