Перейти к основному контенту
Технологии и медиа ,  
0 
Эксклюзив

Правообладатели раскритиковали работу «антипиратского» робота «Яндекса»

Он «не обладает ни точностью, ни корректностью работы»
Робот «Яндекса», который должен был стать одним из основных инструментов поиска пиратского контента в интернете, не оправдал ожиданий правообладателей. «Яндекс» обещает «повысить точность» программы
Фото: Станислав Тихомиров / ТАСС
Фото: Станислав Тихомиров / ТАСС

Подписавшие в ноябре прошлого года антипиратский меморандум правообладатели направили в «Яндекс» письмо, в котором высказали свое мнение относительно созданной интернет-компанией программы для поиска ссылок на пиратский контент. В письме, датированном мартом, правообладатели указывают, что «Яндекс» не предложил действенного инструмента выявления ссылок с нелегальным видео. Об этом РБК рассказали три источника в медиакомпаниях.

Ассоциация «Интернет-видео», объединяющая онлайн-кинотеатры ivi.ru, Okko, Megogo, TVZavr, Amediateka и VIP Viasat Play, не использует робот «Яндекса» для выявления пиратских ссылок для их последующего внесения в реестр, сообщил РБК гендиректор ассоциации Алексей Бырдин (ему также известно о письме правообладателей). По его словам, предложенный «Яндексом» инструмент не обладает ни точностью, ни корректностью работы с данными.

В чем претензии правообладателей и насколько они обоснованны, разбирался РБК.

Что такое антипиратский робот «Яндекса»

Правообладатели и владельцы интернет-ресурсов 1 ноября подписали так называемый антипиратский меморандум. От имени правообладателей под документом поставили свои подписи руководители ВГТРК, «Газпром-Медиа», Национальной медиа группы, «Первого канала», «СТС Медиа», объединяющей онлайн-кинотеатры ассоциации «Интернет-видео», Ассоциации продюсеров кино и телевидения и принадлежащего «Яндексу» сервиса «Кинопоиск». Со стороны интернет-площадок — «Яндекс», Rambler Group, Mail.Ru Group и RuTube.

В соответствии с меморандумом ссылки на пиратский контент по заявлению правообладателей вносятся в специальный реестр, после чего они в течение шести часов должны быть удалены из поисковой выдачи. Кроме того, подписавшие меморандум интернет-площадки должны удалять внесенный в реестр пиратский контент из своего видеохостинга и других сервисов. Срок действия меморандума ограничен 1 сентября 2019 года: к этому времени в антипиратское законодательство должны быть подготовлены поправки, соответствующие положениям меморандума.

Робот от «Яндекса» появился по собственной инициативе интернет-холдинга в марте этого года, в антипиратском меморандуме он не упоминается.

Как пояснил представитель «Яндекса», созданная программа позволяет искать интернет-страницы с контентом, которые похожи на те, что уже попали в антипиратский реестр, — для этого применяются принципы машинного обучения, рассказал «Ведомостям» представитель интернет-компании, не объяснив принцип работы робота.

Благодаря новой программе «Яндекс» за короткое время нашел несколько миллионов страниц с пиратским контентом, рассказывал операционный и финансовый директор компании Грег Абовски. По его мнению, это «ускорит процесс формирования реестра, а борьба с пиратством станет эффективнее».

Почему робот не нравится правообладателям

Робот действительно находит ссылки на сайты с признаками нарушения (например, на этих сайтах может быть запись «Игра престолов» смотреть онлайн»), но самого нарушения — наличия видеоплеера — на выявленных «Яндексом» страницах не оказалось, рассказывает Алексей Бырдин.

«Яндекс» разослал правообладателям файл с 3 млн URL-адресов, который у части правообладателей открылся в текстовой программе «Блокнот», а у части компаний не открылся совсем, утверждают представители двух медиакомпаний. По их словам, этот контент в первой версии файла не был разделен по принадлежности тому или иному правообладателю, во второй раз «Яндекс», выполнив просьбу компаний, рассортировал ссылки лишь частично.

Но и к найденным ссылкам у правообладателей возникли претензии. Один из них, как рассказывают собеседники РБК, провел выборочную проверку 1 тыс. ссылок, 67% из них оказались нерелевантными: на этих сайтах вообще не было никакого видео либо оно было легальным. Прочие ссылки не имели отношения к контенту данного правообладателя. И только две содержали пиратское видео.

Робот «Яндекса» был бы полезным, если бы не просто находил ссылки, но еще и анализировал их, указывают собеседники РБК. По их словам, эту работу для некоторых правообладателей сейчас выполняет специализирующаяся на кибербезопасности Group-IB.

Какова версия «Яндекса»

«Мы будем постоянно работать над повышением точности инструмента», — заверил РБК представитель интернет-холдинга. Он настаивает, что буквально на днях компания улучшила разметку ссылок. «В результате объем новых выборок заметно сократился и стал релевантнее. Новую выгрузку мы уже отправляем нашим партнерам», — добавил представитель «Яндекса».

Как еще ищут нелегальные ссылки

Руководитель департамента инновационной защиты бренда и интеллектуальной собственности Group-IB Андрей Бусаргин рассказал, что в поисках нелегального контента страницы проверяют на два параметра. «Во-первых, речь идет именно о том фильме, который ищем и защищаем. Для этого работает ML-алгоритм, анализирующий содержимое страницы, — пояснил Бусаргин. — Во-вторых, на этой странице действительно можно посмотреть онлайн или скачать фильм: страница анализируется на присутствие непосредственно пиратского контента — ищутся торрент-файлы, плееры для онлайн-просмотра и т.д. Полученные видео и видеопотоки сверяются с эталоном».

По его словам, для успешного функционирования системы оценки наличия пиратского контента на странице решаются две принципиально разные задачи — это оценка соответствия страницы контенту, а также оценка наличия несанкционированного доступа к нему. «Первая задача — классический алгоритм поисковой системы — в среднем занимает непродолжительное время. После успешного установления соответствия страница может перейти на вторую стадию — установление несанкционированного доступа к контенту», — рассказывает собеседник РБК. При решении второй задачи проявляется главная сложность — интеграция технологии «компьютерного зрения» и других методов анализа. «Но в случае грамотного применения алгоритма машинного обучения вердикт может быть выдан на лету», — добавил он.

Авторы
Теги
Видео недоступно при нулевом балансе

Лента новостей
Курс евро на 9 ноября
EUR ЦБ: 105,45 (-0,12)
Инвестиции, 08 ноя, 17:48
Курс доллара на 9 ноября
USD ЦБ: 97,83 (-0,24)
Инвестиции, 08 ноя, 17:48
Два дома загорелись в Раменском после атаки дроновПолитика, 10:07
Третий аэропорт ограничил полеты из-за атаки дронов на МосквуПолитика, 10:05
На подлете к Москве уничтожили 32 беспилотника⁠Политика, 09:59
В Госдуме предложили давать квартиры вышедшим на пенсию полицейскимОбщество, 09:49
Собянин заявил об уничтожении еще трех дронов на подлете к МосквеПолитика, 09:48
Почему люксовые бренды являют свои символы на уровне бессознательногоРБК и Сбер Первый, 09:39
Каковы шансы Медведева и Рублева на победу на Итоговом турнире ATPСпорт, 09:30
Онлайн-курс Digital MBA от РБК Pro
Объединили экспертизу профессоров MBA из Гарварда, MIT, INSEAD и опыт передовых ИТ-компаний
Оставить заявку
Собянин заявил об уничтожении 25 дронов за утро⁠Политика, 09:28
Захарова напомнила, что у администрации Байдена «в кармане пара месяцев»Политика, 09:24
На подлете к Москве сбили еще 13 беспилотниковПолитика, 09:07
Buyback и квази-buyback: как инвесторам оценивать обратный выкуп акцийИнвестиции, 09:00
В какие страны едут россияне в 2024 году. ИнфографикаБизнес, 09:00
Гладков сообщил об одном погибшем и семи пострадавших при атаках ВСУПолитика, 08:56
Домодедово и Жуковский ограничили полеты из-за атаки дронов на МосквуПолитика, 08:54