Перейти к основному контенту
Технологии и медиа ,  
0 

«Яндекс» представил новую русскоязычную нейросеть

YaLM 100B — самая продвинутая нейросеть для генерации текстов на русском языке, утверждает компания
Яндекс YDEX ₽1 662 +3,88% Купить
Фото: Валерий Мельников / РИА Новости
Фото: Валерий Мельников / РИА Новости

Компания «Яндекс» выложила в открытый доступ YaLM 100B — нейросеть для генерации и обработки текстов на русском и английском языках. Как утверждает компания, это самая большая GPT-подобная модель, опубликованная в свободном доступе.

«YaLM 100В содержит 100 млрд параметров — больше, чем какая-либо из существующих моделей для русского языка. Это позволяет использовать ее для решения большого круга задач, связанных с обработкой естественного языка. Языковые модели из семейства YaLM определяют принцип построения текста и генерируют новые, опираясь на законы лингвистики и свои знания о мире», — описывает пресс-служба «Яндекса» работу новой модели.

Как утверждает компания, новую нейросеть можно использовать для создания рекламы, описания товаров, генерировать любые тексты, даже стихи, и применять ее для классификации текста, например по стилю.

Модель обучали на суперкомпьютерах «Яндекса», которые были признаны самыми мощными в Восточной Европе. В процессе обучения YaLM 100B обработала около 2 ТБ текстов из открытых датасетов и интернета на английском и русском языках.

Модель предоставляется по открытой лицензии Apache 2.0 и доступна на GitHub.

Петр Попов, генеральный директор «Яндекс Технологий», заявил, что, выкладывая YaLM 100B в открытый доступ, компания рассчитывает, что это даст толчок развитию генеративных нейросетей.

«Я бы вакцинировал троих на миллион». Интервью с нейросетью GPT-3
Футурология
Фото:Shutterstock

Самой мощной языковой моделью в мире сейчас считается GPT-3 от OpenAI, впервые представленная в 2020 году. Она основана на более чем 175 млрд параметров. Она способна генерировать текст высокого уровня сложности. 8 сентябре 2020 года британское издание The Guardian опубликовало заметку, написанную при помощи GPT-3. В этой статье нейросеть, в частности, написала: «Я здесь, чтобы убедить вас не волноваться. Искусственный интеллект не уничтожит людей. Поверьте мне».

Летом 2021 года «Яндекс» представил нейросетевой языковой алгоритм генерации текстов YaLM. На его основании работал сервис «Балабола», в котором пользователи могли пообщаться с нейросетью. Однако в апреле компания закрыла к нему доступ.

Свою нейросеть для генерации русскоязычных текстов представлял и «Сбер», ее бета-версия находится в открытом доступе. Она построена на 760 млн параметров.

Теги
Компании
Магазин исследований Аналитика по теме "Интернет"
Видео недоступно при нулевом балансе


 

Лента новостей
Курс евро на 18 апреля
EUR ЦБ: 93,25 (-0,08)
Инвестиции, 17 апр, 18:31
Курс доллара на 18 апреля
USD ЦБ: 82,02 (-0,57)
Инвестиции, 17 апр, 18:31
Суд признал студента РУДН Арби Дукаева социально опаснымПолитика, 08:27
Как Кучеров стал одним из лучших в НХЛ и заслужил признание ОвечкинаСпорт, 08:15
Большой гид по «Серии плюс»: чем интересны кварталы ПИК нового поколенияРБК и ПИК, 08:11
Прорывы и разочарования. Как выступили россияне в «регулярке» НХЛСпорт, 08:00
Клиенты «Атома» смогут протестировать авто через подписку и каршерингБизнес, 08:00
Два бойца самообороны погибли при атаке дрона в Белгородской областиПолитика, 07:56
NYT рассказала о частых спонтанных телефонных беседах Макрона и ТрампаПолитика, 07:51
Как добиваться желаемого в любом разговоре
Овладейте действенными техниками на интенсиве РБК Pro «Искусство убеждать»
Подробнее
NYP назвала требуемый Байденом гонорар за выступленияОбщество, 07:41
Российские брокеры по-разному списали НДФЛ с иностранных дивидендовИнвестиции, 07:30
МТС начала эксперимент по продаже автомобилей в салонах связиТехнологии и медиа, 07:30
Военная операция на Украине. ОнлайнПолитика, 07:27
Минобороны сообщило о перехвате 56 дроновПолитика, 07:21
Впервые в истории россиянин дважды подряд стал лучшим бомбардиром в НХЛСпорт, 07:16
В Харькове прогремели взрывыПолитика, 07:08