Перейти к основному контенту
Технологии и медиа ,  
0 

Эксперты усомнились в справедливости победы ИИ над людьми в IQ-тестах

Эксперт Дорохова призвала не делать выводы о превосходстве ИИ по одному IQ-тесту
То, что в эксперименте журналиста Лотта нейросеть получила больше баллов в IQ-тесте, чем средний у человека, еще не говорит о развитии ИИ, считают эксперты. Они согласны, что через пару лет ИИ может достичь еще лучших результатов
Фото: Cover Images / ZUMA Press / ТАСС
Фото: Cover Images / ZUMA Press / ТАСС

Эксперимент журналиста Максима Лотта, в котором нейросеть показала лучший результат IQ-теста по сравнению со средним у людей, интересен, но не является основанием для сравнения искусственного интеллекта (ИИ) и человеческого или оценки развития ИИ, в этом следует быть осторожными, заявили опрошенные РБК эксперты.

В начале марта журналист Максим Лотт опубликовал результаты проведенного им эксперимента с нейросетями, в котором он применил визуальный IQ-тест компании Mensa. Сначала все нейросети провалили тест, но потом Лотт описал используемые в нем картинки текстом, после чего ИИ справился с тестом.

Лучший результат показала Claude-3 от Anthropic (бывшие разработчики OpenAI, которая создала Chat GPT, занявшую второе место), вышедшая за день до проведения эксперимента, — 101 балл. Это выше среднего показателя для человека, за который обычно берется 100 баллов. Журналист заключил, что, согласно закону Мура, через два года нейросети смогут показывать результат 140 баллов, что гораздо больше среднего показателя для человека.

Технический директор «Яков и партнеры Digital» Федор Чемашкин отметил, что генеративный ИИ обучают на «огромном массиве данных», в который входит и информация о тестах IQ, которые подвергаются критике, поскольку проверяют в основном логическое мышление и зависят от психоэмоционального состояния. Специалист считает, что итоги теста Лотта были ожидаемы, ИИ со временем будет только лучше проходить такие тесты, так как изучает различные модели логического мышления и не зависит от психоэмоционального состояния.

Что такое IQ: как проходят тесты и что значат их результаты
Экономика образования
Фото:Pexels

Чемашкин считает, что более показательными будут оценки ИИ, основанные на решении нейросетью реальных задач, в том числе из корпоративного сектора, включая оценку способности ИИ осмысленно решать такие задачи. Такие бенчмарки уже существуют, и показатели по ним показывают прогресс в развитии искусственного интеллекта, добавил эксперт.

С ним согласна и руководитель проектов «Яков и партнеры», соавтор исследования «Искусственный интеллект в России — тренды и перспективы» Марина Дорохова. Она назвала использование теста IQ как одного из возможных бенчмарков для ИИ «интересным подходом», но отметила, что как пользователей, так и компании больше интересует оценка способности нейросети решать прикладные задачи. Кроме того, существует множество тестов IQ.

У нейросети от Meta нашли те же ошибки, что и у чат-бота Gemini от Google
Технологии и медиа
Фото:Michael M. Santiago / Getty Images

«Способность сети выдать 100-процентный результат на тесте IQ не имеет прямой связи с интеллектом. Машинный и человеческий интеллект — это принципиально разные категории, с разными принципами функционирования. И в общем случае без аккуратной методологии испытаний их сравнение на подобных тестах не имеет смысла, кроме маркетингового, и ничего не предсказывает», — так оценивает эксперимент директор по науке компании «Тридиви» (ГК «Папилон») Алексей Самосюк.

Самосюк называет его формально корректным, но отмечает, что без доступа к моделям нельзя проверить чистоту теста. «Ведь ровно такой же результат способна выдать средняя вопросно-ответная система, если заранее скормить ей ответы. И даже лучше», — заявил он.

Дорохова призвала быть осторожными с такими выводами, поскольку в эксперименте использовался лишь один из множества IQ-тестов.

Что касается вывода Лотта о том, что, согласно закону Мура, через пару лет можно будет ожидать, что нейросети в тесте IQ будут набирать более 140 баллов, специалисты согласны, что ИИ развивается очень быстро, но эта оценка не основывается только на этом эксперименте.

Эксперты из «Яков и партнеры» отмечают, что ИИ уже оказывает все большое влияние как на экономику и бизнес, так и на повседневную жизнь. По оценкам компании, общий эффект от внедрения ИИ российским бизнесом к 2028 году может достичь 4,2–6,9 трлн руб. и обеспечить прирост до 4% ВВП. Однако технологии продолжают развиваться, появляются новые возможности их применения в бизнесе, так что оценка может измениться, уточнил Чемашкин.

Кроме того, увеличилась и скорость появления новых генеративных моделей, нацеленных на разные потребности и задачи, добавила Дорохова, что приближает возможность появления у каждого пользователя личного цифрового помощника.

«Со временем большие языковые модели будут становиться все более универсальными и научатся не только выполнять большой спектр задач без дообучения, но и смогут «выйти» в физический мир и взаимодействовать с окружающей средой: заказать такси, забронировать авиабилет, отправить письмо», — считает она.

По мнению Самосюка, развитие ИИ напрямую зависит от того, сколько в это вкладывают средств: «Само там ничего не прогрессирует, текущий прогресс — результат миллиардных инвестиций в отрасль на протяжении многих лет. И эти инвестиции действительно значительно выросли в последние годы».

Авторы
Теги
Видео недоступно при нулевом балансе


 

Лента новостей
Курс евро на 9 апреля
EUR ЦБ: 93,78 (-1)
Инвестиции, 08 апр, 18:17
Курс доллара на 9 апреля
USD ЦБ: 85,46 (-0,73)
Инвестиции, 08 апр, 18:17
Египет возглавил топ самых популярных стран для отдыха весной 2025 годаОбщество, 05:01
Меняйло сообщил об опасности атаки беспилотниковПолитика, 04:43
Глава ЕК сочла Мелони способной помочь диалогу ЕС и СШАПолитика, 04:28
Лавров заявил, что Европа вновь «окрысилась» на РоссиюПолитика, 04:04
Цена нефти Brent упала ниже $61 за баррель впервые с марта 2021 годаЭкономика, 03:59
Слюсарь рассказал о последствиях атаки дронов на Ростовскую областьПолитика, 03:25
США нанесли серию авиаударов по объектам телефонной сети в ЙеменеПолитика, 03:10
Как собрать команду, которая не потеряет ваши деньги
Интенсив РБК Pro об ошибках основателя — присоединяйтесь
Подробнее
В КНР заявили о готовности противостоять запугиваниям торговой войной СШАПолитика, 02:49
Еще два аэропорта России ограничили полетыПолитика, 02:35
В Грузии массово отключился светОбщество, 02:25
Semafor сообщил об открытости Трампа к идее повышения налогов для богачейПолитика, 02:17
В Таганроге сработала ПВОПолитика, 01:32
Трамп заявил о получении США $2 млрд в день после введения пошлинПолитика, 01:02
Экс-главу продовольственного управления Минобороны отпустили на свободуОбщество, 00:55