Перейти к основному контенту
Технологии и медиа ,  
0 

Эксперты усомнились в справедливости победы ИИ над людьми в IQ-тестах

Эксперт Дорохова призвала не делать выводы о превосходстве ИИ по одному IQ-тесту
То, что в эксперименте журналиста Лотта нейросеть получила больше баллов в IQ-тесте, чем средний у человека, еще не говорит о развитии ИИ, считают эксперты. Они согласны, что через пару лет ИИ может достичь еще лучших результатов
Фото: Cover Images / ZUMA Press / ТАСС
Фото: Cover Images / ZUMA Press / ТАСС

Эксперимент журналиста Максима Лотта, в котором нейросеть показала лучший результат IQ-теста по сравнению со средним у людей, интересен, но не является основанием для сравнения искусственного интеллекта (ИИ) и человеческого или оценки развития ИИ, в этом следует быть осторожными, заявили опрошенные РБК эксперты.

В начале марта журналист Максим Лотт опубликовал результаты проведенного им эксперимента с нейросетями, в котором он применил визуальный IQ-тест компании Mensa. Сначала все нейросети провалили тест, но потом Лотт описал используемые в нем картинки текстом, после чего ИИ справился с тестом.

Лучший результат показала Claude-3 от Anthropic (бывшие разработчики OpenAI, которая создала Chat GPT, занявшую второе место), вышедшая за день до проведения эксперимента, — 101 балл. Это выше среднего показателя для человека, за который обычно берется 100 баллов. Журналист заключил, что, согласно закону Мура, через два года нейросети смогут показывать результат 140 баллов, что гораздо больше среднего показателя для человека.

Технический директор «Яков и партнеры Digital» Федор Чемашкин отметил, что генеративный ИИ обучают на «огромном массиве данных», в который входит и информация о тестах IQ, которые подвергаются критике, поскольку проверяют в основном логическое мышление и зависят от психоэмоционального состояния. Специалист считает, что итоги теста Лотта были ожидаемы, ИИ со временем будет только лучше проходить такие тесты, так как изучает различные модели логического мышления и не зависит от психоэмоционального состояния.

Что такое IQ: как проходят тесты и что значат их результаты
Экономика образования
Фото:Pexels

Чемашкин считает, что более показательными будут оценки ИИ, основанные на решении нейросетью реальных задач, в том числе из корпоративного сектора, включая оценку способности ИИ осмысленно решать такие задачи. Такие бенчмарки уже существуют, и показатели по ним показывают прогресс в развитии искусственного интеллекта, добавил эксперт.

С ним согласна и руководитель проектов «Яков и партнеры», соавтор исследования «Искусственный интеллект в России — тренды и перспективы» Марина Дорохова. Она назвала использование теста IQ как одного из возможных бенчмарков для ИИ «интересным подходом», но отметила, что как пользователей, так и компании больше интересует оценка способности нейросети решать прикладные задачи. Кроме того, существует множество тестов IQ.

У нейросети от Meta нашли те же ошибки, что и у чат-бота Gemini от Google
Технологии и медиа
Фото:Michael M. Santiago / Getty Images

«Способность сети выдать 100-процентный результат на тесте IQ не имеет прямой связи с интеллектом. Машинный и человеческий интеллект — это принципиально разные категории, с разными принципами функционирования. И в общем случае без аккуратной методологии испытаний их сравнение на подобных тестах не имеет смысла, кроме маркетингового, и ничего не предсказывает», — так оценивает эксперимент директор по науке компании «Тридиви» (ГК «Папилон») Алексей Самосюк.

Самосюк называет его формально корректным, но отмечает, что без доступа к моделям нельзя проверить чистоту теста. «Ведь ровно такой же результат способна выдать средняя вопросно-ответная система, если заранее скормить ей ответы. И даже лучше», — заявил он.

Дорохова призвала быть осторожными с такими выводами, поскольку в эксперименте использовался лишь один из множества IQ-тестов.

Что касается вывода Лотта о том, что, согласно закону Мура, через пару лет можно будет ожидать, что нейросети в тесте IQ будут набирать более 140 баллов, специалисты согласны, что ИИ развивается очень быстро, но эта оценка не основывается только на этом эксперименте.

Эксперты из «Яков и партнеры» отмечают, что ИИ уже оказывает все большое влияние как на экономику и бизнес, так и на повседневную жизнь. По оценкам компании, общий эффект от внедрения ИИ российским бизнесом к 2028 году может достичь 4,2–6,9 трлн руб. и обеспечить прирост до 4% ВВП. Однако технологии продолжают развиваться, появляются новые возможности их применения в бизнесе, так что оценка может измениться, уточнил Чемашкин.

Кроме того, увеличилась и скорость появления новых генеративных моделей, нацеленных на разные потребности и задачи, добавила Дорохова, что приближает возможность появления у каждого пользователя личного цифрового помощника.

«Со временем большие языковые модели будут становиться все более универсальными и научатся не только выполнять большой спектр задач без дообучения, но и смогут «выйти» в физический мир и взаимодействовать с окружающей средой: заказать такси, забронировать авиабилет, отправить письмо», — считает она.

По мнению Самосюка, развитие ИИ напрямую зависит от того, сколько в это вкладывают средств: «Само там ничего не прогрессирует, текущий прогресс — результат миллиардных инвестиций в отрасль на протяжении многих лет. И эти инвестиции действительно значительно выросли в последние годы».

Выборы в местные советы Англии завершились поражением правящей партии

МВД России объявило в розыск Зеленского и Порошенко

В Иерусалиме в храме Гроба Господня сошел Благодатный огонь

На Западе признали, что Россия приспособилась к экономическому давлению извне

НАТО в рамках учений отрабатывает коалиционные действия против России

Появились новые кадры последствий снегопада в Екатеринбурге. Видео

Джинн из бутылки, Apple и будущее Berkshire. Что сказал Баффет акционерам?


Задержанные после сожжения Нового завета извинились на видео

В Госдуме предложили смягчить требования к тонировке передних стекол

В какой банк положить деньги: топ-10 вкладов в мае 2024-го

«Газпром» получил убыток в 2023 году. Будут ли дивиденды?

В России ускорилось снижение цен на вторичное жилье. Таблица городов

«Продавай в мае и уходи». Сработает ли эта биржевая поговорка в 2024 году?

Бывший министр финансов Задорнов рассказал о тромбозе в российской экономике

Синоптики раскрыли причины «языка холода» в России

Авторы
Теги
Видео недоступно при нулевом балансе
Лента новостей
Курс евро на 4 мая
EUR ЦБ: 98,56 (-0,08)
Инвестиции, 03 мая, 16:44
Курс доллара на 4 мая
USD ЦБ: 91,69 (-0,36)
Инвестиции, 03 мая, 16:44
10 поводов попасть в черный список Центробанка и 2 способа выйти из него Pro, 08:25
Президент Киргизии посетит парад Победы Политика, 08:25
FT рассказала о «лазейке в санкциях», которую может использовать Россия Политика, 08:22
В Белоруссии предупредили о риске использования в России оружия с Украины Политика, 08:16
Минцифры предложило облегчить силовикам определение пользователей Сети Технологии и медиа, 08:09
Эксперты оценили свое влияние на «кол», а работу чиновников — на «тройку» Экономика, 08:00
Киселев заявил о необходимости расследовать убийство военкора Бентли Общество, 07:50
Онлайн-курс Digital MBA от РБК
Объединили экспертизу профессоров MBA из Гарварда, MIT, INSEAD и опыт передовых ИТ-компаний
Оставить заявку
МИД Белоруссии выразил надежду на возобновление переговоров по Украине Политика, 07:35
В конгрессе США назвали условие для ввода войск на Украину Политика, 07:02
В МИДе заявили о необходимости для России наращивать ракетный арсенал Политика, 06:35
Власти обсудили передачу денег от продажи Yandex на поддержку электроники Технологии и медиа, 06:16
Politico узнало о поддержке пропалестинских протестов спонсорами Байдена Политика, 06:10
«Ъ» сообщил о начале суда по делу об убийстве семи военных гранатой Политика, 05:59
ЦАХАЛ заявила об ударе по штабу ХАМАС в комплексе БАПОР в Газе Политика, 05:25