Перейти к основному контенту
Технологии и медиа ,  
0 

OpenAI представила новую версию нейросети GPT-4o

Новая версия ИИ GPT-4o реагирует на голос в среднем за 320 миллисекунд, что сравнимо с реакцией в разговоре. Она «лучше воспринимает изображение и аудио по сравнению с существующими моделями», отмечают разработчики
Основатель OpenAI Сэм Альтман
Основатель OpenAI Сэм Альтман (Фото: Justin Sullivan / Getty Images)

OpenAI представила новую версию генеративного искусственного интеллекта GPT-4o, которая ляжет в основу чат-бота ChatGPT. Буква О означает сокращение от слова omni (всесторонний).

GPT-4o работает с аудио, изображениями и текстом. По словам разработчиков, она реагирует на голос в среднем за 320 миллисекунд, что сравнимо с реакцией в разговоре.

Новая версия соответствует производительности GPT-4 Turbo, но «лучше воспринимает изображение и аудио по сравнению с существующими моделями», отмечает OpenAI.

«До GPT-4o вы могли использовать голосовой режим для общения с ChatGPT со средней задержкой 2,8 секунды (GPT-3.5) и 5,4 секунды (GPT-4). Голосовой режим в этих версиях состоит из трех отдельных моделей: одна простая модель транскрибирует аудио в текст, GPT-3.5 или GPT-4 выводит текст, а третья простая модель преобразовывает этот текст обратно в аудио», — пояснили в компании.

В результате GPT-4 теряет множество информации и не может воспроизводить смех, пение или выражать эмоции. «В случае с GPT-4o мы обучили единую новую модель сквозному анализу текста, изображения и аудио; это означает, что все входные и выходные данные обрабатываются одной и той же нейронной сетью», — рассказали разработчики. Модель доступна более чем на 50 языках, в том числе на русском.

Bloomberg узнал о сделке Apple и OpenAI для внедрения ChatGPT в iPhone
Технологии и медиа
Фото:Andrew Kelly / Reuters

GPT-4o предоставляется пользователям с 13 мая. Однако доступ к голосовым функциям в ближайшие недели появится только у «небольшой группы доверенных партнеров», а в июне — у платных подписчиков.

В конце ноября 2022 года компания OpenAI, одним из основателей которой был Илон Маск, представила универсальный чат-бот ChatGPT.

Этот чат-бот способен вести диалог, искать ошибки в коде, сочинять стихи, писать сценарии и даже спорить. Нейросеть, на основе которой работает ChatGPT, может помимо прочего выдавать базовый программный код, генерировать финансовый анализ, резюме технических статей или научных концепций, прогнозы, персональные советы и дает этичные ответы на любые вопросы. Кроме того, она запоминает детали диалога с пользователем и избегает спорных тем. Наконец, ответы чат-бота можно корректировать с помощью наводящих вопросов.

ChatGPT создавали на суперкомпьютере Azure AI на основе языковой модели GPT-3,5 от OpenAI. Чат-бот обучали с помощью массива текстов из интернета и системы с подкреплением на основе обратной связи с человеком Reinforcement Learning from Human Feedback. Затем нейросеть переобучали несколько раз, используя ее собственные ответы, чтобы сделать последние более точными и корректными. Разработчики заявили, что стремились сделать ИИ простым в использовании, корректным и «человечным».

ChatGPT работает как чат в диалоговом окне. Нейросетью можно пользоваться бесплатно, для этого нужно только зарегистрироваться на сайте OpenAI. Однако пройти верификацию по российскому номеру телефона не получится. Кроме того, сайт заблокировал доступ к чат-боту с российских IP-адресов. Разработчики предлагают также платную подписку ChatGPT Plus, которая гарантирует бесперебойную работу чат-бота даже в часы загруженности. Она стоит $20 в месяц.

В марте 2023 года OpenAI представила новую модель GPT-4. ChatGPT также обновили, добавив фильтры новой модели, которая характеризуется как более точная и этичная. Кроме того, чат-бот начал отвечать на запросы в виде не только текста, но и картинок.

Тематический проект о российской винодельческой культуре, вине и спиртных напитках

РБК Вино РБК Вино

Красивое и противоречивое: что такое амфорное вино

РБК Вино РБК Вино

Зеленые и желтые: какими кроме красных и белых бывают вина

РБК Вино РБК Вино

Артур Саркисян о том, хватит ли российского вина

РБК Вино РБК Вино

Как устроено восприятие вкусов

РБК Вино РБК Вино

Производство вина в России достигло исторических максимумов

РБК Вино РБК Вино

Перспектива терруара: станет ли Крым российским Провансом

РБК Вино РБК Вино

Царь супов русских: все о борще

Авторы
Теги
Видео недоступно при нулевом балансе
Лента новостей
Курс евро на 3 декабря
EUR ЦБ: 112,8 (-1,51)
Инвестиции, 02 дек, 18:04
Курс доллара на 3 декабря
USD ЦБ: 107,18 (-0,57)
Инвестиции, 02 дек, 18:04
Глава Минобрнауки заявил о переломе тренда на утечку мозгов из РоссииОбщество, 06:06
Россияне рассказали, сколько потратят на празднование Нового годаОбщество, 06:00
Таланты в условиях «голода»: как сохранить ценных сотрудниковРБК и Битрикс24, 05:59
Конгрессмены привели пять причин, почему COVID был создан в лабораторииОбщество, 05:45
Трамп приедет на открытие Нотр-Дам де Пари после реставрацииПолитика, 05:26
Названа дата боя-реванша между Биволом и БетербиевымСпорт, 05:11
Стармер пообещал Киеву «максимально сильное положение» для переговоровПолитика, 05:02
Онлайн-курс Digital MBA от РБК Pro
Объединили экспертизу профессоров MBA из Гарварда, MIT, INSEAD и опыт передовых ИТ-компаний
Оставить заявку
Эксперты исключили пользу от «устойчивой к радиации Чернобыля» лягушкиТехнологии и медиа, 05:00
Как выбрать зимние шины, подходящие именно вашему автомобилюРБК и Ikon tyres, 04:50
Суд в Германии приговорил подростков за убийство украинских спортсменовСпорт, 04:13
Дофаминовые интерьеры: как создать дома интерьер, вызывающий яркие эмоцииРБК «Стиль» и Familia, 03:59
США связались с Россией из-за ситуации в СирииПолитика, 03:59
США выделили Украине новый пакет помощи на $725 млнПолитика, 03:46
Немецких журналистов вытолкали из зала на встрече Бербок и Ван И в ПекинеПолитика, 03:43