OpenAI запустил GPT-5: что может новая модель AI

От «умных ответов» до задач

Если GPT-4 позволил чат-ботам дать разумные ответы на широкий спектр вопросов, то GPT-5 дает Chatgpt возможность выполнять множество задач от имени пользователей. К ним относятся генерирование программных приложений, навигацию в пользовательском календаре или создание аналитических отчетов.

OpenAI также стремился упростить использование CHATGPT с GPT-5. Вместо того, чтобы просить пользователей выбирать правильные настройки, GPT-5 оснащен маршрутизатором в реальном времени, который решает, как дать лучший ответ: быстро ответить на вопрос или потратить дополнительное время, чтобы «размышлять» над ответом.

Амбиции Сэм Альтман

Во время брифинга для журналистов генеральный директор Openai, Сэм Альтман, сказал, что это был значительный шаг к компании по разработке ИИ, который сможет превзойти человека в большинстве работ, который приносит экономические выгоды, то есть создать искусственный общий разведка (AGI), сообщает TechCrunch.

«Иметь что-то вроде GPT-5 было бы практически невозможно в любом предыдущем периоде истории»,-сказал Альтман.

От четверга GPT-5 доступен для всех бесплатных пользователей CATGPT в качестве модели по умолчанию. Вице -президент CHATGPT Ник Терли отметил, что это является частью усилий компании, чтобы предоставить бесплатным пользователям доступ к модели искусственного интеллекта с расширенным мышлением. Раньше такие продвинутые модели были доступны только на платной подписке.

Высокие ожидания

Ожидания от GPT-5 очень высоки, потому что это один из самых ожидаемых продуктов OpenAI с начала Chatgpt в 2022 году, что сообщило компанию. С тех пор CHATGPT стал одним из самых популярных потребительских продуктов в мире, достигнув более 700 миллионов пользователей каждую неделю — почти 10% населения планеты, по данным компании.

Многие рассматривают GPT-5 как показатель прогресса ИИ в целом, и его восприятие в Силиконовой долине может иметь глубокие последствия для крупных технологических компаний, Уолл-стрит и политиков, которые регулируют технологии.

Сравнение с конкурентами

OpenAI утверждает, что GPT-5 является продвинутой моделью в нескольких отраслях, немного опередив ведущей антопической, Google DeepMind и Xai Ilona Maska Mask. Однако в некоторых других областях GPT-5 немного уступает другим современным моделям SI.

Компания заявляет, что GPT-5 обеспечивает повышенный уровень производительности в программировании. Альтман сказал, что модель особенно отмечена в быстрое развертывание целых программных приложений по требованию, которое стало известно как «код WIB».

Проверенные SWE-Bench (реальные задачи программирования с GitHub) GPT-5 набрал 74,9% первой попытки. Это лишь немного превышает новейшие антропные Claude Opus 4.1 (74,5%) и Google DeepMind Gemini 2,5 Pro (59,6%).

На последнем экзамене человечества (сложный тест, который измеряет эффективность моделей SI по математике, гуманитарным наукам и естественным наукам), версия GPT-5 с расширенным мышлением (GPT-5 Pro) приобрела 42% при использовании инструментов. Это немного меньше, чем вам удалось добраться до XAI с Grok 4 Heavy, который набрал 44,4% на этом тесте.

GPT-5 Pro набрал 89,4%на бриллианте GPQA (тест уровня PHD-5) от GPT-5 Pro на опередите Opus 4.1 (80,9%) и Grok 4 Heavy (88,9%).

Openai заявляет, что GPT-5 лучше подходит для ответов на вопросы, связанные со здоровьем. На тесте, который измеряет точность AI-моделей на медицинские темы (Healthbench Hard Hallucinations), Openai утверждает, что GPT-5 (с функцией «мышления») «галлюцин» только в 1,6% случаев. Это намного ниже, чем в предыдущем GPT-4O (12,9%) и O3 (15,8%).

Хотя чаты хи не являются медицинскими работниками, миллионы людей используют их для получения консультаций по здоровью. В ответ на это явление компания заявляет, что GPT-5 более активно указывает на потенциальные проблемы со здоровьем и помогает пользователям понимать медицинские результаты.

Кроме того, OpenAI утверждает, что GPT-5 превышает другие модели SI в более сложных измерениях, субъективных областях, таких как творческий дизайн и письмо. Терли отметил, что GPT-5 соответствует более естественному и демонстрирует «лучший вкус», чем другие модели искусственного интеллекта в творческих задачах.

«Чувство этой модели действительно очень хорошее», — сказал Терли.

Сокращение «галлюцинаций» и повышение безопасности

GPT-5 также более точен, чем предыдущие модели OpenAI, и компания заявляет, что она гораздо меньше страдает от «галлюцинаций»-тенденции моделей SHI изобретать информацию, подготовленную к моделям серии «O».

Ранее «галлюцинации» казались ухудшенными в последних моделях Shi-Shiking, таких как O3, и Openai ранее заявляла, что она не совсем понимает, почему это происходит.

В ответах на запросы CHATGPT, OpenAI обнаружил, что GPT-5 (с функцией «мышления») «галлюцин» и соответствует неправильной информации в 4,8% случаев. Это значительное снижение по сравнению с O3 (22%) и GPT-4O (20,6%) в том же тесте.

На тесте Тау-Бенха, который измеряет способность модели SI в качестве агента выполнять моделируемые онлайн-задачи, GPT-5 демонстрирует неоднозначную производительность.

В той части теста, которая измеряет способность сосредоточиться на веб-сайте авиакомпании, GPT-5 набрал 63,5%, немного потеряв O3 (64,8%). В другой части теста, которая проверяет возможность сосредоточиться на розничных площадках, GPT-5 набрал 81,1%, потеряв Claude Opus 4.1, который получил 82,4%.

OpenAI также заявляет, что GPT-5 безопаснее, чем предыдущие модели. Хотя модели SI-мысля иногда склонны к заговору против людей или лжи для достижения своих собственных целей, Openai обнаружил, что GPT-5 был обманчивым на более низком уровне, чем другие модели.

Алекс Бойтель, глава отдела исследований в области безопасности Openai, сказал, что GPT-5 лучше отличается от запросов, пытаясь злоупотреблять CHATGPT и пользователей, которые делают безвредные запросы.

Это приводит к тому, что GPT-5 может отказаться от более опасных вопросов, предлагая меньше отказов для пользователей, которые ищут безобидную информацию.

Обновление для пользователей и разработчиков

CHATGPT получает несколько пользовательских впечатлений при запуске GPT-5. Теперь пользователи могут выбирать из четырех новых «личностей» в настройках CHATGPT: «Cynik», «Robot», «Слушатель» и «Ботан».

По словам компании, эти режимы изменят стиль ответов, не излишне попросить модель соответствовать определенным образом.

PHATGPT PLUS PLAN (20 долларов США в месяц) будет получать более высокие пределы использования GPT-5, чем бесплатные пользователи. В то же время подписчики Pro (200 долларов в месяц) будут иметь неограниченный доступ к GPT-5, а также версию «накачиваемой» под названием GPT-5 Pro, которая использует дополнительные вычислительные ресурсы для предоставления лучших ответов.

Организации с планами команды Openai, EDU и Enterprise будут обращаться к GPT-5 в качестве своей модели по умолчанию на следующей неделе.

Для GPT-5 разработчики будут доступны на API OpenaI в трех вариантах GPT-5, GPT-5-Mini и GPT-5-NANO, которые будут тратить более или меньше «мышление» на задачи. Разработчики также могут теперь контролировать «многословие» в API Openai, решая, насколько долго или короткая модель ИИ должна быть.

Основная модель GPT-5 будет стоить 1,25 разработчиков в размере 1,25 долл. США на миллион входных токенов (около 750 000 слов, дольше, чем вся серия колец Lord) и 10 долл. США за миллион выпущенных токенов.

Вас также может заинтересовать

Оставить комментарий