OpenAI только что сделал толстый ход: генерирование изображений идет непосредственно в CHATGPT, а Далл-э на пенсии. Новая функция, основанная на модели GPT-4O, позволяет создавать графику, не опуская окно чата в одном последовательном сеансе вместе с текстом, анализом данных или обработкой фотографий. С тем, что это будет инструмент намного лучше, чем раньше.
Конец Далл-э. GPT-4O из Openai берет на себя создание изображений-и это «невероятно лучше»
До сих пор это работало над двумя фронтами: GPT отвечал за текст, а Dall-E за изображения. Теперь GPT-4O все сделает. Согласно Openai, новая модель более точная, лучше понимает команды и справляется с текстом на картинах, что является одной из самых сложных задач для графических генераторов. До сих пор головокружение генерирования текстов и чисел пересекала границы абсурда.
В шоу -видео сами Альтман признал, что компания сказала пользователям долго ждать, но «это стоило». Графический GPT-4O показан в действии при генерации манги с относительностью, коллекционными картами, монетами, сочетающими несколько фотографий и графики, созданной из чрезвычайно длинной подсказки. Модель использует полный контекст разговора и знания «от головы», поэтому он может реагировать как собеседник.
Новинка? Фотографии генерируют «вживую» — линию на линии, в режиме реального времени. Нет большее «затяжной» эффекта, как в Dall-E. Это медленнее, но гораздо точнее. И Openai обещает, что он будет ускоряться во времени.
Там не будет свободного американца
Модель не только используется для создания хороших снимков. GPT-4O создает научные модели, образовательные плакаты, иллюстрации для учебных материалов и даже редактирование фотографий. Это Openai, который подчеркивает: искусственный интеллект не только знает, но и, наконец, он может «увидеть» и показать его.
Была также безопасность. GPT-4O не будет генерировать глубокие фэтфуки, насилие или незаконное содержание. Он не добавляет видимых водяных знаков, но все картины имеют скрытые метаданные C2PA, которые сообщают, что они были созданы с помощью ИИ. Опели также готовит инструменты для отслеживания их источников.

Интеграция с API также придет, так что разработчики смогут встроить изображение GPT-4O в их приложение. Пользователи сохраняют права на созданные ими изображения — конечно в пределах правил.
Короче говоря: Далл-э был сценой. GPT-4O-это будущее.