OpenAI представила Sora 2 — обновленную версию своей модели искусственного интеллекта для генерации видео, которая теперь способна создать реалистичный звук. Новая модель исправляет ключевые недостатки предшественника и является прямым ответом на конкурентов, включая Google. Это указано в официальном сообщении компании.
► Подпишитесь на Министерство финансов Telegram: основные финансовые новости
Что нового в Sora 2: звук, физика и интеграция людей
Обновленная модель получила ряд ключевых улучшений, которые приближаются к сгенерированным видео к реальным.
- Аудио синхронизация: в отличие от первой версии, Sora 2 может генерировать полный звук — от диалогов до фонового шума, гармонично сочетая его с видео.
- Реалистичная физика: проблемы с деформацией объектов и нелогичных движений были устранены. Теперь модель может точно воспроизводить сложные действия, такие как спортивные трюки, согласно законам физики.
- Функция камеи: пользователи могут интегрироваться в сгенерированные сцены реальных людей. Этого достаточно, чтобы предоставить короткое видео или аудио, после чего модель может добавить человека в любой ролик, сохраняя ее голос и естественное движение.
Мобильное приложение и доступ: как попробовать
Вместе с новой моделью Openai, мобильное приложение для iOS для iOS запустило. Он позволяет вам создавать, редактировать и распространять видео непосредственно со смартфона и содержит инструменты защиты контента, включая возрастные ограничения.
В настоящее время доступ к приложению ограничен:
- Это работает только в США и Канаде.
- Вы можете получить только приглашение (каждый может пригласить еще четыре человека).
Нет информации об Android.
В начале Sora 2 будет свободным, но с определенными пределами. Абоненты CATGPT Pro будут получать доступ к расширенной экспериментальной версии Sora 2 Pro.
Конкуренция с Google: наверстать упущенное и обогнать
Первая версия Соры, представленная в декабре 2024 года, была впечатлена качеством изображения, но была «молчала». Это был его основным недостатком на фоне конкурента — VEO 3 моделей Google, который уже смог создать видео с синхронизированным звуком.
Запуск SORA 2 с помощью Audio Generation — это стратегический шаг OpenAI, направленный на то, чтобы не отстаивать эту технологическую гонку и предложить пользователям полный инструмент для создания кинематографического контента.