Ведущие технологические компании, такие как Google DeepMind, Meta и Nvidia, переориентируют свои усилия по разработке языковых моделей для создания «мировых моделей» искусственного интеллекта. Эти системы могут учиться не только по текстам, но и на видео, что позволяет им лучше понимать и взаимодействовать с физическим миром, открывая новую эру в робототехнике и автономных системах. Об этом сообщает Financial Times 29 сентября.
► Подпишитесь на Министерство финансов Telegram: основные финансовые новости
Что такое «физический Si» и почему это важно
В отличие от крупных языковых моделей (LLM), которые обрабатывают текстовую информацию, «мировые модели» анализируют визуальные данные для прогнозирования и моделирования событий в реальном мире. Цель состоит в том, чтобы преподавать алгоритмы для навигации по физическому пространству. Это может быть технологической основой для прорыва в области самоконтролируемых автомобилей, промышленной робототехники и создания полноценных агентов SI.
По словам вице -президента NVIDIA по имитационной технологии Lebardian, потенциальный рынок таких систем огромный.
«Если мы создадим интеллект, способный понять и действовать в физическом мире, масштаб возможностей будет огромным», — сказал он, оценивая рынок в 100 триллионов долларов, что почти равно объему всей мировой экономики.
Кто участвует в гонке
Технологические гиганты уже активно работают над своими собственными проектами в этой области:
- Google DeepMind представила модель Genie 3 в августе, которая способна создать видео Pasadrovo, анализируя предыдущие кадры и взаимодействия.
- Meta, под руководством Jan Lecuna, разрабатывает модель V-JEPA, которая изучает необработанный видеоконтент, имитируя процесс знания мира ребенка.
- NVIDIA Ставка на Omniverse Platform, которая имитирует физические среды для обучения роботам. Голова Дженсена Хуанга заявила, что следующая эра Nvidia будет связана с «физическим ИИ».
Стартапы также присоединяются к гонке. World Labs создает трехмерные игровые миры из одного изображения, ведущий на взлетно -посадочную полосу с Голливудом для создания реалистичных сцен, а Niantic использует данные из игры Pokémon Go, чтобы создать подробную карту мира для обучения их системам.
Инвестиции и риски
Конкурс ИИ стимулирует огромные инвестиции, но аналитики предупреждают о значительных рисках. По словам Моргана Стэнли, финансовый разрыв в отрасли оценивается в 1,5 триллиона долларов. Прибыль компаний еще не имеет времени на расходы, которые, по мнению некоторых инвесторов, превращают задницу ИИ в «спекулятивное безумие». Тем не менее, ведущие игроки рынка готовы пойти на большую реструктуризацию инфраструктуры, потому что они считают, что искусственный интеллект полностью переформат на рынок.
В то же время эксперты говорят, что до создания систем с человеческим интеллектом может занять не менее десяти лет.
Концепция Яна Лекуна: изучение ИИ как личности
Следует добавить, что подход, который продвигает главного ученых Meta и одного из «крещенных родителей» Ши Яна Лекуна, значительно отличается от направления развития крупных лингвистических моделей, таких как CHATGPT. Лектор неоднократно раскритиковал LLM за отсутствие истинного понимания мира. По его мнению, такие модели только подразумевают следующее слово в предложении, но не способны рассуждать и планировать.
Его концепция «мировых моделей» заключается в создании ИИ, который, как и люди и животные, образуют внутреннюю модель реальности. Это позволяет системе предсказать последствия их действий и эффективно планировать. Архитектура V-JEPA, разработанная Meta, просто нацелена на обучение ИИ создавать такие абстрактные идеи о мире, анализировать видео, а не просто обрабатывать текст.
Почему это важно
Эта новость знаменует собой потенциальный сдвиг в стратегии развития искусственного интеллекта. Ранее основной поле битвы стало создание чат -ботов, способных идеально подражать человеческому языку, теперь акцент переходит к тому, чтобы придать ИИ способность действовать в реальном мире.
Это шаг от цифрового интеллекта до физического. Представьте, что разница между ИИ, которая может написать инструкции по сбору мебели, и ши-робот, которая может самостоятельно собирать эту мебель, сосредотачиваясь на космосе и манипулируя предметами. Успех в создании «мировых моделей» определит лидеров следующей технологической эпохи и может резко изменить такие отрасли, как производство, логистика, медицина и повседневная жизнь.