В мире искусственного интеллекта, где важна каждая миллисекунда и каждый доллар энергии, Alibaba только что сделала то, что может пошатнуть позиции Nvidia — не только на китайском рынке, но и на глобальном уровне. В рамках облачного направления Alibaba Cloud представила систему под названием Эгеончто, по замыслу его создателей, позволяет сократить спрос на видеокарты Nvidia до 82%.
Это не мелкая оптимизация — это технологическая революция. Система тестировалась более трех месяцев в производственной среде Alibaba Cloud, поддерживая различные языковые модели: 72 миллиарда параметров.
На практике там, где раньше требовалось 1192 графических процессора Nvidia H20, теперь достаточно только 213. Aegaeon — это больше, чем просто алгоритм — это новая философия управления вычислительной мощностью. В мире, где западные компании конкурируют друг с другом за создание все более крупных ферм графических процессоров, Alibaba решила пойти в противоположном направлении: лучше использовать то, что у него уже есть.
Новый подход к искусственному интеллекту
В основе Aegeon лежит динамическое разделение ресурсов – так называемое автоматическое масштабирование на уровне токена. Это означает, что одна видеокарта может одновременно запускать несколько моделей искусственного интеллекта в режиме реального времени, переключаясь между ними по мере генерации ответов. Эффект? Один графический процессор теперь может поддерживать до семи моделей одновременно.а не два или три, как в других решениях.
Alibaba утверждает, что это принесло ей успех сократить задержки при переключении между моделями до 97%. Для компаний, разрабатывающих чат-ботов, системы рекомендаций или языковой анализ, это означает одно — гораздо более дешевые и быстрые внедрения.
Удар по слабому месту Nvidia
Хотя Nvidia по-прежнему является королем систем искусственного интеллекта, особенно в сегменте вывода (т. е. запуска готовых моделей), она доминирование оборудования больше не гарантирует преимущества. Алибаба показывает, что интеллектуальное программное обеспечение может устранить дефицит чипачто особенно важно для Китая – страны, на которую распространяются американские экспортные ограничения.
Ирония в том, что система H20созданный Nvidia специально для обхода американских ограничений на китайском рынке, теперь попадает под прицел регулирующих органов в Пекине из-за предполагаемых «брешей в безопасности». В это время Хуавей и Камбрикон ускоряют работу над собственными системами графических процессоров, а Пекин все активнее настаивает на технологической самодостаточности.
В таком контексте Aegeon может оказаться стратегическим инструментомне только коммерчески. Это способ стать независимым от американского оборудования, не отказываясь при этом от вычислительных мощностей.
Более широкая игра для будущего искусственного интеллекта
Трудно устоять перед впечатлением, что Alibaba, которую когда-то воспринимали главным образом как гиганта электронной коммерции, становится все более и более смелой в своей роли новатора инфраструктуры искусственного интеллекта. Как и Amazon Web Services десять лет назад, Alibaba Cloud начинает создавать стандартычто может определить направление развития отрасли.
Aegeon уже реализован в платформе. Баилиангде он обслуживает, в том числе, языковые модели Qwen — китайский аналог ChatGPT, ориентированный на корпоративных клиентов. На практике именно здесь происходит тихая, но значимая дуэль между мощью американского оборудования и мастерством оптимизации китайского программного обеспечения.
Если система Alibaba Cloud действительно работает так, как показывают данные испытаний, то Nvidia должна начать беспокоиться не только о китайском рынке. Потому что настоящая революция в области искусственного интеллекта не обязательно должна произойти с новым чипом. Это может быть строка кода, тихо написанная в Ханчжоу.
И это может стать первым моментом, когда Запад увидит, что преимущество в области искусственного интеллекта больше зависит не от кремния, а от того, насколько умело он используется.