На рынке оборудования для искусственного интеллекта только что произошла встряска. Канадский стартап Taalas объявил, что разработал чип, способный запускать модели искусственного интеллекта до 10 раз быстрее, чем сегодня. И при гораздо меньших затратах и энергопотреблении. Если эти заявления подтвердятся, это может стать одним из самых революционных событий в полупроводниковой промышленности за последние годы. Но сколько здесь правды и сколько маркетинговой ереси?
ИИ «вжёгся» в кремний
Вместо использования гибких графических процессоров, подобных Nvidia, Taalas предлагает радикально иной подход. «Укрепление» конкретной модели ИИ непосредственно в кремнии. Это означает, что чип предназначен для одной конкретной модели вместе с ее весом и параметрами, а не поддерживает широкий спектр приложений.
Первый продукт компании, HC1, был оптимизирован для модели Llama 3.1 8B. По данным компании, оно достигает 17 тысяч. токенов в секунду на пользователя. Это почти в 10 раз больше, чем нынешние решения на базе графических процессоров, при этом стоимость до 20 раз ниже, а энергопотребление составляет 12–15 кВт на стойку по сравнению со 120–600 кВт в случае серверов с графическим процессором.
Звучит как научная фантастика? Таалас утверждает, что на разработку нового чипа для новой модели им требуется всего два месяца.
Нвидиа в опасности? Еще не так быстро
В теории предложение Тааласа выглядит нокаутом для лидеров, включая Nvidia, AMD и производителей специализированных ускорителей искусственного интеллекта. Однако дьявол кроется в деталях.
Графические процессоры являются гибкими. Они могут поддерживать разные модели, меняющиеся архитектуры и новые приложения — от искусственного интеллекта через HPC до графики. Таалас сводит все к одной карте: максимальная специализация. Один чип равен одной модели. И все.
Для центров обработки данных это означает потенциально огромную экономию, но также и операционный кошмар. Каждое обновление модели требует новой версии оборудования. Каждая модель имеет отдельную версию системы. Это умножение артикулов, логистика и риск.
Интересно, что, несмотря на появление Тааласа, Мета решила сотрудничать с Nvidia на долгие годы. Это сигнал о том, что технологические гиганты по-прежнему полагаются на проверенные, масштабируемые решения.
$219 млн и амбиции изменить рынок
Таалас уже привлек финансирование в размере 219 миллионов долларов. Компания утверждает, что ее архитектура может значительно снизить стоимость токенов в моделях искусственного интеллекта. В то время как OpenAI планирует к 2030 году потратить сотни миллиардов долларов на вычислительную инфраструктуру, снижение затрат на любой порядок может иметь колоссальные последствия.
Стартап планирует дальнейшие версии чипов. В том числе и более совершенные модели на базе кремния нового поколения (HC2). Цель состоит в том, чтобы поддерживать более крупные модели LLM, сохраняя при этом преимущества в затратах и энергопотреблении.
Революция или нишевый эксперимент?
На данный момент Nvidia все еще раздает карты, и ее позиция кажется непоколебимой. Но если даже несколько крупных дата-центров решат поэкспериментировать со специализированными чипами, может возникнуть ценовое давление на гигантов.
Акции Nvidia упадут? Сегодня это скорее интригующая гипотеза, чем реальная угроза. На рынке полупроводников только что появился новый, очень амбициозный игрок. Только время покажет, изменит ли это правила игры или станет диковинкой для компьютерных фанатов.