Всего за несколько дней китайская компания Deepseek привела мировую фондовую биржу к огромному снижению. В то же время, разоблачение мифов об индустрии искусственного интеллекта и неправильные предположения о технологической геополитике.
DeepSeek, компания, специализирующаяся на хеджировании, ранее незамеченная в гонке искусственного интеллекта, разработала в качестве побочного проекта модель с производительностью, сравнимая с продуктами OpenAI. Так много раз дешевле. Он был создан без многоплановых инвестиций, и он пошел в несколько десятков раз меньше, чем американские компании. Создание модели V3 должно было стоить 5-6 миллионов долларов. Его обучение состояло в том, чтобы занять два месяца на кластере, состоящем из процессоров NVIDIA H800 2048, более старых и менее эффективных, к которым не применяются американские запреты на экспорт. Основываясь на модели V3, был создан R1, оснащенный способностью рассуждать, то есть разбивая сложные проблемы на логические этапы, ведущие к окончательному отклику. Именно этот прорыв шокировал мир, хотя ключевые инновации появились в декабрьской модели V3.