Microsoft бросает вызов OpenAI и Google на рынке искусственного интеллекта. Компания объявила о выпуске трех новых моделей, построенных полностью с нуля.
В ноябре 2025 года Microsoft объявила о создании MAI Superintelligence Team — специального подразделения, занимающегося разработкой передового искусственного интеллекта внутри компании.
Команда была сформирована под непосредственным руководством Мустафы Сулеймана, генерального директора Microsoft AI. Его задача — создать с нуля собственные передовые модели искусственного интеллекта с целью создания так называемого гуманистического сверхинтеллекта. Это также было явным сигналом о том, что Microsoft вступает в гонку с OpenAI и Google, которые до сих пор имели существенное преимущество перед гигантом.
Три новые модели искусственного интеллекта от Microsoft готовы
Через несколько месяцев мы увидели первые результаты работы специальной команды. Во вторник были официально представлены три новые модели искусственного интеллекта от Microsoft, и ожидается, что они будут даже более мощными, чем те, что предлагают конкуренты. система транскрипции речи, механизм генерации голоса и генератор изображений.
MAI-Transcribe-1 (транскрипция речи)
Система транскрипции речи Microsoft называется MAI-Transcribe-1. По заявлению компании, она допускает значительно меньше ошибок транскрипции, чем конкурирующие системы. MAI-Transcribe-1 поддерживает 25 языков со всего мира и, если верить Microsoft, превосходит OpenAI Whisper-large-v3 в каждом из них. Однако по сравнению с Google Gemini 3.1 Flash выигрывает на 22 из 25 языков.
MAI-Voice-1 (генератор голоса)
Новый генератор голоса от Microsoft создан для генерации наиболее естественного и реалистичного звука на рынке. Более того, речь, генерируемая MAI-Voice-1, предназначена для обеспечения широкого спектра эмоций и выражений, сохраняя постоянную идентичность говорящего даже в более длинном контенте. Модель способна генерировать 60 секунд звука всего за одну секунду без потери качества.
MAI-Image-2 (генератор изображений)
Третья модель, созданная Microsoft, — MAI-Image-2, новый генератор изображений. Что отличает его от конкурентов, так это создание изображения, похожего на настоящую фотографию. Кроме того, MAI-Image-2 имеет очень развитую возможность вставки текста в изображение, что выделяет его среди конкурентов. Arena.ai поместила его на третье место в таблице генераторов, сразу после OpenAI и Google Gemini.
Цены на новые модели MAI потрясающие (позитивно).
Теперь доступны новые модели от Microsoft, в том числе в Microsoft CoPilot, Bing или Teams. Конечно, они также доступны разработчикам в Microsoft Foundry и на специальной площадке MAI Playground. Мустафа Сулейман подчеркивает, что цены на модели должны быть самыми выгодными среди всех имеющихся на рынке, и это действительно так. Час аудио, созданного MAI-Transcribe-1, стоит всего около 0,36 доллара. Напротив, MAI-Voice-1 позволяет нам генерировать один миллион символов за 22 доллара, а один миллион входных токенов для MAI-Image-2 стоит пять долларов.