Alibaba выпускает модель ИИ, которая, по ее словам, превосходит DeepSeek

48

31.01.2025

В то время как большая часть Китая празднует Лунный Новый год, технологическая компания Alibaba сделала громкое заявление, выпустив новую версию своей модели искусственного интеллекта Qwen 2.5. По данным компании, Qwen 2.5 не только превосходит высоко оцененную модель DeepSeek-V3, но и, по их словам, демонстрирует превосходство над GPT-4o от OpenAI и Llama-3.1-405B от Meta, пишет Reuters.

«Qwen 2.5-Max превосходит… почти по всем показателям GPT-4o, DeepSeek-V3 и Llama-3.1-405B», – заявило облачное подразделение Alibaba в официальном аккаунте WeChat, ссылаясь на самые передовые модели ИИ с открытым исходным кодом от OpenAI и Meta.

Qwen2.5-Max представляет собой крупномасштабную модель Mixture of Experts, которая прошла предварительное обучение на более чем 20 триллионах токенов. Для ее дальнейшей доработки использовались методы Supervised-Fine-Tuning (обучение с участием человека) и обучение на основе обратной связи от людей (RLHF). Эти методы позволяют модели лучше понимать и выполнять запросы пользователей, сообщает Хабр

Рывок DeepSeek, начавшийся с выпуска 10 января модели DeepSeek-V3 и продолженный 20 января с выпуском R1, вызвал волнения в Кремниевой долине и привел к падению акций технологических компаний. Низкие затраты DeepSeek на разработку и эксплуатацию заставили инвесторов переосмыслить крупные планы расходов ведущих компаний в области ИИ в США.

Однако успех DeepSeek не остался незамеченным для конкурентов. После выпуска DeepSeek-R1, ByteDance, владелец TikTok, представил обновление своей флагманской модели ИИ, которая, по их утверждениям, превзошла модель OpenAI o1 в AIME, тесте на понимание и следование сложным инструкциям.

Конкуренция на китайском рынке ИИ обострилась после того, как предшественник DeepSeek-V3, модель DeepSeek-V2, спровоцировал ценовую войну в мае прошлого года. Низкая стоимость и открытый исходный код DeepSeek-V2 заставили облачное подразделение Alibaba снизить цены до 97% на ряд моделей. Другие компании, такие как Baidu и Tencent, также включились в гонку, активно совершенствуя свои собственные разработки.

Фото: REUTERS/Aly Song