Китайская разработка DeepSeek совершила революцию на рынке искусственного интеллекта

265

28.01.2025

Китайская компания DeepSeek выпустила бесплатный чат-бот, вызвав панику среди инвесторов в Кремниевой долине и обойдя американский ChatGPT в нескольких тестах на умение рассуждать.

Китайское приложение искусственного интеллекта DeepSeek-R1 стало самым рейтинговым бесплатным приложением в Apple App Store в США, Великобритании и Китае.

После запуска DeepSeek-R1 в январе компания заявила, что он выполняет задачи на уровне последней версии ChatGPT от OpenAI. Приложение способно писать код, решать математические задачи, анализировать и даже шутить.

Кроме того, оно пока остается полностью бесплатным.

Как пишет Axios, DeepSeek была основана в 2023 году Ляном Вэньфэном, соучредителем хедж-фонда High-Flyer, который разрабатывает модели ИИ с открытым исходным кодом, что позволяет сторонним разработчикам проверять и улучшать программное обеспечение. 

Согласно MIT Technology Review, Лян купил «запас чипов Nvidia A100», которые использовались для разработки DeepSeek. С тех пор США ввели санкции на эти чипы из Китая, но DeepSeek создали более компактную и мощную машину. При этом, согласно данным проведенных тестов, DeepSeek превосходит последнюю модель OpenAI, которой сейчас отдают предпочтение многие пользователи искусственного интеллекта. 

Согласно заявлению компании, разработка обошлась всего в 5,6 млн долларов, что в сотни раз ниже затрат гигантов вроде OpenAI, Google и Meta, чьи проекты требуют сотен миллионов или даже миллиардов долларов.

Такая экономичность стала возможной благодаря инновационному подходу к использованию вычислительных мощностей. Модель DeepSeek демонстрирует результаты, сопоставимые, а по некоторым тестам и превосходящие разработки OpenAI. Например, по данным Driving eco, в AIME 2024 DeepSeek-R1 набрал 79.8% (против 79.2% у o1), а в MATH-500 достиг 97.3% (у конкурента — 96.4%). В задачах программирования R1 показал 96.3-й процентиль на Codeforces, а также результаты 90.8% по MMLU и 71.5% по GPQA Diamond, что подтверждает универсальность и высокую эффективность.

Кроме того, базовые сборы R1 за токен в 27.4 раза дешевле, а с учетом его эффективности в процессах рассуждения — в 4.41 раза выгоднее.

DeepSeek-R1 значительно превосходит своего предшественника R1-Zero благодаря усовершенствованной технологии точной настройки, которая повышает качество ответов и улучшает их читаемость. 

Реакция рынков

27 января на фондовых рынках США произошел резкий спад, вызванный неожиданным технологическим прорывом китайской компании DeepSeek, которая всего за год существования поставила под сомнение доминирующее положение американских компаний в области искусственного интеллекта (ИИ). На фоне этого производитель микросхем Nvidia потерял почти 600 млрд долларов рыночной капитализации, а технологический индекс Nasdaq упал на 3,1%, сообщает CNN.

Причиной потрясения стало представление DeepSeek своей новой ИИ-модели R1, аналогичной ChatGPT. 

«Это один из самых удивительных и впечатляющих прорывов, которые я когда-либо видел», — прокомментировал ситуацию известный инвестор в технологии Марк Андрессен.

Неожиданный успех DeepSeek обрушил акции Nvidia и других технологических гигантов. Индекс S&P 500 снизился на 1,5%, а Nasdaq — на 3,1%. Meta также ощутила давление.

Вызов для американских технологий

Этот прорыв подрывает уверенность в непоколебимости американской технологической индустрии. Ранее генеральный директор OpenAI Сэм Альтман утверждал, что разработка ИИ требует триллионов долларов инвестиций, однако DeepSeek демонстрирует, что конкуренция на этом поле только начинается.

Прорыв DeepSeek стал не просто технологическим достижением, а сигналом к переоценке стратегии США в области ИИ. В условиях, когда относительно молодой стартап может опередить гигантов отрасли, на первый план выходят вопросы эффективности, инноваций и международной конкуренции. Очевидно, что технологическая гонка только набирает обороты.

И заявление небольшого стартапа о создании мощной модели искусственного интеллекта с минимальными затратами заставило экспертов задуматься, действительно ли нужно инвестировать десятки миллиардов долларов в создание крупных кластеров для обучения нейросетей. 

Фото: Justin Sullivan/Getty Images