Искусственный интеллект (ИИ) продолжает удивлять мир новыми достижениями, и недавний запуск китайской модели DeepSeek-R1 стал настоящим прорывом. Эта статья расскажет, что такое DeepSeek, почему она вызвала ажиотаж, и как её успех повлиял на мировой рынок технологий.
Что такое DeepSeek?
DeepSeek — это китайский стартап, основанный в 2023 году, который специализируется на разработке больших языковых моделей (LLM). Последняя разработка компании, DeepSeek-R1, является одной из самых продвинутых моделей ИИ, способной выполнять широкий спектр задач: от написания кода до решения сложных математических уравнений. Она уже сравнивается с такими решениями, как ChatGPT от OpenAI и Bard от Google.
Почему DeepSeek уникальна?
Одной из ключевых особенностей DeepSeek-R1 является её эффективность и экономичность. В отличие от западных компаний, использующих мощные чипы Nvidia для обучения моделей, DeepSeek добилась аналогичных результатов с меньшими затратами. Это стало возможным благодаря использованию подхода «микс экспертов» (mixture of experts), который активирует только необходимые вычислительные мощности для выполнения задачи. Такой подход снижает затраты на обучение и обработку данных.
До официального запуска модели R1 компания DeepSeek заявляла, что её разработки превосходят существующие аналоги по ключевым показателям. В частности, они утверждали, что их модели превосходят решения от OpenAI в задачах кодирования и рассуждений, сохраняя при этом более низкую стоимость разработки. Эти заявления вызвали значительный интерес в технологическом сообществе и усилили ожидания перед выпуском их продукта.
Как DeepSeek повлияла на рынок?
Запуск DeepSeek-R1 оказал значительное влияние как на рынок приложений, так и на мировой рынок технологий. Приложение DeepSeek моментально стало хитом, обогнав ChatGPT по числу скачиваний в App Store.
По данным на январь 2025 года, оно заняло первое место среди бесплатных приложений в США и 51 другой стране. Это подчеркивает растущую привлекательность китайских разработок среди пользователей по всему миру.
Также запуск DeepSeek-R1 привёл и к крупным изменениям на мировых фондовых рынках. Вот основные последствия:
- Обвал акций Nvidia: После запуска модели акции Nvidia упали на 17%, что стало крупнейшим однодневным снижением в истории компании. Рыночная капитализация Nvidia сократилась почти на 600 миллиардов долларов, а состояние её генерального директора Дженсена Хуанга уменьшилось на 20,8 миллиарда долларов.
- Падение индекса Nasdaq: Технологический сектор пережил серьёзное снижение. Индекс Nasdaq упал на 3,1%, а S&P 500 потерял 1,5%.
- Снижение акций других гигантов: Акции Microsoft и Alphabet (материнской компании Google) также потеряли в цене.
Эти события подчеркнули глобальное влияние китайских разработок на рынок высоких технологий.
Прозрачность как стратегия
Одной из ключевых особенностей DeepSeek является её подход к разработке и распространению технологий. Компания сделала свою модель открытой, разместив её исходный код и документацию на GitHub, что позволяет любому желающему изучать архитектуру и механизмы работы DeepSeek-R1. Этот шаг выгодно отличает компанию от таких конкурентов, как OpenAI и Google, которые придерживаются закрытой экосистемы для своих передовых моделей.
Как это работает?
- Доступ к модели через GitHub: публикация кода на GitHub позволяет разработчикам и исследователям свободно изучать и использовать модель для создания собственных приложений. Это значительно ускоряет внедрение передовых технологий ИИ в различные отрасли.
- Сотрудничество с научным сообществом: размещая модель в открытом доступе, DeepSeek активно поощряет академическое сообщество участвовать в её улучшении. Это способствует разработке новых методов и алгоритмов на основе DeepSeek-R1.
- Эффективность и доступность: открытость распространяется и на подход компании к использованию вычислительных ресурсов. DeepSeek продвигает экономически устойчивые методы обучения моделей, такие как техника «микса экспертов», что делает её решения доступными для широкого круга пользователей.
Возможные риски
Несмотря на очевидные преимущества, стратегия открытости вызывает обеспокоенность. Открытый доступ к мощным моделям ИИ может быть использован в злоумышленных целях, например, для создания дезинформации или вредоносных приложений. Однако DeepSeek утверждает, что преимущества от подобной прозрачности перевешивают риски.
DeepSeek за пределами языковых моделей
Успех DeepSeek не ограничивается языковыми моделями. Недавно компания представила новую модель под названием Janus-Pro-7B, которая превосходит конкурентов в задачах генерации изображений по текстовым описаниям. Используя 72 миллиона синтетических и реальных изображений, эта модель создаёт детализированные и стабильные изображения, что делает её конкурентоспособной с решениями от OpenAI и Stability AI.
Реакция инвесторов и технологического сообщества
Успехи DeepSeek привлекли внимание ведущих венчурных инвесторов, включая Марка Андриссена, который высоко оценил инновационный подход компании. Однако модель также подвергается критике за её возможное соответствие официальной позиции китайского правительства, что вызывает сомнения в её объективности.
И конечно же, DeepSeek после запуска начала собирать положительные отзывы от лидеров индустрии. Даже генеральный директор компании OpenAI, Сэм Альтман, высоко оценил модель R1 китайской компании DeepSeek, назвав её «впечатляющей». Он отметил, что успех DeepSeek стал «воодушевляющим» фактором, подчеркивающим необходимость ускорения разработки и выпуска новых моделей. Альтман подчеркнул, что достижения DeepSeek демонстрируют важность эффективного использования вычислительных ресурсов в развитии искусственного интеллекта.
Заключение
DeepSeek стала символом растущей технологической мощи Китая и заставила мир пересмотреть подходы к разработке ИИ. Её экономичность, открытость и инновационный подход выделяют её среди конкурентов и делают ключевым игроком на глобальном рынке.
Технологический мир меняется с невероятной скоростью, и DeepSeek — яркий пример того, как новые подходы могут изменить устоявшиеся правила игры.
Продолжаем следить за новостями и ждём чем ещё DeepSeek смогут нас удивить!