Приложение DeepSeek стало настоящим хитом в мире искусственного интеллекта. Китайская лаборатория DeepSeek привлекла внимание пользователей после того, как ее чат-бот занял ведущие позиции в магазинах приложений Apple и Google. Модели ИИ, разработанные DeepSeek, подняли вопросы о том, сможет ли США сохранить свое лидерство в области ИИ, а также о будущем спроса на чипы для ИИ.
DeepSeek была основана при поддержке хедж-фонда High-Flyer Capital Management, который использует технологии ИИ для принятия инвестиционных решений. Сооснователь High-Flyer, Лянь Вэньфэнг, начал свою карьеру в трейдинге во время учебы в университете и запустил хедж-фонд в 2019 году, сосредоточив внимание на разработке ИИ-алгоритмов.
В 2023 году High-Flyer основала DeepSeek как отдельную лабораторию, занимающуюся исследованиями инструментов ИИ. С момента своего создания DeepSeek активно использует собственные дата-центры для обучения моделей, однако, как и другие компании в Китае, сталкивается с ограничениями, наложенными на экспорт аппаратного обеспечения из США. Например, для обучения одной из своих новых моделей компания была вынуждена использовать чипы Nvidia H800 вместо более мощных H100.
С технической стороны, команда DeepSeek состоит преимущественно из молодых специалистов. Компания активно привлекает исследователей с докторскими степенями из ведущих китайских университетов и нанимает сотрудников без опыта в области компьютерных наук для расширения кругозора своих технологий.
В ноябре 2023 года DeepSeek представила свои первые модели — DeepSeek Coder, DeepSeek LLM и DeepSeek Chat. Однако настоящую популярность компания приобрела в прошлом году с запуском моделей DeepSeek-V2, которые показали высокие результаты в различных тестах ИИ и были дешевле аналогичных решений на рынке. Это заставило конкурентов, таких как ByteDance и Alibaba, снизить цены на свои модели.
Запуск DeepSeek-V3 в декабре увеличил известность компании. По внутренним тестам, DeepSeek V3 превосходит открытые модели, такие как Meta Llama, и закрытые модели, доступные только через API, например, OpenAI GPT-4o. Важной разработкой стал также модель R1, которая, по утверждениям DeepSeek, показывает такие же результаты, как модель OpenAI o1.
Модель R1 осуществляет самопроверку фактов, что помогает избежать распространенных ошибок. Хотя модели с подобным подходом требуют больше времени для поиска решений, они оказываются более надежными в таких областях, как физика и математика. Однако стоит отметить, что все модели DeepSeek подлежат контролю со стороны китайского интернет-регулятора, что ограничивает их возможности в некоторых темах.
В марте 2023 года DeepSeek зафиксировала более 16,5 миллиона посещений. Несмотря на снижение трафика на 25% по сравнению с февралем, компания занимает второе место по посещаемости среди аналогичных сервисов. В то же время ChatGPT продолжает оставаться лидером с более чем 500 миллионами активных пользователей.
Microsoft объявила о доступности DeepSeek на платформе Azure AI Foundry, что подчеркивает интерес крупных игроков к новым технологиям. Однако некоторые компании и страны, включая Южную Корею и штат Нью-Йорк, уже запретили использование DeepSeek на правительственных устройствах из-за опасений по поводу безопасности данных и пропаганды.
Будущее DeepSeek выглядит неопределенным. Хотя компания продолжает развивать свои модели, она сталкивается с растущим недоверием со стороны американских властей, что может привести к дополнительным ограничениям.