
DeepSeek: DeepSeek V3 Base (free)
Контекст:163 840 токенов
Бесплатно
Добавлена:29 марта 2025 г.
Поддерживаемые форматы
Принимает:
Генерирует:
Описание
DeepSeek-V3 Base представляет собой языковую модель с 671 миллиардом параметров, основанную на концепции Mixture-of-Experts (MoE). Она активирует 37 миллиардов параметров за один проход и поддерживает длину контекста до 128 000 токенов. Модель обучалась на 14,8 триллионах токенов с использованием смешанной точности FP8, что обеспечивает высокую эффективность и стабильность обучения. DeepSeek-V3 Base демонстрирует отличные результаты в задачах, связанных с языком, логическим мышлением, математикой и программированием. Это предобученная модель, лежащая в основе DeepSeek V3.
Поддерживаемые параметры
max_tokenstemperaturetop_pstopfrequency_penaltypresence_penaltyseedtop_kmin_prepetition_penaltylogprobslogit_biastop_logprobs
Стоимость
Модель доступна бесплатно
Провайдер
Chutes
deepseek-ai/DeepSeek-V3-Base