
DeepSeek: R1 Distill Llama 8B
Контекст:32 000 токенов
Добавлена:7 февраля 2025 г.
Поддерживаемые форматы
Принимает:
Генерирует:
Описание
DeepSeek R1 Distill Llama 8B представляет собой компактную языковую модель, основанную на Llama-3.1-8B-Instruct, и использует данные из DeepSeek R1. Модель применяет современные методы дистилляции для достижения высокой производительности по различным критериям. Среди результатов можно отметить: AIME 2024 pass@1: 50.4, MATH-500 pass@1: 89.1 и рейтинг CodeForces: 1205. Благодаря тонкой настройке на базе выводов DeepSeek R1, модель демонстрирует конкурентоспособные результаты, сопоставимые с более крупными моделями.
Поддерживаемые параметры
max_tokenstemperaturetop_preasoninginclude_reasoningstopfrequency_penaltypresence_penaltyseedtop_kmin_prepetition_penaltylogit_bias
Стоимость
Запрос:
$0.000000 за 1K токенов
Ответ:
$0.000000 за 1K токенов
Провайдер
NovitaAI
deepseek/deepseek-r1-distill-llama-8b