Бесплатный генератор ИИ кукол

DeepSeek: R1 Distill Llama 8B

Разработчик: deepseek
Llama3
Контекст:32 000 токенов
Добавлена:7 февраля 2025 г.

Поддерживаемые форматы

Принимает:

Текст

Генерирует:

Текст

Описание

DeepSeek R1 Distill Llama 8B представляет собой компактную языковую модель, основанную на Llama-3.1-8B-Instruct, и использует данные из DeepSeek R1. Модель применяет современные методы дистилляции для достижения высокой производительности по различным критериям. Среди результатов можно отметить: AIME 2024 pass@1: 50.4, MATH-500 pass@1: 89.1 и рейтинг CodeForces: 1205. Благодаря тонкой настройке на базе выводов DeepSeek R1, модель демонстрирует конкурентоспособные результаты, сопоставимые с более крупными моделями.

Поддерживаемые параметры

max_tokenstemperaturetop_preasoninginclude_reasoningstopfrequency_penaltypresence_penaltyseedtop_kmin_prepetition_penaltylogit_bias

Стоимость

Запрос:
$0.000000 за 1K токенов
Ответ:
$0.000000 за 1K токенов

Провайдер

NovitaAI
ID модели: deepseek/deepseek-r1-distill-llama-8b