
DeepSeek: R1 Distill Llama 70B (free)
Контекст:8 192 токенов
Бесплатно
Добавлена:23 января 2025 г.
Поддерживаемые форматы
Принимает:
Генерирует:
Описание
DeepSeek R1 Distill Llama 70B представляет собой дистиллированную языковую модель, основанную на Llama-3.3-70B-Instruct, с использованием данных, полученных из DeepSeek R1. Эта модель применяет современные техники дистилляции, что позволяет ей демонстрировать высокие результаты на различных бенчмарках. Например, модель показала 70.0 на AIME 2024 pass@1, 94.5 на MATH-500 pass@1 и рейтинг 1633 на CodeForces. Использование тонкой настройки на основе выводов DeepSeek R1 позволяет модели достигать конкурентоспособных показателей, сопоставимых с более крупными моделями.
Поддерживаемые параметры
max_tokenstemperaturetop_preasoninginclude_reasoningstopfrequency_penaltypresence_penaltytop_krepetition_penaltylogit_biasmin_presponse_format
Стоимость
Модель доступна бесплатно
Провайдер
Together
deepseek-ai/DeepSeek-R1-Distill-Llama-70B-free