DeepSeek: R1 Distill Llama 70B (free)

Name: DeepSeek: R1 Distill Llama 70B (free)
Brand: deepseek
Availability: InStock

Разработчик: deepseek

Llama3

Контекст:8 192 токенов

Бесплатно

Добавлена:23 января 2025 г.

Поддерживаемые форматы

Принимает:

Текст

Генерирует:

Текст

Описание

DeepSeek R1 Distill Llama 70B представляет собой дистиллированную языковую модель, основанную на Llama-3.3-70B-Instruct, с использованием данных, полученных из DeepSeek R1. Эта модель применяет современные техники дистилляции, что позволяет ей демонстрировать высокие результаты на различных бенчмарках. Например, модель показала 70.0 на AIME 2024 pass@1, 94.5 на MATH-500 pass@1 и рейтинг 1633 на CodeForces. Использование тонкой настройки на основе выводов DeepSeek R1 позволяет модели достигать конкурентоспособных показателей, сопоставимых с более крупными моделями.

Поддерживаемые параметры

max_tokenstemperaturetop_preasoninginclude_reasoningstopfrequency_penaltypresence_penaltytop_krepetition_penaltylogit_biasmin_presponse_format

Стоимость

Модель доступна бесплатно

Провайдер

Together

ID модели: deepseek-ai/DeepSeek-R1-Distill-Llama-70B-free

AI Genom - Новости в ИИ

AI Genom12:42

🔥 Manus AI: Помощник, который шутит над вами, пока вы работаете

AI GenomВчера

📊 Компания Meta* запустила Meta AI — виртуального собеседника для iPhone и iPad, который «помогает» с серьезными задачами