
DeepSeek: R1 Distill Qwen 14B (free)
Контекст:64 000 токенов
Бесплатно
Добавлена:30 января 2025 г.
Поддерживаемые форматы
Принимает:
Генерирует:
Описание
DeepSeek R1 Distill Qwen 14B представляет собой дистиллированную языковую модель, основанную на Qwen 2.5 14B. Она использует результаты, полученные от DeepSeek R1, и демонстрирует высокую производительность, превосходя модель o1-mini от OpenAI по различным тестовым заданиям и устанавливая новые рекорды для плотных моделей. Среди других результатов тестирования можно выделить: AIME 2024 pass@1 - 69.7, MATH-500 pass@1 - 93.9 и рейтинг CodeForces - 1481. Модель использует тонкую настройку на основе выходных данных DeepSeek R1, что позволяет ей достигать конкурентоспособных результатов, сопоставимых с более крупными моделями последнего поколения.
Поддерживаемые параметры
max_tokenstemperaturetop_preasoninginclude_reasoningstopfrequency_penaltypresence_penaltyseedtop_kmin_prepetition_penaltylogprobslogit_biastop_logprobs
Стоимость
Модель доступна бесплатно
Провайдер
Chutes
deepseek-ai/DeepSeek-R1-Distill-Qwen-14B