
DeepSeek: R1 Distill Qwen 32B (free)
Контекст:16 000 токенов
Бесплатно
Добавлена:30 января 2025 г.
Поддерживаемые форматы
Принимает:
Генерирует:
Описание
DeepSeek R1 Distill Qwen 32B представляет собой дистиллированную модель языка, основанную на Qwen 2.5 32B, используя результаты, полученные от DeepSeek R1. Эта модель демонстрирует лучшие показатели по сравнению с o1-mini от OpenAI на различных тестах, устанавливая новые рекорды для плотных моделей. Среди других результатов тестирования можно отметить: AIME 2024 pass@1: 72.6, MATH-500 pass@1: 94.3, рейтинг CodeForces: 1691. Модель использует дообучение на основе данных DeepSeek R1, что обеспечивает ей конкурентоспособные характеристики, сравнимые с более крупными моделями на переднем крае технологий.
Поддерживаемые параметры
max_tokenstemperaturetop_preasoninginclude_reasoning
Стоимость
Модель доступна бесплатно
Провайдер
Nineteen
casperhansen/deepseek-r1-distill-qwen-32b-awq