
Qwen: Qwen3 235B A22B (free)
Контекст:40 960 токенов
Бесплатно
Добавлена:29 апреля 2025 г.
Поддерживаемые форматы
Принимает:
Генерирует:
Описание
Qwen3-235B-A22B представляет собой модель смешанных экспертов (MoE) с 235B параметрами, разработанную компанией Qwen. В процессе работы активируется 22B параметров за один проход. Модель обеспечивает гибкий переход между режимом "мышления", предназначенным для сложных задач, таких как логическое рассуждение, математика и программирование, и режимом "немышления", который оптимизирован для эффективного общения. Она демонстрирует высокие способности к рассуждению, поддерживает более 100 языков и диалектов, а также обладает продвинутыми возможностями выполнения инструкций и вызова инструментов. Модель может обрабатывать контекстный размер до 32K токенов, с возможностью расширения до 131K токенов с использованием технологии YaRN.
Поддерживаемые параметры
max_tokenstemperaturetop_preasoninginclude_reasoningstopfrequency_penaltypresence_penaltyseedtop_kmin_prepetition_penaltylogprobslogit_biastop_logprobs
Стоимость
Модель доступна бесплатно
Провайдер
Chutes
Qwen/Qwen3-235B-A22B