THUDM: GLM Z1 Rumination 32B

GLM Z1 Rumination 32B
thudm
Модель THUDM: GLM Z1 Rumination 32B представляет собой 32B-параметрическую систему глубокого мышления из серии GLM-4-Z1, созданную для решения сложных задач с открытым концом, требующих продолжительных размышлений. Она основана на glm-4-32b-0414 и включает дополнительные этапы обучения с подкреплением и многоуровневые стратегии выравнивания, внедряя возможности «размышления», имитирующие длительные когнитивные процессы. Это включает итеративное рассуждение, многоступенчатый анализ и процессы, дополненные инструментами, такие как поиск, извлечение информации и синтез с учетом цитирования. Модель эффективно справляется с задачами, связанными с исследовательским письмом, сравнительным анализом и сложным ответом на вопросы. Она поддерживает вызовы функций для примитивов поиска и навигации (`search`, `click`, `open`, `finish`), что позволяет применять ее в агентных пайплайнах. Поведение размышления управляется многоходовыми циклами с формированием награды на основе правил и механизмами отсроченного принятия решений, протестированными в рамках Deep Research с использованием внутренних стеков выравнивания OpenAI. Эта версия подходит для ситуаций, где важнее глубина анализа, чем скорость.

Характеристики

Контекст32,000 токенов
Входные типыtext
Выходные типыtext
СемействоOther
ПровайдерNovitaAI
ТипПлатная
Формат инструкцийdeepseek-r1

Возможности

Генерация текста
Reasoning
Tool parameters
Multipart запросы
Completions API
Chat Completions API