25 апреля 2025 г.

THUDM: GLM Z1 Rumination 32B

GLM Z1 Rumination 32B

thudm

Модель THUDM: GLM Z1 Rumination 32B представляет собой 32B-параметрическую систему глубокого мышления из серии GLM-4-Z1, созданную для решения сложных задач с открытым концом, требующих продолжительных размышлений. Она основана на glm-4-32b-0414 и включает дополнительные этапы обучения с подкреплением и многоуровневые стратегии выравнивания, внедряя возможности «размышления», имитирующие длительные когнитивные процессы. Это включает итеративное рассуждение, многоступенчатый анализ и процессы, дополненные инструментами, такие как поиск, извлечение информации и синтез с учетом цитирования. Модель эффективно справляется с задачами, связанными с исследовательским письмом, сравнительным анализом и сложным ответом на вопросы. Она поддерживает вызовы функций для примитивов поиска и навигации (`search`, `click`, `open`, `finish`), что позволяет применять ее в агентных пайплайнах. Поведение размышления управляется многоходовыми циклами с формированием награды на основе правил и механизмами отсроченного принятия решений, протестированными в рамках Deep Research с использованием внутренних стеков выравнивания OpenAI. Эта версия подходит для ситуаций, где важнее глубина анализа, чем скорость.

Характеристики

Контекст32,000 токенов

Входные типыtext

Выходные типыtext

СемействоOther

ПровайдерNovitaAI

ТипПлатная

Hugging FaceTHUDM/GLM-Z1-Rumination-32B-0414

Формат инструкцийdeepseek-r1

Возможности

Генерация текста

Reasoning

Tool parameters

Multipart запросы

Completions API

Chat Completions API