Nous: DeepHermes 3 Mistral 24B Preview (free)
DeepHermes 3 (Mistral 24B Preview) — это языковая модель, разработанная компанией Nous Research на основе Mistral-Small-24B. Модель нацелена на выполнение инструкций и поддерживает как простое общение...
Каталог AI моделей и нейросетей
DeepHermes 3 (Mistral 24B Preview) — это языковая модель, разработанная компанией Nous Research на основе Mistral-Small-24B. Модель нацелена на выполнение инструкций и поддерживает как простое общение...
Mistral Medium 3 представляет собой высокопроизводительную языковую модель корпоративного уровня, разработанную для обеспечения передовых возможностей при значительно сниженных операционных затратах. ...
Gemini 2.5 Pro представляет собой передовую модель искусственного интеллекта от Google, предназначенную для решения задач, связанных с логическим мышлением, программированием, математикой и научными и...
Caller Large представляет собой специализированную модель "функционального вызова" от Arcee, предназначенную для интеграции внешних инструментов и API. Вместо того чтобы сосредотачиваться на максимиза...
Spotlight представляет собой модель визуально-языкового взаимодействия с 7 миллиардами параметров, основанную на Qwen 2.5-VL и доработанную компанией Arcee AI для выполнения задач, связанных с точным ...
Maestro Reasoning является главной моделью анализа компании Arcee. Это 32B-параметрическая версия Qwen 2.5-32B, настроенная с использованием DPO и обучения с подкреплением на основе цепочки размышлени...
Virtuoso-Large представляет собой мощную языковую модель от компании Arcee с 72 миллиардами параметров. Она разработана для решения задач, связанных с междоменным выводом, креативным письмом и корпора...
Coder-Large — это модель с 32B параметрами, являющаяся развитием Qwen 2.5-Instruct. Она была дополнительно обучена на данных с разрешенной лицензией из GitHub, CodeSearchNet и синтетических корпусов и...
Virtuoso-Medium-v2 представляет собой модель с 32 миллиардами параметров, созданную на основе логитов DeepSeek-v3 и интегрированную в архитектуру Qwen 2.5. Она предлагает более точные и фактические ре...
Arcee Blitz представляет собой модель с 24 миллиардами параметров, созданную на основе архитектуры Mistral и дистиллированную из DeepSeek для повседневного общения. Процесс дистилляции и последующего ...
Phi-4-reasoning-plus — это усовершенствованная модель с 14 миллиардами параметров от Microsoft, доработанная на основе Phi-4 с использованием дополнительного обучения с подкреплением. Это позволяет по...
Phi-4-reasoning представляет собой трансформер с 14 миллиардами параметров, разработанный Microsoft. Эта модель, основанная на Phi-4, улучшена для выполнения сложных задач рассуждения. Она сочетает в ...
Qwen3-0.6B — это легковесная языковая модель с 0,6 миллиарда параметров, входящая в серию Qwen3. Она обеспечивает поддержку как общего диалога, так и структурированного мышления благодаря архитектуре ...
Mercury Coder Small представляет собой первую модель диффузии среди больших языковых моделей (dLLM). Используя инновационный подход дискретной диффузии, эта модель демонстрирует скорость работы в 5-10...
Qwen3-1.7B — это компактная языковая модель с плотной архитектурой, обладающая 1,7 миллиарда параметров. Она изготавливается в рамках серии Qwen3 и предлагает два режима работы: эффективный диалог (бе...
Qwen3-4B представляет собой языковую модель с 4 миллиардами параметров из серии Qwen3, предназначенную для выполнения как общих, так и задач, требующих глубокого мышления. Модель использует архитектур...
Модель серии InternVL3 в версии 14b представляет собой продвинутую многомодальную языковую модель (MLLM), обладающую высоким уровнем производительности. В отличие от версии InternVL 2.5, модель Intern...
Модель 2b серии InternVL3 обеспечивает высокую скорость вывода и хорошую производительность. Это продвинутая многомодальная языковая модель (MLLM), которая демонстрирует выдающиеся результаты. В сравн...
DeepSeek Prover V2 представляет собой модель с 671 миллиардам параметров, ориентированную на логику и математику. Вероятно, она является улучшенной версией DeepSeek-Prover-V1.5. О модели пока мало инф...
Llama Guard 4 представляет собой многомодальную предобученную модель, основанную на Llama 4 Scout, и адаптированную для классификации безопасного контента. Эта модель, как и её предшественники, может ...
Qwen3 представляет собой последнюю модель из серии Qwen, которая использует как плотные, так и архитектуры смешанных экспертов (MoE). Это обеспечивает отличные результаты в области логического мышлени...
Qwen3-8B представляет собой мощную языковую модель с 8,2 миллиарда параметров из серии Qwen3, оптимизированную для задач, требующих логического мышления, а также для эффективного ведения диалога. Она ...
Qwen3-14B представляет собой компактную языковую модель с 14,8 миллиарда параметров из серии Qwen3, предназначенную для сложного мышления и эффективного общения. Она позволяет без проблем переключатьс...
Qwen3-32B представляет собой мощную языковую модель с 32,8 миллиарда параметров из серии Qwen3. Она оптимизирована для выполнения сложных задач и ведения эффективного диалога. Модель позволяет переклю...
Qwen3-235B-A22B представляет собой модель смешанных экспертов (MoE) с 235B параметрами, разработанную компанией Qwen. В процессе работы активируется 22B параметров за один проход. Модель обеспечивает ...
DeepSeek-R1T-Chimera объединяет возможности моделей DeepSeek-R1 и DeepSeek-V3 (0324), интегрируя аналитические способности R1 с улучшенной эффективностью токенов V3. Основой служит архитектура DeepSee...
Модель THUDM: GLM Z1 Rumination 32B представляет собой 32B-параметрическую систему глубокого мышления из серии GLM-4-Z1, созданную для решения сложных задач с открытым концом, требующих продолжительны...
GLM-Z1-9B-0414 представляет собой языковую модель с 9 миллиардами параметров, разработанную компанией THUDM в рамках семейства GLM-4. Модель использует методы, примененные в более крупных версиях GLM-...
GLM-4-9B-0414 представляет собой языковую модель с 9 миллиардами параметров из серии GLM-4, разработанную компанией THUDM. Эта модель обучена с применением методов обучения с подкреплением и стратегий...
MAI-DS-R1 представляет собой модель, дообученную на основе DeepSeek-R1, созданную командой Microsoft AI для повышения отзывчивости по ранее заблокированным темам и улучшения профиля безопасности. Она ...