Компания Mistral представила свою новую модель искусственного интеллекта, ориентированную на программирование, под названием Devstral. Эта модель разработана совместно с компанией All Hands AI и доступна в открытом доступе по лицензии Apache 2.0, что позволяет использовать её в коммерческих целях без ограничений.
Mistral утверждает, что Devstral превосходит другие открытые модели, такие как Gemma 3 27B от Google и V3 от китайской лаборатории DeepSeek, в тестах SWE-Bench Verified, которые оценивают навыки программирования. В блоге Mistral говорится, что Devstral хорошо справляется с исследованием кодовых баз, редактированием нескольких файлов и поддержкой программных агентов.
Модель работает над каркасами кодовых агентов, такими как OpenHands и SWE-Agent, которые определяют интерфейс между моделью и тестовыми случаями. Devstral достаточно легка для запуска на одной видеокарте Nvidia RTX 4090 или на Mac с 32 ГБ оперативной памяти, что делает её идеальной для локального развертывания и использования на устройствах.
С выходом Devstral растет интерес к ИИ-ассистентам для программирования. В последнее время компании, такие как JetBrains, Google и OpenAI, представили свои модели, адаптированные для выполнения программных задач. Хотя ИИ по-прежнему сталкивается с трудностями в написании качественного кода — генерация кода часто приводит к уязвимостям и ошибкам, связанным с недостатками в понимании логики программирования — их потенциал по повышению производительности заставляет разработчиков активно их использовать. Опрос показал, что 76% разработчиков использовали или планировали использовать ИИ-инструменты в своих процессах разработки.
Ранее Mistral выпустила Codestral, генеративную модель для кода, но она имела ограничения на коммерческое использование. Devstral, названная Mistral «предварительным исследовательским продуктом», доступна для скачивания на платформах разработки ИИ, таких как Hugging Face, и через API Mistral. Стоимость составляет 0,1 доллара за миллион входных токенов и 0,3 доллара за миллион выходных токенов. Один миллион токенов соответствует примерно 750 000 словам, что больше, чем в «Войне и мире».
Mistral также работает над созданием более крупной модели для программирования, которая будет представлена в ближайшие недели. Хотя Devstral не является маленькой моделью, она содержит 24 миллиарда параметров, что позволяет ей решать различные задачи. Mistral была основана в 2023 году и нацелена на создание разнообразных ИИ-услуг, включая платформу для чат-ботов Le Chat и мобильные приложения. Компания привлекла более 1,1 миллиарда евро и сотрудничает с такими клиентами, как BNP Paribas, AXA и Mirakl.