Рубріки: Новини

Devstral — нова LLM-модель з відкритим кодом, створена спеціально для розробки ПЗ

Дмитро Сімагін

Французький стартап Mistral випустив Devstral — нову LLM-модель з відкритим кодом, яка створена спеціально для розробки програмного забезпечення.

Devstral має 24 мільярдів параметрів, що робить її доступною для локального розгортання на ПК з одним графічним процесором Nvidia RTX 4090 або Mac із 32 ГБ оперативної пам’яті. Це може зацікавити тих розробників, яким важлива конфіденційність, або тих, хто працює без доступу до інтернету.

Модель підтримує контекстне вікно на 128 000 токенів та використовує токенізатор Tekken зі словником на 131 000 слів для роботи з великими кодовими базами. На відміну від більшості інших мовних моделей, які орієнтовані на автодоповнення коду, Devstral оптимізована для агентних робочих процесів. Вона інтегрується з фреймворками, такими як OpenHands, SWE-Agent та OpenDevin, що дозволяє їй аналізувати великі кодові бази, редагувати кілька файлів і виконувати багатоетапні завдання.

За даними Mistral, її модель перевершує інші аналогічні LLM з відкритим кодом, такі як Gemma 3 27B від Google і V3 від китайської DeepSeek. Згідно бенчмарку SWE-Bench Verified, Devstral набрала 46,8% на 500 реальних задачах з GitHub. Вона також випереджає на більш ніж 20% деякі закриті моделі, такі як GPT-4.1-mini. 

«На даний момент це, безумовно, найкраща відкрита модель для SWE-Bench Verified і для кодових агентів», — запевняють в Mistral.

Devstral доступна для завантаження на Hugging Face, Ollama, Kaggle, LM Studio та Unsloth. Модель підтримує фреймворки, включно з vLLM, Transformers та Mistral Inference. Також модель доступна через API Mistral Le Platforme під назвою `devstral-small-2505` з ціною $0,10 за мільйон вхідних токенів та $0,30 за мільйон вихідних токенів (приблизно 750 000 слів).

Нагадаємо, що днями стало відомо, що компанія Apple планує зробити свої LLM-моделі доступними для розробників.

 

Останні статті

Китайська LLM-модель DeepSeek-R1 генерує небезпечний код, якщо в запитах згадується Тибет або уйгури

Дослідження компанії кібербезпеки CrowdStrike показало, що LLM-модель DeepSeek-R1 створює більше вразливостей безпеки в коді, якщо…

25.11.2025

Amazon примушує своїх розробників відмовитися від сторонніх інструментів кодування на користь Kiro

Amazon пропонує своїм розробникам відмовитися від інструментів генерації коду від сторонніх компаній на користь власного…

25.11.2025

Anthropic стверджує, що її нова модель Claude Opus 4.5 перевершує всіх в програмуванні

Anthropic випустила нову LLM-модель Claude Opus 4.5. Стверджується, що це найкраща модель у світі для…

25.11.2025

Китайський інструмент вайб-кодингу LingGuang обігнав за популярністю ChatGPT і Sora 2

Інструмент кодування LingGuang від китайської компанії Ant Group менше ніж за тиждень досяг першого мільйона…

24.11.2025

Microsoft і GitHub об’єднали свої інструменти пошуку багів

Microsoft та її дочірня компанія GitHub оголосили про інтеграцію інструментів Microsoft Defender for Cloud та…

24.11.2025

Андрей Карпати виклав LLM Council — інструмент, де моделі штучного інтелекту сперечаються між собою

Відомий ентузіаст штучного інтелекту, співзасновник OpenAI та винахідник терміну «вайб-кодинг» Андрей Карпати виклав у відкритий…

24.11.2025