Рубріки: Новини

Нова модель Kimi K2 перевершує GPT-4 у ключових тестах — і вона безкоштовна

Дмитро Сімагін

Китайський стартап Moonshot AI випустив Kimi K2 — велику мовну модель з відкритим вихідним кодом, яка кидає виклик OpenAI та Anthropic, пропонуючи особливо високу продуктивність у кодуванні. Про це повідомляє Venture Beat.

Kimi K2 має 1 трильйон загальних параметрів і 32 мільярдів активованих параметрів, а також дві версії: базову модель і варіант з налаштуванням інструкцій, оптимізований для чату та автономних агентських програм.

У бенчмарк-тестах Kimi K2 досягла точності 65,8% у SWE-bench Verified, складному бенчмарку з розробки програмного забезпечення, перевершивши більшість альтернатив з відкритим кодом та зрівнявшись з дорогими пропрієтарними моделями.

Kimi K2 не просто конкурує з великими гравцями — вона перевершує їх у завданнях, які є найважливішими для корпоративних клієнтів. У бенчмарку з кодування LiveCodeBench Kimi K2 досягла точності 53,7%, що краще за 46,9% у DeepSeek-V3 та 44,7% у GPT-4.1. Також вона набрала 97,4% у MATH-500 порівняно з 92,4% у GPT-4.1.

Рішення Moonshot зробити Kimi K2 з відкритим вихідним кодом, одночасно пропонуючи доступ до API за конкурентною ціною, демонструє глибоке розуміння динаміки ринку, яке виходить далеко за рамки альтруїстичних принципів відкритого коду.

За ціною $0,15 за мільйон вхідних токенів та $2,50 за мільйон вихідних токенів, Moonshot агресивно встановлює ціни нижче, ніж OpenAI та Anthropic, пропонуючи при цьому схожу, а в деяких випадках і кращу продуктивність. Крім доступу через API, розробники можуть самостійно розгорнути модель на власній інфраструктурі, не сплачуючи за це жодного центу.

Останні статті

Google випустила бету бібліотеки Compose 1.2 — базовий інструментарій для створення user-інтерфейсів в Android

Google оголосила, що бібліотека адаптивних макетів Compose 1.2 офіційно переходить у бета-версію. Вона надає розробникам…

04.09.2025

«Тепер важлива не кваліфікація, а ключові слова»: IT-фахівці розчаровані автоматизованим аналізом резюме

Опитування Dice, проведене серед понад 200 IT-працівників, виявило широке розчарування автоматизованою перевіркою резюме. Багато респондентів…

04.09.2025

Хакери навчились використовувати Grok для поширення шкідливих посилань

Зловмисники використовують Grok, вбудований у X помічник на основі штучного інтелекту, щоб обійти обмеження на…

04.09.2025

На GitHub виклали оригінальний код BASIC 1978 року

На GitHub виклали оригінальний вихідний код інтерпретатора BASIC 1.1 для процесора MOS 6502. Microsoft датує…

04.09.2025

Функція Projects тепер доступна для безкоштовних користувачів ChatGPT

Компанія OpenAI оголосила, що функція Projects стала доступною для безкоштовних користувачів ChatGPT. Проекти дозволяють каталогізувати…

04.09.2025

Мінцифри шукає бажаючих тренувати національну LLM

Міністерство цифрової трансформації оголосило конкурс для бажаючих взяти участь у розробці та навчанні української великої…

03.09.2025