Рубріки: Новини

Нова модель Kimi K2 перевершує GPT-4 у ключових тестах — і вона безкоштовна

Дмитро Сімагін

Китайський стартап Moonshot AI випустив Kimi K2 — велику мовну модель з відкритим вихідним кодом, яка кидає виклик OpenAI та Anthropic, пропонуючи особливо високу продуктивність у кодуванні. Про це повідомляє Venture Beat.

Kimi K2 має 1 трильйон загальних параметрів і 32 мільярдів активованих параметрів, а також дві версії: базову модель і варіант з налаштуванням інструкцій, оптимізований для чату та автономних агентських програм.

У бенчмарк-тестах Kimi K2 досягла точності 65,8% у SWE-bench Verified, складному бенчмарку з розробки програмного забезпечення, перевершивши більшість альтернатив з відкритим кодом та зрівнявшись з дорогими пропрієтарними моделями.

Kimi K2 не просто конкурує з великими гравцями — вона перевершує їх у завданнях, які є найважливішими для корпоративних клієнтів. У бенчмарку з кодування LiveCodeBench Kimi K2 досягла точності 53,7%, що краще за 46,9% у DeepSeek-V3 та 44,7% у GPT-4.1. Також вона набрала 97,4% у MATH-500 порівняно з 92,4% у GPT-4.1.

Рішення Moonshot зробити Kimi K2 з відкритим вихідним кодом, одночасно пропонуючи доступ до API за конкурентною ціною, демонструє глибоке розуміння динаміки ринку, яке виходить далеко за рамки альтруїстичних принципів відкритого коду.

За ціною $0,15 за мільйон вхідних токенів та $2,50 за мільйон вихідних токенів, Moonshot агресивно встановлює ціни нижче, ніж OpenAI та Anthropic, пропонуючи при цьому схожу, а в деяких випадках і кращу продуктивність. Крім доступу через API, розробники можуть самостійно розгорнути модель на власній інфраструктурі, не сплачуючи за це жодного центу.

Останні статті

Надіслали оффер? Не поспішайте погоджуватися: як правильно відповісти на пропозицію, вибити собі зарплату та кращий соцпакет

Співбесіда була важка, але вам запропонували роботу. А що далі? Як тільки усвідомите це повною…

01.03.2026

Кіберпанк японською: 9 найкращих аніме в жанрі «технології нас погублять»

Японія сама по собі — суцільний кіберпанк. Це помітив навіть культовий письменник жанру Вільям Гібсон,…

01.03.2026

Чому сертифікована платформа швидше масштабується: технічний погляд та досвід команди SharksCode

Коли говорять про масштабування ІТ-продукту, зазвичай мають на увазі збільшення обсягу інфраструктури, щоб витримати більше…

27.02.2026

Китай розповсюджує теорію змови про «криптовалютну гегемонію» США

Китайський Національний центр реагування на комп’ютерні віруси (CVERC) оприлюднив звіт під гучною назвою «Top Player».…

27.02.2026

Григорович повернувся: найвідоміший український гейм-розробник анонсував новий проект S.T.R.A.N.G.E.R

Засновник відомої української геймдев-студії GSC Game World Сергій Григорович активно працює над новим проектом у…

27.02.2026

Microsoft теж виходить на ринок агентів. Зустрічайте Copilot Tasks

Microsoft анонсувала бета-версію нового інструмента штучного інтелекту під назвою Copilot Tasks. За словами компанії, він…

27.02.2026