Anthropic випустила Claude Sonnet 4.6: порівнюємо з іншими LLM
Anthropic представила Claude Sonnet 4.6 — найпотужнішу на сьогодні LLM цієї серії, яка тепер є default-моделлю у claude.ai та Claude Cowork. У бета-версії модель підтримує контекстне вікно розміром до 1 мільйона токенів, що цілком достатньо для введення в одному запиті цілих кодових баз або десятків дослідницьких робіт.
Ціна доступу до Claude Sonnet 4.6 через API залишається такою ж, як і в Sonnet 4.5: від $3 за 1 мільйон вхідних та від $15 за 1 мільйон вихідних токенів. Варто відзначити, що ще одна флагманська LLM Anthropic — Opus 4.6, яку випустили 15 днів тому, коштує значно дорожче — від $5/25 за мільйон токенів.
Компанія-розробник стверджує, що Sonnet 4.6 суттєво покращила свої навички кодування в порівнянні з версією 4.5. Переваги над іншими LLM-моделями полягають також в узгодженості та кращому дотриманні інструкцій.
Якщо порівнювати Claude Sonnet 4.6 по бенчмарках, то в Anthropic не приховують: Opus 4.6 має перевагу по багатьом з них. Sonnet 4.6 «наближається до рівня інтелекту» Opus, але має дуже привабливу ціну, що робить новинку більш практичною для більшості завдань.
В агентному кодуванні (Terminal-Bench 2.0, SWE-Bench Verified) нова модель краща за Gemini 3 Pro, але поступається Opus 4.6, GPT-5.2 та навіть Opus 4.5. Однак Claude Sonnet 4.6 попереду всіх у фінансовому аналізі та офісних завданнях.
В анонсі Claude Sonnet 4.6 компанія доволі відверто оцінює цю модель. Anthropic вважає, що Opus 4.6 залишається найкращим варіантом для завдань, які вимагають найглибшого мислення, таких як рефакторинг кодової бази, координація кількох агентів у робочому процесі та проблеми, де правильне виконання є надзвичайно важливим. Водночас, перевага Claude Sonnet 4.6 у співвідношенні «ціна/якість».
У застосуванні через Claude Code внутрішнє тестування показало, що користувачі віддавали перевагу Sonnet 4.6 над Sonnet 4.5 приблизно у 70% випадків. Новинка ефективніше зчитує контекст перед зміною коду та консолідує спільну логіку, а не дублює її. Це робить використання Sonnet 4.6 протягом тривалих сеансів менш складним, ніж при взаємодії з попередніми моделями.
Користувачі оцінили Sonnet 4.6 як значно менш схильну до надмірної інженерії та «ліні», а також значно кращу у виконанні інструкцій. Нова LLM робить менше хибних заяв про успіх, має менше галюцинацій та більш послідовна у виконанні багатоетапних завдань.
Claude Sonnet 4.6 вже доступна для всіх планів Claude, Claude Cowork, Claude Code, API та всіх основних хмарних платформ. Anthropic оновила безкоштовний тариф до Sonnet 4.6 за замовчуванням — тепер він включає створення файлів, конектори, навички та ущільнення.
Нагадаємо, не так давно стало відомо, що Пентагон просить OpenAI та Anthropic зробити для військових спеціальні версії LLM «без обмежень».
Підписуйтесь на нас у соцмережах: Telegram | Facebook | LinkedIn















Сообщить об опечатке
Текст, который будет отправлен нашим редакторам: