Рубріки: Новини

LLM-моделі подвоюють свої можливості в програмуванні кожні 6 місяців

Дмитро Сімагін

Некомерційна дослідницька організація METR, яка вивчає можливості штучного інтелекту, оприлюднила графік, складений на основі даних про можливості сучасних LLM-моделей в галузі програмування. Виявилось, що моделі мають «час подвоєння» виконувати довготривалі завдання з програмування кожні 6 місяців. 

Хоча за графіком METR «час подвоєння» формально становить приблизно 7 місяців, слід взяти до уваги, що останнім часом він міг прискоритися (до 3 місяців, якщо розглядати лише моделі після 2024 року). Тому для спрощення автор аналізу Боаз Барак бере часовий проміжок 6 місяців.

На графіку ось Y відображає час, який знадобиться людині-програмісту для виконання завдання, яке також може виконати LLM-модель. Якщо версія GPT-2, яку представили в 2019 році, не сильно відрізнялась від звичайного розробника за часом виконання завдань, то в останні місяці ця різниця приголомшує. На завдання, які модель виконує майже моментально, у професійного розробника піде більше двох годин.

Нагадаємо, що кілька тижнів тому компанія Palisade Research, яка займається дослідженнями в галузі безпеки штучного інтелекту, заявила про появу у LLM-моделей «інстинкту самозбереження». Вчені виявили, що деякі моделі штучного інтелекту не бажають відключати себе при наявності такої рекомендації, а деякі навіть саботують механізми відключення.

Останні статті

Стейблкоїни на службі тіньової економіки: розбір звіту Chainalysis про китайські схеми

Звіт The 2026 Crypto Crime Report від компанії Chainalysis розкриває масштабну схему легалізації капіталу, де…

24.03.2026

Скандальний генератор відео Seedance 2.0 став публічно доступним

Генератор відео Seedance 2.0 від китайської компанії ByteDance став доступним у версії для CapCut. На…

24.03.2026

DarkSword опублікували на GitHub: атаки на українців можуть почастішати

Небезпечний набір експлойтів під назвою DarkSword став публічно доступним. Невідомий опублікував код його нової версії…

24.03.2026

Майбутнє вже тут: Claude отримав повний контроль над комп’ютером

Компанія Anthropic навчила агента на базі LLM Claude керувати комп'ютером Mac замість користувача. У Claude…

24.03.2026

Марк Цукерберг тестує персонального ШІ-агента: хоче автоматизувати управління компанією

Марк Цукерберг вирішив особисто протестувати концепцію AI-native, яку він просуває в Meta, почавши розробку власного…

24.03.2026

OpenAI запускає в ChatGPT бібліотеку для зберігання особистих файлів

OpenAI запускає в чат-боті ChatGPT нову функцію під назвою «Бібліотека» (Library). Завдяки їй ви можете…

24.03.2026