Рубріки: Новини

LLM-моделі подвоюють свої можливості в програмуванні кожні 6 місяців

Дмитро Сімагін

Некомерційна дослідницька організація METR, яка вивчає можливості штучного інтелекту, оприлюднила графік, складений на основі даних про можливості сучасних LLM-моделей в галузі програмування. Виявилось, що моделі мають «час подвоєння» виконувати довготривалі завдання з програмування кожні 6 місяців. 

Хоча за графіком METR «час подвоєння» формально становить приблизно 7 місяців, слід взяти до уваги, що останнім часом він міг прискоритися (до 3 місяців, якщо розглядати лише моделі після 2024 року). Тому для спрощення автор аналізу Боаз Барак бере часовий проміжок 6 місяців.

На графіку ось Y відображає час, який знадобиться людині-програмісту для виконання завдання, яке також може виконати LLM-модель. Якщо версія GPT-2, яку представили в 2019 році, не сильно відрізнялась від звичайного розробника за часом виконання завдань, то в останні місяці ця різниця приголомшує. На завдання, які модель виконує майже моментально, у професійного розробника піде більше двох годин.

Нагадаємо, що кілька тижнів тому компанія Palisade Research, яка займається дослідженнями в галузі безпеки штучного інтелекту, заявила про появу у LLM-моделей «інстинкту самозбереження». Вчені виявили, що деякі моделі штучного інтелекту не бажають відключати себе при наявності такої рекомендації, а деякі навіть саботують механізми відключення.

Останні статті

Український хакер визнав себе винним у розповсюдженні шкідливого ПЗ Nefilim. За інформацію про його спільника влада США готова заплатити $11 мільйонів

Громадянин України Артем Стрижак у п'ятницю визнав себе винним у здійсненні атак з використанням шкідливого…

22.12.2025

Кожен п’ятий програміст, найнятий Google у цьому році, раніше вже звільнявся з компанії

Близько 20% програмістів, найнятих Google у 2025 році для розробки штучного інтелекту, були так званими…

22.12.2025

Нові комп’ютери почали продавати без оперативної пам’яті

Компанія Paradox Customs, один з найбільших дилерів ПК у штаті Нью-Йорк, оголосила, що додає до…

22.12.2025

Docker Hardened Images тепер доступні безкоштовно та мають відкритий код

Більше 1000 захищених образів Docker (Docker Hardened Images, DHI) стали доступні для розробників безкоштовно та…

22.12.2025

Чат-бот Claude став доступний як розширення для браузера Chrome

Anthropic представила версію свого чат-бота Claude у вигляді розширення для браузера Google Chrome. В рамках…

22.12.2025

Amazon викрила IT-фахівця з КНДР завдяки мілісекундам затримки при натисканні клавіатури

Північнокорейського самозванця, який віддалено працював системним адміністратором в американському Amazon, викрили після того, як затримка…

19.12.2025