Рубріки: Новини

LLM-моделі подвоюють свої можливості в програмуванні кожні 6 місяців

Дмитро Сімагін

Некомерційна дослідницька організація METR, яка вивчає можливості штучного інтелекту, оприлюднила графік, складений на основі даних про можливості сучасних LLM-моделей в галузі програмування. Виявилось, що моделі мають «час подвоєння» виконувати довготривалі завдання з програмування кожні 6 місяців. 

Хоча за графіком METR «час подвоєння» формально становить приблизно 7 місяців, слід взяти до уваги, що останнім часом він міг прискоритися (до 3 місяців, якщо розглядати лише моделі після 2024 року). Тому для спрощення автор аналізу Боаз Барак бере часовий проміжок 6 місяців.

На графіку ось Y відображає час, який знадобиться людині-програмісту для виконання завдання, яке також може виконати LLM-модель. Якщо версія GPT-2, яку представили в 2019 році, не сильно відрізнялась від звичайного розробника за часом виконання завдань, то в останні місяці ця різниця приголомшує. На завдання, які модель виконує майже моментально, у професійного розробника піде більше двох годин.

Нагадаємо, що кілька тижнів тому компанія Palisade Research, яка займається дослідженнями в галузі безпеки штучного інтелекту, заявила про появу у LLM-моделей «інстинкту самозбереження». Вчені виявили, що деякі моделі штучного інтелекту не бажають відключати себе при наявності такої рекомендації, а деякі навіть саботують механізми відключення.

Останні статті

10 причин, чому ця криптозима буде найгіршою в історії (штучний інтелект теж звинуватили)

Біткоїн використав усі причини та пояснення, які протягом багатьох років спонукали людей вкладати гроші в…

06.02.2026

Meta розробляє власний аналог TikTok: як він виглядатиме

Компанія Meta розробляє окремий додаток, інтерфейс якого дуже схожий на TikTok. Майбутня програма під назвою…

06.02.2026

Редактор коду VS Code 1.109 отримав підтримку паралельного керування кількома сеансами агентів

Microsoft оновила свій багатофункціональний редактор коду Visual Studio Code. Версія VS Code 1.109, за твердженням…

06.02.2026

Португальська компанія TEKEVER шукає фахівців з розробки безпілотних систем для команди в Україні

Компанія TEKEVER, провідний європейський постачальник безпілотних авіаційних систем з використанням штучного інтелекту, відкриває нові інженерні…

06.02.2026

OpenAI випустила GPT-5.3-Codex: на 25% швидше пише код і виконує «будь-які» завдання замість розробників

Компанія OpenAI випустила модель для агентного кодування GPT-5.3-Codex — майже одразу після релізу Claude Opus…

06.02.2026

Anthropic випустила Claude Opus 4.6 з підтримкою довгого контексту

Anthropic оголосила про реліз Claude Opus 4.6, яка, за словами компанії, є її найпотужнішою моделлю…

06.02.2026