Рубріки: Новини

LLM-моделі подвоюють свої можливості в програмуванні кожні 6 місяців

Дмитро Сімагін

05.11.2025 15:57

Некомерційна дослідницька організація METR, яка вивчає можливості штучного інтелекту, оприлюднила графік, складений на основі даних про можливості сучасних LLM-моделей в галузі програмування. Виявилось, що моделі мають «час подвоєння» виконувати довготривалі завдання з програмування кожні 6 місяців.

Хоча за графіком METR «час подвоєння» формально становить приблизно 7 місяців, слід взяти до уваги, що останнім часом він міг прискоритися (до 3 місяців, якщо розглядати лише моделі після 2024 року). Тому для спрощення автор аналізу Боаз Барак бере часовий проміжок 6 місяців.

На графіку ось Y відображає час, який знадобиться людині-програмісту для виконання завдання, яке також може виконати LLM-модель. Якщо версія GPT-2, яку представили в 2019 році, не сильно відрізнялась від звичайного розробника за часом виконання завдань, то в останні місяці ця різниця приголомшує. На завдання, які модель виконує майже моментально, у професійного розробника піде більше двох годин.

Нагадаємо, що кілька тижнів тому компанія Palisade Research, яка займається дослідженнями в галузі безпеки штучного інтелекту, заявила про появу у LLM-моделей «інстинкту самозбереження». Вчені виявили, що деякі моделі штучного інтелекту не бажають відключати себе при наявності такої рекомендації, а деякі навіть саботують механізми відключення.

Наступна стаття ChatGPT відповідає точніше, якщо з ним розмовляти грубо »

попередня стаття « Генератор відео Sora від OpenAI став доступним на Android

Дмитро Сімагін

Теги: LLM-модельMETRдослідження

05.11.2025 15:57

Останні статті

Новини

Стейблкоїни на службі тіньової економіки: розбір звіту Chainalysis про китайські схеми

Звіт The 2026 Crypto Crime Report від компанії Chainalysis розкриває масштабну схему легалізації капіталу, де…

24.03.2026

Новини

Скандальний генератор відео Seedance 2.0 став публічно доступним

Генератор відео Seedance 2.0 від китайської компанії ByteDance став доступним у версії для CapCut. На…

24.03.2026

Новини

DarkSword опублікували на GitHub: атаки на українців можуть почастішати

Небезпечний набір експлойтів під назвою DarkSword став публічно доступним. Невідомий опублікував код його нової версії…

24.03.2026

Новини

Майбутнє вже тут: Claude отримав повний контроль над комп’ютером

Компанія Anthropic навчила агента на базі LLM Claude керувати комп'ютером Mac замість користувача. У Claude…

24.03.2026

Новини

Марк Цукерберг тестує персонального ШІ-агента: хоче автоматизувати управління компанією

Марк Цукерберг вирішив особисто протестувати концепцію AI-native, яку він просуває в Meta, почавши розробку власного…

24.03.2026

Новини

OpenAI запускає в ChatGPT бібліотеку для зберігання особистих файлів

OpenAI запускає в чат-боті ChatGPT нову функцію під назвою «Бібліотека» (Library). Завдяки їй ви можете…

24.03.2026

LLM-моделі подвоюють свої можливості в програмуванні кожні 6 місяців

Схожі статті

Останні статті

Стейблкоїни на службі тіньової економіки: розбір звіту Chainalysis про китайські схеми

Скандальний генератор відео Seedance 2.0 став публічно доступним

DarkSword опублікували на GitHub: атаки на українців можуть почастішати

Майбутнє вже тут: Claude отримав повний контроль над комп’ютером

Марк Цукерберг тестує персонального ШІ-агента: хоче автоматизувати управління компанією

OpenAI запускає в ChatGPT бібліотеку для зберігання особистих файлів