Новини 05/05/2026 08:48

Співзасновник Anthropic: системи штучного інтелекту ось-ось почнуть створювати самі себе

Редактор

Джек Кларк, співзасновник Anthropic і автор розсилки Import AI, нещодавно опублікував есе, яке важко назвати оптимістичним — але ще важче відмахнутися від нього як від алармізму. Його теза: з імовірністю понад 60% до кінця 2028 року з’явиться система штучного інтелекту, здатна автономно створити свого наступника — без участі людини.

«Я написав це есе, намагаючись холодно й аналітично розібратися з тим, що десятиліттями здавалося науково-фантастичною страшилкою», — підсумовує Кларк. — «Переглянувши публічні дані, я переконався, що це не фантазія, а реальна тенденція».

Чому саме зараз?

Кларк спирається не на чутки з лабораторій, а на публічно доступні дані: препринти наукових досліджень на arXiv, результати бенчмарків і продукти, які вже розгорнуті. Його аргумент складається з кількох рівнів.

Співзасновник Anthropic: системи штучного інтелекту ось-ось почнуть створювати самі себе

Код — це фундамент

Штучний інтелект існує у вигляді програмного забезпечення, а програмне забезпечення складається з коду. І саме тут прогрес найочевидніший.

Бенчмарк SWE-Bench вимірює, наскільки добре модель може вирішувати реальні завдання з GitHub. Коли він з’явився наприкінці 2023 року, найкращий результат — Claude 2 — складав близько 2%. Сьогодні Claude Mythos Preview досягає 93,9%, фактично вичерпуючи можливості тесту.

Паралельно компанія METR відстежує, скільки годин людської роботи ШІ-система може замінити за один сеанс (з 50% надійністю). Динаміка вражає:

Рік	Модель	Горизонт
2022	GPT-3.5	~30 секунд
2023	GPT-4	~4 хвилини
2024	o1	~40 хвилин
2025	GPT-5.2	~6 годин
2026	Opus 4.6	~12 годин

За прогнозами Аджеї Котра з METR, до кінця 2026 року ця позначка може сягнути 100 годин.

Штучний інтелект вже займається ШІ-дослідженнями

Найважливіша частина есе — це не загальні міркування, а конкретні бенчмарки, які вимірюють здатність штучного інтелекту виконувати саме ту роботу, яку виконують ШІ-дослідники.

Відтворення наукових результатів. Бенчмарк CORE-Bench перевіряє, чи може агент встановити залежності, запустити код зі статті та відтворити її результати. У вересні 2024 найкращий результат — 21,5%. У грудні 2025 benchmark визнали «вирішеним»: Opus 4.5 набрав 95,5%.

Змагання з машинного навчання. MLE-Bench від OpenAI перевіряє, як агенти справляються з реальними змаганнями Kaggle. При запуску в жовтні 2024 — 16,9%. Станом на лютий 2026 — 64,4%.

Оптимізація навчання моделей. Anthropic дає своїм системам завдання прискорити реалізацію навчання LLM-моделі. Прогрес: Claude Opus 4 у травні 2025 року дав прискорення у 2,9×, Opus 4.5 — 16,5×, Opus 4.6 — 30×, а Claude Mythos Preview у квітні 2026 — вже 52×. Для порівняння: людина-дослідник витрачає 4–8 годин, щоб досягти прискорення у 4×.

Пост-тренування інших моделей. Бенчмарк PostTrainBench перевіряє, чи може ШІ навчати менші моделі краще, ніж люди. Наразі найкращі системи досягають близько половини того приросту якості, якого досягають людські дослідники. Це ще не перевага, але вже значущий результат.

Дослідження з безпеки. Anthropic провела експеримент: кілька ШІ-агентів отримали дослідницький напрямок і самостійно намагалися перевершити людський базовий показник у задачі з «масштабованого нагляду» (scalable oversight). Їм це вдалося. Масштаб поки що невеликий — але прецедент є.

Чи може штучний інтелект створювати нові ідеї?

Кларк ставить чесне запитання: дослідження штучного інтелекту схоже більше на відкриття теорії відносності чи на складання Lego?

Його відповідь: переважно на Lego. Більшість прогресу в ШІ — це не революційні прориви, а методичне масштабування, налагодження та ітерація. Трансформери і MoE — це виключення, а не правило. Більшість роботи — це «нудне м’ясо і картопля» інженерії, яку ШІ вже вміє виконувати дедалі краще.

Є й паростки справжньої творчості: Gemini допоміг розв’язати одну з задач Ердьоша в математиці, а дослідники з UBC і Google DeepMind опублікували доведення, де ШІ зробив «дуже суттєвий внесок». Але Кларк залишається обережним: математика і комп’ютерні науки можуть бути нетиповими областями, де ШІ-творчість проявляється легше.

Індустрія сама про це говорить вголос

Мета автоматизації ШІ-досліджень — не чиясь фантазія:

OpenAI хоче мати «автоматизованого ШІ-стажиста-дослідника» вже до вересня 2026 року.
Anthropic публікує роботи про автоматизованих дослідників з безпеки.
DeepMind у своїх матеріалах зазначає, що автоматизацію досліджень із вирівнювання «слід проводити, коли це здійсненно».
Стартап Recursive Superintelligence залучив $500 млн з явною метою автоматизувати AI-дослідження.

Чому це важливо

Кларк формулює три великі наслідки.

Вирівнювання стає ще складнішим. Методи, які працюють сьогодні, можуть зламатися при рекурсивному самовдосконаленні. Якщо ваш метод вирівнювання правильний на 99,9%, після 500 поколінь його точність впаде до 60%. Це катастрофа.
Нерівність посилюється. Штучний інтелект дасть колосальний мультиплікатор продуктивності — але не всім одночасно. Питання розподілу обчислювальних ресурсів стане гостро політичним.
Економіка змінює структуру. Капіталомісткі, але малолюдні компанії витіснятимуть традиційні корпорації. Усередині «людської економіки» почне рости «машинна економіка», де ШІ-компанії торгуватимуть одна з одною. Виникнуть повністю автономні корпорації без жодного директора-людини.

Що далі?

Кларк не схильний до паніки. Але він дивиться на відкриті дані — і бачить, що всі складові для автоматизації ШІ-розробки вже є. Питання не «чи це можливо», а «коли це відбудеться».

60% — до кінця 2028 року. 30% — вже до кінця 2027 року.

Якщо цього не станеться до 2029-го, це означатиме, що поточна технологічна парадигма має якийсь фундаментальний дефект — і людській винахідливості знадобиться новий прорив.

Нагадаємо, вчора стало відомо, що індійських розробників Rockstar Games змушують працювати понаднормово заради релізу GTA VI.

Підписуйтесь на нас у соцмережах: Telegram | Facebook | LinkedIn