Джек Кларк, співзасновник Anthropic і автор розсилки Import AI, нещодавно опублікував есе, яке важко назвати оптимістичним — але ще важче відмахнутися від нього як від алармізму. Його теза: з імовірністю понад 60% до кінця 2028 року з’явиться система штучного інтелекту, здатна автономно створити свого наступника — без участі людини.
«Я написав це есе, намагаючись холодно й аналітично розібратися з тим, що десятиліттями здавалося науково-фантастичною страшилкою», — підсумовує Кларк. — «Переглянувши публічні дані, я переконався, що це не фантазія, а реальна тенденція».
Кларк спирається не на чутки з лабораторій, а на публічно доступні дані: препринти наукових досліджень на arXiv, результати бенчмарків і продукти, які вже розгорнуті. Його аргумент складається з кількох рівнів.
Штучний інтелект існує у вигляді програмного забезпечення, а програмне забезпечення складається з коду. І саме тут прогрес найочевидніший.
Бенчмарк SWE-Bench вимірює, наскільки добре модель може вирішувати реальні завдання з GitHub. Коли він з’явився наприкінці 2023 року, найкращий результат — Claude 2 — складав близько 2%. Сьогодні Claude Mythos Preview досягає 93,9%, фактично вичерпуючи можливості тесту.
Паралельно компанія METR відстежує, скільки годин людської роботи ШІ-система може замінити за один сеанс (з 50% надійністю). Динаміка вражає:
| Рік | Модель | Горизонт |
| 2022 | GPT-3.5 | ~30 секунд |
| 2023 | GPT-4 | ~4 хвилини |
| 2024 | o1 | ~40 хвилин |
| 2025 | GPT-5.2 | ~6 годин |
| 2026 | Opus 4.6 | ~12 годин |
За прогнозами Аджеї Котра з METR, до кінця 2026 року ця позначка може сягнути 100 годин.
Найважливіша частина есе — це не загальні міркування, а конкретні бенчмарки, які вимірюють здатність штучного інтелекту виконувати саме ту роботу, яку виконують ШІ-дослідники.
Відтворення наукових результатів. Бенчмарк CORE-Bench перевіряє, чи може агент встановити залежності, запустити код зі статті та відтворити її результати. У вересні 2024 найкращий результат — 21,5%. У грудні 2025 benchmark визнали «вирішеним»: Opus 4.5 набрав 95,5%.
Змагання з машинного навчання. MLE-Bench від OpenAI перевіряє, як агенти справляються з реальними змаганнями Kaggle. При запуску в жовтні 2024 — 16,9%. Станом на лютий 2026 — 64,4%.
Оптимізація навчання моделей. Anthropic дає своїм системам завдання прискорити реалізацію навчання LLM-моделі. Прогрес: Claude Opus 4 у травні 2025 року дав прискорення у 2,9×, Opus 4.5 — 16,5×, Opus 4.6 — 30×, а Claude Mythos Preview у квітні 2026 — вже 52×. Для порівняння: людина-дослідник витрачає 4–8 годин, щоб досягти прискорення у 4×.
Пост-тренування інших моделей. Бенчмарк PostTrainBench перевіряє, чи може ШІ навчати менші моделі краще, ніж люди. Наразі найкращі системи досягають близько половини того приросту якості, якого досягають людські дослідники. Це ще не перевага, але вже значущий результат.
Дослідження з безпеки. Anthropic провела експеримент: кілька ШІ-агентів отримали дослідницький напрямок і самостійно намагалися перевершити людський базовий показник у задачі з «масштабованого нагляду» (scalable oversight). Їм це вдалося. Масштаб поки що невеликий — але прецедент є.
Кларк ставить чесне запитання: дослідження штучного інтелекту схоже більше на відкриття теорії відносності чи на складання Lego?
Його відповідь: переважно на Lego. Більшість прогресу в ШІ — це не революційні прориви, а методичне масштабування, налагодження та ітерація. Трансформери і MoE — це виключення, а не правило. Більшість роботи — це «нудне м’ясо і картопля» інженерії, яку ШІ вже вміє виконувати дедалі краще.
Є й паростки справжньої творчості: Gemini допоміг розв’язати одну з задач Ердьоша в математиці, а дослідники з UBC і Google DeepMind опублікували доведення, де ШІ зробив «дуже суттєвий внесок». Але Кларк залишається обережним: математика і комп’ютерні науки можуть бути нетиповими областями, де ШІ-творчість проявляється легше.
Мета автоматизації ШІ-досліджень — не чиясь фантазія:
Кларк формулює три великі наслідки.
Кларк не схильний до паніки. Але він дивиться на відкриті дані — і бачить, що всі складові для автоматизації ШІ-розробки вже є. Питання не «чи це можливо», а «коли це відбудеться».
60% — до кінця 2028 року. 30% — вже до кінця 2027 року.
Якщо цього не станеться до 2029-го, це означатиме, що поточна технологічна парадигма має якийсь фундаментальний дефект — і людській винахідливості знадобиться новий прорив.
Нагадаємо, вчора стало відомо, що індійських розробників Rockstar Games змушують працювати понаднормово заради релізу GTA VI.
Підписуйтесь на нас у соцмережах: Telegram | Facebook | LinkedIn
Українська оборонна компанія Swarmer, яка спеціалізується на програмному забезпеченні для автономних дронів, оголосила про вихід…
Український венчур-білдер SKELAR відкрив набір на другий потік акселераційної програми Veteran Venture Program. Це безкоштовна…
На фоні фінальної підготовки до виходу GTA VI в мережі з'явився відгук анонімного співробітника Rockstar…
Американські військові та цивільні співробітники Міністерства оборони США стрімко освоюють нову технологію штучного інтелекту —…
Apple тихо зняла з продажу базову конфігурацію Mac mini з 256 ГБ пам'яті за $599.…
Нове дослідження, опубліковане в журналі Nature, виявило неочікуваний побічний ефект «дружніх» діалогів зі штучним інтелектом.…