Рубріки: Новини

Співзасновник Anthropic: системи штучного інтелекту ось-ось почнуть створювати самі себе

Дмитро Сімагін

05.05.2026 08:48

Джек Кларк, співзасновник Anthropic і автор розсилки Import AI, нещодавно опублікував есе, яке важко назвати оптимістичним — але ще важче відмахнутися від нього як від алармізму. Його теза: з імовірністю понад 60% до кінця 2028 року з’явиться система штучного інтелекту, здатна автономно створити свого наступника — без участі людини.

«Я написав це есе, намагаючись холодно й аналітично розібратися з тим, що десятиліттями здавалося науково-фантастичною страшилкою», — підсумовує Кларк. — «Переглянувши публічні дані, я переконався, що це не фантазія, а реальна тенденція».

Чому саме зараз?

Кларк спирається не на чутки з лабораторій, а на публічно доступні дані: препринти наукових досліджень на arXiv, результати бенчмарків і продукти, які вже розгорнуті. Його аргумент складається з кількох рівнів.

Код — це фундамент

Штучний інтелект існує у вигляді програмного забезпечення, а програмне забезпечення складається з коду. І саме тут прогрес найочевидніший.

Бенчмарк SWE-Bench вимірює, наскільки добре модель може вирішувати реальні завдання з GitHub. Коли він з’явився наприкінці 2023 року, найкращий результат — Claude 2 — складав близько 2%. Сьогодні Claude Mythos Preview досягає 93,9%, фактично вичерпуючи можливості тесту.

Паралельно компанія METR відстежує, скільки годин людської роботи ШІ-система може замінити за один сеанс (з 50% надійністю). Динаміка вражає:

Рік	Модель	Горизонт
2022	GPT-3.5	~30 секунд
2023	GPT-4	~4 хвилини
2024	o1	~40 хвилин
2025	GPT-5.2	~6 годин
2026	Opus 4.6	~12 годин

За прогнозами Аджеї Котра з METR, до кінця 2026 року ця позначка може сягнути 100 годин.

Штучний інтелект вже займається ШІ-дослідженнями

Найважливіша частина есе — це не загальні міркування, а конкретні бенчмарки, які вимірюють здатність штучного інтелекту виконувати саме ту роботу, яку виконують ШІ-дослідники.

Відтворення наукових результатів. Бенчмарк CORE-Bench перевіряє, чи може агент встановити залежності, запустити код зі статті та відтворити її результати. У вересні 2024 найкращий результат — 21,5%. У грудні 2025 benchmark визнали «вирішеним»: Opus 4.5 набрав 95,5%.

Змагання з машинного навчання. MLE-Bench від OpenAI перевіряє, як агенти справляються з реальними змаганнями Kaggle. При запуску в жовтні 2024 — 16,9%. Станом на лютий 2026 — 64,4%.

Оптимізація навчання моделей. Anthropic дає своїм системам завдання прискорити реалізацію навчання LLM-моделі. Прогрес: Claude Opus 4 у травні 2025 року дав прискорення у 2,9×, Opus 4.5 — 16,5×, Opus 4.6 — 30×, а Claude Mythos Preview у квітні 2026 — вже 52×. Для порівняння: людина-дослідник витрачає 4–8 годин, щоб досягти прискорення у 4×.

Пост-тренування інших моделей. Бенчмарк PostTrainBench перевіряє, чи може ШІ навчати менші моделі краще, ніж люди. Наразі найкращі системи досягають близько половини того приросту якості, якого досягають людські дослідники. Це ще не перевага, але вже значущий результат.

Дослідження з безпеки. Anthropic провела експеримент: кілька ШІ-агентів отримали дослідницький напрямок і самостійно намагалися перевершити людський базовий показник у задачі з «масштабованого нагляду» (scalable oversight). Їм це вдалося. Масштаб поки що невеликий — але прецедент є.

Чи може штучний інтелект створювати нові ідеї?

Кларк ставить чесне запитання: дослідження штучного інтелекту схоже більше на відкриття теорії відносності чи на складання Lego?

Його відповідь: переважно на Lego. Більшість прогресу в ШІ — це не революційні прориви, а методичне масштабування, налагодження та ітерація. Трансформери і MoE — це виключення, а не правило. Більшість роботи — це «нудне м’ясо і картопля» інженерії, яку ШІ вже вміє виконувати дедалі краще.

Є й паростки справжньої творчості: Gemini допоміг розв’язати одну з задач Ердьоша в математиці, а дослідники з UBC і Google DeepMind опублікували доведення, де ШІ зробив «дуже суттєвий внесок». Але Кларк залишається обережним: математика і комп’ютерні науки можуть бути нетиповими областями, де ШІ-творчість проявляється легше.

Індустрія сама про це говорить вголос

Мета автоматизації ШІ-досліджень — не чиясь фантазія:

OpenAI хоче мати «автоматизованого ШІ-стажиста-дослідника» вже до вересня 2026 року.
Anthropic публікує роботи про автоматизованих дослідників з безпеки.
DeepMind у своїх матеріалах зазначає, що автоматизацію досліджень із вирівнювання «слід проводити, коли це здійсненно».
Стартап Recursive Superintelligence залучив $500 млн з явною метою автоматизувати AI-дослідження.

Чому це важливо

Кларк формулює три великі наслідки.

Вирівнювання стає ще складнішим. Методи, які працюють сьогодні, можуть зламатися при рекурсивному самовдосконаленні. Якщо ваш метод вирівнювання правильний на 99,9%, після 500 поколінь його точність впаде до 60%. Це катастрофа.
Нерівність посилюється. Штучний інтелект дасть колосальний мультиплікатор продуктивності — але не всім одночасно. Питання розподілу обчислювальних ресурсів стане гостро політичним.
Економіка змінює структуру. Капіталомісткі, але малолюдні компанії витіснятимуть традиційні корпорації. Усередині «людської економіки» почне рости «машинна економіка», де ШІ-компанії торгуватимуть одна з одною. Виникнуть повністю автономні корпорації без жодного директора-людини.

Що далі?

Кларк не схильний до паніки. Але він дивиться на відкриті дані — і бачить, що всі складові для автоматизації ШІ-розробки вже є. Питання не «чи це можливо», а «коли це відбудеться».

60% — до кінця 2028 року. 30% — вже до кінця 2027 року.

Якщо цього не станеться до 2029-го, це означатиме, що поточна технологічна парадигма має якийсь фундаментальний дефект — і людській винахідливості знадобиться новий прорив.

Нагадаємо, вчора стало відомо, що індійських розробників Rockstar Games змушують працювати понаднормово заради релізу GTA VI.

Підписуйтесь на нас у соцмережах: Telegram | Facebook | LinkedIn

Наступна стаття Українська deftech-компанія з капіталізацією $414 млн виходить на ринок Японії. Партнером стане розробник Viber »

попередня стаття « Ветерани з IT-досвідом зможуть отримати до $20 000 на розвиток бізнесу — SKELAR відкрив набір на акселераційну програму

Дмитро Сімагін

Теги: Anthropicбенчмаркиштучний інтелект

05.05.2026 08:48

Останні статті

Новини

Українська deftech-компанія з капіталізацією $414 млн виходить на ринок Японії. Партнером стане розробник Viber

Українська оборонна компанія Swarmer, яка спеціалізується на програмному забезпеченні для автономних дронів, оголосила про вихід…

05.05.2026

Новини

Ветерани з IT-досвідом зможуть отримати до $20 000 на розвиток бізнесу — SKELAR відкрив набір на акселераційну програму

Український венчур-білдер SKELAR відкрив набір на другий потік акселераційної програми Veteran Venture Program. Це безкоштовна…

04.05.2026

Новини

Індійських розробників Rockstar Games змушують працювати понаднормово заради релізу GTA VI

На фоні фінальної підготовки до виходу GTA VI в мережі з'явився відгук анонімного співробітника Rockstar…

04.05.2026

Новини

Пентагон захопився вайб-кодингом: понад 100 000 ШІ-агентів за п’ять тижнів

Американські військові та цивільні співробітники Міністерства оборони США стрімко освоюють нову технологію штучного інтелекту —…

04.05.2026

Новини

Ажіотаж навколо OpenClaw не минув дарма: Apple «вбила» найдоступніший Mac mini

Apple тихо зняла з продажу базову конфігурацію Mac mini з 256 ГБ пам'яті за $599.…

04.05.2026

Новини

Пастка емпатії: дружня розмова з чат-ботом знижує ефективність відповідей

Нове дослідження, опубліковане в журналі Nature, виявило неочікуваний побічний ефект «дружніх» діалогів зі штучним інтелектом.…

04.05.2026

Співзасновник Anthropic: системи штучного інтелекту ось-ось почнуть створювати самі себе

Чому саме зараз?

Код — це фундамент

Штучний інтелект вже займається ШІ-дослідженнями

Чи може штучний інтелект створювати нові ідеї?

Індустрія сама про це говорить вголос

Чому це важливо

Що далі?

Схожі статті

Останні статті

Українська deftech-компанія з капіталізацією $414 млн виходить на ринок Японії. Партнером стане розробник Viber

Ветерани з IT-досвідом зможуть отримати до $20 000 на розвиток бізнесу — SKELAR відкрив набір на акселераційну програму

Індійських розробників Rockstar Games змушують працювати понаднормово заради релізу GTA VI

Пентагон захопився вайб-кодингом: понад 100 000 ШІ-агентів за п’ять тижнів

Ажіотаж навколо OpenClaw не минув дарма: Apple «вбила» найдоступніший Mac mini

Пастка емпатії: дружня розмова з чат-ботом знижує ефективність відповідей