Рубріки: Новини

Ілля Суцкевер: масштабування LLM вже нічого не дає

Дмитро Сімагін

Ілля Суцкевер (співзасновник OpenAI, нині керівник Safe Superintelligence Inc.) і Янн Лекун (віце-президент і головний науковець Meta AI) майже синхронно заявили: галузь штучного інтелекту переходить від «ери масштабування» до «ери досліджень». Просте додавання нових кластерів GPU вже мало що дає в плані продуктивності, пише ABZ Global.

Останнє десятиліття індустрія ШІ жила за формулою «більше даних → більше параметрів → краща модель». Тепер обидва дослідники визнають: наступний етап розвитку штучного інтелекту вимагає нових ідей, а не просто додаткових чіпів Nvidia.

На думку Суцкевера, головними лімітами нинішніх LLM є те, що їхні узагальнення все ще слабші за людські — моделі вимагають тонни даних і складні методи обробки результатів. Тому його нова компанія робить ставку саме на нові методи навчання, а не на «GPT-7, такий самий, але більший».

Лекун виявився ще більш радикальним. Він вважає, що LLM-моделі глибоко обмежені. Кожен новий стрибок їхньої продуктивності дається все дорожче, а віддача знижується. Для справжнього інтелекту потрібні world models — системи, які навчаються на відео, будують уявлення про об’єкти, час та причинність.

Обидва науковці сходяться на головному: світ штучного інтелекту змінюється. GPU перестають бути головною перевагою, бенчмарки більше нічого не гарантують, стек ШІ стане різноманітнішим. Тому головною перевагою будуть дані для навчання та зворотний зв’язок. У перегонах моделей переможуть ті, хто володіє якісними даними, будує точні метрики якості, швидко (та ітеративно) покращує результат під свої процеси.

 

Останні статті

Microsoft прискорює цикл оновлень Visual Studio. Не всі розробники цим задоволені

Microsoft прискорює цикл оновлень Visual Studio. Замість щоквартальних апдейтів розробників чекають щомісячні оновлення функцій та…

27.11.2025

Поліція США провела кілька арештів за «кримінальні» запити в ChatGPT

Американські правоохоронці заарештували кілька підлітків після того, як з'ясувалось, що їхні запити в ChatGPT були…

27.11.2025

«Найкраща модель для кодування»: розробники поділились першими враженнями про Claude Opus 4.5

Вчорашній реліз Claude Opus 4.5, першої LLM-моделі, яка «працює краще людини», отримав перші враження в…

26.11.2025

Українські роботодавці готові платити до $2000 за рекомендацію miltech-фахівця

Бурхливий розвиток miltech-галузі в Україні потребує більшої кількості кваліфікованих фахівців. Свідченням цього є готовність вітчизняних…

26.11.2025

Які рішення з ШІ захистять від кіберзагроз у 2026 році? Розкажуть на вебінарі від iIT Distribution

Компанія iIT Distribution запрошує на безплатний вебінар «Кібербезпека нового покоління: використання ШІ у платформах Vectra…

26.11.2025

Видаляти програми у Windows 11 стане простіше

Microsoft спрощує у Windows 11 процес видалення програм, встановлених із Microsoft Store. Користувачі зможуть робити…

26.11.2025