Агент Google AlphaEvolve створює тисячі варіантів коду, щоб вибрати найкращий
Команда Google DeepMind випустила AlphaEvolve — «суперагент» на базі Gemini 2.0, який може генерувати та перевіряти десятки тисяч варіантів коду, поки не знайде найкращий серед них алгоритм. Про це повідомляє блог Google DeepMind.
AlphaEvolve поєднує дві версії Gemini: швидку Flash для масової генерації ідей і «глибшу» Pro для точкових покращень. Кожен фрагмент коду автоматично компілюється, запускається та оцінюється за метриками точності, швидкості та витрати ресурсів. Найкращі варіанти об’єднуються та допрацьовуються у наступних генераціях.
За рік внутрішнього тестування AlphaEvolve зумів скоротити кількість дій при множенні двох 4×4 комплексних матриць з 49 до 48, побивши рекорд, що тримався 56 років, і знайшов більш швидкі алгоритми для тринадцяти інших розмірів матриць. Загалом, перевіривши понад 50 класичних головоломок, AlphaEvolve відтворив найкращі відомі рішення приблизно у 75% випадків та покращив їх в 25%, причому підготовка тестового середовища займала години, а не тижні.
Новий сервіс будує цілі кодові бази, тоді як AlphaTensor (2022) та FunSearch (2023) генерували лише окремі функції. Експерти вважають, що комбінування еволюційного пошуку із LLM-творчістю виводить алгоритмічне проектування на новий рівень.
Потенційні застосування нового агента досить широкі: від оптимізації GPU-інструкцій та енергетики до матеріалознавства та розробки ліків. Обмеження для завдань одне: завдання повинно мати формалізований критерій оцінки, інакше агенту нема з чим «порівнювати» мутації.
У Грузії за запитом поліції Південної Кореї було затримано 29-річного громадянина Литви, якого підозрюють в…
Компанії все частіше відмовляються від оцінки класичних резюме, віддаючи перевагу найму, де кандидата оцінюють, наскільки…
Команда YC.Market оприлюднила аналіз реєстрацій фізичних осіб підприємців (ФОП) за неповний 4 квартал 2025 року.…
Керівник OpenAI Сем Альтман оголосив про пошук нового директора відділу готовності (head of preparedness), який…
Microsoft доповнила функціонал Copilot найпотужнішою на сьогоднішній день LLM-моделлю GPT-5.2 від OpenAI. Вона дозволяє швидше…
Сервіс Google Photos з'явиться на телевізорах вже наступного року, спочатку лише на пристроях Samsung. Перші…