Рубріки: Новини

Gemini 3 Pro від Google стає новим лідером в кодуванні, випередивши Claude Sonnet 4.5

Дмитро Сімагін

Компанія Google випустила нову мультимодальну LLM-модель Gemini 3 Pro, яку вже названо найпотужнішою з усіх у сімействі Gemini. Новинка доступна в додатку Gemini, пошуку Google (AI Mode), а також в інструментах для розробників і корпоративних клієнтів, пише The Verge.

За більшістю бенчмарків Gemini 3 Pro перевершує усіх конкурентів. Модель стала лідером в рейтингу кодування LMArena, набравши 1544 балів, тоді як Claude Sonnet 4.5-thinking має 1526 балів. Крім того, Gemini 3 Pro отримала перше місце:

  • в математиці (на другому місці — Claude Sonnet 4.5-thinking);
  • в творчому письмі (на другому — Grok 4.1-thinking);
  • Hard Prompts (на другому — Grok 4.1-thinking);
  • Instruction Following (на другому — Claude Sonnet 4.5-thinking);
  • Multi Turn (на другому — Claude Sonnet 4.5-thinking);
  • Longer Query (на другому — Claude Sonnet 4.5-thinking).

В експертних висновках Gemini 3 Pro отримала третє місце (попереду — Claude Sonnet 4.5-thinking і Grok 4.1-thinking). Модель має 91,9% у GPQA Diamond (глибоке розуміння питань) та 72,1% точності за SimpleQA Verified.

Також Gemini 3 Pro показала найвищий результат в історії тесту Humanity’s Last Exam – 37,5%, без використання додаткових інструментів. Цей тест призначений для оцінки загальних здібностей до міркування та експертних знань. Попередній рекорд, що належав GPT-5 Pro, складав 31,64%.

Паралельно Google анонсувала режим Gemini 3 Deep Think, орієнтований на ще складніші завдання. За попередніми даними, він демонструє ще більш високі показники в тестах, що вимагають логічних міркувань: результат у Humanity’s Last Exam становить 41%, а в GPQA Diamond — 93,8%. 

Розробники відзначають, що модель демонструє рівень міркувань, який можна порівняти з рівнем доктора філософії. 

«З Gemini 3 ми спостерігаємо величезний стрибок у здатності до міркування, — Вона реагує з глибиною та нюансами, яких ми раніше не бачили», — заявив Тулсі Доші, керівник відділу продуктів Google.

Одночасно Google також представила новий інтерфейс для написання програмного коду на базі Gemini під назвою Google Antigravity. Він призначений для багатопанельного агентного кодингу, аналогічно до агентних IDE, таких як Warp або Cursor 2.0. Зокрема, Antigravity поєднує в собі вікно підказок у стилі ChatGPT з інтерфейсом командного рядка та вікном браузера, яке може показувати вплив змін, внесених агентом.

«Агент може працювати з вашим редактором коду через ваш термінал, через ваш браузер, щоб допомогти вам створити додаток найкращим чином», — сказав технічний директор DeepMind Корай Кавукчуоглу.

Скористатися Gemini 3 можуть усі бажаючі безкоштовно через мобільний додаток Gemini. У ШІ-режимі пошуковика Google нова нейромережа доступна поки лише платним передплатникам на тарифах Google AI Pro та Ultra. Режим Gemini 3 Deep Think зараз перебуває на стадії перевірки безпеки, він стане доступним користувачам Google AI Ultra протягом найближчих тижнів.

Останні статті

Безлім на швидкості 400 Кбіт/с: уряд Південної Кореї зобов’язав мобільних операторів надавати інтернет безкоштовно

Уряд Південної Кореї оголосив про масштабну реформу ринку мобільного зв'язку. Міністерство науки та інформаційно-комунікаційних технологій…

10.04.2026

Видалення програми не врятує: ФБР навчилося читати повідомлення Signal через кеш iOS

Правоохоронні органи винайшли новий метод для обходу конфіденційності месенджерів. Під час судового процесу в Техасі…

10.04.2026

Claude Cowork став загальнодоступним в усіх тарифних планах на Windows і macOS

Компанія Anthropic оголосила про масштабне оновлення свого інструменту Claude Cowork. Тепер він доступний користувачам усіх…

10.04.2026

Коментарі в Instagram тепер можна редагувати. Але є умова

Соцмережа Instagram офіційно запровадила функцію, на яку користувачі чекали роками — можливість редагувати опубліковані коментарі.…

10.04.2026

Чат-бот Gemini тепер може створювати 3D-моделі та інтерактивні діаграми

Google продовжує розширювати межі мультимодальності свого штучного інтелекту. Останнє оновлення Gemini впроваджує дві критично важливі…

10.04.2026

«Банки почнуть зламувати першими»: міністр фінансів США Скотт Бессент терміново зібрав банкірів через ризики Claude Mythos

Міністр фінансів США Скотт Бессент і голова Федеральної резервної системи Джером Пауелл провели термінову зустріч…

10.04.2026