Рубріки: Новини

Який чат-бот найкращий? Тести порівняли Google Gemini з ChatGPT

Дмитро Сімагін

Платформа для тестування Chatbot Arena провела тест на продуктивність моделей штучного інтелекту. Його результати виявили нового лідера: експериментальна версія Google Gemini під назвою Gemini-Exp-1114, яка вже доступна для випробувань в Google AI Studio, за кількома показниками перевищила модель GPT-4o від OpenAI. Це досягнення завершує тривале домінування OpenAI у передових системах штучного інтелекту, повідомляє Venture Beat.

Нова модель Google Gemini продемонструвала чудову продуктивність у кількох ключових категоріях, включно з математикою, творчим письмом та візуальним розумінням. Модель досягла 1344 балів, що на 40 балів більше, ніж у попередніх версіях.

Результати тесту серед моделей ШІ від ChatBot Arena

Для Google перемога в тесті є значним досягненням після місяців неофіційного змагання з OpenAI. Компанія вже зробила експериментальну модель доступною для розробників через платформу AI Studio, хоча залишається незрозумілим, чи буде ця версія включена в продукти для споживачів.

Кілька днів тому навколо Google Gemini виник скандал, коли в пресу потрапив діалог між чат-ботом та студентом коледжу в Мічігані (США). Під час розмови з людиною модель Gemini несподівано повідомила користувачу: «Ти не особливий, ти не важливий і не потрібний», додаючи, «Будь ласка, помри».

Незважаючи на те, що Gemini має фільтри безпеки, які забороняють використовувати чат-бот у неповажних, сексуальних, насильницьких або небезпечних дискусіях і заохочуванні до шкідливих дій, це не зупинило модель від суперечливої поради.

У заяві для CBS News представник Google повідомив: «Великі мовні моделі іноді можуть відповідати безглуздими відповідями, і це приклад того. Ця відповідь порушила нашу політику, і ми вжили заходів, щоб запобігти виникненню подібних результатів».

Останні статті

X відкриває вихідний код свого алгоритму. Він написаний на Rust і Python

Соцмережа X, основним власником якої є Ілон Маск, виконала обіцянку розкрити свій алгоритм, який визначає…

20.01.2026

OpenAI відкриває необмежений доступ до GPT-5.2 Instant і попереджає про появу реклами

Компанія OpenAI оголосила, що її тарифний план ChatGPT Go, який надає повний доступ до моделі…

20.01.2026

ШІ в розробці: що працює, що ні та як отримати від нього користь

85% розробників уже використовують ШІ в роботі. Це показують і світове опитування The Pragmatic Engineer…

20.01.2026

FRACTAL перейменовує свою рекрутингову агенцію на talanovyti

Група українських IT-компаній FRACTAL (ex-Netpeak Group) провела ребрендинг своєї рекрутингової агенції Netpeak Talent. Відтепер вона…

20.01.2026

Творець Ruby on Rails: штучний інтелект не готовий замінити навіть джуніорів

Автор популярного фреймворку Ruby on Rails Девід Гайнемаєр Генссон скептично висловився щодо перспективи заміни молодших…

20.01.2026

Google ускладнить інсталяцію Android-додатків зі сторонніх джерел

Google ускладнить процес встановлення мобільних програм на пристрої Android зі сторонніх джерел, в обхід офіційного…

20.01.2026