Рубріки: Новини

Який чат-бот найкращий? Тести порівняли Google Gemini з ChatGPT

Дмитро Сімагін

Платформа для тестування Chatbot Arena провела тест на продуктивність моделей штучного інтелекту. Його результати виявили нового лідера: експериментальна версія Google Gemini під назвою Gemini-Exp-1114, яка вже доступна для випробувань в Google AI Studio, за кількома показниками перевищила модель GPT-4o від OpenAI. Це досягнення завершує тривале домінування OpenAI у передових системах штучного інтелекту, повідомляє Venture Beat.

Нова модель Google Gemini продемонструвала чудову продуктивність у кількох ключових категоріях, включно з математикою, творчим письмом та візуальним розумінням. Модель досягла 1344 балів, що на 40 балів більше, ніж у попередніх версіях.

Результати тесту серед моделей ШІ від ChatBot Arena

Для Google перемога в тесті є значним досягненням після місяців неофіційного змагання з OpenAI. Компанія вже зробила експериментальну модель доступною для розробників через платформу AI Studio, хоча залишається незрозумілим, чи буде ця версія включена в продукти для споживачів.

Кілька днів тому навколо Google Gemini виник скандал, коли в пресу потрапив діалог між чат-ботом та студентом коледжу в Мічігані (США). Під час розмови з людиною модель Gemini несподівано повідомила користувачу: «Ти не особливий, ти не важливий і не потрібний», додаючи, «Будь ласка, помри».

Незважаючи на те, що Gemini має фільтри безпеки, які забороняють використовувати чат-бот у неповажних, сексуальних, насильницьких або небезпечних дискусіях і заохочуванні до шкідливих дій, це не зупинило модель від суперечливої поради.

У заяві для CBS News представник Google повідомив: «Великі мовні моделі іноді можуть відповідати безглуздими відповідями, і це приклад того. Ця відповідь порушила нашу політику, і ми вжили заходів, щоб запобігти виникненню подібних результатів».

Останні статті

CEO Google обіцяє збільшувати штат програмістів, незважаючи на штучний інтелект

Сундар Пічаї, який очолює Google з 2015 року, заявив, що його компанія продовжуватиме збільшувати число…

05.06.2025

«Ринок переповнений пропозиціями з України». Чому українські провайдери здають в оренду власні IPv4-адреси

Українські телекомунікаційні компанії та провайдери масово здають в оренду IPv4-адреси, які свого часу були виділені…

05.06.2025

ChatGPT отримав доступ до хмарних документів та сторонніх дослідницьких інструментів

У ChatGPT додали конектори для підключення до хмарних сервісів, таких як Google Drive, Box, Dropbox,…

05.06.2025

У Запоріжжі затримано 35-річного хакера, який зламав 5000 хостинг-акаунтів для майнінгу криптовалют

Співробітники управління Кіберполіції НПУ в Запорізькій області затримали 35-річного хакера, який зламав 5000 хостинг-акаунтів і…

05.06.2025

Apple відмовляється від розробки на Java, віддаючи перевагу Swift

Внутрішня команда розробників Apple у новому тематичному дослідженні виявила, що «підхід Java до управління пам’яттю…

05.06.2025

Юлія Штукатурова стала новою керівницею європейського регіону в GlobalLogic

Компанія GlobalLogic заявила, що європейський регіон відтепер очолюватиме Юлія Штукатурова, повідомили в DOU. У GlobalLogic Юлія…

04.06.2025