Рубріки: Новини

Нова модель GPT 4.5 виявилась найкращою з кодування в рейтингу Chatbot Arena

Дмитро Сімагін

Велика мовна модель GPT 4.5, яку компанія OpenAI представила минулого тижня, отримала високі результати в кількох тестах рейтингу Chatbot Arena. Вона виявилась найкращою в генерації коду, розв’язуванні математичних задач, «творчому письмі» та інших випробуваннях, пише Neowin. 

За сукупністю показників, які впливають на рейтинг, модель GPT 4.5 зараз ділить перше місце в таблиці лідерів Chatbot Arena з ще одним новачком — моделлю Grok-3 від xAI (grok-3-preview-02-24). Ця модель також дебютувала з першої позиції в рейтингу, але в тестах з кодування вона все ж таки трохи поступається GPT 4.5. 

Поки що GPT-4.5, яка знаходиться на стадії попереднього дослідницького тестування, доступна користувачам, які мають підписку ChatGPT Pro вартістю $200 на місяць, а також деяким дослідникам. Але вже з наступного тижня спробувати модель зможуть усі користувачі платних тарифів, у тому числі ChatGPT Plus вартістю $20 на місяць.

Нагадаємо, що компанія OpenAI назвала GPT-4.5 «найдосвідченішою моделлю», але попередила, що вона не є «проривною», оскільки на відміну від моделей o1 або o3-mini, GPT-4.5 не володіє здібностями до міркування.

Останні статті

Всюди брехня: розробник програми для обману на співбесідах визнав, що збрехав журналістам про свій дохід

Рой Лі, засновник вірусного стартапу Cluely, визнав, що збрехав журналістам про $7 мільйонів річного доходу.…

06.03.2026

Cursor запускає ще один інструмент агентного кодування — Automations

Популярний ШІ-редактор коду Cursor від компанії Anysphere робить наступний крок у розвитку агентного програмування. Новий…

06.03.2026

Нові функції «Дії»: бронювання працівників у розшуку та податкові знижки

У найближчі місяці в застосунку «Дія» з'явиться кілька нових функцій, в тому числі опція бронювання…

06.03.2026

X запускає новий варіант монетизації: «Ексклюзивні теми» з платним доступом

Соціальна мережа X анонсувала оновлення інструментів монетизації для авторів контенту. Основна зміна полягає в тому,…

06.03.2026

Зарплати українських розробників: наймів більше, але грошей менше

Статистичний аналіз зарплат українських розробників, найнятих на Djinni за три місяці зими, демонструє суперечливі дані.…

06.03.2026

«Вже не можу писати код вручну»: збій в роботі Claude викликав проблеми у деяких розробників

Коли цього тижня стався збій в роботі інструментів вайб-кодування Claude, деяким розробникам програмного забезпечення довелося…

06.03.2026