Рубріки: Новини

Нова модель GPT 4.5 виявилась найкращою з кодування в рейтингу Chatbot Arena

Дмитро Сімагін

Велика мовна модель GPT 4.5, яку компанія OpenAI представила минулого тижня, отримала високі результати в кількох тестах рейтингу Chatbot Arena. Вона виявилась найкращою в генерації коду, розв’язуванні математичних задач, «творчому письмі» та інших випробуваннях, пише Neowin. 

За сукупністю показників, які впливають на рейтинг, модель GPT 4.5 зараз ділить перше місце в таблиці лідерів Chatbot Arena з ще одним новачком — моделлю Grok-3 від xAI (grok-3-preview-02-24). Ця модель також дебютувала з першої позиції в рейтингу, але в тестах з кодування вона все ж таки трохи поступається GPT 4.5. 

Поки що GPT-4.5, яка знаходиться на стадії попереднього дослідницького тестування, доступна користувачам, які мають підписку ChatGPT Pro вартістю $200 на місяць, а також деяким дослідникам. Але вже з наступного тижня спробувати модель зможуть усі користувачі платних тарифів, у тому числі ChatGPT Plus вартістю $20 на місяць.

Нагадаємо, що компанія OpenAI назвала GPT-4.5 «найдосвідченішою моделлю», але попередила, що вона не є «проривною», оскільки на відміну від моделей o1 або o3-mini, GPT-4.5 не володіє здібностями до міркування.

Останні статті

Відповідала за Резерв+ та Армія+. Заступниця міністра оборони Катерина Черногоренко подала у відставку

Катерина Черногоренко, яка з вересня 2023‑го очолювала цифрову трансформацію в Міністерстві оборони України, оголосила про завершення роботи…

23.07.2025

Ілон Маск: перший гігаватний суперкомп’ютер Colossus 2 запустять в найближчі тижні

Засновник компанії xAI Ілон Маск поділився про майбутнє найбільшого в світу дата-центру, який зараз будується…

23.07.2025

Alibaba випустила «найпотужнішу» LLM-модель для програмування — Qwen3-Coder

Alibaba представила нову велику мовну модель з відкритою ліцензією Qwen3-Coder. У компанії назвали модель найкращим…

23.07.2025

Amazon вводить обмеження на безкоштовне використання Kiro

Amazon Web Services (AWS) обмежує безкоштовне використання Kiro,  інструменту для вайб-кодингу, який має функціонал інтегрованого…

23.07.2025

Вийшов Python 3.14 RC1: реліз-кандидат з прискореним інтерпретатором

Команда Python оголосила про вихід першої версії реліз-кандидата Python 3.14. Це фінальна стадія перед повноцінним…

23.07.2025

16% працівників у США брешуть про використання штучного інтелекту, щоб догодити начальству

Результати опитування, проведеного компанією Howdy, свідчать про те, що кожен шостий американський працівник (16%) бреше…

23.07.2025