Рубріки: Новини

Поступається лише GPT-4: з’явилася потужна LLM Inflection-2

Ігор Шелудченко

Inflection AI представила свою велику мовну модель (Large Language Model, LLM) Inflection-2. За потужністю у своєму обчислювальному класі вона стала другою після GPT-4.

За рівнем продуктивності Inflection-2 конкурує з з Google PaLM 2, проте перевершує її за рядом тестів — MMLU, TriviaQA, HellaSwag і GSM8k.

Inflection-2 натренована на 5000 графічних процесорах NVIDIA H100 зі змішаною точністю fp8 для ~10²⁵ FLOPs.

Inflection-2 планується використовувати для роботи чат-бота Pi, що «стане важливою віхою в створенні особистого ШІ», доступного кожному.

Компанія співпрацювала з NVIDIA, Microsoft і CoreWeave у створенні кластера ШІ.

Результати порівняльного тестування, яке наводять самі розрозбники,  демонструють перевагу Inflection-2 над його попередником і зовнішніми моделями, такими як LLaMA-2, Grok-1, PaLM-2, Claude-2 і GPT-4.

Результати всіх досліджень можна подивитися на сайті компанії.

Читайте також:

Databricks випустила Dolly 2.0: це перша LLM з відкритим вихідним кодом для комерційного використання

Meta працює над новою моделлю ШІ, яка не поступається GPT-4

Мовні моделі, трансформери та інше. 6 актуальних напрямів AI, на які варто звернути увагу початківцям

Останні статті

Brave1 продовжили прийняття заявок на конкурс Battle Proven для deftech-стартапів

Кластер Brave1 продовжив прийняття заявок на конкурс Battle Proven — тепер податися можна до 25 липня 2025 року. Про це…

21.07.2025

Експериментальна LLM-модель OpenAI досягла рівня переможця Міжнародної математичної олімпіади

Експериментальна модель OpenAI досягла рівня золотої медалі на Міжнародній математичній олімпіаді (IMO), вирішивши п'ять із…

21.07.2025

JetBrains переводить всі продукти IntelliJ IDEA на єдиний інсталятор

Компанія JetBrains повідомила, що всі програмні продукти серії IntelliJ IDEA відтепер переходять на єдиний уніфікований…

21.07.2025

Українські кіберфахівці викрили намагання росіян використати LLM-модель для атак на держустанови

Команда реагування на комп'ютерні надзвичайні ситуації України (CERT-UA) розкрила деталі фішингової кампанії, спрямованої на поширення…

21.07.2025

Hugging Face представляє AnyCoder — безкоштовний інструмент для веб-розробки без знання мов програмування

Платформа Hugging Face представляє AnyCoder — середовище для розробки веб-додатків з відкритим кодом. Новий інструмент,…

21.07.2025

Intel припинила 10-річний проект розробки власного дистрибутиву Linux

Компанія Intel оголосила про згортання проекту Clear Linux, робота над яким тривала 10 років. Метою…

21.07.2025