Рубріки: Новини

Поступається лише GPT-4: з’явилася потужна LLM Inflection-2

Ігор Шелудченко

Inflection AI представила свою велику мовну модель (Large Language Model, LLM) Inflection-2. За потужністю у своєму обчислювальному класі вона стала другою після GPT-4.

За рівнем продуктивності Inflection-2 конкурує з з Google PaLM 2, проте перевершує її за рядом тестів — MMLU, TriviaQA, HellaSwag і GSM8k.

Inflection-2 натренована на 5000 графічних процесорах NVIDIA H100 зі змішаною точністю fp8 для ~10²⁵ FLOPs.

Inflection-2 планується використовувати для роботи чат-бота Pi, що «стане важливою віхою в створенні особистого ШІ», доступного кожному.

Компанія співпрацювала з NVIDIA, Microsoft і CoreWeave у створенні кластера ШІ.

Результати порівняльного тестування, яке наводять самі розрозбники,  демонструють перевагу Inflection-2 над його попередником і зовнішніми моделями, такими як LLaMA-2, Grok-1, PaLM-2, Claude-2 і GPT-4.

Результати всіх досліджень можна подивитися на сайті компанії.

Читайте також:

Databricks випустила Dolly 2.0: це перша LLM з відкритим вихідним кодом для комерційного використання

Meta працює над новою моделлю ШІ, яка не поступається GPT-4

Мовні моделі, трансформери та інше. 6 актуальних напрямів AI, на які варто звернути увагу початківцям

Останні статті

Більше 8 млрд грн податків. Стільки сплатили резиденти Дія.City в І кварталі 2025 року

Резиденти Дія.City сплатили до бюджету понад 8 млрд грн податків в І кварталі 2025 року.…

18.04.2025

Китайських офісних працівників закликають менше працювати. Це має допомогти місцевій економіці

У Китаї закликають офісних працівників не працювати надто багато — держава сподівається, що вільний час…

18.04.2025

ChatGPT значно покращив пошук місць по фото. Це посилює проблеми конфіденційності

Експерти звертають увагу на тривожну тенденцію: люди все частіше використовують ChatGPT, щоб визначити місцезнаходження, зображене…

18.04.2025

Середовище розробки IntelliJ IDEA оновлено до версії 2025.1

Компанія JetBrains випустила нову версію мультимовного середовища розробки IntelliJ IDEA 2025.1. Оновлена IDE отримала численні…

18.04.2025

Discord впроваджує функцію сканування обличчя для перевірки віку користувачів

Платформа обміну миттєвими повідомленнями Discord впроваджує функцію перевірки віку за допомогою сканування обличчя. Зараз вона…

18.04.2025

Wikipedia випустила спеціальний датасет, щоб відволікти увагу ботів

Wikipedia намагається захистити себе від тисяч різноманітних ботів-скрейперів, які сканують дані цієї платформи для навчання…

18.04.2025