Європейський стартап випустив відкриту модель Mistral Small 3.1, яка перевершує GPT-4o Mini
Французький стартап Mistral AI представив нову модель штучного інтелекту з відкритим кодом під назвою Mistral Small 3.1. Вона, за словами компанії, перевершує аналогічні моделі від Google і OpenAI, повідомляє Venture Beat.
Mistral Small 3.1 обробляє як текст, так і зображення, маючи лише 24 мільярдів параметрів. Модель має розширене контекстне вікно до 128 тисяч токенів і обробляє інформацію зі швидкістю 150 токенів за секунду, що робить її придатною для програм, які вимагають швидкий відгук.
Ще одна перевага моделі Mistral Small 3.1 в тому, що вона може працювати на відносно малопотужній інфраструктурі. Для автономного запуску моделі достатньо лише одного графічного процесора RTX 4090 або ноутбука Mac із 32 Гб оперативної пам’яті.
Заснований у 2023 році колишніми дослідниками з Google DeepMind і Meta, Mistral AI зараз є найвідомішим європейським стартапом, який працює над технологією штучного інтелекту. Його оцінка капіталізації становить приблизно $6 мільярдів.
Минулого місяця Mistral AI представив модель під назвою Saba, яка орієнтована на арабську мову та культуру, а в березні вийшов реліз Mistral OCR. Це спеціалізована модель, яка використовує оптичне розпізнавання символів для перетворення документів PDF у файли Markdown, що робить їх більш доступними для великих мовних моделей.
Крім того, Mistral має в своєму портфелі релізів чат-бот Le Chat, флагманську велику мовну модель Mistral Large 2, модель Pixtral (для мультимодальних додатків), Codestral (для генерації коду) і Les Ministraux — сімейство моделей, оптимізованих для периферійних пристроїв.
Компанія JetBrains анонсувала оновлення для Rider — свого кросплатформного IDE для розробників .NET та ігор…
Ілон Маск запропонував провести публічний конкурс з програмування між Grok 5 від xAI та колишнім…
Хоча JavaScript досі є найбільшою категорією в українському IT за кількістю кандидатів (13% від усього…
На LinkedIn виявили небезпечну хакерську кампанію, націлену на розробників. Кіберзлочинці розсилають фейкові запрошення на роботу…
Інструмент агентного кодування Claude Code від компанії Anthropic став доступним у веб-версії та мобільному додатку.…
Компанія JetBrains оприлюднила результати щорічного опитування Developer Ecosystem Survey про стан на ринку розробки програмного…