Google випустила Magika 1.0 — систему, яка визначає вміст файлів включно з мовами програмування
Google випустила стабільний реліз системи визначення вмісту файлів Magika 1.0. Вона вміє аналізувати тип та вміст файлів включно з мовами програмування, які використовувались при розробці, методами стиснення, інсталяційними пакетами, кодом, видами розмітки, форматами звуку, відео, документів та зображень. Про це інформує блог Google.
Magika 1.0 має відкритий код і поширюються під ліцензією Apache 2.0. Система вміє ідентифікувати понад 200 типів контенту, що вдвічі більше, ніж під час виходу початкової версії.
Однією з основних змін Magika 1.0 є те, що код системи переписано з Python на Rust. На MacBook Pro (M4) продуктивність нового рушія Magika дозволяє обробляти близько 1000 файлів за секунду.
Серед інших нововведень Magika 1.0 варто виділити:
Від схожих проектів, що визначають MIME-тип за вмістом, Magika відрізняється застосуванням методів машинного навчання, високою продуктивністю та точністю визначення. Модель навчена з використанням фреймворку Keras на 100 млн. прикладів файлів (розмір набору даних більше 3 терабайт) і підтримує розпізнавання 200 типів даних з точністю не менше 99%. Модель скомпонована у форматі ONNX і має розмір лише кілька мегабайт.
Біткоїн використав усі причини та пояснення, які протягом багатьох років спонукали людей вкладати гроші в…
Компанія Meta розробляє окремий додаток, інтерфейс якого дуже схожий на TikTok. Майбутня програма під назвою…
Microsoft оновила свій багатофункціональний редактор коду Visual Studio Code. Версія VS Code 1.109, за твердженням…
Компанія TEKEVER, провідний європейський постачальник безпілотних авіаційних систем з використанням штучного інтелекту, відкриває нові інженерні…
Компанія OpenAI випустила модель для агентного кодування GPT-5.3-Codex — майже одразу після релізу Claude Opus…
Anthropic оголосила про реліз Claude Opus 4.6, яка, за словами компанії, є її найпотужнішою моделлю…