Рубріки: Новини

Google випустила Magika 1.0 — систему, яка визначає вміст файлів включно з мовами програмування

Дмитро Сімагін

Google випустила стабільний реліз системи визначення вмісту файлів Magika 1.0. Вона вміє аналізувати тип та вміст файлів включно з мовами програмування, які використовувались при розробці, методами стиснення, інсталяційними пакетами, кодом, видами розмітки, форматами звуку, відео, документів та зображень. Про це інформує блог Google.

Magika 1.0 має відкритий код і поширюються під ліцензією Apache 2.0. Система вміє ідентифікувати понад 200 типів контенту, що вдвічі більше, ніж під час виходу початкової версії.

Однією з основних змін Magika 1.0 є те, що код системи переписано з Python на Rust. На MacBook Pro (M4) продуктивність нового рушія Magika дозволяє обробляти близько 1000 файлів за секунду.

Серед інших нововведень Magika 1.0 варто виділити:

  • Нативний клієнт командного рядка Rust, який максимально прискорює роботу.
  • Підвищена точність для складних текстових форматів, таких як код та файли конфігурації.
  • Оновлений модуль Magika для Python та TypeScript для ще легшої інтеграції.

Від схожих проектів, що визначають MIME-тип за вмістом, Magika відрізняється застосуванням методів машинного навчання, високою продуктивністю та точністю визначення. Модель навчена з використанням фреймворку Keras на 100 млн. прикладів файлів (розмір набору даних більше 3 терабайт) і підтримує розпізнавання 200 типів даних з точністю не менше 99%. Модель скомпонована у форматі ONNX і має розмір лише кілька мегабайт. 

 

Останні статті

Співзасновник Apple Стів Возняк пояснив, чому не любить штучний інтелект

Стів Возняк, який 50 років тому разом із Стівом Джобсом стояв біля витоків компанії Apple,…

24.03.2026

Стейблкоїни на службі тіньової економіки: розбір звіту Chainalysis про китайські схеми

Звіт The 2026 Crypto Crime Report від компанії Chainalysis розкриває масштабну схему легалізації капіталу, де…

24.03.2026

Скандальний генератор відео Seedance 2.0 став публічно доступним

Генератор відео Seedance 2.0 від китайської компанії ByteDance став доступним у версії для CapCut. На…

24.03.2026

DarkSword опублікували на GitHub: атаки на українців можуть почастішати

Небезпечний набір експлойтів під назвою DarkSword став публічно доступним. Невідомий опублікував код його нової версії…

24.03.2026

Майбутнє вже тут: Claude отримав повний контроль над комп’ютером

Компанія Anthropic навчила агента на базі LLM Claude керувати комп'ютером Mac замість користувача. У Claude…

24.03.2026

Марк Цукерберг тестує персонального ШІ-агента: хоче автоматизувати управління компанією

Марк Цукерберг вирішив особисто протестувати концепцію AI-native, яку він просуває в Meta, почавши розробку власного…

24.03.2026