Google випустила Magika 1.0 — систему, яка визначає вміст файлів включно з мовами програмування
Google випустила стабільний реліз системи визначення вмісту файлів Magika 1.0. Вона вміє аналізувати тип та вміст файлів включно з мовами програмування, які використовувались при розробці, методами стиснення, інсталяційними пакетами, кодом, видами розмітки, форматами звуку, відео, документів та зображень. Про це інформує блог Google.
Magika 1.0 має відкритий код і поширюються під ліцензією Apache 2.0. Система вміє ідентифікувати понад 200 типів контенту, що вдвічі більше, ніж під час виходу початкової версії.
Однією з основних змін Magika 1.0 є те, що код системи переписано з Python на Rust. На MacBook Pro (M4) продуктивність нового рушія Magika дозволяє обробляти близько 1000 файлів за секунду.
Серед інших нововведень Magika 1.0 варто виділити:
Від схожих проектів, що визначають MIME-тип за вмістом, Magika відрізняється застосуванням методів машинного навчання, високою продуктивністю та точністю визначення. Модель навчена з використанням фреймворку Keras на 100 млн. прикладів файлів (розмір набору даних більше 3 терабайт) і підтримує розпізнавання 200 типів даних з точністю не менше 99%. Модель скомпонована у форматі ONNX і має розмір лише кілька мегабайт.
Стів Возняк, який 50 років тому разом із Стівом Джобсом стояв біля витоків компанії Apple,…
Звіт The 2026 Crypto Crime Report від компанії Chainalysis розкриває масштабну схему легалізації капіталу, де…
Генератор відео Seedance 2.0 від китайської компанії ByteDance став доступним у версії для CapCut. На…
Небезпечний набір експлойтів під назвою DarkSword став публічно доступним. Невідомий опублікував код його нової версії…
Компанія Anthropic навчила агента на базі LLM Claude керувати комп'ютером Mac замість користувача. У Claude…
Марк Цукерберг вирішив особисто протестувати концепцію AI-native, яку він просуває в Meta, почавши розробку власного…