Рубріки: Новини

Google випустила Magika 1.0 — систему, яка визначає вміст файлів включно з мовами програмування

Дмитро Сімагін

Google випустила стабільний реліз системи визначення вмісту файлів Magika 1.0. Вона вміє аналізувати тип та вміст файлів включно з мовами програмування, які використовувались при розробці, методами стиснення, інсталяційними пакетами, кодом, видами розмітки, форматами звуку, відео, документів та зображень. Про це інформує блог Google.

Magika 1.0 має відкритий код і поширюються під ліцензією Apache 2.0. Система вміє ідентифікувати понад 200 типів контенту, що вдвічі більше, ніж під час виходу початкової версії.

Однією з основних змін Magika 1.0 є те, що код системи переписано з Python на Rust. На MacBook Pro (M4) продуктивність нового рушія Magika дозволяє обробляти близько 1000 файлів за секунду.

Серед інших нововведень Magika 1.0 варто виділити:

  • Нативний клієнт командного рядка Rust, який максимально прискорює роботу.
  • Підвищена точність для складних текстових форматів, таких як код та файли конфігурації.
  • Оновлений модуль Magika для Python та TypeScript для ще легшої інтеграції.

Від схожих проектів, що визначають MIME-тип за вмістом, Magika відрізняється застосуванням методів машинного навчання, високою продуктивністю та точністю визначення. Модель навчена з використанням фреймворку Keras на 100 млн. прикладів файлів (розмір набору даних більше 3 терабайт) і підтримує розпізнавання 200 типів даних з точністю не менше 99%. Модель скомпонована у форматі ONNX і має розмір лише кілька мегабайт. 

 

Останні статті

Microsoft відкриває ранній доступ до інструментів редагування коду C++ для GitHub Copilot

Компанія Microsoft відкриває в каналі Visual Studio 2026 Insiders публічний preview-доступ до інструментів редагування коду…

23.12.2025

Українським IT-стартапам відкрили програму грантів StartUP EDGE — пропонують від €20 000 до €40 000

Український фонд стартапів оголосив про початок прийому заявок для участі в грантовій програмі Startup EDGE,…

23.12.2025

Група IT-компаній FRACTAL відкрила безкоштовний доступ до власної системи оцінки кандидатів

Група українських IT-компаній FRACTAL (ex-Netpeak Group) відкрила безкоштовний публічний доступ до власної ШІ-системи психолінгвістичної діагностики…

23.12.2025

ChatGPT отримав нову функцію — «персональні підсумки» року

OpenAI запускає в ChatGPT нову функцію, завдяки якій можна дізнатися, як саме ви взаємодіяли з…

23.12.2025

Microsoft перепише весь свій C та C++ код на Rust вже до 2030 року

Microsoft обіцяє повністю відмовитися від мов програмування C і C ++ до кінця десятиліття. Про…

23.12.2025

Український хакер визнав себе винним у розповсюдженні шкідливого ПЗ Nefilim. За інформацію про його спільника влада США готова заплатити $11 мільйонів

Громадянин України Артем Стрижак у п'ятницю визнав себе винним у здійсненні атак з використанням шкідливого…

22.12.2025