Google випустила Magika 1.0 — систему, яка визначає вміст файлів включно з мовами програмування
Google випустила стабільний реліз системи визначення вмісту файлів Magika 1.0. Вона вміє аналізувати тип та вміст файлів включно з мовами програмування, які використовувались при розробці, методами стиснення, інсталяційними пакетами, кодом, видами розмітки, форматами звуку, відео, документів та зображень. Про це інформує блог Google.
Magika 1.0 має відкритий код і поширюються під ліцензією Apache 2.0. Система вміє ідентифікувати понад 200 типів контенту, що вдвічі більше, ніж під час виходу початкової версії.
Однією з основних змін Magika 1.0 є те, що код системи переписано з Python на Rust. На MacBook Pro (M4) продуктивність нового рушія Magika дозволяє обробляти близько 1000 файлів за секунду.
Серед інших нововведень Magika 1.0 варто виділити:
Від схожих проектів, що визначають MIME-тип за вмістом, Magika відрізняється застосуванням методів машинного навчання, високою продуктивністю та точністю визначення. Модель навчена з використанням фреймворку Keras на 100 млн. прикладів файлів (розмір набору даних більше 3 терабайт) і підтримує розпізнавання 200 типів даних з точністю не менше 99%. Модель скомпонована у форматі ONNX і має розмір лише кілька мегабайт.
Компанія Microsoft відкриває в каналі Visual Studio 2026 Insiders публічний preview-доступ до інструментів редагування коду…
Український фонд стартапів оголосив про початок прийому заявок для участі в грантовій програмі Startup EDGE,…
Група українських IT-компаній FRACTAL (ex-Netpeak Group) відкрила безкоштовний публічний доступ до власної ШІ-системи психолінгвістичної діагностики…
OpenAI запускає в ChatGPT нову функцію, завдяки якій можна дізнатися, як саме ви взаємодіяли з…
Microsoft обіцяє повністю відмовитися від мов програмування C і C ++ до кінця десятиліття. Про…
Громадянин України Артем Стрижак у п'ятницю визнав себе винним у здійсненні атак з використанням шкідливого…