Рубріки: Новини

Microsoft MarkItDown — новий інструмент конвертації файлів для Python-розробників

Дмитро Сімагін

Компанія Microsoft представила новий інструмент MarkItDown для Python-розробників. Він має відкритий код і вже доступний для завантаження та встановлення на GitHub. Як інформує Neowin, MarkItDown — це бібліотека Python для конвертації файлів і офісних документів у формат, сумісний з мовою розмітки Markdown.

Конвертовані за допомогою MarkItDown файли можна використовувати для індексування чи аналізу тексту. Інструмент підтримує такі формати файлів:

  • PDF (.pdf);
  • PowerPoint (.pptx);
  • Word (.docx);
  • Excel (.xlsx);
  • зображення (метадані EXIF ​​і OCR);
  • аудіо (метадані EXIF ​​і транскрипція мовлення);
  • HTML;
  • інші текстові формати (csv, json, xml та ін.).

Розробники також можуть налаштувати бібліотеку MarkItDown для використання великих мовних моделей при описі зображень. Для цього потрібно встановити параметри mlm_client і mlm_model для об’єкта MarkItDown відповідно до конкретного клієнта.

Оскільки бібліотека MarkItDown доступна за ліцензією відкритого коду MIT, розробники можуть її вільно використовувати, змінювати та поширювати. Єдина вимога полягає в тому, щоб вони включали оригінальну ліцензію та повідомлення про авторські права у своєму розповсюдженні.

Markdown — це популярна полегшена мова розмітки з синтаксисом форматування простого тексту, який сумісний з HTML і XHTML. Markdown полегшує алгоритмам штучного інтелекту аналізувати та розуміти структуру тексту завдяки її послідовному та передбачуваному синтаксису. Ця мова широко використовується в багатьох сервісах та інструментах, включно з GitHub, Jupyter Notebook та іншими.

Останні статті

Вийшла з-під контролю: Anthropic вважає, що Claude Mythos надто потужна для публічного релізу

Компанія Anthropic вирішила відкласти публічний реліз своєї найновішої LLM-моделі Claude Mythos через побоювання, що вона…

08.04.2026

GitHub Copilot CLI: тепер з підтримкою «агента огляду» Rubber Duck

GitHub офіційно розширює можливості Copilot у терміналі, впроваджуючи підтримку різних сімейств моделей. Це дозволяє розробникам…

07.04.2026

Вдень — на зйомках, вночі пише код: акторка Мілла Йовович виклала власний ШІ-інструмент на GitHub

Голлівудська акторка Мілла Йовович вирішила внести свою лепту в розробку систем штучного інтелекту. Знаменита уродженка…

07.04.2026

800 000 робочих місць: як IT впливає на економіку України

Поки світ обговорює нові LLM-моделі, українське IT доводить свою ефективність не словом, а гривнею. Хоча…

07.04.2026

Голодні ігри за токени: «Дехто залишає агентів працювати годинами, щоб штучно завищити свої показники»

Компанія Meta знайшла незвичний спосіб стимулювати своїх співробітників активніше використовувати штучний інтелект. В середині корпоративної…

07.04.2026

У Google Play з’явився пошук по відгуках: як він працює

Google офіційно запускає корисне оновлення для свого магазину додатків, яке значно спростить вибір програм та…

07.04.2026