Рубріки: Новини

Користувачі GitHub збираються колективно подати до суду на Microsoft: що сталося

Анастасія Пономарьова

Microsoft використовував загальнодоступний код Github для навчання свого інструменту штучного інтелекту. Автори коду вважають, що їхню працю експлуатують — йде розслідування, пише Vice.

Подробиці

Microsoft купила платформу для спільного кодування GitHub ще у 2018 році, а в червні 2022 року випустила інструмент зі штучним інтелектом Microsoft GitHub Copilot. AI навчався з використанням мільярдів рядків відкритого вихідного коду, розміщеного на Github, проте думки програмістів про це ніхто не запитав. Програміст та юрист Метью Баттерик пише, що зібрав колективний судовий позов проти GitHub Copilot. Наразі триває розслідування.

Нагадаємо, що Copilot є розширенням для середовища кодування Microsoft Visual Studio, яке використовує алгоритми прогнозування для автоматичного завершення рядків коду. Це робиться за допомогою моделі штучного інтелекту під назвою Codex, яка була створена та навчена OpenAI з використанням даних, вилучених з репозиторіїв коду у відкритому Інтернеті.

Що кажуть у корпорації

Представники Microsoft стверджують, що інструмент «навчився на десятках мільйонів загальнодоступних репозиторіїв» коду, і що компанія «вважає, що це приклад добросовісного використання». Але програмісти так не вважають.

Github, ілюстрація

«Як Нео, підключений до Матриці, чи корова на фермі, Copilot хоче перетворити нас не більше, ніж на виробників ресурсів, які потрібно видобувати, — каже Баттерик. Навіть корови отримують їжу та дах від угоди. Copilot нічого не робить для наших індивідуальних проектів. І нічого для широкого відкритого вихідного коду».

Деякі розробники навіть помітили, що Copilot копіює їхній код — приклади вражаючої подібності фахівці показали у Twitter. Справа в тому, що ліцензії на програмне забезпечення з відкритим вихідним кодом вимагають, щоб будь-хто, хто використовує код, вказав його першоджерело. Звичайно, це стає практично неможливим, коли ви використовуєте мільярди рядків коду для навчання моделі AI.

GitHub заявив, що дані, взяті з загальнодоступних репозиторіїв, «не призначені для дослівного включення у вихідні дані Copilot», і стверджує, що переважна більшість вихідних даних (> 99%) не відповідає навчальним даним, згідно з внутрішнім звітом компанії. Тобто штучний інтелект не «списує».

Юристи вважають це все відмовками: компанія надає досвід розробників для своїх комерційних проектів, нічого не пропонуючи натомість.

“Схоже, що Microsoft отримує прибуток від роботи інших, ігноруючи умови базових ліцензій з відкритим вихідним кодом та інші юридичні вимоги“, — заявила юридична фірма Джозефа Савері, яка бере участь у розслідуванні.

Останні статті

ChatGPT інтегровано з програмами Adobe. Тепер можна безкоштовно редагувати фотографії та PDF-файли прямо в чаті

Adobe інтегрувала ChatGPT у програми Photoshop, Acrobat і Adobe Express. Користувачі тепер можуть створювати дизайни…

10.12.2025

Функцію d_genocide видалили з Linux через «невідповідність принципам інклюзивності»

В оновленні коду майбутньої версії Linux 6.19 видалено функцію під назвою d_genocide(). Вона була пов'язана…

10.12.2025

JetBrains закриває середовище розробки Fleet

Компанія JetBrains закриває Fleet — полегшене IDE нового покоління, яке розвивали паралельно з IntelliJ IDEA.…

10.12.2025

Підтримка Rust в ядрі Linux переведена з експериментальної в основну

Учасники конференції Maintainers Summit визнали успішним експеримент з додавання в ядро ​​Linux можливості розробки компонентів…

10.12.2025

Mistral випускає нову модель Devstral 2 та інтерфейс командного рядка Mistral Vibe CLI

Французький стартап Mistral представив нове покоління своєї LLM-моделі, яка доступна в двох варіантах: Devstral 2…

10.12.2025

Китайські моделі з відкритим кодом захопили 30% світового ринку LLM

Китайські LLM-моделі з відкритим кодом стрімко завойовують світовий ринок штучного інтелекту, зайнявши майже третину глобального…

09.12.2025