Рубріки: Новини

Китайські розробники використали американську AI-модель Llama 13B для створення військового чат-бота

Дмитро Сімагін

Китайські розробники використали модель штучного інтелекту Llama 13B від компанії Meta (Facebook) для розробки військового чат-бота. Про це повідомляє Silicon Angle з посиланням на розслідування Reuters.

Llama — це сімейство великих мовних моделей з відкритим кодом, які Meta вперше випустила в лютому 2022 року. Розробники можуть безкоштовно використовувати їхні алгоритми як у дослідницьких, так і в комерційних проектах. Згідно з умовами ліцензування Meta, серія Llama не може використовуватися у військових цілях.

За даними Reuters, Llama згадується в статті, авторами якої є шість дослідників з трьох китайських установ. Дві з цих установ працюють при Академії військових наук КНР, дослідницькому органі Народно-визвольної армії Китаю. У документі детально описується чат-бот ChatBIT на базі Llama, який «оптимізований для діалогів і відповідей на запитання у військовій сфері».

Китайський чат-бот базується на Llama 13B — моделі першого покоління LLM, яку випустили в лютому 2023 року. Ця модель працює на модифікованій версії стандартної архітектури нейронної мережі Transformer. Інженери Meta додали оптимізацію продуктивності до архітектури та зробили інші вдосконалення, які покращили її здатність розуміти довгі промти.

Творці чат-бота ChatBIT модифікували Llama 13B, додавши до неї спеціальні параметри конфігурації для обробки даних. Також китайці надали чат-боту доступ до 100 000 записів військових діалогів. Крім того, в статті за авторством китайських вчених йдеться про використання Llama 2 для «навчання стратегіям бортової радіоелектронної боротьби».

Llama 2 — це наступна ітерація серії LLM, яку Meta випустила в липні 2023 року, через кілька місяців після оригінальної версії. Вона навчалась на даних, які на 40% більші, ніж ті, які використовувались для тренування моделі Llama першого покоління. У Llama 2 реалізована техніка штучного інтелекту під назвою групове звернення уваги, або GQA, яка не підтримувалася попередніми моделями. Ця техніка допомагає пришвидшити висновок і скоротити час на обробку інформації.

На сьогодні найпотужніша модель, яка розроблена компанією Meta, називається Llama 3.1 405B. Вона здатна обробляти промти, обсяг яких у 60 разів перевищує обсяг даних, який підтримується алгоритмами Llama першого покоління.

Meta розробила Llama 3.1 405B з використанням 16 000 графічних процесорів H100. Кілька днів тому Марк Цукерберг повідомив, що наступна ітерація серії LLM навчається на кластері з понад 100 000 графічних процесорів H100 і робота над Llama 4 вже «повним ходом». Очікується, що перші моделі з майбутньої серії мають вийти на початку 2025 року.

Останні статті

У Microsoft роз’яснили, як правильно писати коментарі в коді

Представник команди Microsoft Windows Реймонд Чен пояснив, як правильно писати коментарі в коді. За його…

10.10.2025

Google запустила платформу Gemini Enterprise з інструментами для програмування

Google відкрила доступ до платформи Gemini Enterprise. На ній є готові ШІ-агенти для аналізу даних,…

10.10.2025

Copilot тепер може створювати документи Office та підключатись до сторонніх сервісів

Компанія Microsoft випустила оновлення програми Copilot для Windows. Нова версія 1.25095.161.0 підтримує Copilot Connections та…

10.10.2025

Microsoft випускає Edit CLI — новий інструмент командного рядка для Windows 11

Microsoft додає новий інструмент до оновлення Windows 11 версії 25H2, яке випустили минулого тижня. Мова…

10.10.2025

OpenAI наздоганяє Anthropic в якості коду: Codex має 74,3% успішності порівняно з 73,7% у Claude Code

Агентний інструмент генерації коду Codex від компанії OpenAI наздоганяє за певними можливостями аналогічний продукт Claude…

10.10.2025

OpenAI збирається перетворити ChatGPT на операційну систему

Компанія OpenAI має намір перетворити ChatGPT на повноцінну операційну систему з екосистемою додатків. Про це…

09.10.2025