Рубріки: Новини

Тайвань включається в боротьбу за штучний інтелект. Foxconn випускає власну LLM-модель

Дмитро Сімагін

Тайванська компанія Foxconn, відома збиранням iPhone та інших продуктів Apple, анонсувала свою першу велику мовну модель під назвою FoxBrain. Як повідомляє Neowin, її було навчено за допомогою лише 120 графічних процесорів H100 від Nvidia.

Нова LLM-модель базується на архітектурі Meta Llama 3.1 та має 70 мільярдів параметрів, отриманих з використанням дистиляції. Дистиляція моделі передбачає використання батьківської моделі та навчання «дочірньої» моделі на основі її відповідей. 

Хоча Foxconn визнає, що її модель не така потужна, як китайська DeepSeek-R1, але її загальна продуктивність дуже близька до світових стандартів. Компанія вже пообіцяла, що в майбутньому FoxBrain стане «відкритою та доступною для всіх».

Доктор Юнг Ху-Лі, директор Дослідницького центру штучного інтелекту в Науково-дослідному інституті Хон Хай, заявив:

«Наша модель FoxBrain використала дуже ефективну стратегію, зосереджуючись на оптимізації процесу навчання, а не на сліпому накопиченні обчислювальної потужності. Завдяки ретельно розробленим методам навчання та оптимізації ресурсів ми успішно побудували локальну модель ШІ з потужними можливостями аргументації».

Навчання моделі FoxBrain на 120 графічних процесорів Nvidia H100 тривало приблизно чотири тижні. Для цього Foxconn змогла згенерувати 98 млрд токенів високоякісних даних попереднього навчання традиційною китайською мовою з довжиною контекстного вікна 128 тис. токенів.

Відомо, що компанія Foxconn не тільки збирає гаджети для Apple, але й виробляє сервери зі штучним інтелектом для Nvidia. Партнерство Foxconn і Nvidia не є новим: обидві компанії працюють і над іншими спільними проектами, включаючи будівництво найбільшого у світі заводу з виробництва графічних процесорів Blackwell.

Останні статті

21-річний хакер викрав 127 млн грн у компаній батька голови Львівської ОВА: відразу купив собі Cadillac та BMW

Управління Нацполіції у Львівській області заочно повідомило підозру громадянину Денису Ніколаєву в причетності до крадіжки…

24.02.2026

Claude Code навчили оновлювати застарілі мови програмування: акції IBM обвалились на 13%

IT-гігант IBM став новою «жертвою» штучного інтелекту: компанія опинилась в епіцентрі ринкової паніки після новини…

24.02.2026

Помилка в інструменті кодування Amazon Kiro призвела до 13-годинного збою в роботі AWS

Одна з найбільших у світі хмарних платформ Amazon Web Services (AWS) двічі була виведена з…

23.02.2026

«Стягнення майна через Дію»: Мінцифри цифровізує виконання судових рішень

У мобільному застосунку «Дія» почали бета-тестування послуги отримання виконавчих документів. Це дозволить громадянам спростити етапи…

23.02.2026

Google без попередження блокує користувачів, які підключають Gemini до OpenClaw

Google без попередження заблокувала акаунти передплатників найдорожчого тарифу AI Ultra, які підключали Gemini до популярного…

23.02.2026

ITC запустить текстову трансляцію Samsung Galaxy Unpacked 2026

Сайт ITC та мережа магазинів Comfy запрошують всіх на текстову трансляцію презентації Samsung Galaxy Unpacked…

23.02.2026