Рубріки: Новини

Китайська влада наполягла, щоб DeepSeek навчала модель R2 на обладнанні Huawei. Але щось пішло не так

Дмитро Сімагін

Провідний китайський стартап у сфері штучного інтелекту DeepSeek був змушений відкласти випуск своєї майбутньої моделі R2 через труднощі з її навчанням. Проблеми почались після втручання політиків у робочі процеси, повідомляє Tom’s Hardware.

Як стверджують поінформовані джерела, китайські чиновники наполягли на тому, щоб DeepSeek відмовилась від американських чіпів Nvidia на користь продукції місцевої компанії Huawei. Однак навчання R2 зіткнулося з постійними збоями обладнання Huawei, що затримало випуск моделі. Через це DeepSeek була змушена повернутися до чіпів Nvidia для навчання, використовуючи китайські чіпи Huawei Ascend лише для виведення даних.

Проблеми з Huawei пов’язані з нестабільною продуктивністю, більш повільним з’єднанням між чіпами та обмеженням програмного інструментарію Huawei CANN.

Повідомляється, що Huawei направила команду інженерів до центрів обробки даних DeepSeek, щоб спробувати вирішити проблеми з навчанням. Незважаючи на спільні зусилля, фахівцям так і не вдалося провести повністю успішне навчання на платформі Huawei Ascend.

Неможливість завершити навчальний етап стало основним фактором затримки релізу DeepSeek R2, який спочатку було заплановано на травень. Досі невідомо, чи завершилось навчання R2 на цей момент.

У 2024 році компанія DeepSeek навчала свою модель R1 на кластері з 50 000 графічних процесорів серії Hopper, що складається з 30 000 одиниць HGX H20, 10 000 H800 та 10 000 H100. Нова модель R2 потребуватиме набагато більш потужного кластера, тому DeepSeek, враховуючи американські санкції на постачання в Китай сучасних чіпів, зіткнулась з проблемами.

Останні статті

OpenAI випустила гайд для розробників, як писати промпти з GPT-5.1

Компанія OpenAI опублікувала розширений посібник для розробників з рекомендаціями застосування нової LLM-моделі GPT-5.1. В документі…

17.11.2025

PyPI посилює перевірку користувачів після зміни пристрою авторизації

Розробники репозиторію Python-пакетів PyPI (Python Package Index) запровадили додаткову перевірку під час авторизації. Тепер від…

17.11.2025

Новий сервіс Code Wiki від Google сам пише та оновлює документацію для GitHub-репозиторіїв

Компанія Google представила новий проект Code Wiki — сервіс, який автоматично генерує технічну документацію для…

17.11.2025

В оновленому Visual Studio Code з’явився Agent HQ — центр управління агентами кодування

Редактор коду Visual Studio Code отримав чергове оновлення. У релізі 1.106 з'явився Agent HQ —…

17.11.2025

ІТ-компанії, засновані українцями в США, генерують $23,2 млрд доходу і створили 130 000 робочих місць

Американські компанії, засновані вихідцями з України, генерують майже $60 млрд річного доходу в США та…

17.11.2025

Microsoft заблокувала популярний спосіб офлайн-активації Windows

Microsoft відключила один із найвідоміших «напівлегальних» способів активації Windows — офлайн-метод KMS38. Він дозволяв продовжувати…

14.11.2025