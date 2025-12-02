logo

Новини 02/12/2025 15:55

«Вони дешевші і їх можна запускати на власному обладнанні»: американські розробники все частіше обирають китайські LLM-моделі

Дмитро Сімагін

Журналіст

Хоча американські стартапи продовжують лідирувати в галузі штучного інтелекту, багато з них розробляють свої продукти на основі китайських LLM-моделей. Причина цього проста — вони відкриті та дешевші у доступі, і підтримують безліч сценаріїв застосування, пише NBC News. 

Зростання популярності китайських LLM-моделей загрожує всій галузі штучного інтелекту США: інвестори вкладають десятки мільярдів доларів в OpenAI, Anthropic та інші компанії з розрахунку, що вони домінуватимуть на світовому ринку. Однак на практиці розробники все частіше звертаються до китайських проектів — це порушує питання, наскільки американські LLM-моделі насправді виняткові, і чи не є помилкою стратегія з випуску закритих продуктів.

Майкл Файн, керівник відділу в Exa, пошуковій компанії, яка спеціалізується на штучному інтелекті, розповів, що запуск китайських моделей на власному обладнанні в багатьох випадках виявився значно швидшим і дешевшим, ніж використання GPT-5 від OpenAI або Gemini від Google.

«Часто трапляється так, що ми отримуємо функцію, яка працює із закритою моделлю, і розуміємо, що вона занадто дорога або занадто повільна, і ми себе запитуємо, як це зробити швидшим і дешевшим. Зазвичай це означає заміну закритої моделі на користь відкритої моделі, а потім її запуск на власній інфраструктурі», — сказав Файн.

Китайські моделі, такі як R1 від DeepSeek та Qwen від Alibaba, можна використовувати безкоштовно і вони вважаються «відкритими», оскільки кожен може їх завантажити, копіювати, змінювати та використовувати на власному обладнанні. Вони відрізняються від провідних американських систем, таких як Claude від Anthropic або GPT від OpenAI, які є «закритими» або пропрієтарними, і доступ до яких здійснюється через API та дата-центри, які контролюються великими технологічними гігантами.

Роками американські моделі із закритим кодом від OpenAI та Anthropic значно перевершували як американські, так і китайські відкриті альтернативи. Але за останній рік китайські компанії, такі як DeepSeek та Alibaba, досягли величезного технологічного прогресу. Їхні продукти з відкритим кодом тепер майже наближаються або навіть відповідають показникам провідних закритих американських моделей у багатьох сферах, згідно з показниками, що відстежуються Artificial Analysis, незалежною компанією з бенчмаркінгу штучного інтелекту.

«Розрив справді скорочується», — сказав Лінь Цяо, генеральний директор Fireworks AI та співзасновник PyTorch, домінуючого фреймворку для навчання моделей штучного інтелекту.

Джеррі Лю, засновник Dayflow — застосунку для продуктивності — оцінює, що приблизно 40% користувачів Dayflow зараз обирають моделі з відкритим кодом: «Qwen така ж хороша, як GPT-5 для мого випадку використання». І на відміну від GPT-5 або Gemini, полегшена версія Qwen може працювати за відносно низькою ціною або безкоштовно. 

Моделі Dayflow з відкритим кодом можуть виконувати обробку даних на комп’ютері користувача, що, за словами Лю, приваблює тих, хто не хоче надсилати свої дані в хмару з міркувань конфіденційності. Особисто Лю віддає перевагу зберігати дані на своєму пристрої, використовуючи моделі з відкритим кодом: «Чи використовував би я продукт, де весь мій екран транслювався б у хмару якогось випадкового хлопця? Ні, чорт забирай».

Чарльз Зедлевскі, головний директор з продуктів компанії Together AI, яка займається інфраструктурою штучного інтелекту, сказав, що розробникам тепер простіше та ефективніше починати з відкритих моделей та адаптувати їх до власних даних, додаючи «навички чи знання, які недоступні в жодній із існуючих сьогодні моделей». 

Для розробників, які бажають самостійно налаштувати модель, китайські варіанти є відправною точкою за замовчуванням. У Kilo Code, популярному додатку для кодування, де користувачі можуть обирати потрібну їм модель, з 20 найпопулярніших LLM-моделей сім є китайськими, причому шість із семи мають відкритий вихідний код.

