Рубріки: Новини

«Вони дешевші і їх можна запускати на власному обладнанні»: американські розробники все частіше обирають китайські LLM-моделі

Дмитро Сімагін

02.12.2025 15:55

Хоча американські стартапи продовжують лідирувати в галузі штучного інтелекту, багато з них розробляють свої продукти на основі китайських LLM-моделей. Причина цього проста — вони відкриті та дешевші у доступі, і підтримують безліч сценаріїв застосування, пише NBC News.

Зростання популярності китайських LLM-моделей загрожує всій галузі штучного інтелекту США: інвестори вкладають десятки мільярдів доларів в OpenAI, Anthropic та інші компанії з розрахунку, що вони домінуватимуть на світовому ринку. Однак на практиці розробники все частіше звертаються до китайських проектів — це порушує питання, наскільки американські LLM-моделі насправді виняткові, і чи не є помилкою стратегія з випуску закритих продуктів.

Майкл Файн, керівник відділу в Exa, пошуковій компанії, яка спеціалізується на штучному інтелекті, розповів, що запуск китайських моделей на власному обладнанні в багатьох випадках виявився значно швидшим і дешевшим, ніж використання GPT-5 від OpenAI або Gemini від Google.

«Часто трапляється так, що ми отримуємо функцію, яка працює із закритою моделлю, і розуміємо, що вона занадто дорога або занадто повільна, і ми себе запитуємо, як це зробити швидшим і дешевшим. Зазвичай це означає заміну закритої моделі на користь відкритої моделі, а потім її запуск на власній інфраструктурі», — сказав Файн.

Китайські моделі, такі як R1 від DeepSeek та Qwen від Alibaba, можна використовувати безкоштовно і вони вважаються «відкритими», оскільки кожен може їх завантажити, копіювати, змінювати та використовувати на власному обладнанні. Вони відрізняються від провідних американських систем, таких як Claude від Anthropic або GPT від OpenAI, які є «закритими» або пропрієтарними, і доступ до яких здійснюється через API та дата-центри, які контролюються великими технологічними гігантами.

Роками американські моделі із закритим кодом від OpenAI та Anthropic значно перевершували як американські, так і китайські відкриті альтернативи. Але за останній рік китайські компанії, такі як DeepSeek та Alibaba, досягли величезного технологічного прогресу. Їхні продукти з відкритим кодом тепер майже наближаються або навіть відповідають показникам провідних закритих американських моделей у багатьох сферах, згідно з показниками, що відстежуються Artificial Analysis, незалежною компанією з бенчмаркінгу штучного інтелекту.

«Розрив справді скорочується», — сказав Лінь Цяо, генеральний директор Fireworks AI та співзасновник PyTorch, домінуючого фреймворку для навчання моделей штучного інтелекту.

Джеррі Лю, засновник Dayflow — застосунку для продуктивності — оцінює, що приблизно 40% користувачів Dayflow зараз обирають моделі з відкритим кодом: «Qwen така ж хороша, як GPT-5 для мого випадку використання». І на відміну від GPT-5 або Gemini, полегшена версія Qwen може працювати за відносно низькою ціною або безкоштовно.

Моделі Dayflow з відкритим кодом можуть виконувати обробку даних на комп’ютері користувача, що, за словами Лю, приваблює тих, хто не хоче надсилати свої дані в хмару з міркувань конфіденційності. Особисто Лю віддає перевагу зберігати дані на своєму пристрої, використовуючи моделі з відкритим кодом: «Чи використовував би я продукт, де весь мій екран транслювався б у хмару якогось випадкового хлопця? Ні, чорт забирай».

Чарльз Зедлевскі, головний директор з продуктів компанії Together AI, яка займається інфраструктурою штучного інтелекту, сказав, що розробникам тепер простіше та ефективніше починати з відкритих моделей та адаптувати їх до власних даних, додаючи «навички чи знання, які недоступні в жодній із існуючих сьогодні моделей».

Для розробників, які бажають самостійно налаштувати модель, китайські варіанти є відправною точкою за замовчуванням. У Kilo Code, популярному додатку для кодування, де користувачі можуть обирати потрібну їм модель, з 20 найпопулярніших LLM-моделей сім є китайськими, причому шість із семи мають відкритий вихідний код.

Наступна стаття Чат-боти знижують мотивацію та роблять навчання поверхневим »

попередня стаття « За 10 місяців 2025 року експорт IT-послуг з України зріс на $118 мільйонів

Дмитро Сімагін

Теги: LLM-модельКитай

02.12.2025 15:55

Останні статті

Новини

Claude тепер може читати ваші розмови з ChatGPT

Компанія Anthropic анонсувала нову функцію імпорту пам’яті. Вона дозволяє додавати в Claude діалоги користувача з…

02.03.2026

Новини

Вірусна ШІ-соцмережа Moltbook виявилася звалищем ботів без ознак ком’юніті

Соціальна платформа Moltbook, яку кілька тижнів тому назвали «першим ком'юніті для агентів штучного інтелекту», виявилась…

02.03.2026

Новини

ClawJacked краде дані через плагіни OpenClaw

Одного кліку достатньо: сайт може запустити OpenClaw на вашому ноутбуці, «зачепити» звіт чи бухгалтерію та…

02.03.2026

Новини

У соцмережах набирає популярності тренд Cancel ChatGPT

Після того, як компанія Anthropic категорично відмовилася надавати дозвіл використовувати модель Claude для розробки автономної…

02.03.2026

Новини

У Росії розігнали акцію проти блокування Telegram і примусового встановлення Max

У російському місті Новосибірськ затримали 16 людей, які вчора пришли на місце проведення мітингу проти…

02.03.2026

Новини

27-річний українець створив глобальну мережу генерації фейкових документів: як працювала схема

Громадянин України Юрій Назаренко визнав себе винним у створенні сайту OnlyFake, де за допомогою штучного…

02.03.2026

«Вони дешевші і їх можна запускати на власному обладнанні»: американські розробники все частіше обирають китайські LLM-моделі

Схожі статті

Останні статті

Claude тепер може читати ваші розмови з ChatGPT

Вірусна ШІ-соцмережа Moltbook виявилася звалищем ботів без ознак ком’юніті

ClawJacked краде дані через плагіни OpenClaw

У соцмережах набирає популярності тренд Cancel ChatGPT

У Росії розігнали акцію проти блокування Telegram і примусового встановлення Max

27-річний українець створив глобальну мережу генерації фейкових документів: як працювала схема