LLM-модель
«Китайці демпінгують»: Alibaba Group пропонує місячний доступ до LLM-моделей лише за 50 гривень
Автор новин
Компанія Alibaba Cloud оголосила про запуск Coding Plan — дворівневої підписки на доступ до LLM-моделей з відкритим кодом Qwen3.5, GLM-5, MiniMax M2.5 та Kimi K2.5. Про це повідомляє Bloomberg з посиланням на QQ.
Anthropic звинувачує китайські компанії в масовій крадіжці можливостей Claude
Автор новин
Компанія Anthropic звинуватила трьох провідних китайських розробників штучного інтелекту — DeepSeek, Moonshot та MiniMax. Їм закидають використання дистиляції в «промислових масштабах» для незаконного вдосконалення власних моделей на базі відповідей Claude. Загалом зафіксовано 16 мільйонів обмінів даними через мережу з 24 000 шахрайських облікових записів, пише Tom’s Hardware.
Google повертає лідерство серед LLM: нова модель Gemini 3.1 Pro демонструє рекорди продуктивності
Автор новин
Google випустила Gemini 3.1 Pro. Нова LLM перевершує всіх попередників та конкурентів в основних бенчмарках, особливо в логічних та наукових тестах. Компанія-розробник запевняє, що модель Gemini 3.1 Pro є «кроком уперед у сфері базового мислення».
Anthropic випустила Claude Sonnet 4.6: порівнюємо з іншими LLM
Автор новин
Anthropic представила Claude Sonnet 4.6 — найпотужнішу на сьогодні LLM цієї серії, яка тепер є default-моделлю у claude.ai та Claude Cowork. У бета-версії модель підтримує контекстне вікно розміром до 1 мільйона токенів, що цілком достатньо для введення в одному запиті цілих кодових баз або десятків дослідницьких робіт.
OpenAI випустила GPT-5.3-Codex-Spark: пише код у 15 разів швидше, але є нюанс
Автор новин
OpenAI представила дослідницьку preview-версію нової LLM-моделі GPT-5.3-Codex-Spark, яка є полегшеним варіантом GPT-5.3-Codex. За твердженням компанії, вона здатна генерувати код зі швидкістю більше 1000 токенів за секунду, що приблизно в 15 разів швидше, ніж у стандартної версії GPT-5.3-Codex.
Google: невідомі намагались клонувати Gemini, відправивши 100 000 запитів про внутрішню роботу LLM
Автор новин
Google стверджує, що невідомі зловмисники використали понад 100 000 запитів, щоб спробувати клонувати чат-бот Gemini. Мова йде про «атаки дистиляції» або повторювані питання, які спрямовані на те, щоб змусити модель розкрити свою внутрішню роботу, пише NBC News.
Пентагон хоче, щоб OpenAI та Anthropic зробили для військових спеціальні версії LLM «без обмежень»
Автор новин
Міністерство оборони США наполягає на тому, щоб провідні компанії з розробки штучного інтелекту, включно з OpenAI та Anthropic, виготовили для військових спеціальні версії LLM без стандартних обмежень. Про це пише Reuters.
OpenAI випустила GPT-5.3-Codex: на 25% швидше пише код і виконує «будь-які» завдання замість розробників
Автор новин
Компанія OpenAI випустила модель для агентного кодування GPT-5.3-Codex — майже одразу після релізу Claude Opus 4.6 від Anthropic. Новинка працює на 25% швидше за попередню версію GPT-5.2 та використовує менше токенів.
Anthropic випустила Claude Opus 4.6 з підтримкою довгого контексту
Автор новин
Anthropic оголосила про реліз Claude Opus 4.6, яка, за словами компанії, є її найпотужнішою моделлю для виконання складних корпоративних завдань.
Експерти попередили про небезпеку LLM-моделей з відкритим кодом
Автор новин
У дослідженні, яке спільно провели компанії з кібербезпеки SentinelOne та Censys, стверджується, що LLM-моделі з відкритим кодом потенційно небезпечні. Через те, що в них відсутні захисні механізми і вони доступні для модифікації, штучний інтелект легко може бути використаний злочинцями, пише Reuters.
Мінцифри просить всіх поділитись даними для навчання національної LLM
Автор новин
Мінцифри просить користувачів «увійти в історію» та поділитись текстовими даними для розробки національної LLM. Ці дані потрібні для адаптації моделі до українського контексту, повідомляє сайт міністерства.
Kimi 2.5 стала першою LLM-моделлю, яка вміє писати код по зображенню та відео
Автор новин
Китайський стартап Moonshot AI випустив оновлення своєї відкритої мультимодальної моделі Kimi. Реліз 2.5 був навчений на рекордних 15 трлн візуально-текстових токенів, пише блог компанії.
Україна передасть союзникам «мільйони годин відео», зроблених з військових дронів, для навчання ШІ-моделей
Автор новин
Новий міністр оборони України Михайло Федоров пообіцяв передати союзникам «мільйони годин відео», зроблених з військових дронів ЗСУ, для навчання на цих даних спеціалізованих моделей штучного інтелекту. Про це пише Reuters.
GPT-5.2 написала веб-браузер з нуля. Модель створила три мільйони рядків коду і працювала безперервно цілий тиждень
Автор новин
Генеральний директор компанії Cursor AI Майкл Труелл повідомив, що LLM-модель GPT-5.2, яку задіяли через агент кодування Cursor, змогла самостійно написати веб-браузер «повністю з нуля». Для виконання завдання вона працювала безперервно протягом цілого тижня та зрештою створила понад три мільйони рядків коду в тисячах файлів.
«Скопіювали чужий код»: конкурс з розробки LLM-моделі з нуля провалився
Автор новин
Зусилля уряду Південної Кореї створити нативну модель штучного інтелекту без іноземних запозичень зазнали фіаско. Конкурс, оголошений серед місцевих розробників, виявив, що з п’яти компаній-фіналістів три використали чужий відкритий код. «Донорами» стали переважно китайські LLM-моделі, пише The Wall Street Journal.
Михайло Федоров розповів, коли почнеться бета-тестування національної LLM
Автор новин
Розробка української національної LLM виходить на завершальну стадію. Вже навесні команда «Київстар» разом з фахівцями Мінцифри почнуть бета-тестування моделі. До кінця січня в «Дії» проведуть голосування щодо її назви. Про це в своєму Telegram-каналі розповів віце-прем’єр-міністр Михайло Федоров.
Нову модель GPT-5.2-Codex від OpenAI названо «найдосконалішим інструментом для реальної розробки»
Автор новин
Компанія OpenAI офіційно представила GPT-5.2-Codex — нову модель, яку названо «найдосконалішим інструментом для реальної розробки програмного забезпечення на сьогоднішній день». GPT‑5.2-Codex — це версія GPT‑5.2, додатково оптимізована для агентної розробки в Codex, що дозволяє працювати з великими кодовими базами, зберігаючи логічну зв’язність та контекст навіть у складних проектах.
Українська мова лідирує за темпами розповсюдження в LLM-моделях
Автор новин
За останній рік кількість LLM-моделей з відкритим кодом, які працюють з українською мовою, зросла на 122% — це найвищий показник серед усіх мов на платформі Hugging Face. Далі йдуть шведська (117%), арабська (89%), турецька (82%) та китайська (75%), пише AI World.
OpenAI обмежила безкоштовну генерацію коду в режимі Thinking
Автор новин
OpenAI відмовилася від автоперемикача вибору моделей, прибравши з нього режим Thinking для безкоштовних користувачів та передплатників плану Go. Про це пише Wired.
«Великий стрибок у програмуванні»: експерти поділились враженнями від GPT-5.2
Автор новин
Реакція експертів на нову LLM-модель GPT-5.2 від OpenAI, малює двояку картину: реліз названо великим кроком вперед для глибокого, автономного мислення та кодування, але для деяких інших завдань модель занадто повільна. Про це пише Venture Beat.
OpenAI випустила модель GPT‑5.2, яка перевершує людей у 70,9% завдань
Автор новин
OpenAI випустила нову LLM-модель GPT-5.2 у версіях Instant, Thinking та Pro, розгорнувши їх для платних планів, таких як Plus, Pro, Business та Enterprise. Новинка вже доступна для всіх розробників через API. Разом з цим Microsoft негайно додає GPT-5.2 до Microsoft 365 Copilot та Microsoft Copilot Studio, повідомляє блог компанії.
Mistral випускає нову модель Devstral 2 та інтерфейс командного рядка Mistral Vibe CLI
Автор новин
Французький стартап Mistral представив нове покоління своєї LLM-моделі, яка доступна в двох варіантах: Devstral 2 з 123 мільярдами параметрів та Devstral Small 2 з 24 мільярдами параметрів.
Китайські моделі з відкритим кодом захопили 30% світового ринку LLM
Автор новин
Китайські LLM-моделі з відкритим кодом стрімко завойовують світовий ринок штучного інтелекту, зайнявши майже третину глобального використання. Ці дані наводять OpenRouter та венчурна фірма Andreessen Horowitz у новому звіті з аналізом використання 100 трильйонів токенів, пише South China Morning Post
Найпотужніша модель кодування OpenAI стає більш доступною
Автор новин
Компанія OpenAI розширює доступ до своєї найпотужнішою моделі кодування GPT-5.1-Codex-Max. Ця LLM, орієнтована на розробників, тепер доступна в API за тією ж ціною ($1,25 за 1 млн вхідних токенів та $10 за 1 млн вихідних токенів) та такими ж обмеженнями швидкості, що й GPT-5, пише Neowin.
Google відкрила для платних користувачів доступ до Gemini 3 Deep Think — нового лідера серед LLM
Автор новин
Компанія Google оголосила про запуск моделі штучного інтелекту Gemini 3 Deep Think. Вона використовує ще більше обчислювальних ресурсів та нових технологій порівняно з попереднім лідером — моделлю Gemini 3 Pro, пише Neowin.
OpenAI навчила ChatGPT визнавати власні помилки
Автор новин
Компанія OpenAI представила експериментальну систему «визнання», яка вчить LLM-моделі чесно повідомляти про власні помилки та порушення інструкцій.
OpenAI готує реліз нової моделі Garlic, яка спеціалізується на кодуванні
Автор новин
Компанія OpenAI працює над новою LLM-моделлю Garlic («Часник»), яка спеціалізується на програмуванні та логічних завданнях. Її реліз під назвою GPT-5.2 або GPT-5.5 очікується на початку 2026 року, повідомляє Seeking Alpha.
Mistral випускає серію моделей Mistral 3 для роботи на ноутбуках, дронах і смартфонах
Автор новин
Французький стартап Mistral AI випустив сімейство з 10 моделей з відкритим кодом, розроблених для роботи на пристроях користувача: від смартфонів до дронів і ноутбуків. Кожна модель доступна для застосування через інструмент кодування Mistral Code або чат-бот Le Chat, повідомляє Venture Beat.
«Вони дешевші і їх можна запускати на власному обладнанні»: американські розробники все частіше обирають китайські LLM-моделі
Автор новин
Хоча американські стартапи продовжують лідирувати в галузі штучного інтелекту, багато з них розробляють свої продукти на основі китайських LLM-моделей. Причина цього проста — вони відкриті та дешевші у доступі, і підтримують безліч сценаріїв застосування, пише NBC News.
Обмеження безпеки LLM можна обійти, якщо написати промпт у віршах
Автор новин
Великі мовні моделі можна змусити ігнорувати вбудовані механізми безпеки, якщо написати шкідливий запит у вигляді вірша. Це стверджується в результатах експерименту групи дослідників Icaro Lab (Італія). Вони написали 20 віршів англійською та італійською мовами, кожен із яких завершувався прямим запитом на створення шкідливого контенту: від інструкцій з виготовлення зброї до порад, пов’язаних із саморуйнівною поведінкою. Про це пише The Guardian.
Для тренування української LLM обрали модель, яка в рейтингу LMArena займає 78 місце
Автор новин
Міністр цифрової трансформації Михайло Федоров заявив, що майбутню українську LLM тренуватимуть на моделі Gemma 3 від Google. Цю велику мовну модель було обрано разом з фахівцями Kyivstar, написав урядовець в своєму Telegram.
Хакери модифікували GPT для розробки шкідливих скриптів та проведення фішингових атак
Автор новин
Дослідники Unit42 з Palo Alto Networks проаналізували дві кастомні LLM-моделі, створені на базі GPT: WormGPT 4 та KawaiiGPT. Кожна з них використовується для генерації шкідливого коду та розробки функціональних скриптів для програм-вимагачів, пише Bleeping Computer. Доступ до моделей надається через платну підписку або безкоштовні локальні екземпляри.
Google обмежує безкоштовний доступ до Gemini 3 Pro через «високий попит»
Автор новин
Google запроваджує обмеження для безкоштовних користувачів на доступ до LLM-моделі Gemini 3 Pro та генератора зображень Nano Banana Pro. Причиною названо «високий попит», пише 9to5google.
Ілля Суцкевер: масштабування LLM вже нічого не дає
Автор новин
Ілля Суцкевер (співзасновник OpenAI, нині керівник Safe Superintelligence Inc.) і Янн Лекун (віце-президент і головний науковець Meta AI) майже синхронно заявили: галузь штучного інтелекту переходить від «ери масштабування» до «ери досліджень». Просте додавання нових кластерів GPU вже мало що дає в плані продуктивності, пише ABZ Global.
«Найкраща модель для кодування»: розробники поділились першими враженнями про Claude Opus 4.5
Автор новин
Вчорашній реліз Claude Opus 4.5, першої LLM-моделі, яка «працює краще людини», отримав перші враження в професійному середовищі. На думку деяких розробників, Opus 4.5 — реальний крок уперед, а не чергове удосконалення. Крім значного підвищення продуктивності, приємним бонусом стало зниження вартості токенів на 67%. Таким чином, використання можливостей штучного інтелекту в розробці ПЗ стає набагато дешевшим, ніж раніше.



Сообщить об опечатке
Текст, который будет отправлен нашим редакторам: