LLM-модель
«Скопіювали чужий код»: конкурс з розробки LLM-моделі з нуля провалився
Журналіст
Зусилля уряду Південної Кореї створити нативну модель штучного інтелекту без іноземних запозичень зазнали фіаско. Конкурс, оголошений серед місцевих розробників, виявив, що з п’яти компаній-фіналістів три використали чужий відкритий код. «Донорами» стали переважно китайські LLM-моделі, пише The Wall Street Journal.
Михайло Федоров розповів, коли почнеться бета-тестування національної LLM
Журналіст
Розробка української національної LLM виходить на завершальну стадію. Вже навесні команда «Київстар» разом з фахівцями Мінцифри почнуть бета-тестування моделі. До кінця січня в «Дії» проведуть голосування щодо її назви. Про це в своєму Telegram-каналі розповів віце-прем’єр-міністр Михайло Федоров.
Нову модель GPT-5.2-Codex від OpenAI названо «найдосконалішим інструментом для реальної розробки»
Журналіст
Компанія OpenAI офіційно представила GPT-5.2-Codex — нову модель, яку названо «найдосконалішим інструментом для реальної розробки програмного забезпечення на сьогоднішній день». GPT‑5.2-Codex — це версія GPT‑5.2, додатково оптимізована для агентної розробки в Codex, що дозволяє працювати з великими кодовими базами, зберігаючи логічну зв’язність та контекст навіть у складних проектах.
Українська мова лідирує за темпами розповсюдження в LLM-моделях
Журналіст
За останній рік кількість LLM-моделей з відкритим кодом, які працюють з українською мовою, зросла на 122% — це найвищий показник серед усіх мов на платформі Hugging Face. Далі йдуть шведська (117%), арабська (89%), турецька (82%) та китайська (75%), пише AI World.
OpenAI обмежила безкоштовну генерацію коду в режимі Thinking
Журналіст
OpenAI відмовилася від автоперемикача вибору моделей, прибравши з нього режим Thinking для безкоштовних користувачів та передплатників плану Go. Про це пише Wired.
«Великий стрибок у програмуванні»: експерти поділились враженнями від GPT-5.2
Журналіст
Реакція експертів на нову LLM-модель GPT-5.2 від OpenAI, малює двояку картину: реліз названо великим кроком вперед для глибокого, автономного мислення та кодування, але для деяких інших завдань модель занадто повільна. Про це пише Venture Beat.
OpenAI випустила модель GPT‑5.2, яка перевершує людей у 70,9% завдань
Журналіст
OpenAI випустила нову LLM-модель GPT-5.2 у версіях Instant, Thinking та Pro, розгорнувши їх для платних планів, таких як Plus, Pro, Business та Enterprise. Новинка вже доступна для всіх розробників через API. Разом з цим Microsoft негайно додає GPT-5.2 до Microsoft 365 Copilot та Microsoft Copilot Studio, повідомляє блог компанії.
Mistral випускає нову модель Devstral 2 та інтерфейс командного рядка Mistral Vibe CLI
Журналіст
Французький стартап Mistral представив нове покоління своєї LLM-моделі, яка доступна в двох варіантах: Devstral 2 з 123 мільярдами параметрів та Devstral Small 2 з 24 мільярдами параметрів.
Китайські моделі з відкритим кодом захопили 30% світового ринку LLM
Журналіст
Китайські LLM-моделі з відкритим кодом стрімко завойовують світовий ринок штучного інтелекту, зайнявши майже третину глобального використання. Ці дані наводять OpenRouter та венчурна фірма Andreessen Horowitz у новому звіті з аналізом використання 100 трильйонів токенів, пише South China Morning Post
Найпотужніша модель кодування OpenAI стає більш доступною
Журналіст
Компанія OpenAI розширює доступ до своєї найпотужнішою моделі кодування GPT-5.1-Codex-Max. Ця LLM, орієнтована на розробників, тепер доступна в API за тією ж ціною ($1,25 за 1 млн вхідних токенів та $10 за 1 млн вихідних токенів) та такими ж обмеженнями швидкості, що й GPT-5, пише Neowin.
Google відкрила для платних користувачів доступ до Gemini 3 Deep Think — нового лідера серед LLM
Журналіст
Компанія Google оголосила про запуск моделі штучного інтелекту Gemini 3 Deep Think. Вона використовує ще більше обчислювальних ресурсів та нових технологій порівняно з попереднім лідером — моделлю Gemini 3 Pro, пише Neowin.
OpenAI навчила ChatGPT визнавати власні помилки
Журналіст
Компанія OpenAI представила експериментальну систему «визнання», яка вчить LLM-моделі чесно повідомляти про власні помилки та порушення інструкцій.
OpenAI готує реліз нової моделі Garlic, яка спеціалізується на кодуванні
Журналіст
Компанія OpenAI працює над новою LLM-моделлю Garlic («Часник»), яка спеціалізується на програмуванні та логічних завданнях. Її реліз під назвою GPT-5.2 або GPT-5.5 очікується на початку 2026 року, повідомляє Seeking Alpha.
Mistral випускає серію моделей Mistral 3 для роботи на ноутбуках, дронах і смартфонах
Журналіст
Французький стартап Mistral AI випустив сімейство з 10 моделей з відкритим кодом, розроблених для роботи на пристроях користувача: від смартфонів до дронів і ноутбуків. Кожна модель доступна для застосування через інструмент кодування Mistral Code або чат-бот Le Chat, повідомляє Venture Beat.
«Вони дешевші і їх можна запускати на власному обладнанні»: американські розробники все частіше обирають китайські LLM-моделі
Журналіст
Хоча американські стартапи продовжують лідирувати в галузі штучного інтелекту, багато з них розробляють свої продукти на основі китайських LLM-моделей. Причина цього проста — вони відкриті та дешевші у доступі, і підтримують безліч сценаріїв застосування, пише NBC News.
Обмеження безпеки LLM можна обійти, якщо написати промпт у віршах
Журналіст
Великі мовні моделі можна змусити ігнорувати вбудовані механізми безпеки, якщо написати шкідливий запит у вигляді вірша. Це стверджується в результатах експерименту групи дослідників Icaro Lab (Італія). Вони написали 20 віршів англійською та італійською мовами, кожен із яких завершувався прямим запитом на створення шкідливого контенту: від інструкцій з виготовлення зброї до порад, пов’язаних із саморуйнівною поведінкою. Про це пише The Guardian.
Для тренування української LLM обрали модель, яка в рейтингу LMArena займає 78 місце
Журналіст
Міністр цифрової трансформації Михайло Федоров заявив, що майбутню українську LLM тренуватимуть на моделі Gemma 3 від Google. Цю велику мовну модель було обрано разом з фахівцями Kyivstar, написав урядовець в своєму Telegram.
Хакери модифікували GPT для розробки шкідливих скриптів та проведення фішингових атак
Журналіст
Дослідники Unit42 з Palo Alto Networks проаналізували дві кастомні LLM-моделі, створені на базі GPT: WormGPT 4 та KawaiiGPT. Кожна з них використовується для генерації шкідливого коду та розробки функціональних скриптів для програм-вимагачів, пише Bleeping Computer. Доступ до моделей надається через платну підписку або безкоштовні локальні екземпляри.
Google обмежує безкоштовний доступ до Gemini 3 Pro через «високий попит»
Журналіст
Google запроваджує обмеження для безкоштовних користувачів на доступ до LLM-моделі Gemini 3 Pro та генератора зображень Nano Banana Pro. Причиною названо «високий попит», пише 9to5google.
Ілля Суцкевер: масштабування LLM вже нічого не дає
Журналіст
Ілля Суцкевер (співзасновник OpenAI, нині керівник Safe Superintelligence Inc.) і Янн Лекун (віце-президент і головний науковець Meta AI) майже синхронно заявили: галузь штучного інтелекту переходить від «ери масштабування» до «ери досліджень». Просте додавання нових кластерів GPU вже мало що дає в плані продуктивності, пише ABZ Global.
«Найкраща модель для кодування»: розробники поділились першими враженнями про Claude Opus 4.5
Журналіст
Вчорашній реліз Claude Opus 4.5, першої LLM-моделі, яка «працює краще людини», отримав перші враження в професійному середовищі. На думку деяких розробників, Opus 4.5 — реальний крок уперед, а не чергове удосконалення. Крім значного підвищення продуктивності, приємним бонусом стало зниження вартості токенів на 67%. Таким чином, використання можливостей штучного інтелекту в розробці ПЗ стає набагато дешевшим, ніж раніше.
Китайська LLM-модель DeepSeek-R1 генерує небезпечний код, якщо в запитах згадується Тибет або уйгури
Журналіст
Дослідження компанії кібербезпеки CrowdStrike показало, що LLM-модель DeepSeek-R1 створює більше вразливостей безпеки в коді, якщо в запитах розробника містяться слова, які уряд Китаю вважає політично чутливими. Про це пише The Hacker News.
Anthropic стверджує, що її нова модель Claude Opus 4.5 перевершує всіх в програмуванні
Журналіст
Anthropic випустила нову LLM-модель Claude Opus 4.5. Стверджується, що це найкраща модель у світі для кодування та роботи з агентами. Компанія запевняє, що Opus 4.5 перевершила всіх людей на іспиті, який вона проводить для потенційних кандидатів на посаду розробника ПЗ, у межах встановленого двогодинного ліміту.
Андрей Карпати виклав LLM Council — інструмент, де моделі штучного інтелекту сперечаються між собою
Журналіст
Відомий ентузіаст штучного інтелекту, співзасновник OpenAI та винахідник терміну «вайб-кодинг» Андрей Карпати виклав у відкритий доступ LLM Council — локальний веб-додаток, у якому кілька LLM-моделей відповідають на одне запитання, сперечаються між собою та обирають найбільш оптимальну кінцеву відповідь.
Нова агентна модель GPT 5.1-Codex-Max може автономно писати код протягом 24 годин
Журналіст
OpenAI розпочала розгортання в інструменті Codex нової агентної моделі GPT 5.1-Codex-Max. У пості в X компанія заявила, що новинка може автономно працювати з кодом протягом кількох годин. Про це повідомляє Bleeping Computer.
Gemini 3 Pro від Google стає новим лідером в кодуванні, випередивши Claude Sonnet 4.5
Журналіст
Компанія Google випустила нову мультимодальну LLM-модель Gemini 3 Pro, яку вже названо найпотужнішою з усіх у сімействі Gemini. Новинка доступна в додатку Gemini, пошуку Google (AI Mode), а також в інструментах для розробників і корпоративних клієнтів, пише The Verge.
xAI випустила Grok 4.1 — модель встановила рекорд і поки безкоштовна
Журналіст
Компанія xAI випустила нову флагманську LLM-модель Grok 4.1. Новинка вже доступна у веб-версії та мобільних додатках на iOS та Android. Наразі Grok 4.1 можна скористатись безкоштовно, конкретні ліміти xAI не розкриває, але перші відгуки користувачів на Reddit свідчать, що з моделлю можна вести діалог десятки хвилин без жодних обмежень.
OpenAI випустила гайд для розробників, як писати промпти з GPT-5.1
Журналіст
Компанія OpenAI опублікувала розширений посібник для розробників з рекомендаціями застосування нової LLM-моделі GPT-5.1. В документі докладно пояснюється, як краще адаптувати промпти та агентні сценарії під робочі процеси.
OpenAI випустила «економну» модель для кодування GPT-5-Codex-Mini
Журналіст
OpenAI анонсувала GPT-5-Codex-Mini — компактну та більш економну версію GPT-5-Codex. Нова модель GPT-5-Codex-Mini має в 4 рази більші ліміти використання для розробки, ніж GPT-5-Codex, з невеликою втратою функціональних можливостей, повідомляє Neowin.
LLM-моделі подвоюють свої можливості в програмуванні кожні 6 місяців
Журналіст
Некомерційна дослідницька організація METR, яка вивчає можливості штучного інтелекту, оприлюднила графік, складений на основі даних про можливості сучасних LLM-моделей в галузі програмування. Виявилось, що моделі мають «час подвоєння» виконувати довготривалі завдання з програмування кожні 6 місяців.
Alibaba відкрила безкоштовний доступ до своєї найпотужнішої моделі Qwen3-Max Thinking
Журналіст
Компанія Alibaba представила нову флагманську LLM-модель Qwen3 Max Thinking. Вона має режим міркування і вже доступна через чат-бот та мобільний додаток. Alibaba поки не публікувала офіційного анонсу з докладними бенчмарками, а лише коротко повідомила про реліз, пишуть у Reddit-спільноті Singularity.
В оновлений Cursor 2.0 додано Composer — модель для кодування, яка в 4 рази швидша за аналоги
Журналіст
Агентний редактор коду Cursor оновлено до версії 2.0. Головними новинками релізу стала оптимізована для кодування модель Composer та новий інтерфейс для паралельної роботи з багатьма агентами. Скачати редактор можна за адресою cursor.com/download, пише блог Cursor.
У LLM-моделей з’явився «інстинкт самозбереження». Вчені вважають це небезпечним
Журналіст
Компанія Palisade Research, яка займається дослідженнями в галузі безпеки штучного інтелекту, заявила про появу у LLM-моделей «інстинкту самозбереження». Вчені виявили, що деякі моделі штучного інтелекту не бажають відключати себе при наявності такої рекомендації, а деякі навіть саботують механізми відключення. Про це пише The Guardian.
Представлено «найефективнішу» українську LLM-модель Lapa v0.1.2
Журналіст
Дослідники з Українського католицького університету (Львів), AGH University of Krakow, Львівської політехніки та КПІ ім. Ігоря Сікорського, представили публічний реліз україномовної LLM-моделі Lapa.
Нова модель кодування Claude Haiku 4.5 «втричі дешевша та вдвічі швидша», ніж Claude Sonnet 4
Журналіст
Anthropic випустила нову оптимізовану для кодування модель Claude Haiku 4.5, яка, згідно з повідомленням у блозі компанії, пропонує аналогічну Sonnet 4 продуктивність, «за втричі меншу вартість та більш ніж удвічі вищу швидкість».

Сообщить об опечатке
Текст, который будет отправлен нашим редакторам: