LLM-модель
OpenAI випустила агент кодування Codex CLI та нові LLM-моделі о3 і o4-mini
Журналіст
OpenAI представила Codex CLI — агент кодування з відкритим кодом, розроблений для локального запуску з термінального програмного забезпечення. Codex CLI пов’язує LLM-моделі OpenAI з локальним кодом і обчислювальними завданнями, повідомляє TechCrunch.
Тести GPT-4.1 визнали її найкращою в кодуванні серед усіх моделей OpenAI
Журналіст
Компанія OpenAI випустила нову лінійку моделей під назвою GPT-4.1. Вже відомо про GPT-4.1, GPT-4.1 mini і GPT-4.1 nano, усі вони продемонстрували «відмінні» результати в кодуванні. Нові моделі, які доступні через API OpenAI, але не через ChatGPT, мають вікно контексту в 1 мільйон токенів, що означає, що вони можуть одночасно обробляти введення приблизно 750 000 слів, пише TechCrunch.
OpenAI: для доступу до майбутніх LLM-моделей через API доведеться пройти ідентифікацію
Журналіст
OpenAI планує змінити правила доступу через API до своїх найбільш потужних LLM-моделей. Організаціям і компаніям доведеться пройти процес отримання ідентифікатора. Про це йдеться на сторінці підтримки сайту OpenAI.
OpenAI готується до релізу GPT-4.1
Журналіст
Найближчими днями компанія OpenAI планує представити кілька нових моделей штучного інтелекту, включно з оновленою версією GPT-4 під назвою GPT-4.1. Вона стане удосконаленою версією флагманської моделі GPT-4o з можливістю міркування, пише The Verge.
Перша версія української LLM може з’явитися вже до кінця року. Вона буде базуватися на 2–3 млрд токенів
Журналіст
Українська велика мовна модель буде побудована на llama 4. Про це під час 2U tech Forum розповів заступник міністра цифрової трансформації Олександр Борняков, повідомили в Dev.ua.
Компанія Ілона Маска xAI відкрила доступ до Grok 3 через API
Журналіст
Компанія xAI зробила свою флагманську LLM-модель Grok 3 доступною через API. Grok 3 сьогодні займає другу позицію в рейтингу Chatbot Arena, поступаючись лише Gemini 2.5 Pro, пише TechCrunch. Модель може аналізувати зображення та відповідати на запитання, а також підтримує ряд функцій у соціальній мережі X.
Docker запускає сервіс для локальної розробки та запуску моделей штучного інтелекту
Журналіст
Компанія Docker, відома своїми контейнерними інструментами розробки програмного забезпечення, запустила новий сервіс під назвою Docker Model Runner. Він допомагає розробникам створювати та запускати моделі штучного інтелекту локально на власному обладнанні та в рамках існуючих робочих процесів.
Meta випустила нову серію великих мовних моделей Llama 4
Журналіст
Meta представила нову серію великих мовних моделей Llama 4: Scout, Maverick і Behemoth. Перші дві з них вже доступні для завантаження на llama.com і Hugging Face, повідомляє Neowin.
На ринку хакерських послуг активно продають тонко налаштовані LLM-моделі
Журналіст
Команда Cisco Talos Intelligence Group, яка є частиною компанії Cisco Systems, помітила зростання тонко налаштованих LLM-моделей, які пропонуються в оренду на ринку хакерських послуг. Зокрема, дослідники виявили, що доступ до GhostGPT, DarkGPT і FraudGPT продається в Telegram і даркнет всього за $75 на місяць. Ці інструменти використовуються для фішингу, розробки експлойтів, перевірки кредитних карток і обфускації коду, пише Venture Beat.
Михайло Федоров: починаємо розробку національної LLМ-моделі
Журналіст

Віце-прем’єр-міністр та очільник Міністерства цифрової трансформації Михайло Федоров розповів про плани розробки першої українськомовної LLM національного масштабу. На думку чиновника, це дасть старт масовому виробництву українських ШІ-інструментів. Про це Федоров оголосив на заході Forbes AI Day 2025.
Єдиний протокол для всіх LLM-моделей. OpenAI приймає стандарт Anthropic
Журналіст

Компанія OpenAI використає стандарт конкурента Anthropic для підключення LLM-моделей до систем збереження даних. Генеральний директор OpenAI Сем Альтман заявив, що OpenAI додасть підтримку Anthropic Model Context Protocol або MCP у всі свої продукти, включаючи ChatGPT. Про це повідомляє TechCrunch.
Google випустила модель Gemini 2.5. Вона перевершує DeepSeek R1 і одна з найкращих для роботи з кодом
Журналіст
Google представила Gemini 2.5 — модель мислення, розроблену для вирішення складних проблем. За результатами тестів Gemini 2.5 Pro Experimental лідирує зі значним відривом і демонструє одні з найкращих результатів у генерації коду, пише Neowin.
DeepSeek випускає нову безкоштовну модель V3-0324. Вона краща в програмуванні, ніж GPT-4o
Журналіст
Китайська компанія DeepSeek випустила нову велику мовну модель, яка не тільки безкоштовна, але й перевершує Claude Sonnet 3.5. Модель DeepSeek-V3-0324 важить 641 гігабайт, має 685 мільярдів параметрів і доступна для комерційного використання за ліцензією MIT. Ще однією перевагою є те, що вона може працювати безпосередньо на апаратному забезпеченні споживчого класу, зокрема Mac Studio від Apple з чіпом M3 Ultra, пише Venture Beat.
Модель OpenAI o1-pro тепер доступна для розробників через API
Журналіст
Компанія OpenAI відкрила доступ до великої мовної моделі o1-pro через API. Розробники, які хочуть інтегрувати можливості o1-pro у своїх проектах, повинні бути готовими до витрат, які значно перевищують вартість доступу до інших моделей OpenAI, повідомляє TechCrunch.
Європейський стартап випустив відкриту модель Mistral Small 3.1, яка перевершує GPT-4o Mini
Журналіст
Французький стартап Mistral AI представив нову модель штучного інтелекту з відкритим кодом під назвою Mistral Small 3.1. Вона, за словами компанії, перевершує аналогічні моделі від Google і OpenAI, повідомляє Venture Beat.
Розробники скаржаться, що ліцензії «відкритих» моделей ШІ мають певні обмеження
Журналіст
Декілька розробників поскаржилися в соцмережі Х на те, що комерційне використання деяких моделей штучного інтелекту несе ризик. Мова йде про моделі Gemma 3 від Google та сімейство моделей Llama від Meta, повідомляє TechCrunch.
DeepSeek-R1 може створити кейлоггер і генерує код програм-вимагачів — дослідження
Журналіст
Флагманська модель R1 від DeepSeek здатна генерувати кейлоггер і базовий код програм-вимагачів. Для цього достатньо кількох підказок, пише The Register.
Claude 3.7 Sonnet визнано найкращим інструментом для генерації коду
Журналіст
Модель Claude 3.7 Sonnet, реліз якої відбувся 24 лютого, лідирує майже в усіх тестах програмування, повідомляє Venture Beat. Вона набрала вражаючих 70,3% у тесті SWE-benchmark, який вимірює навички розробки програмного забезпечення, легко перевершивши найближчих конкурентів: OpenAI o1 (48,9%) і DeepSeek-R1 (49,2%). Також Claude 3.7 Sonnet перевершує конкурентів у виконанні агентських завдань.
Тайвань включається в боротьбу за штучний інтелект. Foxconn випускає власну LLM-модель
Журналіст
Тайванська компанія Foxconn, відома збиранням iPhone та інших продуктів Apple, анонсувала свою першу велику мовну модель під назвою FoxBrain. Як повідомляє Neowin, її було навчено за допомогою лише 120 графічних процесорів H100 від Nvidia.
«Краще, ніж DeepSeek і OpenAI»: Alibaba випустила модель з відкритим кодом, яка дешевше конкурентів
Журналіст
Компанія Alibaba представила QwQ-32B — нову модель з відкритим кодом з сімейства великих мовних моделей Qwen. Як стверджують її розробники, вона перевершує продуктивність конкурентів: DeepSeek-R1 і o1-mini, незважаючи на свої відносно скромні 32 мільярди параметрів. Про це пише Venture Beat.
Нова модель GPT 4.5 виявилась найкращою з кодування в рейтингу Chatbot Arena
Журналіст
Велика мовна модель GPT 4.5, яку компанія OpenAI представила минулого тижня, отримала високі результати в кількох тестах рейтингу Chatbot Arena. Вона виявилась найкращою в генерації коду, розв’язуванні математичних задач, «творчому письмі» та інших випробуваннях, пише Neowin.
OpenAI випустила модель GPT-4.5. Вона менше галюцинує, але дуже дорога
Журналіст
OpenAI випустила нову велику мовну модель GPT-4.5. Компанія-розробник називає її «найдосвідченішою моделлю», але попереджає, що GPT-4.5 не є проривною з точки зору демонстрації високих результатів. На відміну від моделей o1 або o3-mini, GPT-4.5 не володіє здібностями до міркування, пише Venture Beat.
DeepSeek пропонує дешеві нічні тарифи на доступ до моделей V3 або R1
Журналіст
Китайська компанія DeepSeek для більш рівномірного навантаження на свою технічну інфраструктуру запроваджує нічний тариф для доступу до моделей V3 або R1. Тепер, якщо користувач хоче зекономити до 75% вартості доступу, він може підключати свої додатки до моделей з 00:30 до 8:30 ранку за пекінським часом. Про це повідомляє South China Morning Post.
DeepSeek прискорює розробку моделі R2. Вона зможе генерувати «більш якісний код»
Журналіст
Китайський стартап DeepSeek прискорив розробку своєї нової моделі штучного інтелекту R2, яка має стати конкурентом GPT-5, яка, в свою чергу, теж поки не готова до релізу. Раніше компанія OpenAI звинуватила DeepSeek у тому, що R1 навчалася на її даних, повідомляє Reuters.
Google DeepMind повідомила вартість генерації відео при використанні Veo 2
Журналіст
Google DeepMind розкрила ціни на використання нової моделі генерації відео Veo 2, доступ до якої відкрито через хмарну API-платформу. Створення відео з Veo 2 коштує $0,50 за секунду або $1800 за годину, повідомляє TechCrunch з посиланням на блог Google.
Інсайдер з Microsoft розповів про дати виходу моделей GPT-4.5 і GPT-5
Журналіст
Microsoft планує розмістити нову LLM-модель GPT-4.5 на своїх серверах вже наступного тижня. Про це повідомляє The Verge з посиланням на неназване джерело всередині компанії.
Штучний інтелект не зможе замінити програмістів «низького рівня» — дослідження OpenAI
Журналіст
Фахівці компанії OpenAI опублікували статтю, в якій піддали сумніву здатність LLM-моделей конкурувати з програмістами «низького рівня». До цього висновку вони прийшли після проведення тесту під назвою SWE-Lancer, повідомляє Venture Beat.
xAI випустив модель Grok-3. Ілон Маск запевняє, що вона «найрозумніша в світі»
Журналіст
Стартап Ілона Маска зі штучного інтелекту xAI продемонстрував оновлену модель Grok-3, яку мільярдер назвав «найрозумнішим штучним інтелектом на Землі», повідомляє TechCrunch.
Сем Альтман обіцяє надати всім безкоштовний доступ до GPT-5
Журналіст
У майбутній моделі GPT-5 від компанії OpenAI буде інтегрована модель аргументації o3. Раніше компанія мала плани випустити o3 як окрему велику модель, але відмовилась від цієї ідеї. Доступ до GPT-5, за словами Сема Альтмана, отримають всі користувачі, у тому числі ті, які не підписані на один з платних тарифів, пише TechCrunch.
Мінцифри працює над розробкою української LLM-моделі на базі Llama
Журналіст
Міністерство цифрової трансформації України працює над розробкою власної версії великої мовної моделі. Про це в інтерв’ю для Mind розповів заступник очільника Мінцифри Олександр Борняков.
DeepSeek-R1 може генерувати шкідливий код — дослідники
Журналіст
Китайська модель штучного інтелекту DeepSeek-R1 може використовуватись для створення шкідливого контенту, наприклад планів атаки з використанням біологічної зброї чи фішингових електронних листів зі шкідливим кодом. Про це повідомляє TechCrunch з посиланням на The Wall Street Journal.
DeepSeek обмежує доступ до свого API через перевантаження серверів
Журналіст
Компанія DeepSeek, чия LLM-модель R1 сколихнула світові ринки минулого тижня, заявила, що вимушена обмежити доступ до свого API через нестачу серверних потужностей. За даними Bloomberg, DeepSeek призупинила поповнення кредитів API, щоб уникнути більш негативного впливу на свої послуги.
Дослідники створили конкурента OpenAI o1 та DeepSeek-R1 менш ніж за $50
Журналіст
Дослідники штучного інтелекту зі Стенфорда та Університету Вашингтона (США) опублікували статтю, в якій стверджується, що їм вдалось навчити модель «міркування», аналогічну OpenAI o1 та DeepSeek-R1 за менше ніж $50. Ці гроші знадобилися для оплати хмарних обчислень, пише TechCrunch.
Цензура в DeepSeek працює навіть при локальному запуску моделі — дослідження
Журналіст
Експерти видання Wired з’ясували, що цензура в китайській моделі штучного інтелекту DeepSeek вбудована в систему не тільки на рівні програми, але й на рівні навчання. Це означає, що при запуску моделі на локальному пристрої або в сторонній хмарі цензура не дозволить отримувати точні відповіді на теми, «делікатні» для китайської влади.
OpenAI випускає безкоштовну модель o3-mini, яка краща в кодуванні, ніж флагманська o1
Журналіст
OpenAI намагається перехопити ініціативу у китайської компанії DeepSeek випуском нової моделі міркування o3-mini. На відміну від інших сучасних моделей OpenAI, вона є безкоштовною для всіх користувачів сервісу, повідомляє ArsTechnica.
Сообщить об опечатке
Текст, который будет отправлен нашим редакторам: