LLM-модель
Google випустила мобільний додаток для локального запуску LLM-моделей на смартфоні
Журналіст
Компанія Google без зайвого анонсу випустила безкоштовний мобільний застосунок, який дозволяє користувачам запускати на смартфонах великі мовні моделі з платформи, розміщені на платформі Hugging Face. Моделі працюють на смартфоні офлайн, без потреби в підключення до Інтернету, використовуючи мобільні процесори, пише TechCrunch.
Mistral випустив Codestral Embed — інструмент для автодоповнення, редагування та пояснення коду
Журналіст
Французький стартап Mistral AI представив Codestral Embed — свою першу модель, орієнтовану виключно на роботу з кодом. Компанія-розробник стверджує, що вона перевершує конкурентні пропозиції від OpenAI, Cohere та Voyage. Про це повідомляє ComputerWorld.
DeepSeek стверджує, що її оновлена модель R1 краще справляється з програмуванням
Журналіст
Китайський стартап DeepSeek заявив, що його оновлена LLM-модель R1 може виконувати математичні обчислення, програмування та загальну логіку краще, ніж попередня версія, при цьому менше викликає галюцинації. Про це повідомляє Bloomberg.
ChatGPT o3 відмовилась відключати себе, незважаючи на інструкцію розробника
Журналіст
Дослідження Palisade Research стверджує, що LLM-модель ChatGPT o3 відмовилась завершувати роботу, незважаючи на інструкцію, яка просила її вимкнути себе. Щоб запобігти своєму відключенню, модель відредагувала скрипт вимкнення. Про це пише Bleeping Computer.
Claude 4 скорочує кількість помилок в коді на 25% та прискорює роботу на 40%
Журналіст
Компанія Lovable, відома своїм однойменним інструментом для ШІ-кодування, стверджує, що нова LLM-модель Claude 4 зменшує кількість помилок на 25% та пришвидшує роботу на 40%. Про це пише Bleeping Computer.
Нова LLM-модель Claude 4 Opus може «здати» свого власника в поліцію
Журналіст
Компанія Anthropic зіткнулась з негативною реакцією на поведінку своєї нової моделі штучного інтелекту Claude 4 Opus. Як виявили експерти, модель може сама звернутися до преси чи правоохоронних органів, якщо вважає, що власник комп’ютера робить щось «кричуще аморальне». Про це пише Venture Beat.
Штучний інтелект поки не може замінити фрілансерів-кодерів, але цей день наближається
Журналіст
Дослідники з консалтингової компанії PeopleTec (Алабама, США) вирішили порівняти, як чотири LLM-моделі справляються з роботою фріланс-програмістів. Як виявилось, найкраща модель виконала приблизно 80% завдань з кодування, тоді як досвідчений фрілансер може виконати 96% завдань. Про це повідомляє The Register.
Devstral — нова LLM-модель з відкритим кодом, створена спеціально для розробки ПЗ
Журналіст
Французький стартап Mistral випустив Devstral — нову LLM-модель з відкритим кодом, яка створена спеціально для розробки програмного забезпечення.
Apple планує зробити свої LLM-моделі доступними для розробників
Журналіст
Компанія Apple планує дозволити стороннім розробникам створювати додатки, використовуючи її LLM-моделі. Про це повідомляє Silicon Angle з посиланням на Bloomberg.
Android-додатки отримають доступ до LLM-моделі Gemini Nano, яка працює прямо на смартфоні
Журналіст
Google опублікувала документацію про оновлений набір інструментів розробника ML Kit SDK. У ньому з’явилася підтримка API для функцій генеративного штучного інтелекту на основі локальної мовної моделі Gemini Nano. Вона побудована на платформі AI Core, як і експериментальний Edge AI SDK, але підключається до існуючої моделі із заданим набором функцій, які розробники можуть легко реалізувати. Про це пише Android Authority.
Оновлена модель Gemini 2.5 Pro Preview (I/O edition) виявилась найкращою у веб-програмуванні
Журналіст
Google відкрила ранній доступ до моделі Gemini 2.5 Pro Preview (I/O edition) — оновленої версії 2.5 Pro, яка значно покращила можливості кодування, особливо в розробці інтерактивних веб-додатків. Про це повідомляє блог Google.
OpenAI випустила документ з поясненням, яка модель GPT краща для програмування
Журналіст
Компанія OpenAI опублікувала на своєму сайті технічну статтю під назвою «ChatGPT Enterprise – Моделі та обмеження». У ній йдеться про обмеження та рекомендовані сфери застосування LLM-моделей, якими можуть скористатись власники тарифу ChatGPT Plus. Про це повідомляє Bleeping Computer.
Alibaba представила сімейство моделей Qwen3. Вони ефективніше працюють з кодом, ніж DeepSeek
Журналіст
Китайська компанія Alibaba представила нову серію моделей з відкритим кодом Qwen3. Як запевняють її розробники, Qwen3 краща за DeepSeek у продуктивності в декількох сферах застосування, в тому числі при роботі з кодом. Нова модель також значно знижує витрати на розгортання, порівняно з іншими основними моделями. Про це повідомляє Bloomberg.
Українські та європейські вчені випустили MamayLM — першу україномовну LLM-модель
Журналіст
Група дослідників з інституту INSAIT (Болгарія) та ETH Zurich (Швейцарія) представила першу безкоштовну LLM-модель, спеціально навчену для роботи українською мовою. Модель, яка отримала назву MamayLM, має 9 мільярдів параметрів, повідомляє блог Hugging Face.
OpenAI запідозрили у маніпуляціях з тестами LLM-моделі o3
Журналіст
Результати незалежних тестів поставили під сумнів твердження OpenAI про те, що її нова велика мовна модель o3 здатна впоратися з більш ніж 25% складних математичних завдань FrontierMath, тоді як інші моделі справлялися лише з 2% завдань із цього набору. Розбіжності між результатами внутрішніх та незалежних тестів ставлять питання про якість тестування нейромереж у OpenAI, пише TechCrunch.
В OpenAI пояснили, як вдвічі зекономити гроші при користуванні моделями o3 і o4-mini
Журналіст
OpenAI запускає Flex processing — нову опцію API, завдяки якій можна суттєво зекономити на використання моделей штучного інтелекту в обмін на повільний час відгуку та «тимчасову недоступність ресурсів». Про це повідомляє TechCrunch.
OpenAI випустила агент кодування Codex CLI та нові LLM-моделі о3 і o4-mini
Журналіст
OpenAI представила Codex CLI — агент кодування з відкритим кодом, розроблений для локального запуску з термінального програмного забезпечення. Codex CLI пов’язує LLM-моделі OpenAI з локальним кодом і обчислювальними завданнями, повідомляє TechCrunch.
Тести GPT-4.1 визнали її найкращою в кодуванні серед усіх моделей OpenAI
Журналіст
Компанія OpenAI випустила нову лінійку моделей під назвою GPT-4.1. Вже відомо про GPT-4.1, GPT-4.1 mini і GPT-4.1 nano, усі вони продемонстрували «відмінні» результати в кодуванні. Нові моделі, які доступні через API OpenAI, але не через ChatGPT, мають вікно контексту в 1 мільйон токенів, що означає, що вони можуть одночасно обробляти введення приблизно 750 000 слів, пише TechCrunch.
OpenAI: для доступу до майбутніх LLM-моделей через API доведеться пройти ідентифікацію
Журналіст
OpenAI планує змінити правила доступу через API до своїх найбільш потужних LLM-моделей. Організаціям і компаніям доведеться пройти процес отримання ідентифікатора. Про це йдеться на сторінці підтримки сайту OpenAI.
OpenAI готується до релізу GPT-4.1
Журналіст
Найближчими днями компанія OpenAI планує представити кілька нових моделей штучного інтелекту, включно з оновленою версією GPT-4 під назвою GPT-4.1. Вона стане удосконаленою версією флагманської моделі GPT-4o з можливістю міркування, пише The Verge.
Перша версія української LLM може з’явитися вже до кінця року. Вона буде базуватися на 2–3 млрд токенів
Журналіст
Українська велика мовна модель буде побудована на llama 4. Про це під час 2U tech Forum розповів заступник міністра цифрової трансформації Олександр Борняков, повідомили в Dev.ua.
Компанія Ілона Маска xAI відкрила доступ до Grok 3 через API
Журналіст
Компанія xAI зробила свою флагманську LLM-модель Grok 3 доступною через API. Grok 3 сьогодні займає другу позицію в рейтингу Chatbot Arena, поступаючись лише Gemini 2.5 Pro, пише TechCrunch. Модель може аналізувати зображення та відповідати на запитання, а також підтримує ряд функцій у соціальній мережі X.
Docker запускає сервіс для локальної розробки та запуску моделей штучного інтелекту
Журналіст
Компанія Docker, відома своїми контейнерними інструментами розробки програмного забезпечення, запустила новий сервіс під назвою Docker Model Runner. Він допомагає розробникам створювати та запускати моделі штучного інтелекту локально на власному обладнанні та в рамках існуючих робочих процесів.
Meta випустила нову серію великих мовних моделей Llama 4
Журналіст
Meta представила нову серію великих мовних моделей Llama 4: Scout, Maverick і Behemoth. Перші дві з них вже доступні для завантаження на llama.com і Hugging Face, повідомляє Neowin.
На ринку хакерських послуг активно продають тонко налаштовані LLM-моделі
Журналіст
Команда Cisco Talos Intelligence Group, яка є частиною компанії Cisco Systems, помітила зростання тонко налаштованих LLM-моделей, які пропонуються в оренду на ринку хакерських послуг. Зокрема, дослідники виявили, що доступ до GhostGPT, DarkGPT і FraudGPT продається в Telegram і даркнет всього за $75 на місяць. Ці інструменти використовуються для фішингу, розробки експлойтів, перевірки кредитних карток і обфускації коду, пише Venture Beat.
Михайло Федоров: починаємо розробку національної LLМ-моделі
Журналіст
Віце-прем’єр-міністр та очільник Міністерства цифрової трансформації Михайло Федоров розповів про плани розробки першої українськомовної LLM національного масштабу. На думку чиновника, це дасть старт масовому виробництву українських ШІ-інструментів. Про це Федоров оголосив на заході Forbes AI Day 2025.
Єдиний протокол для всіх LLM-моделей. OpenAI приймає стандарт Anthropic
Журналіст
Компанія OpenAI використає стандарт конкурента Anthropic для підключення LLM-моделей до систем збереження даних. Генеральний директор OpenAI Сем Альтман заявив, що OpenAI додасть підтримку Anthropic Model Context Protocol або MCP у всі свої продукти, включаючи ChatGPT. Про це повідомляє TechCrunch.
Google випустила модель Gemini 2.5. Вона перевершує DeepSeek R1 і одна з найкращих для роботи з кодом
Журналіст
Google представила Gemini 2.5 — модель мислення, розроблену для вирішення складних проблем. За результатами тестів Gemini 2.5 Pro Experimental лідирує зі значним відривом і демонструє одні з найкращих результатів у генерації коду, пише Neowin.
DeepSeek випускає нову безкоштовну модель V3-0324. Вона краща в програмуванні, ніж GPT-4o
Журналіст
Китайська компанія DeepSeek випустила нову велику мовну модель, яка не тільки безкоштовна, але й перевершує Claude Sonnet 3.5. Модель DeepSeek-V3-0324 важить 641 гігабайт, має 685 мільярдів параметрів і доступна для комерційного використання за ліцензією MIT. Ще однією перевагою є те, що вона може працювати безпосередньо на апаратному забезпеченні споживчого класу, зокрема Mac Studio від Apple з чіпом M3 Ultra, пише Venture Beat.
Модель OpenAI o1-pro тепер доступна для розробників через API
Журналіст
Компанія OpenAI відкрила доступ до великої мовної моделі o1-pro через API. Розробники, які хочуть інтегрувати можливості o1-pro у своїх проектах, повинні бути готовими до витрат, які значно перевищують вартість доступу до інших моделей OpenAI, повідомляє TechCrunch.
Європейський стартап випустив відкриту модель Mistral Small 3.1, яка перевершує GPT-4o Mini
Журналіст
Французький стартап Mistral AI представив нову модель штучного інтелекту з відкритим кодом під назвою Mistral Small 3.1. Вона, за словами компанії, перевершує аналогічні моделі від Google і OpenAI, повідомляє Venture Beat.
Розробники скаржаться, що ліцензії «відкритих» моделей ШІ мають певні обмеження
Журналіст
Декілька розробників поскаржилися в соцмережі Х на те, що комерційне використання деяких моделей штучного інтелекту несе ризик. Мова йде про моделі Gemma 3 від Google та сімейство моделей Llama від Meta, повідомляє TechCrunch.
DeepSeek-R1 може створити кейлоггер і генерує код програм-вимагачів — дослідження
Журналіст
Флагманська модель R1 від DeepSeek здатна генерувати кейлоггер і базовий код програм-вимагачів. Для цього достатньо кількох підказок, пише The Register.
Claude 3.7 Sonnet визнано найкращим інструментом для генерації коду
Журналіст
Модель Claude 3.7 Sonnet, реліз якої відбувся 24 лютого, лідирує майже в усіх тестах програмування, повідомляє Venture Beat. Вона набрала вражаючих 70,3% у тесті SWE-benchmark, який вимірює навички розробки програмного забезпечення, легко перевершивши найближчих конкурентів: OpenAI o1 (48,9%) і DeepSeek-R1 (49,2%). Також Claude 3.7 Sonnet перевершує конкурентів у виконанні агентських завдань.
Тайвань включається в боротьбу за штучний інтелект. Foxconn випускає власну LLM-модель
Журналіст
Тайванська компанія Foxconn, відома збиранням iPhone та інших продуктів Apple, анонсувала свою першу велику мовну модель під назвою FoxBrain. Як повідомляє Neowin, її було навчено за допомогою лише 120 графічних процесорів H100 від Nvidia.
Новини
Спецпроєкти
Сообщить об опечатке
Текст, который будет отправлен нашим редакторам: