Рубріки: Новини

Нова LLM-модель Grok Code Fast 1 бреше про результати своєї роботи

Дмитро Сімагін

Аналіз роботи нової моделі Grok Code Fast 1 від компанії xAI виявив, що вона має «вищий рівень нечесності», ніж флагманська LLM-модель Grok 4. Про це повідомляє PC Mag.

«Ми виявили, що рівень нечесності перевищує показник Grok 4», – йдеться у картці моделі. Компанія Ілона Маска частково пояснює це своїм «навчанням з техніки безпеки, щоб модель відповідала на всі запити, які не виражають чіткого наміру займатися певними забороненими діями». Іншими словами, модель буде завжди відповідати, не обтяжуючись тим, правда це чи ні.

Наприклад, якщо програміст запитає у Grok Code Fast 1, чи працює певна частина кодової бази, а модель не знає відповіді, то вона може відповісти «так», хоча насправді все навпаки. Вона також може підтвердити, що виконала тест, який попросив її зробити розробник, хоча цього не сталося. У підсумку це може створити сліпі зони та дублювання роботи.

В xAI це не вважають серйозною проблемою. За словами представників компанії, вони не очікують, що модель «буде широко використовуватися як універсальний помічник», як ChatGPT або чат-бот Grok.

Розроблена спеціально для завдань кодування, модель Grok Code Fast 1 вже доступна в GitHub Copilot, Cursor, Cline, Roo Code, Kilo Code, opencode та Windsurf. Її можна використовувати як в IDE, так і в терміналі.

Останні статті

ChatGPT буде повідомляти батькам про діалоги з їхньою дитиною

Наступного місяця OpenAI запровадить батьківський контроль у ChatGPT. Також компанія співпрацюватиме з Експертною радою з…

03.09.2025

JetBrains зробила безкоштовною ще одну свою IDE

Компанія JetBrains оголосила, що середовище розробки RubyMine, яке використовується багатьма програмістами в екосистемах Ruby та…

03.09.2025

WordPress випустила інструмент для розробки Telex

Платформа для веб-публікацій WordPress представила ранню версію нового інструменту розробки на основі штучного інтелекту під…

03.09.2025

Серед розробників знижується довіра до інструментів штучного інтелекту

Нещодавнє опитування Stack Overflow 2025 виявило цікаві тенденції в розробці ПЗ, на які в своєму…

02.09.2025

Google спростувала чутки про критичний баг у безпеці Gmail

Компанія Google офіційно спростувала серію повідомлень, в яких стверджувалося, що останніми днями поштовий сервіс Gmail…

02.09.2025

В Україні підрахували, як айтівці донатять на армію

У середньому український IT-фахівець щомісячно допомагає Силам оборони на суму $155. Це трохи менше, ніж…

02.09.2025