Рубріки: Новини

52% неточностей, часто не розуміє суті питань: ChatGPT завалив тести Stack Overflow

Ігор Шелудченко

ChatGPT може давати відповіді на прості питання чи допомагати в кодуванні, але дослідники вважають що йому треба суттєво покращити свої навички кодування.

Про це йдеться в дослідженні Університета Пердю, повідомляє PC.mag.

В рамках дослідження ChatGPT давав відповіді на 517 різних запитань від Stack Overflow.

І ці результати виявилися приголомшливими.

«Наше дослідження показало, що 52% відповідей ChatGPT містять неточності, а 77% — багатослівні», — написали дослідники в статті, яка опублікована на сайті університету.

Ще більше дослідників здивувало те, що 54% ​​помилок, зроблених чат-ботом, повязані з тим, що він не розуміє суті запитання, яке йому задають.

У випадках, коли він розумів запитання, йому часто було важко дати правильну відповідь. Все це підкреслює важливість перевірки фактів у відповідях ChatGPT.

«У багатьох випадках ми бачили, як ChatGPT давав відповідь, код або формулу, не передбачаючи наслідки та не думаючи про конкретні результати», — заявили вони.

Тим не менш, ChatGPT може бути досить корисний при програмуванні. У лютому Google передав ChatGPT питання для співбесіди з програмування і чатбот успішно склав іспит на позицію джуна-девелопера.

Зазначимо, що за останні півтора роки трафік на популярному в середовизі програмістів сайті Stack Overflow впав приблизно на 35%. При цьому помітне падіння почалося після релізу ШІ-чатбота ChatGPT.

Зазначимо, згідно з останніми дослідженнями, менш ніж за 10 років ринок генеративного штучного інтелекту може досягнути об’єму в $1,3 трлн.

Читайте також:

«ШІ створює ризики вимирання, як і ядерна війна»: Сем Альтман з OpenAI та 350 науковців підписали нову заяву

Білл Гейтс прогнозує смерть Google і Amazon: їх замінить персональний ШІ-помічник

«Хрещений батько ШІ» покаявся та пішов з Google: тепер він попереджає про небезпеку

Останні статті

Всюди брехня: розробник програми для обману на співбесідах визнав, що збрехав журналістам про свій дохід

Рой Лі, засновник вірусного стартапу Cluely, визнав, що збрехав журналістам про $7 мільйонів річного доходу.…

06.03.2026

Cursor запускає ще один інструмент агентного кодування — Automations

Популярний ШІ-редактор коду Cursor від компанії Anysphere робить наступний крок у розвитку агентного програмування. Новий…

06.03.2026

Нові функції «Дії»: бронювання працівників у розшуку та податкові знижки

У найближчі місяці в застосунку «Дія» з'явиться кілька нових функцій, в тому числі опція бронювання…

06.03.2026

X запускає новий варіант монетизації: «Ексклюзивні теми» з платним доступом

Соціальна мережа X анонсувала оновлення інструментів монетизації для авторів контенту. Основна зміна полягає в тому,…

06.03.2026

Зарплати українських розробників: наймів більше, але грошей менше

Статистичний аналіз зарплат українських розробників, найнятих на Djinni за три місяці зими, демонструє суперечливі дані.…

06.03.2026

«Вже не можу писати код вручну»: збій в роботі Claude викликав проблеми у деяких розробників

Коли цього тижня стався збій в роботі інструментів вайб-кодування Claude, деяким розробникам програмного забезпечення довелося…

06.03.2026