Рубріки: Новини

52% неточностей, часто не розуміє суті питань: ChatGPT завалив тести Stack Overflow

Ігор Шелудченко

ChatGPT може давати відповіді на прості питання чи допомагати в кодуванні, але дослідники вважають що йому треба суттєво покращити свої навички кодування.

Про це йдеться в дослідженні Університета Пердю, повідомляє PC.mag.

В рамках дослідження ChatGPT давав відповіді на 517 різних запитань від Stack Overflow.

І ці результати виявилися приголомшливими.

«Наше дослідження показало, що 52% відповідей ChatGPT містять неточності, а 77% — багатослівні», — написали дослідники в статті, яка опублікована на сайті університету.

Ще більше дослідників здивувало те, що 54% ​​помилок, зроблених чат-ботом, повязані з тим, що він не розуміє суті запитання, яке йому задають.

У випадках, коли він розумів запитання, йому часто було важко дати правильну відповідь. Все це підкреслює важливість перевірки фактів у відповідях ChatGPT.

«У багатьох випадках ми бачили, як ChatGPT давав відповідь, код або формулу, не передбачаючи наслідки та не думаючи про конкретні результати», — заявили вони.

Тим не менш, ChatGPT може бути досить корисний при програмуванні. У лютому Google передав ChatGPT питання для співбесіди з програмування і чатбот успішно склав іспит на позицію джуна-девелопера.

Зазначимо, що за останні півтора роки трафік на популярному в середовизі програмістів сайті Stack Overflow впав приблизно на 35%. При цьому помітне падіння почалося після релізу ШІ-чатбота ChatGPT.

Зазначимо, згідно з останніми дослідженнями, менш ніж за 10 років ринок генеративного штучного інтелекту може досягнути об’єму в $1,3 трлн.

Читайте також:

«ШІ створює ризики вимирання, як і ядерна війна»: Сем Альтман з OpenAI та 350 науковців підписали нову заяву

Білл Гейтс прогнозує смерть Google і Amazon: їх замінить персональний ШІ-помічник

«Хрещений батько ШІ» покаявся та пішов з Google: тепер він попереджає про небезпеку

Останні статті

Brave1 продовжили прийняття заявок на конкурс Battle Proven для deftech-стартапів

Кластер Brave1 продовжив прийняття заявок на конкурс Battle Proven — тепер податися можна до 25 липня 2025 року. Про це…

21.07.2025

Експериментальна LLM-модель OpenAI досягла рівня переможця Міжнародної математичної олімпіади

Експериментальна модель OpenAI досягла рівня золотої медалі на Міжнародній математичній олімпіаді (IMO), вирішивши п'ять із…

21.07.2025

JetBrains переводить всі продукти IntelliJ IDEA на єдиний інсталятор

Компанія JetBrains повідомила, що всі програмні продукти серії IntelliJ IDEA відтепер переходять на єдиний уніфікований…

21.07.2025

Українські кіберфахівці викрили намагання росіян використати LLM-модель для атак на держустанови

Команда реагування на комп'ютерні надзвичайні ситуації України (CERT-UA) розкрила деталі фішингової кампанії, спрямованої на поширення…

21.07.2025

Hugging Face представляє AnyCoder — безкоштовний інструмент для веб-розробки без знання мов програмування

Платформа Hugging Face представляє AnyCoder — середовище для розробки веб-додатків з відкритим кодом. Новий інструмент,…

21.07.2025

Intel припинила 10-річний проект розробки власного дистрибутиву Linux

Компанія Intel оголосила про згортання проекту Clear Linux, робота над яким тривала 10 років. Метою…

21.07.2025