Рубріки: Новини

ChatGPT вдвічі балакучіший, ніж Stack Overflow. Це може бути проблемою

Дмитро Сімагін

Середня відповідь LLM-моделі на запит, пов’язаний з кодом, становить близько 2000 символів, що набагато більше порівняно з 836 символами для типової відповіді на Stack Overflow. Це стверджують результати дослідження Університету Квінз (Канада), співробітники якого вивчили реальні діалоги розробників з ChatGPT, які містили 368 506 фрагментів коду більш ніж 20 мовами програмування.

Крім зайвого спалювання токенів, якість коду, згенерованого чат-ботами, викликає додаткове занепокоєння. Серед виявлених проблем були невизначені змінні у 75% фрагментів коду JavaScript, недійсні імена у 83% фрагментів коду Python (з невизначеними змінними у 31%), відсутні заголовки у 41% коду C++, відсутні обов’язкові коментарі у 76% фрагментів Java та невирішені простори імен у 49% виводів C#. Ці синтаксичні помилки були не єдиною проблемою: поширеними були також проблеми з підтримкою та стилем.

«Я думаю, що це велика проблема, що в згенерованому коді багато недоліків», — сказала один з авторів дослідження Сучжен Чжун, дослідниця з Університету Королеви в Кінгстоні, Канада. Вона особливо стурбована ризиком розгортання дефектного коду у великомасштабному реальному проекті. 

Усі ці проблеми не означають, що помічники штучного інтелекту непридатні для використання. Насправді, Чжун є прихильницею цих інструментів у власній роботі. «Я часто використовую LLM для генерації коду», — каже вона. 

Її практична порада щодо того, як використовувати ефективність штучного інтелекту, одночасно виправляючи недоліки, проста: проведіть статичний аналіз генерованого коду та внесіть діагностичні дані назад у наступний запит. Дослідниця також каже, що частково проблема полягає в неконкретних запитах. «Розробники повинні дуже чітко розуміти свою інженерію запитів», — додає Чжун.

Останні статті

Amazon викрила IT-фахівця з КНДР завдяки мілісекундам затримки при натисканні клавіатури

Північнокорейського самозванця, який віддалено працював системним адміністратором в американському Amazon, викрили після того, як затримка…

19.12.2025

В українському IT на третину поменшало початківців

Вітчизняна IT-галузь демонструє ознаки повільного зростання після суттєвого падіння показників у 2022-23 роках. Наприкінці 2025…

19.12.2025

Після обурення спільноти GitHub відмовляється від плану стягувати плату за self-hosted раннери

Не минуло й двох діб після того, як GitHub оголосив про запровадження з 1 березня…

19.12.2025

JetBrains випустила Kotlin 2.3.0. Реліз має експериментальні функції та підтримку Java 25

JetBrains випустила загальнодоступне останнє оновлення мови програмування Kotlin 2.3.0. Новий реліз має низку експериментальних функцій,…

19.12.2025

Нову модель GPT-5.2-Codex від OpenAI названо «найдосконалішим інструментом для реальної розробки»

Компанія OpenAI офіційно представила GPT-5.2-Codex — нову модель, яку названо «найдосконалішим інструментом для реальної розробки…

19.12.2025

Мінфін все ж таки готується ввести ПДВ для ФОП третьої групи

Міністерство фінансів України опублікувало законопроект про введення ПДВ для ФОП 1-3 груп. Прогнозується, що нові…

18.12.2025