Рубріки: Новини

ChatGPT вдвічі балакучіший, ніж Stack Overflow. Це може бути проблемою

Дмитро Сімагін

Середня відповідь LLM-моделі на запит, пов’язаний з кодом, становить близько 2000 символів, що набагато більше порівняно з 836 символами для типової відповіді на Stack Overflow. Це стверджують результати дослідження Університету Квінз (Канада), співробітники якого вивчили реальні діалоги розробників з ChatGPT, які містили 368 506 фрагментів коду більш ніж 20 мовами програмування.

Крім зайвого спалювання токенів, якість коду, згенерованого чат-ботами, викликає додаткове занепокоєння. Серед виявлених проблем були невизначені змінні у 75% фрагментів коду JavaScript, недійсні імена у 83% фрагментів коду Python (з невизначеними змінними у 31%), відсутні заголовки у 41% коду C++, відсутні обов’язкові коментарі у 76% фрагментів Java та невирішені простори імен у 49% виводів C#. Ці синтаксичні помилки були не єдиною проблемою: поширеними були також проблеми з підтримкою та стилем.

«Я думаю, що це велика проблема, що в згенерованому коді багато недоліків», — сказала один з авторів дослідження Сучжен Чжун, дослідниця з Університету Королеви в Кінгстоні, Канада. Вона особливо стурбована ризиком розгортання дефектного коду у великомасштабному реальному проекті. 

Усі ці проблеми не означають, що помічники штучного інтелекту непридатні для використання. Насправді, Чжун є прихильницею цих інструментів у власній роботі. «Я часто використовую LLM для генерації коду», — каже вона. 

Її практична порада щодо того, як використовувати ефективність штучного інтелекту, одночасно виправляючи недоліки, проста: проведіть статичний аналіз генерованого коду та внесіть діагностичні дані назад у наступний запит. Дослідниця також каже, що частково проблема полягає в неконкретних запитах. «Розробники повинні дуже чітко розуміти свою інженерію запитів», — додає Чжун.

Останні статті

Вайб-кодування переходить на новий рівень: Google AI Studio стає повноцінним браузерним IDE

Google оголосила про масштабне оновлення AI Studio. Замість браузерної платформи для експериментів з моделями Gemini…

20.03.2026

Composer 2: в Cursor додали модель, яка випереджає Claude Opus 4.6

Стартап Anysphere, відомий своїм агентним редактором коду Cursor, представив оновлену модель кодування під назвою Composer…

20.03.2026

Anthropic запускає «вбивцю OpenClaw» — Claude Code Channels

Компанія Anthropic анонсувала новий інструмент Claude Code Channels, який вже встигли назвати «вбивцею OpenClaw». Завдяки…

20.03.2026

Google залишить можливість встановлювати неперевірені Android-додатки. Але з «режимом очікування»

Google додає роз'яснення щодо свого майбутнього плану посилити контроль над екосистемою Android. Починаючи з березня…

20.03.2026

Хакери використовують критичну вразливість Zimbra для атак на українські державні установи

Хакерське угруповання APT28 (також відоме як Fancy Bear або Strontium), яке пов’язують із російським ГРУ,…

20.03.2026

ChatGPT, браузер та Codex об’єднають в єдину суперпрограму для ПК

OpenAI планує об'єднати свій додаток ChatGPT, платформу кодування Codex та браузер в одну «суперпрограму» для…

20.03.2026