Рубріки: Новини

Співзасновник OpenAI Карпати опублікував код відкритого клону ChatGPT

Дмитро Сімагін

Співзасновник OpenAI Андрей Карпати виклав у відкритий доступ код проекту NanoChat, який є open source форком ChatGPT. За його словами, це «кращий ChatGPT, який можна створити за $100». Репозиторій вже набрав на GitHub понад 7000 зірок.

Як запевняє Карпати, NanoChat створений на основі ChatGPT в єдиній кодовій базі на 8000 рядків з мінімальними залежностями. 

«Ви завантажуєте хмарний графічний процесор, запускаєте один скрипт, і вже через 4 години можете спілкуватися зі своєю LLM у веб-інтерфейсі, подібному до ChatGPT», — пише розробник.

NanoChat включає токенізацію, навчання, донавчання, оцінку, інференс та веб-інтерфейс, що дозволяє спілкуватися з моделлю прямо з браузера. Все працює на одному вузлі з 8 GPU H100 і запускається однією командою:

bash speedrun.sh

 

Навчання займає близько чотирьох годин і коштує приблизно $100 за оренду хмарного сервера Lambda Labs. Після цього можна відкрити локальний веб-інтерфейс і вести діалог з власною LLM-моделлю, як із ChatGPT. NanoChat поширюється під відкритою ліцензією MIT.

У міру подальшого масштабування витрат до ~$1000 (~41,6 години навчання) чат-бот швидко стає набагато більш розумним і може вирішувати прості математичні/кодові задачі та проходити тести з множинним вибором.

Репозиторій написаний в основному на Python (89%), з мінімальними вставками на Rust та HTML. NanoChat використовує просту пайплайн-архітектуру з підтримкою етапів pretraining, fine-tuning, evaluation та serving, а також вбудований сервер чату на Python (python -m scripts.chat_web). Результати навчання зберігаються у вигляді звітної таблиці з ключовими метриками (ARC, GSM8K, MMLU).

 

Останні статті

У КПІ будуть викладати «Програмування комп’ютерних ігор» за підтримки GSC Game World

Київський політехнічний інститут (КПІ) та найвідоміша українська геймдев-студія GSC Game World, розробник гри S.T.A.L.K.E.R. 2:…

28.11.2025

Хакери модифікували GPT для розробки шкідливих скриптів та проведення фішингових атак

Дослідники Unit42 з Palo Alto Networks проаналізували дві кастомні LLM-моделі, створені на базі GPT: WormGPT…

28.11.2025

Команда мови програмування Zig відмовляється від GitHub на користь Codeberg

Репозиторій мови Zig мігрує з GitHub до Codeberg, некомерційної компанії з хостингу Git, яка базується…

28.11.2025

Google обмежує безкоштовний доступ до Gemini 3 Pro через «високий попит»

Google запроваджує обмеження для безкоштовних користувачів на доступ до LLM-моделі Gemini 3 Pro та генератора…

28.11.2025

Українським IT-фахівцям треба готуватись до збільшення податків: уряд погодився на умови МВФ

Кабінет міністрів України погодився з пропозицією скасувати податкові пільги в обмін на новий пакет фінансування…

28.11.2025

Microsoft працює над новим способом оновлення програм із Microsoft Store

Останні preview-збірки Windows 11 демонструють, що Microsoft готує новий спосіб оновлення програм з каталогу Microsoft…

27.11.2025