Рубріки: Новини

Співзасновник OpenAI Карпати опублікував код відкритого клону ChatGPT

Дмитро Сімагін

Співзасновник OpenAI Андрей Карпати виклав у відкритий доступ код проекту NanoChat, який є open source форком ChatGPT. За його словами, це «кращий ChatGPT, який можна створити за $100». Репозиторій вже набрав на GitHub понад 7000 зірок.

Як запевняє Карпати, NanoChat створений на основі ChatGPT в єдиній кодовій базі на 8000 рядків з мінімальними залежностями. 

«Ви завантажуєте хмарний графічний процесор, запускаєте один скрипт, і вже через 4 години можете спілкуватися зі своєю LLM у веб-інтерфейсі, подібному до ChatGPT», — пише розробник.

NanoChat включає токенізацію, навчання, донавчання, оцінку, інференс та веб-інтерфейс, що дозволяє спілкуватися з моделлю прямо з браузера. Все працює на одному вузлі з 8 GPU H100 і запускається однією командою:

bash speedrun.sh

 

Навчання займає близько чотирьох годин і коштує приблизно $100 за оренду хмарного сервера Lambda Labs. Після цього можна відкрити локальний веб-інтерфейс і вести діалог з власною LLM-моделлю, як із ChatGPT. NanoChat поширюється під відкритою ліцензією MIT.

У міру подальшого масштабування витрат до ~$1000 (~41,6 години навчання) чат-бот швидко стає набагато більш розумним і може вирішувати прості математичні/кодові задачі та проходити тести з множинним вибором.

Репозиторій написаний в основному на Python (89%), з мінімальними вставками на Rust та HTML. NanoChat використовує просту пайплайн-архітектуру з підтримкою етапів pretraining, fine-tuning, evaluation та serving, а також вбудований сервер чату на Python (python -m scripts.chat_web). Результати навчання зберігаються у вигляді звітної таблиці з ключовими метриками (ARC, GSM8K, MMLU).

 

Останні статті

Microsoft припинила підтримку Windows 10. Користувачам пропонують три варіанти дій

Сьогодні Microsoft повністю припинила підтримку Windows 10. Випуск усіх оновлень для цієї операційної системи остаточно…

14.10.2025

Microsoft випускає свою першу модель для генерації зображень MAI-Image-1

Компанія Microsoft представила MAI-Image-1, свою першу внутрішньо розроблену LLM-модель для генерації зображень. Згідно з дописом…

14.10.2025

Vibe Checker — нова система оцінки коду від Google DeepMind

Дослідники Google DeepMind представили нову систему Vibe Checker, яка оцінює код, згенерований штучним інтелектом, за…

13.10.2025

Apple підвищує максимальну винагороду за знайдений баг до $5 мільйонів

Компанія Apple оновила програму винагород Security Bounty, вдвічі підвищивши максимальний розмір виплат за знайдені вразливості.…

13.10.2025

Київ увійшов у Топ-10 європейських міст за потенціалом розвитку штучного інтелекту

Київ увійшов до десятки міст Європи за потенціалом розвитку штучного інтелекту. Це стверджують результати «Аналізу…

13.10.2025

Microsoft посилює контроль над своїми розробниками. Вимагає більше використовувати Copilot

Microsoft додає контрольні показники використання Copilot до інструменту Viva Insights. Це дозволить менеджерам контролювати команди…

13.10.2025