Співзасновник OpenAI Карпати опублікував код відкритого клону ChatGPT
Співзасновник OpenAI Андрей Карпати виклав у відкритий доступ код проекту NanoChat, який є open source форком ChatGPT. За його словами, це «кращий ChatGPT, який можна створити за $100». Репозиторій вже набрав на GitHub понад 7000 зірок.
Як запевняє Карпати, NanoChat створений на основі ChatGPT в єдиній кодовій базі на 8000 рядків з мінімальними залежностями.
«Ви завантажуєте хмарний графічний процесор, запускаєте один скрипт, і вже через 4 години можете спілкуватися зі своєю LLM у веб-інтерфейсі, подібному до ChatGPT», — пише розробник.
NanoChat включає токенізацію, навчання, донавчання, оцінку, інференс та веб-інтерфейс, що дозволяє спілкуватися з моделлю прямо з браузера. Все працює на одному вузлі з 8 GPU H100 і запускається однією командою:
bash speedrun.sh
Навчання займає близько чотирьох годин і коштує приблизно $100 за оренду хмарного сервера Lambda Labs. Після цього можна відкрити локальний веб-інтерфейс і вести діалог з власною LLM-моделлю, як із ChatGPT. NanoChat поширюється під відкритою ліцензією MIT.
У міру подальшого масштабування витрат до ~$1000 (~41,6 години навчання) чат-бот швидко стає набагато більш розумним і може вирішувати прості математичні/кодові задачі та проходити тести з множинним вибором.
Репозиторій написаний в основному на Python (89%), з мінімальними вставками на Rust та HTML. NanoChat використовує просту пайплайн-архітектуру з підтримкою етапів pretraining, fine-tuning, evaluation та serving, а також вбудований сервер чату на Python (python -m scripts.chat_web). Результати навчання зберігаються у вигляді звітної таблиці з ключовими метриками (ARC, GSM8K, MMLU).
Сьогодні Microsoft повністю припинила підтримку Windows 10. Випуск усіх оновлень для цієї операційної системи остаточно…
Компанія Microsoft представила MAI-Image-1, свою першу внутрішньо розроблену LLM-модель для генерації зображень. Згідно з дописом…
Дослідники Google DeepMind представили нову систему Vibe Checker, яка оцінює код, згенерований штучним інтелектом, за…
Компанія Apple оновила програму винагород Security Bounty, вдвічі підвищивши максимальний розмір виплат за знайдені вразливості.…
Київ увійшов до десятки міст Європи за потенціалом розвитку штучного інтелекту. Це стверджують результати «Аналізу…
Microsoft додає контрольні показники використання Copilot до інструменту Viva Insights. Це дозволить менеджерам контролювати команди…