Рубріки: Новини

«Робохлопці-чат»: дата-саєнтист клонував своїх друзів за допомогою ШІ

Ігор Шелудченко

Фахівець з Data Science Іззі Міллер клонував груповий чат своїх найкращих друзів за допомогою моделі LLaMA від Meta.

Про подробиці чудернацького експерименту розповів The Verge.

Як з’явилися «Робохлопці»

Іззі Міллер завантажив 500 тис. повідомлень із семирічного групового чату, в якому спілкувалися шестеро друзів. Він відсортував повідомлення за авторами та спонукав модель відтворити особистість кожного учасника: Харві, Генрі, Вятта, Кібса, Люка та самого Міллера.

Задля обробки даних він обрав мовну модель LLaMA від Meta. Вона приблизно така ж потужна, як і модель GPT-3 від OpenAI.

Цікаво, що автор не подавав запит на користування мовною моделлю через офіційні канали, а просто скористався зливом на GitHub.

«Я побачив сценарій LLaMA і подумав, що це буде видалено з GitHub. Тож я зберіг його у текстовому файлі на робочому столі», — сказав він.

Сценарій дійсно був згодом видалений з Github.

Коли модель навчилася працювати з повідомленнями групового чату, Міллер підключив її до клону інтерфейсу користувача iMessage від Apple і надав доступ своїм друзям.  Як результат, вони всі змогли поспілкуватися між собою.

«Я був справді здивований тим, як модель дізналася про нас, а не тільки про те, як ми говоримо. Вона знає інформацію про те, з ким ми зустрічаємося, де ми ходили до школи, номер нашого будинку, де ми жили, тощо», — розповів він.

В чаті «робохлопці» ШІ досить вдало імітував поведінку та манеру спілкування реальних людей.

Недоліки

Але у ШІ є і суттєві недоліки. Серед головних — нерозуміння хронології.

ШІ не аналізує чат як щось цілісне — не звертає увагу на новини і оновлення — а на тільки на кількість повідомлень . Іншими словами, чим більше про щось говорять, тим більша ймовірність, що на це посилатимуться боти.

Одним із несподіваних результатів цього є те, що клони штучного інтелекту, як правило, діють так, ніби вони ще навчаються в коледжі, оскільки саме тоді груповий чат був найбільш активним.

Крім того, ШІ ще може плутати факти, які стосуються однієї людини та додавати їх до іншої.

До речі, усі технічні кроки, які необхідно зробити для повторення експерименту, він описав у себе в блозі. Тому повторити це зможе кожен бажаючий.

Читайте також:

Databricks випустила Dolly 2.0: це перша LLM з відкритим вихідним кодом для комерційного використання

Прискорюють розробку та підвищують безпеку: Google запускає сервіси для девелоперів Deps.dev и Assured OSS

Розробник створив програму Wolverine з GPT-4: cкрипти Python можуть самі себе «ремонтувати»

Останні статті

В Anthropic проаналізували роботу своїх програмістів, щоб дізнатись, які переваги дає штучний інтелект

В Anthropic провели внутрішнє опитування 132 програмістів та дослідників, 53 поглиблених інтерв'ю та проаналізували використання…

04.12.2025

AWS випустила три нові інструменти для покращення кодування на базі штучного інтелекту

На щорічній конференції Re:Invent, яка проходить цими днями в Лас-Вегасі, керівник AWS Метт Гарман оголосив…

04.12.2025

OpenAI готує реліз нової моделі Garlic, яка спеціалізується на кодуванні

Компанія OpenAI працює над новою LLM-моделлю Garlic («Часник»), яка спеціалізується на програмуванні та логічних завданнях.…

03.12.2025

Верховна Рада не буде підвищувати податки для ФОП третьої групи

Верховна Рада України не буде розглядати питання щодо впровадження ПДВ для фізичних осіб підприємців з…

03.12.2025

Розробники з КНДР тепер готові орендувати особисті дані за третину зарплати

Шукаючи віддалену роботу в західних компаніях, громадяни КНДР тепер готові не тільки «орендувати ноутбук», але…

03.12.2025

Віддалена робота шкодить молодим співробітникам та якості їхнього коду

Молоді спеціалісти, які працюють віддалено, гірше оволодівають новими навичками та мають менше можливостей для кар'єрного…

03.12.2025