За оцінками Stanford AI Index, на тренування GPT-4 знадобилося орієнтовно $78 млн лише на обчислення; для Google Gemini Ultra – $191 млн. Дослідники Epoch AI прогнозують, що витрати на передові ШІ-моделі зростатимуть у 2-3 рази щороку й можуть перевищити $1 млрд до 2027.
Розробка та тренування ШІ з нуля – це дороге задоволення. Але також в ньому рідко коли є сенс: все, що вам треба, вже існує на ринку (хіба що ви маєте унікальні вимоги).
У цьому матеріалі разом із FAVBET Tech розбираємо, де шукати готові моделі, як їх обирати, перевіряти на власних даних і адаптувати під продукт.
У Favbet Tech напрямком даних та ШІ опікується Олексій Ковальчук, Head of Data & AI. Він допомагає компанії формувати AI-стратегію та ділиться досвідом, що змінилось завдяки впровадженню нових рішень.
«Я вже не можу уявити Favbet Tech без AI-рішень і вважаю, що якби компанія сьогодні відмовилася від них, то втратила б ринок. У нашій сфері занадто багато даних і занадто висока швидкість, тому “в Excel і блокнотиках таке вже не працює”, хоча це й допомагало в нульових», – пояснює Олексій.
Компанія планує у найближчі два-три роки ще більше автоматизувати бізнес-процеси і зробити їх прозорішими, зокрема це стосується доступу до аналітики та роботи із CRM.
«Вже є експерименти з внутрішніми чат-ботами, які дозволяють нам зменшити залежність від BI-систем. Такі речі ще не до кінця автоматизовані, але потенціал величезний», – додає Олексій.
Найбільший публічний хаб моделей і датасетів – це Hugging Face. На сьогодні тут розміщено 2+ млн моделей, 500 тис. датасетів та 1 млн демо.
Чому саме ця платформа стала GitHub для ШІ? Частково через вдалу інфраструктуру: тут можна розгорнути модель, донавчити її, інтегруватися з PyTorch, TensorFlow та ONNX, а також вийти у продакшн через Inference Endpoints (керовані API, автоскейлінг, логування). Якщо вам потрібно швидко знайти кілька кандидатів, підвантажити невелику вибірку власних даних і порівняти результати, Hugging Face зазвичай дає найменший поріг входу.
Крім того, навколо Hugging Face існує велике ком’юніті людей, які якраз й додають та підтримують моделі.
Втім, є кейси, коли Hugging Face для пошуку ШІ-моделей не підійде. В першу чергу, він не оптимальний для enterprise, бо має обмеження за ліцензіями, швидкістю та latency.
Нижче альтернативи, та для яких кейсів вони підходять:
Максимально конкретизуйте, що вам потрібно. Не «бот для підтримки», а «класифікація звернень у сапорт на 6 категорій, українська/англійська мови, середній обсяг тексту – 1–3 речення».
Чим точніше формулювання, тим швидше ви відсієте невдалі варіанти.
На цьому етапі важливо не провалитись у нескінченний рісьорч. За лічені хвилини обрана платформа зі списку вище запропонує вам з десяток варіантів, але всі вони вам не потрібні. Оберіть 3-5, які:
На етапі відбору завжди питайте: «Чи є приклади використання моделі у схожих реальних кейсах?».
На цьому етапі ви не тюните модель, не оптимізуєте інференс і не будуєте складні пайплайни. Ваша ціль – зрозуміти, яка модель із коробки поводиться найадекватніше саме на вашому типі даних. Бо модель може виглядати переконливо у лідерборді, але зафейлитись на реальній бізнес-задачі.
Зберіть 100-300 реальних прикладів, пропустіть їх через кожну модель і порівняйте за трьома групами критеріїв:
Загалом, якщо модель дає 70-80% бажаної якості без доопрацювань, є сенс інвестувати у fine-tuning, RAG чи оптимізацію інференсу. Якщо ні – дешевше і швидше замінити кандидата на іншого.
Інколи неадаптована модель уже достатньо хороша для запуску: як-от, для задач підтримки, контент-асистентів або внутрішніх аналітичних інструментів. У такому випадку ваші наступні кроки це:
Це робоча стратегія і, за даними Gartner, головний спосіб використання GenAI в організаціях.
При цьому адаптація теж не обов’язково дорівнює переписуванню ваг. Це може бути:
При чому, за дослідженням Menlo Ventures (2024), лише ~9% компаній використовують fine-tuning, тоді як 51% покладаються на RAG, а решта – на промпти та інженерію навколо моделі. Також, навіть якщо ви дійдете до повної кастомізації, краще робити це поступово, після реальних сигналів, що це потрібно. Для цього впроваджуйте:
Наостанок розберемо помилки, які найчастіше роблять при впровадженні ШІ-моделей:
Також велика помилка покладатися на модель у всьому, забуваючи, що вона може вигадати, помилитися або бути не впевненою. Тож fallback-механізм – це must-have. Мусите мати спосіб безпечно «відмовитися від відповіді» або передати запит іншій системі або людині.
У Favbet Tech із цим працює одразу кілька підрозділів: команда Data Science, команда BI та окремий підрозділ Data Engineering. Попри різні завдання, усі вони входять до одного департаменту й тісно співпрацюють між собою. Коли від бізнесу надходить запит, керівники команд декомпозують його на кілька стримів і розподіляють роботу так, щоб процеси синхронно рухалися від збору даних до впровадження AI-рішень.
Всередині Google знову назріває етичний шторм. Понад 600 співробітників компанії, в тому числі з підрозділу…
Компанія OpenAI, схоже, готова вийти за межі чат-ботів і кинути виклик пануванню Apple та Google…
Компанія Google почала тестувати нову функцію на базі штучного інтелекту під назвою Ask YouTube. Цей…
Компанія Meta готує власне хмарне рішення для користувачів WhatsApp, яке дозволить зберігати резервні копії файлів…
Поліцейські Львівської області затримали хакерське угруповання, учасники якого зламали понад 610 тисяч геймерських профілів. Метою…
Компанія Apple анонсувала впровадження нової моделі монетизації програм в App Store. Вона має зробити платні…