Рубріки: Новини

OpenAI випустила GPT-4: вона працює з зображеннями та має різні особистості

Ігор Шелудченко

Компанія OpenAI офіційно представила GPT-4 — наступне покоління мовної моделі штучного інтелекту.

Технічний директор OpenAI Грег Брокман продемонстрував деякі можливості GPT-4 під час онлайн-презентації. Наприклад, він показав, як штучний інтелект створює справжній вебсайт на основі фотографії зробленого від руки ескізу.

Відмінності від GPT-3.5

GPT-4 може розпізнавати зображення

Ця функція раніше була анонсована як «мультимодальність», тобто GPT-3.5 могла сприймати тільки один «модальний» тип інформації. Відповідно, ChatGPT и GPT-3 працювали тільки з текстом.

А тепер модель ще може сприймати і зображення, аналізувати їх та знаходити релевантну інформацію. Наприклад, можна попросити описати те, що на зображенні.

Тут показовим є партнерство з Be My Eyes, застосунком для людей, з порушенням зору.

Краща пам’ять

Ліміт для GPT-3.5 і старої версії ChatGPT складав 4096 токенів що приблизно дорівнює 8000 словам. Таким чином, модель втрачала деякі логічні зв’язки, якщо розмова відбулася досить давно.

GPT-4 має максимальний розмір токенів 32 768. 

Це означає, що під час розмови чи генерації тексту модель зможе пам’ятати більше, і, відповідно, надавати більш точні відповіді.

GPT-4 — багатомовний і знає українську

Модель тепер вміє відповідати на тисячі питань з множинним вибором з високою точністю 26 мовами, від італійської до української та корейської.

Базовою залишається англійська, проте це досить великий крок в сторону інших мов.

Робота з фактами

GPT-4 тепер складніше обдурити. OpenAI стверджує, що GPT-4 — «креативніша» і може розв’язувати складні завдання із більшою точністю завдяки розширеним загальним знанням.

GPT-4 натренували на безлічі провокативних запитів, які користувачі люб’язно надали OpenAI протягом останніх одного-двох років.

Ну, і звичайно, модель більш серйозно надресували не виходити за рамки дозволеного.

Різні особистості GPT-4

GPT-4 інтегрує керованість більш нативно, ніж GPT-3.5, і користувачі зможуть змінити «класичну особистість ChatGPT з фіксованою багатослівністю, тоном і стилем» на щось більш відповідне їхнім потребам.

Тепер розробники зможуть закладати думку, стиль спілкування, тон чи метод взаємодії від початку.

Результати тестів

OpenAI  підтверджує оптимізацію мовної моделі результатами тестів. Це:

  • LSAT (вступний тест для майбутніх юристів);
  • SAT Math (тест з математики);
  • SAT Evidence-Based Reading & Writing (іспити з читання та письма).

У цих тестах GPT-4 набрав 88% і вище.

Програмістам можна поки що спати спокійно — на задачах із Codeforces модель входить лише у нижні 5% за рейтингом.

Обмаль деталей

Разом з тим, деталей про GPT-4 не так і багато. Не розповідали ні про архітектуру, ні навіть про кількість параметрів .

«Враховуючи як конкурентне середовище, так і наслідки для безпеки великомасштабних моделей, таких як GPT-4, цей звіт не містить додаткових відомостей про архітектуру (включаючи розмір моделі), обладнання, навчальних вибірках, побудову набору даних, метод навчання і т. п.», — кажуть офіціальні представники компанії.

Поки що GPT-4 буде доступний тільки для користувачів платної версії чат-бота, вартість якої становить $20 на місяць. Однак новий чат-бот вже вбудований у Bing – пошукову платформу компанії Microsoft. Нещодавно Microsoft вклав у компанію OpenAI $10 млрд.

Записатися до листа очікування можна за посиланням.

Нагадаємо, появу GPT-4 анонсували минулого тижня.

Нагадаємо, нещодавно Microsoft об’єднала технологію ChatGPT зі своєю платформою Power Platform. Технологія дозволяє користувачам розробляти застосунки практично або повністю без необхідності написання коду.

Читайте також:

OpenAI випустив API ChatGPT і Whisper для розробників

Почніть зараз, поки це безплатно: 12 простих способів заробити гроші за допомогою ChatGPT 

Співробітники звинувачують Google у провальному анонсі конкурента ChatGPT Bard

Останні статті

Google випустила бету бібліотеки Compose 1.2 — базовий інструментарій для створення user-інтерфейсів в Android

Google оголосила, що бібліотека адаптивних макетів Compose 1.2 офіційно переходить у бета-версію. Вона надає розробникам…

04.09.2025

«Тепер важлива не кваліфікація, а ключові слова»: IT-фахівці розчаровані автоматизованим аналізом резюме

Опитування Dice, проведене серед понад 200 IT-працівників, виявило широке розчарування автоматизованою перевіркою резюме. Багато респондентів…

04.09.2025

Хакери навчились використовувати Grok для поширення шкідливих посилань

Зловмисники використовують Grok, вбудований у X помічник на основі штучного інтелекту, щоб обійти обмеження на…

04.09.2025

На GitHub виклали оригінальний код BASIC 1978 року

На GitHub виклали оригінальний вихідний код інтерпретатора BASIC 1.1 для процесора MOS 6502. Microsoft датує…

04.09.2025

Функція Projects тепер доступна для безкоштовних користувачів ChatGPT

Компанія OpenAI оголосила, що функція Projects стала доступною для безкоштовних користувачів ChatGPT. Проекти дозволяють каталогізувати…

04.09.2025

Мінцифри шукає бажаючих тренувати національну LLM

Міністерство цифрової трансформації оголосило конкурс для бажаючих взяти участь у розробці та навчанні української великої…

03.09.2025