Рубріки: Новини

GPT-4 з’явиться наступного тижня: Microsoft обіцяє відео та мультимодальність

Ігор Шелудченко

Технічний директор Microsoft Germany та керівник підрозділу Data & AI STU Андреас Браун анонсував появу GPT-4 вже на наступному тижні.

Про це він заявив на інформаційному заході AI in Focus — Digital Kickoff, передає Heise.

Зміни, які на нас чекають

CTO назвав LLM (Large Language Models) «переломним моментом у грі» оскільки вони вчать машини розуміти природню мову, що дозволяє статистично інтерпретувати те, що раніше було зрозуміло лише людям.

Технологія просунулася настільки далеко, що практично «працює всіма мовами»: ви можете поставити запитання німецькою, а отримати відповідь італійською. Завдяки мультимодальності Microsoft хоче «зробити моделі комплексними».

«Ми представимо GPT-4 наступного тижня, там у нас будуть мультимодальні моделі, які пропонуватимуть зовсім інші можливості – наприклад, відео», – сказав Браун.

До Брауна приєдналася генеральна директорка Microsoft Німеччина Маріанна Янік, яка порівняла випуск GPT-4 з появою iPhone. При цьому наголосивши, що ШІ не забере робочі місця, оскільки люди навіть не навчилися його використовувати з розумом: «потрібно багато експертів, щоб використовувати штучний інтелект з користю».

Крім того, генеральна директорка підкреслила, що Microsoft не використовує дані клієнтів для навчання моделей.

Як можна використати GPT-4

Клеменс Зібер (старший спеціаліст зі штучного інтелекту) і Хольгер Кенн (головний технолог відділу штучного інтелекту та новітніх технологій у сфері розвитку бізнесу, Microsoft Німеччина) розповіли на конференції про практичне використання штучного інтелекту.

Кенн зазначив, що мультимодальний штучний інтелект може перетворювати текст не лише на зображення, а й на музику та відео. Йдеться про розширення, які використовуються для внутрішнього представлення тексту в моделі.

За словами Кенна, відповідний штучний інтелект вже вбудований у продукти Microsoft, і «мільйони запитів можуть бути відображені в API» через хмару.

Клеменс Зіблер проілюстрував варіанти використання GPT-4. Наприклад, можна записувати телефонні розмови з перетворенням мови в текст, і працівникам кол-центру більше не потрібно вручну робити нотатки. Це може заощадити 500 робочих годин на день для великого клієнта Microsoft, який отримує 30 000 дзвінків щодня.

За його словами, три найпоширеніші варіанти використання — це:

  • відповіді на запитання (доступно лише працівникам компанії);
  • обробка документів за допомогою штучного інтелекту;
  • напівавтоматична обробка усної мови в центрі викликів і відповідей.

Коли його запитали про операційну надійність і точність фактів, Зіблер сказав, що ШІ не завжди буде правильно відповідати, тому необхідно перевіряти інформацію. Зараз корпорація створює показники довіри для вирішення цієї проблеми.

Цікаво, що жоден із чотирьох співробітників Microsoft не прокоментував інтеграцію ШІ у пошукову систему Bing.

Нагадаємо, нещодавно Microsoft об’єднала технологію ChatGPT зі своєю платформою Power Platform.

Технологія дозволяє користувачам розробляти застосунки практично або повністю без необхідності написання коду

Останні статті

JetBrains: для 90% програмістів інструменти ШІ економлять мінімум годину на тиждень, для 20% — цілий робочий день

Компанія JetBrains оприлюднила результати щорічного опитування Developer Ecosystem Survey про стан на ринку розробки програмного…

20.10.2025

Microsoft: фішинг за допомогою штучного інтелекту в 4,5 рази ефективніший за традиційний

Фішингові листи, створені за допомогою штучного інтелекту, більш успішні для хакерів у порівнянні з традиційними.…

20.10.2025

П’ять пасток, у які потрапляють навіть досвідчені проджект-менеджери. Колонка FAVBET Tech

Мабуть, у кожного проджекта є день, коли він ловить себе на думці: «Я більше координую…

20.10.2025

FAVBET Tech сплатив понад 650 млн грн податків за 9 місяців 2025 року

Українська ІТ-компанія FAVBET Tech за дев’ять місяців 2025 року перерахувала до державного бюджету понад 650…

20.10.2025

Telegram тестує функцію прямих ефірів з особистих акаунтів

Незабаром месенджер Telegram може поповнитись функцією трансляції прямих ефірів. Як повідомляє канал Telegram Info, у…

20.10.2025

«Claude Haiku 4.5 генерує низькоякісний код»: експерт розповів, які моделі краще використовувати для рефакторингу

Тестування нещодавно випущеної LLM-моделі Claude Haiku 4.5 від компанії Anthropic виявило парадокс: вона створила найбільше…

20.10.2025