Вхід
  • Новини
  • Front-end
  • Back-end
  • Блокчейн
  • Підручник з Rust
  • Mobile app
  • Книжки
  • Добірки
  • Історії
  • Рішення
  • Теорія
  • Залізо
  • Інтерв’ю
  • Спецпроєкти
  • Реклама у виданні
  • Редакційні правила
  • Наша редакція
  • Про видання
  • Контакти
  • Рейтинг блогерів Highload
  • Аукціон відплати

Приєднуйтесь до нас

  • Новини
  • Front-end
  • Back-end
  • Блокчейн
  • Підручник з Rust
  • Mobile app
  • Книжки
  • Добірки
  • Історії
  • Рішення
  • Теорія
  • Залізо
  • Інтерв’ю
  • Спецпроєкти
  • Реклама у виданні
  • Редакційні правила
  • Наша редакція
  • Про видання
  • Контакти
  • Рейтинг блогерів Highload
  • Аукціон відплати

Приєднуйтесь до нас

DeepSeek

Новини - 5 днів назад

Китайська влада наполягла, щоб DeepSeek навчала модель R2 на обладнанні Huawei. Але щось пішло не так

Дмитро Сімагін

Журналіст

Китайська влада наполягла, щоб DeepSeek навчала модель R2 на обладнанні Huawei. Але щось пішло не так

Провідний китайський стартап у сфері штучного інтелекту DeepSeek був змушений відкласти випуск своєї майбутньої моделі R2 через труднощі з її навчанням. Проблеми почались після втручання політиків у робочі процеси, повідомляє Tom’s Hardware.

Новини - 2 місяці назад

Реліз LLM-моделі DeepSeek R2 затримується. Причина в Nvidia

Дмитро Сімагін

Журналіст

Реліз LLM-моделі DeepSeek R2 затримується. Причина в Nvidia

Китайська компанія DeepSeek зазнала невдачі в розробці нової LLM-моделі R2, оскільки їй не вдалось отримати достатню кількість графічних процесорів Nvidia. Про це повідомляє Silicon Angle.

Новини - 2 місяці назад

Китайська компанія MiniMax стверджує, що її нова модель краща за DeepSeek R1-0528

Дмитро Сімагін

Журналіст

Китайська компанія MiniMax стверджує, що її нова модель краща за DeepSeek R1-0528

Компанія MiniMax з Шанхаю випустила нову LLM-модель під назвою MiniMax-M1. Вона має відкритий код і, як стверджується, більш ефективна, ніж всі конкуренти, створені в Китаї. Компанія-розробник запевняє, що MiniMax-M1 перевершує останню модель DeepSeek R1-0528 у кількох бенчмарках. Про це повідомляє Bloomberg.

Новини - 3 місяці назад

DeepSeek стверджує, що її оновлена ​​модель R1 краще справляється з програмуванням

Дмитро Сімагін

Журналіст

DeepSeek стверджує, що її оновлена ​​модель R1 краще справляється з програмуванням

Китайський стартап DeepSeek заявив, що його оновлена LLM-​​модель R1 може виконувати математичні обчислення, програмування та загальну логіку краще, ніж попередня версія, при цьому менше викликає галюцинації. Про це повідомляє Bloomberg.

Новини - 3 місяці назад

Співробітникам Microsoft заборонили використовувати DeepSeek

Дмитро Сімагін

Журналіст

Співробітникам Microsoft заборонили використовувати DeepSeek

Співробітникам Microsoft заборонено використовувати DeepSeek через проблеми безпеки даних та побоювання китайської пропаганди. Про це на слуханнях в Сенаті США заявив президент Microsoft Бред Сміт, пише TechCrunch.

Новини - 5 місяців назад

DeepSeek випускає нову безкоштовну модель V3-0324. Вона краща в програмуванні, ніж GPT-4o

Дмитро Сімагін

Журналіст

DeepSeek випускає нову безкоштовну модель V3-0324. Вона краща в програмуванні, ніж GPT-4o

Китайська компанія DeepSeek випустила нову велику мовну модель, яка не тільки безкоштовна, але й перевершує Claude Sonnet 3.5. Модель DeepSeek-V3-0324 важить 641 гігабайт, має 685 мільярдів параметрів і доступна для комерційного використання за ліцензією MIT. Ще однією перевагою є те, що вона може працювати безпосередньо на апаратному забезпеченні споживчого класу, зокрема Mac Studio від Apple з чіпом M3 Ultra, пише Venture Beat.

Новини - 5 місяців назад

DeepSeek-R1 може створити кейлоггер і генерує код програм-вимагачів — дослідження

Дмитро Сімагін

Журналіст

DeepSeek-R1 може створити кейлоггер і генерує код програм-вимагачів — дослідження

Флагманська модель R1 від DeepSeek здатна генерувати кейлоггер і базовий код програм-вимагачів. Для цього достатньо кількох підказок, пише The Register.

Machine Learning - 6 місяців назад

Формула 1 в галузі ШІ: чи зможе DeepSeek обігнати ChatGPT?

Владислав Гринів

Кінець січня був насичений подіями, які сколихнули світ: інавгурація президента США Дональда Трампа, щорічний Всесвітній економічний форум (ВЕФ) у Давосі та запуск нового конкурента ChatGPT — DeepSeek. Зокрема, останній вже встиг вплинути на фінансові ринки, оскільки акції багатьох компаній впали в ціні на тлі його запуску. Однак чи справді новий чат-бот є революційним і кращим за своїх дорожчих конкурентів — ChatGPT від OpenAI та Gemini від Google? Розглянемо докладніше.

Новини - 6 місяців назад

DeepSeek пропонує дешеві нічні тарифи на доступ до моделей V3 або R1

Дмитро Сімагін

Журналіст

DeepSeek пропонує дешеві нічні тарифи на доступ до моделей V3 або R1

Китайська компанія DeepSeek для більш рівномірного навантаження на свою технічну інфраструктуру запроваджує нічний тариф для доступу до моделей V3 або R1. Тепер, якщо користувач хоче зекономити до 75% вартості доступу, він може підключати свої додатки до моделей з 00:30 до 8:30 ранку за пекінським часом. Про це повідомляє South China Morning Post.

Новини - 6 місяців назад

DeepSeek прискорює розробку моделі R2. Вона зможе генерувати «більш якісний код»

Дмитро Сімагін

Журналіст

DeepSeek прискорює розробку моделі R2. Вона зможе генерувати «більш якісний код»

Китайський стартап DeepSeek прискорив розробку своєї нової моделі штучного інтелекту R2, яка має стати конкурентом GPT-5, яка, в свою чергу, теж поки не готова до релізу. Раніше компанія OpenAI звинуватила DeepSeek у тому, що R1 навчалася на її даних, повідомляє Reuters.

Новини - 6 місяців назад

DeepSeek-R1 може генерувати шкідливий код — дослідники

Дмитро Сімагін

Журналіст

DeepSeek-R1 може генерувати шкідливий код — дослідники

Китайська модель штучного інтелекту DeepSeek-R1 може використовуватись для створення шкідливого контенту, наприклад планів атаки з використанням біологічної зброї чи фішингових електронних листів зі шкідливим кодом. Про це повідомляє TechCrunch з посиланням на The Wall Street Journal.

Новини - 6 місяців назад

DeepSeek обмежує доступ до свого API через перевантаження серверів

Дмитро Сімагін

Журналіст

DeepSeek обмежує доступ до свого API через перевантаження серверів

Компанія DeepSeek, чия LLM-модель R1 сколихнула світові ринки минулого тижня, заявила, що вимушена обмежити доступ до свого API через нестачу серверних потужностей. За даними Bloomberg, DeepSeek призупинила поповнення кредитів API, щоб уникнути більш негативного впливу на свої послуги. 

Новини - 7 місяців назад

Цензура в DeepSeek працює навіть при локальному запуску моделі — дослідження

Дмитро Сімагін

Журналіст

Цензура в DeepSeek працює навіть при локальному запуску моделі — дослідження

Експерти видання Wired з’ясували, що цензура в китайській моделі штучного інтелекту DeepSeek вбудована в систему не тільки на рівні програми, але й на рівні навчання. Це означає, що при запуску моделі на локальному пристрої або в сторонній хмарі цензура не дозволить отримувати точні відповіді на теми, «делікатні» для китайської влади. 

Новини - 7 місяців назад

OpenAI представив «цифрового дослідника» Deep Research

Андрій Губін

Журналіст

OpenAI представила інструмент Deep Research, який за півгодини готує аналітичний звіт, на створення якого фахівець витратив би цілий робочий день. На тлі жорсткої конкуренції з китайським DeepSeek, компанія Сема Альтмана представила агента, здатного самостійно блукати інтернетом і формулювати висновки, повідомили в Terazus.

Новини - 7 місяців назад

Microsoft відкрила доступ до DeepSeek-R1 у GitHub та Azure

Дмитро Сімагін

Журналіст

Microsoft відкрила доступ до DeepSeek-R1 у GitHub та Azure

Microsoft перенесла велику мовну модель DeepSeek-R1 на платформи GitHub і Azure AI Foundry. Усі клієнти Microsoft тепер можуть інтегрувати її в свої програми, пише The Verge.

Machine Learning - 7 місяців назад

Реліз DeepSeek R1 — зміна правил гри у сфері LLM

Родіон Сальник BLOG

Co-founder of CASERS and Brocoders

20 січня 2025 року китайський стартап DeepSeek, що займається розробкою штучного інтелекту, випустив модель R1. Це нове доповнення до їхньої лінійки ШІ стало наслідком успіху DeepSeek-V3, моделі, яка швидко привернула увагу завдяки безпрецедентному поєднанню продуктивності та економічної ефективності. Зокрема, модель R1 представила недороге рішення, здатне конкурувати, а в деяких випадках і перевершувати моделі, розроблені найбільшими гравцями галузі. Її випуск сколихнув Кремнієву долину, і тепер технологічний світ намагається зрозуміти наслідки вражаючого злету DeepSeek.

Новини - 7 місяців назад

OpenAI стверджує, що має докази «несанкціонованого використання» її моделі для навчання DeepSeek-R1

Дмитро Сімагін

Журналіст

OpenAI стверджує, що має докази «несанкціонованого використання» її моделі для навчання DeepSeek-R1

Компанія OpenAI заявляє, що має докази того, що китайський стартап DeepSeek використовував її великі мовні моделі для навчання власної моделі DeepSeek-R1 з відкритим кодом. Представник Адміністрації президента США Девід Сакс вважає, що йдеться про ймовірну крадіжку інтелектуальної власності, пише Financial Times.

Новини - 7 місяців назад

«Meta в режимі паніки»: Цукерберг створив 4 робочі групи для вивчення причин успіху DeepSeek

Дмитро Сімагін

Журналіст

«Meta в режимі паніки»: Цукерберг створив 4 робочі групи для вивчення причин успіху DeepSeek

Генеральний директор Meta Марк Цукерберг створив чотири «військові кімнати» з розробників, щоб дослідити причини успіху DeepSeek. За даними Windows Central, флагманська модель DeepSeek перевершує не тільки існуючі, але й наступну версію моделі Llama, реліз якої заплановано на початок 2025 року. Про це заявив директор інфраструктури штучного інтелекту Meta Метью Олдхем.

Новини - 7 місяців назад

Розробники Hugging Face почали роботу над Open-R1 — «повністю відкритим» форком DeepSeek-R1

Дмитро Сімагін

Журналіст

Розробники Hugging Face почали роботу над Open-R1 — «повністю відкритим» форком DeepSeek-R1

Керівник відділу Hugging Face Леандро фон Верра та кілька розробників компанії запустили Open-R1 — проект, який має на меті створити удосконалений форк моделі DeepSeek-R1 з відкритими даними для всіх компонентів, включно з тими, які використовуються для навчання. Як повідомляє TechCrunch, дослідження, для роботи над яким виділено 768 графічних процесорів Nvidia H100, лише за три дні набрало на GitHub понад 11 000 зірок. 

Новини - 7 місяців назад

Витік чутливих даних та цензура. Експерт розповів про ризики використання DeepSeek

Андрій Губін

Журналіст

Занепокоєння з приводу китайських технологій штучного інтелекту, таких як DeepSeek, зростає серед країн, які прагнуть зберегти свою цифрову незалежність, повідомили в РБК-Україна.

Новини - 7 місяців назад

DeepSeek скоротила розробку своєї моделі, скориставшись бібліотеками OpenAI

Дмитро Сімагін

Журналіст

DeepSeek скоротила розробку своєї моделі, скориставшись бібліотеками OpenAI

Розробник Яншун Тай з компанії Meta помітив, що бібліотеки DeepSeek мають повну сумісність з бібліотеками OpenAI. Про це він розповів на LinkedIn, пояснивши, що таким чином китайська компанія суттєво скоротила процес розробки.

Новини - 7 місяців назад

DeepSeek випускає Janus-Pro — генератор зображень, який конкурує з OpenAI DALL-E 3

Дмитро Сімагін

Журналіст

DeepSeek випускає Janus-Pro — генератор зображень, який конкурує з OpenAI DALL-E 3

Компанія DeepSeek, яка днями викликала фурор своєю моделлю штучного інтелекту DeepSeek-R1, оголосила про реліз ще одного програмного продукту. Китайський стартап випустив сімейство мультимодальних моделей Janus-Pro. Як повідомляє TechCrunch, ці моделі здатні генерувати зображення краще, ніж OpenAI DALL-E 3, PixArt-alpha та Stable Diffusion XL.

Новини - 7 місяців назад

Успіх DeepSeek-R1 ставить під загрозу багатомільярдну індустрію OpenAI

Дмитро Сімагін

Журналіст

Успіх DeepSeek-R1 ставить під загрозу багатомільярдну індустрію OpenAI

Реліз нової китайської моделі DeepSeek-R1, яка не поступається за продуктивністю моделям сімейства GPT, але значно перевищує їх за економічною ефективністю, викликав побоювання щодо перспектив багатомільярдної індустрії OpenAI. Як повідомляє Cointelegraph, на навчання DeepSeek-R1, яка має відкритий код, було витрачено лише $6 мільйонів та задіяна незначна кількість графічних процесорів. 

Новини - 8 місяців назад

Китайська модель DeepSeek V3 з відкритим кодом перевершила усіх конкурентів

Дмитро Сімагін

Журналіст

Китайська модель DeepSeek V3 з відкритим кодом перевершила усіх конкурентів

Китайський стартап DeepSeek створив одну з найпотужніших на сьогоднішній день «відкритих» моделей штучного інтелекту — DeepSeek V3. Вона має відкритий код і навчена на наборі даних з 14,8 трильйонів токенів. 1 мільйон токенів дорівнює приблизно 750 000 слів, повідомляє Venture Beat.

Новини

Google Docs тепер читає документи вголос за допомогою Gemini

7 хвилин назад

Опитування Python-розробників: популярність PyCharm падає, лише 15% використовують останню версію 3.13

1 годину назад

MCP тепер доступний для всіх у Visual Studio

3 години назад

Кабмін запустить «електронний ТЦК». Яких змін чекати?

19 години назад

Керівник AWS: заміна джунів на штучний інтелект — «одна з найдурніших ідей»

20 години назад

OpenAI розглядає можливість додати шифрування в ChatGPT

23 години назад

87% гейм-девелоперів застосовують штучний інтелект у робочих процесах — дослідження Google Cloud

1 день назад

Тарифи на інструмент кодування Kiro назвали «трагедією, яка спустошує гаманець»

1 день назад

Microsoft заборонила користувачам зупиняти оновлення програм

2 дні назад

Claude зможе сам завершувати діалог, щоб запобігти шкідливому використанню

2 дні назад
Показати ще

Спецпроєкти

Крихкі зони: як виявляти їх вчасно. Досвід FAVBET Tech
Ефективний моніторинг сучасного PHP-застосунку. Як тут працюють системи спостереження Observability?
Хмарна vs локальна: як обрати ідеальну СRM і що вона повинна вміти
Топ текстів тижня
1.
Розробник підлаштував свій режим сну під дію тарифу Claude Pro
2.
У ChatGPT може з’явитись реклама
3.
Через шахрайства зі штучним інтелектом Google та інші IT-компанії повертаються до особистих співбесід
4.
В Excel тепер можна аналізувати зображення за допомогою Python
5.
В Google Translate додали функцію вивчення іноземних мов
6.
«Дія» шукає охочих отримувати щомісячні грошові виплати в рамках бета-тестування
7.
Китайська влада наполягла, щоб DeepSeek навчала модель R2 на обладнанні Huawei. Але щось пішло не так
8.
Google відкриє доступ до Gemini 2.5 Deep Research через API
9.
В Gemini додали «Персональний контекст» і «Тимчасові чати»
10.
Google випустила мініатюрну модель Gemma 3 270M — її можна запустити на смартфоні
  • Про видання
  • Наша редакція
  • Контакти
  • Політика конфіденційності
  • Реклама у виданні
  • Редакційні правила
  • Як відправити текст у редакцію

Якщо ви знайшли помилку, будь ласка, виділіть фрагмент тексту та натисните Ctrl+Enter.


Ми використовуємо ілюстрації від Depositphotos


Окремі матеріали можуть містити посилання на партнерів — це не впливає на контент та політику редакції. Проте дає виданню можливості для розвитку.


Підтримка серверів

© Highload. 2021-2025

Ваша жалоба отправлена модератору

Переглядаючи цей сайт, ви погоджуєтесь з нашою політикою конфіденційностіOK

Сообщить об опечатке

Текст, который будет отправлен нашим редакторам:

Отправить Скасувати

Користні рішення для тих,
хто пише код

Приєднуйтесь
до товариства: