CAD 31.54₴ 0.01%
KZT 0.09₴ 0.25%
GBP 59.09₴ 0.05%
USD 44.92₴ 0.12%
EUR 50.92₴ 0.08%
PLN 11.88₴ 0.06%
CAD 31.54₴ 0.01%
KZT 0.09₴ 0.25%
GBP 59.09₴ 0.05%
USD 44.92₴ 0.12%
EUR 50.92₴ 0.08%
PLN 11.88₴ 0.06%
Toggle sidebar
Новини
Новини від Роман Мельник

Anthropic представила Claude Opus 4.8: кращий у програмуванні та чесніший у відповідях

Anthropic представила Claude Opus 4.8: кращий у програмуванні та чесніший у відповідях

Anthropic оголосила про запуск своєї найновішої AI-моделі Claude Opus 4.8. У компанії стверджують, що модель стала «ефективнішим партнером» завдяки покращенням в агентному програмуванні, міждисциплінарному міркуванні, агентному використанні комп’ютера, роботі зі знаннями та агентному фінансовому аналізі.

Тестувальники зазначають, що Opus 4.8 є «надійнішою та точнішою у своїх судженнях» під час виконання агентних завдань, а також стала чеснішою.

Перші тестувальники повідомляють, що Opus 4.8 частіше позначає невизначеність у своїй роботі та рідше робить непідтверджені твердження. Це підтверджують і наші оцінювання: вони показують, що Opus 4.8 приблизно в чотири рази рідше, ніж попередниця, пропускає непоміченими вади в написаному нею коді.

Оцінювання узгодженості (alignment) свідчать, що модель досягла нових максимумів за показниками просоціальних рис — зокрема підтримки автономії користувача та дій в його найкращих інтересах. Рівень неузгодженої поведінки на кшталт обману нижчий, ніж у Opus 4.7, і подібний до Claude Mythos Preview.

За бенчмарками Anthropic, Opus 4.8 набрала 69,2% у SWE-Bench Pro, випередивши GPT–5.5 і Gemini 3.1 Pro у цьому тесті та ще в кількох інших, хоча GPT–5.5 лідирує в бенчмарку terminal-coding.

Швидкий режим Opus 4.8 також працює у 2,5 раза швидше, а сама модель тепер утричі дешевша за попередні.

Разом із Opus 4.8 Anthropic додає нові функції до своєї лінійки продуктів.

  • Динамічні робочі процеси (research preview) — Claude може виконувати масштабніші завдання в Claude Code. Вона здатна планувати роботу та запускати сотні паралельних субагентів в межах однієї сесії. Також може виконувати міграції на рівні всього кодового базису на сотнях тисяч рядків коду. Функція доступна в Claude Code для планів Enterprise, Team і Max.
  • Керування зусиллям — у Claude.ai та Cowork користувачі можуть обирати, скільки зусиль Claude вкладає у відповідь. За нижчого рівня Claude відповідатиме швидше та повільніше витрачатиме ліміти запитів. Для Opus 4.8 за замовчуванням встановлено високий рівень зусиль, який, за словами Anthropic, найкраще балансує якість і користувацький досвід.
  • Messages API — Messages API приймає системні записи всередині масиву повідомлень, тож розробники можуть оновлювати інструкції для Claude посеред виконання завдання.

Claude Opus 4.8 доступна всюди вже сьогодні. Ціни на звичайне використання не змінилися порівняно з Opus 4.7.

Anthropic працює над моделями з такими самими можливостями, як у Opus 4.8, але за нижчої вартості, а також над новим класом моделей, які будуть ще розумнішими за Opus. Компанія каже, що розробляє запобіжники для моделі Claude Mythos, яку тестує з невеликою кількістю організацій, і очікує, що зможе надати моделі класу Mythos усім клієнтам «у найближчі тижні».

Джерело: macrumors.com

Як вам цей матеріал?

Оцінити матеріал
Коментарі
Додати в закладки
0
Додати в закладки
11 переглядів

Щотижнева розсилка

Підпишіться на нас щоб бути в курсі останніх новин про яблучні технології

0 коментарів

Поки немає коментарів…

Instagram
Twitter X
Threads
Telegram
YouTube

© 2024–2026 Ябло.Тех - Яблучний техно-гід — новини, огляди та додатки зі світу Apple.

RSS

Матеріали сайту можуть використовуватися за умови обов'язкового посилання на "Yablo.tech" (для інтернет-ресурсів — відкритого гіперпосилання), розміщеного не нижче другого абзацу.

Контент із позначками "Реклама", "Пресреліз" та "Новини компаній" є рекламним і публікується на правах реклами. Погляди, висловлені в цих матеріалах, не обов'язково збігаються з думкою редакції.
Матеріали з позначками "Спецпроєкт" та "Партнерський проект" також є рекламними, однак їх підготовка відбувається за участі редакції, яка підтримує висловлені там ідеї та позиції.

Редакція не відповідає за зміст фактичних даних та оціночні судження, висвітлені в рекламних матеріалах. Згідно із законодавством України, відповідальність за зміст реклами покладається на рекламодавця.

Новини
Додатки
Шпалери
Apple TV+
Вікі

Вхід в акаунт

або
Email
Пароль
Запам'ятати мене

Ще не маєте акаунту?

Реєстрація

або
Імʼя
Email
Пароль
Повторіть пароль

Реєструючись, ви погоджуєтеся з умовами положення про обробку і захист персональних даних та угодою користувача.

Вже зареєстровані?

Відновлення паролю

Введіть email — надішлемо посилання для скидання паролю.

Email

Згадали пароль?