Meta звинуватили у навчанні свого штучного інтелекту за допомогою піратського контенту з торрентів

Компанія Meta опинилася в центрі чергового скандалу, пов’язаного зі штучним інтелектом. Її звинувачують у використанні піратського контенту для навчання великої мовної моделі Llama, яка живить Meta AI. Ця справа стала однією з перших судових справ щодо порушення авторських прав у контексті навчання ШІ.

Документи підтверджують використання піратського контенту

Як повідомляє Wired, у 2023 році письменники Річард Кадрі та Крістофер Голден подали позов проти Meta, стверджуючи, що компанія використовувала їхні захищені авторським правом твори без дозволу. Справа отримала назву “Kadrey et al. v. Meta Platforms”.

Спочатку Meta надала суду документи з прихованими даними, проте суддя Вінс Чаббрія з Окружного суду Північного округу Каліфорнії постановив оприлюднити оригінали. У них містяться переписки працівників Meta, які підтверджують використання піратського контенту. Наприклад, один інженер зазначив: «Завантаження торентів з корпоративного ноутбука [Meta] виглядає сумнівно». Також згадується, що рішення щодо використання піратського матеріалу схвалив сам Марк Цукерберг.

Використання бібліотек піратського контенту

Документи вказують, що Meta ймовірно використовувала контент із LibGen – онлайн-бібліотеки піратських книг, журналів та наукових статей. Окрім цього, було використано матеріали з інших «тіньових бібліотек».

Meta виправдовується, посилаючись на принцип “fair use” (дозволене використання), який допускає обмежене використання авторського контенту без згоди власників за певних обставин. Компанія стверджує, що її діяльність є статистичним моделюванням мови для створення нового контенту.

Apple також у центрі уваги

Meta – не єдина технологічна компанія, яка стикалася із подібними звинуваченнями. У 2022 році було виявлено, що OpenELM, модель від Apple, використовувала субтитри з понад 170 000 відео на YouTube. Це спричинило припущення, що Apple також застосовує піратський контент для тренування своїх моделей.

Проте Apple заявила, що OpenELM – це дослідницька модель з відкритим кодом, яка не використовується для тренування Apple Intelligence. За словами компанії, її ШІ-функції базуються на ліцензованих та загальнодоступних даних.

Можливі наслідки

Справа Meta може стати прецедентом для регулювання навчання ШІ в умовах авторського права. Якщо суд визнає порушення, це змінить підхід технологічних гігантів до створення своїх моделей.

Роман Мельник

Роман має пристрасть до технологій та інновацій. Він завжди в курсі останніх новин у сфері IT та постійно вивчає нові технології. Роман любить ділитися своїми знаннями та досвідом з іншими через статті та огляди. У вільний час він займається програмуванням та тестуванням нових гаджетів.

Роман Мельник
Редактор

Поки немає коментарів…

avatar