Добавить новость

Звездопад обрушится на Землю в ночь на 31 июля

Жителя Москвы с дробовиком ищут в Тверской области

«День варенья» пройдет в Подмосковье

В России за прошлую неделю выросла заболеваемость COVID-19

News in English


Новости сегодня

Новости от TheMoneytizer

Sarah Silverman, authors allege Meta used copyrighted content to train AI model

Sarah Silverman, authors allege Meta used copyrighted content to train AI model

A lawsuit against Meta filed by Sarah Silverman and a group of authors alleges that the company infringed their copyrights by training AI models on their content without permission.

A lawsuit against Meta filed by authors and content creators alleges the company trained its artificial intelligence (AI) models on copyrighted materials despite Meta’s lawyers' warning of the legal ramifications, according to a new filing in the suit.

The lawsuit was filed this summer by a group of content creators including comedian Sarah Silverman, Pulitzer Prize winner Michael Chabon and other prominent authors. They allege that Facebook's parent company Meta infringed their copyrights by using their work to train its Llama AI model. Large language models train AI programs using vast amounts of data like text, images and video to teach the program how to associate users’ prompts with existing content.

The group revised its lawsuit after a California judge dismissed part of it last month while allowing them to revise their suit. The amended complaint filed in federal court late Monday includes chat logs of a Meta-affiliated researcher who discussed the use of a dataset on the discord server and noted that the company’s lawyers raised concerns about its inclusion of copyrighted content in response to his inquiries.

AUTHORS’ COPYRIGHT LAWSUIT AGAINST OPENAI OVER CHATGPT BEGINS

Tim Dettmers, an AI researcher who worked with Meta, discussed on a public Discord server the procurement of a dataset called "The Pile" that was compiled by EleutherAI. The Pile included a section called Books3, which included 196,640 books according to a comment made by the person who assembled it that was cited in the complaint.

Dettmers said in November 2020 that he was interested in using The Pile dataset for research and noted that Meta was worried about portions of the dataset having legal concerns and added, "At Facebook we need to get legal approval if we want to publish with certain datasets and lawyers will work on it and verify if there [are] any deep concerns… I think if the process reveals some problems I would be allowed to share that information with you and we maybe could work together to work around that."

AI COMPLICATES COPYRIGHT LAW

Another poster on the EleutherAI Discord server noted that the legal department "is most likely to be worried about books3 which contains the text of books with active copyrights" because that is a "legal grey area" in the U.S. because it hasn’t been litigated leaving legal questions unresolved.

Dettmers posted in December that lawyers had noted issues with Bibliotik, the database the Books3 section was sourced from, and they "recommended to avoid" the dataset and that "it seems to be already clear that the data cannot be used or models cannot be published if they are trained on that data." 

Dettmers followed up in January 2021 to say that the current version of The Pile was too legally problematic to use and see if there would be a way to make it useable for companies with legal concerns.

WHAT IS ARTIFICIAL INTELLIGENCE (AI)?

"At Facebook there are a lot of people interested in working with [T]he [P]ile, including myself, but in its current form, we are unable to use it for legal reasons," he wrote. "Would there be interest in working on this together, that is a Pile version which can be used without any issues at companies that [are] require[d] to follow more stringent legal criteria?"

The plaintiffs’ complaint states that despite the issues with the Books3 database it was included in the Llama 1 training dataset from December 2022 to February 2023. The filing adds that the plaintiffs believe Meta’s Llama 2 model was also trained on Books3 from January to July 2023, when the lawsuit was initially filed, although Meta hasn’t disclosed the training sources for Llama 2.

GET FOX BUSINESS ON THE GO BY CLICKING HERE

The lawsuit added that EleutherAI removed the conversation about The Pile and Books3 from public view in August 2023. 

Additionally, it said that the Books3 dataset was removed The Eye, a website linked to by EleutherAI, in August 2023 following a copyright takedown notice from a group in Denmark, and it was also removed from the AI project hosting service Hugging Face "due to reported copyright infringement" in October 2023.

Meta did not immediately respond to a request for comment.

Reuters contributed to this report.

Читайте на 123ru.net


Новости 24/7 DirectAdvert - доход для вашего сайта



Частные объявления в Вашем городе, в Вашем регионе и в России



Smi24.net — ежеминутные новости с ежедневным архивом. Только у нас — все главные новости дня без политической цензуры. "123 Новости" — абсолютно все точки зрения, трезвая аналитика, цивилизованные споры и обсуждения без взаимных обвинений и оскорблений. Помните, что не у всех точка зрения совпадает с Вашей. Уважайте мнение других, даже если Вы отстаиваете свой взгляд и свою позицию. Smi24.net — облегчённая версия старейшего обозревателя новостей 123ru.net. Мы не навязываем Вам своё видение, мы даём Вам срез событий дня без цензуры и без купюр. Новости, какие они есть —онлайн с поминутным архивом по всем городам и регионам России, Украины, Белоруссии и Абхазии. Smi24.net — живые новости в живом эфире! Быстрый поиск от Smi24.net — это не только возможность первым узнать, но и преимущество сообщить срочные новости мгновенно на любом языке мира и быть услышанным тут же. В любую минуту Вы можете добавить свою новость - здесь.




Новости от наших партнёров в Вашем городе

Ria.city

«Желтый» уровень опасности объявлен в Московском регионе

В Москве увидели китайский автомобиль с логотипом LADA

Столичный спецназ Росгвардии задержал мужчин, совершавших противоправные действия

Москвичи смогут принять участие в квесте и викторине о городском транспорте

Музыкальные новости

Хинштейн: МВД контролирует дело о драке сына Бажаева с полицейским в Москве

Новосибирские энергетики помогли коллегам восстановить линию 110 кВ в Омской области

Смоленский хоккейный клуб «Славутич» выиграл Кубок памяти Александра Дубко

Собянин рассказал о благоустройстве парков в Москве

Новости России

Общественники проконтролировали благоустройство парка «Сосны»

Уроженец Москвы вывихнул плечо, празднуя завоевание бронзы в дзюдо на Олимпиаде в Париже

Москвичи смогут принять участие в квесте и викторине о городском транспорте

Ефимов: в Бирюлеве Восточном построят жилой квартал по программе КРТ

Экология в России и мире

Сотрудники филиала «Красноярский» компании «ЛокоТех-Сервис» стали серебряными призерами Спартакиады РЖД

Кажетта Ахметжанова отдыхает в Якутии и делится местами силы

ENERGY приглашает на «Пикник Афиши»

Zuhair Murad haute couture FW-2024/25 (осень-зима 2024)

Спорт в России и мире

Даниил Медведев победил в первом круге олимпийского турнира по теннису

Рейтинг ATP. Рублев обошел Рууда, Берреттини вернулся в топ-50, Нишиока поднялся на 36 строчек

Мирру Андрееву наградили за первую победу в турнире на уровне WTA

Александрова вылетела с Олимпиады в Париже в первом же раунде

Moscow.media

Пьяный водитель погубил трёх человек: возбуждено дело

Утро в Нёноксе...

Филиал № 4 ОСФР по Москве и Московской области информирует: Более 12 тысяч жителей Москвы и Московской области получают повышенную пенсию за работу в сельском хозяйстве

Филиал № 4 ОСФР по Москве и Московской области информирует: Родители 240,5 тыс. детей в Московской области получают единое пособие











Топ новостей на этот час

Rss.plus






Москвичи смогут принять участие в квесте и викторине о городском транспорте

В России за прошлую неделю выросла заболеваемость COVID-19

Москва и Пекин оспорили претензии США на 1 млн кв. км морского дна

В Москве увидели китайский автомобиль с логотипом LADA