Добавить новость

Опасные бактерии обнаружили в рыбном паштете в России

В России зарегистрировали новый аналог датского «Оземпика» для диабетиков

Сбой произошел в работе приложения Discord

В соцсетях показали видео из шахты в Кузбассе после землетрясения





Новости сегодня

Новости от TheMoneytizer

A leaked document indicates Runway's Gen-3 AI video generation tool may have been trained on YouTube videos and copyrighted content without permission

 A leaked document indicates Runway's Gen-3 AI video generation tool may have been trained on YouTube videos and copyrighted content without permission

I imagine the lawyers are sharpening their pencils...

Here's a question that can throw a generative AI company into a twist: "What content has been used to train your models?" While some opt to dodge the question, and others bullishly front out the issue entirely, the question of whether an AI company has scraped content for its own business purposes without permission is a thorny one. 

At best, you're likely to get a mealy-mouthed explanation of "curated datasets", and at worst, a polemic about whether everything on the internet is essentially fair game.

Now a document obtained by 404media appears to show that part of the data used to train Runway's latest AI video generation tool, Gen-3, may have come from the YouTube channels of thousands of popular media companies, including Pixar, Netflix, Disney and Sony.

While 404media doesn't go into details as to how the document was obtained, nor could it verify that every video mentioned within was used to train Gen-3, it's potentially an insight into the sort of practices that an AI company might use to scrape copyrighted material to train its models.

A former Runway employee spoke to 404media about the methodology involved. The 14 spreadsheets contained within the leaked document are said to feature terms like "beach" or "rain", with the names of Runway employees next to them. 

According to the source, these names were said to be employees tasked with finding videos or channels related to these keywords, who would then go on to use a YouTube video downloader tool via a proxy to scrape them from the site without being blocked by Google.

It's not just YouTube content that looks to have been scraped, either. A spreadsheet containing 14 links to non-YouTube sources, including a link to a website dedicated to streaming popular cartoons and animated movies, with thousands of copyright complaints logged against it. 

Essentially, pirated media looks to have been at least under consideration for training data, if not directly scraped and used.

AI, explained

OpenAI logo displayed on a phone screen and ChatGPT website displayed on a laptop screen are seen in this illustration photo taken in Krakow, Poland on December 5, 2022.

(Image credit: Jakub Porzycki/NurPhoto via Getty Images)

What is artificial general intelligence?: We dive into the lingo of AI and what the terms actually mean.

404media actually went one step further, and attempted to use Gen-3 to generate video using prompts that contained keywords based on the terms found in the spreadsheet, and was able to create clips that looked to be very much in the same style as the associated content.

Runway was itself part-funded by Google, among others, so scraping content without permission from creators on its platforms, if true, is likely to land it in significant hot water. Never mind the potential wider legal repercussions.

Still, while the issue of AI content theft is a thorny one, the model does still appear to have issues. Ars Technica tried creating some videos recently with Gen-3 Alpha, and it gave a cat a pair of human hands. I'm not sure what content was used to train that particular version of the model, but I'd suggest that no matter the methodology used here, it could do with some work one way or the other.

Читайте на 123ru.net


Новости 24/7 DirectAdvert - доход для вашего сайта



Частные объявления в Вашем городе, в Вашем регионе и в России



Smi24.net — ежеминутные новости с ежедневным архивом. Только у нас — все главные новости дня без политической цензуры. "123 Новости" — абсолютно все точки зрения, трезвая аналитика, цивилизованные споры и обсуждения без взаимных обвинений и оскорблений. Помните, что не у всех точка зрения совпадает с Вашей. Уважайте мнение других, даже если Вы отстаиваете свой взгляд и свою позицию. Smi24.net — облегчённая версия старейшего обозревателя новостей 123ru.net. Мы не навязываем Вам своё видение, мы даём Вам срез событий дня без цензуры и без купюр. Новости, какие они есть —онлайн с поминутным архивом по всем городам и регионам России, Украины, Белоруссии и Абхазии. Smi24.net — живые новости в живом эфире! Быстрый поиск от Smi24.net — это не только возможность первым узнать, но и преимущество сообщить срочные новости мгновенно на любом языке мира и быть услышанным тут же. В любую минуту Вы можете добавить свою новость - здесь.




Новости от наших партнёров в Вашем городе

Ria.city

В Якутии отмечают пятилетие открытия пассажирского движения до железнодорожной станции Нижний Бестях

Что нельзя делать 28 июля в День крещения Руси

«Едадил» представил российский индекс гамбургера

Московский «Спартак» официально объявил о подписании вратаря «Шинника»

Музыкальные новости

Второй тур РПЛ: прямая трансляция выездного матча команды Алипа

24 июля директор филиала «Северный» ООО «ЛокоТех-Сервис» Андрей Дружков провёл встречу с участниками ключевого кадрового резерва на управленческие должности.

Футболисты клуба «Луки-Энергия» встретятся с «Динамо-СПб» 28 июля

Сергей Собянин. Неделя мэра

Новости России

День крещения Руси отметят православные верующие России 28 июля 2024 года

Арестованный по делу Булгакова бизнесмен владел фирмой по производству свинины

Из-за глобального потепления в Москве появились новые животные

Mash: счета обвиняемого в коррупции генерала Булгакова арестованы

Экология в России и мире

Blankspot: Арест Игбала Абилова очередное преступление бакинского диктатора Алиева. После войны в Нагорном Карабахе положение талышей в Азербайджане ухудшилось

Модные показы и лекции стилистов запланированы на форуме-фестивале «Территория будущего. Москва 2030» в «Зарядье»

Смириться нельзя выздороветь. Как живут и справляются с трудностями люди, перенесшие инсульт

Вкусные оттенки зеленого: модный цвет сезона

Спорт в России и мире

Олимпийка с титулом // Теннисистка Мирра Андреева перед стартом Игр в Париже впервые выиграла турнир WTA

Лекарство против будней: почему предстоящая Олимпиада в Париже будет уникальна для России

Теннисистка Рыбакина снялась с Олимпиады

Рублёв пробился в полуфинал турнира ATP в Умаге

Moscow.media

В горах Кавказа

Идёт экстренная эвакуация: в Челябинской области прорвало дамбу

Филиал № 4 ОСФР по Москве и Московской области информирует: С 1 августа Соцфонд увеличит страховые пенсии россиян

Беспроводной сканер штрих-кодов SAOTRON P05i промышленного класса











Топ новостей на этот час

Rss.plus






Митрофорный протоиерей Владимир Полторак: Православных мучеников почитают и в Литве

Мария Шукшина предположила, что ее отца могли отравить

Мужчина в Дмитрове обезглавил сожительницу и попал под машину при попытке сбежать

Адвокат Алсу Крючков не увидел перспектив сохранения брака певицы с Абрамовым