Добавить новость

Депутат Нилов предложил не штрафовать водителей за тонировку передних боковых стекол автомобиля

Глава Ступина обсудил здравоохранение в рамках еженедельного здравчаса

Госветслужба Подмосковья провела 49 тыс исследований овощей на безопасность

В ЦИК России рассказали о прекращении предвыборной агитации на этой неделе



News in English


Новости сегодня

Новости от TheMoneytizer

Reddit's CEO says Microsoft, Anthropic, and Perplexity scraping content is 'a real pain in the ass'

Steve Huffman called out Microsoft, Anthropic, and Perplexity for using Reddit's data to train their AI models without permission.
  • Reddit's CEO slammed Microsoft, Anthropic, and Perplexity for using the social platform's data for free.
  • The three companies previously landed in trouble for training their AI models on data without permission.
  • Paying for data could cost AI companies "hundreds of billions of dollars," Andreessen Horowitz said last year.

AI companies have been combing Reddit to train their models — and Reddit isn't happy about it.

Steve Huffman, the CEO of Reddit, has called out Microsoft, Anthropic, and Perplexity for using Reddit's data to train their AI models without paying.

"We've had Microsoft, Anthropic, and Perplexity act as though all of the content on the internet is free for them to use," Huffman told The Verge, saying that blocking these companies has been "a real pain in the ass."

AI companies use web crawlers — bots designed to download information from the internet — which Reddit has been trying to block, by changing its policies to stop companies that do not pay for collecting Reddit's data, Bloomberg reported.

"When it was used for simple search, to create simple links that would send us traffic from search engines, that was fine," Huffman told Bloomberg. "But now folks are using Reddit data for training, they're reselling it, they're doing search summaries instead of linking to us."

Google is the only known major AI player to have an agreement with Reddit. The Alphabet-owned company signed a deal with Reddit's data to train its AI model for $60 million annually, Reuters reported in February.

This isn't the first time that Microsoft, Anthropic, and Perplexity have come under fire for training their models using data without permission.

In June, Anthropic and Microsoft-backed OpenAI were found to have violated a rule known as robots.txt, which denies web crawlers permission to access and collect content on certain websites.

While it is an unofficial rule, OpenAI and Anthropic have publicly stated that they respect robots.txt and do not collect data from websites that block their web crawlers. A spokeswoman for OpenAI declined to comment, while a spokesperson for Anthropic did not respond to emails seeking comment.

Microsoft's head of search posted on X earlier this week that Reddit blocked Bing, "favoring another engine." Microsoft did not immediately respond to requests for comment.

Perplexity also got in hot water for plagiarizing several news outlets. In June, Forbes accused Perplexity of "ripping off" several articles from various publications in its own AI-generated podcast and stories without properly attributing its sources.

The AI search engine was also found to have violated the robots.txt rule and was "paraphrasing WIRED stories, and at times summarizing stories inaccurately and with minimal attribution," wrote Wired in a June investigation.

Perplexity did not respond to a request for comment from Business Insider.

Debates about copyright and paying for data to train AI models have been rife among major AI players. Leading venture-capital firm Andreessen Horowitz said last year that paying for data would cost developers "tens or hundreds of billions of dollars a year in royalty payments" and put a dent in AI investments.

While Meta has also been skeptical about striking deals for data, the company has considered deals with news publishers to access news and media content, BI reported in May.

BI parent company Axel Springer inked a deal last year with OpenAI to use content from brands including BI and Politico to train its AI models.

Read the original article on Business Insider

Читайте на 123ru.net


Новости 24/7 DirectAdvert - доход для вашего сайта



Частные объявления в Вашем городе, в Вашем регионе и в России



Smi24.net — ежеминутные новости с ежедневным архивом. Только у нас — все главные новости дня без политической цензуры. "123 Новости" — абсолютно все точки зрения, трезвая аналитика, цивилизованные споры и обсуждения без взаимных обвинений и оскорблений. Помните, что не у всех точка зрения совпадает с Вашей. Уважайте мнение других, даже если Вы отстаиваете свой взгляд и свою позицию. Smi24.net — облегчённая версия старейшего обозревателя новостей 123ru.net. Мы не навязываем Вам своё видение, мы даём Вам срез событий дня без цензуры и без купюр. Новости, какие они есть —онлайн с поминутным архивом по всем городам и регионам России, Украины, Белоруссии и Абхазии. Smi24.net — живые новости в живом эфире! Быстрый поиск от Smi24.net — это не только возможность первым узнать, но и преимущество сообщить срочные новости мгновенно на любом языке мира и быть услышанным тут же. В любую минуту Вы можете добавить свою новость - здесь.




Новости от наших партнёров в Вашем городе

Ria.city

Сборная России по футболу прилетела из Вьетнама

Явка избирателей в Подмосковье на 10:00 8 сентября составила 18,89%

Памфилова: в 26 регионах более 3 млн граждан проголосовали дистанционно

Посетителям торгового центра в Москве пришлось ломать двери при эвакуации

Музыкальные новости

Делегация ГУАП посетила научно-технологический центр и заводы ПАО «КАМАЗ»

Российские школьники выиграли четыре золота на Олимпиаде в Египте

Певец Дмитрий Маликов провел интерактивное шоу для юных жителей Химок

«Можно гордиться»: Путин поздравил москвичей с Днём города и открыл новые объекты столичной инфраструктуры

Новости России

Продвижение Музыки. Раскрутка Музыки. Продвижение Песни. Раскрутка Песни.

Россия XVI века, или Как началось Новое время?

Явка избирателей в Подмосковье на 10:00 8 сентября составила 18,89%

«Последствия наблюдаются до сих пор»: какой след в истории США оставил Уотергейтский скандал

Экология в России и мире

Продвижение Стихов. Раскрутка Стихов. Продвижение Песни. Раскрутка Песни.

“Фанагория” получила сразу 7 высоких наград Международного конкурса Asia Wine Сhallenge в китайском Гонконге

Заигрывание с Турцией ослабляет позиции России в Закавказье и на Ближнем Востоке

Чудское озеро: где находится и что посмотреть

Спорт в России и мире

«Я живу в Москве, а не в США»

Стали известны все полуфиналисты Открытого чемпионата США у мужчин

ATP и WTA могут завершить коммерческое слияние в первой половине 2025 года (Front Office Sports)

Соболенко выиграла второй «Большой шлем» в сезоне и третий в карьере

Moscow.media

Заигрывание с Турцией ослабляет позиции России в Закавказье и на Ближнем Востоке

Портативный ТСД корпоративного класса Saotron RT-T70

Стартовал монтаж центральной секции пролета путепровода в подмосковном Красногорске

ТСД SAOTRON RT41 GUN: практичный, производительный, надёжный











Топ новостей на этот час

Rss.plus






Патриотический квиз и мастер-классы пройдут на Болотной площади 8 сентября

Маршруты наземного транспорта изменились к открытию станций Троицкой линии метро

Собянин: 55 корпусов разнопрофильных больниц построили в Москве с 2011 года

Ученые: Ртуть высвобождается в атмосферу из-за таяния ледников