Добавить новость

Экс-замглавы МЧС Барышева подозревают в мошенничестве на 20 млн рублей

NBC: Хантер Байден собирается признать свою вину в деле о нарушениях по налогам

Депутат Нилов предложил не штрафовать водителей за тонировку передних боковых стекол автомобиля

«Отец вундеркиндов» Евгений Тепляков напал на пенсионерку за замечание: женщину госпитализировали





Новости сегодня

Новости от TheMoneytizer

Reddit's CEO says Microsoft, Anthropic, and Perplexity scraping content is 'a real pain in the ass'

Steve Huffman called out Microsoft, Anthropic, and Perplexity for using Reddit's data to train their AI models without permission.
  • Reddit's CEO slammed Microsoft, Anthropic, and Perplexity for using the social platform's data for free.
  • The three companies previously landed in trouble for training their AI models on data without permission.
  • Paying for data could cost AI companies "hundreds of billions of dollars," Andreessen Horowitz said last year.

AI companies have been combing Reddit to train their models — and Reddit isn't happy about it.

Steve Huffman, the CEO of Reddit, has called out Microsoft, Anthropic, and Perplexity for using Reddit's data to train their AI models without paying.

"We've had Microsoft, Anthropic, and Perplexity act as though all of the content on the internet is free for them to use," Huffman told The Verge, saying that blocking these companies has been "a real pain in the ass."

AI companies use web crawlers — bots designed to download information from the internet — which Reddit has been trying to block, by changing its policies to stop companies that do not pay for collecting Reddit's data, Bloomberg reported.

"When it was used for simple search, to create simple links that would send us traffic from search engines, that was fine," Huffman told Bloomberg. "But now folks are using Reddit data for training, they're reselling it, they're doing search summaries instead of linking to us."

Google is the only known major AI player to have an agreement with Reddit. The Alphabet-owned company signed a deal with Reddit's data to train its AI model for $60 million annually, Reuters reported in February.

This isn't the first time that Microsoft, Anthropic, and Perplexity have come under fire for training their models using data without permission.

In June, Anthropic and Microsoft-backed OpenAI were found to have violated a rule known as robots.txt, which denies web crawlers permission to access and collect content on certain websites.

While it is an unofficial rule, OpenAI and Anthropic have publicly stated that they respect robots.txt and do not collect data from websites that block their web crawlers. A spokeswoman for OpenAI declined to comment, while a spokesperson for Anthropic did not respond to emails seeking comment.

Microsoft's head of search posted on X earlier this week that Reddit blocked Bing, "favoring another engine." Microsoft did not immediately respond to requests for comment.

Perplexity also got in hot water for plagiarizing several news outlets. In June, Forbes accused Perplexity of "ripping off" several articles from various publications in its own AI-generated podcast and stories without properly attributing its sources.

The AI search engine was also found to have violated the robots.txt rule and was "paraphrasing WIRED stories, and at times summarizing stories inaccurately and with minimal attribution," wrote Wired in a June investigation.

Perplexity did not respond to a request for comment from Business Insider.

Debates about copyright and paying for data to train AI models have been rife among major AI players. Leading venture-capital firm Andreessen Horowitz said last year that paying for data would cost developers "tens or hundreds of billions of dollars a year in royalty payments" and put a dent in AI investments.

While Meta has also been skeptical about striking deals for data, the company has considered deals with news publishers to access news and media content, BI reported in May.

BI parent company Axel Springer inked a deal last year with OpenAI to use content from brands including BI and Politico to train its AI models.

Read the original article on Business Insider

Читайте на 123ru.net


Новости 24/7 DirectAdvert - доход для вашего сайта



Частные объявления в Вашем городе, в Вашем регионе и в России



Smi24.net — ежеминутные новости с ежедневным архивом. Только у нас — все главные новости дня без политической цензуры. "123 Новости" — абсолютно все точки зрения, трезвая аналитика, цивилизованные споры и обсуждения без взаимных обвинений и оскорблений. Помните, что не у всех точка зрения совпадает с Вашей. Уважайте мнение других, даже если Вы отстаиваете свой взгляд и свою позицию. Smi24.net — облегчённая версия старейшего обозревателя новостей 123ru.net. Мы не навязываем Вам своё видение, мы даём Вам срез событий дня без цензуры и без купюр. Новости, какие они есть —онлайн с поминутным архивом по всем городам и регионам России, Украины, Белоруссии и Абхазии. Smi24.net — живые новости в живом эфире! Быстрый поиск от Smi24.net — это не только возможность первым узнать, но и преимущество сообщить срочные новости мгновенно на любом языке мира и быть услышанным тут же. В любую минуту Вы можете добавить свою новость - здесь.




Новости от наших партнёров в Вашем городе

Ria.city

«Вопрос времени»: в США заявили о неизбежности ядерной войны

МЧС: в здании на Промышленном проезде в Москве произошел пожар в типографии

«Нужно паяльник вернуть в одно место и еще что-то сделать»: Грамматиков передумал завершать кинокарьеру

Ученые нашли новые опасные последствия курения вейпов

Музыкальные новости

Общество: Путин открыл первую очередь кинопарка «Москино», готового соревноваться с Голливудом

“Фанагория” получила сразу 7 высоких наград Международного конкурса Asia Wine Сhallenge в китайском Гонконге

Представитель Дзюбы — о скандале с Артемом: «Игроки «Амкала» повели себя не по-пацански»

Певица Алла Рид выступила на вечере в честь юбилея комедии "В джазе только девушки»

Новости России

Власти Ирана объявили о планах сменить столицу страны

Разочарование для фанатов: Юбилейный концерт группы «Курара» в Москве не состоится

"Не ищите виноватых": юбилейный концерт группы "Курара" отменили

​Прудников: «Столько пришлось пролететь ради одного матча»

Экология в России и мире

Гастроэнтеролог Садыков объяснил, для чего нужна бесшлаковая диета

Работники СЛД «Магдагачи» филиала «Забайкальский» компании «ЛокоТех-Сервис» организовали экологический десант

Продвижение Стихов. Раскрутка Стихов. Продвижение Песни. Раскрутка Песни.

Питчинг Релиза. Питчинг релиза Яндекс музыка. Питчинг релиза ВК.

Спорт в России и мире

Соболенко обыграла шестую ракетку в финале Открытого чемпионата США по теннису

Камилла Рахимова выиграла «челленджер» в Гвадаллахаре

Российская теннисистка Шнайдер заявила, что больше не живет в США

Теннисистка Петрова назвала Синнера фаворитом US Open

Moscow.media

Капремонт участка трассы Улан-Удэ – Романовка – Чита в Бурятии выполнен на 70 %

Ремонт участков двух региональных дорог на Ямале выполнен более чем наполовину

Портативный ТСД корпоративного класса Saotron RT-T70

Орловской полицией задержан пособник мошенников за помощь в обмане пенсионерки на 400 тысяч рублей











Топ новостей на этот час

Rss.plus






Что произошло 8 сентября в истории Якутии

Ветеран Великой Отечественной войны проголосовала на выборах в Подмосковье

Джо Байден провел 532 дня в отпуске менее чем за 4 года президентства

В Барнауле сменился главный "речник" на фоне рекордных цифр по перевозке грузов