Добавить новость

РЕН ТВ: люди выпрыгивают в поле из-за остановки электрички в Орехово-Зуеве

Эксперт рассказала о роли искусственного интеллекта в разработке лекарств

Россиянам посоветовали есть авокадо, печень и ореха для получения витамина Е

Жители Красногвардейского района приняли участие в разработке проекта набережной





Новости сегодня

Новости от TheMoneytizer

Reddit's CEO says Microsoft, Anthropic, and Perplexity scraping content is 'a real pain in the ass'

Reddit partnered with Google in a $60 million annual deal to use the social media platform's content to train Google's AI.

Reddit CEO Steve Huffman stands on the floor of the New York Stock Exchange after ringing a bell setting the share price at $47 in its initial public offering on March 21, 2024 in New York City.
Steve Huffman called out Microsoft, Anthropic, and Perplexity for using Reddit's data to train their AI models without permission.
  • Reddit's CEO slammed Microsoft, Anthropic, and Perplexity for using the social platform's data for free.
  • The three companies previously landed in trouble for training their AI models on data without permission.
  • Paying for data could cost AI companies "hundreds of billions of dollars," Andreessen Horowitz said last year.

AI companies have been combing Reddit to train their models — and Reddit isn't happy about it.

Steve Huffman, the CEO of Reddit, has called out Microsoft, Anthropic, and Perplexity for using Reddit's data to train their AI models without paying.

"We've had Microsoft, Anthropic, and Perplexity act as though all of the content on the internet is free for them to use," Huffman told The Verge, saying that blocking these companies has been "a real pain in the ass."

AI companies use web crawlers — bots designed to download information from the internet — which Reddit has been trying to block, by changing its policies to stop companies that do not pay for collecting Reddit's data, Bloomberg reported.

"When it was used for simple search, to create simple links that would send us traffic from search engines, that was fine," Huffman told Bloomberg. "But now folks are using Reddit data for training, they're reselling it, they're doing search summaries instead of linking to us."

Google is the only known major AI player to have an agreement with Reddit. The Alphabet-owned company signed a deal with Reddit's data to train its AI model for $60 million annually, Reuters reported in February.

This isn't the first time that Microsoft, Anthropic, and Perplexity have come under fire for training their models using data without permission.

In June, Anthropic and Microsoft-backed OpenAI were found to have violated a rule known as robots.txt, which denies web crawlers permission to access and collect content on certain websites.

While it is an unofficial rule, OpenAI and Anthropic have publicly stated that they respect robots.txt and do not collect data from websites that block their web crawlers. A spokeswoman for OpenAI declined to comment, while a spokesperson for Anthropic did not respond to emails seeking comment.

Microsoft's head of search posted on X earlier this week that Reddit blocked Bing, "favoring another engine." Microsoft did not immediately respond to requests for comment.

Perplexity also got in hot water for plagiarizing several news outlets. In June, Forbes accused Perplexity of "ripping off" several articles from various publications in its own AI-generated podcast and stories without properly attributing its sources.

The AI search engine was also found to have violated the robots.txt rule and was "paraphrasing WIRED stories, and at times summarizing stories inaccurately and with minimal attribution," wrote Wired in a June investigation.

Perplexity did not respond to a request for comment from Business Insider.

Debates about copyright and paying for data to train AI models have been rife among major AI players. Leading venture-capital firm Andreessen Horowitz said last year that paying for data would cost developers "tens or hundreds of billions of dollars a year in royalty payments" and put a dent in AI investments.

While Meta has also been skeptical about striking deals for data, the company has considered deals with news publishers to access news and media content, BI reported in May.

BI parent company Axel Springer inked a deal last year with OpenAI to use content from brands including BI and Politico to train its AI models.

Read the original article on Business Insider

Читайте на 123ru.net


Новости 24/7 DirectAdvert - доход для вашего сайта



Частные объявления в Вашем городе, в Вашем регионе и в России



Smi24.net — ежеминутные новости с ежедневным архивом. Только у нас — все главные новости дня без политической цензуры. "123 Новости" — абсолютно все точки зрения, трезвая аналитика, цивилизованные споры и обсуждения без взаимных обвинений и оскорблений. Помните, что не у всех точка зрения совпадает с Вашей. Уважайте мнение других, даже если Вы отстаиваете свой взгляд и свою позицию. Smi24.net — облегчённая версия старейшего обозревателя новостей 123ru.net. Мы не навязываем Вам своё видение, мы даём Вам срез событий дня без цензуры и без купюр. Новости, какие они есть —онлайн с поминутным архивом по всем городам и регионам России, Украины, Белоруссии и Абхазии. Smi24.net — живые новости в живом эфире! Быстрый поиск от Smi24.net — это не только возможность первым узнать, но и преимущество сообщить срочные новости мгновенно на любом языке мира и быть услышанным тут же. В любую минуту Вы можете добавить свою новость - здесь.




Новости от наших партнёров в Вашем городе

Ria.city

Музыкально-поэтический вечер пройдет в центральном парке Лобни 2 августа

Матвиенко объяснила, для чего Центробанк поднял ключевую ставку

«Экология – дело каждого»: Детского радио приглашает к участию

Омбудсмен Подмосковья Фаевская провела личный прием 17 граждан в июле

Музыкальные новости

Компания ICDMC стала лауреатом премии "Здоровое питание"

"Локомотив" обыграл "Ростов" в первом туре Кубка России

Собянин сообщил о строительстве развязки у будущей станции метро «Корниловская»

Лес, тайга, реки, земля, Сибирь и вся Россия – гастрономический фестиваль ТАЙГАСТРО 2024

Новости России

Готовность обхода Октябрьского на трассе М-5 Урал в Подмосковье приблизилась к 90 %

Яд в бульоне. Врач объяснила, из каких съедобных грибов не стоит варить суп

Музыкально-поэтический вечер пройдет в центральном парке Лобни 2 августа

Командир спецназа Николаев покажет, как правильно сдавать нормы ГТО

Экология в России и мире

Эти яркие и стильные вещи украсят ваше лето

Осторожно, слепни! Доктор Кутушов предупредил об опасных насекомых

Сотрудники филиала «Красноярский» компании «ЛокоТех-Сервис» стали серебряными призерами Спартакиады РЖД

Молодые ученые смогут посетить региональную лабораторию ВЫЗОВ в Челябинске

Спорт в России и мире

Гауфф вышла в третий круг на дебютной для себя Олимпиаде

Рейтинг ATP. Рублев обошел Рууда, Берреттини вернулся в топ-50, Нишиока поднялся на 36 строчек

Теннисист Медведев вылетел с Олимпиады после обидного поражения

Медведев обыграл австрийца Офнера и вышел в третий круг Олимпиады-2024

Moscow.media

В ромашках.

iSpring добавила субтитры в конструктор курсов iSpring Suite

Тюменца отправили в колонию за умышленное заражение подруги ВИЧ

В iSpring Learn появилась удобная база знаний











Топ новостей на этот час

Rss.plus






Профилактические работы завершились центре «Дельфин» в Ленинском округе

Суд отказал в иске на 368 млн рублей к реставраторам кремля в Нижнем Новгороде

Яд в бульоне. Врач объяснила, из каких съедобных грибов не стоит варить суп

Политолог Фетисов оценил масштабные проекты развития на Ставрополье