The New York Times and other top news sites block OpenAI's new SearchGPT web crawling bot

03.08.2024 00:03

BusinessInsider.com

Sam Altman, CEO of OpenAI, speaks at a conference in San Francisco

ANDREW CABALLERO-REYNOLDS/Getty Images

OpenAI unveiled a new search engine called SearchGPT last week.
Several top publisher sites are already blocking the related OpenAI web crawler, OAI-SearchBot.
OpenAI says this new bot doesn't collect data for AI model training. Some publishers probably don't believe that.

About a week after OpenAI launched SearchGPT, some of the top news publishers have made clear they want nothing to do with the startup's new search engine.

The New York Times and at least 13 other news sites have blocked OAI-SearchBot. This is the web crawler that indexes information so OpenAI can retrieve and show relevant results to SearchGPT users.

Originality.ai tracks this stuff and it found that 14 of the top 1,000 website publishers have blocked OAI-SearchBot. Other publications on the list include Wired, The New Yorker, Vogue, Vanity Fair, and GQ.

This is a bit of a head-scratcher, according to Jon Gillham, CEO of Originality.ai.

"I am not sure why any publisher would block it," he told Business Insider. "It is traffic that publishers want and need."

When OpenAI unveiled SearchGPT last week it stressed that OAI-SearchBot does not crawl the web to collect data to train its AI models like GPT-5. And it advised website owners to allow the new bot to "ensure your site appears in search results."

Without crawler access to every website, OpenAI's SearchGPT services risks being less complete than Google's Search engine. BI asked Gillham whether any major news publishers block Google's search bot and he said he doesn't know of any that do.

A lack of trust, or search traffic doubts

There's another OpenAI web crawler, called GPTbot, that scoops up online data for AI model training. Hundreds of websites have already blocked this. That makes more sense: You want traffic from search engines, but you don't want to give away your content to train AI models that will likely compete against you.

However, OpenAI spent years collecting online data without permission. Maybe publishers just don't trust OpenAI when it says its new search bot won't also secretly suck up their content for AI training data?

"I think so," Gillham said.

Another theory: Search results these days don't always send users to the websites that worked hard to create the original content. Part of the goal with new AI-powered search engines is to keep users around by showing them summaries. If publishers aren't seeing huge traffic from search engines anymore, why bother allowing their web crawling bots?

A complaint from The New York Times

Gillham also noted that OpenAI has been busy this year cutting deals with publishers to use their content archives. (Business Insider parent Axel Springer signed one of these.)

"Seems like it was an intentional sequence of steps with OpenAI, first cozy up to publishers signing all of these partnership deals and then announcing SearchGPT," Gillham added.

The major holdout among publishers is The New York Times. It has sued OpenAI and Microsoft, alleging the tech companies unlawfully use its work to create competing products.

"The Times does not authorize the use of our works for generative search or AI training purposes without an express written agreement, regardless of whether we do or do not block or restrict any particular bot from crawling our content," Charlie Stadtlander, a spokesman for The New York Times, said in a statement.

In its complaint against OpenAI and Microsoft, The New York Times touched on this issue of search engines becoming more AI-powered and potentially siphoning off traffic from publishers.

"Defendants also use Microsoft's Bing search index, which copies and categorizes The Times's online content, to generate responses that contain verbatim excerpts and detailed summaries of Times articles that are significantly longer and more detailed than those returned by traditional search engines," the publisher wrote in its complaint. "By providing Times content without The Times's permission or authorization, Defendants' tools undermine and damage The Times's relationship with its readers and deprive The Times of subscription, licensing, advertising, and affiliate revenue."

OpenAI did not respond to requests for comment.

Do you work at OpenAI? Do you use their models? Have a tip, tirade or opinion you feel like sharing? Get in touch with Darius Rafieyan by phone or Signal at +1-714-651-1367 or email at drafieyan@insider.com

Read the original article on Business Insider

Новости от наших партнёров в Вашем городе

Ria.city

123ru.net

СКР проверит данные о митинге с экстремистскими лозунгами в МФЮА

В Подмосковье подвели итого поискового сезона «Вахта Памяти — 2024»

Глава Галского района Пилия: все госучреждения Абхазии работают в штатном режиме

В центральный аппарат СК России будет доложено о расследовании возможных противоправных действий в одном из столичных учебных заведений

Музыкальные новости

Bigpot.news

Волейболисты московского «Динамо» обыграли АСК в матче чемпионата России

В Поморье проходит третий форум победителей конкурсов грантов губернатора Архангельской области

Семья из Пермского края победила в конкурсе Ирины Дубцовой «Главное – Семья»

Светлану Светличную похоронят на Троекуровском кладбище в Москве

Новости России

29ru.net

Лидер московских коммунистов Николай Зубрилин: Москвичи поддерживают начинание КПРФ об отмене ДЭГа и трёхдневного голосования

Главы МИД ЕС обсудят новые санкции против России и Ирана

В ночь на 18 ноября ожидается максимум "падающих звезд"

Критик Песочинский: для снижения цен на билеты надо больше финансировать театры

Экология в России и мире

Life24.pro

Приглашаем на VII Большой детский фестиваль

Компания ICDMC стала “Выбором потребителей” в 2024 году

Продвижение Песни в Мою Волну музыкального стриминга Яндекс Музыка.

Спорт в России и мире

News.tennis

Теннисист Рублев проиграл Рууду на Итоговом турнире ATP

Рублёв: надо научиться эмоционально вести себя правильно

Ни один теннисист не вышел в полуфинал Итогового турнира ATP — 2024 по итогам двух туров

Непреодолимая преграда: Медведев снова проиграл Синнеру и не смог выйти в полуфинал Итогового турнира ATP

Moscow.media

News24.pro

Авария произошла на внутренней стороне 93-го километра МКАД

Alexandr Mers выпустил новый трек "EIN LICHT"

В ночь на 18 ноября ожидается максимум "падающих звезд"

Критик Песочинский: для снижения цен на билеты надо больше финансировать театры

A lack of trust, or search traffic doubts

A complaint from The New York Times

Читайте на 123ru.net

Модные новости

Реклама

Деньги

Фоторепортажи

Частные объявления в Вашем городе, в Вашем регионе и в России

Новости от наших партнёров в Вашем городе

СКР проверит данные о митинге с экстремистскими лозунгами в МФЮА

В Подмосковье подвели итого поискового сезона «Вахта Памяти — 2024»

Глава Галского района Пилия: все госучреждения Абхазии работают в штатном режиме

В центральный аппарат СК России будет доложено о расследовании возможных противоправных действий в одном из столичных учебных заведений

Волейболисты московского «Динамо» обыграли АСК в матче чемпионата России

В Поморье проходит третий форум победителей конкурсов грантов губернатора Архангельской области

Семья из Пермского края победила в конкурсе Ирины Дубцовой «Главное – Семья»

Светлану Светличную похоронят на Троекуровском кладбище в Москве

Лидер московских коммунистов Николай Зубрилин: Москвичи поддерживают начинание КПРФ об отмене ДЭГа и трёхдневного голосования

Главы МИД ЕС обсудят новые санкции против России и Ирана

В ночь на 18 ноября ожидается максимум "падающих звезд"

Критик Песочинский: для снижения цен на билеты надо больше финансировать театры

Приглашаем на VII Большой детский фестиваль

Приглашаем на VII Большой детский фестиваль

Компания ICDMC стала “Выбором потребителей” в 2024 году

Продвижение Песни в Мою Волну музыкального стриминга Яндекс Музыка.

Теннисист Рублев проиграл Рууду на Итоговом турнире ATP

Рублёв: надо научиться эмоционально вести себя правильно

Ни один теннисист не вышел в полуфинал Итогового турнира ATP — 2024 по итогам двух туров

Непреодолимая преграда: Медведев снова проиграл Синнеру и не смог выйти в полуфинал Итогового турнира ATP

Школьники из России и Беларуси стали победителями международной олимпиады по креативному программированию наряду с участниками из 12 стран

Семья из Пермского края победила в конкурсе Ирины Дубцовой «Главное – Семья»

Ночная Кимжа...

ТСД SAOTRON RT41 GUN: практичный, производительный, надёжный

Топ новостей на этот час

Более полутысячи человек посетили ярмарку вакансий в Мытищах

Баскетбольный «Зенит» обыграл МБА-МАИ с разницей в 21 очко, а ПБК ЦСКА разгромил «Астану» с преимуществом в 60 очков

В ночь на 18 ноября ожидается максимум "падающих звезд"

Критик Песочинский: для снижения цен на билеты надо больше финансировать театры