Добавить новость

Самые редкие имена новорожденных назвали в Королеве в 2024 г

Объем реализованной на торгах городской недвижимости вырос более чем на 40%

Россиянам посоветовали использовать нашатырный спирт для выпрямления брюк

Юбилейный забег проекта «5 верст» в Клину состоится в новом формате





Новости сегодня

Новости от TheMoneytizer

ChatGPT Users Want Help With Homework. They’re Also Very Horny.

Photo-Illustration: Intelligencer; Photo: WildChat/The Allen Institute for AI

A recent research paper sounded an alarm for AI developers: Training data is drying up. Concerns about theft, copyright, and commercial competition are leading public and semi-public resources to tighten protections against AI scraping. The result, the paper’s authors argue, “will impact not only commercial AI, but also non-commercial AI and academic research” by “biasing the diversity, freshness, and scaling laws for general-purpose AI systems.” It’s an interesting problem that’s already starting to bite. It was also probably inevitable. A bunch of companies are raising and spending money to steal data, and the people and companies they’re stealing from are not pleased.

Deeper in the report, researchers for the Data Provenance Institute identified another problem: Not only is the data drying up, but what remains available is out of step with what AI companies need most, at least according to their users. They included this set of charts:

Photo-Illustration: Intelligencer; Photo: The Data Provenance Institute

AI companies are training on a ton of news and encyclopedia content, in large part because that’s what’s available to scrapers in great quantities. (In the top chart, “tokens” can be understood as units of training data in sampled sources.) Meanwhile, actual ChatGPT users are barely engaging with news at all. In reality, they’re asking ChatGPT to write stories, often of a sexual nature. They’re asking it for ideas, for assistance with research and code, and for help with homework. But, again, they’re very horny. This is, as the paper notes, an issue for model training, accuracy, and bias: People aren’t using these things in ways that match the data on which they’re trained, and AI model performance is very much determined by the quality and quantity of training data. It’s also out of step with a lot of the discourse around AI, in which concerns about the news, disinformation, and the media in general have played — for reasons both novel and obvious — an outsize role. ChatGPT users are asking a newsbot to write erotic fiction. Not ideal!

But wait — since when do we know how people are actually using ChatGPT? OpenAI doesn’t share data like this, which would be extremely valuable to people trying to figure out what’s going on with the company and with AI in general. On this, the Data Provenance Institute cites WildChat, a project from the Allen Institute for AI, a nonprofit funded by Microsoft co-founder Paul Allen. Researchers “offered free access to ChatGPT for online users in exchange for their affirmative, consensual opt-in to anonymously collect their chat transcripts,” resulting in a data set of “1 million user-ChatGPT conversations.” These conversations aren’t perfectly representative of ChatGPT use — researchers warn that because of where it was provided, and the fact that it allowed for anonymous use, it probably overselected for tech-inclined users and people who “prefer to engage in discourse they would avoid on platforms that require registration.” In any case, these conversations are searchable, and they’re some of the most illuminating things I’ve ever seen on the question of what people actually expect from their chatbots.

To get this one out of the way, the horniness is relentless — search any explicit term and you’ll get hundreds of conversations in which persistent users are trying (and usually failing) to get ChatGPT to write erotic stories about video-game characters, celebrities, or themselves. There’s a huge amount of “explanation” that’s very clearly just help with schoolwork — a fascinating Washington Post analysis of the data found that about one in six conversations was basically about homework:

Photo-Illustration: Intelligencer; Photo: WildChat/Allen Institute forAI

There’s also a great deal of assistance with interpersonal issues and communication: help writing messages for work and school, but also dating apps:

Photo-Illustration: Intelligencer; Photo: WildChat/Allen Institute forAI

Again, if you’re not sure what people are getting from services like ChatGPT, and trying them yourself hasn’t helped, poke around here for a while. It’s probably not ideal for OpenAI (and others) that users spend so much time trying to coax chatbots into doing things they’re not supposed to, or into helping them do things that they’re not supposed to, but the broader sense you get from these interactions is that, generally, a lot of ChatGPT users expect the chatbot to be capable of a really wide range of things — they treat it like a more comprehensive resource than it probably is and more like a person — which indicates belief, trust, and plausible demand.

Glimpses into real user habits for new technologies are pretty rare — the last time I remember being able to eavesdrop such strange, rich, and occasionally bracing material like this was when AOL released a massive cache of search logs back in 2006, revealing that its users were talking to the search engine, revealing incredibly poignant and sometimes dark secrets in the course of something like — but also clearly unlike — conversation. (It doesn’t take long to find similarly moving material in the anonymized WildChat records; similarly, while the data has been cleaned somewhat, it’s easy to find intensely distressing sexual and violent requests.)

The main takeaway then was that people were ready to place a great deal of trust in open text boxes, and that “search,” for a lot of users, was something more like an all-purpose companion, a box into which they could put anything and frequently get at least something back — in the broadest possible sense, a bullish outlook for then-rising companies like Google. The new text boxes actually pretend to have conversations with you, and users are responding with similarly extreme candor. They’re behind on their work. And they’d like to read some porn.

Читайте на 123ru.net


Новости 24/7 DirectAdvert - доход для вашего сайта



Частные объявления в Вашем городе, в Вашем регионе и в России



Smi24.net — ежеминутные новости с ежедневным архивом. Только у нас — все главные новости дня без политической цензуры. "123 Новости" — абсолютно все точки зрения, трезвая аналитика, цивилизованные споры и обсуждения без взаимных обвинений и оскорблений. Помните, что не у всех точка зрения совпадает с Вашей. Уважайте мнение других, даже если Вы отстаиваете свой взгляд и свою позицию. Smi24.net — облегчённая версия старейшего обозревателя новостей 123ru.net. Мы не навязываем Вам своё видение, мы даём Вам срез событий дня без цензуры и без купюр. Новости, какие они есть —онлайн с поминутным архивом по всем городам и регионам России, Украины, Белоруссии и Абхазии. Smi24.net — живые новости в живом эфире! Быстрый поиск от Smi24.net — это не только возможность первым узнать, но и преимущество сообщить срочные новости мгновенно на любом языке мира и быть услышанным тут же. В любую минуту Вы можете добавить свою новость - здесь.




Новости от наших партнёров в Вашем городе

Ria.city

Без ума от селфи: как безобидное фото самого себя стало опасным трендом

В ряде регионов России, включая Татарстан, жалуются на сбои в TikТок

Россияне пожаловались на сбой в работе TikTok

Лавров оценил вероятность продажи Турцией российских ЗРК

Музыкальные новости

Сергей Светлаков пригласил турецкую звезду Бурака Озчивита сыграть в продолжении «Беляковых в отпуске»

Лавров в ООН: Москва осуждает действия Израиля в Ливане

Сломавшийся Як-40 временно парализовал работу аэропорта Внуково

Желдорреммаш определил лучших работников локомотиворемонтных заводов 2024 года

Новости России

ЯДЕРНЫМ ОРУДИЕМ НЕ РАЗБРАСЫВАЮТСЯ, НО ЕСЛИ НАТО, ЗНАЧИТ НАДО?! "ДОБРЫЙ КАРДИНАЛ КРЕМЛЯ". Полезные советы Высшего Всенародного Президента Вселенной. Важные данные для России, Европы, США и всего мира!

Милош Бикович дал редкий комментарий о сыне

Зарплаты разнорабочих превысили 100 тысяч рублей

Магнитная буря 29 сентября 2024 года: сложный день ожидает метеопатов из-за активности Солнца

Экология в России и мире

Желдорреммаш определил лучших работников локомотиворемонтных заводов 2024 года

Валерия Чекалина, Алёна Блин, Ксения Бородина, Ольга Бузова, Михаил Галустян, Мария Погребняк, Алана Мамаева: ТНТ презентовал новый проект  «Звёзды в джунглях»

От аспирина до фосарбина. За что любили народного академика Арбузова?

Маршрут автопоезда «Остановим ВИЧ в Свердловской области!» в текущем году включает 24 города региона

Спорт в России и мире

Первую ракетку мира подводят под срок // Всемирное антидопинговое агентство будет добиваться дисквалификации Янника Синнера

Пекин (ATP). 2-й круг. Котов сыграет с Коболли, Сафиуллин – с Синнером, Медведев – с Маннарино

Даниил Медведев вышел во второй круг турнира ATP-500 в Пекине

Даниил Медведев обыграл Гаэля Монфиса и вышел во 2-й круг турнира ATP-500 в Пекине

Moscow.media

В городском округе Домодедово проведена агитационно-разъяснительная работа с населением о сохранности имущества.

В Подмосковье росгвардейцы задержали гражданина, находящегося в розыске.

Для ремонта дорог в Петербурге в 2025 году ищут подрядчиков

Стоит ли отдавать ребенка в частную школу?











Топ новостей на этот час

Rss.plus






Без ума от селфи: как безобидное фото самого себя стало опасным трендом

Милош Бикович дал редкий комментарий о сыне

Лавров оценил вероятность продажи Турцией российских ЗРК

Лавров заявил о готовности РФ помочь Грузии в примирении с Южной Осетией