Добавить новость

Мобильных операторов РФ могут обязать использовать ИИ для защиты от мошенников

Трамп и Маск наблюдали за запуском Starship

Путин встретился с главой фракции «Справедливая Россия — За правду» Мироновым

Поклонники несут цветы на могилу Заворотнюк спустя полгода после ее смерти (фото)



News in English


Новости сегодня

Новости от TheMoneytizer

Why That Chatbot Is So Good at Imitating Bart Simpson

This is Atlantic Intelligence, a newsletter in which our writers help you wrap your mind around artificial intelligence and a new machine age. Did someone forward you this newsletter? Sign up here.

Earlier this week, The Atlantic published a new investigation by Alex Reisner into the data that are being used without permission to train generative-AI programs. In this case, dialogue from tens of thousands of movies and TV shows has been harvested by companies such as Apple, Anthropic, Meta, and Nvidia to develop large language models (or LLMs).

The data have a strange provenance: Rather than being pulled from scripts or books, the dialogue is taken from subtitle files that have been extracted from DVDs, Blu-ray discs, and internet streams. “Though this may seem like a strange source for AI-training data, subtitles are valuable because they’re a raw form of written dialogue,” Reisner writes. “They contain the rhythms and styles of spoken conversation and allow tech companies to expand generative AI’s repertoire beyond academic texts, journalism, and novels, all of which have also been used to train these programs.”

Perhaps it no longer comes as a major shock that creative humans are having their work ripped off to train machines that threaten to replace them. But evidence demonstrating exactly what data have been used, and for what purposes, is hard to come by, thanks to the secretive nature of these tech companies. “Now, at least, we know a bit more about who is caught in the machinery,” Reisner writes. “What will the world decide they are owed?”


Illustration by Matteo Giuseppe Pani / The Atlantic

There’s No Longer Any Doubt That Hollywood Writing Is Powering AI

By Alex Reisner

For as long as generative-AI chatbots have been on the internet, Hollywood writers have wondered if their work has been used to train them. The chatbots are remarkably fluent with movie references, and companies seem to be training them on all available sources. One screenwriter recently told me he’s seen generative AI reproduce close imitations of The Godfather and the 1980s TV show Alf, but he had no way to prove that a program had been trained on such material.

I can now say with absolute confidence that many AI systems have been trained on TV and film writers’ work. Not just on The Godfather and Alf, but on more than 53,000 other movies and 85,000 other TV episodes: Dialogue from all of it is included in an AI-training data set that has been used by Apple, Anthropic, Meta, Nvidia, Salesforce, Bloomberg, and other companies. I recently downloaded this data set, which I saw referenced in papers about the development of various large language models (or LLMs). It includes writing from every film nominated for Best Picture from 1950 to 2016, at least 616 episodes of The Simpsons, 170 episodes of Seinfeld, 45 episodes of Twin Peaks, and every episode of The Wire, The Sopranos, and Breaking Bad. It even includes prewritten “live” dialogue from Golden Globes and Academy Awards broadcasts. If a chatbot can mimic a crime-show mobster or a sitcom alien—or, more pressingly, if it can piece together whole shows that might otherwise require a room of writers—data like this are part of the reason why.

Read the full article.


What to Read Next

Читайте на 123ru.net


Новости 24/7 DirectAdvert - доход для вашего сайта



Частные объявления в Вашем городе, в Вашем регионе и в России



Smi24.net — ежеминутные новости с ежедневным архивом. Только у нас — все главные новости дня без политической цензуры. "123 Новости" — абсолютно все точки зрения, трезвая аналитика, цивилизованные споры и обсуждения без взаимных обвинений и оскорблений. Помните, что не у всех точка зрения совпадает с Вашей. Уважайте мнение других, даже если Вы отстаиваете свой взгляд и свою позицию. Smi24.net — облегчённая версия старейшего обозревателя новостей 123ru.net. Мы не навязываем Вам своё видение, мы даём Вам срез событий дня без цензуры и без купюр. Новости, какие они есть —онлайн с поминутным архивом по всем городам и регионам России, Украины, Белоруссии и Абхазии. Smi24.net — живые новости в живом эфире! Быстрый поиск от Smi24.net — это не только возможность первым узнать, но и преимущество сообщить срочные новости мгновенно на любом языке мира и быть услышанным тут же. В любую минуту Вы можете добавить свою новость - здесь.




Новости от наших партнёров в Вашем городе

Ria.city

Думали, все: хирурги спасли мужчину с неоперабельным раком поджелудочной железы

Ракетостроительное предприятие в Химках отметило 71 год со дня основания

Турнир по футболу среди школьных команд прошел в Балашихе

Суммы заработка Дедов Морозов в Москве в праздничный сезон

Музыкальные новости

Начальник Главного управления Росгвардии по Московской области полковник полиции Пётр Зоров обратился к ветеранам региональной общественной организации войск правопорядка

В Бурятском театре оперы и балета прошёл закрытый показ оперы «Евгений Онегин»

Начальник Главного управления Росгвардии по Московской области полковник полиции Пётр Зоров обратился к ветеранам региональной общественной организации войск правопорядка

В Чехове сотрудники Росгвардии задержали подозреваемого в незаконном обороте наркотиков в крупном размере

Новости России

Лекцию о сражении под городом Красным 1812 года провели в Химках

Москвичка с 13 детьми рассказала о плюсах переезда в Колывань

Занятие по истории ко Дню военной присяги провели для жителей Химок

Медведев: Трамп вряд ли моментально отменит все санкции против России

Экология в России и мире

Гуф появился на сцене с электронным браслетом на ноге

«Юмор FM» – лауреат премии «Бренд года в России 2024»

Специалисты компании КАМА TYRES: как подобрать шины для грузового транспорта

«Микробиотики микст» с антоцианами удостоены золотой медали на Международном Конкурсе качества

Спорт в России и мире

Италия в 5-й раз выиграла Кубок Билли Джин Кинг и сравнялась с Россией

Тренер Камельзон раскритиковал поведение теннисиста Медведева

Кубок Билли Джин Кинг. Финал. Грунчакова играет с Бронцетти, Шрамкова встретится с Паолини

Калинская и Шнайдер претендуют на премию WTA в номинации «Прогресс года»

Moscow.media

Стабильная связь и удобный дизайн: наушники-клипсы A4Tech Biosong B5

Седое болотце...

Северный обход Омска сократит на 20 км транзитный маршрут от Тюмени до Новосибирска

Стабильная связь и удобный дизайн: наушники-клипсы A4Tech Biosong B5











Топ новостей на этот час

Rss.plus






Суммы заработка Дедов Морозов в Москве в праздничный сезон

Турнир по футболу среди школьных команд прошел в Балашихе

В 2025 году колымские предприниматели смогут применять автоматизированную упрощенную систему налогообложения

Собаку Сталина по кличке Катюша спасли волонтеры в Новосибирске