Добавить новость

Лесничие освободили деревья от незаконной рекламы в Чехове

КЦ «Лира» объявил набор «долголетов» на занятия в студию «Индийский танец»

Росгвардия помогла найти родственников красноармейца, погибшего в годы Великой Отечественной войны

В Подмосковье осудят таджиков, которые держали в плену и избивали своего земляка

World News


Новости сегодня

Новости от TheMoneytizer

Entrenar a ChatGPT con datos producidos por máquinas hace que pierda la memoria

Abc.es 
ChatGPT es capaz de responder, prácticamente, a cualquier pregunta que le haga el usuario en cuestión de segundos. Sin embargo, la herramienta esta lejos (muchísimo) de ser plenamente confiable. Sam Altman , director ejecutivo de la empresa OpenAI, creadora de la máquina, lo sabe bien; por eso, siempre que tiene ocasión, recuerda a todo el que esté dispuesto a escuchar lo «tontas» que son las soluciones que crean texto e imágenes a partir de palabras a día de hoy. También alerta sobre los errores que cometen. Errores que, en muchos casos, son utilizados para entrenar directamente a los algoritmos que las mueven. Y eso es un problema que puede volverse mucho más grave en el futuro. De acuerdo con un estudio publicado en ' Nature ', el uso de datos generados directamente por inteligencia artificial para el entrenamiento de herramientas como ChatGPT puede provocar que estas colapsen y empiecen a errar a discreción en sus resultados, que se volverán, además, pobres y mucho más limitados. «Imaginemos a un estudiante que sólo estudia sus propios apuntes, copiados parcialmente de forma incorrecta de una pizarra, ignorando por completo el libro de texto de la clase y las lecciones correspondientes. Se convencería a sí mismo de que los errores son correctos y desarrollaría una sólida comprensión de sus propios errores», explica a ABC Ilia Shumailov , investigador de la Universidad de Oxford (Reino Unido) y autor principal del estudio. Shumailov destaca que, el alumno daría por buenos datos que son erróneos y muy limitados, y «algo similar ocurre aquí con los modelos (de IA)»: «Se convencen a sí mismos de que los errores son una fuente de verdad y que los acontecimientos probables son más importantes de lo que lo son en realidad». El auge de ChatGPT, y la llegada a la red de muchísimas soluciones de IA generativa similares, como es el caso de Gemini , de Google, o de Llama , de Meta, ha provocado que el número de contenido generado por inteligencia artificial que hay en internet aumente considerablemente durante los últimos meses. Es fácil entrar en páginas web y ver que las imágenes que las pueblan han sido creadas por máquinas, y lo mismo ocurre con los textos. El problema es que para crear todo este contenido, las máquinas son entrenadas previamente con información publicada a lo ancho y largo de internet, desde blogs hasta portales de noticias o redes sociales. Y dentro de la red, como hemos dichos, ahora, y cada vez más en el futuro, se encuentra también texto e imágenes generadas por IA, que ya están siendo empleadas activamente para capacitar a las herramientas, entre ellas ChatGPT . «Si observas los informes correspondientes a GPT , encontrarás que ya se utilizan algunos datos sintéticos durante el proceso de entrenamiento«, dice Shumailov. El estudio, efectivamente, sostiene que el uso de datos generados hace que las herramientas de IA colapsen, y esto lleva a que se vuelvan, con el tiempo, menos precisas en sus resultados, y, por tanto, que ofrezcan contenido cada vez más pobre y limitado. También que olviden los elementos menos comunes de sus datos de entrenamiento originales y se queden solo con aquello que ven de forma recurrente, como señala Emily Wenger, ingeniera informática de la Universidad de Duke, en un análisis del estudio. Wenger apunta que, por ejemplo, una herramienta que genera imágenes de perros tenderá a reproducir en sus resultados las razas más comunes respecto a los datos con los que ha sido entrenada. Por tanto, si se la capacita con mucha información sobre el golden retriever tenderá a olvidar a todos los demás. Y si futuros modelos se entrenan con datos generados por IA que representan mucho a este tipo concreto de perro, el problema se agravará. Con el tiempo, el modelo solo generará imágenes de esa clase colapsando en el proceso . «Cuando el contenido generado por IA se incluye en los conjuntos de datos que se usan para entrenar modelos, estos modelos aprenden a generar conceptos, frases y tonos bien conocidos más fácilmente que ideas y formas de escribir menos comunes. Este es el problema», zanja la ingeniera. Shumailov y sus colegas apuntan que hay medios de evitar que una máquina generadora de contenido colapse . «Hay varias formas posibles, aunque la literatura académica actualmente no tiene una comprensión clara de hasta qué punto serán útiles. En primer lugar, hay que verificar siempre los modelos a medida que se desarrollan, certificando explícitamente el desempeño de los datos minoritarios», apunta el investigador de Oxford. «En segundo lugar, hay que asegurarse de que los datos se filtren y de que no se incluyan puntos de datos incorrectos o corruptos en el desarrollo», prosigue. El estudio, efectivamente, aboga por la necesidad de que las empresas de desarrollo de IA, como OpenAI, desarrollen estrategias que mitiguen el impacto del colapso de sus herramientas para ayudar a que sean más precisas y efectivas con el paso del tiempo. Porque, además, la cantidad de contenido generado mediante inteligencia artificial disponible en la red no va a descender próximamente. Más bien todo lo contrario.

Читайте на 123ru.net


Новости 24/7 DirectAdvert - доход для вашего сайта



Частные объявления в Вашем городе, в Вашем регионе и в России



Smi24.net — ежеминутные новости с ежедневным архивом. Только у нас — все главные новости дня без политической цензуры. "123 Новости" — абсолютно все точки зрения, трезвая аналитика, цивилизованные споры и обсуждения без взаимных обвинений и оскорблений. Помните, что не у всех точка зрения совпадает с Вашей. Уважайте мнение других, даже если Вы отстаиваете свой взгляд и свою позицию. Smi24.net — облегчённая версия старейшего обозревателя новостей 123ru.net. Мы не навязываем Вам своё видение, мы даём Вам срез событий дня без цензуры и без купюр. Новости, какие они есть —онлайн с поминутным архивом по всем городам и регионам России, Украины, Белоруссии и Абхазии. Smi24.net — живые новости в живом эфире! Быстрый поиск от Smi24.net — это не только возможность первым узнать, но и преимущество сообщить срочные новости мгновенно на любом языке мира и быть услышанным тут же. В любую минуту Вы можете добавить свою новость - здесь.




Новости от наших партнёров в Вашем городе

Ria.city

Белоснежка из Чертанова: что за девушку задержали в Париже вместе с Павлом Дуровым

Росгвардия помогла найти родственников красноармейца, погибшего в годы Великой Отечественной войны

В Подмосковье осудят таджиков, которые держали в плену и избивали своего земляка

«Был уверен, что повезти может любому участнику». Уроженец Тамбова выиграл в лотерею более 2 млн рублей

Музыкальные новости

Амбассадор фонда без кистей рук установил мировой рекорд в дисциплине стронгмен

Стало известно о возбуждении ряда дел по факту хищений в "Роснано"

ЦСКА намерен отдать в аренду Виктора Мендеса

Выставка известного белорусского художника Феликса Гумена откроется в Музее-усадьбе сето в печорской деревне Сигово

Новости России

Белоснежка из Чертанова: что за девушку задержали в Париже вместе с Павлом Дуровым

РАНХиГС: в 2023 году в Россию въехало 3,5 млн мигрантов

Бывшее российское представительство Mercedes-Benz переключилось на китайские машины. «МБ Рус» обещает поставить тысячу машин Foton в 2024 году

Жители Тюмени полгода собирали деньги для блогерши с поддельным диагнозом рака

Экология в России и мире

Запуск нового ювелирного бренда Gosha Kartsev

«585*ЗОЛОТОЙ» запускает новый сезон проекта об истории культовых мировых украшений

Косметолог Мадина Байрамукова: какие процедуры стоит сделать после лета

Колоноскопия пройдет без боли: о правилах подготовки к процедуре рассказал гастроэнтеролог Садыков

Спорт в России и мире

Карен Хачанов поднялся на одну строчку в рейтинге ATP

Хачанов проиграл в самом долгом матче в истории турнира US Open

Чжан Шуай проиграла 23-й раз подряд, обновив свой же антирекорд WTA и АТР

Эрика Андреева добилась победы на старте Открытого чемпионата США

Moscow.media

Амбассадор фонда без кистей рук установил мировой рекорд в дисциплине стронгмен

ГАЗ начал продажи новой модели грузовика. Цена уже известна

Ваш Galaxy S4 больше не сможет звонить: Билайн отключил 3G в Москве

С начала 2024 года более 2,5 тысячи многодетных мам в Московском регионе досрочно вышли на пенсию











Топ новостей на этот час

Rss.plus






Горячий сентябрь. Стало известно, когда в Москву придет осенняя погода

Лесничие освободили деревья от незаконной рекламы в Чехове

«Был уверен, что повезти может любому участнику». Уроженец Тамбова выиграл в лотерею более 2 млн рублей

Замглавы Коломны навестила детей из Курской области в семейном центре