Добавить новость

Министр Папоян: Армения намерена увеличить объем торговли с Ираном

Конфликт на Ближнем Востоке не влияет прямо на курс рубля

Эксперты проекта «Перезвони сам» рассказали, как защититься от мошенников при поиске работы

Влиятельный отец школьника-насильника в Кинешме пытается спрятать его в психушке



World News


Новости сегодня

Новости от TheMoneytizer

Entrenar a ChatGPT con datos producidos por máquinas hace que pierda la memoria

Abc.es 
ChatGPT es capaz de responder, prácticamente, a cualquier pregunta que le haga el usuario en cuestión de segundos. Sin embargo, la herramienta esta lejos (muchísimo) de ser plenamente confiable. Sam Altman , director ejecutivo de la empresa OpenAI, creadora de la máquina, lo sabe bien; por eso, siempre que tiene ocasión, recuerda a todo el que esté dispuesto a escuchar lo «tontas» que son las soluciones que crean texto e imágenes a partir de palabras a día de hoy. También alerta sobre los errores que cometen. Errores que, en muchos casos, son utilizados para entrenar directamente a los algoritmos que las mueven. Y eso es un problema que puede volverse mucho más grave en el futuro. De acuerdo con un estudio publicado en ' Nature ', el uso de datos generados directamente por inteligencia artificial para el entrenamiento de herramientas como ChatGPT puede provocar que estas colapsen y empiecen a errar a discreción en sus resultados, que se volverán, además, pobres y mucho más limitados. «Imaginemos a un estudiante que sólo estudia sus propios apuntes, copiados parcialmente de forma incorrecta de una pizarra, ignorando por completo el libro de texto de la clase y las lecciones correspondientes. Se convencería a sí mismo de que los errores son correctos y desarrollaría una sólida comprensión de sus propios errores», explica a ABC Ilia Shumailov , investigador de la Universidad de Oxford (Reino Unido) y autor principal del estudio. Shumailov destaca que, el alumno daría por buenos datos que son erróneos y muy limitados, y «algo similar ocurre aquí con los modelos (de IA)»: «Se convencen a sí mismos de que los errores son una fuente de verdad y que los acontecimientos probables son más importantes de lo que lo son en realidad». El auge de ChatGPT, y la llegada a la red de muchísimas soluciones de IA generativa similares, como es el caso de Gemini , de Google, o de Llama , de Meta, ha provocado que el número de contenido generado por inteligencia artificial que hay en internet aumente considerablemente durante los últimos meses. Es fácil entrar en páginas web y ver que las imágenes que las pueblan han sido creadas por máquinas, y lo mismo ocurre con los textos. El problema es que para crear todo este contenido, las máquinas son entrenadas previamente con información publicada a lo ancho y largo de internet, desde blogs hasta portales de noticias o redes sociales. Y dentro de la red, como hemos dichos, ahora, y cada vez más en el futuro, se encuentra también texto e imágenes generadas por IA, que ya están siendo empleadas activamente para capacitar a las herramientas, entre ellas ChatGPT . «Si observas los informes correspondientes a GPT , encontrarás que ya se utilizan algunos datos sintéticos durante el proceso de entrenamiento«, dice Shumailov. El estudio, efectivamente, sostiene que el uso de datos generados hace que las herramientas de IA colapsen, y esto lleva a que se vuelvan, con el tiempo, menos precisas en sus resultados, y, por tanto, que ofrezcan contenido cada vez más pobre y limitado. También que olviden los elementos menos comunes de sus datos de entrenamiento originales y se queden solo con aquello que ven de forma recurrente, como señala Emily Wenger, ingeniera informática de la Universidad de Duke, en un análisis del estudio. Wenger apunta que, por ejemplo, una herramienta que genera imágenes de perros tenderá a reproducir en sus resultados las razas más comunes respecto a los datos con los que ha sido entrenada. Por tanto, si se la capacita con mucha información sobre el golden retriever tenderá a olvidar a todos los demás. Y si futuros modelos se entrenan con datos generados por IA que representan mucho a este tipo concreto de perro, el problema se agravará. Con el tiempo, el modelo solo generará imágenes de esa clase colapsando en el proceso . «Cuando el contenido generado por IA se incluye en los conjuntos de datos que se usan para entrenar modelos, estos modelos aprenden a generar conceptos, frases y tonos bien conocidos más fácilmente que ideas y formas de escribir menos comunes. Este es el problema», zanja la ingeniera. Shumailov y sus colegas apuntan que hay medios de evitar que una máquina generadora de contenido colapse . «Hay varias formas posibles, aunque la literatura académica actualmente no tiene una comprensión clara de hasta qué punto serán útiles. En primer lugar, hay que verificar siempre los modelos a medida que se desarrollan, certificando explícitamente el desempeño de los datos minoritarios», apunta el investigador de Oxford. «En segundo lugar, hay que asegurarse de que los datos se filtren y de que no se incluyan puntos de datos incorrectos o corruptos en el desarrollo», prosigue. El estudio, efectivamente, aboga por la necesidad de que las empresas de desarrollo de IA, como OpenAI, desarrollen estrategias que mitiguen el impacto del colapso de sus herramientas para ayudar a que sean más precisas y efectivas con el paso del tiempo. Porque, además, la cantidad de contenido generado mediante inteligencia artificial disponible en la red no va a descender próximamente. Más bien todo lo contrario.

Читайте на 123ru.net


Новости 24/7 DirectAdvert - доход для вашего сайта



Частные объявления в Вашем городе, в Вашем регионе и в России



Smi24.net — ежеминутные новости с ежедневным архивом. Только у нас — все главные новости дня без политической цензуры. "123 Новости" — абсолютно все точки зрения, трезвая аналитика, цивилизованные споры и обсуждения без взаимных обвинений и оскорблений. Помните, что не у всех точка зрения совпадает с Вашей. Уважайте мнение других, даже если Вы отстаиваете свой взгляд и свою позицию. Smi24.net — облегчённая версия старейшего обозревателя новостей 123ru.net. Мы не навязываем Вам своё видение, мы даём Вам срез событий дня без цензуры и без купюр. Новости, какие они есть —онлайн с поминутным архивом по всем городам и регионам России, Украины, Белоруссии и Абхазии. Smi24.net — живые новости в живом эфире! Быстрый поиск от Smi24.net — это не только возможность первым узнать, но и преимущество сообщить срочные новости мгновенно на любом языке мира и быть услышанным тут же. В любую минуту Вы можете добавить свою новость - здесь.




Новости от наших партнёров в Вашем городе

Ria.city

Пенсионеров похищают для принудительных работ на стройках

Педагоги из Пензы отправились на Всероссийский Форум классных руководителей

Подсчитали, во сколько обходится владение Toyota Land Cruiser 300

Shot: Экс-солист «Бутырки» Ждамиров попал в больницу из-за проблем с сердцем

Музыкальные новости

ЦСКА — «Металлург» — 0:7. Видеообзор матча КХЛ

РОСГВАРДЕЙЦЫ ПРИНЯЛИ УЧАСТИЕ В МАСШТАБНОМ ФЕСТИВАЛЕ «ПОКОЛЕНИЕ Z.O.V.» В САРАТОВСКОЙ ОБЛАСТИ

«Ростов» вышел в плей-офф «пути РПЛ» Кубка России по футболу

Первый проект от BMS Development Group станет экополисом в окружении зеленых исторических деревьев

Новости России

В торжественном приеме многодетных семей росгвардейцев приняла участие семья офицера из Самары

Пенсионеров похищают для принудительных работ на стройках

Подсчитали, во сколько обходится владение Toyota Land Cruiser 300

На ярославских участках М-8 начинают ставить барьерное ограждение

Экология в России и мире

Магия зеркал

Праздник к нам приходит с OUTRIGGER Maldives Maafushivaru

ТРЦ «Мегаполис» масштабирует сегмент DIY & Household

Токсиколог Кутушов объяснил, как микробиота кишечника помогает справиться с отравлением

Спорт в России и мире

Рублев вышел в четвертьфинал турнира в Пекине

Теннисист Рублев рассказал об угрожавшей ему ампутации

Даниил Медведев стал первым полуфиналистом турнира ATP-500 в Пекине

Самсонова и Кочаретто вышли в полуфинал турнира WTA 1000 в Пекине в парном разряде

Moscow.media

Свыше 6,5 тысячи жителей Москвы и Московской области получили справки о статусе предпенсионера в клиентских службах регионального Отделения СФР и МФЦ

С начала 2024 года более 2,5 тысячи многодетных мам в Московском регионе досрочно вышли на пенсию

Социальный фонд оказывает помощь эвакуированным жителям Курской области

Умные очки Meta* использовали для слежки за ничего не подозревающими людьми











Топ новостей на этот час

Rss.plus






Педагоги из Пензы отправились на Всероссийский Форум классных руководителей

Компания из Кировской области дважды победила в «Экспортере года»

На ярославских участках М-8 начинают ставить барьерное ограждение

От спектакля про бабушек до «Лунного кота» : Афиша Tverlife на выходные с 4 по 6 октября