Добавить новость

В Москве подвели итоги седьмого потока обучения «Венчурной академии»

"Агентство "Москва": в столице эвакуируют посетителей Пушкинского музея

Ярослав Богданов считает, что России нужна полная легализация криптовалют

Сюрприз для россиян: власти сделали долгожданное заявление о заблокированной популярной соцсети

World News


Новости сегодня

Новости от TheMoneytizer

Los modelos de IA están entrenándose con fotos de niños. Y da igual que los padres traten de evitarlo

Los modelos de IA están entrenándose con fotos de niños. Y da igual que los padres traten de evitarlo thumbnail

Los modelos de IA están entrenándose con fotos de niños. Y da igual que los padres traten de evitarlo

El organismo Human Rights Watch (HRW) lleva tiempo vigilando cómo la tecnología puede amenazar nuestros derechos y libertades, y ahora ha denunciado un nuevo problema, esta vez relacionado con la IA. Y lo más preocupante es quiénes son las víctimas de esa amenaza: los niños.

Qué hacían esas fotos de niños ahí. Una investigadora de HWR llamado Hye Jung Han descubrió el mes pasado algo inquietante. El conjunto de datos (dataset) LAION-5B, muy popular para el entrenamiento de modelos de IA, contenía una serie de 170 fotos de niños brasileños. Las imágenes procedían de blogs sobre temas parentales y personales, pero incluso había fotogramas de vídeos de YouTube poco vistos, posiblemente subidos para ser compartidos con amigos y familiares, indicaron en Wired. Los términos de servicio de YouTube prohíben capturar información que pueda identificar a una persona salvo en casis excepcionales, pero el daño parece estar hecho ya, como vimos en el pasado.

Ahora han descubierto más. La misma investigadora ha encontrado otras 190 fotos de niños, esta vez procedentes de Australia. Las imágenes recorren toda la duración de la etapa infantil: desde bebés nada más nacer hasta niñas en bañador en un carnaval, pasando por niños haciendo pompas. Hay fotos de niños tribus indígenas australianas, pero en todas ellas hay un dato preocupante: los padres trataron de evitar que esas fotos quedaran expuestas al público.

Fotos robadas. En este nuevo descubrimiento se especifica cómo las fotos fueron vistas por poca gente y «tenían ciertas medidas de privacidad». No parecía posible encontrarlas con una búsqueda online, y se publicaron en blogs personales o sitios para compartir vídeos. Otras fueron publicadas por los colegios o por fotógrafos contratados por familias. «Algunas fueron subidas años o incluso una década antes de que LAION-5B fuera creado», destacan en este organismo.

Niños identicables. La investigación destacaba cómo las URLs en el conjunto de datos a veces revelan información sobre los niños, incluyendo nombres o ubicaciones donde fueron tomadas las fotos. De una foto con la descripción «dos niños, de 3 y 4 años, sonriendo de oreja a oreja mientras sostienen pinceles frente a un colorido mural» la investigadora fue capaz de obtener «los nombres completos y edades de ambos niños, y el nombre de la guardería a la que iban en Perth, en Australia Occidental». No había información sobre los niños en otros sitios en internet, lo que parece dejar claro que lso padres tomaron medidas para tratar de evitar que los niños fueran identificados.

Y seguramente esto sea solo la punta del iceberg. Como explican en HRW, sus investigadores solo han podido revisar «menos del 0,0001 % de las 5.850 millones de imágenes y descripciones de ese conjunto de datos». Han explicaba cómo «es alucinante que eso saliera de un conjunto aleatorio de unas 5.000 imágenes, y que de ellas inmediatamente aparecieran esas 190 fotos de niños australianos. Uno esperaría encontrarse con más fotos de gatos que fotos personales de niños» teniend o en cuenta que LAION-5B es teóricamente «un reflejo de toda internet».

La IA no sabe guardar secretos. Para HRW los modelos de IA son un peligro porque ya se ha demostrado que es posible recolectar información sensible y «rescatar» datos sensibles —como registros médicos— que acabaron en esos datasets con los que son entrenados.

Qué dicen los creadores de LAION-5B. Los creadores de este conjunto de datos forman parte de LAION, una ONG que deja claro que tiene una «política de tolerancia cero con el contenido ilegal». Uno de sus portavoces, Nathan Tyler, comentó en Ars Technica que están trabajando para resolver el problema, pero eliminar esas imágenes es un proceso lento y además poco efectivo. Como dice Han, eliminar los enlaces de los conjuntos de datos no cambia los modelos de IA que ya han sido entrenados con este dataset. «No puden olvidar los datos con los que se han entrenado, incluso si esos datos se borraron después del conjunto de datos [de entrenamiento]».

Imagen | Robert Collins

En Xataka | YouTube considera una violación de la privacidad que alguien use una IA para suplantarnos. Y lo podremos denunciar


La noticia

Los modelos de IA están entrenándose con fotos de niños. Y da igual que los padres traten de evitarlo

fue publicada originalmente en

Xataka

por
Javier Pastor

.

Читайте на 123ru.net


Новости 24/7 DirectAdvert - доход для вашего сайта



Частные объявления в Вашем городе, в Вашем регионе и в России



Smi24.net — ежеминутные новости с ежедневным архивом. Только у нас — все главные новости дня без политической цензуры. "123 Новости" — абсолютно все точки зрения, трезвая аналитика, цивилизованные споры и обсуждения без взаимных обвинений и оскорблений. Помните, что не у всех точка зрения совпадает с Вашей. Уважайте мнение других, даже если Вы отстаиваете свой взгляд и свою позицию. Smi24.net — облегчённая версия старейшего обозревателя новостей 123ru.net. Мы не навязываем Вам своё видение, мы даём Вам срез событий дня без цензуры и без купюр. Новости, какие они есть —онлайн с поминутным архивом по всем городам и регионам России, Украины, Белоруссии и Абхазии. Smi24.net — живые новости в живом эфире! Быстрый поиск от Smi24.net — это не только возможность первым узнать, но и преимущество сообщить срочные новости мгновенно на любом языке мира и быть услышанным тут же. В любую минуту Вы можете добавить свою новость - здесь.




Новости от наших партнёров в Вашем городе

Ria.city

С «Дворянином» - по Волге. Как посетители выставки «Россия» выиграли путевки в Ульяновскую область

Брат арестованного в Турции россиянина оспаривает идентификацию на фотографиях

ГУФССП России по Московской области призывает граждан Подмосковья пользоваться только официальными источниками получения информации

Geely Monjaro — суперхит: продажи кроссовера в России взлетели в 9 раз

Музыкальные новости

Песков: Россия надеется, что Армения не пойдет по пути киевского режима

Выставка современного искусства «Вертикаль» проходит в нижегородском центре «Микула»

Путин назначил Романа Курынина замглавы МЧС России

В СЛД «Брянск-Льговский» филиала «Московский» ООО «ЛокоТех-Сервис» сформирован студенческий отряд

Новости России

Прихожанка: фигурант дела о подрыве авто служил в греко-католическом приходе

В Москве официант и бармен обчистили кассу хинкальной, но потом все вернули

Безработным Подмосковья предложили бесплатно обучиться на тракториста

Инвалид Ксения сообщила, что ее коляску сломали на рейсе «Уральских авиалиний»

Экология в России и мире

Не поможет и жвачка: Доктор Кутушов рассказал о причинах неприятного запаха изо рта

Дистрибьюция Музыки.

3 завтрака на лето из разных уголков страны

"Кедровые острова" дали первые всходы

Спорт в России и мире

Лекарство против будней: почему предстоящая Олимпиада в Париже будет уникальна для России

Названа причина поражения Хачанова во втором круге Уимблдона

Синнер не смог вылететь на Олимпиаду в Париж из-за проблем со здоровьем

Саснович не вышла в четвертьфинал турнира WTA-250 в Румынии

Moscow.media

Из-за дождя обрушилась насыпь дороги Шахтерск – Бошняково на Сахалине

Филиал № 4 ОСФР по Москве и Московской области информирует: С начала 2024 года 140 тысяч женщин и новорожденных Московского региона получили услуги по родовым сертификатам

DCLogic вошла в топ-10 самых эффективных ИТ-компаний страны 2023 по версии CNews

В горах Кавказа











Топ новостей на этот час

Rss.plus






Экс-министру открытого правительства Абызову вызвали «скорую» в суд

Какие уникальные предметы проданы на винтажном маркете «Лета в Москве»

Ярослав Богданов считает, что России нужна полная легализация криптовалют

Сюрприз для россиян: власти сделали долгожданное заявление о заблокированной популярной соцсети