Добавить новость

В Москве суд арестовал находящегося в международном розыске азербайджанца

Сборные Казахстана и Китая взяли первые медали на Олимпиаде в Париже

В Домодедове началось строительство нового детского сада на 240 мест

Крупный газорегуляторный пункт модернизировали на западе столицы





Новости сегодня

Новости от TheMoneytizer

[Прожо́ра] "И це́лого ми́ра ма́ло". OpenAI не хватает качественных знаний всего интернета для обучения GPT-5: есть вероятность, что стремительное развитие нейросетей вскоре затормозиться

Согласно отчёту The Wall Street Journal, компаниям вроде OpenAI или Google требуются огромные массивы данных для обучения и совершенствования их больших языковых моделей (LLM), но проблема в том, что в интернете попросту не хватает качественных данных.

Авторы материала на The Wall Street Journal ссылаются на заявления специалиста в области искусственного интеллекта Пабло Вильялобоса из Исследовательского института Epoch. По его словам, языковая модель GPT-4 обучалась на 12 триллионах токенов данных, а если следовать законам масштабирования Шиншиллы, следующая версия требует порядка 60-100 триллионов токенов. Однако в свободном доступе не хватает по меньшей мере от 10 до 20 триллионов токенов подходящего качества текстовых и графических данных. К слову, ещё пару лет назад Вильялобос заявлял, что к середине 2024-го с вероятностью 50% нейросетям перестанет хватать данных для дальнейшего обучения. Тогда он прогнозировал, что к 2026-му такая вероятность будет составлять уже 90%.

В исследовании говорится, что большинство доступных данных в интернете попросту непригодно для обучения ИИ, поскольку содержит бессвязный текст или не содержит новой для нейросетей информации. Усугубляет проблему и тот факт, что крупные платформы, включая новостные агентства и социальные сети, закрывают доступ к своим данным и не дают разрешения компаниям вроде OpenAI на их использование.

По словам главы OpenAI Сэма Альтмана, они разрабатывают новые способы обучения нейросетей. Есть информация, что компания рассматривает возможность создания системы оценки стоимости данных, чтобы платить за них платформам. Согласно отчёту The Wall Street Journal, аналогичный подход рассматривают и в Google. А пока в OpenAI намерены использовать инструмент распознавания речи Whisper, чтобы "вытягивать" сведения из аудиозаписей и видео, находящихся в свободном доступе в интернете.

Внутри компании OpenAI рассматривают ещё один способ обойти нехватку данных - генерацию высококачественных синтетических данных, которые бы использовались для дальнейшего обучения нейросетей.


(https://4pda.to/2024/04/0...)

Читайте на 123ru.net


Новости 24/7 DirectAdvert - доход для вашего сайта



Частные объявления в Вашем городе, в Вашем регионе и в России



Smi24.net — ежеминутные новости с ежедневным архивом. Только у нас — все главные новости дня без политической цензуры. "123 Новости" — абсолютно все точки зрения, трезвая аналитика, цивилизованные споры и обсуждения без взаимных обвинений и оскорблений. Помните, что не у всех точка зрения совпадает с Вашей. Уважайте мнение других, даже если Вы отстаиваете свой взгляд и свою позицию. Smi24.net — облегчённая версия старейшего обозревателя новостей 123ru.net. Мы не навязываем Вам своё видение, мы даём Вам срез событий дня без цензуры и без купюр. Новости, какие они есть —онлайн с поминутным архивом по всем городам и регионам России, Украины, Белоруссии и Абхазии. Smi24.net — живые новости в живом эфире! Быстрый поиск от Smi24.net — это не только возможность первым узнать, но и преимущество сообщить срочные новости мгновенно на любом языке мира и быть услышанным тут же. В любую минуту Вы можете добавить свою новость - здесь.




Новости от наших партнёров в Вашем городе

Ria.city

В Дагестане подросток на отцовском «КамАЗе» переехал 9-летнюю велосипедистку

Адвокат Абрамова опроверг информацию о запрете Алсу приходить домой

Лавров: появление ядерного оружия США в ЮВА создаст угрозы для безопасности

В МЧС Москвы предупредили о ливне и грозе в столице

Музыкальные новости

Новосибирские эксперты рассказали, что будет с продавцами и потребителями Wildberries после слияния с Russ

Activision secretly experimented on 50% of Call of Duty players by 'decreasing' skill-based matchmaking, and determined players like SBMM even if they don't know it

Штаб-квартиру Роскосмоса предложили разместить в Амурской области

Хинштейн: МВД контролирует дело о драке сына Бажаева с полицейским в Москве

Новости России

«У нее красивые ноги?» Как специалист по погоде создал «Комбинацию»

Сергей Жуков анонсировал в «Лужниках» премьеру фильма о группе «Руки вверх!»

Модно — не значит полезно: каким рекомендациям по похудению не стоит доверять

Глава Дмитрова Поночевный провел прием жителей округа в школе № 5

Экология в России и мире

Жители Балашихи помогут сделать родной город чище

Дольче вита с выгодой в Fish Point Family Resort

24 июля директор филиала «Северный» ООО «ЛокоТех-Сервис» Андрей Дружков провёл встречу с участниками ключевого кадрового резерва на управленческие должности.

Saint Laurent pre-fall 2024

Спорт в России и мире

Четвертая ракетка мира Рыбакина снялась с Олимпиады из-за состояния здоровья

Мирру Андрееву наградили за первую победу в турнире на уровне WTA

Рыбакина обратилась к публике после снятия с Олимпийских игр в Париже

Даниил Медведев победил в первом круге олимпийского турнира по теннису

Moscow.media

Филиал № 4 ОСФР по Москве и Московской области информирует: Родители 240,5 тыс. детей в Московской области получают единое пособие

Филиал № 4 ОСФР по Москве и Московской области информирует: С 1 августа Соцфонд увеличит страховые пенсии россиян

«Норникель» внедрил решения на базе ИИ почти на всех производственных площадках

Каршеринг BelkaCar открыл новые зоны в регионах ближнего Подмосковья











Топ новостей на этот час

Rss.plus






Сына миллиардера Бажаева задержали за нападение на полковника полиции в Москве

Гастроэнтеролог Сухорукова раскрыла пользу смородины для здоровья

Муса Бажаев высказался о возможной причастности сына к драке с полицейским

Магнитная буря 28.07.2024: прогнозируется ли мощный геошторм